引言:当AI拥有了“双手”

我们已经习惯了与ChatGPT这样的AI对话,它们能写诗、能写代码、能回答问题。但它们始终被“囚禁”在云端的沙箱里,无法直接与我们的本地计算机交互。如果想让它分析一个本地Excel文件,我们必须手动复制内容给它;如果想让它运行一段代码,我们只能复制回来自己执行。

Open-Interpreter 打破了这堵墙。

它是一个开源的代码解释器实现,允许大语言模型(LLM)在你的本地终端环境中,以一种可控、安全的方式,直接运行代码(包括Python, Shell, JavaScript等)。

这意味着你可以用自然语言下达指令,然后亲眼看着AI:

  • 调用Shell命令来转换视频格式。
  • 编写并执行Python脚本来分析一个本地CSV文件并绘图。
  • 读取你的项目文件,并为你编写新的代码。
  • 甚至是在浏览器中进行自动化操作。

这篇指南将带你从零开始,全面掌握这个强大的工具。

安装与基本使用

安装Open-Interpreter非常简单,它是一个Python包。

pip install open-interpreter

安装完成后,直接在终端运行 interpreter 命令,它会默认尝试使用OpenAI的GPT-4模型(如果检测到API密钥)。

interpreter

首次运行时,它会询问你是否愿意让它自动运行代码。为了体验完整功能,建议输入 y (yes)。

现在,你进入了一个交互式对话环境。让我们给它一个任务:

You: “Please list all the text files in the current directory.”

你会看到Open-Interpreter思考片刻,然后显示它将要执行的Shell命令,并请求你的授权:

> interpreter
...
▌ Model set to GPT-4

> Please list all the text files in the current directory.

  • Use Shell to list files in the current directory.

Running `ls *.txt` in shell...

Approved!
Executing `ls *.txt`...

它会列出当前目录下的所有 .txt文件。这就是Open-Interpreter的核心工作模式:自然语言 -> AI生成代码 -> 用户授权 -> 本地执行 -> 返回结果

连接到本地运行的LLM(省钱大法!)

默认使用GPT-4效果最好,但也需要花费OpenAI的API费用。幸运的是,Open-Interpreter可以轻松连接到任何兼容OpenAI API格式的本地模型,比如我们上一篇文章中介绍的 LlamaFileOllama

假设你已经在本地 8080端口启动了一个LlamaFile服务器。你可以这样启动 interpreter来连接它:

interpreter --local

程序会自动检测并连接到 http://127.0.0.1:8080/v1。如果你的本地模型运行在其他地址,也可以手动指定:

interpreter --local --api_base "http://localhost:11434/v1" --model "ollama/llama3"

这个例子展示了如何连接到Ollama运行的Llama 3模型。通过这种方式,你可以在完全免费、离线的情况下使用Open-Interpreter的强大功能!

实战案例:让AI为你分析数据

让我们来个更酷的例子。假设你有一个名为 sales.csv 的文件,内容如下:

Month,Revenue,Profit
Jan,1000,200
Feb,1200,250
Mar,1500,300
Apr,1300,280

现在,启动 interpreter并告诉它:

You: “Using Python, please read sales.csv, calculate the profit margin for each month, and plot the result as a bar chart. Save the chart as profit_margin.png

接下来,你将见证神奇的时刻:

  1. 思考: AI会告诉你它计划编写一段Python代码来完成这个任务。
  2. 生成代码: 它会生成Pandas和Matplotlib库相关的代码。
  3. 安装依赖: 如果它检测到你的环境缺少 pandasmatplotlib,它会自动生成并执行 pip install pandas matplotlib命令来安装它们!
  4. 执行代码: 它运行Python脚本,进行数据处理和计算。
  5. 生成图表: 脚本执行完毕后,一个名为 profit_margin.png 的图表文件就会出现在你的文件夹中。

整个过程,你只说了一句话。

安全性

让AI在你的电脑上直接跑代码,听起来可能有点吓人。Open-Interpreter通过以下方式来确保安全:

  • 代码审查与授权:默认情况下,每一段由AI生成的代码在执行前,都必须得到你的明确批准。
  • 沙箱环境:你可以配置它在Docker等沙箱环境中运行,进一步隔离风险。

总结

Open-Interpreter是通往真正“AI助理”之路的重要一步。它将大语言模型的“大脑”与我们计算机的“身体”连接起来,释放了前所未有的自动化潜力。

从今天起,尝试将你日常工作中那些重复、繁琐的命令行或脚本任务交给它来完成吧。你会惊讶地发现,你的工作效率将得到质的飞跃。