@langchain/openai 包为 OpenAI 的内置工具提供了 LangChain 兼容的包装器。这些工具可以使用 bindTools() 或 createAgent 绑定到 ChatOpenAI。
网络搜索工具
网络搜索工具允许 OpenAI 模型在生成响应之前搜索网络以获取最新信息。网络搜索支持三种主要类型:- 非推理网络搜索:快速查找,模型将查询直接传递给搜索工具
- 带推理模型的代理搜索:模型主动管理搜索过程,分析结果并决定是否继续搜索
- 深度研究:使用
o3-deep-research或gpt-5等模型进行扩展调查,具有高推理努力
MCP 工具(模型上下文协议)
MCP 工具允许 OpenAI 模型连接到远程 MCP 服务器和 OpenAI 维护的服务连接器,使模型能够访问外部工具和服务。 有两种使用 MCP 工具的方式:- 远程 MCP 服务器:通过 URL 连接到任何公共 MCP 服务器
- 连接器:使用 OpenAI 维护的流行服务包装器,如 Google Workspace 或 Dropbox
代码解释器工具
代码解释器工具允许模型在沙盒环境中编写和运行 Python 代码以解决复杂问题。 代码解释器适用于:- 数据分析:处理具有多样化数据和格式的文件
- 文件生成:创建包含数据和图表图像的文件
- 迭代编码:编写和运行代码以迭代解决问题
- 视觉智能:裁剪、缩放、旋转和转换图像
注意:容器在 20 分钟不活动后过期。虽然称为“代码解释器”,但模型将其视为“python 工具”——对于显式提示,请在提示中要求“python 工具”。更多信息,请参阅 OpenAI 的代码解释器文档。
文件搜索工具
文件搜索工具允许模型使用语义和关键词搜索您的文件以查找相关信息。它支持从先前上传的文件的知识库中进行检索,这些文件存储在向量存储中。 先决条件:在使用文件搜索之前,您必须:- 使用
purpose: "assistants"将文件上传到文件 API - 创建一个向量存储
- 将文件添加到向量存储
eq(等于)、ne(不等于)、gt(大于)、gte(大于或等于)、lt(小于)、lte(小于或等于)。
更多信息,请参阅 OpenAI 的文件搜索文档。
图像生成工具
图像生成工具允许模型使用文本提示和可选的图像输入生成或编辑图像。它利用 GPT 图像模型并自动优化文本输入以提高性能。 图像生成适用于:- 从文本创建图像:根据详细的文本描述生成图像
- 编辑现有图像:根据文本指令修改图像
- 多轮图像编辑:在对话轮次中迭代优化图像
- 各种输出格式:支持 PNG、JPEG 和 WebP 格式
提示技巧:使用“绘制”或“编辑”等术语以获得最佳结果。对于组合图像,请说“通过添加此元素编辑第一张图像”,而不是“组合”或“合并”。支持的模型:
gpt-4o、gpt-4o-mini、gpt-4.1、gpt-4.1-mini、gpt-4.1-nano、o3
更多信息,请参阅 OpenAI 的图像生成文档。
计算机使用工具
计算机使用工具允许模型通过模拟鼠标点击、键盘输入、滚动等来控制计算机界面。它使用 OpenAI 的计算机使用代理 (CUA) 模型来理解屏幕截图并建议操作。测试版:计算机使用处于测试版。仅在沙盒环境中使用,不要用于高风险或经过身份验证的任务。对于重要决策,始终实现人工在环。工作原理:该工具在连续循环中运行:
- 模型发送计算机操作(点击、键入、滚动等)
- 您的代码在受控环境中执行这些操作
- 您捕获结果的屏幕截图
- 将屏幕截图发送回模型
- 重复直到任务完成
本地 Shell 工具
本地 Shell 工具允许模型在您提供的机器上本地运行 Shell 命令。命令在您自己的运行时内执行——API 仅返回指令。
安全警告:运行任意 Shell 命令可能很危险。始终对执行进行沙盒处理或在将命令转发到系统 Shell 之前添加严格的允许/拒绝列表。
注意:此工具设计用于与 Codex CLI 和 codex-mini-latest 模型配合使用。
command- 要执行的 argv 令牌数组env- 要设置的环境变量working_directory- 在其中运行命令的目录timeout_ms- 建议的超时(强制执行您自己的限制)user- 可选的用户以运行命令
Shell 工具
Shell 工具允许模型通过您的集成运行 Shell 命令。与本地 Shell 不同,此工具支持并发执行多个命令,并设计用于gpt-5.1。
安全警告:运行任意 Shell 命令可能很危险。始终对执行进行沙盒处理或在将命令转发到系统 Shell 之前添加严格的允许/拒绝列表。用例:
- 自动化文件系统或进程诊断 – 例如,“查找 ~/Documents 下最大的 PDF”
- 扩展模型功能 – 使用内置的 UNIX 实用程序、Python 运行时和其他 CLI
- 运行多步骤构建和测试流程 – 链接命令,如
pip install和pytest - 复杂的代理编码工作流 – 与
apply_patch一起用于文件操作
commands- 要执行的 Shell 命令数组(可以并发运行)timeout_ms- 可选的超时(毫秒)(强制执行您自己的限制)max_output_length- 每个命令返回的最大可选字符数
ShellResult:
注意:仅通过带有更多信息,请参阅 OpenAI 的 Shell 文档。gpt-5.1的 Responses API 可用。模型的timeout_ms仅是一个提示——始终强制执行您自己的限制。
应用补丁工具
应用补丁工具允许模型提议结构化差异,由您的集成应用。这支持迭代、多步骤的代码编辑工作流,模型可以在您的代码库中创建、更新和删除文件。 何时使用:- 多文件重构 – 重命名符号、提取帮助程序或重组模块
- 错误修复 – 让模型诊断问题并发出精确的补丁
- 测试和文档生成 – 创建新的测试文件、夹具和文档
- 迁移和机械编辑 – 应用重复的、结构化的更新
安全警告:应用补丁可能会修改代码库中的文件。始终验证路径、实施备份并考虑沙盒处理。
注意:此工具设计用于与 gpt-5.1 模型配合使用。
create_file– 在path处创建一个新文件,内容来自diffupdate_file– 使用diff中的 V4A 差异格式修改path处的现有文件delete_file– 删除path处的文件
- 路径验证:防止目录遍历并限制对允许目录的编辑
- 备份:考虑在应用补丁之前备份文件
- 错误处理:返回描述性错误消息,以便模型可以恢复
- 原子性:决定是否需要“全有或全无”语义(如果任何补丁失败则回滚)
通过 MCP 将这些文档连接到 Claude、VSCode 等 以获取实时答案。

