OpenAI推出新工具和SDK,以简化AI代理开发
OpenAI推出新工具和SDK,以简化AI代理开发
OpenAI 宣布推出一套新的 API、内置工具和开源 SDK,旨在简化开发人员和企业有用、可靠的 AI 代理的开发。这些新版本提供了将 AI 代理从概念转移到生产的基本构建块,有助于跨行业自动执行复杂的多步骤任务。
用于代理应用程序的简化 API 和工具
该版本的亮点是 Responses API,它将 OpenAI 的 Chat Completions API 的简单性与 Assistants API 的工具使用功能相结合。Responses API 允许开发人员将多种工具(如 Web 搜索、文件搜索和计算机使用)集成到单个统一的 API 调用中,无需大量的提示工程或复杂的编排逻辑。
主要功能包括:
Web 搜索工具: 提供实时答案和清晰的引用,非常适合研究助理、购物代理或市场情报工具。API 中的网络搜索由用于 ChatGPT 搜索的相同模型提供支持,在 SimpleQA 事实问答基准上实现了 90% 和 88% 的准确率。该工具可通过响应 API 以预览版形式提供给所有开发人员,也可以通过 Chat Completions API(gpt-4o-search-preview 和 gpt-4o-mini-search-preview)直接访问微调的搜索模型。起价分别为每 1000 个查询 30 USD 和 25 USD。
文件搜索工具:允许开发人员从跨多种文件类型的大型文档集中高效检索相关信息,并内置对查询优化、元数据筛选和自定义重新排名的支持。使用案例包括增强客户支持代理、法律助理和技术文档查询。例如,Navan 使用文件搜索来支持其 AI 旅行社,使用户能够从旅行政策等内部知识库中获得准确的答案。该工具支持简化的 RAG(检索增强生成)管道,无需额外配置。
此工具可供 Responses API 中的所有开发人员使用。文件存储的起价为每 1000 次查询 2.50 USD,文件存储的起价为 0.10 USD/GB/天,前 GB 免费。它在 Assistants API 中仍然可用,开发人员还可以使用 Vector Store API 对象中的新搜索端点直接查询其数据,以便更广泛的应用程序使用。
电脑使用工具:通过将模型生成的鼠标和键盘作转换为可执行命令,使开发人员能够自动执行基于浏览器的工作流程和桌面工作流程。它由 OpenAI 的计算机使用代理 (CUA) 模型(用于支持 Operator 的相同模型)提供支持,它支持在没有 API 访问权限的系统上执行质量保证测试、数据输入和研究工作流程等任务。该模型已经达到了最先进的基准,在 WebVoyager 上成功率为 87%,在 WebArena 上为 58.1%,尽管对于完全使用计算机的任务来说,它仍然不太可靠(在 OSWorld 上为 38.1%),因此人工监督是必不可少的。
此工具在 Responses API 中作为研究预览提供,供使用层 3-5 中的开发人员使用。定价为每 1M 输入令牌 3 美元,每 1M 输出令牌 12 美元起。OpenAI 还集成了强大的安全措施,包括确认提示、提示注入检查和环境隔离工具,以降低风险。
响应 API 还包括改进的可观察性功能,允许开发人员跟踪、评估和优化代理工作流程,同时确保数据隐私——默认情况下,业务数据不用于训练 OpenAI 的模型。
现有的 API 呢?
对于已经在使用 OpenAI 的 Chat Completions API 或 Assistants API 的开发人员,新的 Responses API 建立在熟悉的功能之上。它将 Chat Completions 的简单性与 Assistant 的工具使用灵活性相结合,使其成为开发代理应用程序的更强大、更统一的选项。虽然聊天完成功能仍然受到广泛支持,并且 Assistants API 将继续接收更新,但 OpenAI 计划在 2026 年年中之前逐步淘汰 Assistants API,从而为响应 API 提供明确的迁移路径。
Agents SDK 简化了多代理编排
除了 API,OpenAI 还推出了 Agents SDK,这是一个开源框架,旨在通过内置的护栏、切换和可观察性工具编排单代理和多代理工作流。它与 Responses API 和其他聊天风格的 API 无缝协作,为开发人员提供灵活的生产就绪代理解决方案。
Agents SDK 适用于广泛的实际使用案例,从自动化客户支持和简化多步骤研究,到支持内容创建、代码审查和销售勘探。实际示例包括:
币库: 利用 Agents SDK 对 AgentKit 进行原型设计,将 AI 代理与加密钱包和链上活动集成。
箱: 快速构建的代理,使企业能够安全地从专有数据和公共 Web 源中搜索和提取见解。
Python 支持现已推出,Node.js兼容性即将推出。
展望未来:构建 AI 代理的未来
OpenAI 将座席视为未来劳动力不可或缺的一部分,为各行各业提供智能、自主的系统。这些新工具反映了 OpenAI 更广泛的战略,即使代理开发更易于访问、可靠和可扩展,从而加速跨行业的采用。
随着未来几个月的进一步更新和更深入的集成,OpenAI 正在为无缝平台体验奠定基础,为开发人员提供部署高性能 AI 代理所需的一切,从而产生实际影响。