OpenAI推出新工具和SDK,以简化AI代理开发

AI快讯 2025-03-19


image.png

OpenAI推出新工具和SDK,以简化AI代理开发

OpenAI 宣布推出一套新的 API、内置工具和开源 SDK,旨在简化开发人员和企业有用、可靠的 AI 代理的开发。这些新版本提供了将 AI 代理从概念转移到生产的基本构建块,有助于跨行业自动执行复杂的多步骤任务。

用于代理应用程序的简化 API 和工具

该版本的亮点是 Responses API,它将 OpenAI 的 Chat Completions API 的简单性与 Assistants API 的工具使用功能相结合。Responses API 允许开发人员将多种工具(如 Web 搜索、文件搜索和计算机使用)集成到单个统一的 API 调用中,无需大量的提示工程或复杂的编排逻辑。

主要功能包括:

  • Web 搜索工具: 提供实时答案和清晰的引用,非常适合研究助理、购物代理或市场情报工具。API 中的网络搜索由用于 ChatGPT 搜索的相同模型提供支持,在 SimpleQA 事实问答基准上实现了 90% 和 88% 的准确率。该工具可通过响应 API 以预览版形式提供给所有开发人员,也可以通过 Chat Completions API(gpt-4o-search-preview 和 gpt-4o-mini-search-preview)直接访问微调的搜索模型。起价分别为每 1000 个查询 30 USD 和 25 USD。

  • 文件搜索工具:允许开发人员从跨多种文件类型的大型文档集中高效检索相关信息,并内置对查询优化、元数据筛选和自定义重新排名的支持。使用案例包括增强客户支持代理、法律助理和技术文档查询。例如,Navan 使用文件搜索来支持其 AI 旅行社,使用户能够从旅行政策等内部知识库中获得准确的答案。该工具支持简化的 RAG(检索增强生成)管道,无需额外配置。

    此工具可供 Responses API 中的所有开发人员使用。文件存储的起价为每 1000 次查询 2.50 USD,文件存储的起价为 0.10 USD/GB/天,前 GB 免费。它在 Assistants API 中仍然可用,开发人员还可以使用 Vector Store API 对象中的新搜索端点直接查询其数据,以便更广泛的应用程序使用。

  • 电脑使用工具:通过将模型生成的鼠标和键盘作转换为可执行命令,使开发人员能够自动执行基于浏览器的工作流程和桌面工作流程。它由 OpenAI 的计算机使用代理 (CUA) 模型(用于支持 Operator 的相同模型)提供支持,它支持在没有 API 访问权限的系统上执行质量保证测试、数据输入和研究工作流程等任务。该模型已经达到了最先进的基准,在 WebVoyager 上成功率为 87%,在 WebArena 上为 58.1%,尽管对于完全使用计算机的任务来说,它仍然不太可靠(在 OSWorld 上为 38.1%),因此人工监督是必不可少的。

  • 此工具在 Responses API 中作为研究预览提供,供使用层 3-5 中的开发人员使用。定价为每 1M 输入令牌 3 美元,每 1M 输出令牌 12 美元起。OpenAI 还集成了强大的安全措施,包括确认提示、提示注入检查和环境隔离工具,以降低风险。

响应 API 还包括改进的可观察性功能,允许开发人员跟踪、评估和优化代理工作流程,同时确保数据隐私——默认情况下,业务数据不用于训练 OpenAI 的模型。

现有的 API 呢?

对于已经在使用 OpenAI 的 Chat Completions API 或 Assistants API 的开发人员,新的 Responses API 建立在熟悉的功能之上。它将 Chat Completions 的简单性与 Assistant 的工具使用灵活性相结合,使其成为开发代理应用程序的更强大、更统一的选项。虽然聊天完成功能仍然受到广泛支持,并且 Assistants API 将继续接收更新,但 OpenAI 计划在 2026 年年中之前逐步淘汰 Assistants API,从而为响应 API 提供明确的迁移路径。

Agents SDK 简化了多代理编排

除了 API,OpenAI 还推出了 Agents SDK,这是一个开源框架,旨在通过内置的护栏、切换和可观察性工具编排单代理和多代理工作流。它与 Responses API 和其他聊天风格的 API 无缝协作,为开发人员提供灵活的生产就绪代理解决方案。

Agents SDK 适用于广泛的实际使用案例,从自动化客户支持和简化多步骤研究,到支持内容创建、代码审查和销售勘探。实际示例包括:

  • 币库: 利用 Agents SDK 对 AgentKit 进行原型设计,将 AI 代理与加密钱包和链上活动集成。

  • 箱: 快速构建的代理,使企业能够安全地从专有数据和公共 Web 源中搜索和提取见解。

Python 支持现已推出,Node.js兼容性即将推出。

展望未来:构建 AI 代理的未来

OpenAI 将座席视为未来劳动力不可或缺的一部分,为各行各业提供智能、自主的系统。这些新工具反映了 OpenAI 更广泛的战略,即使代理开发更易于访问、可靠和可扩展,从而加速跨行业的采用。

随着未来几个月的进一步更新和更深入的集成,OpenAI 正在为无缝平台体验奠定基础,为开发人员提供部署高性能 AI 代理所需的一切,从而产生实际影响。

©️版权声明:若无特殊声明,本站所有文章版权均归AI工具集原创和所有,未经许可,任何个人、媒体、网站、团体不得转载、抄袭或以其他方式复制发表本站内容,或在非我站所属的服务器上建立镜像。否则,我站将依法保留追究相关法律责任的权利。

相关文章