Manus AI：首款完全自主的 AI 代理创下新的基准记录

AI快讯 2025-03-19

一家中国 AI 初创公司推出了 Manus，它称之为世界上第一个完全自主的 AI 代理，旨在独立处理现实世界的任务，无需人工干预。

Manus 声称在多个 AI 基准测试中具有最先进的（SOTA）性能，包括 GAIA，它评估通用 AI 助手解决复杂的现实问题的能力。

Manus AI：完全自主的任务执行

与 ChatGPT 或 Gemini 等需要持续用户输入的传统 AI 助手不同，Manus 独立运行，在最少的监督下处理多步骤工作流程。它可以在没有人工干预的情况下从头到尾导航软件、分析数据并执行复杂的任务，其功能更像数字工作者，而不是传统的助手。

Manus 能够执行广泛的实际任务，包括：

商业与研究 - 进行简历筛选、房产研究和人工智能市场分析。

Web & Freelance Automation – 在 Upwork 和 Fiverr 上处理网页浏览、编码、内容创建和自由职业。

金融与投资 - 生成具有深度财务洞察的交互式股票市场仪表板。

教育与培训 - 为教育工作者开发关于动量定理等主题的互动课程。

法律与保险 – 创建结构化的保单比较表，并提供量身定制的建议。

电子商务和运营 – 分析亚马逊商店的销售情况，提供数据驱动的增长策略。

个性化旅行计划 – 为国际旅行设计详细的行程和手册。

Manus 团队还接受公共任务提交，允许用户请求 AI 驱动的项目并探索其全部功能。有关 Manus 可以做什么的更多示例，请访问他们的官方网站。

通过导航软件、分析数据和自行采取行动，Manus 的功能更像是数字工作者，而不是传统的 AI 助手，这标志着向完全自主的 AI 系统迈出了重要一步。

GAIA Benchmark Results: How Manus Compares

Manus 在 GAIA 基准测试的所有三个级别中都优于领先的 AI 助手，包括 ChatGPT 和 Gemini。

AI 代理的未来：下一步是什么？

Manus 目前仅以受邀者的方式运营，但该公司已宣布计划在今年晚些时候开源其 AI 模型。

此次发布标志着 AI 开发的重大转变 — 从辅助 AI 模型（需要人工监督）转变为能够独立处理多步骤工作流程的完全自主代理。

随着 AI 的不断发展，Manus 可能预示着新一波自主 AI 代理，与 OpenAI 和 Google 等主要参与者争夺一般 AI 主导地位。

这意味着什么

Manus AI 的自主能力代表了 AI 开发的重大转变，超越了 ChatGPT 和 Gemini 等需要人工提示和监督的传统助手。

如果 Manus 兑现其主张，它可能标志着 AI 代理的下一次发展——完全独立处理复杂的多步骤任务。这可能会对各行各业产生重大影响：

劳动力自动化 – 完全自主的 AI 代理可以开始取代人类工作人员担任管理、研究和技术角色。

自由职业者和零工经济的颠覆 - AI在Upwork和Fiverr上处理任务表明AI和人类自由职业者之间的竞争日益激烈。

企业 AI 采用 – 企业可以开始依赖 AI 代理进行决策、运营和研究，从而减少对人工参与的需求。

AI监管与安全 - 随着AI变得更加自主，确保透明度、问责制和道德使用将变得更加重要。

也许最值得注意的是，Manus AI 来自一家相对不知名的公司，但它在 GAIA 基准测试中取得了最先进的性能，超过了主要的 AI 参与者。这表明，对高级 AI 代理的竞争不再局限于 OpenAI 和 Google 等大型科技公司，较小的新兴初创公司现在正在突破 AI 的界限。

由于 Manus 的性能优于现有的 AI 模型，现在的问题是其他 AI 公司是否会加快向完全自主代理的推动，以及这对未来的工作、生产力和 AI 治理意味着什么。

Manus AI AI 代理

中国的 Manus AI 与阿里巴巴的 Qwen 合作扩展 AI 代理

2025-03-19

HotAI导航站