Manus AI:首款完全自主的 AI 代理创下新的基准记录
一家中国 AI 初创公司推出了 Manus,它称之为世界上第一个完全自主的 AI 代理,旨在独立处理现实世界的任务,无需人工干预。
Manus 声称在多个 AI 基准测试中具有最先进的 (SOTA) 性能,包括 GAIA,它评估通用 AI 助手解决复杂的现实问题的能力。
Manus AI:完全自主的任务执行
与 ChatGPT 或 Gemini 等需要持续用户输入的传统 AI 助手不同,Manus 独立运行,在最少的监督下处理多步骤工作流程。它可以在没有人工干预的情况下从头到尾导航软件、分析数据并执行复杂的任务,其功能更像数字工作者,而不是传统的助手。
Manus 能够执行广泛的实际任务,包括:
商业与研究 - 进行简历筛选、房产研究和人工智能市场分析。
Web & Freelance Automation – 在 Upwork 和 Fiverr 上处理网页浏览、编码、内容创建和自由职业。
金融与投资 - 生成具有深度财务洞察的交互式股票市场仪表板。
教育与培训 - 为教育工作者开发关于动量定理等主题的互动课程。
法律与保险 – 创建结构化的保单比较表,并提供量身定制的建议。
电子商务和运营 – 分析亚马逊商店的销售情况,提供数据驱动的增长策略。
个性化旅行计划 – 为国际旅行设计详细的行程和手册。
Manus 团队还接受公共任务提交,允许用户请求 AI 驱动的项目并探索其全部功能。有关 Manus 可以做什么的更多示例,请访问他们的官方网站。
通过导航软件、分析数据和自行采取行动,Manus 的功能更像是数字工作者,而不是传统的 AI 助手,这标志着向完全自主的 AI 系统迈出了重要一步。
GAIA Benchmark Results: How Manus Compares
Manus 在 GAIA 基准测试的所有三个级别中都优于领先的 AI 助手,包括 ChatGPT 和 Gemini。
AI 代理的未来:下一步是什么?
Manus 目前仅以受邀者的方式运营,但该公司已宣布计划在今年晚些时候开源其 AI 模型。
此次发布标志着 AI 开发的重大转变 — 从辅助 AI 模型(需要人工监督)转变为能够独立处理多步骤工作流程的完全自主代理。
随着 AI 的不断发展,Manus 可能预示着新一波自主 AI 代理,与 OpenAI 和 Google 等主要参与者争夺一般 AI 主导地位。
这意味着什么
Manus AI 的自主能力代表了 AI 开发的重大转变,超越了 ChatGPT 和 Gemini 等需要人工提示和监督的传统助手。
如果 Manus 兑现其主张,它可能标志着 AI 代理的下一次发展——完全独立处理复杂的多步骤任务。这可能会对各行各业产生重大影响:
劳动力自动化 – 完全自主的 AI 代理可以开始取代人类工作人员担任管理、研究和技术角色。
自由职业者和零工经济的颠覆 - AI在Upwork和Fiverr上处理任务表明AI和人类自由职业者之间的竞争日益激烈。
企业 AI 采用 – 企业可以开始依赖 AI 代理进行决策、运营和研究,从而减少对人工参与的需求。
AI监管与安全 - 随着AI变得更加自主,确保透明度、问责制和道德使用将变得更加重要。
也许最值得注意的是,Manus AI 来自一家相对不知名的公司,但它在 GAIA 基准测试中取得了最先进的性能,超过了主要的 AI 参与者。这表明,对高级 AI 代理的竞争不再局限于 OpenAI 和 Google 等大型科技公司,较小的新兴初创公司现在正在突破 AI 的界限。
由于 Manus 的性能优于现有的 AI 模型,现在的问题是其他 AI 公司是否会加快向完全自主代理的推动,以及这对未来的工作、生产力和 AI 治理意味着什么。