5个人三小时复刻开源版Manus,邀请码也不需要了

克雷西 一水 发自 凹非寺

量子位 | 公众号 QbitAI

这壁垒……一夜走红的Manus,现在已经有了开源复刻版!

5个人3个小时,一个完全免费、无需排队等待的OpenManus就做好了。

500

500

至于复现程度,还是直接看Manus官方和开源团队提供的demo对比。

作为全球首款通用智能体,官方提供的case如下:           

而OpenManus团队三小时复刻的成果是酱婶儿的:

效果大家自己感受一下。

对于动手能力强的小伙伴儿,也期待大家自行体验后留言反馈。

从开源反推Manus的实现路径

与此同时,通过深扒OpenManus,我们其实还可以看出一条实现Manus的合理路径。

(当前Manus使用了哪家模型、Agent框架等具体细节处于保密状态)

概括而言,OpenManus的背后有三大关键:

拥有模块化Agent系统;

具备实时反馈机制;

配备了一整套强大的工具链;

展开来说,其核心设计就在这种模块化Agent系统。开发者可以根据需要自由组合不同的功能模块,从而创造出独特的AI助手。

在OpenManus中,拥有不同分工的Agent会协作完成需求理解、规划、行动等任务。

比如Manus主代理就像项目经理,负责理解用户需求并完成分工;PlanningAgent作为规划员,负责将复杂任务进一步拆解成可执行的步骤;而ToolCallAgent则是技术专家,负责掌管各类工具使用。

以上这一套都是靠开源团队曾经提出的MetaGPT(一个多智能体框架)实现,开发者可以自由集成多个合适的大语言模型。

此外,OpenManus的另一关键在于其思维过程是公开透明的

正如开头提到的例子,拿到任务后,OpenManus如何思考问题,如何规划执行……全都能实时反馈。

这为人类在合适时间进行干预提供了“窗口”,有助于更高质量完成任务。

500

最后不得不提到Agent对工具的使用。

为了完成复杂任务,OpenManus也配备了一系列“外援”:

浏览器自动化:像人类一样操作浏览器,自动分析网络信息并交互;

各种代码执行器:能够实时生成和执行代码;

文件处理:自动生成和管理各类文档;

……

需要注意的是,各类工具都不是单独的模块,而是需要协同设计。

将以上组合在一起,这类多智能体系统的一般架构为:底层由各类大语言模型构成,中间层通过多智能体协作拆解任务,执行层调用各类API接口完成具体操作。

总之,按照OpenManus作者的总结,这一开源成果结合了computer-use、基本的Agents以及融合了规划能力。

500

正如OpenManus团队在项目致谢中提到的,Claude厂商Anthropic去年上线的computer-use,以及YC投资的项目browser-use,都给OpenManus提供了基础支持。

顾名思义,这两个项目分别被用来操作电脑和浏览器,而在沙盒环境中操纵正是Manus工作的一大核心特征。

500

5人开发团队,3小时完成复刻

OpenManus团队只用了1个小时就完成了核心系统整体也只用了3个小时

核心作者梁新兵介绍,OpenManus的火速上线,来源于MetaGPT积累下的技术沉淀。

(注:MetaGPT是一个多智能体框架,为了处理复杂任务,将不同的角色分配给GPT模型,形成一个协作性“软件公司”。)

我们只是把浏览器工具链嫁接到过去代码上,配合沉淀的Agent工具包。

几位研发成员,也都是来自MetaGPT团队。

“开源版Devin”——数据解释器(Data Interpreter),也是出自MetaGPT团队之手。

500

OpenManus核心作者梁新兵,毕业于华东师大,还在读时就参与了Data Interpreter的工作。

500

另一名核心作者向劲宇,本科就读于西南交通大学应用物理系。

去年,读大四的他和队友一起使用GPT-4与Claude 3组成多智能体的方案,让AI分饰多个角色、相互验证来完成答题步骤,获得了阿里巴巴数学竞赛AI赛道全球第二名。

在MetaGPT社区,向劲宇还和其他成员一起,让智能体成功在“我的世界”当中采集到了钻石。

甚至他还曾经让智能体假扮知乎大V,回答了100多个问题,获得3万余次阅读,还有赞同、反驳甚至私信关注,结果直到他主动停止,AI的身份都未被发现。

500

张佳钇,去年本科毕业于中国人民大学高瓴人工智能学院,现在是港科大(广州)在读博士,被ICLR 2025接收的智能体框架AFlow,他和向劲宇是共同一作。

于兆洋,张佳钇在人大的同级同学;洪思睿,MetaGPT和Data Interpreter两篇论文的共同一作,DeepWisdom高级研究员,香港科技大学硕士,本科毕业于暨南大学。

AFlow的作者当中,也有于兆洋和洪思睿的名字。

500

今年,以张佳钇和向劲宇为共同一作,五个人的名字共同出现在了一个名为SPO的项目当中,该项目能够让提示词自我进化,让人们摆脱研究提示词工程的繁琐过程。

500

并且综合五名作者的经历和署名信息可以推断,除了15年取得硕士学位的洪思睿年龄稍长之外,其余4位作者,几乎都是本科毕业不久,当中有人选择继续深造,也有人加入了DeepWisdom。

重新看Manus“套壳风波”

除此之外,OpenManus的出现,或许也给Manus的“套壳风波”提供了新的视角。

先简单回顾一下这场风波。

Manus被质疑“套壳”主要源于两点:

一是有前车之鉴。Manus背后团队曾打造出另一款产品——Monica,而作为一款集成各类大语言模型的插件,Monica也曾一度陷入套壳争议。

所以对于一家公司出品的东西,大家很容易产生联想。

在此基础之上,由于产品被怀疑是套壳缝合而成,因此大家很容易形成Manus技术含量不高的印象。

然而,之所以说OpenManus是一个新视角,是因为从其复现路径来看,许多模块都是基于已有开源项目实现。

实现不同模块的统筹、调度,形成新的功能,绝非人人都有能力实现。

而且开源社区的一大意义,本就是让后来的开发者,能够直接站在巨人的肩膀上。

即使不谈开源,各大模型厂商提供API给开发者的目的,同样是让他们能够开发新的应用。

说得再夸张一些,引用Perplexity创始人的说法,“OpenAI就是英伟达套壳,英伟达就是台积电套壳,台积电就是沙子套壳……”。

所以是否“套壳”,不是问题的核心,关键是它能不能产生实质性的生产力提升

但从我们昨天的实测感受来看,Manus距离这一目标,还有相当长的距离。

所以,把产品的能力打磨好,可能才是比纠结套壳更要紧的事。

你对Manus的感受如何?欢迎评论区留言讨论。

开源地址:

https://github.com/mannaandpoem/OpenManus

参考链接:

[1]https://x.com/didiforx/status/1897675038972883408

[2]https://www.sohu.com/a/827134153_121798711

[3]https://modelscope.cn/studios/AI-ModelScope/SPO

站务

全部专栏