
1、在Manus爆火之前,我已经用过几款基于浏览器的AI Agent产品了。比如browser use、browserbase、还有几个名字我也忘记了。
当时测试的一个典型案例就是让它帮我去发推,点赞。只需给AI一句命令,确实也能实现,大体就是它拆分步骤,然后去执行,比如它会打开网站,登录需要账号密码,中间会叫我介入,这也没办法,能理解。登录成功后它就就继续去发推点赞了。
所以开始,我看到了AI开始要掌控我们浏览器的迹象,就是能力还比较有限,有这个功夫让AI去做事,且等几分钟还不成功,最后还不如自己来。所以,大多数情况下很多事情还用不着让AI来。
2、我心想Manus大概也是类似的产品,加上Manus邀请码被炒得老贵,也不是太当一回事。
最近接到任务,必须用一下。故破费弄了个账号当早期”韭菜“了。
3、先前的认知:
AI+Python脚本=AI Agent。
AI + RPA = AI Agent。
AI是大脑,要让他获得手和脚,要么就是用python脚本等操控电脑,要么就用RPA软件去模拟键盘鼠标操作电脑。
还有要么就是借助机械操控物理世界。
4、AI+Python这条路好虽好,就是编程这东西对大众有较高的使用门槛。其实Cursor、Trae、Windsurf等就是非常好的AI Agent,他们也可能操控文件,以实现在电脑上间接做事,只不过他们被定义成代码编辑器了。
我之所以选Cursor,也试用过Trae和windsurf最终回归Cursor,主要因为后两者太智能了。在当前AI还不够成熟的情况下,虽然它们可以一句话命令就做很多事情,一旦中间步骤有点偏差,结果就会与预期相差甚远。
而Cursor不够智能,反而成了好事,每一步我还能监控修正,也恰恰给到了用户掌控感。
5、AI+RPA这条路,虽也有前途,但RPA的最大缺点就是它要占用用户电脑,你把电脑给AI用了,那你就不能用电脑做别的事了。
所以,AI+RPA这条路,也有有技术门槛,也有重大使用弊端。
6、Manus 非常明智的做法就是用了”虚拟云端电脑“,用的Linux Ubuntu环境,
这么一来,AI在这个云端空间里,可以使用命令行自行创建项目文件夹,写python代码,用markdown文档来记录任务信息,管理任务,汇总任务报告,也可以启用浏览器获得搜索信息。
这方案简直太6了!!!
7、这不禁让我想到我用AI在服务器上做的事情,回想我过去一年,AI给我最大的改变也在于此,最划算的投入就是花百来刀弄一个VPS服务器,另外花20刀每月用在Cursor上面,然后就是在各种AI 模型上的token消耗。
因为AI最适合在服务器上使用,让AI结合Python,没日没夜地给人干活。
而Manus的实现,如出一辙!!!
8、MetaGPT开源了OpenManus,事实证明,Manus的技术并非有多深的门槛,任何人也都可以在电脑本地复刻一个Manus。
但----”运营这一门生意,可比开源困难多了!!“
即便我也可以在我服务器上部署一个OpenManus,我也非常仍然愿意去用官方的Manus。
因为AI Agent的使用成本太高了!!!
9、Manus使用多个AI进行协作。其中Claude作为主力,通义千问等次之。因为目前在众多AI中,只有Claude有这个能力把一个任务分解成七八个小任务,执行到后面还能知道自己在做什么。
换做其他AI,在第五六步就忘记初心,不知道自己在做什么了,以至于导致任务失败。
即使是DeepSeek,也是要弱一点。
而Claude的使用成本也相对较高。
综合一下,单纯给Manus一个命令让他干个活,几个AI协作下来,一次任务的成本已经高达2美金。
话说,如果用GPT4.5的话,单纯回答一次问题就高达2美金的API 成本了。
所以,即便给你个OpenManus,得自己充钱买token,你也舍不得用。
何况,现在Manus自己在烧钱给人用。
好在前几天,Manus伴上了通义千问,而通义千问也恰恰前几天发布了QWQ 32b模型,同样类似的能力,相比DeepSeek R1的成本又下降了不少。
所以,相信通义千问+Manus,还是能为国人带来惊喜的。
10、那Coze、Dify等低代码工作流工具,也是被称为AI Agent,跟Manus有什么区别?
这也正是Manus理念的精华所在,即,“Less structure, more intelligence”,减少对AI的约束,充分释放AI的能力。
无论是Coze、DIfy还是各种其他AI应用,自己作为产品经理,都在鼓励用户也做产品经理,尽可能多建立工作流。甚至官方自己下场做各种智能体工作流进行推广。
而现实是用户的需求个性化不一,买账用户不多。
工作流的主要意义在于用户把日常的工作事务,抽象成若干个独立的模块,串起来,以求实现自动化。本质是用户的工作具体怎么做只有用户自己知道。
而现实是用户的需求个性化不一,买账用户不多。
Manus在这点是我还是挺佩服的。他们从头到尾自己写了0个工作流!!!
写工作流这个事也交给AI。
这才成就了他们对”通用 AI Agent“的定位。
所以,也就有媒体大肆吹,全球首个通用AI Agent,这么说确实像是那么回事。
11、既然Manus可以执行Python脚本来给用户做事情,那就让我立即想到,python最擅长的就是数据处理了。
于是,我就给他Manus一个颇具挑战性的任务。
我准备了一个数据表格,准备让Manus为我数据清洗,也就是去除重复的条目,补全缺失的条目。
准备文件,一个数百行的客户信息数据表格:
提示词:我有一个包含客户信息的CSV文件,数据格式不一致且有很多缺失值。请帮我清洗这些数据,包括:标准化日期格式,填充缺失的邮政编码,删除重复条目,并修正明显的拼写错误。然后生成一个清洁版的CSV文件和一份数据质量报告。
处理后的截图:
说起来令人难以置信:整个过程耗时超过30分钟!!!
对比上传前的文件,它也确实为我处理了重复的条目,补充了缺失的内容。
而且给我提供了一份处理报告。
整个过程可以看这个链接:
https://manus.im/share/6ixNfkXWcTi8Tb2tjkfFAc?replay=1
或者扫码看更方便:
12、所以,现在知道AI Agent能做什么了吧。
AI+搜索是基础能力。
操控文件是必需。
也就是说,Python是AI的语言,大概问问,Python能做什么,Manus这样的AI Agent就能做什么。
13、AI 确实能真做事了。
我们过去的AI,仅仅陪你聊聊天,生成些文案,大家就不知道能用来干嘛了。
但这波AI Agent确实不一样,是真的在做事了。
但仍要警惕AI Agent做事的实际效果。
用一个简单的算术来表示。
AI存在幻觉问题,一个AI在处理一个小任务时,成功率假设90%。
一个大任务拆成10个小任务,让AI连续处理。由于幻觉累加,90%的十次方,意味着最终的成功率只剩下35%了。
14、AI Agent的成功率不高,据Oraige.ai实测,它布置了10个任务,实际成功了3个。
目前也就这样的概率了。
朋友说:这样的AI,要它作甚?
我说:现实中,老板让员工做事,也差不多这样子,有的时候能做好就行,许多公司不都养着一些差不多就可以的员工么...
不知Manus有没有设定一个检查监督的AI角色,查一查我任务的执行成功与否...
如此,依然可期。
如上。
谢阅。