3月6日,又一个来自中国的AI产品刷屏了,Manus。有多火呢?一时间,几乎全网都在争抢邀请码,甚至传言Manus邀请码在闲鱼炒到了8万元一个。就在3月7日,咱们得到的快刀青衣老师,迅速给大家做了专业的讲解。
今天,我们又请来了得到App,《科技参考》第四季的主理人卓克老师,从Manus的定位、优劣势、预期等方面,为你进一步解读。卓克老师的这门课程,主要带你关注和追踪这个世界正在发生的科技大事,带你每天跟上科技新变化。
卓克老师长期追踪科技进展,著有畅销书《我们脑中那些挥之不去的问题》,在得到App累计已有19万人订阅他的课程。
以下是卓克老师的分享:
作者:卓克
来源:《卓克·科技参考4》
01 定位:一个不错的产品
先来定位,它是一个很不错的产品,在特定领域的实用性预期会很好,但和之前大火的DeepSeek比起来,并不是一个级别的。DeepSeek如果是奥运会金牌,Manus大约是全运会前三名的水平。
Manus的火爆是源于一段演示视频。
第一个任务是让Manus从一堆简历里找出“强化学习算法工程师”这个职位最合适的候选人。
它接收到一个zip压缩文件,里面有15份个人简历,Manus自动解压后,逐页阅读了简历,记录了重要信息,根据这些人的经验和专业水平对15个人做了排序,然后根据主人的偏好生成了一个excel格式的结果报告。
第二个任务是根据主人的购房需求在纽约选房子。考虑了很多因素,比如社区的犯罪率、中小学教育质量、预算等等,最后给出了候选房屋的报告。
第三个任务是对特斯拉股票的分析,最终呈现的是一个网页,网页里是关于这只股票的各种可视化的而且带一定交互属性的页面(这是需要编程的)。
这个视频发布后,Manus邀请了一些人做体验,可能是由于这个公司算力有限,所以邀请码数量很少,不到一天的时间在闲鱼上,一个邀请码就被炒到了8万块钱。
第二天Manus还专门发文章辟谣,说他们从未开设任何付费获取邀请码的渠道,从未投入任何市场推广预算。
在这些事情发生后,我看到的对Manus的评价鲜明地分为两派:
第一派说Manus是全球首款通用型AI Agent,是继DeepSeek后又一个国运级突破。
第二派是浇凉水派,说Manus并没有重大技术突破,只是一个可能还不错的互联网产品。
而第一派集中在那些平时什么内容都发的自媒体上,第二派集中在平时只聚焦在偏技术的自媒体上。所以不用多说,第二派的定位是更值得采信的。
02 优势:产品化做得又快又好
我们先来说说Manus的优势,那就是产品化做得又快又好。
实际上AI Agent(人工智能体)从GPT3时代就有人在做,比如Auto-GPT,而且这个项目今天依然存在,还在不断改进和优化中。类似的自我驱动完成任务的Agent在开源社区里还有很多,比如BabyAGI、LangChain Agent,还有商业化更成熟的Coze、Dify、ChatDev。
但是开源社区比较火的那几个Agent,实际使用门槛比较高,又要本地部署,又要申请各种API密钥,还得付款,普通用户是不可能搞定的。
其次是他们诞生得比较早,基于的大语言模型还是能力较弱的GPT-4,所以虽然听上去,“自我驱动”好像很神奇,但实际上它理解完任务后规划出来的步骤经常跑偏。
比如2年前我使用Auto-GPT只是想完成一个在网页上查信息的工作,竟然耗了1个多小时没有弄完,消耗的token也几美元了,我手动暂停了,它好像是卡在了某个循环上。这本质上是因为那时候大语言模型的理解能力弱,导致拆分任务不合理。
这个问题要解决,只能靠基础模型的能力提升。所以在2024年9月之前下功夫做Agent,受挫感是很明显的,业界也曾有一股潮流认为Agent已死,这个状况是从带有较强推理功能的模型出现后才得以改观的。
而Manus无疑是其中反应最快的,最早做出了效果不错,看上去可用的AI Agent。尽管还没有公布任何技术细节,但从初期大家的试用体验来看,如果后续把算力大幅补齐,应该会是一个比较受欢迎的产品。
03 劣势:功能不全面
然后我们再来说说Manus的劣势,当然,这不止是Manus的劣势,而是整个AI Agent都无法避免的。
我们先从商业化更成熟的后者,其中最有代表性的Coze说起。
他们就明确知道Agent还有其他严重瘸腿的部分,所以只在自己有权限的软件生态圈里设计功能,一般来说定位在公司的运营和办公上。
Coze是字节跳动开发的,工作流里有很多任务其实不需要多高的能力去完成,只需要消耗时间,中学生都可以做,比如请假、报销、会议安排,还有一些工作是公司经常用到的有明确评价标准的工作,比如面试、简单编程辅助、信件翻译。所以Coze就自己开发出大量小工具插件,Agent需要的时候就可以调用它们。
这时你不禁要问,为什么Coze不把功能做全?让Agent可以控制所有的软件,就像很多游戏代练一样,把整个电脑操作权交给一个脚本,只不过现在是一个比脚本程序智能得多的、能够自我驱动的Agent去设计脚本并执行。
这个思路是对的,但问题卡在本地部署和权限上。
你如果想让Agent能像我说的智能脚本一样为你干活,首先你需要把这个Agent背后的模型部署在本地,而这种计划要商业化的模型,怎么可能让所有用户随便安装在本地呢,相当于核心机密免费赠送了。那么不本地部署,就不可能有足够的权限通过网络操作你本地电脑上的那些软件。
其次就是,哪怕你说我根本不在乎网络安全,你可以就像远程控制那样,通过网络完全接管我的电脑,但是广大用户给Agent安排的任务还往往牵涉让Agent去各个互联网巨头,比如电商平台、票务平台、打车平台、内容服务平台、短视频平台、房屋中介平台,让它们像真人一样输入信息、获取信息。
而今天绝大部分互联网巨头都不会轻易给你提供这样的API接口权限,我们真人使用时完全感受不到这种限制,但你想通过机器人或者爬虫,从这些平台搞到批量的信息,对方平台其实大部分都是禁止你这样访问的。
所以你发现没有,Manus给大家展示的功能,涉及到网页之外的服务时,都是用亚马逊举例,因为亚马逊是个例外,它本身有自己的AI音箱,希望接入AI智能下单这类的功能,所以允许以API的方式访问和下订单。但这个事情放在京东、淘宝、闲鱼就搞不定了。
于是像Coze这样的AI Agent,虽然早就在做Agent的项目,但只是把Agent的功能定义在字节软件生态内部。当它自我驱动去索取工具时,也只是用Coze自己开发的插件,这样从权限到功能兼容性都不会出问题。
在中国,也不会有哪个公司打算推出一个功能特别全面的Agent,因为大部分线上线下服务的互联网巨头并不给这些初创公司开API特权,起码当下是没有这个环境基础的。也许今后,某个成熟的、用户体验好、安全也做到位的Agent出现,会有首先吃螃蟹的巨头出现,但这是很难预期的。
这就是中国目前没有很好的全功能的Agent的原因,也是今后一段时间Manus发展受限的主要原因。
04 预期:自媒体内容领域可能出现大洗牌
说完优势和劣势,我们再来说说预期。那就是自媒体内容领域,可能会出现大洗牌。
如果你听懂了我刚刚说的逻辑就知道,尽管中国互联网服务的巨头们,今天大都没有向AI Agent开放API接口,但有一个领域其实是全面开放的,那就是所有用浏览器可以看到的部分。
只要人用浏览器可以看见的内容,AI Agent就有能力完全获取,于是Agent的输入部分就完全没有限制了,如果输出部分也不做特殊功能要求,也只让他输出图片和文字,那其实也相当于完全开放。
于是一个任务规划功能训练优秀的AI Agent最先取代的就是那些公众号的写手们,这些公众号的老板们用上这个工具后就会发现不需要再招聘编辑了,Agent可以写得又快又好。
你可能会说,咱们不是有OpenAI的DeepResearch吗?他生成的报告,那质量简直就是硕士的水平,这不假,但这个功能也有缺点,就是只能生成这个调调的内容,从风格到深度,都是很统一的。
他不能根据用户的需求很自由地规划任务,而Manus是可以轻松搞定这一步的。虽然我没有申请到邀请码,但是《五分钟商学院》的刘润老师有,他今天和我分享了好几个例子:
1. 刘润公众号主笔招聘报告
2.《雷军的修行》短视频脚本系列
3. 成都到新加坡旅行方案
我就以第一个方案招聘主笔举例,需求是:
“我要招聘刘润公众号的主笔。工作地点在上海。待遇优厚。请根据刘润写作的风格,分析主笔需要的写作能力要求,并根据这个能力要求,去各个渠道(比如各类招聘网站、正在找工作的公众号创作者、今日头条、知乎、微博等等)上去寻找10位符合这个要求的,最优秀的潜在候选人,把他们的简历和合规的联系方式提供给我,并告诉我应该怎么说服他们加入刘润公众号。”
当然,大家也能发现,刘润老师的提示词写得很全面、很有逻辑,然后Manus就按这几个步骤去规划更细节的动作:
1. 分析刘润写作风格和特点。
主要参考了几个网站上,曾经有其他人对刘润老师文章的点评,它并没有自己抓取刘润的大量文章,自己分析。当然,因为刘润老师本来影响力大,所以这样直接找到正确答案的概率也高。
2. 确定主笔招聘要求。
这一步是通过大语言模型对文章风格的理解生成的,这一步能比较好的完成,是强烈依赖于大语言模型能力的进步,GPT-4是干不了的。
3. 启动了自己的虚拟PC里的浏览器,在直聘网上搜索潜在的候选人。
4. 同时分析了今日头条、知乎、微博、微信公众号上写商业文章风格和之前分析刘润文章风格近似的那些作者都有谁。
5. 然后把这2个集合的交集做了一个地理位置是否在上海的筛选。
6. 然后把作者们按刘润老师的要求排了序,并且针对性地给每个作者生成了一条劝说他加入刘润公众号的文案。
7. 生成报告。
这个任务非常个性化,还涉及很多具体访问动作,OpenAI的DeepResearch哪怕可以完成,效果也是很勉强的。我把DeepResearch结果图放在下面。
实际上你会发现DeepResearch给的结果,这些推荐人都是一些在写商业分析文章中已经独树一帜的大V了,比如猫爷、邵恒、李翔、小马宋。这个招聘候选人的结果可用性我们放在一边不提,起码是看不出对刘润文章分析的过程,也看不出对招聘网站信息的筛选过程的。
最后说说Manus的创始人,肖弘,92年出生,华中科技大学软件工程专业,大三的时候就开发了华科版的微信漂流瓶、微信上墙、志愿者报名助手、圈圈市场这些小程序。
毕业后推出了壹伴助手,就是最早用AI续写文章的一个程序,之后推出了浏览器插件Monica,后来Monica还发展成一个AI软件的聚合平台。
肖弘之前在AI领域的经验在开发Manus的时候真的全都用上了,快速积累出Manus这个产品,起码在抢先体验的时候,会给人眼前一亮的感觉。这个产品之后如果发展顺利,应该会首先取代一些文章的写手,但也很可能会止步于此。