靠这个工具,我一句话搓出了个奶龙
17 小时前 / 阅读约7分钟
来源:凤凰网
AI学会了3D建模。

最近 Manus 爆火,很多人都苦于没有邀请码,只能看着有码的人体验 “别人给自己干活”的快感。

为啥这东西这么吸引人呢?还是因为现在的大语言模型,只能和你进行“言语交流” 。你跟它说“这个东西我不会”,它会给你罗列出详细的步骤,但绝对不会帮你完成。完成工作,是只有碳基生物能干的事,硅基生物它做不来。

而Manus一出,就展现了超越传统大模型的自主执行能力,不仅能理解复杂指令,还能拆解任务、调用工具等。网友一看,好家伙,这不就是个帮我打工的私人助理吗?

但这玩意也没那么全能,只能算个“套壳产品”,虽然是集成了很多工具包,但如果是它工具库里没有的,那就完蛋了。

比如,你能让Manus帮你PS个图,用PR剪个视频,再把工程文件发给你吗?对不起,做不到。也就是说,它离我们真正的“生产力工具”还很远。

但最近世超在GitHub上发现了个比较火的项目,可以让大语言模型帮你建模。这可不得了,可以说是让AI成为真正生产力工具的重要一步,现在这个项目已经收获了 6.8k 的 Stars ,还在快速增长。

世超看完演示视频,发现作者仅仅通过与Claude对话,就使用3D建模软件 Blender 建立出了一幅精美的模型。整个建模过程无需敲代码,更无需学习软件操作,只需要通过语言描述需求即可完成。

视频里,作者直接在对话框里输入:“请用 Blender 帮我建立一个场景,有一条龙站在一罐金子旁边 ” 。

随即, Claude就开始调用Blender开始建模了,很快啊。

最终成品图如下:

看着效果确实不错啊,那必须体验一下了,毕竟作为懒狗,看着别人把活全干了确实有种不能拒绝的快感呢。

于是,我找到项目文档,照着上面的步骤,用不了一小时就把项目部署完成了,确实简单。整个过程也不需要写代码,完全的鼠标操作。

体验了一个上午,先说结论:趣味性十足,实用性一般。

首先我试验了一下,能不能达到视频中的效果。我直接把视频中的提示词复制过去,他还真列出步骤一步一步开始做了:

就是这效果。。不能说是一模一样,只能说是有点关系:

金币和地板是有了,就是这龙也太龙了。

不过视频显示啊,作者在该提示词的基础上进行了多次微调,世超由于对建模一窍不通,不懂怎么调整建模细节,所以造成了实物与原图不符。感兴趣的差友们可以尝试复刻一下视频中的效果。

哎,不然来个简单点的,就给我画条龙吧?我们来看看对这种简单直接的要求,它的完成度怎么样。

于是,我直接跟它说:给我画条真龙。

看它输出的步骤,真是有模有样的,先画龙身,再画龙头,然后是龙爪和细节修饰。。

结果呢?

你还别说,跟楼上那条龙真有异曲同工之妙。看来大模型对龙的理解就是这样了,又龙又猪的。没关系,反正都是十二生肖嘛。

额,真龙画不出来,奶龙总行吧?我把奶龙的细节特征全给你描述清楚,你给我画,就不会出错了呗。

必须动手。我给的提示词是:“画一条黄色怪兽,圆圆的头,肥胖的身躯,短胳膊短腿,还有恐龙尾巴和绿色眼睛。”

它立马就开始动手了,很快啊。

最终结果令我拍手叫好:

说实话,这是给它的几个任务里,完成度最高的一个了,起码能看出来是条奶龙了。

不过呢,这些其实都是些神秘的东方元素,对西方大模型来说,画不出也可以理解。

有没有什么世界各地都常见的东西?我想了想,让它给我画栋房子吧。提示词很简单:画栋房子。

在经过一番全自动操作后,它给出了最终成品:

嗯,确实还不错,有门、窗、树甚至烟囱之类的东西。就是旁边飞了两根横梁不知道是做什么的。。

这几轮体验下来,感觉只能说勉强可以,毕竟是零基础建模师,建出能看出形状的模型已经算是胜利了。

世超也把它的作品给专业3D建模的同事看了,同事表示:其实它现在只会简单的几何体堆砌,就像小孩搭积木一样,没有建立复杂模型的能力。

有很多网友尝试过它之后,也给出了类似评价:

总结一下就是:能用,但也仅限能用。想给专业人士帮上忙,其实还远着呢。。

但对现在AI的发展来说,还是个不小的进步,AI从 “ 摸不到工具 ” 到 “ 能摸到工具了”,那给人类打工这件事还会远吗?

那么话又说回来,不是说让AI实现工具使用挺有难度吗?这个是咋实现的呢?

其实,怎么能让AI使用我们的生产工具干活,一直是AI从业者研究的难题。因为现在的AI和生产力工具们,还没办法直接“交流” 。

举个例子,《圣经》中说,最初所有人类都使用的是同一种语言,为了防止人类合伙建造通天塔,上帝一声令下,把大伙的语言都分隔开了。

而现在的各大AI和人类的工具、数据库之间呢,也有这种“语言不通”的矛盾。

为了解决这个问题,在去年11月,一位叫MCP( Model Context Protocol ,模型上下文协议 )的重量级嘉宾就闪亮登场了。

它是由Anthropic提出的一种开放标准协议,你可以把它理解成一个AI世界的 “ 翻译官 ”。不管你是什么东西,只要支持MCP协议,它都能使大模型的“语言”让其他使用 MCP 协议的工具 “听懂” ,这样一来,壁垒就被打破了,通天塔不是就指日可待了嘛?

如果未来越来越多的应用使用MCP协议,我们的AI就能轻松调用它们进行工作,人类就能正式进入“解放双手”的时代了。

上面介绍的建模项目呢,就是使用了 MCP 协议,把大模型和建模软件连接了起来,所以咱们每提一个要求,大模型就能根据要求调用建模软件进行执行。

随着时间推移,已经有越来越多的工具加入MCP的队伍中了。

比如,VSCode上的一个叫Cline的插件,本身是使用AI辅助编程的,最近也宣布支持 MCP了,这意味着这款插件可以使用MCP生态下的全部功能。

比如一款爬虫工具Firecrawl ,能把各大网站的信息爬下来,然后转化成对大模型友好的Markdown格式。

程序员用这款插件时,想在网站上爬点有用的信息并喂给AI总结,so easy好吧。

不过据传Manus没有使用MCP协议,世超觉得如果未来MCP成为主流, Manus也就随即失去意义了。。毕竟大家伙都能“万物互联”了,还需要你个集成工具包干什么呢?当然这也都是展望阶段,未来到底怎么样,还不好说。

不过最近的几波新闻,都代表着AI离“替人类干活”越来越近了。你说大家不担心抢工作,那是不可能的,毕竟你永远不知道下一个被替代的职业是什么。。

所以,你的职业离被AI拿下,还有多远呢?