体验Auto GLM沉思,有亮点但不是很多
3 天前 / 阅读约6分钟
来源:36kr
智谱AI推出AutoGLM智能体,实测生成报告存在信息拼凑、维度宽泛等问题。

昨天,智谱AI,推出了他的全球首个自主智能体应用:AutoGLM沉思。

这款应用的核心功能有三点,深度研究与推理、自主调用工具以及多平台信息搜索。

下载并安装完成后,页面左侧罗列了一系列智能体,包括AI搜索、AI对话、AI阅读以及AI生成视频、制作PPT等。

我找到了AutoGLM沉思,在对话框下方,还有一系列可选任务,比如:教儿童编程、整理AI行业报告等。目前我看到的共有五个板块,涵盖学术攻略、金融生活、创作多个方面。

我随机点击了一个任务,要求它帮我写一篇以AI为主题的文章。它自动显示了一个任务示例,即撰写一篇从三个维度用大数据预测2025年海外爆品的文章。

我直接点击确认后,就可以将任务发送给它。

首先,我看到了它的思考过程。会将任务拆解,以撰写这篇文章为例,它将其分为了四步。

第一步,了解什么是选品以及选品在电商中的应用;第二步,展示海外电商的现状;第三步是预测爆品的三个维度;第四步是收集行业数据和案例。

随后便开始了执行步骤。

它访问了5个网站,包括微博、今日头条以及原创力文档等,从这些网站搜索相关信息。搜索完成后,它提炼出了几个结论。

说:基于搜索的初步结果,我现在对AI在选品中的应用有了基本了解。从搜索结果可以看出,AI技术通过数据整合与智能分析、智能推荐系统、自动化流程管理以及精准匹配需求等方式,正在 revolution 革新传统的选品模式。

接着,它又进行第二轮搜索,在搜索前,它又重新界定了问题。如下:

这次是去寻找更权威的资料,它提炼出了三个关键词,即AI、选品技术、方法论、大数据。它访问的网站是今日头条、搜狐、腾讯新闻等。

这一轮搜索后,它得出结论:

我已经获取了关于AI选品和大数据分析的一些基本概念和应用方式。现在我需要深入研究预测爆品的三个关键维度,这是文章的核心内容。

不过,此时它卡住了。

提示我任务执行要在Chrome浏览器中,安装智谱清言浏览器插件(AutoGLM Web)。好吧,我下载插件后,它开始执行任务。

这一步的确比较细节,它分别去了知乎和小红书。

在小红书网站,自动输入了“AI选品”“电商”等关键词。之后,它随机点开了几位小红书博主的内容,开始真正进行阅读理解,左下角显示本轮任务已结束。

这样的行为大概持续了五六个,我推测它是在提取小红书博主所写的一些有观点的内容;随后,它在PC端给我总结道:

我已经查看了小红书上关于"用Deepseek做咸鱼,一分钟找出30个爆品"的笔记;这篇笔记展示了如何利用Deepseek AI工具进行选品,以及AI如何帮助快速找到适合在闲鱼平台销售的冷门高利润商品。

不过,我仍需要找到预测爆品的三个关键维度,这是文章的核心内容。让我继续搜索更多相关信息。

接着,它又进行了下一轮搜索,再次访问了今日头条、搜狐、腾讯等5个网站,并且自动打开了我的浏览器查看相关内容。

在一些需要登录的页面,它会留下大约150秒的时间让我登录,登录完成后它才进行下一轮操作。

例如:

我看到它打开了我的知乎账号,直接在里面输入了“AI选品”“预测模型”“关键因素”等信息;让我感到惊奇的是,它居然会使用知乎直答功能,这是没想到的。

在这个过程中,它打开几个知乎答主的内容,上下滑动以采集其中的关键信息。

这一轮搜索结束后,它提炼出了一些结论,比如:

我找到了多篇与AI选品相关的高质量内容,这些将帮助我构建"AI选品革命:用大数据预测2025年海外爆品的三个维度"的文章框架。

特别有价值的内容包括:跨境电商AI选品的变革性作用、AI选品相比传统选品的优势、预测模型在选品中的应用方法、影响选品的几大关键因素等等。

最后,它思考了一把说:虽然这些信息非常有价值,但不能只看文章,还要查找核心期刊论文来支持论证。

于是,它打开了知网,通过高级检索找到了两篇关于大数据下跨境电商选品和AI选品的文章,并详细阅读了这些学术文章;它又打开了百度学术,在其中输入了“跨境电商选品维度”,并自动设置了时间范围,从2023年到2025年。

我觉得它这一点很聪明,能够筛选文献的时效性。之后,它进行了精准搜索,整个过程都是全自动化完成的。

我细数了一下,它前前后后折腾了四轮,总共八次操作,才整出一份研究报告。

说实话,这报告看得我挺无语。整个内容像八股文一样,结构死板。看着它挺忙活,一会儿去这儿搜索,一会儿去那儿摘录,但拼凑到报告里,70%的内容根本用不上,感觉就是瞎忙活。

还有一点是,我给它的任务是写一篇关于“AI选品革命:用大数据预测2025年海外爆品的三个维度”的文章。

结果它给出的三个维度,全是些宽泛又宏观的东西,比如市场分析、市场趋势、消费升级,啥都说了,但啥都不具体。

提到海外市场预测,更是糊弄人,中亚市场、地缘优势、非洲市场这些,听着高大上,但真不知道该怎么用。最后还扯上了些AI选品工具,像DeepSeek、JungleScout、Helium 10,虽然列出来了,但感觉没啥实际用处。

最后,这报告连个导出按钮都没有,只能手动复制到Markdown或者文档里。

总结下来,我的感受是:

一,生成报告的精准度不够,能把流程走完,但内容质量实在差强人意,很多信息不靠谱。二,抓取信息太局限:就搜小红书、搜狗、知乎这些平台,专业点的网站一概没有。

三,搜索能力有待提高:分步骤去搜、但分步骤后如何搜、如何定义关键词,处理不到位。搜商还得好好练练。

也可能是我用的方法不对。不过,新产品刚出现,我们也不能要求太苛刻,还要不断加油。感兴趣的话可以去体验一下。

地址是:https://autoglm-research.zhipuai.cn/