强如Operator也怕验证码，1450元花得值吗？第一波实测来了 - AI

7 x 24跟踪全球科技动态

热门话题

白天

搜索

资讯

强如Operator也怕验证码，1450元花得值吗？第一波实测来了

9 小时前 / 阅读约5分钟

来源：凤凰网

让Operator登录ChatGPT调用Operator会怎样?

要花1450元才能玩到Operator，让本来满满期待的大伙，一下难受住了。

而交了钱的各位，开始兴奋的晒出各种测试结果。

有网友分享，Operator通过浏览网页在3分钟之内帮打找到了附近牙医诊所，回报了地址和电话。

也有人让它作为研究助手，在arXiv上挨个打开每篇论文，看完后输出总结。

也有“坏人”专门出难题，看AI如何应对：让Operator到ChatGPT官网使用Operator会如何？

但没想到OpenAI预判了他的预判，直接给出一个嘲讽式报错。

试得好，下次别试了。

强如Operator，上网冲浪时也会被验证码难住，但好在它学会了向人类用户求助：

我遇到了一个验证码……你能接管并帮我搞定吗？

没错，这只是一个早期预览版。

参与发布直播的基础研究贡献者（Fundamental Research Contributor）Casey Chu认为，它会犯错误，但它让你提前窥见未来。

而且他的这个帖子，就是Operator寄几发的，成功套娃了：

核心贡献者（Core Contributor）Yilong Qin认为，测试时间计算的Scaling Law在这里继续发挥威力。

给Agent更多时间，它会内省、更新、一遍又一遍地尝试直至最终成功。

同为核心贡献者的姚顺雨表示，有了强化学习的新范式，Operator的进步速度会像从o1-preview到o3一样。

同时他介绍，Agent是OpenAI（甚至是AI）诞生以来就有的目标，在发展过程中做了多次尝试。

但只有发现GPT和草莓（o1）两种新范式后，Agent的潜能才真正被解锁。

2025年将是Agent之年。

他为什么这么说？还要从OpenAI成立之初讲起。

OpenAI的十年Agent之路

早在2016-2017年，OpenAI就通过Word of Bits和Universe探索了让AI操作浏览器上网。

Word of Bits由OpenAI与斯坦福大学合作，参与者包括大家熟悉的Karpathy和Jim Fan、斯坦福大学副教授Percy Liang等，以及姚班校友施天麟。

施天麟只在OpenAI工作了一年，随后在2017年创办了Cresta，业务正是AI Agents 方向，专注于为客服中心提供各种AI助手。

2024年11月，Cresta完成1.25亿美元D轮融资，总融资金额达到2.7亿美元。

OpenAI Universe则是一个Agent训练和测试的平台。他们从李飞飞的ImageNet上受到启发，希望能把图像识别任务上的快速进步复制到Agent领域。

2017年的Universe已经能让AI完成一些简单的浏览器操作，以及玩Atari游戏等任务。

但随后不久，OpenAI就把主要精力从强化学习转向了语言模型GPT系列上。

2021年底，到了GPT-3时代，OpenAI不忘初心推出WebGPT，使用基于文本的Web浏览器更准确地回答开放式问题。

这项研究把GPT-3回答开放式问题的真实性和有用性从20%-30%提升到了40%-80%，但仍未达到人类平均水平。

WebGPT的作者中，有4位也出现在最新的Operator贡献名单里，分别是欧阳龙，Christina Kim，Reiichiro Nakano，Kevin Button。

其中Reiichiro Nakano（中野礼一郎）是Operator项目的研究主管之一，也出现在了发布直播中。

△Sam Altman，Yash Kumar，Casey Chu，Reiichiro Nakano

最新的Operator背后模型命名为CUA（Computer Use Agent），与此前的探索相比，有了几项重大突破：

多模态理解带来“感知”能力，由GPT-4o提供。

长上下文作为“任务视野”，让Agent能连续执行任务长达20分钟。

o1式的思维链推理，这种内心独白使模型能够评估其观察结果、跟踪中间步骤并动态适应。

参与、观察了整个十年发展过程的Karpathy总结到：

Operator之于数字世界，就像人形机器人之于物理世界。

在数字世界的发展速度要比物理世界更快，因为翻转比特的成本相比移动原子只有约1/1000。

……

与其说2025年是Agent年，不如说2025-2035年是Agent的十年。

上一篇：OpenAI 阿尔特曼：ChatGPT 用户可免费体验 o3-mini，付费用户将获得更多额度

下一篇：业界首款！中国联通发布元景思维链大模型：性能比肩OpenAI

返回列表

热文阅读

2 天前

三星 SF4X 先进制程获 IP 生态支持：Blue Cheetah 流片 D2D 互联 PHY

2 天前

AMD高管揭秘Ryzen 9 9950X3D与9900X3D游戏性能

2 天前

英特尔向合作伙伴发送Nova Lake CPU进行测试

3 天前

英伟达黄仁勋抵达上海现身陆家嘴，此次访华行程进入最后一站

2 天前

韦尔股份预计2024年营收创历史新高净利润预计增长五倍

2 天前

瑞芯微2024年预计营收创历史新高净利润增长超300%

1 天前

晶圆厂，大砍资本支出

1 天前

上海SiC新秀，C轮融进10亿

1 天前

2700亿“华为弃子”，遭华为老员工索赔43个亿

1 天前

图灵量子创始人金贤敏教授团队入选“2024新质生产力年度案例”，全国仅10例

上一篇：OpenAI 阿尔特曼：ChatGPT 用户可免费体验 o3-mini，付费用户将获得更多额度

下一篇：业界首款！中国联通发布元景思维链大模型：性能比肩OpenAI

C114通信网
通信人家园

7 X 24跟踪全球科技动态

发现

资讯话题

热门话题

7 x 24跟踪全球科技动态

快讯

资讯

视频

关于我们

C114通信网

通信人家园