近一周,资本市场再度刮起AI大模型热潮,“豆包概念股”迎来普遍上涨。对此,字节十分罕见地出面回应。
12月19日晚,字节发布风险提示称,资本市场出现炒作“豆包概念股”现象,流传着众多夸大其词甚至是虚构的内容,涉及字节资本开支、数据中心花费、AI硬件、应用合作等多方面。“请投资者切勿轻信市场传言,以免遭受不必要的投资损失。”
资本热捧背后,字节用两年时间在AI大模型领域实现逆袭,打了一场漂亮的翻身仗。
今年初,抖音CEO张楠辞职, 这位抖音核心骨干决定转战AI应用战场。经过一年的蛰伏,她带着最新产品即梦AI现身火山引擎Force冬季大会。
12月18日,如今已是剪映业务负责人的张楠公开表示,借助GenAI的技术,可以把每个人脑子里的奇思妙想快速视觉化,像做梦一样,这也是‘即梦’名字的由来。
作为字节旗下剪映业务的一个板块,即梦AI2024年5月上线,定位是AI内容平台,支持通过自然语言及图片输入,生成高质量的图像及视频,即梦AI还在业内首创了“一句话P图”“一键海报”和“动态海报”能力,大幅提升了图片中文字生成的准确率。
目前,创作者已经开始在即梦创作短片,今年7月,抖音上线了通过即梦创作的科幻短剧《觉醒》,这也是抖音上首部单日点赞破40万的AI短剧。
这只是字节重投AI的一个侧面。过去一年,字节一直在疯狂赶进度,从斥资购买GPU芯片到组建以Flow为核心的AI架构,再到从阿里等大厂高薪挖人,字节努力补齐此前因技术判断失误而拖慢的AI大模型进度。
如今看来,字节不仅推出包括多模态在内的豆包大模型家族,还通过降价等方式加速豆包大模型在应用端的使用。而随着应用不断深入,字节预计很快会展现出商业化方面的潜力。
会上,字节一口气晒出了最新成果,重头戏是豆包视觉理解模型的发布,这是一款具备内容识别、理解和推理、视觉描述和创作等能力的模型,标志着公司向多模态迈出关键一步。
与大模型同时发布的还有价格。谭待表示,视觉理解模型的定价模式依然基于Tokens,模型会把图像编码转成tokens,和文本tokens一同计费。
他进一步表示,“Claude是每千tokens2.1分钱,GPT-4o是每千Tokens 1.7分钱,阿里千问是每千tokens 2分钱。豆包视觉理解的定价是每千tokens 3厘钱,比行业平均价格降低85%。”
豆包·通用模型pro也迎来升级,同时,字节还透露了多个垂直领域模型的进展。
火山引擎总裁谭待表示,12月通用模型pro完成了新版本的迭代,相比过去又有了大幅提升。“豆包pro已经全面对齐GPT-4o 能力,甚至在部分复杂场景复杂任务中,效果表现更好。而且使用价格只有GPT-4o 的八分之一。”
在经过两年多的发展后,AI大模型的发展重心已经从技术迭代向应用侧转移,这也是外界关注的焦点。
据谭待介绍,豆包大模型5月发布以来,日均调用量呈现高速增长。“5月模型日均tokens 1200亿;到7月份涨到了5000亿,到9月份1.3万亿;而截至12月15日,豆包大模型的日均tokens数已经突破了4万亿,在7个月的时间里增长超过33倍。”
字节大模型正在加速行业渗透。谭待表示,大模型在各种场景中都在全面开花,尤其是和企业生产力相关的场景,比如信息处理场景,最近3个月豆包的调用量增长了39倍,在硬件终端场景,豆包增长了13倍。
有市场消息称,苹果正在和字节等多家公司洽谈,意在将后者的人工智能模型整合到中国版iPhone中,谈判仍处于早期阶段。对此,字节暂未回应。
一些细节也彰显了字节在应用方面的决心和力度。今年中秋,火山引擎一款给客户的玩具“显眼包”悄然走热,它主打聊天式情感陪伴,目前处于奇货可居状态,这也让字节内部颇感意外,可以确定的是,这个案例加快了字节AI在更多场景落地的速度。
华尔街见闻从知情人士处获悉,目前,找豆包合作的玩具公司特别多,将模型植入玩具可能会催生一波毛绒玩具潮。据观察,扣子这次联合苏珀尔、猫王音响、启明云端等在会场展示了相关产品Demo。
不过,随之而来的就是商业化问题,虽然字节并未明确提及商业化时间表,但从字节AI的应用方向上可以窥见一些端倪。
谭待表示,AI大模型市场还处于非常早期,能用的场景非常多,公司没有一个特定的偏好,因为AI将来一定是普惠的。根据豆包内部数据,工作、娱乐、生产力的场景差不多,大模型处于 2C和2B齐头并进状态。
字节的优势在于,大模型技术处于快速迭代通道。谭待表示,作为一个后来者,字节的信心来自三个方面,一是市场非常大,二是火山有规模优势,三是公司在AI大模型这块的目标是第一。
挑战也显而易见,随着AI大模型竞赛进入深水区,字节AI首当其冲的就是成本压力。
在C端,豆包已经是用户数最多的AIGC应用。华尔街见闻获悉,张一鸣不仅亲自盯着豆包产品,还会提出反馈意见。根据QuestMobile数据,截至2024年10月,豆包APP月活跃用户为4839万。
民生证券计算机首席分析师吕伟表示,尽管字节AI产品的数据表现亮眼,月活跃用户数已突破7000万。随着“豆包”年底月活目标的达成,以及类似字节“即梦”AI视频等算力消耗大户的应用推广,算力需求将大幅增加。
今年,字节已经成为国内五大互联网巨头中采购AI卡及服务器最多的客户,明年采购量有望进一步攀升。谭待表示,火山方舟提供豆包大模型的 MaaS 推理服务,开发了新的模型之后,视觉理解模型会解锁更多的场景,从火山角度,算力储备是足够的。
快速增长的使用量叠加较低的价格,无疑会加剧成本压力。对此,谭待直言,ToB跟ToC不同,不存在先烧钱获取市场,后续再靠其他收费的商业模式,公司做了大量的成本优化,来维持可持续的商业模式。
C端方面,国内AI大模型产品仍未正式进入订阅付费阶段,豆包APP依然是免费应用,加之产品应用本身也需要做大量的推广,这也加剧了收入和成本之间的Gap。相较而言,Open AI已经给出了商业化目标,即2029年实现千亿收入。
挑战的另一方面来自竞争,虽然豆包在过去一年经历了快速逆袭,但AI大模型仍处于快速迭代中,对手们都在努力。
继Sora之后,谷歌刚刚发布了最新的视频生成模型 Veo 2 和图像生成模型 Imagen 3;国内方面,智谱AI、爱诗科技、Minimax都在加码视频生成产品,尤其智谱AI和爱诗科技刚完成新一轮融资,将用在相关技术和应用上。
经过两年的追赶后,字节AI正在快速补齐能力,并以更自信的姿态朝着AGI演进。然而,这注定是一条很艰难的道路,字节要想在AI时代继续称王,还需背水一战。
简体中文 繁體中文 English 日本語 Deutsch 한국 사람 русский بالعربية TÜRKÇE português คนไทย Français