昔日的自动驾驶第一股,在经历了退市和转型后,正式宣布驶向AIGC领域。未来,它可能会成为腾讯、网易、米哈游等众多游戏厂商的竞争对手。
然而,这家公司的前联合创始人兼前CTO侯晓迪——昔日一起并肩作战的关键人物,却公开表示:图森转型“就像梅西宣布转向打篮球”,“.……图森根本不可能做出AI大模型和游戏应用,图森最好现在破产,没有侯晓迪就没有未来。”
这是任何精心编排的商业大戏都难写出的剧情,侯晓迪就这么戏剧性地把图森未来推到了舆论场的风口。
就在11月,该公司前CTO侯晓迪搭建了SaveTuSimple网站,并呼吁股东立即清算图森未来,并将所有现金返还股东。然而,就在刚刚结束的图森股东大会上,剧情陡然反转。
大多数股东们选择站在了创始人陈默和CEO吕程的一边,支持公司选择的动漫游戏业务方向,让这场内部纷争落下帷幕。
2024年3月,图森管理层开始探索AIGC业务可行性。
8月董事会正式批准进军动漫、游戏领域的转型,并同时宣布拿下《三体》IP的动画电影和游戏授权合作。
2024年12月,图森正式宣布更名CreateAI,并一举发布了多项新业务进展,包括获得著名武侠IP《金庸群侠传》正版授权,开发一款大型AAA级武侠开放世界RPG游戏;与日本著名动画导演河森正治和顶级动画制作公司株式会社白组展开合作,利用AIGC技术推动创作者在展示宏大宇宙文明方面实现更多突破。与此同时,CreateAI还发布了其首个大型模型产品“Ruyi”,该模型定位于开源图生视频领域。
仅仅半年的时间,图森团队完成了大转型,并回应了很多人的质疑。当理想主义派的侯晓迪仍然在孤独坚守自动驾驶创业时,现实主义派的陈默则带领图森迅速转身,走向了更容易实现商业化落地的动漫游戏领域。
图森的这次转型是铺满鲜花的康庄大道,还是暗藏礁石的汹涌暗流?图森距离成为一家优秀的的AIGC和数字内容制作公司,到底还需要具备哪些关键能力?
其实,自从大模型爆发以来,转型做AI或者重投AI业务的大公司并不少见,图森只是因为退市和内部风波,在期待和唱衰的重压下比较特殊。
对于一个经过验证的技术团队来说,做“二次创业”,需要担心的不是技术储备,而是技术优势如何转化。
首先,AIGC的关键技术并没有自动驾驶那么复杂。以多模态大模型为例,壁垒在于数据、算力、算法三个方面。
算力是行业共同瓶颈,算法则是图森的传统优势,而数据则是“各显所长”。
由于底层大模型市场已经足够细分,用户关注的往往是某一场景、某一风格下的生成水准。这也就暗示,模型训练的数据质量、数据处理方式比资产规模更重要。
从数据采集、模型训练到高效部署的闭环开发能力,基本是自动驾驶领域的“标配”。将一套成熟的技术工作流转化落地并不难,图森需要做的是补充产业力量,提升对垂类数据的理解和解构能力。
此外,自动驾驶是多领域融合下的前沿工业赛道,AIGC则还停留在数字化应用形式。无论是工程周期还是技术融合难度,自动驾驶作为一个泛AI领域,都不会有太大的入局障碍,反而有望进一步压缩推理成本。
图森能在短时间内做出Ruyi大模型,技术视角上并非偶然。而在商业化的视角下,背水一战的决心能不能得到回报,也很快就会有答案。
事实上,2024年底,一家企业能不能AIGC化,多数时候不在于背后有没有技术天才,而是针对目标应用场景的迭代速度够不够“快准狠”。
随着Sora发布正式版以后口碑良莠不齐,一个衍生出来的共识是:入局AIGC的时间窗口还没有关闭,至少在视频生成等多模态领域是这样。
与此同时,已经在大模型红利下迅速跻身独角兽的国内厂商,也不免在商业化面前“摇摇欲坠”。
过去一年的时间,AIGC无异于是资本的一场豪赌。起跑较晚的字节跳动,如今后发制人,成为了AI应用布局最多的科技大厂。而在和大厂的血拼中,六小虎从发力商业化变成了要尽力“留在牌桌上”。
可以说,现阶段大家都是在拿着锤子找钉子。做下沉落地、找盈利方向、在产业中种植大模型,对于任何一家厂商来说,都比压价本身更难。身位问题没那么重要,能从一个高增长潜力的产业中赚到钱,才是AIGC的破局之道。
这种环境下,重新出发的图森第一时间找到了应用的落脚点:ACG。
按照规划,CreateAI将于2025年上线两款AVG和SLG游戏,2027年分别上线《金庸群侠传》开放世界游戏、《三体》IP下的影游融合动画电影与游戏。
基于图森的预期是将《金庸群侠传》做成对标黑神话的3A作品,为期三年左右、远低于市场平均周期的预估研发时间,基本上也证明了AIGC会起到关键作用。
AI生成和内容产业的天然契合不必过多论证。但令业界比较意外的是,以技术见长的图森,并没有选择合作开发,而是在部署系列大模型、推出基础制作工具的同时,坚持要自己做内容的闭环生态。
谈及AIGC商业化的未来战场,技术可行性是入场券,产业切入点则是真正的武器。
从时间点反推,也就是在OpenAI发布了Sora的测试版之后,图森就开始笃定AI生成视频的方向,并且选择了壁垒更高、与自动驾驶技术积淀更契合的图生视频。
尤其是在大型项目开发中,文生视频目前仅能用于初步创意理解,图生视频则能够通过控制初始图像、模型和参数特征,深入参与创作的效率流程。
因此,在重数字资产的影视游戏行业,视频大模型并不是智能化噱头,而是将创意内容进行动态化扩展的生产力。这也使得这项技术更容易在短期内找到降本增效的锚点。
全球范围内,视频大模型还处于早期阶段,反而是国内市场,这一次并没有被甩开时间差,做到了产品体验的抢跑:
今年6月,快手可灵大模型上线不久之后推出图生视频功能。随后,抖音推出即梦。Vidu、PixVerse等“创业大模型”也表现不俗。
而Ruyi大模型基于DiT架构,通过多模态数据集、与图森自动驾驶业务共享的计算、存储、GPU资源训练等底层基础设施,目前已开源的Mini版本可以生成120帧/5秒时长的视频,未来计划发布的专业部署级模型到达2K HDR画面水平,在生成控制、运动幅度、镜头控制等性能上也不输Sora。
Ruyi潜在的制胜点在于,其他视频大模型,目前几乎没有直接用于专业级内容生产的能力。
因此,说图森“跟风”选择了AIGC没有错,但并没有选择一个循规蹈矩的切入点。自研AI技术&原创内容发行的商业模式,本身就突破了市场对于大模型做SaaS变现和内容供应商的固有预想。
距离全流程自动化生产的视频大模型出现,可能至少还要花5-10年时间。但当下动漫游戏行业的主要痛点,其实并不在于内容能力的枯竭。
作为媒体行业中增长最快的子版块,全球视频游戏在2023年总收入达到1960亿美元,超过了流媒体视频、音乐、电影票房的总和。
同时,动漫领域也同样保持着10%以上的年复合增长率,ACG正在成为中国乃至东亚在内容制作领域输出最成功的全球主流文化。
与此相对的是,在经历了资本寒潮以后,优质的3A游戏和动画大电影已经很难再像以前一样,既坚守对质量的追求,又能顺利煎熬漫长的制作期:一部迪士尼动画电影制作时间为4-6年,《荒野大镖客》《赛博朋克2077》等3A游戏的开发周期在7-8年左右,其中视频制作成本占比50-70%。
视频AI化,能够通过重新标准化制作流程,让高质量内容生产的“劳动密集型”环节被AI代替。CreateAI的目标是五年内将制作成本和开发周期降低70%。
因此,图森跑步入场表面看起来是“模型大战”,实际上是一个数字内容效率的蓝海。其预计在明年推出的ACG-GEN工具,就是将Ruyi大模型的能力工程化,为市场输出一套自用且可定制的专业级生产力工具。
这一生态化路径,不难联想到以虚幻引擎闻名的Epics Games,作为一家游戏公司,同样是在自研自发行的基础上,将专业级制作能力开放给了业界。
目前,CreateAI已经将Ruyi大模型的Mini版开源到了Hugging Face社群,并打算通过吸引影游行业的人才、建设创作者生态圈来“快速入圈”。
在图生视频的技术先机上,图森的发力时间是远远早于技术成熟期的。不过,未来随着算力、显示器等硬件设备性能提升,产业对AI的复杂度和精细度需求也会随之提高。
图生视频、视频生视频等技术趋势必然会来到舞台中央,届时,各厂商拼的就是模型迭代速度和生态数据能力。
从现阶段来看,图森有比较充足的现金储备能够支撑大模型迭代。同时,他们新的商业落脚点也是在向市场呼吁:一家技术公司,并不是只能做内容的供应商。
如果说大模型是火炬,那么第一批“吃AI螃蟹”的产业,就是希望的火种。
不只是视频生成,图像、音乐、3D建模,任何细分领域内的专业级AIGC工具,都有像Office和Adobe一样重新定义创作的机会。然而,在国内企服市场的大环境下,只做工具的人,很难找到最舒适的生存空间和天花板。
图森选择的方向,和飞书来自字节十几万员工的需求是一个道理:做出先进的大模型,不能只靠训练,要靠人来用。
得到《三体》的IP授权之后,图森也邀请了漫画大师河森正治来主导制作,并且通过在河森正治团队中应用Ruyi大模型,让AIGC技术深入到整个动漫制作的生态中。
此外,创始人陈默本身就是多年的动漫和武侠迷。在和版权方的长期深入接触下,拿下了将《金庸群侠传》IP开发为开放世界3A游戏的授权。
黑神话诞生前的十年,我们都在问国产游戏市场一个问题:为什么中国做不出3A?
3A的概念,本身就代表着长周期、高预算、高成本,这三个特性与顶级游戏品质体验成正相关,3A是文化艺术软实力在游戏工业中最好的体现。
回顾中国制造的发展史,各行各业几乎都是从代工、加工、爆款商品的逻辑逐渐走向高精尖产品。国产的本质优势在于创新迭代速度和成熟供应链带来的降本增效。
因此,在产业链无法带来成本优势的时代,内容制作成为不了“内容制造”,国产游戏市场虽然增长曲线和出海表现都很出色,但更关注生存、爆款和流水,也是无可厚非的。
AIGC时代,无疑就是国产文化内容产业最好的蝶变时刻。
不难看出,图森之所以敢用工业化思维去“挑战”传统内容产业,就是瞄准了消费者对高质量内容的需求,远远高于内容产业自身的提效意识和能力。
阿里、字节懂互联网办公效率,所以做出了钉钉、飞书。图森懂智能制造的工程化效率,想在大制作的高回报、高口碑、高文化输出性和动辄几亿美元的开发成本之间寻找平衡点,才是切实可行的。
而侯晓迪和图森现任管理层的分歧,其实更多的在于理念的背道而驰。网友认为,尽管前方的路很难走,坚持自动驾驶的梦想没有错,但与此同时,从企业价值和股东利益来看,AIGC也是一个长期可持续的掘金赛道。
更重要的是,图森在新的地图上,仍然想要“争先”:先一步把大模型工具化,直接应用于生产和盈利,无异于撕开了AIGC如今模棱两可的商业化“封条”。
大模型终有一天会成熟落地,像互联网一样成为时代的容器,AI企业自身也会高度产业化,在不同的商业模式下追逐技术的转型与创新。
未来,每家企业都是AI公司,就不会再有一家真正的AI公司。