雷军,又亲自出手挖人了。
这次他的目标,是95后天才少女、AI萝莉、曾在国际顶会发表8篇论文、DeepSeek开源大模型DeepSeek-V2关键开发者之一——罗福莉。
第一财经消息,雷军觉得小米在大模型领域发力太晚,于是亲自出手把她挖来,或供职于小米AI实验室,领导小米大模型团队。
支付的薪酬,在千万元级别。
罗福莉,出生在四川小城一个普通家庭,上大学前没怎么接触过电脑,误打误撞进了北师大计算机专业。
因为基础太差,刚开始成绩垫底。
但靠着天赋和努力,很快跃升到前几名,并保研进入北京大学计算语言学研究所。
读研期间,罗福莉曾一次性在国际顶会ACL,发表8篇论文,其中2篇为一作,在国际学术界引起轰动。
她提出的词义消歧方法,和文本风格转换框架等成果,推动了NLP技术发展。
因此,被誉为95后天才少女、AI萝莉。
毕业后,罗福莉加入阿里达摩院机器智能实验室,主导开发多语言预训练模型VECO。
2022年,她又来到DeepSeek,担任深度学习研究员,参与研发MoE大模型DeepSeek-V2。
这次加入小米,可能会有1+1>2的效果。
一方面,她深耕自然语言处理领域,包括词义消歧、文本生成,正是小米手机、电脑、车机这些设备最常用的场景。
另一方面,DeepSeek-V2模型一大亮点是性价比,罗福莉表示1元/百万输入Tokens的价格,只有GPT4的1/100。这一点和小米非常契合。
此外,95后天才少女、AI萝莉的标签,很适合宣传。可以预想到发布会她出场解说后,热搜霸屏的场景。
上一次传出雷军亲自挖人,还是因为小米汽车。而AI大模型对小米的意义,丝毫不亚于汽车。
自ChatGPT爆火,AI手机逐渐成为潮流。未来每台手机,都将是用户高度定制化的私人助理。
目前,国行iPhone上AI功能的缺席,也是OVM等品牌冲击高端的又一良机。
但小米在这方面的发展,有点起大早赶晚集。
2016年它便组建AI团队,小爱同学早就家喻户晓。结果,2023年vivo先发布蓝心大模型。
2024年底,荣耀CEO赵明在发布会上,用手机AI点了2000杯瑞幸咖啡。
小米15与竞品相比,一些基础AI功能还算不错。可在多模态交互与跨App联动等方面的应用,就有些乏善可陈。
另一方面,小米几乎是全球,拥有最丰富AI入口和应用场景的公司。其AIoT平台,已连接的IoT设备数超8.61亿。
手机、汽车、智能家居有了AI大模型加持,能实现场景内和场景间多设备的协同,智能体验再上一层级,也为「人车家全生态」战略赋能。
同时,无数的应用场景,又可以反哺大模型,提高其上限......想象空间非常大。
除了小米,也只有华为能做到这一点了。
界面新闻消息,小米大模型团队,在成立时已有6500张GPU资源。目前,正在着手搭建GPU万卡集群,将对AI大模型大力投入。
值得注意的是,字节跳动和腾讯,在2024年采购的英伟达GPU,都超过20万张。
看来,小米在买卡方面还得努力,不知道会不会采购华为的昇腾......