AI端侧的芯片革命
4 小时前 / 阅读约11分钟
来源:36kr
市场对于能适配小尺寸模型运行的端侧AI芯片需求开始水涨船高。

2025年,中国开了一个好年。

文化市场,哪吒2爆火,票房已经突破了百亿,闯入全球电影TOP榜,向世界展示了中国市场“恐怖的”消费能力。AI市场,DeepSeek的横空出世,更低的算力达到Chat GPT的效果,直接刷屏全球热搜榜。

如果说Chat GPT的出现,让生成式AI走向了云,那么DeepSeek则是让生成式AI走向了端。 

 01 端侧AI芯片的“黄金拐点”

科技行业一直在探索AI硬件产品。

从今年“消费电子届春晚”CES上来看非常明确。今年CES上的各大公司推出的产品都与AI强相关,无论是通用的PC,还是手机终端,再到机器人、眼镜、耳机、手表等等,几乎每种产品只要存在人机交互的硬件终端,都有厂商尝试将其与AI大模型结合。

但这些探索似乎都不太成功。大模型推出了成百上千种,硬件产品更是成千上万种,但效果不甚了了。究其原因,还是本地SoC提供的算力和大模型需要的算力无法匹配。

ChatGPT时代,大模型的蒸馏是很大的问题。如果采用云端调用算力完成AI推理,就存在三个问题:第一,成本。云端的任何操作都是有成本的,可能不多,几分人民币,但总之是要花钱的。 

有手机厂商透露,调用一次云端大模型的平均成本在1.2分到1.5分人民币,假设每个品牌都有上亿的用户量,每人每天调用10次,这其中的算力成本非常惊人。但是如果按次数或月租向用户进行收费,在功能同质化的情况下,用户的使用意愿也会很难保证。 

第二,速度。既然是云端完成,那么必然需要进行网络传输,这就导致AI在终端的响应速度慢。如果是自动驾驶中的汽车,对于当前环境需要在10毫秒内决策,靠着云端未免过于危险。在自动驾驶、工业质检等场景,端侧推理延迟能够降至毫秒级,较云端方案提升5倍。 

第三,隐私。这是最重要的部分,涉及到医疗和金融等内容,对于用户来说,端侧模型才是最优解。 

所有人内心都有一个答案:端侧AI才是AI硬件落地的关键。

小尺寸模型落地端侧已经开始了。 

自华为宣布“小艺智能体”接入DeepSeek-R1算起,在一周多的时间里,包括星纪魅族、荣耀、OPPO、努比亚、vivo在内的6家手机厂商宣布接入DeepSeek。 

需要解释的是,满血版DeepSeek-R1模型参数达到671B,仅模型文件就需要404GB存储空间,任何一种移动设备都无法满足这样的硬件配置需要。但DeepSeek蒸馏版本(1.5B、7B)适合手机等端侧使用。 

为了让这些小尺寸模型在端侧流畅运行并充分发挥其智能优势,就需要性能强劲的端侧 AI 芯片来提供算力支持。 

市场对于能适配小尺寸模型运行的端侧 AI 芯片需求开始水涨船高。

 02赛道主力玩家

端侧的应用市场非常大,前文我们提到,只要存在人机交互的硬件终端,都有厂商尝试将其与AI大模型结合。我们可以在这里具体看一下:

AI PC领域,2027年AI PC在中国PC市场占比能够达到85%;AI手机领域,2026年,AI 手机的出货量预计将突破4.7亿部,渗透率增至38%;在AI可穿戴设备领域,市场规模预计将从2024年的419亿美元增长至2028年的1207亿美元,CAGR达到30.3%。

2023年中国端侧AI市场规模为1,939亿元,从2018至2023年,其年均复合增长率为116.3%。 

DeepSeek首先带动是AI端侧的SoC芯片需求。 

SOC芯片是各类型硬件设备的主控单元,承载着运算控制等核心功能,是硬件的“大脑”。随着AI在边缘侧的应用越来越广泛,SOC将更加变成集成人工智能和边缘计算能力的系统级芯片,成为AI SOC,算力达到几十甚至数百TOPS。 

在这次端侧AI热潮中,瑞芯微频频涨停。

目前,瑞芯微能够提供从 0.2TOPs 到 6TOPs 的不同算力水平的 AIoT 芯片,其中 RK3588、RK3576 带有 6TOPs NPU 处理单元,能够支持端侧主流的 0.5B~3B 参数级别的模型部署。可通过大语言模型实现翻译、总结、问答等功能,并可实现多模态搜索、识别,有效解决不同 AIoT 场景的痛点,提升产品使用体验。 

其中,公司SOC芯片拳头产品RK3588M是国内少数能媲美国外一线产品的智能座舱SoC芯片。

据瑞芯微透露,该产品性能优异,一芯带多屏、端侧AI等能力突出,已落地应用于众多头部车厂,量产车型10余款,超20款定点车型项目在同步开发中。此外,新产品RK3576M也正在进行客户导入。 

这还仅是瑞芯微端侧AI产品应用的一个方面。 

事实上,当前已有多个领域的客户基于瑞芯微主控芯片研发在端侧支持AI大模型的新硬件,例如教育平板、AI玩具、桌面机器人、算力终端、会议主机等产品。 

全志科技也是一家备受关注的SoC企业。去年公司全年实现属于上市公司股东的净利润为1.53亿元–1.9亿元,同比增长566.29%~727.42%。业绩暴增的原因,则是以扫地机器人、智能投影等业务线为代表的产品出货量显著提升,致使营业收入同比增长约35%。 

在记者问询全志科技产品是否能适配DeepSeek,是否针对DeepSeek进行布局时,全志科技表示:“公司产品可以为端侧多种形态的智能终端产品提供算力支持。” 

乐鑫科技SoC长期应用于泛IoT领域。从应用端看,乐鑫科技在智能家居、智能照明和消费电子等核心应用市场合计达到了30%以上的增长。 

乐鑫科技ESP32-S3 和 ESP32-P4 产品线都有添加边缘 AI 的功能,主要体现为设备端语音唤醒与控制,以及图像处理的功能。这两个系列的芯片在硬件设计上增加了 AI 加速指令;而在软件层面,也提供图像识别和语音唤醒、控制等方案。 

乐鑫科技副总经理王珏表示:“公司带端侧AI功能的AIoT芯片ESP32-S3目前增长非常迅速,也是当前主推的旗舰产品。”字节跳动的AI玩具“显眼包”中用的也是乐鑫的芯片 ESP32。 

晶晨股份已有超15款商用芯片搭载其自研的端侧AI算力单元,2024年携带自研端侧AI算力单元的芯片出货量超过800万颗。 

2024年年度实现营业收入59.21亿元左右;归母净利润约8.2亿元左右,同比增长64.65%左右。该公司表示,其6nm芯片S905X5系列可利用端侧AI能力,实现本地同声翻译、同声字幕等功能,商用半年以来取得多个国际Top级运营商的订单,预计6nm芯片有望在2025年达成千万颗以上的销量。 

端侧的AI音频处理器应用场景多是在智能物联网领域。比如,在智能音响中,端侧 AI 音频处理器能够支持语音唤醒、语音识别、语音合成等功能,实现用户与音箱的自然语言交互。在智能家居系统中,它可用于声音控制家电设备,如通过语音指令调节灯光、空调、电视等。 

恒玄科技的端侧SoC已经成功搭载在多家主流品牌产品里,包括百度、字节跳动、谷歌、哈曼、安克创新、漫步者、韶音等。今年,字节跳动推出的首款搭载豆包大模型的智能耳机Ola Friend,搭载的就是恒玄科技2700芯片。恒玄科技的最新芯片BES2800还被应用于三星2024年最新发布的Galaxy Buds3 Pro耳机中。多款耳机的应用,能够看出恒玄科技在智能终端SoC芯片领域处于领先地位。 

对于端侧 AI对于芯片要求的变化,恒玄科技认为:“云端大模型的兴起除了对 AI 手机、PC 带动外,可穿戴也是会受益于端侧 AI 的发展,它对芯片会提出新的需求,比如可穿戴的环境感知能力要变得更强,所以主控芯片的算力需要相应提升,同时可穿戴产品长续航是刚需,所以芯片在算力提升的基础上还要保持较低的功耗水平。” 

值得一提的还有AI眼镜芯片。行业普遍认为眼镜是目前最火的AI、大模型的落地载体,今年行业将会完成0到1的突破。 

之前在2017年,Meta就开始自研AI眼镜,最开始是和三星合作,但是三年都没出什么结果,然后告吹了。之后Meta放弃了自研芯片,Ray-Ban眼镜使用了高通的AR1 Gen 1芯片。 

可以说,在ARVR芯片这个领域,高通还是处于绝对的控制地位。在市面上,AI眼镜能用上的芯片,除了高通芯片,那就是紫光展锐的TW517。 

紫光展锐TW517采用12nm工艺,GPU 型号为 IMG8300,运行频率 800MHz。主要客户是闪极 AI 拍拍镜、影目科技。

同时,恒玄科技此前透露,该公司芯片已在魅族等智能眼镜产品中应用发布,同时有一些客户项目正在导入阶段。 

 03结语

哪吒2突破百亿票房,向世界展示了中国市场“恐怖的”消费能力。这意味着:单凭中国市场的规模和消费能力就抵得上全球其他发达国家的总和。

这背后传递的信号非常积极。

如果只看电影市场,可能还不太理解。但如果放到科技和制造业中来看就会明白其中的巨大价值。 

接下来不管欧美再怎么对我们进行贸易和科技壁垒,都不可能阻止我们产业升级。对于科技和制造的最大障碍,并不是“卡脖子”,而是前期没有足够大的消费市场买单,就无法形成相关产业链的建立。 

举个例子,某企业研发一款芯片,从设计到量产累计成本要2个亿,如果只卖出十万片那每个芯片的成本等于是2000块,这个价格太高了,企业肯定无法盈利。只能陷入长期亏损,最终倒闭出局。但是如果能够卖出1亿片,那每片成本只需要2块钱。这个成本的大幅度摊薄就会让企业有利润继续投入研发。 

因为市场体量足够大,有足够多的买家帮助消化成本,公司就能赚钱、行业就能发展,这就是中国市场的魔力。 

国信证券研报观点称,2024年电子行情由“周期复苏”向“成长创新”切换,2025年行业有望迈入估值扩张大年。应用端AI革新人机交互,以语音交互为核心的AI端侧应用正处在大规模商业化的临界点,创新催化频繁。 

相比AI云侧,国内半导体企业将在AI端侧创新中实现更高的市场参与度,同时国产半导体自给率仍偏低,两者共振奠定了行业成长的确定性和空间。