高通中国:AI变革正在推动终端侧推理创新
5 天前 / 阅读约3分钟
来源:集微网
高通技术公司在引领并利用从AI训练向大规模推理转型,以及AI计算处理从云端向边缘侧扩展方面具有战略优势。公司在开发定制CPU、NPU、GPU和低功耗子系统领域取得了广泛的成就。通过与模型厂商展开合作,以及面向跨不同边缘终端领域的模型部署提供工具、框架和SDK,高通技术公司赋能开发者在边缘侧加速采用AI智能体和应用。

尖端AI推理模型DeepSeek R1一经问世,便在整个科技行业引起波澜。因其性能能够媲美甚至超越先进的同类模型,颠覆了关于AI发展的传统认知。

这一关键时刻是更广泛趋势的一部分,凸显了行业在打造高质量小语言模型和多模态推理模型方面的创新,以及这些创新正在为AI的商用应用和终端侧推理落地做好准备。这些新模型能够在终端侧运行,将加速强大边缘侧芯片的规模化扩展,并创造对此类芯片的需求。

四大趋势正在显著提高目前可在终端侧运行的AI模型的质量、性能和效率,从而推动上述变革:

  • 当前先进的AI小模型已具有卓越性能。模型蒸馏和新颖的AI网络架构等新技术能够在不影响质量的情况下简化开发流程,让新模型的表现超越一年前推出的仅能在云端运行的更大模型。

  • 模型参数规模正在快速缩小。先进的量化和剪枝技术使开发者能够在不对准确性产生实质影响的情况下,缩小模型参数规模。

  • 开发者能够在边缘侧打造更丰富的应用。高质量AI模型快速激增,意味着文本摘要、编程助手和实时翻译等特性在智能手机等终端上的普及,让AI能够支持跨边缘侧规模化部署的商用应用。

  • AI正在成为新的UI。个性化多模态AI智能体将简化交互,高效地跨越各种应用完成任务。

高通技术公司在引领并利用从AI训练向大规模推理转型,以及AI计算处理从云端向边缘侧扩展方面具有战略优势。公司在开发定制CPU、NPU、GPU和低功耗子系统领域取得了广泛的成就。通过与模型厂商展开合作,以及面向跨不同边缘终端领域的模型部署提供工具、框架和SDK,高通技术公司赋能开发者在边缘侧加速采用AI智能体和应用。

近期对AI模型训练方式的颠覆变革和重新评估验证了AI格局即将向大规模推理转变的趋势,这将形成全新边缘侧推理计算的创新和升级周期。尽管模型训练仍将在云端进行,但推理将受益于采用高通®技术的广泛终端规模,并催生更多边缘侧AI赋能处理器的需求。

*本文内容来自高通技术公司高级副总裁兼技术规划和边缘解决方案业务总经理马德嘉(Durga Malladi)、高通技术公司市场资深经理Jerry Chang的博客文章。

点击此处链接可下载高通白皮书,了解更多内容。