1.推理模型性能比肩世界先进水平,智谱GLM开源模型系列迎来新成员,同时启用全球域名“z.ai”;
2.芯原推出面向可穿戴设备的超低功耗OpenGL ES GPU,支持3D/2.5D混合渲染;
3.锐思智芯完成B轮融资,用于新一代融合视觉传感器研发及量产推进;
4.总投资200亿 湖北先导半导体材料项目即将投产;
5.投资总额超11亿 智汇芯晖“数字光源芯片先进封测基地项目”落户临港;
1.推理模型性能比肩世界先进水平,智谱GLM开源模型系列迎来新成员,同时启用全球域名“z.ai”;
智谱将开源 32B/9B 系列 GLM 模型,涵盖基座、推理、沉思模型,均遵循 MIT 许可协议。该系列模型现已通过全新平台 Z.ai 免费开放体验,并已同步上线智谱 MaaS 平台。
其中,推理模型 GLM-Z1-32B-0414 性能媲美 DeepSeek-R1 等顶尖模型,实测推理速度可达 200 Tokens/秒(MaaS 平台 bigmodel.cn),目前国内商业模型中速度最快。此外,其价格仅为 DeepSeek-R1 的 1/30。
智谱启用全新域名 Z.ai,目前该平台整合了 32B 基座、推理、沉思三类 GLM 模型,后续将作为智谱最新模型的交互体验入口。
模型开源
本次开源的所有模型均采用宽松的 MIT 许可协议。这意味着可以免费用于商业用途、自由分发,为开发者提供了极大的使用和开发自由度。我们开源了 9B 和 32B 两种尺寸的模型,包括基座模型、推理模型和沉思模型,具体信息如下:
基座模型 GLM-4-32B-0414 拥有 320 亿参数,其性能可与国内、外参数量更大的主流模型相媲美。该模型利用 15T 高质量数据进行预训练,特别纳入了丰富的推理类合成数据,为后续的强化学习扩展奠定了基础。在后训练阶段,除了进行面向对话场景的人类偏好对齐,我们还通过拒绝采样和强化学习等技术,重点增强了模型在指令遵循、工程代码生成、函数调用等任务上的表现,以强化智能体任务所需的原子能力。
GLM-4-32B-0414 在工程代码、Artifacts 生成、函数调用、搜索问答及报告撰写等任务上均表现出色,部分 Benchmark 指标已接近甚至超越 GPT-4o、DeepSeek-V3-0324(671B)等更大模型的水平。
GLM-4-32B-0414 进一步提升了代码生成能力,可处理并生成结构更复杂的单文件代码。Z.ai 的对话模式内建了预览功能,支持对生成的 HTML 和 SVG 进行可视化查看,便于用户评估生成结果和进行迭代优化。
>>> 给我设计一个移动端机器学习平台的 UI,其中要包括训练任务,存储管理,和个人统计界面。个人统计界面要用图表展示用户过去一段时间的各类资源使用情况。使用 Tailwind CSS 来美化页面,把这 3 个手机界面平铺展示到一个 HTML 页面中
>>> 设计一个支持自定义函数绘制的绘图板,可以添加和删除自定义函数,并为函数指定颜色。
>>> 用 svg 展示一个 LLM 的训练流程
GLM-Z1-32B-0414 是一款具备深度思考能力的推理模型。该模型在 GLM-4-32B-0414 的基础上,采用了冷启动与扩展强化学习策略,并针对数学、代码、逻辑等关键任务进行了深度优化训练。与基础模型相比,GLM-Z1-32B-0414 的数理能力和复杂问题解决能力得到显著增强。此外,训练中整合了基于对战排序反馈的通用强化学习技术,有效提升了模型的通用能力。
在部分任务上,GLM-Z1-32B-0414 凭借 32B 参数,其性能已能与拥有 671B 参数的 DeepSeek-R1 相媲美。通过在 AIME 24/25、LiveCodeBench、GPQA 等基准测试中的评估,GLM-Z1-32B-0414 展现了较强的数理推理能力,能够支持解决更广泛复杂任务。
GLM-Z1-9B-0414 是一个惊喜。我们沿用了上述一系列技术,训练了一个 9B 的小尺寸模型。虽然参数量更少,GLM-Z1-9B-0414 在数学推理及通用任务上依然表现出色,整体性能已跻身同尺寸开源模型的领先水平。特别是在资源受限的场景下,该模型可以很好地在效率与效果之间取得平衡,为需要轻量化部署的用户提供强有力的选择。
沉思模型GLM-Z1-Rumination-32B-0414 代表了智谱对 AGI 未来形态的下一步探索。
与一般推理模型不同,沉思模型通过更多步骤的深度思考来解决高度开放与复杂的问题。其关键创新在于,它能在深度思考过程中整合搜索工具处理复杂任务,并运用多种规则型奖励机制来指导和扩展端到端的强化学习训练。该模型支持“自主提出问题—搜索信息—构建分析—完成任务”的完整研究闭环,从而在研究型写作和复杂检索任务上的能力得到了显著提升。
200 Tokens/秒
除模型开源外,基座、推理两类模型也已同步上线智谱MaaS开放平台(bigmodel.cn),面向企业与开发者提供API服务。
本次上线的基座模型提供两个版本:GLM-4-Air-250414 和 GLM-4-Flash-250414,其中后者完全免费。
上线的推理模型分为三个版本,分别满足不同场景需求:
GLM-Z1-AirX(极速版):定位国内最快推理模型,推理速度可达 200 tokens/秒,比常规快 8 倍;
GLM-Z1-Air(高性价比版):价格仅为 DeepSeek-R1 的 1/30,适合高频调用场景;
GLM-Z1-Flash(免费版):支持免费使用,旨在进一步降低模型使用门槛。
对应模型价格表:
Z.ai 上线
全新站点 Z.ai ,作为智谱最新模型交互体验入口,将正式启用!
Z.ai 目前已上线三款开源模型:
GLM-4-32B(基座模型):具备强大代码生成能力,支持全新 Artifacts 功能,打造交互式开发体验。
Z1-32B(推理模型):超强推理性能,在线体验最高达 200 Tokens/秒 的极速输出。
Z1-Rumination-32B(沉思模型):可以体验 Deep Research 的强大能力,适合做深度调研。
OpenAI采用智谱标准评测最新模型
OpenAI 在刚刚发布的 GPT-4.1 系列模型中评测其函数调用能力时采用了 ComplexFuncBench,这是由智谱团队提出的专用于评估大模型复杂函数调用能力的测试基准。
ComplexFuncBench 主要评测大模型在 128K 的长上下文下进行多步带约束的函数调用的能力。相比于现有函数调用测试基准,ComplexFuncBench 要求大模型对真实场景下的用户需求进行细粒度理解,并在此基础上进行多步带推理的函数调用,这对模型的函数调用能力提出了更高的挑战。
GPT-4.1 模型在 ComplexFuncBench 得分不足 70,这说明 ComplexFuncBench 在可预见未来依然能为大模型函数调用能力提升和优化提供有效指引,助力智能体应用的开发与落地。
返回
2.芯原推出面向可穿戴设备的超低功耗OpenGL ES GPU,支持3D/2.5D混合渲染;
4月16日,芯原股份宣布推出全新超低功耗的图形处理器 (GPU) IP——GCNano3DVG。该IP具备3D与2.5D图形渲染功能,在视觉效果与功耗效率之间实现了卓越平衡,专为可穿戴设备及其他需要动态图形渲染的紧凑型电池供电设备而设计,如智能手表、智能手环、AI/AR眼镜等。
芯原的GCNano3DVG IP结合了优化的硬件流水线与轻量且可配置的软件栈,实现了高效、低功耗的图形处理。该IP配备了分别针对3D和2.5D图形的独立渲染管线,可加速由3D图像和矢量图形构成的复杂场景的渲染,并通过微调进一步优化了性能、功耗和面积 (PPA)。此外,GCNano3DVG采用统一的命令引擎以及多种CPU-GPU同步机制,进一步降低了系统开销,加之所采用静态随机存储器 (SRAM) 或伪静态随机存储器 (PSRAM) 的无DDR配置,为嵌入式图形处理提供了高效且低功耗的解决方案。
GCNano3DVG支持芯原的GLLite和VGLite应用程序编程接口 (API),用于3D和2.5D/2D图形渲染。其中,GLLite驱动程序高度可配置,支持完整的OpenGL ES 2.0规范,并可选集成运行时OpenGL着色语言 (GLSL) 编译器,或者以OpenGL ES 1.1固定功能管线模式运行,以实现最低内存使用。它还支持渲染Khronos的图形库传输格式 (glTF),能够高效处理现代应用中的3D资源。VGLite驱动程序兼容流行的矢量图形库,如LVGL和NanoVG。GLLite API和VGLite API均可在单一应用程序中灵活且同步地使用,为各种嵌入式应用场景提供多功能且高效的图形解决方案。
“随着可穿戴应用的不断扩展,市场对于能够呈现3D渲染内容的沉浸式用户界面的需求持续攀升,同时仍需满足超低功耗的要求。”芯原首席战略官、执行副总裁、IP事业部总经理戴伟进表示,“为了满足这些需求,我们基于超低功耗的Nano 3D和Nano 2.5D GPU技术设计了一种支持混合渲染的GPU架构。这一创新实现了在超低功耗下高效渲染混合的3D和2.5D内容。”
芯原的GCNano3DVG GPU IP现已开放授权。
3.锐思智芯完成B轮融资,用于新一代融合视觉传感器研发及量产推进;
国内融合视觉传感器研发商锐思智芯(AlpsenTek)近期宣布完成B轮融资,本轮投资方包括智慧互联产业基金、浦耀信晔、中车时代投资、智宸投资、毅岭资本等多家机构。据称,本轮融资将主要用于新一代融合视觉传感器的研发、量产推进及市场拓展。
锐思智芯创始人、首席执行官邓坚表示,公司凭借首创的融合视觉感知技术(Hybrid Vision Sensing, HVS),解决了传统图像传感器在帧率、动态范围等方面的性能瓶颈,实现了图像传感器和事件相机从像素到应用的无缝融合,推出多款融合视芯片和端到端融合方案,帮助前沿客户实现快速部署与产品上市,已在AIoT设备和消费电子领域出货。
锐思智芯是一家新型融合视觉传感领域的芯片研发及整体方案提供商,核心产品是融合式视觉传感器芯片ALPIX系列,为智能手机、消费电子、智能安防、智能汽车领域提供一体化智能视觉解决方案。
此前,锐思智芯首款基于Hybrid Vision融合技术的芯片ALPIX-Pilatus于2021年10月发布,验证了融合视觉方案的可行性。随后,该公司于2022年7月发布首款高端融合视觉传感芯片ALPIX-Eiger,主要应用于智能手机、运动相机等消费电子产品。(校对/李梅)
4.总投资200亿 湖北先导半导体材料项目即将投产;
据荆州发改消息,近日湖北先导新材料循环经济回收产业园项目锆铪材料车间已进入设备安装尾声。
湖北先导新材料科技有限公司总经理崔飞表示,“预计本月底锆铪车间可以试生产,锆铪车间生产的产品主要应用于航空航天、合金及半导体等领域,产品供应给集团总部及外部市场,这个产品年产能规划2550吨,今年预计可以实现60%的产能,产值约3亿元。”
据悉,湖北先导项目总投资200亿元,于2023年1月落户经开区,是荆州市招商引资规模最大的半导体材料项目。项目分两期建设,一期是循环经济产业回收产业园项目,建有16栋厂房,主要生产镓、铟、锗产品,铋化合物及铋药产品,氧化锆、氧化铪产品,催化剂等产品。二期是电子信息材料及元器件项目,将重点布局半导体靶材、金属前驱体等前沿材料研发生产,主要生产MO源、电子特气、锆铪产品、金属前驱体、银粉银浆、铋化合物等电子材料和新材料。一、二期项目全部建成后年产值可达80亿元,提供就业岗位3000余个。项目投产后,可带动上下游产业链投资超百亿元,为湖北打造“光芯屏端网”万亿产业集群注入新动能。(校对/李梅)
5.投资总额超11亿 智汇芯晖“数字光源芯片先进封测基地项目”落户临港;
据报道,近日,上海智汇芯晖微电子有限公司在上海临港新片区书院产业区投资建设了“数字光源芯片先进封测基地项目”,主要从事数字化车灯模组生产,项目投资总额超11亿元。
据了解,该项目分阶段建设,土建均在一阶段建设完成,一阶段拟生产数字化车灯模组120万套/年;二阶段通过新增部分瓶颈设备并延长设备工作时间实现产能提升,拟生产数字化车灯模组180万套/年,本项目建成后年生产数字化车灯模组300万套/年。
资料显示,上海智汇芯晖微电子有限公司成立于2024年,位于临港新片区,该公司由上海晶合光电出资3000万元成立,并持有100%的股份。(校对/李梅)