百川智能发布深度思考模型 Baichuan-M1-preview,同时具备语言、视觉和搜索三大领域推理能力
19 小时前 / 阅读约3分钟
来源:IT之家
视觉推理能力方面,在 MMMU-val、MathVista 等权威评测中的成绩,超越了 GPT-4o、Claude3.5 Sonnet、QVQ-72B-Preview 等模型。

IT之家 1 月 24 日消息,百川智能今日宣布推出全场景深度思考模型 Baichuan-M1-preview,聚齐三大核心推理能力。同时,百川智能还推出了行业首个开源医疗增强大模型 Baichuan-M1-14B。

据官方介绍,Baichuan-M1-preview 同时具备语言、视觉和搜索三大领域推理能力,在数学、代码等多个权威评测中的表现可对标 o1-preview。

IT之家注意到,它还解锁了“医疗循证模式”,实现了从证据检索到深度推理的完整端到端服务,能够快速、精准地回答医疗临床、科研问题。

Baichuan-M1-14B 则是 Baichuan-M1-preview 的小尺寸版本,同时也是行业首个开源的医疗增强大模型。据介绍,其医疗能力超越了更大参数量的 Qwen2.5-72B,与 o1-mini 相差无几。

  • Github:https:https//github.com/baichuan-inc/Baichuan-M1-14B

  • Huggingface(base):https://huggingface.co/baichuan-inc/Baichuan-M1-14B-Base

  • Huggingface(Instruct):https://huggingface.co/baichuan-inc/Baichuan-M1-14B-Instruct

  • NPU 版本支持 BF16 推理:https://modelers.cn/models/MindIE/Baichuan-M1-14B-Base

语言推理方面,其在 AIME 和 Math 等数学基准测试,以及 LiveCodeBench 代码任务上的成绩均超越了 o1-preview 等模型。

视觉推理能力方面,在 MMMU-val、MathVista 等权威评测中的成绩,超越了 GPT-4o、Claude3.5 Sonnet、QVQ-72B-Preview 等模型。