Deepseek退位，Minimax开源的新王！ - AI

7 x 24跟踪全球科技动态

热门话题

白天

搜索

资讯

Deepseek退位，Minimax开源的新王！

8 小时前 / 阅读约1分钟

来源：凤凰网

支持4M上下文的大海捞针

MiniMax-Text-01和MiniMax-VL-01开源。

用到了线性注意力，所以在处理长输入的时候有非常高的效率，接近线性复杂度。支持4M上下文的大海捞针。

并且得益于新架构，所以推理更快，在其他模型处理256K tokens的时间，Minimax的模型可以处理高达1000k tokens的信息。

456B的模型，每次激活参数为45.9B，结构图如下：

效果对齐第一梯队。

长文有领先优势。

模型地址：https://huggingface.co/MiniMaxAI/MiniMax-Text-01； https://huggingface.co/MiniMaxAI/MiniMax-VL-01

项目地址：https://github.com/MiniMax-AI

上一篇：ChatGPT自主执行力首次解锁，秒变24h超级管家，OpenAI跨入L3级智能体

下一篇：一文了解AI创业公司MiniMax

返回列表

热文阅读

2 天前

英伟达RTX 50系列显卡性价比优预期台厂供应链迎换卡潮

1 天前

英特尔酷睿 Ultra 200S 系列非 K 版桌面处理器国行上架：可选 U5-225/230F、U7-265F，1999 元起

1 天前

英特尔Core Ultra 9 285H在用户评测中力压锐龙AI 9 365

2 天前

【头条】1.3万亿元！中国集成电路TOP30园区总产值跃升韧性增长显著；

1 天前

英伟达抨击拜登政府芯片配额提案“广泛越权” 威胁创新和经济增长

1 天前

三星美国得州半导体厂获 47.4 亿美元激励资金，2026 年起大规模生产 2 纳米芯片与台积电竞争

1 天前

英伟达的主要客户因AI芯片架构故障面临延期

1 天前

SIA：AI芯片出口新限制或损害美国竞争力

1 天前

消息称 Arm 计划大幅提高芯片设计授权费，并考虑自主研发芯片

2 天前

意法半导体将加大汽车MCU投入力度

上一篇：ChatGPT自主执行力首次解锁，秒变24h超级管家，OpenAI跨入L3级智能体

下一篇：一文了解AI创业公司MiniMax

C114通信网
通信人家园

7 X 24跟踪全球科技动态

发现

资讯话题

热门话题

7 x 24跟踪全球科技动态

快讯

资讯

视频

关于我们

C114通信网

通信人家园