ITCOW牛新网 6月16日消息,稀宇科技(MiniMax)昨晚正式在HuggingFace平台开源了其最新原生多模态旗舰大模型——MiniMax M3的模型权重,并同步释出自研MSA(MiniMix Sparse Attention)技术论文。这款被官方定义为”从Step 0开始做多模态混合训练”的开源模型,总参数量达4280亿(428B),激活参数23B,是目前业界首个真正意义上的原生多模态训练开源权重版本,而非视觉模块后挂的文本底座改装品。

据ITCOW牛新网了解,MiniMax M3在发布短短两周内,便于Artificial Analysis综合智能指数排行榜上拿下全球开源模型最高排名,其在编码与智能体评测中均达到行业顶尖水平。该模型具备自主任务拆解、多步推理及工具调用能力,官方强调它生成的代码”目标是直接可交付,而不是能跑但需要人工改”,且API最高支持100万Tokens(1M)的超长上下文窗口,配合MSA稀疏注意力架构在预填充和解码阶段分别实现最高9倍和15倍的加速。针对上周开源初期访问量激增导致的吞吐波动,团队已将输出速度从约30 TPS提升至80 TPS,并透露接下来还会继续优化提速30%—40%,让交互响应更加丝滑。

MiniMax M3的此番开源延续了该公司在多模态与长文本理解领域的激进投入路线——它是国内首个同时具备前沿编程与智能体能力、百万级上下文及原生多模态三大特性的模型,也是唯一选择开源路线的同级别产品。目前开发者已可通过官方HuggingFace仓库(https://huggingface.co/MiniMaxAI/MiniMax-M3)下载权重与配置文件进行本地部署或二次开发,稀宇科技表示将持续迭代推理效率并扩充生态工具链支持。