开源项目2026-06-01·MiniMax 官方
MiniMax 发布 M3:首个开源多模态前沿模型,428B 参数支持 100 万上下文
MiniMax 于 6 月 1 日发布 M3,这是首个开源权重的多模态前沿模型。总参数 428B、激活参数 23B,支持文本/图像/视频输入和 100 万 token 上下文。在 SWE-Bench Pro 上达到 59%,Terminal-Bench 66%,性能媲美 Gemini 3.1 Pro。API 定价 $0.30/$1.20 每百万 token,权重将在 10 天内发布到 HuggingFace。
AI Master 解读
核心事件
MiniMax 发布首个开源多模态前沿模型 M3,428B 参数支持 100 万上下文,性能媲美 Gemini 3.1 Pro。
行业影响
M3 引入 MiniMax Sparse Attention (MSA) 架构,在 100 万上下文下 prefill 速度提升 9 倍、decode 速度提升 15 倍,每 token 计算成本降至 1/20。原生多模态训练从第一步开始混合文本/图像/视频,实现深度语义融合。
AI Master 建议
这是目前性价比最高的前沿模型选择。建议重点关注:(1) 长文档分析和全仓库代码理解场景;(2) 多模态 Agent 工作流;(3) 本地部署(量化后约 128GB 可运行)。权重发布后可完全自托管。
MiniMax M3:开源多模态前沿模型
2026 年 6 月 1 日,MiniMax 发布 M3,首个开源权重的多模态前沿模型。
核心规格
- 参数规模: 428B 总参数 / 23B 激活参数
- 上下文窗口: 100 万 token(当前支持 512K,完整 1M 即将开放)
- 多模态: 原生支持文本、图像、视频输入
- 架构: MiniMax Sparse Attention (MSA),9x prefill / 15x decode 加速
- 定价: $0.30/$1.20 每百万 token(≤512K),$0.60/$2.40(512K-1M)
性能基准
| 基准测试 | M3 得分 | 对比 |
|---|---|---|
| SWE-Bench Pro | 59% | 媲美 Gemini 3.1 Pro |
| Terminal-Bench 2.1 | 66% | 开源模型领先 |
| GPQA Diamond | 93% | 比 M2.7 提升 6 点 |
| MMMU-Pro | ~80% | 与 GPT-5.5 持平 |
技术亮点
- MiniMax Sparse Attention (MSA): 自定义稀疏注意力算子,比开源 Flash-Sparse-Attention 快 4 倍以上
- 原生多模态: 从训练第一步开始混合模态,非后期拼接
- 开源权重: 计划 10 天内发布到 HuggingFace
本地部署
- 未量化 bf16: ~855GB
- 1-bit GGUF: ~128GB(最低 133GB RAM)
- 推荐 4-bit: ~208GB(适合 256GB+ 系统)
来源: MiniMax 官方 + HuggingFace + Fireworks AI
链接: https://huggingface.co/MiniMaxAI/MiniMax-M3