开源项目2026-06-01·MiniMax 官方

MiniMax 发布 M3:首个开源多模态前沿模型,428B 参数支持 100 万上下文

MiniMax 于 6 月 1 日发布 M3,这是首个开源权重的多模态前沿模型。总参数 428B、激活参数 23B,支持文本/图像/视频输入和 100 万 token 上下文。在 SWE-Bench Pro 上达到 59%,Terminal-Bench 66%,性能媲美 Gemini 3.1 Pro。API 定价 $0.30/$1.20 每百万 token,权重将在 10 天内发布到 HuggingFace。

AI Master 解读

核心事件

MiniMax 发布首个开源多模态前沿模型 M3,428B 参数支持 100 万上下文,性能媲美 Gemini 3.1 Pro。

行业影响

M3 引入 MiniMax Sparse Attention (MSA) 架构,在 100 万上下文下 prefill 速度提升 9 倍、decode 速度提升 15 倍,每 token 计算成本降至 1/20。原生多模态训练从第一步开始混合文本/图像/视频,实现深度语义融合。

AI Master 建议

这是目前性价比最高的前沿模型选择。建议重点关注:(1) 长文档分析和全仓库代码理解场景;(2) 多模态 Agent 工作流;(3) 本地部署(量化后约 128GB 可运行)。权重发布后可完全自托管。

MiniMax M3:开源多模态前沿模型

2026 年 6 月 1 日,MiniMax 发布 M3,首个开源权重的多模态前沿模型。

核心规格

  • 参数规模: 428B 总参数 / 23B 激活参数
  • 上下文窗口: 100 万 token(当前支持 512K,完整 1M 即将开放)
  • 多模态: 原生支持文本、图像、视频输入
  • 架构: MiniMax Sparse Attention (MSA),9x prefill / 15x decode 加速
  • 定价: $0.30/$1.20 每百万 token(≤512K),$0.60/$2.40(512K-1M)

性能基准

基准测试 M3 得分 对比
SWE-Bench Pro 59% 媲美 Gemini 3.1 Pro
Terminal-Bench 2.1 66% 开源模型领先
GPQA Diamond 93% 比 M2.7 提升 6 点
MMMU-Pro ~80% 与 GPT-5.5 持平

技术亮点

  1. MiniMax Sparse Attention (MSA): 自定义稀疏注意力算子,比开源 Flash-Sparse-Attention 快 4 倍以上
  2. 原生多模态: 从训练第一步开始混合模态,非后期拼接
  3. 开源权重: 计划 10 天内发布到 HuggingFace

本地部署

  • 未量化 bf16: ~855GB
  • 1-bit GGUF: ~128GB(最低 133GB RAM)
  • 推荐 4-bit: ~208GB(适合 256GB+ 系统)

来源: MiniMax 官方 + HuggingFace + Fireworks AI
链接: https://huggingface.co/MiniMaxAI/MiniMax-M3