开源项目2026-06-01·MiniMax 官方

MiniMax 发布 M3：首个开源多模态前沿模型，428B 参数支持 100 万上下文

MiniMax 于 6 月 1 日发布 M3，这是首个开源权重的多模态前沿模型。总参数 428B、激活参数 23B，支持文本/图像/视频输入和 100 万 token 上下文。在 SWE-Bench Pro 上达到 59%，Terminal-Bench 66%，性能媲美 Gemini 3.1 Pro。API 定价 $0.30/$1.20 每百万 token，权重将在 10 天内发布到 HuggingFace。

AI Master 解读

核心事件

MiniMax 发布首个开源多模态前沿模型 M3，428B 参数支持 100 万上下文，性能媲美 Gemini 3.1 Pro。

行业影响

M3 引入 MiniMax Sparse Attention (MSA) 架构，在 100 万上下文下 prefill 速度提升 9 倍、decode 速度提升 15 倍，每 token 计算成本降至 1/20。原生多模态训练从第一步开始混合文本/图像/视频，实现深度语义融合。

AI Master 建议

这是目前性价比最高的前沿模型选择。建议重点关注：(1) 长文档分析和全仓库代码理解场景；(2) 多模态 Agent 工作流；(3) 本地部署（量化后约 128GB 可运行）。权重发布后可完全自托管。

MiniMax M3：开源多模态前沿模型

2026 年 6 月 1 日，MiniMax 发布 M3，首个开源权重的多模态前沿模型。

核心规格

参数规模: 428B 总参数 / 23B 激活参数
上下文窗口: 100 万 token（当前支持 512K，完整 1M 即将开放）
多模态: 原生支持文本、图像、视频输入
架构: MiniMax Sparse Attention (MSA)，9x prefill / 15x decode 加速
定价: $0.30/$1.20 每百万 token（≤512K），$0.60/$2.40（512K-1M）

性能基准


基准测试	M3 得分	对比
SWE-Bench Pro	59%	媲美 Gemini 3.1 Pro
Terminal-Bench 2.1	66%	开源模型领先
GPQA Diamond	93%	比 M2.7 提升 6 点
MMMU-Pro	~80%	与 GPT-5.5 持平

技术亮点

MiniMax Sparse Attention (MSA): 自定义稀疏注意力算子，比开源 Flash-Sparse-Attention 快 4 倍以上
原生多模态: 从训练第一步开始混合模态，非后期拼接
开源权重: 计划 10 天内发布到 HuggingFace

本地部署

未量化 bf16: ~855GB
1-bit GGUF: ~128GB（最低 133GB RAM）
推荐 4-bit: ~208GB（适合 256GB+ 系统）

来源: MiniMax 官方 + HuggingFace + Fireworks AI
链接: https://huggingface.co/MiniMaxAI/MiniMax-M3

📰 原始来源

https://huggingface.co/MiniMaxAI/MiniMax-M3

← 上一篇

阿里巴巴发布 Qwen 3.7 Plus：多模态 Agent 模型，比 Max 便宜 6 倍

NVIDIA发布RTX Spark Arm超级芯片，进军消费级笔记本市场直接挑战Intel和AMD

📰 更多动态

Agent2026-06-14