产品发布3 天前·DeepSeek
DeepSeek V4发布:1.6万亿参数MoE模型在华为昇腾芯片上训练
DeepSeek发布V4-Pro预览版,这是一个1.6万亿参数的混合专家(MoE)模型,关键突破在于完全在华为昇腾950芯片上训练,而非NVIDIA硬件。V4是目前全球最佳开源模型之一,但与美国前沿闭源模型仍有差距。该模型通过DeepSeek网站和API开放使用。
AI Master 解读
核心事件
DeepSeek V4在华为昇腾芯片上完成训练,验证国产AI芯片可行性。
行业影响
影响分析: 这是中美AI芯片竞争的关键节点。DeepSeek V4证明华为昇腾950可以作为大型MoE模型的可行训练平台,这对美国芯片管制政策构成直接挑战。
技术层面:1)V4采用1.6万亿参数MoE架构;2)是目前最佳开源选项;3)但仍落后于美国前沿闭源模型。
AI Master 建议
国产AI芯片生态正在快速成熟,关注昇腾生态的长期发展潜力。
DeepSeek V4技术详情
核心参数
| 指标 | 数据 |
|---|---|
| 参数量 | 1.6万亿(MoE架构) |
| 训练芯片 | 华为昇腾950 |
| 开源状态 | 完全开源 |
| 可用性 | 网站 + API |
战略意义
- 验证华为昇腾作为大模型训练平台的可行性
- 对美国芯片管制构成直接挑战
- 为中国AI公司提供替代NVIDIA的可行路径
局限性
- 仍落后于美国前沿闭源模型
- 人才流失至腾讯、字节、小米等公司
- 开源策略是中国AI实验室与美国闭源模型竞争的主要方式