产品发布3 天前·DeepSeek

DeepSeek V4发布:1.6万亿参数MoE模型在华为昇腾芯片上训练

DeepSeek发布V4-Pro预览版,这是一个1.6万亿参数的混合专家(MoE)模型,关键突破在于完全在华为昇腾950芯片上训练,而非NVIDIA硬件。V4是目前全球最佳开源模型之一,但与美国前沿闭源模型仍有差距。该模型通过DeepSeek网站和API开放使用。

AI Master 解读

核心事件

DeepSeek V4在华为昇腾芯片上完成训练,验证国产AI芯片可行性。

行业影响

影响分析: 这是中美AI芯片竞争的关键节点。DeepSeek V4证明华为昇腾950可以作为大型MoE模型的可行训练平台,这对美国芯片管制政策构成直接挑战。

技术层面:1)V4采用1.6万亿参数MoE架构;2)是目前最佳开源选项;3)但仍落后于美国前沿闭源模型。

AI Master 建议

国产AI芯片生态正在快速成熟,关注昇腾生态的长期发展潜力。

DeepSeek V4技术详情

核心参数

指标 数据
参数量 1.6万亿(MoE架构)
训练芯片 华为昇腾950
开源状态 完全开源
可用性 网站 + API

战略意义

  1. 验证华为昇腾作为大模型训练平台的可行性
  2. 对美国芯片管制构成直接挑战
  3. 为中国AI公司提供替代NVIDIA的可行路径

局限性

  • 仍落后于美国前沿闭源模型
  • 人才流失至腾讯、字节、小米等公司
  • 开源策略是中国AI实验室与美国闭源模型竞争的主要方式