大语言模型2026-04-24·腾讯云开发者社区 + CSDN

DeepSeek-V4 正式开源:1.6 万亿参数 MoE 架构,全面适配华为昇腾平台

深度求索发布 DeepSeek-V4,包含 Pro 版(总参数 1.6 万亿,激活 49B)和 Flash 版(总参数 284B,激活 13B),采用混合专家架构,全面适配华为昇腾平台,被称为国产算力里程碑。

DeepSeek-V4 开源

2026 年 4 月 24 日,深度求索(DeepSeek)发布。

双版本策略

  • Pro 版: 总参数 1.6 万亿,激活参数 49B
  • Flash 版: 总参数 284B,激活参数 13B
  • 采用 MoE(混合专家)架构

技术亮点

  • 全面适配华为昇腾平台
  • 推理能力大幅升级
  • 开源协议友好

行业影响

  • 国产模型持续缩小与 GPT/Claude 的差距
  • 张亚勤认为中国转向更轻的模型、更聪明的架构、更高的效率和更低的价格
  • DeepSeek 系列成为开源与闭源良性互补的代表

来源: 腾讯云开发者社区 + CSDN
链接: https://cloud.tencent.com/developer/article/2661902