行业今天·新浪科技

面壁智能联合清华开源中国首个基于昇腾训练的 1.58-bit 端侧大模型 BitCPM-CANN

面壁智能联合清华大学正式开源 BitCPM-CANN,从量化算子、训练算法到全链路框架均在华为昇腾上原生完成。推理阶段释放约 6 倍显存红利,模型能力保留率维持 90% 到 97.2%,是中国端侧 AI 的重要突破。

端侧 AI 在中国迎来关键突破。

技术亮点:

  • 1.58-bit 量化:极低比特量化,大幅降低模型部署门槛
  • 显存红利:推理阶段释放约 6 倍显存
  • 能力保留:模型能力保留率 90% 到 97.2%
  • 全链路原生:从量化算子到训练算法到框架均在昇腾上完成

行业意义:

  • 端侧大模型是 AI 普惠化的关键路径
  • 1.58-bit 量化让大模型能在资源受限设备上运行
  • 昇腾原生适配意味着摆脱英伟达依赖的进一步深入

来源: 新浪科技
链接: https://k.sina.com.cn/article_7857201856_1d45362c001905x0l8.html