中国 AI 模型训练规模正在达到新高度。
里程碑
36 氪报道,DeepSeekV4 和美团 LongCat 几乎同时宣布训练 Token 数突破万亿。这意味着国内 AI 企业开始尝试铺设自己的技术轨道,而非仅仅跟随国外的步伐。
技术意义
万亿 Token 训练是 LLM scaling law 的重要里程碑。更多的训练数据意味着模型能学习到更广泛的知识模式和语言能力。DeepSeek 在开源社区持续发力,而美团 LongCat 则展示了互联网公司在 AI 基础设施方面的投入。
行业信号
两家几乎同时达到这一里程碑,说明中国 AI 行业的算力投入正在加速。这也与 Anthropic 与 Amazon 扩展到 5GW 算力、Google 与 Broadcom 合作建设下一代算力的趋势相互呼应。
来源: 36 氪
链接: https://36kr.com/p/3788904611033605