开源项目2026-05-02 09:26·36 氪

DeepSeekV4 与美团 LongCat 同时突破万亿 Token 训练规模

国内两大 AI 团队 DeepSeek 和美团 LongCat 几乎同时宣布模型训练 Token 数突破万亿,标志着中国 AI 进入大规模训练新阶段。

中国 AI 模型训练规模正在达到新高度。

里程碑

36 氪报道,DeepSeekV4 和美团 LongCat 几乎同时宣布训练 Token 数突破万亿。这意味着国内 AI 企业开始尝试铺设自己的技术轨道,而非仅仅跟随国外的步伐。

技术意义

万亿 Token 训练是 LLM scaling law 的重要里程碑。更多的训练数据意味着模型能学习到更广泛的知识模式和语言能力。DeepSeek 在开源社区持续发力,而美团 LongCat 则展示了互联网公司在 AI 基础设施方面的投入。

行业信号

两家几乎同时达到这一里程碑,说明中国 AI 行业的算力投入正在加速。这也与 Anthropic 与 Amazon 扩展到 5GW 算力、Google 与 Broadcom 合作建设下一代算力的趋势相互呼应。

来源: 36 氪
链接: https://36kr.com/p/3788904611033605