大语言模型2026-05-03 00:00·机器之心

DeepSeek 开源「Thinking With Visual Primitives」：让 AI 看得明白而非只是看得清楚

DeepSeek 提出并开源了「Thinking With Visual Primitives」多模态新范式。不同于 OpenAI、Google、Anthropic 都在比谁看得更清楚（更高分辨率），DeepSeek 的研究方向是让 AI 理解视觉内容——用视觉原语进行推理。

从"看清楚"到"看明白"

2026 年 Week 18，据机器之心报道，DeepSeek 提出了新的多模态范式。

这代表了多模态 AI 从感知向认知的转变。就像人类不单纯依赖高分辨率视觉来理解世界，而是依赖视觉概念和抽象——DeepSeek 试图让 AI 模型也能建立这种视觉认知能力。

来源： 机器之心
链接： https://www.jiqizhixin.com/

📰 原始来源

← 上一篇

Google Gemini AI 助手将进入数百万辆汽车，车载 AI 竞争白热化

Anthropic 与 NEC 合作建设日本最大 AI 工程人才队伍