大语言模型2026-05-03 00:00·机器之心

DeepSeek 开源「Thinking With Visual Primitives」:让 AI 看得明白而非只是看得清楚

DeepSeek 提出并开源了「Thinking With Visual Primitives」多模态新范式。不同于 OpenAI、Google、Anthropic 都在比谁看得更清楚(更高分辨率),DeepSeek 的研究方向是让 AI 理解视觉内容——用视觉原语进行推理。

从"看清楚"到"看明白"

2026 年 Week 18,据机器之心报道,DeepSeek 提出了新的多模态范式。

核心理念

  • 当前趋势:各大公司都在提高模型视觉分辨率(看更清楚的图)
  • DeepSeek 方向:让 AI 用视觉原语(visual primitives)进行思考和推理
  • 本质区别:不是"看得更清楚",而是"看得更明白"

技术意义

这代表了多模态 AI 从感知向认知的转变。就像人类不单纯依赖高分辨率视觉来理解世界,而是依赖视觉概念和抽象——DeepSeek 试图让 AI 模型也能建立这种视觉认知能力。

来源: 机器之心
链接: https://www.jiqizhixin.com/