大语言模型2026-05-02 00:00·36氪 + 机器之心

DeepSeek 发布「Thinking With Visual Primitives」多模态新范式

DeepSeek 提出并开源多模态技术新范式「以视觉原语思考」,为 AI 视觉理解提供全新思路。

AI 多模态技术正在迎来范式创新。

技术突破

DeepSeek 发布了「Thinking With Visual Primitives」(以视觉原语思考)多模态技术范式。该方法不同于传统的视觉-语言对齐方式,而是让模型以「视觉原语」为基础进行推理和思考。

行业影响

机器之心指出,OpenAI、Google、Anthropic 都在比拼谁看得更清楚,而 DeepSeek 在研究怎么让 AI 看得「明白」。这代表了 AI 视觉理解从「识别」向「理解」的重要转变。

来源: 36氪 + 机器之心
链接: https://36kr.com/p/3789208597372165