AI 多模态技术正在迎来范式创新。
技术突破
DeepSeek 发布了「Thinking With Visual Primitives」(以视觉原语思考)多模态技术范式。该方法不同于传统的视觉-语言对齐方式,而是让模型以「视觉原语」为基础进行推理和思考。
行业影响
机器之心指出,OpenAI、Google、Anthropic 都在比拼谁看得更清楚,而 DeepSeek 在研究怎么让 AI 看得「明白」。这代表了 AI 视觉理解从「识别」向「理解」的重要转变。
来源: 36氪 + 机器之心
链接: https://36kr.com/p/3789208597372165