AI 理解世界:从语言模式到物理现实
2026 年 5 月 21 日,MIT Technology Review 举办圆桌讨论,探讨 AI 能否真正理解外部世界。
核心议题
- LLM 的局限: 当前大语言模型基于统计模式匹配,是否真正“理解”仍有争议
- 世界模型: Google Gemini Omni 等系统尝试构建物理世界的内部表征
- 多模态融合: 视觉、语言、行动的联合建模是否是通往真正理解的路径
研究进展
- Google 在 I/O 大会上展示的 Omni 世界模型试图让 AI“理解”物理规律
- arXiv 近期多篇论文探讨了 Agent JIT 编译优化和自适应记忆框架
- DeepWeb-Bench 等新基准测试要求 Agent 在开放网络中搜索证据并进行长程推理
行业共识
与会者普遍认为,虽然当前 AI 系统在特定任务上表现出色,但距离真正“理解”世界仍有显著差距。这需要算法创新、新架构设计和更丰富的训练数据。
来源: MIT Technology Review
链接: https://www.technologyreview.com/2026/05/21/1137756/roundtables-can-ai-learn-to-understand-the-world/