什么是计算机视觉？它与人类视觉有何关系？

Q: 什么是计算机视觉？它与人类视觉有何关系？

定义：计算机视觉研究如何使机器从数字图像/视频中获取高层次理解（对象、动作、场景、文字）。 与人眼视觉类比 环节 人类 计算机 ------ ------ -------- 传感 视网膜感光细胞 相机/CCD 低层处理 侧抑制、边缘检测 滤波、边缘算子 中层 形状、运动感知 CNN 中层特征 高层 物体识别、语义 分类头、检测头 注意 选择性关注 显著性、ROI、Transformer Attention 相似点：层次处理；对边缘、纹理、形状敏感；利用上下文。 差异点 1. 人眼立体视差天然 深度感知；单目 CV 需估计深度 2. 人类样本效率极高；深度学习需大量标注 3. 人类有世界常识与因果；CV 模型易「对抗样本」 fooled 4. 颜色恒常性人脑更强 核心任务：目标检测、语义分割、OCR、三维重建、视频理解。 入门：计算机视觉。

Question 1

Accepted Answer

定义：计算机视觉研究如何使机器从数字图像/视频中获取高层次理解（对象、动作、场景、文字）。

与人眼视觉类比


环节	人类	计算机
传感	视网膜感光细胞	相机/CCD
低层处理	侧抑制、边缘检测	滤波、边缘算子
中层	形状、运动感知	CNN 中层特征
高层	物体识别、语义	分类头、检测头
注意	选择性关注	显著性、ROI、Transformer Attention

相似点：层次处理；对边缘、纹理、形状敏感；利用上下文。

差异点

人眼立体视差天然深度感知；单目 CV 需估计深度
人类样本效率极高；深度学习需大量标注
人类有世界常识与因果；CV 模型易「对抗样本」 fooled
颜色恒常性人脑更强

核心任务：目标检测、语义分割、OCR、三维重建、视频理解。

入门：计算机视觉。

Question 2

人类视觉哪些能力 CV 仍欠缺？

Accepted Answer

小样本/零样本快速学习、强分布外泛化与对抗鲁棒性、基于常识与因果的场景推理、稳定的颜色与亮度恒常性，以及主动注意与持续学习。例如人看一眼就能认新物体，而模型常需大量标注且易被对抗扰动或罕见场景骗到。这些是当前 CV 与人类视觉的主要差距。

Question 3

CV 和神经科学互相借鉴的例子？

Accepted Answer

CNN 的局部感受野与层次特征受 Hubel-Wiesel 视觉皮层简单/复杂细胞启发；注意力机制类比选择性注意；脉冲神经网络与事件相机模拟生物神经编码。反向上，深度网络也被神经科学用作 V1-IT 腹侧通路的计算模型来解释脑活动。两者长期双向启发。

Question 4

事件相机 vs 传统帧相机？

Accepted Answer

事件相机异步报告亮度变化，高动态范围、低延迟，利于高速运动；需新算法，与传统 CV pipeline 不同。

什么是计算机视觉？它与人类视觉有何关系？

核心要点

简要回答

标准回答

常见误区

追问

延伸学习