深度感知在计算机视觉应用中有何意义？

Question 1

深度感知在计算机视觉应用中有何意义？

Accepted Answer

为何重要：2D 图像丢失距离信息；深度使系统能判断障碍物远近、场景几何、真实尺度，是物理世界交互的前提。 获取深度方式 1. 双目立体：视差 $d$，深度 $Z = fB/d$（基线 B、焦距 f） 2. 结构光 / ToF：主动投射图案或测量飞行时间 3. 运动结构 SfM：多视角三角化 4. 单目深度估计：CNN/Transformer 学先验（尺度模糊） 应用场景 - 自动驾驶：可行驶区域、障碍物距离、融合激光雷达 - 机器人：抓取规划、SLAM、避障 - AR：虚实遮挡、平面检测、锚定 - 工业：体积测量、缺陷三维形貌 挑战 - 单目尺度不确定 - 透明/反光/无纹理表面 - 室外远距离精度 - 实时性与标定维护 工具：RealSense、OpenCV StereoBM/SGBM、PyTorch 深度模型。详见 三维视觉。

Question 2

单目深度为何尺度模糊？

Accepted Answer

同样投影大小可能是近处小物或远处大物。网络靠绝对尺寸先验（车、人高度）猜尺度，换域需微调或用已知参考物标定。

Question 3

LiDAR 和视觉深度互补吗？

Accepted Answer

LiDAR 稀疏但度量准确；相机稠密带语义。融合（BEV、点云投影）是自动驾驶主流，互补天气与距离盲区。

Question 4

NeRF 和深度图关系？

Accepted Answer

NeRF 隐式建体积密度，可渲染新视角并导出深度；适合物体重建，实时 SLAM 仍多用传统/深度网络深度图。

深度感知在计算机视觉应用中有何意义？

核心要点

简要回答

标准回答

常见误区

追问

延伸学习