核心要点

  • 分析光照:阴影、过曝、色温变化对特征的影响

  • 分析姿态:旋转、尺度、遮挡、视角变化

  • 提出数据增强归一化、多尺度检测等对策

  • 区分传统特征与深度学习的鲁棒性

简要回答

光照变化挑战

  • 明暗对比改变边缘与纹理强度
  • 色温/白平衡导致颜色特征不稳定
  • 阴影造成假轮廓、高光饱和丢细节

姿态与几何挑战

  • 旋转/翻转:物体外观剧变(非严格平移)
  • 尺度:远近导致目标像素尺寸差数量级
  • 视角:3D 物体 2D 投影形变
  • 遮挡:部分可见破坏整体形状

传统方法局限:SIFT/HOG 对极端光照仍脆弱;

深度学习对策

  1. 数据增强:亮度、对比度、色调抖动

标准回答

光照变化挑战

  • 明暗对比改变边缘与纹理强度
  • 色温/白平衡导致颜色特征不稳定
  • 阴影造成假轮廓、高光饱和丢细节

姿态与几何挑战

  • 旋转/翻转:物体外观剧变(非严格平移)
  • 尺度:远近导致目标像素尺寸差数量级
  • 视角:3D 物体 2D 投影形变
  • 遮挡:部分可见破坏整体形状

传统方法局限:SIFT/HOG 对极端光照仍脆弱;需手工设计不变性。

深度学习对策

  1. 数据增强:亮度、对比度、色调抖动;随机旋转、缩放、裁剪(OpenCV / Albumentations)
  2. 归一化per-channel mean/std;直方图均衡(慎用)
  3. 架构CNN 层次特征、多尺度 FPN、旋转等变网络(RoIAlign)
  4. 训练策略:多域数据、域自适应、测试时增强 TTA

评测:除 mAP 外,应在不同光照/角度子集上分层评估。详见 目标检测

常见误区

⚠️ 常见踩坑

只说「多收集数据」不说具体增强;混淆分类与检测;忽视域偏移(训练日光、测试夜景)。

追问

追问 1颜色空间选 RGB 还是 HSV 做光照鲁棒?

HSV 的 V 通道对亮度变化相对分离,传统 CV 常用;深度学习端到端学特征,RGB+增强通常足够。红外/多光谱需专门通道设计。

追问 2旋转不变性 CNN 天生具备吗?

旋转不变性并非 CNN 天生具备。传统卷积核只能捕获局部平移等变特征,对旋转角度变化缺乏内在鲁棒性。常见实现方式包括:数据增强(随机旋转训练样本)、旋转等变卷积核(如 Steerable CNNs)、空间变换网络(STN)以及 RoIAlign 等。工程上数据增强更实用,显式不变性会增加计算开销。生产环境常用数据增强加测试时增强(TTA)组合策略。

追问 3夜间场景如何提升识别率?

夜间场景提升识别率的方法包括:低光增强预处理(直方图均衡化、Retinex 算法)、红外与可见光融合、合成夜景数据增强、域自适应技术(从日到夜的迁移学习)。注意数据增强可能引入伪影,会误导模型学习错误特征,需要谨慎使用。

延伸学习

与本题相关的知识库文章、术语、工具与行业资讯。