标准回答
为什么需要 Sim2Real
真机采样慢、贵、危险,仿真可并行采海量数据。难点是仿真与现实存在差距(reality gap):动力学与接触摩擦建模不准、传感器有噪声和延迟、相机外观和光照与真实不同、电机/执行器特性难精确建模,导致仿真里好用的策略到真机失效。
主流方法
- 域随机化:训练时随机化质量、摩擦、光照、纹理、噪声等,把真实当作随机分布的一个样本,逼策略学到鲁棒特征。
- 系统辨识:测量真机参数去标定仿真,缩小差距(与随机化互补)。
- 真机微调:在仿真预训练,再用少量真机数据微调适配。
- real2sim2real:用真机数据反向校准仿真,再迁回真机闭环迭代。
工程权衡
随机化范围要折中:过大策略保守、性能下降,过小则不鲁棒。视觉差距可加域随机化或域适应;延迟需在仿真中显式建模。
常见误区
⚠️ 常见踩坑
域随机化不是「随机得越多越好」:盲目扩大范围会让策略学不到任务、过度保守;应针对真实不确定性来源有的放矢,并配合系统辨识收紧关键参数。
延伸学习
与本题相关的知识库文章、术语、工具与行业资讯。