核心要点
把全球大气状态表示为地球网格上的多变量场,模型学习从当前状态预测下一时刻状态。
GraphCast 用图神经网络在网格上传递信息,Pangu 等用 Transformer;属于数据驱动而非求解物理方程。
训练数据来自再分析资料(如 ERA5),用历史观测同化得到的高质量全球状态作监督。
推理时自回归滚动多步得到中期预报,速度比传统数值天气预报快几个量级,精度可相当甚至更优。
标准回答
问题设定
把全球大气状态离散为地球表面网格,每个网格点带多个变量(温度、气压、风、湿度等)和多个高度层。预报任务就是:给定当前(及近期)网格状态,预测未来某时刻的网格状态。
模型与方法
- GraphCast:用图神经网络,把网格点连成图(含多尺度长程连边),通过消息传递在全球范围传播信息,一步预测固定时间间隔后的状态。
- Pangu-Weather 等:用 Transformer/注意力在网格上建模空间依赖。
- 共同点是数据驱动:直接学习状态到状态的映射,而非像传统数值天气预报(NWP)那样数值求解流体力学等控制方程。
训练与推理
- 训练数据用再分析资料(如 ERA5):它把历史观测通过数据同化融合成时空连续的高质量全球状态,作为监督目标。
- 推理时自回归滚动:用上一步预测作为下一步输入,逐步推进得到几天的中期预报。
优势
一旦训练完成,推理只需一次前向传播,比运行物理数值模式快几个数量级(秒级 vs 小时级),且在多项指标上精度与顶级数值模式相当甚至更优。
常见误区
⚠️ 常见踩坑
AI 天气模型不是在求解物理控制方程,而是从再分析数据学统计映射;它依赖 ERA5 等高质量数据,且自回归长程滚动可能累积误差、对极端/分布外事件外推能力仍受限。
追问
追问 1:GraphCast 为什么用图神经网络而不是普通 CNN?
地球是球面,规则网格在两极会严重畸变,普通平面卷积难以处理球面几何与经纬度不均。图结构能自然表示球面网格点及其邻接,还可加入多尺度的长程连边,让远距离的大气系统(如急流、遥相关)在少数消息传递步内交互信息,更贴合大气全球耦合的特性。
追问 2:为什么用 ERA5 再分析数据而不是原始观测来训练?
原始观测在时空上稀疏、不规则且有缺测,无法直接构成完整网格状态。再分析(如 ERA5)通过数据同化把历史观测与数值模式融合,生成时空连续、物理自洽的全球网格状态,提供了密集且高质量的监督目标,使数据驱动模型能稳定学习状态到状态的映射。代价是模型会继承再分析本身的偏差。
延伸学习
与本题相关的知识库文章、术语、工具与行业资讯。