AI 天气预报（如 GraphCast）是如何工作的？

Question 1

Accepted Answer

问题设定 把全球大气状态离散为地球表面网格，每个网格点带多个变量（温度、气压、风、湿度等）和多个高度层。预报任务就是：给定当前（及近期）网格状态，预测未来某时刻的网格状态。 模型与方法 - GraphCast：用图神经网络，把网格点连成图（含多尺度长程连边），通过消息传递在全球范围传播信息，一步预测固定时间间隔后的状态。 - Pangu-Weather 等：用 Transformer/注意力在网格上建模空间依赖。 - 共同点是数据驱动：直接学习状态到状态的映射，而非像传统数值天气预报（NWP）那样数值求解流体力学等控制方程。 训练与推理 - 训练数据用再分析资料（如 ERA5）：它把历史观测通过数据同化融合成时空连续的高质量全球状态，作为监督目标。 - 推理时自回归滚动：用上一步预测作为下一步输入，逐步推进得到几天的中期预报。 优势 一旦训练完成，推理只需一次前向传播，比运行物理数值模式快几个数量级（秒级 vs 小时级），且在多项指标上精度与顶级数值模式相当甚至更优。

Question 2

GraphCast 为什么用图神经网络而不是普通 CNN？

Accepted Answer

地球是球面，规则网格在两极会严重畸变，普通平面卷积难以处理球面几何与经纬度不均。图结构能自然表示球面网格点及其邻接，还可加入多尺度的长程连边，让远距离的大气系统（如急流、遥相关）在少数消息传递步内交互信息，更贴合大气全球耦合的特性。

Question 3

为什么用 ERA5 再分析数据而不是原始观测来训练？

Accepted Answer

原始观测在时空上稀疏、不规则且有缺测，无法直接构成完整网格状态。再分析（如 ERA5）通过数据同化把历史观测与数值模式融合，生成时空连续、物理自洽的全球网格状态，提供了密集且高质量的监督目标，使数据驱动模型能稳定学习状态到状态的映射。代价是模型会继承再分析本身的偏差。

AI 天气预报（如 GraphCast）是如何工作的？

核心要点

标准回答

常见误区

追问

延伸学习