春夏交棒,上海夏意渐浓,今夜明晨雨水将随之现身,颇有些雨季欲来的意味。这几日,位于上海气象局气象大楼三楼的上海市人工智能气象应用创新中心十分忙碌,几盏办公灯时常亮到天黑,围坐在电脑前的一群年轻人的眼睛紧盯着屏幕上跳动着雷达回波图、卫星云图和数值预报模型的输出结果,键盘敲击声此起彼伏,混合着低语和争论——当AI重塑一切,这支平均年龄不足35岁、6个人组成的年轻科研团队,正在气象与人工智能的交叉领域掀起一场“技术进阶”,不断调试“雨师”“扶摇”两个AI气象预报模型的参数,为即将到来的汛期做最后准备,也在不断创新探索,期望用代码丈量风云,用数据解码天气,守卫这座超大城市的安全。
从“看天”到“算天”的跨界
“这次的算法优化,得把垂直速度场的物理约束再调细一点。”一位纤瘦的年轻人轻声慢语但目光专注。他叫陈诗祺,是上海市气象局人工智能团队的“90后”工程师,负责 “雨师”短临预警系列模型技术研发及上海中心气象台气象人工智能重点算法研发的管理工作。从2024年模型试运行以来,这样的加班对他来说早已习以为常。作为南京信息工程大学的气象学硕士,陈诗祺的办公桌上摆着两本书:一本是《天气学原理》,另一本是《深度学习》。2018年刚入职时,他还是个在一线值守的预报员,每天对着数值预报图人工标注强对流云团。“当时,传统全球数值模式,以逐3小时预报为主,分辨率只有10-25公里左右。有时候,等预报出来,暴雨可能已经落地了,或者落得不够精准。”回忆起工作之初的极端天气,他至今记忆犹新:城市里突如其来的局地暴雨一度让地铁短时停运、也曾让城市瞬间“看海”,而当时的预报系统无法对这类“小尺度怪物”精准“定位”。
6人团队经常在一起讨论,坐着的是陈诗祺(左)和曹原(右)
“如何才能更精准地预报?”陈诗祺的契机出现在2023年。当上海人工智能实验室抛出橄榄枝时,陈诗祺主动向局里申请,加入技术交流。在那里,他第一次遇到还在复旦大学就读计算机博士的曹原。正如“气象+AI”这场跨界变革一样,两人也经历了从“看天”到“算天”,从“人工智能”到“气象+”的角色互补和互换。“我总觉得,气象是AI的‘终极应用题’之一,它既有时空序列的复杂性,又有极端事件的小样本挑战。希望每一行代码都能让预警早一些,守住城市的风云危机线。”曹原笑着说,他在读博期间尝试过金融模型,做过健康AI,但最终,他毕业时放弃了进入互联网大厂,在2024年正式“扎根”在气象AI领域。
驯服“数据噪音”的博弈
然而,AI模型并非万能,更不是一蹴而就。研发过程充满技术博弈。“神经网络天生擅长捕捉统计均值,但极端天气在它眼里只是‘噪音’。这些‘噪音’,恰恰是我们最为关注,也是最容易引发灾害的重要对象。”曹原说,传统AI模型对35dBZ(dBZ是气象学中用于量化雷达回波强度的单位)以上强回波的识别准确率一度很低,“就像考试时避开难题,它选择了最安全的答案”。为了让AI“关注难题”,两个人带领团队大胆尝试:“雨师”中,首次将三维连续性方程嵌入神经网络,模拟大气中的垂直运动规律,陈诗祺联合上海人工智能实验室还设计了一个 “物理约束层”,强制模型学习雷达回波的立体结构。经过近百次的迭代,当新模型不再输出过于平滑的模糊图像,而是展示清晰的强对流落区预测时,团队在办公室里击掌相庆。
“扶摇”模型的研发更体现出“数据融合”的智慧。雷达每分钟更新,数值预报每小时输出一次,卫星半小时才有一张图,如何让它们“同步说话”?曹原带领团队搭建了Nowcastformer架构,像“数据翻译官”一样处理雷达、卫星、激光测风等多源数据,并采用自回归预报建模,形成时间间隔1小时的降雨、风速等预报场,实现同化预报一体以及即时启动、快速更新。现在,“扶摇”能生成逐小时的街道级风雨预报,未来或许连黄浦区某条小巷的瞬时风速都能精准预判。
防止AI“幻觉”的攻坚
2024年冬天的一次测试,让团队遭遇了AI的“致命幻觉”。陈诗祺记得,模型突然在长江口“生成”出一片强对流云团,而实际雷达回波显示那里晴空万里。“就像AI自说自话做了个‘梦’,把历史数据中的极端案例无厘头地拼接在一起。”分析发现,生成式模型的随机噪声在小样本场景下会被放大,导致虚警率攀升。
为了减少这种 “幻觉”,陈诗祺提出“确定式+概率式”级联方案:先用确定式模型锁定中大尺度降水趋势,再让概率式模型聚焦小尺度极端事件。这就像给AI配备了“双保险”,确定式模型如同经验丰富的预报员,画出天气演变的“粗线条”,概率式模型则像精密显微镜,捕捉每一个可能的极端波动。曹原又在代码中加入“自适应权重机制”,让模型重点关注历史案例中的“异常点”,那些曾被视为噪声的极端数据,成了训练的“黄金样本”。
如今,“雨师”和“扶摇”已成为上海气象局的“双子星”。“雨师”专注于突发强对流天气的预测,它能精准刻画雷暴单体的立体结构,便于气象工作者判断对流天气什么时候出现、什么时候消亡。凭借这一独特优势,“雨师”实现了对未来3小时内逐6分钟、1公里尺度的雷达降水预报,有望将强对流预警时效提前15至45分钟。而“扶摇”则聚焦短时强降水和雷雨大风。它利用自回归建模,将雷达、卫星、数值预报等多源数据“缝合”成一个动态画卷,预报频次从目前的逐1小时提升至逐10分钟级更新,预警精细程度更是有望深入到街镇一级。
“这场‘解码风云’的旅程,才刚刚开始。”为了更好地打磨模型,今年初,曹原开始了每周的大气基础线上课自学,而陈诗祺则每天都在关注深度学习的最新动态。这支完全由年轻人组成的创新团队不断在代码与云图间耕耘。在他们设想中,未来AI将解锁更多天气密码:用强化学习优化台风路径预测,借大模型推演气候变化趋势,甚至让气象预警像推送新闻般触达每个市民的手机。
原标题:上海气象局AI创新:90后“解码风云”,在暴雨来临前抢出45分钟
上一篇:*ST兰黄录得9天6板