国家海洋环境预报中心高性能计算机发展纪实

作者:记者 方正飞  来源:中国海洋报   发布时间:2017-11-22 09:29:50   [打印本页] [关闭窗口]

  11月10日,此前一直在广州天河等商业化超算中心运行的全球高分辨率数值预报系统,首次在国家海洋环境预报中心新引进的高性能计算机上运算成功。该高性能计算机运算速度达到258万亿次/秒,相当于上万台电脑并行运算的速度之和,是目前海洋系统运算速度最快的超算系统。目前,该系统运行稳定,运算结果合理,满足了海洋预报中数值模式运行要求。

技术人员在安装调试高性能计算机系统 伊 峰 摄

  在计算机技术发展之前,海洋预报主要是“靠天吃饭”的经验预报,预报结果往往不够精准。自1987年预报中心引入高性能计算机起,海洋数值预报走过了30年的历程,不断扩容的高性能计算机持续提升运算速度、预报精度,为海洋防灾减灾、海洋生态文明建设、海洋经济发展提供了更加精准、可靠的预报服务。

  数值预报呼唤“超级大脑”

  预报中心网络与计算机部工程师张炜说,在经验预报时代,就是经验丰富的预报员根据气压图、云图、实测温度变化估算风速、估计浪高等,这种预报方法偏于定性化,缺乏定量依据,偏差相对较大。

  20世纪50年代,我国开始发展数值预报技术,用高性能计算机做数值计算,预测未来一定时段的大气运动状态和天气现象。

  预报中心研究员张蕴斐说,这种方法首先要把大量常规观测、雷达观测、船舶观测、卫星观测等数据和过去几十年积累的数据输入计算机,再通过数学物理方法建立一套模式(即数值模式),该模式可以通过计算机模拟整个大气和海洋。运用数值模式,通过高速交换网络进行并行计算,模拟和预报未来几天风、温度、海浪等各种变量,最后经过预报员的人工综合使用再对外发布。“预报员只要在电脑上发布指令,就能够通过高性能计算机获取未来几天的海浪预报。

  由此可见,高性能计算机在数值预报中发挥着至关重要的作用。“预报中心每天要下载大量观测资料,再加上原有的基础数据和数值预报模式,计算机要运行巨量的数据,这就要求计算机的计算速度要非常快。”张蕴斐说,与经验预报相比,数值预报能有效提升海洋预报的准确度,而高性能计算机就是海洋预报的“超级大脑”,是衡量预报能力的一项重要指标。

  正是意识到了高性能计算机对海洋预报的重要性,几代海洋预报人为不断提升计算机的计算速度而不懈努力。

  “砸锅卖铁”购进高性能设备

  时间回溯到1955年,这一年我国迈出了探索数值天气预报的“脚步”。1959年,我国开始在计算机上进行数值天气预报。1969年,气象部门正式发布短期数值天气预报,而当时,我国海洋预报技术还停留在“靠天吃饭”的经验预报阶段。

  直到1987年,预报中心才引进了两台高性能计算机。提起引进这两台超级计算机的经历,预报中心高级工程师余劼记忆犹新。“引进这两套高性能计算机可费了牛劲了。”余劼皱着眉头说,当时以美国为首的发达国家对我国采取高技术禁运政策,卖给我国的产品都要经过美国国会核查。“历经多次波折,美方认定海洋预报属于公益预报事业,才答应把计算机卖给我们。为此,预报中心还签了保密协议,保证不做他用。”

  能买到高性能计算机,可资金又成了“拦路虎”。余劼告诉记者,经过多方协调和筹措,最终在国家专项资金的支持下,预报中心购得了第一套计算机——Cybre840。

  然而,这套计算机的计算速度仍不能满足需要,预报中心不得不筹划购买第二套。可当时他们又拿不出经费,只好把“主意”打到了预报中心位于北京白家庄黄金地段的一栋办公楼上。

  余劼说,我国是遭受海洋灾害严重的国家之一,海洋预报技术发展对海洋防灾减灾发挥着巨大作用,不能简单用经济价值来衡量,海洋预警报准确、及时能有效避免人员伤亡和财产损失。“就算是砸锅卖铁,也要发展数值预报技术。”最后,预报中心卖掉了那栋办公楼,购买了第二套高性能计算机。

  费尽周折引进的这两套计算机运算速度分别为100万次/秒和1250万次/秒。正是在这两套计算机的基础上,在中国科学院院士、时任预报中心主任巢纪平的带领下,预报中心创建了我国第一个海洋环境数值预报业务系统,我国海洋预报技术进入快速发展阶段。

  “当时这两套计算机运算速度已经很快了,属于国内领先,但和现在没法比,现在我们智能手机的速度每秒都已经达到几亿次了。”余劼笑着说。

  多次扩容实现三次飞跃

  随着计算机技术的飞速发展,运算速度每两三年就会更新一个量级,高性能计算机同样面临着升级换代的问题。

  从1987年到2008年,预报中心没有对高性能计算机进行更新换代。“短短20多年,我们已经从曾经的国内领先,变成落后于国内同行,更不用提世界先进水平了。”张炜坦言。

  同时,数值预报技术的发展对高性能计算机运算速度要求也越来越高。更新换代频率低,严重影响了我国海洋预报事业的发展。张炜解释说,以海洋环流数值预报为例,随着模式分辨率的提升,需要从1/4°精确到1/12°(以经纬度为标准),水平分辨率也要提高3倍,这带来的计算量却是指数级的增长。“以前需要计算两个小时,现在就要两天以上。即便算出结果,也没时效性了,高性能计算机的更新升级迫在眉睫。”

  2008年,经过多方努力,预报中心在海洋预报减灾能力建设专项第一期的支持下,购入了神威300A高性能计算机,计算速度为26万亿次/秒。“这套高性能计算机当时在国内排名第八,非常先进。”张炜骄傲地说。正是在这套高性能计算机的支撑下,我国的海洋预报事业取得了长足的进步。

  在2008年~2017年的9年里,预报中心对高性能计算机进行了多次扩容,运算速度达到了60万亿次/秒,但与国内和世界同行相比,差距不是在缩小,而是不断地拉大。

  直到今年11月8日,预报中心引进的联想高性能计算机通过专家验收,才使得运算速度再上一个新台阶。

  预报中心业务处副处长张志华介绍说,联想高性能计算机的投入运行,是继1987年、2008年之后预报中心高性能计算机运算能力的第三次飞跃。这套计算机系统整机理论峰值、即运算速度达258万亿次/秒,可为预报中心数值预报业务升级工作提供有力保障。

  以前,由于运算速度太慢,预报中心全球高分辨率(1/12°)海洋环流数值预报系统只能在商业化超算中心运行。根据数值室张宇博士的报告,运算 7天的预报,在天津天河超算中心要20小时,在广州天河超算中心要7个小时,而用联想高性能计算机只要4个小时,大大提升了运算速度。联想高性能计算机的应用,使得高分辨率全球海洋数值预报业务化运行成为可能。

  张志华告诉记者,联想高性能计算机入列后,预报能力将有大幅提升。在近海近岸预报业务方面,预报业务具备了向更加精细化方向发展的计算条件。下一步,预报中心对沿海城市预报将由目前的县级海域向乡镇级拓展,海洋灾害预警报将由百米级向街区级(10米~50米分辨率)拓展,近海网格化预报将由目前的50公里级向5公里级拓展。

  “尽管联想高性能计算机的运算能力提升很多,但与世界领先水平相比还存在很大差距,像欧洲中期天气预报中心的超算系统运算能力大约是4300万亿次/秒。”张志华说,“我国是超级计算大国,江南计算机研究所神威‘太湖之光’的计算速度世界排名第一,海洋预报在计算能力提升方面还是大有可为的。”

  值得高兴的是,高性能计算能力提升的问题已经引起了国家海洋局的高泛关注。十三五期间,预报中心将进一步提升高性能计算能力,利用先进的云计算技术,为整个业务体系提供海洋预报高性能计算服务。