据IT之家3月17日消息,尽管美国宇航局 (NASA) 一直使用着世界上最前沿的技术,并取得了人类历史上许多重大发现,但一份其内部总监察长办公室 (NASA Office of Inspector General) 的特别报告却揭露,由于NASA的超级计算机能力不足以满足任务需求,导致一些项目进度延误。
报告指出,NASA的超级计算机仍然主要依赖于CPU中央处理器,例如其旗舰超级计算机之一,竟拥有18000个CPU,但仅有48个GPU图形处理器。要知道,GPU在并行处理任务(科学模拟和建模中非常常见)方面能提供远超CPU的计算能力。
目前,NASA在加州埃姆斯研究中心 (Ames) 的NASA先进超级计算中心 (NAS) 和马里兰州戈达德太空中心 (Goddard) 的NASA气候模拟中心 (NCCS) 共拥有五台高端计算 (HEC) 设备。这些设备包括支持重返月球并建立长期驻留基地“阿尔忒弥斯计划”的艾特肯 (Aitken)、性能强大的伊莱克特拉 (Electra)、用于气候和天气模拟的发现号 (Discover)、应用于气候模拟、天体物理研究和航空航天建模的毕宿五 (Pleiades) 以及奋进号 (Endeavour)。
IT之家注意到,这些机器几乎完全依赖旧款的CPU核心,例如,所有NAS超级计算机都使用超过18000个CPU,而GPU仅有48个,NCCS的GPU数量甚至更少。
报告援引美国宇航局高端计算官员的话说,造成系统无法现代化的原因是多方面的,包括供应链问题、现代编程语言需求以及实施新技术所需的技术人员短缺等。报告指出,无法升级现有高端计算基础设施将直接影响美国宇航局实现其探索、科学和研究目标的能力。
审计还发现,美国宇航局的高端计算运营并未进行集中管理,导致效率低下,并且缺乏内部资源与云计算资源之间使用策略的统一性。由于未知的调度方式或假定的更高成本,这种不确定性导致了对使用云计算资源的犹豫。一些任务被迫自行获取基础设施,以避免等待使用主要超级计算资源,因为这些资源在很大程度上由于没有采用最新的高性能计算技术而导致过载。
此外,审计发现,高端计算基础设施的安全控制措施经常被绕过或未被实施,从而增加了网络攻击的风险。
报告最后建议,转向使用GPU和进行代码现代化改造是满足NASA当前和未来需求的关键。这将大大提升其在科学模拟和建模等领域的计算能力,并助力其顺利完成各项太空探索和科研任务。