高性能神威太湖之光双精浮点峰值高达125PFlops,稳定性能为93PFlops,相比较之下,美国超算泰坦的双精浮点峰值高达27 Pflops,稳定性能为17.6 PFlops,天河2号的双精浮点峰值高达54.9Pflops,稳定性能为30.65PFlops,由此可见,“神威太湖之光”在稳定性能是美国超算泰坦的5.2倍(泰坦很可能是美国现在顶尖的超算之一,完成升级的Stampede2性能为18PFlops)。
高效率“神威太湖之光”整机效率高达74.16%,相比较之下,美国超算泰坦的整机效率为65.19%,而河2号的整机效率为55.83%,由于超算性能越强,规模越大,整机效率提升就越困难,“神威太湖之光”在稳定性能是美国超算泰坦5.2倍的情况下,整机效率依然大幅优于泰坦,整机效率之高简直令人惊骇!
低功耗“神威太湖之光”的功耗为15.3 MW,美国超算泰坦功耗为9MW,天河2号为17.8 MW,可以说,“神威太湖之光”的稳定性能达到天河2号3倍的水平,但整机功耗却低于天河2号。
性能功耗比高“神威太湖之光”的性能功耗比高达6G/W,相比之下,TOP500超算榜单上的竞争对手都相形见绌天河2号的整机性能功耗比为1.95G/W,美国泰坦超算的性能功耗比为2.143G/W,美国超算红杉整机性能功耗比为2.069G/W,日本超算“京”整机性能功耗比为0.830/W,美国超算Mira整机性能功耗比为2.069G/W(Mira和红杉用的都是IBM的Power)……即便是全球Green500排行榜,“神威太湖之光”也能排至第三位。由于Green500排行榜第一和第二的超算只采用了低功耗版的Intel E5,性能非常弱,而即便是采用英伟达K80加速卡的超算,其整机性能功耗比也只有4.7G/W。因此,“神威太湖之光”在性能功耗比上显得格外耀眼。
小体积“神威太湖之光”机柜占地605平方米,美国超算泰坦机柜占地面积404平方米,天河2号机柜占地面积720平方米。

曾经刷榜的中国超算
中国有三大超算系列:天河、神威、曙光。三大系列超算分别由国防科大、曙光公司,以及地处江南的某研究所研制,当然,其中也不乏互相协作以及其他单位参与的情况。近年来,中国超算频频刷榜,不仅赚足了眼球,还为中国国防军工以及社会经济发展产生了促进作用。
2009年,中国第一台国产千万亿次超级计算机天河一号在湖南长沙亮相。天河一号超级计算机由国防科大研制,性能为每秒1206万亿次的峰值速度,Linpack实测性能为每秒563.1万亿次,强劲的性能使天河一号位列中国超级计算机前100强之首。2010年,国防科大对天河1号进行了升级,使天河1A的实测运算能力从天河1号的每秒563.1万亿次,提升至2507万亿次,成为当时世界上最快的超级计算机。虽然天河1A使用的是国外芯片14336片Intel Xeon X5670六核处理器,7168片NVIDIA Tesla M2050高性能计算卡,但国防科大在互联网络等方面的技术底蕴颇为不俗。另外,天河1A采用了2048片飞腾 1000八核心处理器。
2010年,曙光6000以实测每秒达1271万亿次的Linpack峰值速度,在2010年第35届全球超级计算机500强排名中名列第二。曙光6000由曙光公司研制,和天河1号一样,曙光6000同样是以国外芯片为主,以国产芯片(龙芯)为辅。
2012年,神威蓝光超级计算机投入使用。虽然该超算并未冲击TOP500前3名,但作为“神威太湖之光”的上一代产品,神威蓝光超算还是值得一书的。神威蓝光超算使用了8704片申威1600,搭载神威睿思操作系统,虽然超算绝对性能并不高,但却是中国在“市场换技术”之后,首次实现了超算CPU和操作系统的全部国产化。神威蓝光超算峰值计算性能为每秒一千万亿次,持续性能为每秒796万亿次,性能功耗比超过741MFlops/W(百万次浮点运算/秒·瓦),LINPACK效率为74%。神威蓝光超算有两大特点,一是全部使用申威1600芯片,搭载神威睿思操作系统,实现操作系统和CPU全部国产化。二是性能功耗比高。神威蓝光超算性能功耗比超过741MFlops/W。该超算被安装在“国家超级计算济南中心”,主要面向气象气候、海洋环境、生物医药、信息安全、航空航天、材料物理、金融分析、工业设计、石油物探等应用领域。