11月19日,在世界超算界的顶级盛会SC20期间,多名国际专家联合发布了新一期IO500榜单。鹏城实验室等单位联合研制的“鹏城云脑II”分别以7043.99和1129.75的得分,位居IO500总榜榜首和10节点榜单榜首。这是国内系统首次占据该榜单榜首位置。

据了解,在大规模算力系统设计中,存储系统的性能日益受到关注。IO500榜单是高性能计算领域针对存储性能最权威的世界排行榜之一。自2017年11月开始,IO500榜单在高性能计算领域的顶级会议(美国的SC和德国的ISC大会)上发布。

为证明“鹏城云脑II”项目的世界级先进算力,鹏城实验室、清华大学和华为技术有限公司共同开展IO500测试工作。对系统软硬件性能进行了极限测试,包括数据带宽BW(GiB/S)和元数据性能MD(KIOP/S)两大部分,需要具有各种规模下的良好扩展性和稳定性。

本次“鹏城云脑II”的存储系统基于清华大学计算机系开发的超算缓存文件系统MadFS研制,针对“鹏城云脑II”的硬件特征,提出了基于RUST语言的高可扩展并发访问、大粒度数据缓存/旁路访问、数据访问/落盘流水化、零拷贝极速RPC处理技术等创新方法。

IO500的两项桂冠反映了“鹏城云脑II”面向实际应用的设计原则。不但全系统得分四倍于上届冠军,实现大幅度超越,在小规模数据吞吐的10节点榜单上,得分也超过上届冠军近一半,成为首个10节点得分超过1000分的系统。这意味着对于各种规模的人工智能应用,“鹏城云脑II”均能提供世界领先的数据吞吐能力和顶级算力。据悉,“鹏城云脑II”于2020年10月建成试运行,拥有超过1000P OPS的人工智能算力,即将服务于从基础研究到产业赋能的广泛领域。

公开资料显示,“鹏城云脑Ⅱ”系统的AI计算子系统包含4096颗AI处理器,提供理论上1E OPS FP16和2E OPS INT8的AI运算能力。通用算力由基于ARM架构的2048颗CPU组成,每个CPU提供不少于0.49T Flops的通用算力。