8月15日,在蘇州舉行的2020全球人工智能產(chǎn)品應(yīng)用博覽會(AIExpo2020)上,浪潮發(fā)布人工智能服務(wù)器NF5488A5。在前不久公布的全球權(quán)威AI測試榜單MLPerf中,浪潮NF5488A5僅用時33.37分鐘,就在包含128萬張圖片的ImageNet數(shù)據(jù)集上完成Resnet50模型的訓(xùn)練,相當于每秒訓(xùn)練23000多張圖片,單機計算性能高居第一,可謂最快人工智能訓(xùn)練服務(wù)器。
MLPerf是國際權(quán)威的AI測試,2018年由圖靈獎得主Patterson聯(lián)合谷歌、哈佛、斯坦福等發(fā)起,每年發(fā)布訓(xùn)練和推理兩次基準測試榜單。今年的MLPerf訓(xùn)練測試包含8個主流人工智能模型,涉及計算機視覺、自然語言理解、推薦模型和強化學習4個領(lǐng)域。浪潮NF5488A5人工智能服務(wù)器除了在Resenet50中取得榜首外,還在人工智能自然語言理解Transformer、神經(jīng)網(wǎng)絡(luò)翻譯系統(tǒng)GNMT、深度學習推薦模型DLRM、目標監(jiān)測算法SSD等MLPerf的模型訓(xùn)練評估中均取得不俗成績。
NF5488A5是浪潮自研的新一代AI服務(wù)器,單機訓(xùn)練性能可達5 PetaOPS,相比上一代服務(wù)器計算性能提升234%。兩年前Facebook的科學家用32臺GPU服務(wù)器、256塊GPU花了1個小時完成了ImageNet上的Resnet50訓(xùn)練,而現(xiàn)在僅需一臺NF5488A5,即可在33分鐘完成同樣的訓(xùn)練,單臺設(shè)備訓(xùn)練效率提升近60倍。同時,浪潮優(yōu)化了NF5488A5的拓撲結(jié)構(gòu),采用NUMA綁定策略,可實現(xiàn)CPU與最近GPU的指定通信,大幅提升CPU與GPU之間的數(shù)據(jù)傳輸效率,實現(xiàn)更低的數(shù)據(jù)傳輸延遲和更高的帶寬,滿足各種AI負載高效數(shù)據(jù)通信需求。
(美通社,2020年8月18日北京)