【資料圖】
NVIDIA的H100加速卡在AI爆火之后炙手可熱,售價超過25萬元依然供不應(yīng)求。而它的性能也非??鋸垼钚碌腁I測試中全面刷新記錄,基于GPT-3的大語言模型訓(xùn)練任務(wù)紀(jì)錄已經(jīng)被刷至11分鐘。
機器學(xué)習(xí)及人工智能領(lǐng)域開放產(chǎn)業(yè)聯(lián)盟MLCommons公布了最新的MLPerf基準(zhǔn)評測,其中包括8個負(fù)載測試,LLM大語言模型中就有基于GPT-3開源模型的,很考驗平臺的AI性能。
參與測試的NVIDIA平臺由896個Intel至強8462Y+處理器和3584個H100加速卡組成,是所有平臺中唯一跑完所有測試的,而且刷新了記錄。
在關(guān)鍵的基于GPT-3的大語言模型訓(xùn)練任務(wù)中,H100平臺只用了10.94分鐘,可以對比的是Intel平臺,由96個至強8380處理器和96個Habana Gaudi2 AI芯片構(gòu)建的系統(tǒng)中,完成同樣測試的時間為311.94分鐘。
H100平臺的性能幾乎是30倍于Intel平臺,當(dāng)然兩套平臺的規(guī)模相差也很大,但只用768個H100加速卡的話,訓(xùn)練時間也只要45.6分鐘,依然遠(yuǎn)超Intel平臺的AI芯片。
關(guān)鍵詞:
質(zhì)檢
推薦