基于鯤鵬和昇騰異構(gòu)平臺的單節(jié)點HPL-AI設計與優(yōu)化
華南理工大學學報(自然科學版)
頁數(shù): 10 2024-02-15
摘要: 鑒于低精度浮點運算擁有更快的運算速度,越來越多的高性能應用采用混合精度方案進行加速,而同樣采用該方案來加速的AI(人工智能)大模型也受到廣泛關注。最近,HPL-AI(High Performance LINPACK for Accelerator Introspection)基準測試被提出,用于評估高性能系統(tǒng)的混合精度運算性能。針對該基準測試,本研究在鯤鵬和昇騰異構(gòu)平臺上設計并... (共10頁)