針對SW26010眾核處理器的單精度矩陣乘算法
小型微型計算機系統(tǒng)
頁數(shù): 9 2022-02-14
摘要: 矩陣乘作為許多科學應用中被頻繁使用的關鍵部分,其計算量巨大且稠密的本質(zhì),使得高性能計算領域中矩陣乘并行算法的研究一直是經(jīng)久不衰的熱門話題.隨著我國自主研發(fā)的申威眾核處理器SW26010在科學計算和人工智能領域的快速發(fā)展,對面向SW26010眾核處理器的高性能矩陣乘算法提出了迫切的需求.針對SW26010眾核處理器的體系結構特征,首次對單精度矩陣乘實現(xiàn)進行了深入探討,提出了3種不... (共9頁)