基于批量LU分解的矩陣求逆在GPU上的有效實現(xiàn)
軟件學(xué)報
頁數(shù): 21 2023-05-19
摘要: 給出批量矩陣的LU分解和批量求逆算法在GPU上實現(xiàn)及優(yōu)化方法.針對批量LU分解問題,分析Leftlooking和Right-looking等常用LU分解塊算法在GPU上實現(xiàn)時對全局內(nèi)存的數(shù)據(jù)讀寫次數(shù),針對GPU架構(gòu)特點,選擇具有較少訪存數(shù)據(jù)量的Left-looking塊算法.在LU分解的選主元過程,采用適合GPU架構(gòu)的并行二叉樹搜索算法.此外,為了降低選主元引起的行交換過程對算... (共21頁)