基于共享GPU的深度學(xué)習(xí)訓(xùn)練性能實(shí)證研究
計(jì)算機(jī)應(yīng)用與軟件
頁(yè)數(shù): 7 2022-12-12
摘要: 深度學(xué)習(xí)應(yīng)用的訓(xùn)練過(guò)程是計(jì)算密集型的,它通常依靠圖形處理單元(Graphics Processing Unit, GPU)來(lái)加速訓(xùn)練過(guò)程。然而深度學(xué)習(xí)開(kāi)發(fā)框架往往會(huì)獨(dú)占GPU,造成計(jì)算資源的浪費(fèi)。針對(duì)該問(wèn)題,該實(shí)證研究對(duì)兩個(gè)深度學(xué)習(xí)應(yīng)用共享GPU訓(xùn)練的可行性進(jìn)行討論,系統(tǒng)地分析了有代表性的深度學(xué)習(xí)模型的靜態(tài)和運(yùn)行時(shí)特性,展示了共享GPU訓(xùn)練兩個(gè)模型時(shí),不同的模型組合和特征對(duì)整體... (共7頁(yè))