面向深度學(xué)習(xí)的數(shù)據(jù)存儲(chǔ)技術(shù)綜述
摘要: 隨著數(shù)據(jù)總量和計(jì)算能力的不斷提升,以深度學(xué)習(xí)和大模型為代表的人工智能技術(shù)獲得了迅速的發(fā)展,并成功應(yīng)用于計(jì)算機(jī)視覺和自然語言處理等領(lǐng)域。然而,隨著GPU等加速器運(yùn)算速度的提高,數(shù)據(jù)存儲(chǔ)已經(jīng)成為了深度學(xué)習(xí)訓(xùn)練和推理的主要瓶頸之一,主要表現(xiàn)為:(1)數(shù)據(jù)集的規(guī)??焖僭鲩L,無法完全緩存在內(nèi)存中;(2)若無額外處理,數(shù)據(jù)集主要由小文件組成。在每輪訓(xùn)練中,訓(xùn)練任務(wù)會(huì)隨機(jī)讀取訓(xùn)練集中的文件;... (共52頁)
開通會(huì)員,享受整站包年服務(wù)