當(dāng)前位置:首頁 > 科技文檔 > 汽車工業(yè) > 正文

基于改進人類反饋強化學(xué)習(xí)的端到端自動駕駛決策模型

汽車工程 頁數(shù): 13 2026-01-25
摘要: 端到端自動駕駛是智能汽車領(lǐng)域的最新研究熱點,現(xiàn)有研究大多采用人工設(shè)計的強化學(xué)習(xí)獎勵函數(shù),在復(fù)雜駕駛環(huán)境中存在學(xué)習(xí)效率和泛化能力提升的瓶頸。針對該問題,本文提出了一種基于改進人類反饋強化學(xué)習(xí)的端到端自動駕駛建模方法。首先,構(gòu)建了采用響應(yīng)比估計方法簡化人類偏好的自動化獎勵反饋,提高了駕駛策略的邏輯性、降低了人工設(shè)計成本;其次,設(shè)計了獎勵函數(shù)預(yù)訓(xùn)練優(yōu)化方法,通過學(xué)習(xí)初期對先驗知識的嵌... (共13頁)

開通會員,享受整站包年服務(wù)
說明: 本文檔由創(chuàng)作者上傳發(fā)布,版權(quán)歸屬創(chuàng)作者。若內(nèi)容存在侵權(quán),請點擊申訴舉報