當(dāng)前位置:首頁 > 科技文檔 > 汽車工業(yè) > 正文

基于運動風(fēng)險的強(qiáng)化學(xué)習(xí)換道決策方法研究

機(jī)械工程學(xué)報 頁數(shù): 15 2025-09-20
摘要: 針對目前換道決策模型在穩(wěn)定性、控制可靠性和場景適應(yīng)性上的不足,提出一種基于運動風(fēng)險的強(qiáng)化學(xué)習(xí)換道決策方法。首先基于換道最小安全距離理論建立運動風(fēng)險模型,以有效整合駕駛場景信息,提高模型訓(xùn)練效率及穩(wěn)定性?;诙鄨鼍暗膹?qiáng)化學(xué)習(xí)換道決策訓(xùn)練模型,以風(fēng)險模型作為智能體的觀測狀態(tài),并設(shè)計回報函數(shù)驅(qū)使智能體生成安全換道決策,然后通過仿真測試,將所設(shè)計的訓(xùn)練模型與普通的決策模型以及傳統(tǒng)的基于... (共15頁)

開通會員,享受整站包年服務(wù)
說明: 本文檔由創(chuàng)作者上傳發(fā)布,版權(quán)歸屬創(chuàng)作者。若內(nèi)容存在侵權(quán),請點擊申訴舉報