跨模態(tài)交互學(xué)習(xí)與迭代融合的3D視覺定位
摘要: 針對(duì)現(xiàn)有3D視覺定位方法存在的對(duì)單一模態(tài)信息依賴過強(qiáng)、視角變化適應(yīng)性差以及跨模態(tài)特征融合效果有限的問題,提出了一種跨模態(tài)交互學(xué)習(xí)與迭代融合的3D視覺定位方法。該方法包括多模態(tài)特征提取與跨模態(tài)特征融合兩個(gè)階段。在特征提取階段,分別采用點(diǎn)云編碼器和文本編碼器提取點(diǎn)云與文本特征,并引入點(diǎn)云的類別信息;在特征融合階段,設(shè)計(jì)基于Transformer的點(diǎn)云特征增強(qiáng)模塊,以提升點(diǎn)云特征的表... (共16頁)
開通會(huì)員,享受整站包年服務(wù)