多模態(tài)信息引導(dǎo)的三維數(shù)字人運(yùn)動(dòng)生成綜述
中國圖象圖形學(xué)報(bào)
頁數(shù): 25 2024-09-16
摘要: 基于多模態(tài)信息的三維數(shù)字人運(yùn)動(dòng)生成技術(shù)旨在通過文本、音頻、圖像和視頻等數(shù)據(jù)實(shí)現(xiàn)特定輸入條件下的人體運(yùn)動(dòng)生成。這項(xiàng)技術(shù)在電影、動(dòng)畫、游戲制作和元宇宙等領(lǐng)域具有重要的應(yīng)用價(jià)值和廣泛的經(jīng)濟(jì)社會(huì)效益,是近年來計(jì)算機(jī)圖形學(xué)和計(jì)算機(jī)視覺等領(lǐng)域研究的熱點(diǎn)問題之一。然而,基于多模態(tài)信息的三維數(shù)字人運(yùn)動(dòng)生成面臨著諸多挑戰(zhàn),包括跨模態(tài)信息的表征和融合困難、高質(zhì)量數(shù)據(jù)集缺乏、生成的運(yùn)動(dòng)質(zhì)量較差(如抖... (共25頁)