基于知識(shí)圖譜與全局上下文注意的圖像描述生成模型
摘要: 針對(duì)當(dāng)前大多數(shù)圖像描述模型僅利用圖像內(nèi)容推理生成圖像描述而導(dǎo)致描述內(nèi)容缺失、準(zhǔn)確性差的問(wèn)題,通過(guò)引入知識(shí)圖譜增強(qiáng)生成字幕的語(yǔ)義完整性,利用全局上下文信息約束進(jìn)一步增加生成描述的準(zhǔn)確性,提出一種基于知識(shí)圖譜與全局上下文注意的圖像描述模型。通過(guò)利用知識(shí)圖譜,將外部知識(shí)編碼到模型當(dāng)中,提高生成初始語(yǔ)義信息的完整性;從初始的完整描述中獲取全局上下文信息,利用上下文信息進(jìn)一步約束指導(dǎo)最終... (共7頁(yè))
開(kāi)通會(huì)員,享受整站包年服務(wù)