基于穩(wěn)定擴散模型的漢服效果圖生成研究
北京服裝學院學報(自然科學版)
頁數(shù): 8 2024-12-24
摘要: 針對漢服效果圖生成過程中因各朝代服飾特征難以被準確捕捉而造成生成圖像朝代混淆的問題,本文基于穩(wěn)定擴散模型(Stable Diffusion),根據(jù)新輸入的文本提示詞匹配文本與圖像特征空間向量,將V~*作為新標記符號嵌入層,并協(xié)同交叉注意力層參數(shù)W
k和W
v進行聯(lián)合優(yōu)化,最終搜索模型再學習新服飾文本特征后的損失函數(shù)最小值。通過查閱文獻史料,收集整理并新增了唐、宋、明3個朝代16... (共8頁)