大語言模型中的差分隱私保護(hù)研究
摘要: 為提高大語言模型中的差分隱私保護(hù)的隱私性和效用性,提出一種基于效用機(jī)制優(yōu)化的差分隱私模型。首先構(gòu)建了大語言模型中的差分隱私保護(hù)方法框架;然后分別從敏感檢測器和效用優(yōu)化機(jī)制方面,對大語言模型中的差分隱私保護(hù)方法進(jìn)行設(shè)計(jì);最后以Claude 3.5大語言模型為例,驗(yàn)證本方法對大語言模型中的差分隱私保護(hù)效果。結(jié)果表明,本方法的平均反攻擊成功率、推理準(zhǔn)確率、精確率、運(yùn)行時(shí)間分別為93.... (共7頁)
開通會(huì)員,享受整站包年服務(wù)