融合多策略的中文科技文獻(xiàn)機(jī)構(gòu)名稱規(guī)范化研究與實(shí)踐
醫(yī)學(xué)信息學(xué)雜志
頁(yè)數(shù): 7 2022-12-25
摘要: 分析中文科技文獻(xiàn)中機(jī)構(gòu)著錄項(xiàng)的組織特點(diǎn)和中文機(jī)構(gòu)名稱的命名特點(diǎn),詳細(xì)闡述常見(jiàn)機(jī)構(gòu)名稱規(guī)范化方法、中文科技文獻(xiàn)機(jī)構(gòu)名稱規(guī)范化處理流程,提出利用字符串匹配詞典和規(guī)則過(guò)濾等方法提取規(guī)范化的機(jī)構(gòu)名稱,并基于機(jī)構(gòu)-作者共現(xiàn)關(guān)系,計(jì)算作者共現(xiàn)率,結(jié)合絕對(duì)共現(xiàn)量和共現(xiàn)率閾值實(shí)現(xiàn)機(jī)構(gòu)實(shí)體的消歧,能夠有效匹配同一機(jī)構(gòu)的不同表現(xiàn)形式。