123,123

7.3 三種模型的訓(xùn)練過程及結(jié)果分析

CRF模型操作起來比較簡單,對GPU性能要求不高,但為了保證比較結(jié)果的公平性,我們同樣選用了上文中介紹過的實(shí)驗(yàn)環(huán)境。首先安裝好crf++工具包,打開CRF訓(xùn)練文件的文件夾,將處理好準(zhǔn)備訓(xùn)練和測試的語料移到該文件夾目錄下。模板文件...[繼續(xù)閱讀]

知識挖掘的平行句法語料庫

字?jǐn)?shù)： 4500

命/n 曰/v 首/nrx 仰/v 足/nrx 肣/v 外/n 高/v 內(nèi)/n 下/v。/w 卜/v 有/v 憂/n,/w 無/v 傷/n 也/u。/w 行者/nrx 不/d 來/v。/w 病/n 久/v 死/v。/w 求/v 財(cái)物/n 不/d 得/v。/w 見/v 貴人/nrx 者/r 吉/v。/w 命/n 曰/v 外/n 高/v 內(nèi)/n 下/v。/w 卜/v 病/n 不/d 死/v,/w 有...[繼續(xù)閱讀]

知識挖掘的平行句法語料庫

字?jǐn)?shù)： 41461

第5章詞性級的古白平行語料庫構(gòu)建及分析研究

要進(jìn)行詞性標(biāo)注,首先碰到兩個問題:一是標(biāo)記集如何確定,二是如何處理詞語的兼類。在詞性標(biāo)記集已經(jīng)確定的情況下,如果一個詞只有一個詞性,當(dāng)然就直接標(biāo)上該詞性標(biāo)記,如果一個詞在詞典中有兩個及兩個以上的詞性,就會面臨選擇...[繼續(xù)閱讀]

知識挖掘的平行句法語料庫

字?jǐn)?shù)： 298

4.2.3 基于人工智能技術(shù)——模擬分詞

基于人工智能技術(shù)——模擬分詞的過程是模擬人類大腦對分詞的思考方式,嘗試將人類對語言的了解和認(rèn)知過程通過數(shù)字化的模型進(jìn)行描繪。使用該算法對大腦進(jìn)行模擬,然后對相關(guān)模型構(gòu)建進(jìn)行操作,在神經(jīng)網(wǎng)絡(luò)內(nèi)部注入分詞知識的...[繼續(xù)閱讀]

知識挖掘的平行句法語料庫

字?jǐn)?shù)： 2224

8.4.5 模型應(yīng)用

在本章獲得的序號8的Bi-LSTM模型基礎(chǔ)上,可以使用該模型對其他先秦典籍問句快速且較為準(zhǔn)確地識別其類別。本章利用開發(fā)的平臺,可將輸入的問句進(jìn)行分類,具體的平臺功能如圖8-6所示。圖8-6 先秦典籍問句自動分類展示根據(jù)圖8-6,將待...[繼續(xù)閱讀]

知識挖掘的平行句法語料庫

字?jǐn)?shù)： 351

5.2.4 古文詞性自動標(biāo)注模型的構(gòu)建與評價(jià)

同樣,為了獲得性能指標(biāo)最好的古文詞性自動標(biāo)注模型,本文對古文語料庫進(jìn)行了與白話文語料庫相同的操作,得到10組古文測試結(jié)果(Acc)、準(zhǔn)確率(P)、召回率(R)、調(diào)和平均值(F)作為模型精度的判斷標(biāo)準(zhǔn),并作為當(dāng)前十折交叉驗(yàn)證下該模型...[繼續(xù)閱讀]

知識挖掘的平行句法語料庫

字?jǐn)?shù)： 1430

6.3.1 人名自動識別模型的應(yīng)用結(jié)果

基于上述構(gòu)建的古漢語和白話文人名自動識別模型和古漢語詞性人名自動識別模型,分別對《史記》中未進(jìn)行人名識別的空白語料進(jìn)行人名實(shí)體的識別,以驗(yàn)證該模型在相似語料上的性能。表6-19為古文的應(yīng)用結(jié)果示例,表6-20為白話文的...[繼續(xù)閱讀]

知識挖掘的平行句法語料庫

字?jǐn)?shù)： 2538

5.1.4 基于深度學(xué)習(xí)的詞性標(biāo)注

在深度學(xué)習(xí)技術(shù)成熟之前,機(jī)器學(xué)習(xí)主要使用的算法建模是帶有一層或是沒有隱形節(jié)點(diǎn)的建模,如條件隨機(jī)場、支持向量機(jī)及最大熵模型等。這些帶有一層或是沒有隱形節(jié)點(diǎn)的建模在面對結(jié)構(gòu)復(fù)雜的數(shù)據(jù)泛化問題時,能力十分有限[1]。...[繼續(xù)閱讀]

知識挖掘的平行句法語料庫

字?jǐn)?shù)： 691

附件四史部典籍人名標(biāo)注語料

舉【風(fēng)后】【力牧】【常先】【大鴻】以治民。順天地之紀(jì),幽明之占,死生之說,存亡之難。時播百谷草木,淳化鳥獸蟲蛾,旁羅日月星辰水波土石金玉,勞勤心力耳目,節(jié)用水火材物。有土德之瑞,故號【黃帝】?！军S帝】二十五子,其得...[繼續(xù)閱讀]

知識挖掘的平行句法語料庫

字?jǐn)?shù)： 26690

5.2.5 最佳模型在相似語料上的性能測試

基于上文所構(gòu)建的白話文詞性自動標(biāo)注最佳模型和古文詞性自動標(biāo)注最佳模型,分別對測試語料中未進(jìn)行詞性標(biāo)注的白話文和古文進(jìn)行詞性標(biāo)注,以驗(yàn)證最佳模型在相似語料上的性能。測試語料的標(biāo)注結(jié)果樣例如圖5-2所示:圖5-2 古文...[繼續(xù)閱讀]

知識挖掘的平行句法語料庫

字?jǐn)?shù)： 356

7.3 三種模型的訓(xùn)練過程及結(jié)果分析

附件三 史部典籍詞性標(biāo)注語料

第5章 詞性級的古白平行語料庫構(gòu)建及分析研究

4.2.3 基于人工智能技術(shù)——模擬分詞

8.4.5 模型應(yīng)用

5.2.4 古文詞性自動標(biāo)注模型的構(gòu)建與評價(jià)

6.3.1 人名自動識別模型的應(yīng)用結(jié)果

5.1.4 基于深度學(xué)習(xí)的詞性標(biāo)注

附件四 史部典籍人名標(biāo)注語料

5.2.5 最佳模型在相似語料上的性能測試

附件三史部典籍詞性標(biāo)注語料

第5章詞性級的古白平行語料庫構(gòu)建及分析研究

附件四史部典籍人名標(biāo)注語料