亚洲成色777777女色窝,777亚洲妇女,色吧亚洲日本,亚洲少妇视频

一種基于雙向LSTM的聯(lián)合學(xué)習(xí)的中文分詞方法

摘要:針對(duì)現(xiàn)有的基于深度學(xué)習(xí)的神經(jīng)網(wǎng)絡(luò)模型通常都是對(duì)單一的語(yǔ)料庫(kù)進(jìn)行訓(xùn)練學(xué)習(xí),提出了一種大規(guī)模的多語(yǔ)料庫(kù)聯(lián)合學(xué)習(xí)的中文分詞方法。語(yǔ)料庫(kù)分別為簡(jiǎn)體中文數(shù)據(jù)集(PKU、MSRA、CTB6)和繁體中文數(shù)據(jù)集(CITYU、AS),每一個(gè)數(shù)據(jù)集輸入語(yǔ)句的句首和句尾分別添加一對(duì)標(biāo)志符。應(yīng)用BLSTM(雙向長(zhǎng)短時(shí)記憶模型)和CRF(條件隨機(jī)場(chǎng)模型)對(duì)數(shù)據(jù)集進(jìn)行單獨(dú)訓(xùn)練和多語(yǔ)料庫(kù)共同訓(xùn)練的實(shí)驗(yàn),結(jié)果表明大規(guī)模的多語(yǔ)料庫(kù)共同學(xué)習(xí)訓(xùn)練能取得良好的分詞效果。

關(guān)鍵詞:
  • 中文分詞  
  • 大規(guī)模語(yǔ)料庫(kù)  
  • 聯(lián)合學(xué)習(xí)  
  • 雙向長(zhǎng)短時(shí)記憶模型  
作者:
章登義; 胡思; 徐愛萍
單位:
武漢大學(xué)計(jì)算機(jī)學(xué)院; 武漢430072
刊名:
計(jì)算機(jī)應(yīng)用研究

注:因版權(quán)方要求,不能公開全文,如需全文,請(qǐng)咨詢雜志社

計(jì)算機(jī)應(yīng)用研究雜志緊跟學(xué)術(shù)前沿,緊貼讀者,國(guó)內(nèi)刊號(hào)為:51-1196/TP。堅(jiān)持指導(dǎo)性與實(shí)用性相結(jié)合的原則,創(chuàng)辦于1984年,雜志在全國(guó)同類期刊中發(fā)行數(shù)量名列前茅。