亚洲成色777777女色窝,777亚洲妇女,色吧亚洲日本,亚洲少妇视频

基于CNN和LSTM混合模型的中文詞性標注

摘要:中文詞性標注具有重要的作用,它的準確性和標注速度直接影響到自然語言處理的后續(xù)任務.提出一種基于CNN(convolutional neural network)和LSTM(long-short term memory)混合模型進行中文詞性標注.該模型采用三層結(jié)構(gòu),用詞向量和CNN的滑動窗口特性產(chǎn)生詞語表示特征,LSTM的時序性來產(chǎn)生詞性標注的序列標簽.分別在PFR《人民日報》語料庫、CTB7.0和CoNLL09語料庫上對該模型進行測試,在未加入任何人工特征的條件下,對詞語進行詞性標注,詞性標注效果好于HMM(hidden Markov model)、MLP(multi-layer perceptron)、CNN和LSTM.

關鍵詞:
  • 詞性標注  
  • 卷積神經(jīng)網(wǎng)絡  
  • 長短期記憶  
  • 實驗分析  
作者:
謝逸; 饒文碧; 段鵬飛; 陳振東
單位:
武漢理工大學計算機科學與技術學院; 湖北武漢430070
刊名:
武漢大學學報·理學版

注:因版權方要求,不能公開全文,如需全文,請咨詢雜志社

武漢大學學報·理學版緊跟學術前沿,緊貼讀者,國內(nèi)刊號為:42-1674/N。堅持指導性與實用性相結(jié)合的原則,創(chuàng)辦于1930年,雜志在全國同類期刊中發(fā)行數(shù)量名列前茅。