摘要:詞性標注是自然語言處理的基礎(chǔ)研究,應(yīng)用的領(lǐng)域十分廣泛?;谵D(zhuǎn)換的錯誤驅(qū)動學(xué)習(xí)詞性標注是一種基于規(guī)則的算法,但由于此算法占用大量的計算機資源進行規(guī)則的提取,從而造成算法本身偏慢的問題。文章在原有算法的基礎(chǔ)上,跳過那些對語料庫的標注不夠明顯的規(guī)則,尋找應(yīng)用最好的轉(zhuǎn)換規(guī)則,使語料庫錯誤標注降到最低,從而達到標注的目的。
注:因版權(quán)方要求,不能公開全文,如需全文,請咨詢雜志社