摘要:自然語(yǔ)言處理技術(shù)已用于非結(jié)構(gòu)化中文電子病歷信息抽取,并且新的算法或模型不斷出現(xiàn),但其應(yīng)用效果的證據(jù)較少。共收集北京某大型三甲綜合醫(yī)院呼吸專科住院電子病歷38218份,通過(guò)對(duì)數(shù)據(jù)預(yù)處理,抽象文本特征與定義語(yǔ)法規(guī)則,產(chǎn)生訓(xùn)練數(shù)據(jù)集和測(cè)試集,構(gòu)建層疊條件隨機(jī)場(chǎng)模型,并評(píng)估該模型的識(shí)別效果。結(jié)果表明,針對(duì)入院記錄、出院記錄、輔助檢查報(bào)告3大類共39種非結(jié)構(gòu)化文本,該模型可準(zhǔn)確、快速地處理病歷文本信息,應(yīng)用效果較為理想。
注:因版權(quán)方要求,不能公開(kāi)全文,如需全文,請(qǐng)咨詢雜志社