摘要:自然語言處理技術(shù)已用于非結(jié)構(gòu)化中文電子病歷信息抽取,并且新的算法或模型不斷出現(xiàn),但其應(yīng)用效果的證據(jù)較少。共收集北京某大型三甲綜合醫(yī)院呼吸專科住院電子病歷38218份,通過對數(shù)據(jù)預(yù)處理,抽象文本特征與定義語法規(guī)則,產(chǎn)生訓(xùn)練數(shù)據(jù)集和測試集,構(gòu)建層疊條件隨機場模型,并評估該模型的識別效果。結(jié)果表明,針對入院記錄、出院記錄、輔助檢查報告3大類共39種非結(jié)構(gòu)化文本,該模型可準確、快速地處理病歷文本信息,應(yīng)用效果較為理想。
注:因版權(quán)方要求,不能公開全文,如需全文,請咨詢雜志社