摘要:【目的】比較不同機器學習算法在智能分診任務(wù)中的準確率,針對性地分析在線問診平臺的類目設(shè)置問題,嘗試從數(shù)據(jù)中提取新特征提升分類器效果?!痉椒ā炕凇按河赆t(yī)生”13個科室33 073條實際問診數(shù)據(jù),比較兩種文本向量化方式在支持向量機、多項式貝葉斯、Logistic回歸、隨機森林、k近鄰以及集成分類模型這6種分類器上實現(xiàn)智能分診的準確率;通過高頻詞分析及詞語共現(xiàn)對不同科室的錯分數(shù)據(jù)進一步分析?!窘Y(jié)果】文本向量化方法為TF-IDF、分類算法為支持向量機的分類器在智能分診中的總體效果最優(yōu),增加年齡和性別特征后分類準確率可達76.3%。該分類器對外科數(shù)據(jù)分診準確率僅為40.9%,原因在于問診平臺類目設(shè)置的混淆?!揪窒蕖考僭O(shè)現(xiàn)有數(shù)據(jù)中患者選擇的科室是正確的。【結(jié)論】機器學習可用于在線問診平臺的智能分診任務(wù),根據(jù)醫(yī)療數(shù)據(jù)特點增加輸入特征是分類器提高準確率的一個方向。部分疾病及癥狀的跨科室性影響了分類器的效果,在線問診平臺可通過推薦多個科室的方式來提升患者問診體驗。
注:因版權(quán)方要求,不能公開全文,如需全文,請咨詢雜志社