摘要:為了提高文本情感傾向性分類的精度,提出了一種文本情感傾向性分析方法 bfsmPMI-SVM.該方法在文本預(yù)處理階段,濾除了對表述主題情感傾向性不強(qiáng)烈的語句以及無關(guān)停用詞等;用改進(jìn)的PMI-IR算法對情感傾向性詞語抽取,并自動擴(kuò)充了正負(fù)基準(zhǔn)詞集;改進(jìn)了互信息(MI)算法,在MI的計算中增加了詞頻因子(f)、類別差異因子(b)和符號因子(s).利用改進(jìn)的MI算法選擇文本特征,融合其他一些文本特征,用SVM實(shí)現(xiàn)文本情感傾向性分類.實(shí)驗(yàn)以食品安全領(lǐng)域爬取文本為例,與PMI-IR-SVM和MI-SVM算法的傾向分析相比,本文方法的正向文本準(zhǔn)確率、負(fù)向文本準(zhǔn)確率、召回率和F1值等都有提高.
注:因版權(quán)方要求,不能公開全文,如需全文,請咨詢雜志社