摘要:【目的】針對(duì)短文本分類(lèi)中的內(nèi)容稀疏問(wèn)題,提出一種基于類(lèi)別特征擴(kuò)展的短文本分類(lèi)方法?!痉椒ā渴褂酶倪M(jìn)后的TF-IDF模型以及LDA主題模型構(gòu)建基于類(lèi)別特征的關(guān)鍵詞集與主題分布集,完成對(duì)短文本內(nèi)容及詞匯向量表征上的擴(kuò)充,并在此基礎(chǔ)上通過(guò)卷積神經(jīng)網(wǎng)絡(luò)對(duì)短文本分類(lèi)。【結(jié)果】實(shí)驗(yàn)結(jié)果表明,基于類(lèi)別特征擴(kuò)展后的短文本在分類(lèi)的準(zhǔn)確率上提升3%,在召回率上提升4.1%。【局限】?jī)H使用卷積神經(jīng)網(wǎng)絡(luò)進(jìn)行驗(yàn)證?!窘Y(jié)論】基于類(lèi)別特征擴(kuò)展的短文本分類(lèi)方法能夠克服短文本分類(lèi)中的內(nèi)容稀疏問(wèn)題,提高短文本分類(lèi)的性能。
注:因版權(quán)方要求,不能公開(kāi)全文,如需全文,請(qǐng)咨詢(xún)雜志社