亚洲成色777777女色窝,777亚洲妇女,色吧亚洲日本,亚洲少妇视频

基于類(lèi)別特征擴(kuò)展的短文本分類(lèi)方法研究

摘要:【目的】針對(duì)短文本分類(lèi)中的內(nèi)容稀疏問(wèn)題,提出一種基于類(lèi)別特征擴(kuò)展的短文本分類(lèi)方法?!痉椒ā渴褂酶倪M(jìn)后的TF-IDF模型以及LDA主題模型構(gòu)建基于類(lèi)別特征的關(guān)鍵詞集與主題分布集,完成對(duì)短文本內(nèi)容及詞匯向量表征上的擴(kuò)充,并在此基礎(chǔ)上通過(guò)卷積神經(jīng)網(wǎng)絡(luò)對(duì)短文本分類(lèi)。【結(jié)果】實(shí)驗(yàn)結(jié)果表明,基于類(lèi)別特征擴(kuò)展后的短文本在分類(lèi)的準(zhǔn)確率上提升3%,在召回率上提升4.1%。【局限】?jī)H使用卷積神經(jīng)網(wǎng)絡(luò)進(jìn)行驗(yàn)證?!窘Y(jié)論】基于類(lèi)別特征擴(kuò)展的短文本分類(lèi)方法能夠克服短文本分類(lèi)中的內(nèi)容稀疏問(wèn)題,提高短文本分類(lèi)的性能。

關(guān)鍵詞:
  • 詞向量  
  • lda  
  • 模型  
  • 卷積神經(jīng)網(wǎng)絡(luò)  
  • 短文本分類(lèi)  
作者:
邵云飛; 劉東蘇
單位:
西安電子科技大學(xué)經(jīng)濟(jì)與管理學(xué)院; 西安710126
刊名:
數(shù)據(jù)分析與知識(shí)發(fā)現(xiàn)

注:因版權(quán)方要求,不能公開(kāi)全文,如需全文,請(qǐng)咨詢(xún)雜志社

數(shù)據(jù)分析與知識(shí)發(fā)現(xiàn)雜志緊跟學(xué)術(shù)前沿,緊貼讀者,國(guó)內(nèi)刊號(hào)為:10-1478/G2。堅(jiān)持指導(dǎo)性與實(shí)用性相結(jié)合的原則,創(chuàng)辦于1980年,雜志在全國(guó)同類(lèi)期刊中發(fā)行數(shù)量名列前茅。