摘要:為從海量微博中高效地獲取不同話題下的關(guān)鍵信息,微博觀點(diǎn)摘要成為自然語言處理領(lǐng)域近期研究的熱點(diǎn)之一?;€方法基于TF.IDF算法抽取微博句中的關(guān)鍵詞,并據(jù)此計(jì)算微博的重要性分?jǐn)?shù),直接篩選出觀點(diǎn)摘要;樸素改進(jìn)方法在基線方法的基礎(chǔ)上,增加了情感分類步驟,并利用微博句之間的語義距離,將摘要句候選集中語義重復(fù)、重要度較小的句子去除,生成觀點(diǎn)摘要;基于語義圖優(yōu)化算法的方法在樸素改進(jìn)方法的基礎(chǔ)上,利用微博句的重要性分?jǐn)?shù)及微博句之間的語義距離構(gòu)建語義圖結(jié)構(gòu),并通過圖優(yōu)化算法篩選出觀點(diǎn)摘要。樸素改進(jìn)方法在COAE2016評(píng)測任務(wù)一測試數(shù)據(jù)集上,10個(gè)話題的平均ROUGE-1值達(dá)到26.39%,平均ROUGE-2值達(dá)到0.68%,平均ROUGE-SU4值達(dá)到5.69%,且評(píng)測官方公布結(jié)果顯示,該方法在9項(xiàng)評(píng)價(jià)指標(biāo)中獲得6項(xiàng)最佳性能?;谡Z義圖優(yōu)化算法的方法在評(píng)測樣例數(shù)據(jù)集上進(jìn)行了實(shí)驗(yàn),結(jié)果顯示,該方法比樸素改進(jìn)方法在ROUGE-1,ROUGE-2,ROUGE—SU4值上分別提升了0.63%,1.51%,2.69%。
注:因版權(quán)方要求,不能公開全文,如需全文,請(qǐng)咨詢雜志社