摘要:主題建模是非常重要的一類文本挖掘方法,被廣泛用于構(gòu)建文本語料庫的主題,但其存在難以解釋和調(diào)整的問題.為了協(xié)助用戶構(gòu)建字典以及幫助用戶理解主題模型并調(diào)節(jié)模型,設(shè)計(jì)并實(shí)現(xiàn)了漸進(jìn)式可視化分析框架,包含2個(gè)可視化工作區(qū):語料庫優(yōu)化可視化工作區(qū),協(xié)助用戶高效構(gòu)建字典;主題模型可視化工作區(qū),提供多尺度信息可視化以輔助用戶理解主題模型并交互地改進(jìn)主題建模.實(shí)現(xiàn)了Web環(huán)境下的交互式可視主題模型系統(tǒng)TMvis,并采用20newsgroups新聞數(shù)據(jù)設(shè)計(jì)了對(duì)照實(shí)驗(yàn),證明了方法的有效性.此外,實(shí)現(xiàn)了針對(duì)豆瓣電影數(shù)據(jù)的案例分析,驗(yàn)證了系統(tǒng)的實(shí)用性.
注:因版權(quán)方要求,不能公開全文,如需全文,請(qǐng)咨詢雜志社