亚洲成色777777女色窝,777亚洲妇女,色吧亚洲日本,亚洲少妇视频

基于加權(quán)關(guān)聯(lián)模式挖掘與規(guī)則后件擴(kuò)展的跨語言信息檢索

摘要:【目的】針對自然語言處理中查詢主題漂移和詞不匹配問題,提出一種基于加權(quán)關(guān)聯(lián)模式挖掘和規(guī)則后件擴(kuò)展的跨語言信息檢索模型及其算法?!痉椒ā吭撃P筒捎眯碌募訖?quán)關(guān)聯(lián)模式支持度和基于最大項目權(quán)值的項集剪枝策略挖掘頻繁項集,利用置信度和相關(guān)度評價加權(quán)關(guān)聯(lián)規(guī)則,根據(jù)擴(kuò)展模型從規(guī)則中提取優(yōu)質(zhì)擴(kuò)展詞實現(xiàn)規(guī)則后件擴(kuò)展,擴(kuò)展詞與原查詢詞項組合為新查詢再次檢索文檔得到最終檢索結(jié)果。【結(jié)果】實驗結(jié)果表明,與單語言檢索基準(zhǔn)比較,本文檢索模型的R-prec和P@10平均增幅分別為42.49%和25.53%;與跨語言檢索基準(zhǔn)比較,其平均增幅分別為91.87%和64.61%;與現(xiàn)有基于加權(quán)關(guān)聯(lián)規(guī)則挖掘的跨語言檢索方法比較,R-prec和P@10最高平均增幅分別可達(dá)93.20%和34.60%。【局限】只進(jìn)行實驗性研究,需要探討在實際跨語言搜索引擎中的具體應(yīng)用。【結(jié)論】本文檢索模型能有效地減少查詢主題漂移和詞不匹配問題,改善和提高檢索性能。

關(guān)鍵詞:
  • 信息檢索  
  • 跨語言檢索  
  • 文本挖掘  
  • 關(guān)聯(lián)規(guī)則  
  • 自然語言處理  
作者:
黃名選; 盧守東; 徐輝
單位:
廣西財經(jīng)學(xué)院廣西(東盟)財經(jīng)研究中心; 南寧530003; 廣西跨境電商智能信息處理重點實驗室(廣西財經(jīng)學(xué)院); 南寧530003; 廣西財經(jīng)學(xué)院信息與統(tǒng)計學(xué)院; 南寧530003
刊名:
數(shù)據(jù)分析與知識發(fā)現(xiàn)

注:因版權(quán)方要求,不能公開全文,如需全文,請咨詢雜志社

數(shù)據(jù)分析與知識發(fā)現(xiàn)雜志緊跟學(xué)術(shù)前沿,緊貼讀者,國內(nèi)刊號為:10-1478/G2。堅持指導(dǎo)性與實用性相結(jié)合的原則,創(chuàng)辦于1980年,雜志在全國同類期刊中發(fā)行數(shù)量名列前茅。