摘要:【目的】針對自然語言處理中查詢主題漂移和詞不匹配問題,提出一種基于加權(quán)關(guān)聯(lián)模式挖掘和規(guī)則后件擴(kuò)展的跨語言信息檢索模型及其算法?!痉椒ā吭撃P筒捎眯碌募訖?quán)關(guān)聯(lián)模式支持度和基于最大項目權(quán)值的項集剪枝策略挖掘頻繁項集,利用置信度和相關(guān)度評價加權(quán)關(guān)聯(lián)規(guī)則,根據(jù)擴(kuò)展模型從規(guī)則中提取優(yōu)質(zhì)擴(kuò)展詞實現(xiàn)規(guī)則后件擴(kuò)展,擴(kuò)展詞與原查詢詞項組合為新查詢再次檢索文檔得到最終檢索結(jié)果。【結(jié)果】實驗結(jié)果表明,與單語言檢索基準(zhǔn)比較,本文檢索模型的R-prec和P@10平均增幅分別為42.49%和25.53%;與跨語言檢索基準(zhǔn)比較,其平均增幅分別為91.87%和64.61%;與現(xiàn)有基于加權(quán)關(guān)聯(lián)規(guī)則挖掘的跨語言檢索方法比較,R-prec和P@10最高平均增幅分別可達(dá)93.20%和34.60%。【局限】只進(jìn)行實驗性研究,需要探討在實際跨語言搜索引擎中的具體應(yīng)用。【結(jié)論】本文檢索模型能有效地減少查詢主題漂移和詞不匹配問題,改善和提高檢索性能。
注:因版權(quán)方要求,不能公開全文,如需全文,請咨詢雜志社