亚洲成色777777女色窝,777亚洲妇女,色吧亚洲日本,亚洲少妇视频

基于Ad-Sim算法的代碼克隆檢測方法

摘要:代碼克隆檢測在代碼抄襲檢測、代碼審查、軟件更迭和錯誤檢測等方面有重要作用。為提高代碼克隆檢測的準(zhǔn)確率,結(jié)合TF-IDF及馬爾科夫模型提出了一種改進(jìn)的Simhash算法Ad-Sim。該算法首先對代碼進(jìn)行歸一化預(yù)處理;其次在Simhash計算指紋簽名的過程中使用TF-IDF計算各關(guān)鍵詞權(quán)重,并利用馬爾科夫模型優(yōu)化關(guān)鍵詞權(quán)重;最后比較待檢測代碼指紋簽名的漢明距離相似度,從而判斷待檢測代碼是否為克隆代碼。實驗結(jié)果表明:Ad-Sim算法在代碼克隆檢測上的準(zhǔn)確率及召回率相比Simhash有所提升,尤其在少量代碼的檢測準(zhǔn)確率上提升更明顯。

關(guān)鍵詞:
  • simhash  
  • 漢明距離  
  • 馬爾科夫模型  
作者:
王衛(wèi)紅; 谷永亮; 毛怡偉; 張政豪
單位:
浙江工業(yè)大學(xué)計算機(jī)科學(xué)與技術(shù)學(xué)院; 浙江杭州310023
刊名:
浙江工業(yè)大學(xué)學(xué)報

注:因版權(quán)方要求,不能公開全文,如需全文,請咨詢雜志社

浙江工業(yè)大學(xué)學(xué)報緊跟學(xué)術(shù)前沿,緊貼讀者,國內(nèi)刊號為:33-1193/T。堅持指導(dǎo)性與實用性相結(jié)合的原則,創(chuàng)辦于1973年,雜志在全國同類期刊中發(fā)行數(shù)量名列前茅。