摘要:針對(duì)目前數(shù)據(jù)引力模型的多標(biāo)簽懶惰學(xué)習(xí)分類算法不能同時(shí)利用標(biāo)簽相關(guān)性以及數(shù)據(jù)質(zhì)量的相互作用的問(wèn)題,提出基于數(shù)據(jù)引力模型的改進(jìn)多標(biāo)簽算法IMLDGM。首先,計(jì)算訓(xùn)練集中的每個(gè)樣本數(shù)據(jù)的K個(gè)最近鄰居樣本,構(gòu)成新的數(shù)據(jù)樣本集;其次,根據(jù)新的數(shù)據(jù)樣本集標(biāo)簽的分布情況計(jì)算交互引力系數(shù)IGC,同時(shí)為每個(gè)數(shù)據(jù)樣本建立相關(guān)性矩陣來(lái)計(jì)算標(biāo)簽相關(guān)性關(guān)系,再計(jì)算出每個(gè)訓(xùn)練集樣本數(shù)據(jù)的密度以及權(quán)重大小;最后計(jì)算粒子間的正、負(fù)引力大小來(lái)構(gòu)建新的多標(biāo)簽分類模型。仿真實(shí)驗(yàn)結(jié)果表明,IMLDGM算法子集準(zhǔn)確率SA與微平均F1值MF1評(píng)價(jià)指標(biāo)均優(yōu)于對(duì)比算法,漢明損失HL也較為明顯的降低。
注:因版權(quán)方要求,不能公開(kāi)全文,如需全文,請(qǐng)咨詢雜志社