摘要:聚類分析在無監(jiān)督學(xué)習(xí)領(lǐng)域中一直備受國內(nèi)外學(xué)者關(guān)注.針對K-means聚類算法對初始聚類中心點敏感、簇內(nèi)數(shù)據(jù)相關(guān)性差以及收斂到局部最優(yōu)的缺點,提出了一種基于離群因子的優(yōu)化聚類算法.該算法采用信息熵加權(quán)歐式距離作為相似性度量依據(jù),以更明顯地區(qū)分?jǐn)?shù)據(jù)對象間的差異,然后利用k距離參數(shù)自調(diào)整的局部異常因子檢測算法計算出各數(shù)據(jù)點的離群因子并篩選出初始聚類中心的候選集,最后根據(jù)其離群因子加權(quán)距離法優(yōu)化聚類中心.通過在UCI數(shù)據(jù)集上的實驗測試結(jié)果表明,優(yōu)化算法的準(zhǔn)確率比K-means++算法、OFMMK-means算法、FCM算法更高,運(yùn)行速度比FCM算法更快.該算法能夠更好地應(yīng)用于入侵行為檢測、信用風(fēng)險評估以及多故障診斷等領(lǐng)域.
注:因版權(quán)方要求,不能公開全文,如需全文,請咨詢雜志社