摘要:在數(shù)據(jù)挖掘中,由于數(shù)據(jù)集中含有大量的冗余和不相關的特征,因此特征選擇是一個重要的預處理過程。提出了一個基于混合互信息和粒子群算法的過濾式-封裝式的多目標特征選擇方法(HMIPSO)。根據(jù)粒子的pbest距離上次更新的迭代次數(shù),提出了自適應突變策略去擾動種群,避免種群陷入局部最優(yōu)。同時基于帕累托前沿面和外部文檔提出了一個新的集合概念。結合互信息和新的集合知識提出了一個局部搜索策略,使得帕累托前沿面中的粒子可以刪除不相關和冗余的特征,然后通過精英策略更新學習前和學習后的帕累托前沿面。最后將提出的算法和另外4種多目標算法在15個UCI數(shù)據(jù)集上進行了測試,實驗結果表明提出的算法能夠更好地降低特征個數(shù)和分類錯誤率。
注:因版權方要求,不能公開全文,如需全文,請咨詢雜志社