摘要:為了解決主成分分析(PCA)算法無法處理高維數(shù)據(jù)降維后再聚類精確度下降的問題,提出了一種新的屬性空間概念,通過屬性空間與信息熵的結(jié)合構(gòu)建了基于特征相似度的降維標(biāo)準(zhǔn),提出了新的降維算法ENPCA。針對降維后特征是原特征的線性組合而導(dǎo)致可解釋性變差以及輸入不夠靈活的問題,提出了基于嶺回歸的稀疏主成分算法(ESPCA)。ESPCA算法的輸入為主成分降維結(jié)果,不需要迭代獲得稀疏結(jié)果,增加了靈活性和求解速度。最后在降維數(shù)據(jù)的基礎(chǔ)上,針對遺傳算法聚類收斂速度慢等問題,對遺傳算法的初始化、選擇、交叉、變異等操作進(jìn)行改進(jìn),提出了新的聚類算法GKA++。實驗分析表明EN-PCA算法表現(xiàn)穩(wěn)定,GKA++算法在聚類有效性和效率方面表現(xiàn)良好。
注:因版權(quán)方要求,不能公開全文,如需全文,請咨詢雜志社