摘要:隨機(jī)森林(RF)具有抗噪能力強(qiáng),預(yù)測準(zhǔn)確率高,能夠處理高維數(shù)據(jù)等優(yōu)點(diǎn),因此在機(jī)器學(xué)習(xí)領(lǐng)域得到了廣泛的應(yīng)用。模型決策樹(MDT)是一種加速的決策樹算法,雖然能夠提高決策樹算法的訓(xùn)練效率,但是隨著非純偽葉結(jié)點(diǎn)規(guī)模的增大,模型決策樹的精度也在下降。針對上述問題,提出了一種模型決策森林算法(MDF)以提高模型決策樹的分類精度。MDF算法將MDT作為基分類器,利用隨機(jī)森林的思想,生成多棵模型決策樹。算法首先通過旋轉(zhuǎn)矩陣得到不同的樣本子集,然后在這些樣本子集上訓(xùn)練出多棵不同的模型決策樹,再將這些樹通過投票的方式進(jìn)行集成,最后根據(jù)得到的模型決策森林給出分類結(jié)果。在標(biāo)準(zhǔn)數(shù)據(jù)集上的實驗結(jié)果表明,提出的模型決策森林在分類精度上明顯優(yōu)于模型決策樹算法,并且MDF在樹的數(shù)量較少時也能取到不錯的精度,避免了因樹的數(shù)量增加時間復(fù)雜度增高的問題。
注:因版權(quán)方要求,不能公開全文,如需全文,請咨詢雜志社