摘要:目的隨著3D掃描技術(shù)和虛擬現(xiàn)實(shí)技術(shù)的發(fā)展,真實(shí)物體的3D識(shí)別方法已經(jīng)成為研究的熱點(diǎn)之一。針對(duì)現(xiàn)有基于深度學(xué)習(xí)的方法訓(xùn)練時(shí)間長(zhǎng),識(shí)別效果不理想等問(wèn)題,提出了一種結(jié)合感知器殘差網(wǎng)絡(luò)和超限學(xué)習(xí)機(jī)(ELM)的3D物體識(shí)別方法。方法以超限學(xué)習(xí)機(jī)的框架為基礎(chǔ),使用多層感知器殘差網(wǎng)絡(luò)學(xué)習(xí)3D物體的多視角投影特征,并利用提取的特征數(shù)據(jù)和已知的標(biāo)簽數(shù)據(jù)同時(shí)訓(xùn)練了ELM分類層、K最近鄰(KNN)分類層和支持向量機(jī)(SVM)分類層識(shí)別3D物體。網(wǎng)絡(luò)使用增加了多層感知器的卷積層替代傳統(tǒng)的卷積層。卷積網(wǎng)絡(luò)由改進(jìn)的殘差單元組成,包含多個(gè)卷積核個(gè)數(shù)恒定的并行殘差通道,用于擬合不同數(shù)學(xué)形式的殘差項(xiàng)函數(shù)。網(wǎng)絡(luò)中半數(shù)卷積核參數(shù)和感知器參數(shù)以高斯分布隨機(jī)產(chǎn)生,其余通過(guò)訓(xùn)練尋優(yōu)得到。結(jié)果提出的方法在普林斯頓3D模型數(shù)據(jù)集上達(dá)到了94.18%的準(zhǔn)確率,在2D的NORB數(shù)據(jù)集上達(dá)到了97.46%的準(zhǔn)確率。該算法在兩個(gè)國(guó)際標(biāo)準(zhǔn)數(shù)據(jù)集中均取得了當(dāng)前最好的效果。同時(shí),使用超限學(xué)習(xí)機(jī)框架使得本文算法的訓(xùn)練時(shí)間比基于深度學(xué)習(xí)的方法減少了3個(gè)數(shù)量級(jí)。結(jié)論本文提出了一種使用多視角圖識(shí)別3D物體的方法,實(shí)驗(yàn)表明該方法比現(xiàn)有的ELM方法和深度學(xué)習(xí)等最新方法的識(shí)別率更高,抗干擾性更強(qiáng),并且其調(diào)節(jié)參數(shù)少,收斂速度快。
注:因版權(quán)方要求,不能公開(kāi)全文,如需全文,請(qǐng)咨詢雜志社