摘要:場景分類在圖像理解和計算機視覺中是一個挑戰(zhàn)性問題。有效的圖像表示在場景分類任務(wù)中至關(guān)重要。CNN特征在場景分類任務(wù)中表現(xiàn)相對突出,但仍有缺陷,其主要表征圖像的全局特征,忽略了局部信息,且缺乏幾何不變性。本文通過編碼多尺度局部圖像塊的中層CNN特征,獲得圖像的局部信息,并將編碼特征與原始圖像的全局CNN特征進行多通道融合來描述場景圖像,獲得更高效的圖像表示,以實現(xiàn)更好的分類判別。本文在兩個常用的場景數(shù)據(jù)集上進行實驗評估,結(jié)果表明,該方法在場景分類任務(wù)中取得了令人滿意的效果。
注:因版權(quán)方要求,不能公開全文,如需全文,請咨詢雜志社