時(shí)間:2023-03-14 14:49:21
導(dǎo)語(yǔ):在圖像處理技術(shù)論文的撰寫(xiě)旅程中,學(xué)習(xí)并吸收他人佳作的精髓是一條寶貴的路徑,好期刊匯集了九篇優(yōu)秀范文,愿這些內(nèi)容能夠啟發(fā)您的創(chuàng)作靈感,引領(lǐng)您探索更多的創(chuàng)作可能。
簡(jiǎn)單來(lái)說(shuō),計(jì)算機(jī)圖像處理技術(shù)就是將一些圖像、視頻、圖片等進(jìn)行數(shù)字轉(zhuǎn)化,并且通過(guò)轉(zhuǎn)化將其變成計(jì)算機(jī)技術(shù)所能識(shí)別的固定代碼,從而便于計(jì)算機(jī)進(jìn)行識(shí)別和美化,通過(guò)對(duì)圖像的一些操作使圖像呈現(xiàn)出我們想要的圖像效果,計(jì)算機(jī)圖像處理技術(shù)的處理速度是相對(duì)較快的,而且其存儲(chǔ)空間也相對(duì)較大,所以,對(duì)于那些已經(jīng)處理過(guò)的圖像和視頻可以直接保存,同時(shí),隨著計(jì)算機(jī)信息技術(shù)的發(fā)展,計(jì)算機(jī)圖像處理技術(shù)也取得了一定的進(jìn)展,計(jì)算機(jī)圖像處理技術(shù)只需要將數(shù)字轉(zhuǎn)化為紅、黃、藍(lán)三種原始色彩的數(shù)字圖像就可以,然后計(jì)算機(jī)通過(guò)對(duì)這些圖像進(jìn)行分析和處理,從而實(shí)現(xiàn)圖像的多樣化操作,同時(shí),計(jì)算機(jī)圖像處理技術(shù)的提高也體現(xiàn)在圖像清晰度和分辨率,以及圖像傳輸率等技術(shù)的提升和發(fā)展。
2計(jì)算機(jī)圖像處理技術(shù)在網(wǎng)頁(yè)設(shè)計(jì)中的應(yīng)用
在網(wǎng)頁(yè)設(shè)計(jì)的過(guò)程中,圖像的處理和美化是其中最重要的環(huán)節(jié)之一,在一些較為復(fù)雜的網(wǎng)頁(yè)中,可能會(huì)包含一些動(dòng)態(tài)的圖像以及flash元素等,這些元素的存在無(wú)疑增加了網(wǎng)頁(yè)的特色,同時(shí),也會(huì)提高客戶體驗(yàn),為了保持這些元素的鮮明性就需要將計(jì)算機(jī)圖像處理技術(shù)很好的應(yīng)用到網(wǎng)頁(yè)設(shè)計(jì)中,提高網(wǎng)頁(yè)質(zhì)量的同時(shí),增加網(wǎng)頁(yè)的特點(diǎn)。
2.1滿足網(wǎng)頁(yè)設(shè)計(jì)中對(duì)于圖片格式的需求
滿足網(wǎng)頁(yè)設(shè)計(jì)中對(duì)圖片格式的需求是網(wǎng)頁(yè)設(shè)計(jì)過(guò)程中最基礎(chǔ)的環(huán)節(jié),在網(wǎng)頁(yè)設(shè)計(jì)中,需要各種不同的元素來(lái)組成一個(gè)完整的、特色鮮明的網(wǎng)頁(yè),從而讓瀏覽者瞬間獲取自己所需要的信息和資源,同時(shí),網(wǎng)頁(yè)設(shè)計(jì)必須具有一定的便捷性,這樣才能有效的增加用戶體驗(yàn),同時(shí)增強(qiáng)用戶瀏覽體驗(yàn)的感受,由此可見(jiàn),圖像的處理是網(wǎng)頁(yè)設(shè)計(jì)中最基礎(chǔ)的內(nèi)容,所以,計(jì)算機(jī)圖像處理技術(shù)首先需要處理的就是網(wǎng)頁(yè)設(shè)計(jì)中的圖像問(wèn)題,其中jpeg是最為常用的圖片格式,而gif可以實(shí)現(xiàn)圖像的動(dòng)態(tài)效果,由于這兩種的網(wǎng)絡(luò)圖像格式所需要的參數(shù)和規(guī)格是不盡相同的,所以在應(yīng)用計(jì)算機(jī)圖像處理技術(shù)時(shí),應(yīng)該滿足其格式的不同需求。
2.2對(duì)網(wǎng)頁(yè)設(shè)計(jì)中圖像的大小進(jìn)行控制
眾所周知,計(jì)算機(jī)的長(zhǎng)度和寬度是有限的,這在一定程度上就決定了網(wǎng)頁(yè)設(shè)計(jì)的圖像也應(yīng)該是有一定的規(guī)格,同時(shí),為了保障網(wǎng)頁(yè)瀏覽的清晰度和流暢度,就需要對(duì)網(wǎng)頁(yè)中的圖像進(jìn)行一些特定的處理來(lái)限制其圖像的大小,由于圖像的大小與其所展現(xiàn)的清晰度有直接關(guān)系,所以,需要借助計(jì)算機(jī)圖像處理技術(shù)來(lái)進(jìn)行處理,以此來(lái)緩解清晰度和圖像大小之間的矛盾,在追求圖片高清晰度的同時(shí),提高網(wǎng)頁(yè)加載的速度和質(zhì)量,同時(shí)提高網(wǎng)頁(yè)瀏覽的效果。計(jì)算機(jī)圖像處理技術(shù)主要是一種針對(duì)jpeg圖片進(jìn)行處理來(lái)權(quán)衡加載速度和網(wǎng)頁(yè)瀏覽效果的一種技術(shù),從而提高網(wǎng)頁(yè)設(shè)計(jì)的瀏覽效果和網(wǎng)頁(yè)質(zhì)量。
2.3對(duì)網(wǎng)頁(yè)設(shè)計(jì)進(jìn)行進(jìn)一步的開(kāi)發(fā)
只有綜合運(yùn)用計(jì)算機(jī)圖像處理技術(shù)對(duì)網(wǎng)頁(yè)設(shè)計(jì)進(jìn)行進(jìn)一步的開(kāi)發(fā)和應(yīng)用,才能從根本上提高網(wǎng)頁(yè)設(shè)計(jì)效果,近年來(lái),計(jì)算機(jī)圖像處理技術(shù)主要是以軟件為主,photoshop是目前最為常用的圖片處理軟件,但是,隨著網(wǎng)頁(yè)設(shè)計(jì)的不斷普及和發(fā)展,出現(xiàn)了更多網(wǎng)頁(yè)個(gè)體設(shè)計(jì)者,為了滿足不同個(gè)體對(duì)網(wǎng)頁(yè)設(shè)計(jì)的個(gè)性化需求,同時(shí)帶動(dòng)個(gè)體成為網(wǎng)頁(yè)設(shè)計(jì)的主流,豐富網(wǎng)頁(yè)的內(nèi)容和色彩,就需要適當(dāng)?shù)慕档陀?jì)算機(jī)圖像處理技術(shù)的技術(shù)水平,以此滿足社會(huì)大眾的需求,其中photoshop的圖片處理功能相對(duì)強(qiáng)大,但是photoshop主要是針對(duì)專業(yè)的網(wǎng)頁(yè)設(shè)計(jì)人員開(kāi)發(fā)的一種技術(shù)處理軟件,所以,對(duì)于那些非專業(yè)的網(wǎng)頁(yè)設(shè)計(jì)者,這個(gè)軟件具有一定的難度,這在一定程度上限制了網(wǎng)頁(yè)設(shè)計(jì)的普及和發(fā)展,所以,為了滿足更多網(wǎng)頁(yè)開(kāi)發(fā)者的設(shè)計(jì)體驗(yàn),要不斷開(kāi)發(fā)出一些相對(duì)簡(jiǎn)單和實(shí)用的計(jì)算機(jī)圖像處理技術(shù),進(jìn)而推動(dòng)計(jì)算機(jī)圖像處理技術(shù)的革新和技術(shù)升級(jí)。
3結(jié)語(yǔ)
【關(guān)鍵詞】機(jī)器視覺(jué) Matlab 圖像處理 尺寸測(cè)量
在工業(yè)生產(chǎn)中,測(cè)量是進(jìn)行質(zhì)量管理的手段,是貫徹質(zhì)量標(biāo)準(zhǔn)的技術(shù)保證。機(jī)械零件的尺寸檢測(cè)作為產(chǎn)品加工的一個(gè)關(guān)鍵環(huán)節(jié),其檢測(cè)結(jié)果不僅影響產(chǎn)品的質(zhì)量,而且對(duì)后續(xù)零件的再加工和裝配產(chǎn)生決定性的作用。目前,常規(guī)的零件尺寸測(cè)量手段主要采用游標(biāo)卡尺、激光測(cè)量?jī)x和輪廓儀等完成檢測(cè)環(huán)節(jié)。以上零件尺寸測(cè)量方法要么受測(cè)量工具限制,其測(cè)量精度有限;要么檢測(cè)儀器過(guò)于昂貴且操作復(fù)雜,同時(shí)其準(zhǔn)確率往往受人為因素的影響。
鑒于當(dāng)前機(jī)器視覺(jué)技術(shù)的快速發(fā)展以及其在工業(yè)檢測(cè)方面的成功應(yīng)用,論文構(gòu)想利用攝像機(jī)替代人眼,讓計(jì)算機(jī)替代人腦,從而研制出一套針對(duì)零件常規(guī)尺寸的自動(dòng)化y量系統(tǒng)。
1 系統(tǒng)概述
在充分遵循系統(tǒng)的完整性、可靠性、經(jīng)濟(jì)性和實(shí)時(shí)性等原則的基礎(chǔ)上,本文設(shè)計(jì)出了一套基于機(jī)器視覺(jué)的零件常規(guī)尺寸測(cè)量系統(tǒng)。該測(cè)量系統(tǒng)主要由圖像攝取、圖像處理、圖像特征提取和分析、圖像常規(guī)尺寸測(cè)量和結(jié)果輸出幾部分組成。其工作原理圖如圖1所示。
2 硬件設(shè)計(jì)
基于機(jī)器視覺(jué)的零件常規(guī)尺寸測(cè)量系統(tǒng)的硬件主要包括:照明裝置、攝像機(jī)、計(jì)算機(jī)和透明工作臺(tái)。各部件的主要功能是:照明裝置主要為零件圖像采集提供合適的光照環(huán)境;攝像機(jī)用來(lái)采集零件數(shù)字圖像并傳送到計(jì)算機(jī),然后保存為相應(yīng)圖片格式;計(jì)算機(jī)通過(guò)系統(tǒng)軟件實(shí)現(xiàn)對(duì)零件圖像的預(yù)處理、邊界提取、特征提取、相機(jī)標(biāo)定和常規(guī)尺寸計(jì)算;透明工作臺(tái)用來(lái)承載被測(cè)零件。
3 算法設(shè)計(jì)
圖像處理算法對(duì)機(jī)器視覺(jué)測(cè)量系統(tǒng)會(huì)產(chǎn)生決定性的影響。為了能滿足零件尺寸測(cè)量的要求,針對(duì)零件產(chǎn)品圖像的特點(diǎn),我們?cè)O(shè)計(jì)了一套合理的圖像處理算法流程。其流程圖如圖2所示。
首先對(duì)獲取的零件圖像進(jìn)行預(yù)處理,包括圖像灰度化、圖像去噪、圖像分割和邊界提??;然后提取零件的幾何特征;最后通過(guò)對(duì)系統(tǒng)的標(biāo)定,實(shí)現(xiàn)了零件圖像常規(guī)尺寸的測(cè)量和結(jié)果顯示。
3.1 圖像預(yù)處理
3.1.1 圖像灰度化
經(jīng)過(guò)攝像機(jī)采集到的零件圖像是24位真彩色RGB圖像,該圖像中的每個(gè)像素由R、G、B三個(gè)分量決定,而灰度圖像的每個(gè)像素由一個(gè)值確定。為了減少后續(xù)操作過(guò)程中的計(jì)算量,需要對(duì)采集到的零件圖像進(jìn)行灰度化處理。
3.1.2 圖像去噪
采集系統(tǒng)獲取的待檢零件圖像由于受照明程度、環(huán)境溫度、電源變化、電磁輻射和振動(dòng)等隨機(jī)因素的干擾,圖像會(huì)包含大量的噪聲,表現(xiàn)為圖像模糊、失真和大量斑點(diǎn)等。為了消除和抑制噪聲對(duì)零件圖像后續(xù)處理的影響,必須對(duì)圖像進(jìn)行濾波處理。由于中值濾波既能消除噪聲又能保持圖像的細(xì)節(jié),符合本系統(tǒng)檢測(cè)的需求。
3.1.3 圖像分割
在所采集到的零件圖像中,我們只對(duì)零件區(qū)域本身感興趣,對(duì)于圖像中的其他要素則要盡量消除。圖像分割就是指把圖像分成各具特性的區(qū)域,并提取出感興趣目標(biāo)的技術(shù)和過(guò)程。經(jīng)過(guò)大量的實(shí)驗(yàn)驗(yàn)證,本文采用迭代閾值分割法實(shí)現(xiàn)對(duì)零件圖像的分割,達(dá)到了預(yù)期的處理效果。
3.1.4 邊界提取
輪廓是對(duì)物體形狀的有力描述,對(duì)圖像分析和識(shí)別十分有用,而通過(guò)邊界提取算法就可以得到物體的邊界輪廓。目標(biāo)圖像邊界提取的方法很多,主要包括鏈碼表示法、標(biāo)記圖法以及多邊形近似法等。論文采用8連通鏈碼法對(duì)待測(cè)零件進(jìn)行了邊界提取,為后續(xù)零件尺寸的檢測(cè)奠定了很好的基礎(chǔ)。
3.2 圖像分析
3.2.1 特征檢測(cè)
要測(cè)量零件的尺寸,首先應(yīng)該檢測(cè)出零件所包含的直線和圓等基本的幾何特征。目前常用的幾何特征檢測(cè)方法有Hough變換法、擬合法和模板匹配法等。本文采用最小二乘法實(shí)現(xiàn)了對(duì)直線和圓的擬合,其擬合具體過(guò)程如下:
(1)采用最小二乘法實(shí)現(xiàn)對(duì)直線的擬合。
(2)采用最小二乘法實(shí)現(xiàn)對(duì)圓和圓弧的擬合。
采用最小二乘法對(duì)圓和圓弧的擬合過(guò)程與直線的擬合求解過(guò)程類似。設(shè)所求擬合圓的方程為:。根據(jù)最小二乘法應(yīng)滿足的條件,可以求出擬合圓的三個(gè)參數(shù):u、v和r。
這樣,通過(guò)基于最小二乘法的直線和圓擬合方法,可以順利檢測(cè)到直線和圓弧幾何特征,為后續(xù)零件尺寸的測(cè)量奠定了基礎(chǔ)。
3.2.2 系統(tǒng)的標(biāo)定
相機(jī)拍攝到的圖像是以像素為單位的,要得到待檢零件的實(shí)際尺寸,需要將像素尺寸轉(zhuǎn)換為長(zhǎng)度尺寸,這個(gè)過(guò)程稱為系統(tǒng)的標(biāo)定。本文使用0級(jí)精度量塊,采用二次標(biāo)定法實(shí)現(xiàn)了對(duì)系統(tǒng)的標(biāo)定過(guò)程。被測(cè)零件的實(shí)際尺寸L與像素尺寸N之間應(yīng)滿足如下關(guān)系式:L=KN+b
式中,b為系統(tǒng)誤差,K為標(biāo)定系數(shù);
在攝像機(jī)固定的情況下,求取參數(shù)K和b值的具體步驟如下:
(1)在被測(cè)位置放置一長(zhǎng)度為L(zhǎng)1的標(biāo)準(zhǔn)量塊;
(2)對(duì)標(biāo)準(zhǔn)量塊進(jìn)行掃描、處理,得到對(duì)應(yīng)的像素尺寸N1;
(3)在被測(cè)位置放置另一長(zhǎng)度為L(zhǎng)2的標(biāo)準(zhǔn)量塊,重復(fù)步驟2,得到對(duì)應(yīng)像素尺寸N2;
(4)求取參數(shù)值:
4 軟件設(shè)計(jì)
本著穩(wěn)定、可靠、合理、高效、簡(jiǎn)潔和易于操作的原則,我們采用面向?qū)ο蟮腗atlab程序語(yǔ)言,實(shí)現(xiàn)了基于Matlab GUI的測(cè)量系統(tǒng)軟件的設(shè)計(jì)。
本測(cè)量系統(tǒng)軟件主要包括用戶登錄模塊、文件管理模塊、圖像處理模塊、參數(shù)設(shè)置模塊、數(shù)據(jù)瀏覽模塊和幫助模塊等。其中,用戶登錄模塊可以完成用戶的注冊(cè)、登陸、密碼修改和賬號(hào)管理;文件管理模塊主要包括待測(cè)零件圖像的打開(kāi)、關(guān)閉和保存等功能;圖像處理模塊不僅包含文中所涉及到的算法,還增加了其他算法功能;參數(shù)設(shè)置模塊可以實(shí)現(xiàn)對(duì)攝像機(jī)、零件和圖像參數(shù)的設(shè)置;數(shù)據(jù)瀏覽模塊可以完成對(duì)實(shí)時(shí)數(shù)據(jù)、歷史數(shù)據(jù)和操作記錄的查看;軟件幫助模塊主要用來(lái)說(shuō)明軟件的使用和系統(tǒng)的更新問(wèn)題。
5 實(shí)驗(yàn)結(jié)果
為了驗(yàn)證測(cè)量系統(tǒng)的適應(yīng)性、穩(wěn)定性和可靠性,本文選用工作面距離為1.49mm的0級(jí)量塊和直徑為2.03mm的標(biāo)準(zhǔn)環(huán)規(guī)對(duì)系統(tǒng)進(jìn)行了可靠性測(cè)試。實(shí)驗(yàn)的測(cè)量結(jié)果如表1所示。
采用概率與數(shù)理統(tǒng)計(jì)的方法對(duì)測(cè)量結(jié)果進(jìn)行了處理。由處理結(jié)果可以看到,采用本測(cè)量系統(tǒng),其測(cè)量精度可以達(dá)到微米級(jí),可以滿足在線實(shí)時(shí)測(cè)量的需要。
6 結(jié)論
作者設(shè)計(jì)了一套基于機(jī)器視覺(jué)的零件幾何尺寸在線檢測(cè)系統(tǒng),克服當(dāng)前人工檢測(cè)的不足,提高了產(chǎn)品的檢測(cè)精度。同時(shí),完成了系統(tǒng)硬件、軟件和圖像處理算法的設(shè)計(jì)。實(shí)驗(yàn)結(jié)果表明:該測(cè)量系統(tǒng)的測(cè)量精度可以達(dá)到2um以下,滿足零件尺寸非接觸在線測(cè)量要求,具有很好的應(yīng)用前景。
參考文獻(xiàn)
[1]王保軍.基于機(jī)器視覺(jué)的藥瓶封裝缺陷檢測(cè)系統(tǒng)研究[D].沈陽(yáng):東北大學(xué)(碩士學(xué)位論文),2014.
[2]李巖,花國(guó)梁.精密測(cè)量技術(shù)[M].北京:中國(guó)計(jì)量出版社,2001.
[3]章毓晉.圖像工程(上冊(cè))――圖像處理和分析[M].北京:清華大學(xué)出版社,1999,5-120.
[4]張錚,王艷平,薛桂香.數(shù)字圖像處理與機(jī)器視覺(jué)[M].北京:人民郵電出版社,2012(12):63-160.
作者簡(jiǎn)介
王保軍(1988-),男,山西省忻州市人。碩士研究生學(xué)歷?,F(xiàn)為山西機(jī)電職業(yè)技術(shù)學(xué)院助理講師。主要研究方向?yàn)榛跈C(jī)器視覺(jué)的零件在線檢測(cè)。
【關(guān)鍵詞】椒鹽噪聲 雙閾值 隸屬函數(shù)
1 引言
噪聲主要在數(shù)字圖像的獲取和傳輸過(guò)程中產(chǎn)生,一般是不可預(yù)測(cè)的隨機(jī)信號(hào),只能用概率統(tǒng)計(jì)的方法去識(shí)別。噪聲對(duì)圖像處理十分重要,其會(huì)影響圖像處理的輸入、采集、處理的各個(gè)環(huán)節(jié)以及輸出結(jié)果的全過(guò)程。其中,椒鹽噪聲一般是由于傳輸誤差或比特丟失造成的。椒鹽噪聲與其他的像素點(diǎn)有明顯的區(qū)別,一般是鄰域中的像素值的極值點(diǎn)。但是極值點(diǎn)并不一定是噪聲點(diǎn)。椒鹽噪聲在圖像上表現(xiàn)出黑白相間的亮暗點(diǎn),會(huì)嚴(yán)重影響圖像的質(zhì)量。傳統(tǒng)中值濾波算法(SMF)[1]能夠減弱或消除傅里葉空間的高頻分量,但是同時(shí)會(huì)影響低頻分量。由于高頻分量對(duì)應(yīng)圖像中的邊沿灰度值具有較大較快變化的部分,所以SMF算法可將這些分量濾除,使圖像平滑,破壞圖像的邊緣和細(xì)節(jié)。
文獻(xiàn)[2]提出了模糊開(kāi)關(guān)中值濾波算法(FSM),F(xiàn)SM算法處理效果比SMF算法要好一點(diǎn)。文獻(xiàn)[3]提出了自適應(yīng)模糊開(kāi)關(guān)中值濾波(NAFSM)算法。文獻(xiàn)[4]提出了EDPA算法。文獻(xiàn)[5]和文獻(xiàn)[6]提出基于神經(jīng)網(wǎng)絡(luò)的模糊中值濾波算法,對(duì)于受密度噪聲污染的圖像取得了不錯(cuò)的效果,但是計(jì)算量很大。文獻(xiàn)[7]、文獻(xiàn)[8]、文獻(xiàn)[9]、文獻(xiàn)[10]提出了一種自適應(yīng)模糊中值濾波算法(AFM)。AFM算法對(duì)傅里葉空間的低頻分量具有較好的濾除效果,但對(duì)高頻分量的處理效果不是很好,主要是沒(méi)有考慮椒鹽噪聲對(duì)圖像的污染程度。所以本文在AFM的基礎(chǔ)上提出了一種雙閾值模糊中值濾波算法,該算法能很好地保護(hù)圖像的細(xì)節(jié),具有高效地處理椒鹽噪聲的能力。
2 算法的基本思想和實(shí)現(xiàn)
2.1 建立模糊系統(tǒng)
利用模糊系統(tǒng)(如圖1所示),計(jì)算輸入?yún)?shù)的模糊系數(shù)權(quán)值。因?yàn)樘幚淼氖墙符}噪聲,所以只需輸入濾波窗口中原值與中值的差,最后通過(guò)去模函數(shù)去模糊化,濾波輸出。
圖1 模糊濾波系統(tǒng)設(shè)計(jì)
濾波窗口S由w×w(w默認(rèn)值為3,一般為奇數(shù))的方陣組成。對(duì)S里的像素點(diǎn)值進(jìn)行快排序,可得濾波窗口中像素的最小值為Smin,最大值為Smax,中值為Smed,均值為Smean。x(i,j)表示噪聲圖像在(i,j)的灰度值。模糊系統(tǒng)首先是計(jì)算參數(shù)S1(i,j)=x(i,j)-Smed。在圖像處理的時(shí)候一般對(duì)像素的污染程度進(jìn)行閾值的設(shè)置。這里假設(shè)最小閾值為Tmin,最大閾值為Tmax,同時(shí)設(shè)置參數(shù)S2=|x(i,j)-Smean|。當(dāng)S2Tmax時(shí),認(rèn)為像素點(diǎn)嚴(yán)重污染,這時(shí)就用最近鄰域已處理的像素點(diǎn)求均值代替。
設(shè)當(dāng)前像素的灰度值為x(i,j),濾波后的像素的灰度值為y(i,j),模糊濾波系數(shù)為P。則模糊隸屬函數(shù)為:
(1)
如果S2
y(i,j)=S(i,j) (2)
如果Tmin≤S2≤Tmax時(shí),則:
y(i,j)=P×S(i,j)+(1-P)×Smed (3)
如果S2>Tmax時(shí),則:
, i=0,j=0 (4)
,i>0,j=0 (5)
,i=0,j>0 (6)
,
i>0,j>0 (7)
2.2 算法實(shí)現(xiàn)
定義S(i,j)是以點(diǎn)(i,j)為中心,大小為w×w的方形窗口,可表示為S(i,j)={(k,l)||k-i|
具體方法如下:
設(shè)最大窗口為wmax×wmax,輸出圖像為y(i,j)。自適應(yīng)雙閾值模糊中值濾波算法的基本思想是通過(guò)判斷窗口中心點(diǎn)是否為噪聲來(lái)調(diào)節(jié)窗口的大小,以克服中值濾波對(duì)細(xì)節(jié)的破壞。
具體算法如下:
初始化窗口大小,令w=3。
計(jì)算窗口S(i,j)中像素的最小值Smin,最大值Smax,中值Smed及均值Smean。
如果Smin
如果w≤wmax跳到第2步,否則說(shuō)明是噪聲點(diǎn),用鄰域已處理點(diǎn)灰度值均值代取y(i,j)。
如果Smin
2.3 實(shí)驗(yàn)實(shí)現(xiàn)與分析
在win7系統(tǒng)和vs2010+opencv環(huán)境下,經(jīng)過(guò)大量的仿真實(shí)驗(yàn),最終得到Tmin=5,Tmax=13可以達(dá)到很好的去噪效果。實(shí)驗(yàn)分別對(duì)加入30%、80%的椒鹽噪聲的Lena.jpg進(jìn)行處理。具體如圖2、圖3、圖4所示:
圖2 無(wú)噪聲的原圖
觀察圖3(a~e)到圖4(a~e)可以發(fā)現(xiàn),噪聲輕度污染時(shí)各算法去噪能力沒(méi)有明顯差別;當(dāng)噪聲嚴(yán)重污染時(shí)SMF基本不能保護(hù)圖像的細(xì)節(jié),AFM、FSM能夠適當(dāng)?shù)乇Wo(hù)圖像的細(xì)節(jié),但是噪聲點(diǎn)還是很多,論文算法能夠很好地保護(hù)圖像細(xì)節(jié)并去除噪聲。
采用峰值信噪比(PSNR)歸一化均方誤差(NMSE)度量處理圖像效果的好壞,定義如下:
(8)
(9)
式中y(i,j)表示去噪后的圖像各像素點(diǎn)的灰度值,I(i,j)表示原始無(wú)噪圖像各像素點(diǎn)的灰度值。M、N分別表示圖像的高和寬。表1為幾種算法的NMSE比較,表2為幾種算法的PSNR的比較。
各種算法的NMSE如圖5所示,各種算法的PSNR如圖6所示。
從表1、表2、圖5和圖6可以看出論文算法去噪和其他算法相比優(yōu)勢(shì)非常明顯。在加入小于40%的噪聲時(shí)各算法的去噪效果差別不是很大。隨著噪聲的加大,其他算法處理能力明顯下降,但是論文算法卻達(dá)到一種趨衡的狀態(tài)。
表1 幾種算法的NMSE比較
噪聲密度/
% 不同算法處理的NMSE
SMF AFM EDPA 論文算法
10 0.0022 0.0006 0.0012 0.0006
20 0.0048 0.0014 0.0021 0.0011
30 0.0171 0.0022 0.0029 0.0021
40 0.0457 0.0042 0.0066 0.0041
50 0.1096 0.0097 0.0149 0.0042
60 0.2156 0.0267 0.0271 0.0043
70 0.3673 0.0712 0.0734 0.0044
80 0.5661 0.1791 0.1578 0.0047
90 0.7968 0.4175 0.3785 0.0051
表2 幾種算法的PSNR的比較
噪聲密度/
% 不同算法的PSNR
SMF AFM EDPA 論文算法
10 32.2789 37.4440 36.7873 37.4440
20 28.8538 34.3215 33.2178 35.2321
30 23.3064 32.2061 30.1963 32.2624
40 19.0506 29.4123 27.2338 29.4182
50 15.2454 25.7989 23.7133 29.4086
60 12.3090 21.3828 20.7634 29.3226
70 9.99450 17.1203 17.2960 29.1659
80 8.11600 13.1141 13.4691 28.9376
90 6.63180 9.43800 10.2843 28.5508
圖5 各種算法的NMSE
圖6 各種算法的PSNR
3 結(jié)束語(yǔ)
本文在AFM算法的基礎(chǔ)上提出了一種自適應(yīng)雙閾值模糊中值濾波算法。和其他去噪算法相比,論文算法具有極強(qiáng)的去噪性,同時(shí)很好地保護(hù)了圖像的細(xì)節(jié),并且算法具有穩(wěn)定性,是去除椒鹽噪聲的好算法。
參考文獻(xiàn):
[1] Pitas I, Venetsanopoulos A N. Order statistics in digital image processing[J]. Proceeding of the IEEE, 1992,80(12): 1893-1921.
[2] H Ibrahim, K K V Toh, M N Mahyuddin. Salt-and-pepper noise detection and reduction using fuzzy switching median filter[J]. IEEE Transaction on Consumer Electronics, 2008,54(4): 1956-1961.
[3] K K V Toh, N A M Isa. Noise Adaptive Fuzzy Switching Median Filter for Salt-and-Pepper Noise Reduction[J]. IEEE Signal Processing Letters, 2010,17(3): 281-284.
[4] Nibong Tebal, Penang. Fuzzy Multipass Filter for Impulse Noise Removal in Digital Images[C]. Signals and Information Technology, 2013.
[5] M E Yuksel. A hybrid neuro-fuzzy filter for edge preserving restoration of images corrupted by impulse noise[J]. IEEE Transactions on Image Processing, 2006,15(4): 928-936.
[6] S Schulte, M Nachtegael, V D Witte, et al. A fuzzy impulse noise detection and reduction method[J]. IEEE Transactions on Image Processing, 2006,15(5): 1153-1162.
[7] T Palabas, A Gangal. Salt and pepper noise reduction in images using adaptive fuzzy filter[C]. SIU, 2012: 1-4.
[8] T Palabas, A Gangal. Adaptive fuzzy filter combined with median filter for reducing intensive salt and pepper noise in gray level images[C]. Innovations in Intelligent Systems and Applications, 2012: 1-4.
關(guān)鍵詞: MATLAB; 預(yù)處理; Hough變換; 降維; 形態(tài)學(xué)
中圖分類號(hào):TP391.41 文獻(xiàn)標(biāo)志碼:A 文章編號(hào):1006-8228(2016)11-17-04
Research on the image recognition of target sheet with MATLAB
Wang Weiyang, Ding Jiayue, Wang Penghong, Lu Zhengyong
(School of Imformation & Electronic Engineering, Zhejiang Gongshang University, Hangzhou, Zhejiang 310018, China)
Abstract: According to the shooting competition when a real-time and accurate detection of the shooting results is required, a research on image recognition of target sheet with MATLAB is presented in this paper. An image processing algorithm based on MATLAB is used in order to analyse the ring number of impact point on the target sheet captured by digital camera. Grayscale conversion, median filtering, and binariztion of the target sheet image are used in the image pretreatment. Sobel operator is used to extract image edge, so the amount of computation is dramatically reduced. And the bullet hole is recognized and located by using improved Hough transform, image subtraction method and morphological algorithm. The experimental results show that the image processing algorithm has fast speed and good accuracy.
Key words: MATLAB; pretreatment; Hough transform; mension reduction; morphology
0 引言
隨著科技的發(fā)展,射擊比賽時(shí)采用自動(dòng)報(bào)靶系統(tǒng),將會(huì)越來(lái)越普遍。這種方式不僅能減少人力物力支出、提高報(bào)靶效率,還能減小由于人為帶來(lái)的不確定因素。目前已有不少單位研究出多種自動(dòng)報(bào)靶系統(tǒng)[1-4]?;跈C(jī)器視覺(jué)的自動(dòng)報(bào)靶系統(tǒng),應(yīng)用環(huán)境要求特殊,還未得到普及[1-4]。本文基于MATLAB函數(shù)工具箱實(shí)現(xiàn)靶紙彈孔檢測(cè)的數(shù)字化方法,在射擊時(shí)對(duì)靶紙圖像進(jìn)行采集,通過(guò)基于MATLAB的圖像處理技術(shù)對(duì)靶紙圖像進(jìn)行處理分析,并模擬圖像進(jìn)行成績(jī)輸出。
1 靶紙圖像采集讀取
靶紙圖像采集可以有多種方式,本實(shí)驗(yàn)采用最高像素值為300萬(wàn)的數(shù)碼相機(jī)拍攝,圖像采集簡(jiǎn)便,便于推廣應(yīng)用。MATLAB中提供的imread()函數(shù)用于實(shí)現(xiàn)圖像的讀取操作,可讀取JPG、TIF、GIF、HDF、XWD和CUR等多種圖像格式。調(diào)用該函數(shù)后將得到一個(gè)存儲(chǔ)圖像數(shù)據(jù)的矩陣,后期對(duì)圖像的各種處理正是基于該數(shù)據(jù)矩陣來(lái)完成。
2 靶紙圖像預(yù)處理[1]
2.1 圖像灰度化
數(shù)碼相機(jī)拍攝的圖像為彩色圖像,圖像中每個(gè)像素都包含有R(紅色)、G(綠色)、B(藍(lán)色)三種基色分量信息,每種基色分量均需要占用八位來(lái)表示基色強(qiáng)度,數(shù)據(jù)量較大。為減輕計(jì)算機(jī)工作量,去除掉部分無(wú)用信息,將圖像進(jìn)行灰度化處理,減少后續(xù)處理分析耗時(shí)。
在MATLAB中采用rgb2gray()函數(shù)對(duì)圖像進(jìn)行灰度化處理,該函數(shù)中三基色的權(quán)重系數(shù)取值為(0.299,0.587,0.114)[5]。
2.2 圖像增強(qiáng)
對(duì)靶紙圖像增強(qiáng)是為了突出圖像中的有用信息,同時(shí)對(duì)噪聲等無(wú)用信息進(jìn)行一定的消除,類似信號(hào)處理中的濾波器。圖像噪聲常常表現(xiàn)為孤立像素點(diǎn),如果不去除噪聲,會(huì)對(duì)邊緣檢測(cè)、圖像變換以及后續(xù)的彈孔定位帶來(lái)影響。MATLAB中提供了平滑濾波器、中值濾波器以及銳化濾波器這三種圖像增強(qiáng)濾波器[6]。平滑濾波器本質(zhì)上類似低通濾波器,只對(duì)信號(hào)的低頻部分有很好地選通性。靶紙圖像中對(duì)屬于高頻部分的圓環(huán)邊緣提取十分重要,采用平滑濾波器將對(duì)其造成破壞。銳化濾波器有時(shí)會(huì)導(dǎo)致輸出圖像灰度值出現(xiàn)負(fù)值,還需要進(jìn)行相應(yīng)灰度轉(zhuǎn)換,增加處理工作量。本文采用中值濾波器對(duì)靶紙圖像進(jìn)行濾波處理,能有效去除類似斑點(diǎn)噪聲及椒鹽噪聲的孤立像素點(diǎn),同時(shí)較好地保留了圖像的邊緣信息[2]。這是一種非線性的去噪方法,其基本原理是在圖像中一個(gè)像素周圍確定一個(gè)鄰域,以該鄰域中各像素點(diǎn)灰度值的中值來(lái)代換該像素點(diǎn)自身的灰度值[4]。
MATLAB中提供medfilt2()函數(shù)用于對(duì)圖像信息進(jìn)行中值濾波,二維濾波窗口可以為方形、圓形、菱形等,由圖像像素點(diǎn)構(gòu)成,可在函數(shù)中設(shè)置窗口形狀,默認(rèn)為像素點(diǎn)的方形窗口[5]。
2.3 靶紙圖像二值化
由于對(duì)靶紙圖像的處理主要是對(duì)圓環(huán)和彈孔的識(shí)別提取,對(duì)于圖像灰度值并沒(méi)有特定的要求,所以進(jìn)一步對(duì)圖像二值化以去除無(wú)用信息。所選取的閾值需要能夠有效保留圖像特征,保證后續(xù)處理的可靠性。對(duì)灰度化后的靶紙圖像繪制灰度直方圖,如圖1所示。
從直方圖看出灰度值集中在Y220范圍內(nèi),其中Y220對(duì)應(yīng)白色背景以及白色圓環(huán)部分,所以閾值TG取值應(yīng)在30/255
3 基于Hough變換的靶心定位
3.1 Hough變換圓檢測(cè)原理[2,7]
Hough變換將二維圖像平面轉(zhuǎn)換為三維參數(shù)空間,采用類似“投票”模式的判斷方法。三個(gè)參數(shù)值分別為圓心的行坐標(biāo)a,圓心列坐標(biāo)b,以及半徑r。對(duì)于圖像平面中的任何一個(gè)像素點(diǎn)(x,y)都要在三維參數(shù)空間內(nèi)進(jìn)行遍歷運(yùn)算,若運(yùn)算結(jié)果滿足關(guān)系式,則對(duì)應(yīng)三維空間中的參數(shù)點(diǎn)票數(shù)加一。完成運(yùn)算后,三維空間中“票數(shù)”最多(或滿足一定數(shù)量)的參數(shù)點(diǎn),其參數(shù)即為檢測(cè)到的圓所對(duì)應(yīng)圓心坐標(biāo)以及半徑值。Hough變換檢測(cè)圓三個(gè)參數(shù)間的一般關(guān)系如下式:
3.2 用于靶紙圓環(huán)提取的Hough變換降維算法
從Hough變換原理可知,其運(yùn)算過(guò)程中將會(huì)有大量的時(shí)空消耗,減少運(yùn)算維度和參與運(yùn)算的像素點(diǎn)數(shù)可以提高Hough變換效率。前期已對(duì)靶紙圖像進(jìn)行預(yù)處理得到圖像的二值圖,減少了參與Hough變換的像素點(diǎn)數(shù)。接著,采用Sobel算子對(duì)靶紙圓環(huán)進(jìn)行邊緣提取。圖像邊緣是圖像局部特征不連續(xù)的表現(xiàn),出現(xiàn)在兩個(gè)不同圖像區(qū)域的交界,常常是灰度突變的結(jié)果,在灰度突變處進(jìn)行微分運(yùn)算將產(chǎn)生高值[8]。MATLAB中通過(guò)調(diào)用edge()函數(shù)進(jìn)行邊緣提取,函數(shù)計(jì)算結(jié)果為和輸入圖像一樣大小的二值圖。邊緣提取對(duì)圖像的特征信息進(jìn)行提取,進(jìn)一步減少Hough變換算法的工作量,減少運(yùn)算時(shí)間。
由于靶紙圓環(huán)均為同心圓環(huán),只存在一個(gè)位置固定的圓心。經(jīng)邊緣提取后的圖像是由像素點(diǎn)組成的多個(gè)同心圓環(huán),圓環(huán)特征較為明顯,考慮降低Hough變換的計(jì)算維度來(lái)提高計(jì)算速度[9],先進(jìn)行靶紙圓心的提取,將圓心橫縱坐標(biāo)分別提取。首先是橫坐標(biāo)的提取,以平行于X軸的掃描線,自圖像頂部向下縱向掃描。此時(shí)靶紙上圓環(huán)邊緣點(diǎn)值為“1”,背景為“0”,因此每向下掃描一行,記錄該行i中間距最大的兩個(gè)“1”值像素點(diǎn)的橫坐標(biāo)分別為、,直至掃描完圖像。接著,以平行于Y軸的掃描線,自圖像左邊向右橫向掃描,記錄像素點(diǎn)縱坐標(biāo)分別為ali、a2i,直至掃描完圖像。若某行只存在一個(gè)“1”值點(diǎn),則跳過(guò)該行。距離最遠(yuǎn)的兩“1”值點(diǎn)為最外圈圓環(huán)上的點(diǎn),坐標(biāo)中值(ami,bmi)即為對(duì)應(yīng)圓心坐標(biāo),計(jì)算公式如下:
由于邊緣提取后的圓環(huán)邊緣不完全連續(xù),且可能存在彈孔邊緣信息以及噪聲點(diǎn),若以文獻(xiàn)[10]中盡量多弦交點(diǎn)的簡(jiǎn)單統(tǒng)計(jì)平均來(lái)計(jì)算坐標(biāo),將引入上述影響因素,導(dǎo)致圓心定位出現(xiàn)誤差。因此,采用類似Hough變換證據(jù)積累的判斷方法,對(duì)每行/列掃描得出的中值坐標(biāo)采取投票的積累方式,出現(xiàn)相同的中值點(diǎn)坐標(biāo)時(shí)則對(duì)該坐標(biāo)對(duì)應(yīng)“票數(shù)”Na[ami]加1,當(dāng)遍歷完整幅圖像時(shí),找出“票數(shù)”最多的中值點(diǎn)坐標(biāo)ammax。此處,可設(shè)置一個(gè)閾值Ta,考慮到圖像像素點(diǎn)的離散化以及邊緣提取帶來(lái)的影響,將中值坐標(biāo)滿足
內(nèi)的對(duì)應(yīng)點(diǎn)ami求和,接著求取平均值,此平均值記為圓心坐標(biāo)a。同理得b。通過(guò)這種方法可以有效減少非最外圈圓環(huán)上弦交點(diǎn)即錯(cuò)誤點(diǎn)或者噪聲點(diǎn)的干擾的影響。MATLAB中調(diào)用sum()函數(shù)用于求和,調(diào)用max()函數(shù)用于求取最大值。坐標(biāo)關(guān)系式如下:
上述算法的部分MATLAB代碼如下:
%BW為邊緣提取后靶紙圖
[rows,cols]=find(BW); %搜索1值像素點(diǎn)
mount=size(rows); number=mount(1);
i=1; j=1;
while(i
xjd(j,1)=rows(a);
while(i
if(cols(i)==cols(i+1))
xjd(j,2)=rows(i+1);i=i+1;
else
i=i+1; j=j+1; break;
end
end
end
number=length(xjd); Na=zeros(1,number);
for n=1:number%for循環(huán)計(jì)算中值及票數(shù)
zz(n)=round((xjd(n,1)+xjd(n,2))/2);
Na(zz(n))=Na(zz(n))+1;
end
[amax,id]=max(Na); %找出票數(shù)最多中值點(diǎn)
a=(Na(id)*id+Na(id-Ta)*(id- Ta)+Na(id+Ta)*(id+Ta))/
sum(Na(id-Ta:id+Ta))%基于閾值Ta計(jì)算均值得坐標(biāo)a
根據(jù)機(jī)器視覺(jué)中的ROI(Region Of Interest)理論,恰當(dāng)選取ROI能有效減少圖像運(yùn)算的計(jì)算量[11]。根據(jù)先驗(yàn)知識(shí)圖像采集時(shí)圓心處于圖像中部區(qū)域,將待驗(yàn)證像素點(diǎn)所處范圍設(shè)定為圖像中部的矩形區(qū)域,該矩形區(qū)域邊長(zhǎng)設(shè)為圖像邊長(zhǎng)的1/4,由此進(jìn)一步減少參與運(yùn)算的像素點(diǎn)。本算法將圓的參數(shù)方程寫(xiě)為極坐標(biāo)形式:
已知圓心坐標(biāo),根據(jù)先驗(yàn)知識(shí)設(shè)定r的可能取值范圍,遍歷計(jì)算感興趣區(qū)域中的邊緣點(diǎn),采用上述Hough變換證據(jù)積累的方法得到r[9],且設(shè)定一個(gè)閾值Tr,減少離散數(shù)據(jù)帶來(lái)的誤差。閾值的設(shè)定使得對(duì)于一些存在干擾的靶紙圖像也能有效地進(jìn)行圓環(huán)檢測(cè),例如靶紙存在一定形變或者是子彈擊中內(nèi)圓環(huán)帶來(lái)的干擾,提高了算法的魯棒性。
4 基于圖像差影法的彈孔定位[12]
4.1 圖像差影算法[2,4]
本文在彈孔定位的分析上,將彈孔視為一個(gè)運(yùn)動(dòng)目標(biāo),每次射擊后彈著點(diǎn)都不同,近似為目標(biāo)的運(yùn)動(dòng)過(guò)程。運(yùn)動(dòng)目標(biāo)的檢測(cè)算法有幀間差分法、背景差分法以及基于光流場(chǎng)的檢測(cè)方法,圖像差影法是利用當(dāng)前圖像與初始圖像進(jìn)行減運(yùn)算來(lái)提取目標(biāo)的一種檢測(cè)方法[13]。首先,采集射擊前的靶紙圖像以及本次射擊后的靶紙圖像,將兩幅圖像視為視頻中的前后兩幀圖像,接著采用幀間差分法獲得彈孔信息,并將彈孔圖像二值化處理。
4.2 形態(tài)學(xué)濾波處理[3]
提取的彈孔圖像可能會(huì)包含噪聲,將會(huì)導(dǎo)致彈孔定位出現(xiàn)誤差,對(duì)該圖像進(jìn)行先腐蝕后膨脹處理的開(kāi)運(yùn)算[5]。在MATLAB中調(diào)用imerode()函數(shù)對(duì)圖像進(jìn)行腐蝕操作,去除圖像中小而無(wú)意義的噪聲像素點(diǎn);接著調(diào)用imdilate()函數(shù)對(duì)圖像進(jìn)行膨脹操作,使彈孔區(qū)域恢復(fù)至原始大小,即消除由于腐蝕對(duì)彈孔面積帶來(lái)的影響。兩個(gè)函數(shù)均采用strel()函數(shù)定義一個(gè)結(jié)構(gòu)元素,其在形態(tài)學(xué)中的作用好比濾波器中的濾波窗口,該函數(shù)支持創(chuàng)建線形、矩形、方形、球形和自定義類型等的結(jié)構(gòu)元素。
實(shí)現(xiàn)彈孔提取及定位的部分MATLAB代碼如下:
b=imread('current.jpg'); %靶紙讀取
B=I-b; %射擊前后的靶紙圖像差影
B=im2bw(B,T); %基于閾值T進(jìn)行二值化
subplot(221),imshow(B)
se=strel('square',2); %定義方形結(jié)構(gòu)元素
imeBW=imerode(B,se); %圖像腐蝕
subplot(222),imshow(imeBW)
imdBW=imdilate(imeBW,se); %圖像膨脹
subplot(223),imshow(imdBW)
[row,col]=find(imdBW==1); %搜索彈孔
x=min(col); w=max(col)-x;
y=min(row); h=max(row)-y;
subplot(224),imshow(imdBW)
hold on; %圖像保持
rectangle('Position',[x,y,w,h],'LineWidth',1,'EdgeColor',
'w'); %框彈孔區(qū)域
5 實(shí)驗(yàn)結(jié)果
仿真實(shí)驗(yàn)在2.3GHz,RAM為4GB的計(jì)算機(jī)上進(jìn)行,采用MATLAB8.2語(yǔ)言編寫(xiě)代碼。本次實(shí)驗(yàn)采用靶紙滿環(huán)11環(huán),且不同環(huán)數(shù)圓環(huán)半徑差相同。實(shí)驗(yàn)結(jié)果如圖2、圖3和圖4所示。
求得彈著點(diǎn)環(huán)數(shù)及誤差。其中(a,b)為環(huán)心坐標(biāo),(xd,yd)為彈孔坐標(biāo),r為中心圓環(huán)半徑,Hj為環(huán)數(shù)計(jì)算值,Sj為人工計(jì)算值(采用尺規(guī)法測(cè)量),ρ為環(huán)數(shù)相對(duì)誤差。計(jì)算結(jié)果若為負(fù)數(shù),則判為脫靶。靶紙測(cè)試結(jié)果如表1所示。
6 總結(jié)
基于MATLAB函數(shù)工具箱的圖像處理,函數(shù)調(diào)用方便,程序設(shè)計(jì)高效。首先通過(guò)圖像預(yù)處理去除無(wú)用信息,接著將Hough變換算法降維進(jìn)行內(nèi)圓環(huán)的定位,最后搜索定位彈孔,求出彈著點(diǎn)坐標(biāo),方案適用于圓環(huán)完整的靶紙識(shí)別。計(jì)算出的射擊環(huán)數(shù)相比人工計(jì)算誤差在0.1環(huán)以內(nèi),且計(jì)算速度較快。進(jìn)一步,可考慮靶紙形變帶來(lái)的影響或?qū)⒎桨皋D(zhuǎn)換為硬件系統(tǒng)以提高實(shí)時(shí)處理性能,可以應(yīng)用于射擊比賽中的自動(dòng)報(bào)靶系統(tǒng),免去人工報(bào)靶可能帶來(lái)的不確定性因素,提高比賽的公正度和效率。
參考文獻(xiàn)(References):
[1] 周曉偉.基于圖像處理的自動(dòng)報(bào)靶系統(tǒng)研究[D].中北大學(xué)碩
士學(xué)位論文,2011.
[2] 陳海萍.基于機(jī)器視覺(jué)技術(shù)的模擬射擊訓(xùn)練系統(tǒng)研究與設(shè)計(jì)[D].
廈門大學(xué)碩士學(xué)位論文,2012.
[3] 羅真.基于圖像處理的自動(dòng)報(bào)靶系統(tǒng)設(shè)計(jì)[D].中南大學(xué)碩士
學(xué)位論文,2014.
[4] 謝殿強(qiáng).基于ARM-Linux機(jī)器視覺(jué)的軍用自動(dòng)報(bào)靶系統(tǒng)的
研究[D].山東大學(xué)碩士學(xué)位論文,2009.
[5] 周品.MATLAB圖像處理與圖形用戶界面設(shè)計(jì)[M].清華大學(xué)
出版社,2013.
[6] 葉雯.基于MATLAB的圖像去噪研究[J].計(jì)算機(jī)時(shí)代,
2015.6:10-12
[7] 陳小艷,王強(qiáng),李柏林.改進(jìn)的Hough變換檢測(cè)圓方法[J].計(jì)算
機(jī)系統(tǒng)應(yīng)用,2015.8:197-201
[8] 蔣先剛.數(shù)字圖像模式識(shí)別工程軟件設(shè)計(jì)[M].中國(guó)水利水電
出版社,2008.
[9] 趙京東.用兩步Hough變換檢測(cè)圓[J].計(jì)算機(jī)應(yīng)用,2008.7:
1761-1763
[10] 孫蓉蓉.圖像處理技術(shù)在自動(dòng)報(bào)靶系統(tǒng)中的應(yīng)用研究[D].南
京理工大學(xué)碩士學(xué)位論文,2006.
[11] 孫國(guó)棟,趙大興.機(jī)器視覺(jué)檢測(cè)理論與算法[M].科學(xué)出版社,
2015.
[12] 崔亞琳.基于計(jì)算機(jī)視覺(jué)的射箭精確自動(dòng)報(bào)靶系統(tǒng)研究[J].
火控雷達(dá)技術(shù),2015.12:27-30
關(guān)鍵詞:數(shù)字圖像處理 教學(xué)模式 教學(xué)改革
中圖分類號(hào):G642
文獻(xiàn)標(biāo)識(shí)碼:A
文章編號(hào):1004-4914(2013)05-216-02
一、引言
隨著電子和信息技術(shù)的迅速發(fā)展,數(shù)字圖像處理已成為當(dāng)今信息處理技術(shù)中發(fā)展很快且應(yīng)用面很廣的新興學(xué)科之一?!皵?shù)字圖像處理”課程也成為了高校本科計(jì)算機(jī)與信息類專業(yè)的一門專業(yè)核心課程。但由于數(shù)字圖像處理學(xué)科所涉及的知識(shí)面廣,理論復(fù)雜,對(duì)數(shù)學(xué)基礎(chǔ)的要求高,實(shí)踐環(huán)節(jié)動(dòng)手能力要求強(qiáng),其課程內(nèi)容也在不斷更新豐富。在以往傳統(tǒng)教學(xué)過(guò)程中呈現(xiàn)出了以下弊端:(1)教材中大量理論和算法推導(dǎo)給學(xué)生的學(xué)習(xí)帶來(lái)困難;(2)單一的單機(jī)版多媒體教學(xué),無(wú)法滿足學(xué)生對(duì)新知識(shí)、新技術(shù)、新應(yīng)用的了解和深入學(xué)習(xí);(3)沒(méi)有完善系統(tǒng)的實(shí)驗(yàn)指導(dǎo)書(shū),促使學(xué)生學(xué)習(xí)的積極性下降,導(dǎo)致實(shí)驗(yàn)效果不佳;(4)沒(méi)有實(shí)際項(xiàng)目作為應(yīng)用鍛煉,造成理論與實(shí)踐脫鉤,無(wú)法激發(fā)學(xué)生的學(xué)習(xí)動(dòng)力和興趣等。
針對(duì)數(shù)字圖像處理教學(xué)過(guò)程中出現(xiàn)的上述問(wèn)題,國(guó)內(nèi)很多教學(xué)專家和學(xué)者,結(jié)合自己的實(shí)際教學(xué)過(guò)程,各抒己見(jiàn),陸續(xù)提出了很多寶貴的改革建議和方案,取得了相應(yīng)的教學(xué)改革成果。如山東工商學(xué)院的魏廣芬和王永強(qiáng)等于2009年針對(duì)“數(shù)字圖像處理”課程和學(xué)生特點(diǎn),介紹了教學(xué)過(guò)程中實(shí)施的一些改革措施,包括采用現(xiàn)代化教學(xué)手段,“設(shè)問(wèn)-思考-引導(dǎo)-嘗試-總結(jié)”的教學(xué)模式和學(xué)生分組的學(xué)習(xí)方式,加強(qiáng)實(shí)驗(yàn)和課程設(shè)計(jì)教學(xué)環(huán)節(jié)以及完善評(píng)分機(jī)制等方面。并對(duì)教學(xué)過(guò)程中發(fā)現(xiàn)的相關(guān)問(wèn)題進(jìn)行探討。西北民族大學(xué)的李向群和王書(shū)文于2010年從教學(xué)內(nèi)容建設(shè)、教學(xué)手段改革、實(shí)驗(yàn)環(huán)境建立、考核方式改革等方面入手進(jìn)行了深入細(xì)致的探討,并將這些方法應(yīng)用到實(shí)際教學(xué)過(guò)程中,收到了較好的效果。中國(guó)傳媒大學(xué)的呂朝輝也于2010年根據(jù)數(shù)字圖像處理課程的特點(diǎn),探討了本門課程的教學(xué)改革和實(shí)踐,經(jīng)過(guò)五年來(lái)的教學(xué)實(shí)施,取得了良好的教學(xué)效果。南通大學(xué)的趙敏于2011年,針對(duì)該課程的特點(diǎn),論述了在教學(xué)中引入案例教學(xué)法的可行性和具體實(shí)施方案。
通過(guò)對(duì)上述數(shù)字教學(xué)改革的學(xué)習(xí)和研究,結(jié)合我?!按蟮掠?,大工程,大實(shí)踐”的辦學(xué)理念和信息與計(jì)算科學(xué)專業(yè)“3+1”教育模式(本專業(yè)“3+1”教育模式是指3年在學(xué)校完成理論課學(xué)習(xí),1年在軟件實(shí)習(xí)公司等完成工程實(shí)訓(xùn)、生產(chǎn)實(shí)習(xí)、畢業(yè)實(shí)習(xí)和畢業(yè)設(shè)計(jì)等實(shí)踐環(huán)節(jié),以培養(yǎng)應(yīng)用型人才為培養(yǎng)目標(biāo))及本科生的特點(diǎn)。對(duì)本專業(yè)數(shù)字圖像處理課程的教學(xué)進(jìn)行了改革研究和實(shí)踐。建立了一個(gè)以學(xué)生為主體,以現(xiàn)代網(wǎng)絡(luò)多媒體教學(xué)為平臺(tái),以大學(xué)生科研立項(xiàng)為載體,以大學(xué)生就業(yè)或考研深造為目標(biāo)的一套較為完善的數(shù)字圖像處理課程教學(xué)體系結(jié)構(gòu)。
二、課程改革內(nèi)容
結(jié)合傳統(tǒng)教學(xué)中存在的問(wèn)題,和現(xiàn)代網(wǎng)絡(luò)多媒體教學(xué)建設(shè)的需要。本課題研究?jī)?nèi)容主要將通過(guò)教學(xué)內(nèi)容、教學(xué)方法、教學(xué)手段和考核機(jī)制來(lái)探索和實(shí)施。
1.優(yōu)化教學(xué)內(nèi)容。數(shù)字圖像處理課程的基本內(nèi)容包括圖像處理的基礎(chǔ)知識(shí)、圖像增強(qiáng)、圖像變換、圖像分割、圖像復(fù)原、圖像特征提取與選取以及圖像壓縮編碼等知識(shí)。但隨著信息化時(shí)代知識(shí)的加快更新、技術(shù)快速革新,數(shù)字圖像處理課程已成為模式識(shí)別和計(jì)算機(jī)視覺(jué)等新學(xué)科的基礎(chǔ),并根據(jù)學(xué)生就業(yè)需求的主線要求。通過(guò)對(duì)教學(xué)內(nèi)容的深入研究,在本專業(yè)新版教學(xué)大綱中,對(duì)授課內(nèi)容中要求以基礎(chǔ)理論知識(shí)為基礎(chǔ),把相關(guān)的科研項(xiàng)目和實(shí)際項(xiàng)目滲透到授課中。例如在介紹圖像處理的基礎(chǔ)知識(shí)的時(shí)候,我們可以結(jié)合案例驅(qū)動(dòng)來(lái)講述圖像處理的過(guò)程;將車牌識(shí)別、人臉識(shí)別、筆記識(shí)別等實(shí)際項(xiàng)目穿插到圖像增強(qiáng)、圖像分割、頻域處理以及特征提取與選取中。同時(shí),我們把信息熵、模糊數(shù)學(xué)和小波分析等概念滲透到部分章節(jié)中,并給出該理論解決問(wèn)題的結(jié)果,以提高學(xué)生學(xué)習(xí)新理論的興趣,促使部分同學(xué)自學(xué)新的理論,培養(yǎng)學(xué)生的自學(xué)能力。在講述專業(yè)基礎(chǔ)知識(shí)的過(guò)程中,我們將適時(shí)地增強(qiáng)相關(guān)的軟件的學(xué)習(xí)和資源庫(kù)的介紹,例如通過(guò)實(shí)驗(yàn)和實(shí)訓(xùn)的教學(xué)加強(qiáng)學(xué)生對(duì)Matlab和VC++等語(yǔ)言的學(xué)習(xí)和實(shí)踐。通過(guò)CNKI和IEEE Tran文章的介紹,提高學(xué)生對(duì)最新科研成果的了解,激發(fā)學(xué)生學(xué)習(xí)的興趣,培養(yǎng)學(xué)生對(duì)新事物的學(xué)習(xí)能力。鼓勵(lì)學(xué)生進(jìn)行大學(xué)生參加校內(nèi)科研立項(xiàng),引導(dǎo)學(xué)生分析問(wèn)題和解決實(shí)際問(wèn)題的能力,進(jìn)一步提高學(xué)生的綜合素質(zhì)能力。
2.豐富教學(xué)方法。在以往的教學(xué)過(guò)程中,數(shù)字圖像處理課程的教學(xué)主要以“填鴨式”教學(xué)方法為主,只注重對(duì)學(xué)生的教,而忽視了學(xué)生的學(xué)和做,沒(méi)能產(chǎn)生良好的教學(xué)效果。通過(guò)對(duì)當(dāng)前主要教學(xué)方法的研究與探索,我們豐富了數(shù)字圖像處理課程的教學(xué)方法,以“啟發(fā)式”教學(xué)方法為主,以綜合運(yùn)用講授法、研究法、討論法、實(shí)驗(yàn)法等教學(xué)法,把“教、學(xué)和做”很好地穿插起來(lái),發(fā)揮各種方法的優(yōu)勢(shì),引導(dǎo)學(xué)生積極參與教學(xué),實(shí)現(xiàn)教與學(xué)深層次互動(dòng)。促進(jìn)學(xué)生對(duì)數(shù)字圖像處理基本知識(shí)和方法的掌握及動(dòng)手能力的培養(yǎng)。
3.提升教學(xué)手段。針對(duì)該門課程理論性強(qiáng)、乏味單調(diào)的特點(diǎn),應(yīng)用現(xiàn)代網(wǎng)絡(luò)多媒體教學(xué)手段,借鑒當(dāng)前較為流行的CDIO教學(xué)模式,進(jìn)行教學(xué)手段的提升。結(jié)合教學(xué)內(nèi)容的組合的優(yōu)化和教學(xué)方法的豐富,在教學(xué)中以現(xiàn)代網(wǎng)絡(luò)多媒體為教學(xué)媒體,通過(guò)制作多媒體課件,以“少而精”和“圖文并茂”為原則,并結(jié)合Matlab和VC++等軟件編程實(shí)例的案例教學(xué),在課堂教學(xué)中適時(shí)引入前沿?zé)狳c(diǎn)圖例分析和編程處理實(shí)例,引導(dǎo)學(xué)生進(jìn)行理論知識(shí)的學(xué)習(xí),使學(xué)生體會(huì)到易學(xué)、樂(lè)學(xué)和會(huì)做。
4.改善考核機(jī)制。摒棄了以往“一考定乾坤”的考核方式,將平時(shí)出勤與課堂表現(xiàn)情況、作業(yè)和實(shí)驗(yàn)成績(jī)等進(jìn)行量化,納入最終成績(jī)的綜合評(píng)核。并結(jié)合“3+1”創(chuàng)新教育模式對(duì)學(xué)生實(shí)踐能力和CDIO培養(yǎng)大綱對(duì)學(xué)生素質(zhì)進(jìn)行全面考核的要求。側(cè)重學(xué)生對(duì)基礎(chǔ)知識(shí)的把握、個(gè)體實(shí)踐能力、團(tuán)隊(duì)協(xié)作能力的考核。
三、實(shí)踐效果
通過(guò)數(shù)字圖像處理教學(xué)內(nèi)容、教學(xué)方法、教學(xué)手段和考核機(jī)制等四方面的改革研究與實(shí)踐,近幾年本專業(yè)每年都有10%左右的學(xué)生選擇數(shù)字圖像處理的相關(guān)研究?jī)?nèi)容作為本科畢業(yè)論文選題,并取得了較好的成績(jī)。通過(guò)對(duì)畢業(yè)生的跟蹤調(diào)查發(fā)現(xiàn),考研深造的部分學(xué)生也把圖像處理及新興相關(guān)學(xué)科前沿方向作為自己的學(xué)術(shù)研究方向,工作就業(yè)的部分學(xué)生也從事了與數(shù)字圖像處理相關(guān)的研究工作領(lǐng)域。
四、結(jié)束語(yǔ)
本文對(duì)以往數(shù)字圖像處理課程教學(xué)過(guò)程中存在的主要問(wèn)題進(jìn)行了簡(jiǎn)要的介紹,并對(duì)主要相關(guān)學(xué)者的教學(xué)改革內(nèi)容進(jìn)行了闡述。結(jié)合我校的教學(xué)理念以及本專業(yè)的“3+1”教學(xué)改革模式,針對(duì)本專業(yè)本科生的特點(diǎn),進(jìn)行了數(shù)字圖像處理教學(xué)的改革研究和實(shí)踐。實(shí)踐表明,此次教學(xué)改革提高了教學(xué)效果,得到了學(xué)生的認(rèn)可和好評(píng)。完成了對(duì)本專業(yè)學(xué)生在知識(shí)、能力與素質(zhì)等方面要求的綜合培養(yǎng)。
[基金項(xiàng)目:黑龍江省教育科學(xué)“十二五”規(guī)劃研究課題(GBC1212076);黑龍江科技學(xué)院教學(xué)研究項(xiàng)目]
參考文獻(xiàn):
1.魏廣芬,王永強(qiáng),丁昕苗,何愛(ài)香.“數(shù)字圖像處理”課程教學(xué)改革的嘗試.電氣電子教學(xué)學(xué)報(bào),2009(6)
2.李向群,王書(shū)文.《數(shù)字圖像處理》課程的教學(xué)改革初探.微計(jì)算機(jī)信息,2010(3-2)
3.呂朝輝.數(shù)字圖像處理課程教學(xué)改革與實(shí)踐.高教論壇,2010(11)
4.趙敏.MATLAB用于數(shù)字圖像處理的教學(xué)實(shí)踐研究.電腦知識(shí)與技術(shù),2012(31)
5.查建中.CDIO:顛覆性的工科教育模式改革[J].中國(guó)遠(yuǎn)程教育,2009(3)
關(guān)鍵詞:注冊(cè);識(shí)別;圖像獲取
1.指紋識(shí)別技術(shù)的發(fā)展
在生活中較常見(jiàn)的指紋識(shí)別應(yīng)用有:指紋鎖、指紋考勤、指紋門禁、指紋保管箱、筆記本電腦指紋登陸模塊、手機(jī)指紋開(kāi)機(jī)驗(yàn)證模塊、指紋網(wǎng)上銀行。相信隨著技術(shù)發(fā)展成熟,應(yīng)用成本越來(lái)越低,指紋識(shí)別技術(shù)會(huì)越來(lái)越廣泛地應(yīng)用到我們?nèi)粘I钪衼?lái)。
指紋識(shí)別由于其電子門鎖技術(shù)的成熟和成本降低,開(kāi)始徹底走向民用。國(guó)內(nèi)生物識(shí)別未來(lái)將形成上百億元的市場(chǎng),其中安防業(yè)是最重要的應(yīng)用領(lǐng)域之一,市場(chǎng)空間很大。目前,羅湖口岸已經(jīng)用了指紋通關(guān),德國(guó)將指紋識(shí)別付款應(yīng)用到某些超市中。預(yù)計(jì)指紋門禁、指紋讀卡器、指紋智能鎖,指紋門禁考勤一體機(jī)及相關(guān)指紋身份識(shí)別系統(tǒng)將會(huì)迅速普及到每一個(gè)安全防范項(xiàng)目和智能大廈,目前國(guó)內(nèi)年門禁安裝數(shù)量大約是在50萬(wàn)門以上,其中指紋識(shí)別的在門禁應(yīng)用大概只有1%左右,而一般國(guó)外這個(gè)比例大約應(yīng)為20%以上。換句話說(shuō),在國(guó)內(nèi)安防業(yè),生物識(shí)別產(chǎn)品的市場(chǎng)缺口在9.5萬(wàn)臺(tái)左右,另一個(gè)比較明顯的狀況是,目前專門從事指紋讀頭和電子門鎖指紋門禁生產(chǎn)和銷售企業(yè)很少,所以綜合起來(lái)看這個(gè)市場(chǎng)有兩個(gè)明顯的特點(diǎn):市場(chǎng)大,競(jìng)爭(zhēng)少。
社會(huì)在不斷的進(jìn)步,身份的鑒別工作也提出越來(lái)越高的要求,在各種生物特征識(shí)別技術(shù)中,歷史最悠久、使用最廣泛的無(wú)疑是指紋識(shí)別技術(shù),是一種相對(duì)比較成熟的身份鑒別方法,無(wú)論是在科學(xué)研究還是在工業(yè)界的實(shí)際應(yīng)用中都得到了人們的廣泛關(guān)注。盡管指紋識(shí)別技術(shù)在研究與使用得到了關(guān)注,但其發(fā)展還是不能滿足社會(huì)日益增長(zhǎng)的需求,究其原因是指紋識(shí)別在識(shí)別率、穩(wěn)定性以及識(shí)別速度等方面還不能夠滿足實(shí)際使用時(shí)的要求。
2.指紋識(shí)別技術(shù)的應(yīng)用
毫無(wú)疑問(wèn),指紋識(shí)別技術(shù)具有廣泛的市場(chǎng)前景,其社會(huì)效益及經(jīng)濟(jì)效益是具大的,一般的自動(dòng)指紋識(shí)別技術(shù)都需要有四個(gè)過(guò)程,即指紋圖像的獲取、指紋圖像的處理、指紋特征提取和指紋匹配,也就是說(shuō),指紋識(shí)別的大部分工作都是數(shù)字圖像處理的工作,而本文的主要研究?jī)?nèi)容也是數(shù)字圖像處理在指紋識(shí)別中的應(yīng)用。在數(shù)字圖像處理中,圖像獲取就是把一幅模擬圖像(如照片、畫(huà)片等)轉(zhuǎn)換成適合計(jì)算機(jī)或數(shù)字設(shè)備的數(shù)字信號(hào)。這一過(guò)程主要包換攝取圖像、光電轉(zhuǎn)換、數(shù)字化等步驟,而指紋圖像的獲取就是通過(guò)一定的設(shè)備采集手指表面的指紋凹凸信息同時(shí)將之轉(zhuǎn)化為數(shù)字信號(hào)圖像的過(guò)程;而在指紋圖像處理的過(guò)程中,包含了幾種常用的圖像處理手段,如圖像增強(qiáng),圖像分割等,其中在圖像增強(qiáng)的過(guò)程中又包含了灰度與對(duì)比度的處理過(guò)程,主要是為了突出圖像中感興趣的信息,衰減或去除不需要的信息,從而使有用的信息得到增強(qiáng),便于目標(biāo)區(qū)分或?qū)ο窭斫?;指紋特征提取則是從經(jīng)過(guò)預(yù)處理的圖像中提取指紋特征;指紋匹配顧名思義是指匹配指紋的特征,從而進(jìn)行識(shí)別。故對(duì)幾幅指紋圖像進(jìn)行匹配一般是從圖像中提取的特征進(jìn)行匹配。
一般來(lái)說(shuō),指紋圖像有全局特征和局部特征兩大特征,能夠反映指紋整體開(kāi)關(guān)特征的是全局特征,這個(gè)特征的提取一般局于指紋分類;能夠反映指紋細(xì)節(jié)特點(diǎn)是局部特征,這個(gè)特征一般用于指紋對(duì)比。指紋線中的中斷點(diǎn)、交叉點(diǎn)及拐點(diǎn)是指紋的特征點(diǎn)。
指紋識(shí)別系統(tǒng)的主要工作分為兩個(gè)階段,即注冊(cè)階段與識(shí)別階段,也就是提取指紋特征和識(shí)別指紋特征的過(guò)程。一般在注冊(cè)階段,都要求輸入各自的用戶名以及對(duì)應(yīng)的指紋,該過(guò)程需要將手指放在專門的采集指紋窗口上,經(jīng)過(guò)指紋識(shí)別系統(tǒng)的指定模塊特征提取模塊將輸入指紋的特征提取出來(lái),結(jié)合用戶名形成一個(gè)數(shù)據(jù)庫(kù);識(shí)別階段時(shí),該系統(tǒng)會(huì)將輸入的指紋與數(shù)據(jù)庫(kù)中現(xiàn)在有的指紋中進(jìn)行一系列的匹配,特征點(diǎn)特征線等,這個(gè)過(guò)程需要讀取數(shù)據(jù)庫(kù)中保存的指紋特征信息。通用的指紋識(shí)別系統(tǒng)的流程圖如圖1所示。
圖1指紋識(shí)別系統(tǒng)
就使用情況看,現(xiàn)有的指紋識(shí)別系統(tǒng)通常分為兩大類,即嵌入式系統(tǒng)和計(jì)算機(jī)終端指紋識(shí)別系統(tǒng)。嵌入式系統(tǒng)是一個(gè)獨(dú)立的系統(tǒng),它不需要其它的設(shè)備就可以完成工作,這方面的應(yīng)用有指紋鎖,指紋考勤機(jī)(此處的指紋考勤機(jī)需要定期連接設(shè)備讀取存檔)等;計(jì)算機(jī)終端的指紋識(shí)別系統(tǒng)的設(shè)計(jì)與使用則更加靈活,通過(guò)計(jì)算機(jī)的分配,可以使多個(gè)系統(tǒng)共同使用指紋數(shù)據(jù)庫(kù),若用在考勤設(shè)備中,則可以實(shí)時(shí)顯示該工作人員是否在崗。
除了公司等地的考勤、安保等地,還有一個(gè)與我們是日常生活更為接近的使用場(chǎng)合,即筆記本的指紋識(shí)別系統(tǒng),現(xiàn)在,有很多品牌的筆記本已經(jīng)將指紋識(shí)別系統(tǒng)應(yīng)用到計(jì)算機(jī)上,筆記本的指紋識(shí)別系統(tǒng)大概經(jīng)歷了兩代,第一代的指紋識(shí)別系統(tǒng)使用的是光學(xué)識(shí)別系統(tǒng),這種技術(shù)容易出錯(cuò)而且不穩(wěn)定,而第二代指紋識(shí)別系統(tǒng)采用的是電容傳感技術(shù),利用小信號(hào)創(chuàng)建指紋圖像的半導(dǎo)體設(shè)備,電容傳感器產(chǎn)生的電子信號(hào)可以直接達(dá)到真皮層讀取指紋圖案,提高了整個(gè)系統(tǒng)的可靠性。
3.結(jié)束語(yǔ)
指紋作為生物特征之一,其先天具有的不變性,唯
一性和可分類性,是公認(rèn)的具有法律地位的個(gè)人身份特
征的可靠證據(jù)。指紋識(shí)別系統(tǒng)相對(duì)其他生物識(shí)別系統(tǒng),
起點(diǎn)較早、種類最多應(yīng)用最廣泛,由于指紋識(shí)別系統(tǒng)成
本低,可以集成在很小的芯片上進(jìn)行處理,已經(jīng)普遍被
用來(lái)替換用戶名/ 口令、電子令牌等傳統(tǒng)的身份認(rèn)證終
端設(shè)備。目前,指紋識(shí)別系統(tǒng)已用到了幾乎所有需要進(jìn)
行安全性防范的場(chǎng)合,遍及諸多領(lǐng)域。
參考文獻(xiàn):
[1] 郭浩.基于嵌入式隱Markov模型的指紋分類和匹配研究.[博士學(xué)位論文].大連:大連理工大學(xué),2004
[2] Jain A K, Pankanti S. Automated Fingerprint Identification and Imaging Systems. Technical Report. Miehigan State University,1999.
[3] 李曉昆.基于結(jié)構(gòu)特征的指紋識(shí)別.計(jì)算機(jī)工程與科學(xué).1999,21(2):25~29
[4] 王崇文,李見(jiàn)為等.自動(dòng)指紋識(shí)別系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn).計(jì)算機(jī)應(yīng)用.2001,12:63~65
[5] 章毓晉.中國(guó)圖像工程及當(dāng)前的兒個(gè)研究熱點(diǎn).計(jì)算機(jī)輔助設(shè)計(jì)與圖形學(xué)學(xué)報(bào),2002,14(6):489~193
[6] 高靖靖.指紋識(shí)別預(yù)處理算法研究:[碩士學(xué)位論文].成都:電子科技大學(xué),2007
關(guān)鍵詞:表格圖像處理;性能評(píng)測(cè);表格版面結(jié)構(gòu);線條交點(diǎn)
中圖分類號(hào):TP751文獻(xiàn)標(biāo)識(shí)碼:A文章編號(hào):1009-3044(2007)03-10754-02
1 引言
隨著圖像處理技術(shù)的不斷發(fā)展,對(duì)文檔圖像的處理已經(jīng)從一個(gè)字符識(shí)別器發(fā)展到一個(gè)復(fù)雜的包含圖文分割、公式識(shí)別、表格識(shí)別等功能的智能化系統(tǒng)。其中表格圖像最為常見(jiàn),對(duì)于表格圖像的識(shí)別也是DIP(Document Image Processing)領(lǐng)域的一個(gè)研究重點(diǎn)[1]。
表格圖像中表格結(jié)構(gòu)的存在是不確定的,表格結(jié)構(gòu)存在的數(shù)量和位置也是不固定的。表格圖像處理的目的就是從包含有表格數(shù)據(jù)的圖像中定位出表格的位置,然后再對(duì)表格內(nèi)部版面結(jié)構(gòu)進(jìn)行分析,最后按照某種格式保存,變成計(jì)算機(jī)能夠處理的表格信息。表格圖像處理技術(shù)是一個(gè)有相當(dāng)難度的課題[1],許多處理方法不盡完善,需要不斷探索,針對(duì)表格圖像處理系統(tǒng)建立一個(gè)完整的評(píng)測(cè)體系尤為重要。目前的評(píng)測(cè)方法主要有兩種:一種是手工評(píng)測(cè),一種是自動(dòng)評(píng)測(cè)。手工評(píng)測(cè)是由評(píng)測(cè)人員用肉眼來(lái)觀察處理結(jié)果的好壞,自動(dòng)評(píng)測(cè)是利用評(píng)測(cè)軟件分析系統(tǒng)的處理性能,評(píng)測(cè)過(guò)程是自動(dòng)或半自動(dòng)的。
本文針對(duì)表格版面結(jié)構(gòu)定位與分析的性能評(píng)測(cè)問(wèn)題展開(kāi)研究,在前人提出的“線條交點(diǎn)矩陣”匹配的評(píng)測(cè)機(jī)制[8]基礎(chǔ)上,做了優(yōu)化和改良,建立了完整的評(píng)測(cè)系統(tǒng),最后,基于南開(kāi)大學(xué)機(jī)器智能研究所RTK系統(tǒng),進(jìn)行實(shí)際的測(cè)試分析,得出實(shí)驗(yàn)結(jié)果。
2 表格圖像處理自動(dòng)評(píng)測(cè)模型
2.1 性能評(píng)測(cè)基本概念
首先我們引入DIP系統(tǒng)評(píng)測(cè)機(jī)制中使用的概念:
(1)性能評(píng)測(cè)(Performance Evaluation):根據(jù)一系列基準(zhǔn)數(shù)據(jù)對(duì)系統(tǒng)進(jìn)行性能測(cè)試。
(2)理想系統(tǒng)(Ideal System):相對(duì)實(shí)際待評(píng)測(cè)系統(tǒng)而言的,是個(gè)理想化的系統(tǒng),對(duì)于一定的輸入,產(chǎn)生期望的輸出。每個(gè)實(shí)際系統(tǒng)都有個(gè)對(duì)應(yīng)的理想系統(tǒng)。
(3)測(cè)試樣本(Test Sample):在系統(tǒng)測(cè)試或者評(píng)測(cè)過(guò)程中需要的對(duì)實(shí)際系統(tǒng)的輸入。
(4)測(cè)試基準(zhǔn)(Ground Truth):就是標(biāo)準(zhǔn)結(jié)果,測(cè)試樣本輸入理想系統(tǒng)得到的結(jié)果[3]。
(5)處理結(jié)果(Processing Result):將測(cè)試基準(zhǔn)作為實(shí)際系統(tǒng)的輸入,得到的結(jié)果就是處理結(jié)果。
(6)評(píng)測(cè)機(jī)制(Evaluation Mechanism):包括確定評(píng)測(cè)內(nèi)容、設(shè)計(jì)評(píng)測(cè)方法、制定評(píng)測(cè)標(biāo)準(zhǔn)和評(píng)測(cè)參數(shù)、選擇評(píng)測(cè)樣本、監(jiān)督評(píng)測(cè)實(shí)施和分析評(píng)測(cè)結(jié)果。
2.2 自動(dòng)性能評(píng)測(cè)流程
圖1簡(jiǎn)單描述了表格圖像處理性能評(píng)測(cè)的流程:
圖1 性能評(píng)測(cè)流程簡(jiǎn)圖
其中標(biāo)準(zhǔn)結(jié)果是評(píng)測(cè)系統(tǒng)的一個(gè)基準(zhǔn),它是表格的所有線條和交點(diǎn)的集合,我們構(gòu)建一個(gè)數(shù)據(jù)庫(kù)來(lái)存放表格的標(biāo)準(zhǔn)結(jié)果;實(shí)際系統(tǒng)是我們待評(píng)測(cè)的表格處理系統(tǒng);評(píng)測(cè)函數(shù)是自動(dòng)評(píng)測(cè)的核心。一個(gè)有效的評(píng)測(cè)算法是做到自動(dòng)評(píng)測(cè)的關(guān)鍵[4],本文采用的是“線條交點(diǎn)”的評(píng)測(cè)機(jī)制,從整體和局部都能找到錯(cuò)誤的原因,為表格圖像的處理性能提高和完善提供指導(dǎo)信息;性能評(píng)測(cè)的結(jié)果是評(píng)測(cè)的比較結(jié)果,我們以圖形和表格等信息來(lái)描述評(píng)測(cè)結(jié)果。
2.4 基于線條交點(diǎn)的評(píng)測(cè)模型
表格的復(fù)雜版面結(jié)構(gòu)可以用表格中水平和豎直線的交點(diǎn)來(lái)描述,如圖2是一個(gè)表格圖像,它的結(jié)構(gòu)可以用圖3所示的線條交點(diǎn)來(lái)描述,其中表格邊線缺失的情況用虛線補(bǔ)齊。
圖2
圖3
(1)表格版面結(jié)構(gòu)定位的評(píng)測(cè)算法思想。采用由粗到精的比對(duì)算法對(duì)表格結(jié)構(gòu)的定位性能進(jìn)行評(píng)測(cè),將表格定位的處理結(jié)果與標(biāo)準(zhǔn)結(jié)果相比較,如果處理結(jié)果正確,那么它的表格定位的位置和標(biāo)準(zhǔn)結(jié)果應(yīng)該一致(實(shí)際算法考慮閾值范圍),否則存在識(shí)別錯(cuò)誤,我們以此為標(biāo)準(zhǔn)來(lái)判斷處理結(jié)果中表格是否被定位。確定了表格是否被定位以后,再根據(jù)表格定位區(qū)域的區(qū)域是否標(biāo)準(zhǔn)結(jié)果區(qū)域重合來(lái)判斷定位的精度。
(2)表格版面分析的評(píng)測(cè)算法思想。表格圖像經(jīng)過(guò)處理以后得到的版面結(jié)構(gòu)是一個(gè)單元格(由行線和列線圍成的的最小矩形區(qū)域)鏈表,基于單元格對(duì)版面分析的結(jié)果的描述是一個(gè)非常復(fù)雜的問(wèn)題(單元格為二維結(jié)構(gòu),其合理處理結(jié)果表現(xiàn)為二維平面的可接受面積),所以通過(guò)直接比較單元格鏈表的方法來(lái)評(píng)測(cè)版面分析的結(jié)果好壞,實(shí)現(xiàn)起來(lái)比較困難,效率也很低。
通過(guò)大量的實(shí)踐和觀察,我們發(fā)現(xiàn)兩個(gè)規(guī)律:(1)線條交點(diǎn)可以確定單元格;(2)線條交點(diǎn)的關(guān)聯(lián)性可以判斷單元格的正確性。因此我們可以通過(guò)比較表格線條交點(diǎn)的關(guān)聯(lián)性來(lái)確定單元格匹配是否成功。算法的實(shí)現(xiàn)過(guò)程見(jiàn)流程圖4:
圖4 表格評(píng)測(cè)算法整體流程
3 表格圖像處理性能評(píng)測(cè)環(huán)境
首先,挑選了100頁(yè)樣本作為本次實(shí)驗(yàn)的數(shù)據(jù),并且對(duì)其進(jìn)行了詳細(xì)分類:
表1是根據(jù)圖像的效果進(jìn)行分類,表2是根據(jù)表格的數(shù)目進(jìn)行的分類:
表1 測(cè)試樣本分類統(tǒng)計(jì)表
表2 測(cè)試樣本分類統(tǒng)計(jì)
這些樣本圖像文件放在一個(gè)單獨(dú)的目錄TableImageSet中。
其次,我們對(duì)所選的100頁(yè)樣本的處理結(jié)果做了人工評(píng)測(cè),因?yàn)闃颖緮?shù)目較小,所以得到的結(jié)果是準(zhǔn)確和有效的,將它作為評(píng)測(cè)系統(tǒng)的衡量標(biāo)準(zhǔn),來(lái)衡量自動(dòng)評(píng)測(cè)系統(tǒng)的結(jié)果,由此可以得出本系統(tǒng)的可靠性和有效性。
該自動(dòng)評(píng)測(cè)系統(tǒng)在VC6.0環(huán)境中開(kāi)發(fā),運(yùn)行環(huán)境是Pentium4,CPU 1.80GHz。下面一節(jié)將對(duì)評(píng)測(cè)的結(jié)果進(jìn)行分析總結(jié)。
4 實(shí)驗(yàn)結(jié)果
我們以TableImageSet中的樣本集作為輸入數(shù)據(jù),以RTK7.0的表格定位與分析模塊為評(píng)測(cè)對(duì)象,用我們的程序?qū)ζ溥M(jìn)行性能評(píng)測(cè)。首先分析其表格版面結(jié)構(gòu)定位性能,得出表3的結(jié)果,然后針對(duì)定位正確的表格進(jìn)行結(jié)構(gòu)分析的評(píng)測(cè),得出表4的結(jié)果。
這些評(píng)測(cè)數(shù)據(jù)不僅反映出表格處理系統(tǒng)的整體性能,還定量的給出了系統(tǒng)的錯(cuò)誤的所在,使開(kāi)發(fā)人員可以根據(jù)錯(cuò)誤的發(fā)生情況,對(duì)系統(tǒng)進(jìn)行有針對(duì)性的改進(jìn)。
參考文獻(xiàn):
[1]C. Peterman, C.H. Chang, andH. Alam. A system for table understanding. InProceedings of the Symposiun on Document Image Understanding Technonogy(SDIUT'97),pp. 55-62, Annapolis, MD, April/May 1997.
[2](美)Mark Fewster &Dorothy Graham. 軟件測(cè)試自動(dòng)化技術(shù)與實(shí)例詳解[M], 電子工業(yè)出版社.
[3]Jianying Hu,Ramanujan Kashi,Daniel Lopresti,George Nagy,Gordon Wilfong. "Why Table Ground-Truthing is Hard." ICDAR 2001(Djvu) pp.129-133.
[4]V. F. Margner, P.Karcher, A.K.Pawlowski. "On BenchMarking of Document Analysis System", August, 1997. Proceedings of 4th International Conference Document Analysis and Recognition, Ulm, Germany(ICDAR'97). pp. 331-336.
[5]G. Nagy, "Document image analysis: Automated performance evaluation," in Document Analysis s\Systems, A. L. Spitz and Dengel, eds., pp. 137-156, World Scientific, Singapore, 1995.
[6]Jing. Hu, R. Kashi, D. Lopresti and G. Wilfong, "Table Structure Recognition and Its Evaluation", SPIE Document Recognition and Retrieval VIII San Jose, California, January 2001.
[7]Jianyin Hu, Ram Kashi, Daniel Lopresti, Gordon Wilfong, "Medium-Independent Table Detection", in Proceedings of Document Recognition and Retrieval VII (IS&T/SPIE Electronic Imaging),volume 3967,California,USA,January 2000,pp.291-302.
關(guān)鍵詞:結(jié)構(gòu)化局部邊緣模式;文檔圖像;模式分類
目前,文檔圖像具有很多種模式形態(tài),其分類方法也多種多樣。在過(guò)去,人們比較常用的分類方法是光學(xué)字符識(shí)別系統(tǒng),該系統(tǒng)主要根據(jù)文本特征、結(jié)構(gòu)特征、混合特征三種方法對(duì)文檔進(jìn)行識(shí)別分類,但是該分類方法的分類速度比較慢,對(duì)所處理圖像解析度的要求比較高。因此,該方法逐漸被結(jié)構(gòu)化局部邊緣模式分類方法所替代。
1 結(jié)構(gòu)化局部邊緣模式下處理圖像分類的預(yù)備知識(shí)
文本管理工作主要包括:壓縮、管理、歸檔、文本分析等,在進(jìn)行文檔工作處理的時(shí)候,相對(duì)準(zhǔn)確的文檔類型信息能夠有效的提高文本檢索的速度以及工作人員的工作效率。文檔具有多種模式形態(tài),每種形態(tài)都有自己的獨(dú)特性以及形態(tài)之間的相似性。結(jié)構(gòu)化局部邊緣模式的使用,不僅可以實(shí)現(xiàn)對(duì)圖像分割模式的自由調(diào)節(jié),還能夠有效的提高文檔圖像特征提取的準(zhǔn)確性,在使用結(jié)構(gòu)化局部邊緣模式進(jìn)行文檔圖像特征提取的時(shí)候,采用的是圖像區(qū)塊之間重疊的方法,通過(guò)這種方式有效的確保圖像分割區(qū)域特征本身的連貫型性。
2 采用結(jié)構(gòu)化局部邊緣模式下,文檔圖像分類特征的提取
本文在對(duì)結(jié)構(gòu)化局部邊緣模式下文檔圖像分類處理的研究中,進(jìn)行分類對(duì)比采用的是HOG。結(jié)構(gòu)化局部邊緣系統(tǒng)通過(guò)LEP特征,根據(jù)圖像像素鄰域的邊緣方向進(jìn)行了相關(guān)的編碼。文檔圖像本身特征就比較明顯,例如影像圖片的像素?cái)?shù)值變化比較大;一般學(xué)術(shù)論文的格式比較規(guī)整且字?jǐn)?shù)比較多;灰度圖像之相似性比較大,沒(méi)有明顯的規(guī)律可循;表格文件的特征性比較明顯,橫線和豎線比較多;PPT幻燈片的圖像、文字等變化性比較明顯,但是在排版方面具有一定的規(guī)律可以遵循,為了方便結(jié)構(gòu)化局部邊緣模式在處理文檔圖像方面的研究工作,上述幾種圖像類型的邊緣信息都比較明顯。
3 結(jié)構(gòu)化局部邊緣模式和HOG的主要特征
3.1 模式分類框架
文中在進(jìn)行結(jié)構(gòu)化局部邊緣模式下,文檔圖像的分類處理研究中,還沒(méi)有形成一一個(gè)完整通用的基準(zhǔn)數(shù)據(jù)庫(kù)進(jìn)行相關(guān)的實(shí)驗(yàn)研究,并且受其它因素的限制也比較明顯。所以,本文在進(jìn)行處理研究的時(shí)候,通過(guò)綜合對(duì)比研究選取了含有5000張圖像并具有四種文檔圖像類別,每種類型都包含1250張圖像,類型包括:影像圖片、學(xué)術(shù)論文、PPT幻燈影片以及含有表格的文件。另外,在進(jìn)行文檔圖像處理研究時(shí),圖片都是隨機(jī)獲取的。
3.2 結(jié)構(gòu)化局部邊緣模式的特征描述
結(jié)構(gòu)化局部邊緣模式主要是利用計(jì)算機(jī)模擬技術(shù)對(duì)對(duì)視覺(jué)、圖像等進(jìn)行處理,在使用的過(guò)程中,根據(jù)圖片中重復(fù)出現(xiàn)的不同pixel,并將其按照不同的方向延伸成九宮格的形狀作為參考的重點(diǎn)。在模式計(jì)算的過(guò)程中,首先要獲取到原始的邊緣圖像,并建立一個(gè)3*3的鄰域窗口,在這一過(guò)程中,文本會(huì)被分為比較小的空間區(qū)塊,其計(jì)算方式為:結(jié)構(gòu)化局部邊緣模式(SLEP)=Ni/N,i=0,1,2,…31,其中結(jié)構(gòu)化邊緣模式的變化范圍是在0到31之間,Ni中的i代表的是pixel的數(shù)目,n代表的是piexl的總數(shù)目。
3.3 HOG的特征描述
HOG特征是目前人們比較常用的圖像特征提取方法,該方法在計(jì)算的時(shí)候選取的是320*256的圖像區(qū)域,在此基礎(chǔ)上,把區(qū)塊的大小劃分為32*32,其中九宮格的大小為16*16,將九宮格的每一格作為最基本地計(jì)算單元,然后進(jìn)行相關(guān)的串聯(lián)計(jì)算。方法步驟如下。第一,可以對(duì)圖像進(jìn)行卷積處理,目的是了解圖像中像素的梯度以及方向變化,一般將范圍值控制在[-1,0,1]或者是[1,0,-1]。第二,對(duì)每個(gè)格子進(jìn)行量化處理,角度量化的范圍值是[0,180],然后根據(jù)每個(gè)像素的模建立九維方向角直方圖。第三,把區(qū)塊內(nèi)部各格子之間的直方圖進(jìn)行串聯(lián)處理,然后組成36維直方圖的特征向量。第四,把所有的特征向量串聯(lián)在一起,就會(huì)形成最后的直方圖特征向量。
4 結(jié)構(gòu)化局部邊緣模式的處理分析
在對(duì)上述四種類型的圖像特征進(jìn)行信息提取研究以后,了解到在進(jìn)行圖像分析的過(guò)程中,圖像的解析度分別為:80*64,160*128,這組數(shù)據(jù)說(shuō)明和HOG相比,結(jié)構(gòu)化局部邊緣模式在運(yùn)用過(guò)程中性能效果比較好,分辨率也比較高。這說(shuō)明結(jié)構(gòu)化局部邊緣系統(tǒng)在不適用OCR系統(tǒng)的條件下,也具有高質(zhì)量的文檔圖像分辨率。當(dāng)圖像大小為80*64,文檔圖像的類別為影像照片以及規(guī)范化的學(xué)術(shù)論文的時(shí)候,SLEP測(cè)試效果要比HOG高0.1到1.6個(gè)百分點(diǎn),但是當(dāng)進(jìn)行表格文件處理的時(shí)候,百分點(diǎn)就會(huì)比HOG的百分點(diǎn)低,當(dāng)進(jìn)行PPT幻燈片測(cè)試的時(shí)候,百分點(diǎn)又會(huì)比HOG高,這表明,結(jié)構(gòu)化局部邊緣模式在文檔圖像處理的時(shí)候,使用整體效能比較高。當(dāng)圖像大小逐漸變大的時(shí)候,除表格文件的測(cè)試百分點(diǎn)比較低之外,其余也呈現(xiàn)逐漸增高的現(xiàn)象。上述研究表明,當(dāng)圖像文檔比較混亂的時(shí)候,梯度方向呈現(xiàn)混亂的狀態(tài),進(jìn)行文檔圖像、影片特征分類會(huì)比較方便,但是在進(jìn)行表格文檔處理的時(shí)候,使用HOG取得的效果會(huì)更加的明顯。
[參考文獻(xiàn)]
關(guān)鍵詞: 三維坐標(biāo); 多目視覺(jué); 雙目交匯; 硅棒; 特征點(diǎn)
中圖分類號(hào): TP 274.2文獻(xiàn)標(biāo)識(shí)碼: Adoi: 10.3969/j.issn.10055630.2013.02.001
引言硅棒的實(shí)際尺寸參數(shù)與硅棒本身的特征點(diǎn)提取密切相關(guān),獲取硅棒特征點(diǎn)的三維坐標(biāo)信息可有效反映硅棒尺寸參數(shù)和產(chǎn)品質(zhì)量,為產(chǎn)品的質(zhì)量監(jiān)控提供依據(jù)[1]。然而針對(duì)硅棒,無(wú)論是整體尺寸還是局部特征的檢測(cè),國(guó)內(nèi)目前尚無(wú)相關(guān)儀器,在我國(guó)這些參數(shù)的檢測(cè)還主要是依靠人工完成[2]。人工檢測(cè)是一種非在線、接觸式的傳統(tǒng)檢測(cè)方式,采用直角尺、游標(biāo)卡尺、鋼板尺等工具進(jìn)行檢驗(yàn),檢測(cè)精確度和重復(fù)性受到檢測(cè)人員工作狀態(tài)干擾,很難保證統(tǒng)一標(biāo)準(zhǔn),總體上來(lái)說(shuō)檢測(cè)速度和檢測(cè)精度不高;同時(shí)接觸式檢測(cè)過(guò)程中需反復(fù)搬動(dòng)樣品不可避免地造成對(duì)樣品的二次傷害,效率低,儀器損耗大[2]。結(jié)合視覺(jué)成像技術(shù)和圖像處理技術(shù)出現(xiàn)的機(jī)器視覺(jué)檢測(cè)技術(shù),不僅摒棄了傳統(tǒng)檢測(cè)方法的不足,滿足了實(shí)時(shí)檢測(cè)要求,同時(shí)還具有非接觸、精度高等優(yōu)點(diǎn),是現(xiàn)場(chǎng)實(shí)時(shí)三維坐標(biāo)測(cè)量的首選方法之一[35]。國(guó)內(nèi)外關(guān)于三維坐標(biāo)的相關(guān)測(cè)量方法主要有:電子經(jīng)緯儀法和三坐標(biāo)測(cè)量機(jī)法[3]。坐標(biāo)測(cè)量機(jī)的測(cè)量精度可達(dá)微米級(jí),但是龐大的機(jī)身、厚重的底座、復(fù)雜的操作以及昂貴的成本限制了其現(xiàn)場(chǎng)的應(yīng)用[4];經(jīng)緯儀、激光跟蹤儀便攜性好,但采用多點(diǎn)對(duì)準(zhǔn),效率低,不適合于現(xiàn)場(chǎng)在線檢測(cè)[5]。機(jī)器視覺(jué)檢測(cè)系統(tǒng)組建非常靈活,既可由單目視覺(jué)測(cè)量系統(tǒng)構(gòu)成,亦可選擇雙目甚至多目視覺(jué)測(cè)量系統(tǒng)搭建而成。因?yàn)閱文恳曈X(jué)測(cè)量三維空間坐標(biāo)測(cè)量不確定度偏差較大[4],所以選擇由四CCD構(gòu)成的多目視覺(jué)系統(tǒng),該多目視覺(jué)檢測(cè)系統(tǒng)中,相鄰的兩CCD構(gòu)成正交雙目交匯視覺(jué)測(cè)量子模塊系統(tǒng),基于雙目視覺(jué)原理的子模塊克服了單目視覺(jué)檢測(cè)的缺陷,精度更高。該多目機(jī)器視覺(jué)系統(tǒng)在保證較高精度的前提下,作為機(jī)器視覺(jué)前端采集系統(tǒng),實(shí)現(xiàn)了硅棒全范圍大尺寸輪廓檢測(cè),檢測(cè)效率和速度較高。1硅棒坐標(biāo)檢測(cè)機(jī)器視覺(jué)系統(tǒng)組成典型的基于機(jī)器視覺(jué)的硅棒坐標(biāo)檢測(cè)系統(tǒng)組成如圖1所示:
圖1機(jī)器視覺(jué)的坐標(biāo)檢測(cè)系統(tǒng)組成
Fig.1The design of machine vision for coordinate detection system
硅棒坐標(biāo)測(cè)量系統(tǒng)主要包括上位機(jī)界面、數(shù)據(jù)采集模塊、圖像處理模塊、輸入輸出接口以及機(jī)械搭建平臺(tái)組成。上位機(jī)作為人機(jī)交互平臺(tái)負(fù)責(zé)數(shù)據(jù)顯示和存儲(chǔ),總體管理數(shù)據(jù)采集模塊和圖像處理模塊。數(shù)據(jù)采集系統(tǒng)作為機(jī)器視覺(jué)檢測(cè)的核心之一完成硅棒輪廓信息圖像采集,涉及光源、鏡頭、CCD相機(jī)以及圖像采集卡,采集系統(tǒng)工作流程為:光源照射待測(cè)硅棒,CCD相機(jī)采集圖像信息經(jīng)過(guò)圖像采集卡將圖像信息轉(zhuǎn)換為數(shù)字信息送入上位機(jī)并實(shí)時(shí)保存起來(lái)。數(shù)據(jù)采集完成之后,圖像處理模塊讀取圖像通過(guò)相應(yīng)算法提取特征點(diǎn)最終計(jì)算特征點(diǎn)空間三維坐標(biāo)。圖1還可以看出整個(gè)數(shù)據(jù)采集模塊搭建在機(jī)械平臺(tái)上由執(zhí)行機(jī)構(gòu)驅(qū)動(dòng),不僅可以實(shí)現(xiàn)待測(cè)目標(biāo)的小范圍檢測(cè),同時(shí)還可以配合機(jī)械平臺(tái)運(yùn)動(dòng),驅(qū)動(dòng)數(shù)據(jù)采集系統(tǒng)實(shí)現(xiàn)待測(cè)物體的大范圍全尺寸檢測(cè)。2硅棒特征點(diǎn)三維坐標(biāo)檢測(cè)原理
2.1四目視覺(jué)全范圍檢測(cè)系統(tǒng)組成硅棒特征點(diǎn)坐標(biāo)視覺(jué)檢測(cè)技術(shù)基于四目視覺(jué)原理,整個(gè)四目視覺(jué)系統(tǒng)作為機(jī)器視覺(jué)檢測(cè)系統(tǒng)的數(shù)據(jù)采集模塊負(fù)責(zé)為后續(xù)圖像處理模塊提供硅棒圖像信息,采集的圖像質(zhì)量直接影響到后續(xù)圖像處理的難易程度和結(jié)果的計(jì)算精度。四目視覺(jué)原理如圖2所示:數(shù)據(jù)采集模塊由四臺(tái)CCD相機(jī)組成,分別在待測(cè)硅棒每個(gè)側(cè)面安裝一臺(tái)CCD面陣相機(jī),保持相機(jī)與硅棒待測(cè)面垂直放置,在自然光源照射下硅棒表面成像于與之垂直的CCD相機(jī)上,則相機(jī)分別獲得每個(gè)硅棒表面特征的圖像。該圖像可以通過(guò)一個(gè)四路camelink接口圖像采集卡或者2個(gè)雙路camelink接口圖像采集卡送入上位機(jī)進(jìn)行后續(xù)圖像處理。整個(gè)數(shù)據(jù)采集系統(tǒng)要實(shí)現(xiàn)的功能就是確保不降低系統(tǒng)檢測(cè)精度的前提下,維持盡量大的有效視場(chǎng)范圍,實(shí)時(shí)采集獲取清晰的硅棒圖像。
2.2四目視覺(jué)系統(tǒng)視場(chǎng)約束為了實(shí)現(xiàn)最優(yōu)檢測(cè)目的,必須保證待測(cè)硅棒在檢測(cè)過(guò)程中始終處于四目視覺(jué)系統(tǒng)的有效視場(chǎng)范圍內(nèi),若硅棒對(duì)應(yīng)于相機(jī)上像點(diǎn)的坐標(biāo)為(xi,yi),通過(guò)針孔模型透視變換公式就能得出某個(gè)特征點(diǎn)在有效視場(chǎng)內(nèi)的世界坐標(biāo)為OXWiYWiZWi。圖3為四目視覺(jué)系統(tǒng)有效視場(chǎng)示意圖,以四臺(tái)CCD交匯中心建立世界坐標(biāo)系。
圖2四目視覺(jué)系統(tǒng)組成
Fig.2The composition of the 4 CCDs
vision system圖3四目全范圍檢測(cè)原理及有效視場(chǎng)分析
Fig.3The principle and the analysis of effective
vision field for 4CCDs′ full range detection
如圖所示:四臺(tái)面陣相機(jī)型號(hào)相同,焦距f均為鏡頭中心到CCD靶面中心的距離,相鄰相機(jī)之間的基線長(zhǎng)度均為B(B=O1O2=O2O3=O3O4=O4O1),O1Xc1Yc1Zc1、O2Xc2Yc2Zc2、O3Xc3Yc3Zc3、O4Xc4Yc4Zc4是分別以CCD相機(jī)各自的鏡頭中心建立相機(jī)坐標(biāo)系,以CCD1和CCD2光軸的交點(diǎn)為原點(diǎn)建立世界坐標(biāo)系OXWYWZW,O1Xc1Yc1Zc1、O2Xc2Yc2Zc2、O3Xc3Yc3Zc3、O4Xc4Yc4Zc4均位于OXWYWZW內(nèi),最終計(jì)算時(shí)必須將O1Xc1Yc1Zc1、O2Xc2Yc2Zc2、O3Xc3Yc3Zc3、O4Xc4Yc4Zc4這四個(gè)相機(jī)坐標(biāo)系轉(zhuǎn)換到同一個(gè)參考坐標(biāo)系OXWYWZW。假設(shè)CCD相機(jī)像平面平均尺寸為2Tx×2Ty,相鄰相機(jī)光軸夾角為2α,則四目視覺(jué)系統(tǒng)的有效視場(chǎng)為ABCDEFGH圍成的八邊形。為了準(zhǔn)確描述有效視場(chǎng),在八邊形ABCDEFGH內(nèi)做內(nèi)切圓,內(nèi)切圓面積就反映有效視場(chǎng)的大小,采用內(nèi)切圓的半徑R對(duì)有效視場(chǎng)進(jìn)行描述??紤]Tx遠(yuǎn)遠(yuǎn)小于焦距f,則有效視場(chǎng)R可以采用如下近似公式描述:R=Bcosβ/2sinα=Bcos(arctan(Tx/f))/2sin45°≈22BTx/f(1)由式(1)可知:CCD相機(jī)間基線長(zhǎng)度B、視場(chǎng)角β以及相機(jī)夾角α這三個(gè)參數(shù)不僅直接限制有效視場(chǎng)的大小,還會(huì)嚴(yán)重影響四目視覺(jué)系統(tǒng)的測(cè)量精度。引起測(cè)量精度的誤差包括相機(jī)本身參數(shù)(Tx、Ty)以及相機(jī)分布結(jié)構(gòu)參數(shù)、參數(shù)本身的測(cè)量誤差(B、f)[6],它們共同決定了機(jī)器視覺(jué)采集系統(tǒng)的精度。
2.3雙目交會(huì)原理如圖2可知:四目視覺(jué)系統(tǒng)中的任意相鄰的兩個(gè)CCD構(gòu)成雙目交匯視覺(jué)測(cè)量系統(tǒng),所以整個(gè)四目視覺(jué)系統(tǒng)可以看作四個(gè)雙目交匯視覺(jué)子系統(tǒng)組成,其中CCD1和CCD2構(gòu)成子系統(tǒng)1,CCD2和CCD3構(gòu)成子系統(tǒng)2,CCD3和CCD4構(gòu)成子系統(tǒng)3,CCD4和CCD1構(gòu)成子系統(tǒng)4。因?yàn)槊總€(gè)子系統(tǒng)光軸互相垂直,所以子系統(tǒng)基于正交雙目交匯視覺(jué)原理。正交雙目交匯測(cè)量比單目測(cè)量準(zhǔn)確度高,它的相機(jī)夾角2α=90°有效降低安裝誤差[7],保證基線長(zhǎng)度,形成相對(duì)較大的有效視場(chǎng)利于實(shí)現(xiàn)大尺寸檢測(cè),同時(shí)α=45°滿足α∈(40°-70°)放置時(shí)測(cè)量誤差最小要求[4]。以雙目交匯視覺(jué)子系統(tǒng)1為例:CCD1和CCD2分別滿足針孔成像模型:zc1 u
(3)其中矩陣M是由相機(jī)內(nèi)部參數(shù)(r1~r9)和相機(jī)外部參數(shù)(T1~T3)構(gòu)成的一個(gè)3×4的綜合矩陣。聯(lián)立式(2)和式(3)求解則可得到CCD1和CCD2的采集圖像上的公共特征點(diǎn)的三維坐標(biāo),即硅棒第1對(duì)棱邊上的特征點(diǎn)坐標(biāo),同理對(duì)于雙目交匯視覺(jué)子系統(tǒng)2、雙目交匯視覺(jué)子系統(tǒng)3、雙目交匯視覺(jué)子系統(tǒng)4可依次求得第2對(duì)、第3對(duì)、第4對(duì)棱邊上的特征點(diǎn)坐標(biāo),從而在保證精度前提下實(shí)現(xiàn)硅棒全范圍檢測(cè)目的。3硅棒特征點(diǎn)三維坐標(biāo)檢測(cè)方法的實(shí)現(xiàn)為了驗(yàn)證硅棒特征點(diǎn)三維坐標(biāo)視覺(jué)檢測(cè)系統(tǒng)的可行性,在實(shí)驗(yàn)室搭建了機(jī)器視覺(jué)檢測(cè)試驗(yàn)樣機(jī)進(jìn)行試驗(yàn),完成四目視覺(jué)采集系統(tǒng)的相機(jī)標(biāo)定實(shí)驗(yàn),同時(shí)以CCD1和CCD2構(gòu)成的正交雙目子系統(tǒng)為例進(jìn)行一對(duì)硅棒表面圖像的數(shù)據(jù)采集實(shí)驗(yàn),基于Visual Studio 2008平臺(tái)編寫(xiě)核心圖像處理算法。
3.1標(biāo)定實(shí)驗(yàn)相機(jī)標(biāo)定是視覺(jué)測(cè)量過(guò)程中不可缺少的關(guān)鍵技術(shù),標(biāo)定通過(guò)針孔成像原理求取相機(jī)內(nèi)部屬性參數(shù)和外部位置參數(shù)從而確定空間坐標(biāo)系中物點(diǎn)和像點(diǎn)的對(duì)應(yīng)關(guān)系[8]。針對(duì)本文的多目視覺(jué)系統(tǒng)首先對(duì)每個(gè)相機(jī)進(jìn)行單目標(biāo)定。單目標(biāo)定選擇一種介于傳統(tǒng)標(biāo)定技術(shù)和自標(biāo)定技術(shù)之間的方法:張氏平面標(biāo)定法。標(biāo)定流程為:首先將自制一個(gè)大小為11×11標(biāo)準(zhǔn)棋盤格模板,每個(gè)棋盤格大小為10 mm×10 mm。該模板置于視覺(jué)系統(tǒng)有效視場(chǎng)內(nèi),改變模板位置多角度(不小于3個(gè))分別拍攝,拍攝完成后進(jìn)行角點(diǎn)檢測(cè),單應(yīng)性矩陣求解和參數(shù)優(yōu)化,每個(gè)CCD獲得一個(gè)相應(yīng)的相機(jī)標(biāo)定文件calib_CCD_1.mat、calib_CCD_2.mat、calib_CCD_3.mat、calib_CCD_4.mat。這種標(biāo)定方法比傳統(tǒng)標(biāo)定簡(jiǎn)單,算法計(jì)算量減少且精度高于自標(biāo)定方法。通過(guò)單目標(biāo)定得到X方向和Y方向有效焦距(ax,ay)、CCD靶面中心坐標(biāo)(u0,v0)以及徑向或者切向畸變等相機(jī)內(nèi)部參數(shù),由于切向畸變較小,此處忽略不計(jì),主要考慮徑向畸變參數(shù)(k1,k2),單目標(biāo)定結(jié)果見(jiàn)表1。單目標(biāo)定完成之后進(jìn)行立體標(biāo)定,分別獲得相機(jī)坐標(biāo)系O1Xc1Yc1Zc1、O2Xc2Yc2Zc2、O3Xc3Yc3Zc3、O4Xc4Yc4Zc4相對(duì)于世界坐標(biāo)系的旋轉(zhuǎn)矩陣R和平移矩陣T。立體標(biāo)定結(jié)果見(jiàn)表2。表1單目相機(jī)標(biāo)定結(jié)果
Tab.1The result of monocular camera calibration
CCD1CCD2CCD3CCD4(ax,ay)(1 537.644 971 864.834 93)(1 533.415 091 857.500 18)(1 535.344 071 860.932 01)(1 539.700 31 865.793 31)(u0,v0)(350.602 11272.778 93)(360.149 42285.268 16)(357.021 19279.775 49)(351.339 08288.441 09)(k1,k2)(-0.382 631.710 26)(-0.372 052.034 223)(-0.367 811.901 27)(-0.380 091.947 37)像素誤差(0.321 280.370 39)(0.275 690.223 16)(-0.332 810.201 27)(-0.339 610.291 27)
表2多目相機(jī)標(biāo)定結(jié)果
Tab.2The result of multicamera calibration
O1Xc1Yc1Zc1O2Xc2Yc2Zc2O3Xc3Yc3Zc3O4Xc4Yc4Zc4R10010.003 70.04310.002 90.004 310.003 70.040 3010-0.003 61-0.006 50.043 61-0.046 5-0.007 11-0.047 3001-0.004 50.066 81-0.003 90.061 71-0.006 50.057 91T0.242 81 000.229 00999.233 70.100 20.297 50.441 70.020 9-998.001 90.199 51 002.336 70.019 7
圖4硅棒圖像
Fig.4Images of silicon rods3.2圖像采集實(shí)驗(yàn)實(shí)驗(yàn)采用四個(gè)IMPERX面陣CCD相機(jī)、相機(jī)配接15 mm的標(biāo)準(zhǔn)鏡頭,兩個(gè)X64CL Prio圖像采集卡,兩個(gè)鏡頭基線距離為1 408.6 mm搭建實(shí)驗(yàn)樣機(jī),有效線視場(chǎng)為236.544 mm,將待測(cè)硅棒置于CCD交匯的有效視場(chǎng)范圍內(nèi),配置圖像采集卡輸出格式為Cameralink Base Mono #1,導(dǎo)入IPX_VGA210相機(jī).cfg配置文件,通過(guò)X64CL Prio圖像采集卡將一對(duì)像素為640×480黑白硅棒圖像實(shí)時(shí)送入上位機(jī)。其中正交雙目視覺(jué)子模塊1采集到的一對(duì)圖像如圖4所示。
3.3圖像處理特征點(diǎn)坐標(biāo)檢測(cè)視覺(jué)系統(tǒng)第二個(gè)核心組成是圖像處理模塊,該模塊通過(guò)完成對(duì)采集數(shù)據(jù)的后續(xù)圖像處理獲得目標(biāo)特征點(diǎn)的三維空間坐標(biāo),技術(shù)難點(diǎn)在于機(jī)器視覺(jué)數(shù)據(jù)采集模塊中CCD相機(jī)得到的是二維圖像信息,而系統(tǒng)最終要求是得到目標(biāo)特征點(diǎn)的空間三維坐標(biāo)。針對(duì)問(wèn)題論文提出一種二維圖像上恢復(fù)特征興趣點(diǎn)三維坐標(biāo)的解決方法:首先提取待處理圖像上的特征興趣點(diǎn),建立特征興趣點(diǎn)對(duì)應(yīng)關(guān)系即同名點(diǎn)識(shí)別,接著通過(guò)同名點(diǎn)立體匹配獲取對(duì)應(yīng)點(diǎn)視差從而得到特征興趣點(diǎn)3D坐標(biāo)。
3.3.1Harris角點(diǎn)檢測(cè)論文以硅棒角點(diǎn)作為研究的特征興趣點(diǎn),采用一種基于灰度值相關(guān)的角點(diǎn)檢測(cè)算子:Harris算子進(jìn)行硅棒角點(diǎn)檢測(cè)。Harris角點(diǎn)檢測(cè)的目的是提取待測(cè)目標(biāo)的特征點(diǎn),依靠特征點(diǎn)來(lái)傳遞圖像所表征的參數(shù)信息,算法不受相機(jī)姿態(tài)及光照影響,檢測(cè)精度達(dá)到像素級(jí)別[9]。Harris算子數(shù)學(xué)表達(dá)形式為:M=G(S)gxgxgy
gxgygy(4)
I=Det(M)-k×Trace2(5)M為自相關(guān)聯(lián)系矩陣、Det(M)為自相關(guān)矩陣行列式的值,Trace為矩陣的跡,k為默認(rèn)常數(shù),取0.04。式(5)稱為Harris算法響應(yīng)函數(shù),該函數(shù)給出局部范圍內(nèi)的興趣值大小。Harris算法采用局部范圍內(nèi)的極大興趣值對(duì)應(yīng)的像素點(diǎn)作為特征點(diǎn),因此通過(guò)對(duì)算法中的門限閾值、局部鄰域大小、高斯窗口大小和高斯方差多次調(diào)整,保證在局部鄰域內(nèi)只留下最大極值點(diǎn)作為興趣點(diǎn),實(shí)現(xiàn)特征最優(yōu)角點(diǎn)的提取。
3.3.2特征點(diǎn)立體匹配特征點(diǎn)立體匹配就是在待匹配圖像上尋找標(biāo)準(zhǔn)圖像上每個(gè)特征點(diǎn)的同名點(diǎn),從而將不同圖像中原本獨(dú)立的特征興趣點(diǎn)聯(lián)系起來(lái)[1011],特征點(diǎn)匹配不是盲目進(jìn)行,它遵循一定約束條件,本文同名點(diǎn)匹配基于極線約束。極線約束規(guī)定了一幅圖像上任意一點(diǎn)在另一幅圖像上的對(duì)應(yīng)點(diǎn)只可能位于一條特定的極線上,通過(guò)該約束特征點(diǎn)匹配搜索空間從二維降為一維,減少計(jì)算量[10]。匹配流程為:首先在現(xiàn)有圖像中設(shè)定一個(gè)標(biāo)準(zhǔn)圖像,對(duì)于標(biāo)準(zhǔn)圖像中的特征點(diǎn)Pl,找出待匹配圖像中與其有最近歐氏距離的前兩個(gè)特征點(diǎn)Pr1和Pr2,計(jì)算兩個(gè)特征點(diǎn)中最近的距離Dmin與次近的距離Pcmin的比值,如果該比值小于匹配閾值,則表示待匹配圖像上歐氏距離最近的點(diǎn)是標(biāo)準(zhǔn)圖像中Pl特征最優(yōu)匹配點(diǎn)。其次以待匹配圖像中Pr1為特征點(diǎn),重復(fù)步驟1的過(guò)程,求取標(biāo)準(zhǔn)圖像中Pr1的候選匹配點(diǎn)P′l。最后如果Pl 和P′l是相同點(diǎn),則Pl 和Pr1匹配成功,否則棄之。重復(fù)這個(gè)流程,直到匹配完成。同名點(diǎn)匹配完成之后,由雙目視覺(jué)視差公式即可得出特征點(diǎn)3D坐標(biāo)。最后對(duì)采集系統(tǒng)拍攝的兩幅硅棒圖像進(jìn)行角點(diǎn)檢測(cè)及匹配算法驗(yàn)證,獲得了圖像中的4對(duì)公共角點(diǎn)3D點(diǎn)坐標(biāo)值,結(jié)果見(jiàn)表3。
表3特征點(diǎn)3D坐標(biāo)計(jì)算結(jié)果
Tab.3The calculation result of characteristic points′ 3D coordinatemm
特征角點(diǎn)X實(shí)測(cè)值X理論值Y實(shí)測(cè)值Y理論值Z實(shí)測(cè)值Z理論值153.59154-79.833-80.5-63.422-63263.32263-80.032-80.5-53.709-54353.6195480.20080.5-63.192-63463.2096379.90280.5-53.991-54
通過(guò)表3可以看出:理論計(jì)算結(jié)果和實(shí)際測(cè)量結(jié)果基本吻合,且實(shí)際測(cè)量精度明顯高于理論計(jì)算精度。4結(jié)論論文提出一種基于機(jī)器視覺(jué)的非接觸、實(shí)時(shí)硅棒特征點(diǎn)檢測(cè)技術(shù),搭建了多目視覺(jué)硅棒采集系統(tǒng)進(jìn)行圖像采集實(shí)驗(yàn),重點(diǎn)研究了多目視覺(jué)有效視場(chǎng)確定和正交雙目交匯視覺(jué)測(cè)量原理,基于Visual Studio 2008平成了硅棒角點(diǎn)特征提取以及同名角點(diǎn)立體匹配等后續(xù)圖像處理算法,整個(gè)檢測(cè)過(guò)程時(shí)間不超過(guò)0.5 min。實(shí)驗(yàn)結(jié)果表明,該技術(shù)可準(zhǔn)確快速獲取待檢測(cè)硅棒的特征點(diǎn)三維坐標(biāo),檢測(cè)精度可以達(dá)到像素級(jí)別,適合于硅棒參數(shù)的非接觸式高精度檢測(cè)。為下一步開(kāi)展硅棒面形檢測(cè)研究奠定了基礎(chǔ)。參考文獻(xiàn):
[1]郭海霞,解凱.焦點(diǎn)檢測(cè)技術(shù)研究[J].哈爾濱師范大學(xué)自然科學(xué)學(xué)報(bào),2007,23(2):73-75.
[2]徐岳生,劉彩池,王海云,等.直拉硅的現(xiàn)狀與發(fā)展[C]∥中國(guó)有色金屬學(xué)會(huì)第六屆學(xué)術(shù)年會(huì)論文集.長(zhǎng)沙:中南大學(xué)出版社,2005:62-69.
[3]彭凱,劉麗冰.雙攝像機(jī)光學(xué)三坐標(biāo)測(cè)量系統(tǒng)的研究[J].工藝與檢測(cè),2008,10(9):115-117.
[4]彭凱,劉麗冰,劉書(shū)桂.基于雙相機(jī)的計(jì)算機(jī)視覺(jué)坐標(biāo)測(cè)量系統(tǒng)[J].光電工程,2008,35(7):95-98.
[5]管業(yè)鵬,童林夙.雙目立體視覺(jué)測(cè)量方法研究[J].儀器儀表學(xué)報(bào),2003,24(6):581-588.
[6]劉佳音,王忠立,賈云得.一種雙目立體視覺(jué)系統(tǒng)的誤差分析方法[J].光學(xué)技術(shù),2003,29(3):354-360.
[7]郭玉波,姚郁.雙目視覺(jué)測(cè)量系統(tǒng)結(jié)構(gòu)參數(shù)優(yōu)化問(wèn)題研究[J].紅外與激光工程,2006,35(增刊):506-509.
[8]羅世民,李茂西.雙目視覺(jué)測(cè)量中三維坐標(biāo)的求取方法研究[J].計(jì)算機(jī)工程與設(shè)計(jì),2006,27(19):3622-3624.
[9]張春生.基于點(diǎn)特征匹配的SUSANHarris算子比較[J].西安科技大學(xué)學(xué)報(bào),2007,27(4):608-616.