亚洲成色777777女色窝,777亚洲妇女,色吧亚洲日本,亚洲少妇视频

圖像處理技術論文

時間:2023-03-14 14:49:21

導語:在圖像處理技術論文的撰寫旅程中,學習并吸收他人佳作的精髓是一條寶貴的路徑,好期刊匯集了九篇優(yōu)秀范文,愿這些內容能夠啟發(fā)您的創(chuàng)作靈感,引領您探索更多的創(chuàng)作可能。

圖像處理技術論文

第1篇

簡單來說,計算機圖像處理技術就是將一些圖像、視頻、圖片等進行數(shù)字轉化,并且通過轉化將其變成計算機技術所能識別的固定代碼,從而便于計算機進行識別和美化,通過對圖像的一些操作使圖像呈現(xiàn)出我們想要的圖像效果,計算機圖像處理技術的處理速度是相對較快的,而且其存儲空間也相對較大,所以,對于那些已經處理過的圖像和視頻可以直接保存,同時,隨著計算機信息技術的發(fā)展,計算機圖像處理技術也取得了一定的進展,計算機圖像處理技術只需要將數(shù)字轉化為紅、黃、藍三種原始色彩的數(shù)字圖像就可以,然后計算機通過對這些圖像進行分析和處理,從而實現(xiàn)圖像的多樣化操作,同時,計算機圖像處理技術的提高也體現(xiàn)在圖像清晰度和分辨率,以及圖像傳輸率等技術的提升和發(fā)展。

2計算機圖像處理技術在網頁設計中的應用

在網頁設計的過程中,圖像的處理和美化是其中最重要的環(huán)節(jié)之一,在一些較為復雜的網頁中,可能會包含一些動態(tài)的圖像以及flash元素等,這些元素的存在無疑增加了網頁的特色,同時,也會提高客戶體驗,為了保持這些元素的鮮明性就需要將計算機圖像處理技術很好的應用到網頁設計中,提高網頁質量的同時,增加網頁的特點。

2.1滿足網頁設計中對于圖片格式的需求

滿足網頁設計中對圖片格式的需求是網頁設計過程中最基礎的環(huán)節(jié),在網頁設計中,需要各種不同的元素來組成一個完整的、特色鮮明的網頁,從而讓瀏覽者瞬間獲取自己所需要的信息和資源,同時,網頁設計必須具有一定的便捷性,這樣才能有效的增加用戶體驗,同時增強用戶瀏覽體驗的感受,由此可見,圖像的處理是網頁設計中最基礎的內容,所以,計算機圖像處理技術首先需要處理的就是網頁設計中的圖像問題,其中jpeg是最為常用的圖片格式,而gif可以實現(xiàn)圖像的動態(tài)效果,由于這兩種的網絡圖像格式所需要的參數(shù)和規(guī)格是不盡相同的,所以在應用計算機圖像處理技術時,應該滿足其格式的不同需求。

2.2對網頁設計中圖像的大小進行控制

眾所周知,計算機的長度和寬度是有限的,這在一定程度上就決定了網頁設計的圖像也應該是有一定的規(guī)格,同時,為了保障網頁瀏覽的清晰度和流暢度,就需要對網頁中的圖像進行一些特定的處理來限制其圖像的大小,由于圖像的大小與其所展現(xiàn)的清晰度有直接關系,所以,需要借助計算機圖像處理技術來進行處理,以此來緩解清晰度和圖像大小之間的矛盾,在追求圖片高清晰度的同時,提高網頁加載的速度和質量,同時提高網頁瀏覽的效果。計算機圖像處理技術主要是一種針對jpeg圖片進行處理來權衡加載速度和網頁瀏覽效果的一種技術,從而提高網頁設計的瀏覽效果和網頁質量。

2.3對網頁設計進行進一步的開發(fā)

只有綜合運用計算機圖像處理技術對網頁設計進行進一步的開發(fā)和應用,才能從根本上提高網頁設計效果,近年來,計算機圖像處理技術主要是以軟件為主,photoshop是目前最為常用的圖片處理軟件,但是,隨著網頁設計的不斷普及和發(fā)展,出現(xiàn)了更多網頁個體設計者,為了滿足不同個體對網頁設計的個性化需求,同時帶動個體成為網頁設計的主流,豐富網頁的內容和色彩,就需要適當?shù)慕档陀嬎銠C圖像處理技術的技術水平,以此滿足社會大眾的需求,其中photoshop的圖片處理功能相對強大,但是photoshop主要是針對專業(yè)的網頁設計人員開發(fā)的一種技術處理軟件,所以,對于那些非專業(yè)的網頁設計者,這個軟件具有一定的難度,這在一定程度上限制了網頁設計的普及和發(fā)展,所以,為了滿足更多網頁開發(fā)者的設計體驗,要不斷開發(fā)出一些相對簡單和實用的計算機圖像處理技術,進而推動計算機圖像處理技術的革新和技術升級。

3結語

第2篇

【關鍵詞】機器視覺 Matlab 圖像處理 尺寸測量

在工業(yè)生產中,測量是進行質量管理的手段,是貫徹質量標準的技術保證。機械零件的尺寸檢測作為產品加工的一個關鍵環(huán)節(jié),其檢測結果不僅影響產品的質量,而且對后續(xù)零件的再加工和裝配產生決定性的作用。目前,常規(guī)的零件尺寸測量手段主要采用游標卡尺、激光測量儀和輪廓儀等完成檢測環(huán)節(jié)。以上零件尺寸測量方法要么受測量工具限制,其測量精度有限;要么檢測儀器過于昂貴且操作復雜,同時其準確率往往受人為因素的影響。

鑒于當前機器視覺技術的快速發(fā)展以及其在工業(yè)檢測方面的成功應用,論文構想利用攝像機替代人眼,讓計算機替代人腦,從而研制出一套針對零件常規(guī)尺寸的自動化y量系統(tǒng)。

1 系統(tǒng)概述

在充分遵循系統(tǒng)的完整性、可靠性、經濟性和實時性等原則的基礎上,本文設計出了一套基于機器視覺的零件常規(guī)尺寸測量系統(tǒng)。該測量系統(tǒng)主要由圖像攝取、圖像處理、圖像特征提取和分析、圖像常規(guī)尺寸測量和結果輸出幾部分組成。其工作原理圖如圖1所示。

2 硬件設計

基于機器視覺的零件常規(guī)尺寸測量系統(tǒng)的硬件主要包括:照明裝置、攝像機、計算機和透明工作臺。各部件的主要功能是:照明裝置主要為零件圖像采集提供合適的光照環(huán)境;攝像機用來采集零件數(shù)字圖像并傳送到計算機,然后保存為相應圖片格式;計算機通過系統(tǒng)軟件實現(xiàn)對零件圖像的預處理、邊界提取、特征提取、相機標定和常規(guī)尺寸計算;透明工作臺用來承載被測零件。

3 算法設計

圖像處理算法對機器視覺測量系統(tǒng)會產生決定性的影響。為了能滿足零件尺寸測量的要求,針對零件產品圖像的特點,我們設計了一套合理的圖像處理算法流程。其流程圖如圖2所示。

首先對獲取的零件圖像進行預處理,包括圖像灰度化、圖像去噪、圖像分割和邊界提取;然后提取零件的幾何特征;最后通過對系統(tǒng)的標定,實現(xiàn)了零件圖像常規(guī)尺寸的測量和結果顯示。

3.1 圖像預處理

3.1.1 圖像灰度化

經過攝像機采集到的零件圖像是24位真彩色RGB圖像,該圖像中的每個像素由R、G、B三個分量決定,而灰度圖像的每個像素由一個值確定。為了減少后續(xù)操作過程中的計算量,需要對采集到的零件圖像進行灰度化處理。

3.1.2 圖像去噪

采集系統(tǒng)獲取的待檢零件圖像由于受照明程度、環(huán)境溫度、電源變化、電磁輻射和振動等隨機因素的干擾,圖像會包含大量的噪聲,表現(xiàn)為圖像模糊、失真和大量斑點等。為了消除和抑制噪聲對零件圖像后續(xù)處理的影響,必須對圖像進行濾波處理。由于中值濾波既能消除噪聲又能保持圖像的細節(jié),符合本系統(tǒng)檢測的需求。

3.1.3 圖像分割

在所采集到的零件圖像中,我們只對零件區(qū)域本身感興趣,對于圖像中的其他要素則要盡量消除。圖像分割就是指把圖像分成各具特性的區(qū)域,并提取出感興趣目標的技術和過程。經過大量的實驗驗證,本文采用迭代閾值分割法實現(xiàn)對零件圖像的分割,達到了預期的處理效果。

3.1.4 邊界提取

輪廓是對物體形狀的有力描述,對圖像分析和識別十分有用,而通過邊界提取算法就可以得到物體的邊界輪廓。目標圖像邊界提取的方法很多,主要包括鏈碼表示法、標記圖法以及多邊形近似法等。論文采用8連通鏈碼法對待測零件進行了邊界提取,為后續(xù)零件尺寸的檢測奠定了很好的基礎。

3.2 圖像分析

3.2.1 特征檢測

要測量零件的尺寸,首先應該檢測出零件所包含的直線和圓等基本的幾何特征。目前常用的幾何特征檢測方法有Hough變換法、擬合法和模板匹配法等。本文采用最小二乘法實現(xiàn)了對直線和圓的擬合,其擬合具體過程如下:

(1)采用最小二乘法實現(xiàn)對直線的擬合。

(2)采用最小二乘法實現(xiàn)對圓和圓弧的擬合。

采用最小二乘法對圓和圓弧的擬合過程與直線的擬合求解過程類似。設所求擬合圓的方程為:。根據最小二乘法應滿足的條件,可以求出擬合圓的三個參數(shù):u、v和r。

這樣,通過基于最小二乘法的直線和圓擬合方法,可以順利檢測到直線和圓弧幾何特征,為后續(xù)零件尺寸的測量奠定了基礎。

3.2.2 系統(tǒng)的標定

相機拍攝到的圖像是以像素為單位的,要得到待檢零件的實際尺寸,需要將像素尺寸轉換為長度尺寸,這個過程稱為系統(tǒng)的標定。本文使用0級精度量塊,采用二次標定法實現(xiàn)了對系統(tǒng)的標定過程。被測零件的實際尺寸L與像素尺寸N之間應滿足如下關系式:L=KN+b

式中,b為系統(tǒng)誤差,K為標定系數(shù);

在攝像機固定的情況下,求取參數(shù)K和b值的具體步驟如下:

(1)在被測位置放置一長度為L1的標準量塊;

(2)對標準量塊進行掃描、處理,得到對應的像素尺寸N1;

(3)在被測位置放置另一長度為L2的標準量塊,重復步驟2,得到對應像素尺寸N2;

(4)求取參數(shù)值:

4 軟件設計

本著穩(wěn)定、可靠、合理、高效、簡潔和易于操作的原則,我們采用面向對象的Matlab程序語言,實現(xiàn)了基于Matlab GUI的測量系統(tǒng)軟件的設計。

本測量系統(tǒng)軟件主要包括用戶登錄模塊、文件管理模塊、圖像處理模塊、參數(shù)設置模塊、數(shù)據瀏覽模塊和幫助模塊等。其中,用戶登錄模塊可以完成用戶的注冊、登陸、密碼修改和賬號管理;文件管理模塊主要包括待測零件圖像的打開、關閉和保存等功能;圖像處理模塊不僅包含文中所涉及到的算法,還增加了其他算法功能;參數(shù)設置模塊可以實現(xiàn)對攝像機、零件和圖像參數(shù)的設置;數(shù)據瀏覽模塊可以完成對實時數(shù)據、歷史數(shù)據和操作記錄的查看;軟件幫助模塊主要用來說明軟件的使用和系統(tǒng)的更新問題。

5 實驗結果

為了驗證測量系統(tǒng)的適應性、穩(wěn)定性和可靠性,本文選用工作面距離為1.49mm的0級量塊和直徑為2.03mm的標準環(huán)規(guī)對系統(tǒng)進行了可靠性測試。實驗的測量結果如表1所示。

采用概率與數(shù)理統(tǒng)計的方法對測量結果進行了處理。由處理結果可以看到,采用本測量系統(tǒng),其測量精度可以達到微米級,可以滿足在線實時測量的需要。

6 結論

作者設計了一套基于機器視覺的零件幾何尺寸在線檢測系統(tǒng),克服當前人工檢測的不足,提高了產品的檢測精度。同時,完成了系統(tǒng)硬件、軟件和圖像處理算法的設計。實驗結果表明:該測量系統(tǒng)的測量精度可以達到2um以下,滿足零件尺寸非接觸在線測量要求,具有很好的應用前景。

參考文獻

[1]王保軍.基于機器視覺的藥瓶封裝缺陷檢測系統(tǒng)研究[D].沈陽:東北大學(碩士學位論文),2014.

[2]李巖,花國梁.精密測量技術[M].北京:中國計量出版社,2001.

[3]章毓晉.圖像工程(上冊)――圖像處理和分析[M].北京:清華大學出版社,1999,5-120.

[4]張錚,王艷平,薛桂香.數(shù)字圖像處理與機器視覺[M].北京:人民郵電出版社,2012(12):63-160.

作者簡介

王保軍(1988-),男,山西省忻州市人。碩士研究生學歷?,F(xiàn)為山西機電職業(yè)技術學院助理講師。主要研究方向為基于機器視覺的零件在線檢測。

第3篇

【關鍵詞】椒鹽噪聲 雙閾值 隸屬函數(shù)

1 引言

噪聲主要在數(shù)字圖像的獲取和傳輸過程中產生,一般是不可預測的隨機信號,只能用概率統(tǒng)計的方法去識別。噪聲對圖像處理十分重要,其會影響圖像處理的輸入、采集、處理的各個環(huán)節(jié)以及輸出結果的全過程。其中,椒鹽噪聲一般是由于傳輸誤差或比特丟失造成的。椒鹽噪聲與其他的像素點有明顯的區(qū)別,一般是鄰域中的像素值的極值點。但是極值點并不一定是噪聲點。椒鹽噪聲在圖像上表現(xiàn)出黑白相間的亮暗點,會嚴重影響圖像的質量。傳統(tǒng)中值濾波算法(SMF)[1]能夠減弱或消除傅里葉空間的高頻分量,但是同時會影響低頻分量。由于高頻分量對應圖像中的邊沿灰度值具有較大較快變化的部分,所以SMF算法可將這些分量濾除,使圖像平滑,破壞圖像的邊緣和細節(jié)。

文獻[2]提出了模糊開關中值濾波算法(FSM),F(xiàn)SM算法處理效果比SMF算法要好一點。文獻[3]提出了自適應模糊開關中值濾波(NAFSM)算法。文獻[4]提出了EDPA算法。文獻[5]和文獻[6]提出基于神經網絡的模糊中值濾波算法,對于受密度噪聲污染的圖像取得了不錯的效果,但是計算量很大。文獻[7]、文獻[8]、文獻[9]、文獻[10]提出了一種自適應模糊中值濾波算法(AFM)。AFM算法對傅里葉空間的低頻分量具有較好的濾除效果,但對高頻分量的處理效果不是很好,主要是沒有考慮椒鹽噪聲對圖像的污染程度。所以本文在AFM的基礎上提出了一種雙閾值模糊中值濾波算法,該算法能很好地保護圖像的細節(jié),具有高效地處理椒鹽噪聲的能力。

2 算法的基本思想和實現(xiàn)

2.1 建立模糊系統(tǒng)

利用模糊系統(tǒng)(如圖1所示),計算輸入參數(shù)的模糊系數(shù)權值。因為處理的是椒鹽噪聲,所以只需輸入濾波窗口中原值與中值的差,最后通過去模函數(shù)去模糊化,濾波輸出。

圖1 模糊濾波系統(tǒng)設計

濾波窗口S由w×w(w默認值為3,一般為奇數(shù))的方陣組成。對S里的像素點值進行快排序,可得濾波窗口中像素的最小值為Smin,最大值為Smax,中值為Smed,均值為Smean。x(i,j)表示噪聲圖像在(i,j)的灰度值。模糊系統(tǒng)首先是計算參數(shù)S1(i,j)=x(i,j)-Smed。在圖像處理的時候一般對像素的污染程度進行閾值的設置。這里假設最小閾值為Tmin,最大閾值為Tmax,同時設置參數(shù)S2=|x(i,j)-Smean|。當S2Tmax時,認為像素點嚴重污染,這時就用最近鄰域已處理的像素點求均值代替。

設當前像素的灰度值為x(i,j),濾波后的像素的灰度值為y(i,j),模糊濾波系數(shù)為P。則模糊隸屬函數(shù)為:

(1)

如果S2

y(i,j)=S(i,j) (2)

如果Tmin≤S2≤Tmax時,則:

y(i,j)=P×S(i,j)+(1-P)×Smed (3)

如果S2>Tmax時,則:

, i=0,j=0 (4)

,i>0,j=0 (5)

,i=0,j>0 (6)

,

i>0,j>0 (7)

2.2 算法實現(xiàn)

定義S(i,j)是以點(i,j)為中心,大小為w×w的方形窗口,可表示為S(i,j)={(k,l)||k-i|

具體方法如下:

設最大窗口為wmax×wmax,輸出圖像為y(i,j)。自適應雙閾值模糊中值濾波算法的基本思想是通過判斷窗口中心點是否為噪聲來調節(jié)窗口的大小,以克服中值濾波對細節(jié)的破壞。

具體算法如下:

初始化窗口大小,令w=3。

計算窗口S(i,j)中像素的最小值Smin,最大值Smax,中值Smed及均值Smean。

如果Smin

如果w≤wmax跳到第2步,否則說明是噪聲點,用鄰域已處理點灰度值均值代取y(i,j)。

如果Smin

2.3 實驗實現(xiàn)與分析

在win7系統(tǒng)和vs2010+opencv環(huán)境下,經過大量的仿真實驗,最終得到Tmin=5,Tmax=13可以達到很好的去噪效果。實驗分別對加入30%、80%的椒鹽噪聲的Lena.jpg進行處理。具體如圖2、圖3、圖4所示:

圖2 無噪聲的原圖

觀察圖3(a~e)到圖4(a~e)可以發(fā)現(xiàn),噪聲輕度污染時各算法去噪能力沒有明顯差別;當噪聲嚴重污染時SMF基本不能保護圖像的細節(jié),AFM、FSM能夠適當?shù)乇Wo圖像的細節(jié),但是噪聲點還是很多,論文算法能夠很好地保護圖像細節(jié)并去除噪聲。

采用峰值信噪比(PSNR)歸一化均方誤差(NMSE)度量處理圖像效果的好壞,定義如下:

(8)

(9)

式中y(i,j)表示去噪后的圖像各像素點的灰度值,I(i,j)表示原始無噪圖像各像素點的灰度值。M、N分別表示圖像的高和寬。表1為幾種算法的NMSE比較,表2為幾種算法的PSNR的比較。

各種算法的NMSE如圖5所示,各種算法的PSNR如圖6所示。

從表1、表2、圖5和圖6可以看出論文算法去噪和其他算法相比優(yōu)勢非常明顯。在加入小于40%的噪聲時各算法的去噪效果差別不是很大。隨著噪聲的加大,其他算法處理能力明顯下降,但是論文算法卻達到一種趨衡的狀態(tài)。

表1 幾種算法的NMSE比較

噪聲密度/

% 不同算法處理的NMSE

SMF AFM EDPA 論文算法

10 0.0022 0.0006 0.0012 0.0006

20 0.0048 0.0014 0.0021 0.0011

30 0.0171 0.0022 0.0029 0.0021

40 0.0457 0.0042 0.0066 0.0041

50 0.1096 0.0097 0.0149 0.0042

60 0.2156 0.0267 0.0271 0.0043

70 0.3673 0.0712 0.0734 0.0044

80 0.5661 0.1791 0.1578 0.0047

90 0.7968 0.4175 0.3785 0.0051

表2 幾種算法的PSNR的比較

噪聲密度/

% 不同算法的PSNR

SMF AFM EDPA 論文算法

10 32.2789 37.4440 36.7873 37.4440

20 28.8538 34.3215 33.2178 35.2321

30 23.3064 32.2061 30.1963 32.2624

40 19.0506 29.4123 27.2338 29.4182

50 15.2454 25.7989 23.7133 29.4086

60 12.3090 21.3828 20.7634 29.3226

70 9.99450 17.1203 17.2960 29.1659

80 8.11600 13.1141 13.4691 28.9376

90 6.63180 9.43800 10.2843 28.5508

圖5 各種算法的NMSE

圖6 各種算法的PSNR

3 結束語

本文在AFM算法的基礎上提出了一種自適應雙閾值模糊中值濾波算法。和其他去噪算法相比,論文算法具有極強的去噪性,同時很好地保護了圖像的細節(jié),并且算法具有穩(wěn)定性,是去除椒鹽噪聲的好算法。

參考文獻:

[1] Pitas I, Venetsanopoulos A N. Order statistics in digital image processing[J]. Proceeding of the IEEE, 1992,80(12): 1893-1921.

[2] H Ibrahim, K K V Toh, M N Mahyuddin. Salt-and-pepper noise detection and reduction using fuzzy switching median filter[J]. IEEE Transaction on Consumer Electronics, 2008,54(4): 1956-1961.

[3] K K V Toh, N A M Isa. Noise Adaptive Fuzzy Switching Median Filter for Salt-and-Pepper Noise Reduction[J]. IEEE Signal Processing Letters, 2010,17(3): 281-284.

[4] Nibong Tebal, Penang. Fuzzy Multipass Filter for Impulse Noise Removal in Digital Images[C]. Signals and Information Technology, 2013.

[5] M E Yuksel. A hybrid neuro-fuzzy filter for edge preserving restoration of images corrupted by impulse noise[J]. IEEE Transactions on Image Processing, 2006,15(4): 928-936.

[6] S Schulte, M Nachtegael, V D Witte, et al. A fuzzy impulse noise detection and reduction method[J]. IEEE Transactions on Image Processing, 2006,15(5): 1153-1162.

[7] T Palabas, A Gangal. Salt and pepper noise reduction in images using adaptive fuzzy filter[C]. SIU, 2012: 1-4.

[8] T Palabas, A Gangal. Adaptive fuzzy filter combined with median filter for reducing intensive salt and pepper noise in gray level images[C]. Innovations in Intelligent Systems and Applications, 2012: 1-4.

第4篇

關鍵詞: MATLAB; 預處理; Hough變換; 降維; 形態(tài)學

中圖分類號:TP391.41 文獻標志碼:A 文章編號:1006-8228(2016)11-17-04

Research on the image recognition of target sheet with MATLAB

Wang Weiyang, Ding Jiayue, Wang Penghong, Lu Zhengyong

(School of Imformation & Electronic Engineering, Zhejiang Gongshang University, Hangzhou, Zhejiang 310018, China)

Abstract: According to the shooting competition when a real-time and accurate detection of the shooting results is required, a research on image recognition of target sheet with MATLAB is presented in this paper. An image processing algorithm based on MATLAB is used in order to analyse the ring number of impact point on the target sheet captured by digital camera. Grayscale conversion, median filtering, and binariztion of the target sheet image are used in the image pretreatment. Sobel operator is used to extract image edge, so the amount of computation is dramatically reduced. And the bullet hole is recognized and located by using improved Hough transform, image subtraction method and morphological algorithm. The experimental results show that the image processing algorithm has fast speed and good accuracy.

Key words: MATLAB; pretreatment; Hough transform; mension reduction; morphology

0 引言

隨著科技的發(fā)展,射擊比賽時采用自動報靶系統(tǒng),將會越來越普遍。這種方式不僅能減少人力物力支出、提高報靶效率,還能減小由于人為帶來的不確定因素。目前已有不少單位研究出多種自動報靶系統(tǒng)[1-4]?;跈C器視覺的自動報靶系統(tǒng),應用環(huán)境要求特殊,還未得到普及[1-4]。本文基于MATLAB函數(shù)工具箱實現(xiàn)靶紙彈孔檢測的數(shù)字化方法,在射擊時對靶紙圖像進行采集,通過基于MATLAB的圖像處理技術對靶紙圖像進行處理分析,并模擬圖像進行成績輸出。

1 靶紙圖像采集讀取

靶紙圖像采集可以有多種方式,本實驗采用最高像素值為300萬的數(shù)碼相機拍攝,圖像采集簡便,便于推廣應用。MATLAB中提供的imread()函數(shù)用于實現(xiàn)圖像的讀取操作,可讀取JPG、TIF、GIF、HDF、XWD和CUR等多種圖像格式。調用該函數(shù)后將得到一個存儲圖像數(shù)據的矩陣,后期對圖像的各種處理正是基于該數(shù)據矩陣來完成。

2 靶紙圖像預處理[1]

2.1 圖像灰度化

數(shù)碼相機拍攝的圖像為彩色圖像,圖像中每個像素都包含有R(紅色)、G(綠色)、B(藍色)三種基色分量信息,每種基色分量均需要占用八位來表示基色強度,數(shù)據量較大。為減輕計算機工作量,去除掉部分無用信息,將圖像進行灰度化處理,減少后續(xù)處理分析耗時。

在MATLAB中采用rgb2gray()函數(shù)對圖像進行灰度化處理,該函數(shù)中三基色的權重系數(shù)取值為(0.299,0.587,0.114)[5]。

2.2 圖像增強

對靶紙圖像增強是為了突出圖像中的有用信息,同時對噪聲等無用信息進行一定的消除,類似信號處理中的濾波器。圖像噪聲常常表現(xiàn)為孤立像素點,如果不去除噪聲,會對邊緣檢測、圖像變換以及后續(xù)的彈孔定位帶來影響。MATLAB中提供了平滑濾波器、中值濾波器以及銳化濾波器這三種圖像增強濾波器[6]。平滑濾波器本質上類似低通濾波器,只對信號的低頻部分有很好地選通性。靶紙圖像中對屬于高頻部分的圓環(huán)邊緣提取十分重要,采用平滑濾波器將對其造成破壞。銳化濾波器有時會導致輸出圖像灰度值出現(xiàn)負值,還需要進行相應灰度轉換,增加處理工作量。本文采用中值濾波器對靶紙圖像進行濾波處理,能有效去除類似斑點噪聲及椒鹽噪聲的孤立像素點,同時較好地保留了圖像的邊緣信息[2]。這是一種非線性的去噪方法,其基本原理是在圖像中一個像素周圍確定一個鄰域,以該鄰域中各像素點灰度值的中值來代換該像素點自身的灰度值[4]。

MATLAB中提供medfilt2()函數(shù)用于對圖像信息進行中值濾波,二維濾波窗口可以為方形、圓形、菱形等,由圖像像素點構成,可在函數(shù)中設置窗口形狀,默認為像素點的方形窗口[5]。

2.3 靶紙圖像二值化

由于對靶紙圖像的處理主要是對圓環(huán)和彈孔的識別提取,對于圖像灰度值并沒有特定的要求,所以進一步對圖像二值化以去除無用信息。所選取的閾值需要能夠有效保留圖像特征,保證后續(xù)處理的可靠性。對灰度化后的靶紙圖像繪制灰度直方圖,如圖1所示。

從直方圖看出灰度值集中在Y220范圍內,其中Y220對應白色背景以及白色圓環(huán)部分,所以閾值TG取值應在30/255

3 基于Hough變換的靶心定位

3.1 Hough變換圓檢測原理[2,7]

Hough變換將二維圖像平面轉換為三維參數(shù)空間,采用類似“投票”模式的判斷方法。三個參數(shù)值分別為圓心的行坐標a,圓心列坐標b,以及半徑r。對于圖像平面中的任何一個像素點(x,y)都要在三維參數(shù)空間內進行遍歷運算,若運算結果滿足關系式,則對應三維空間中的參數(shù)點票數(shù)加一。完成運算后,三維空間中“票數(shù)”最多(或滿足一定數(shù)量)的參數(shù)點,其參數(shù)即為檢測到的圓所對應圓心坐標以及半徑值。Hough變換檢測圓三個參數(shù)間的一般關系如下式:

3.2 用于靶紙圓環(huán)提取的Hough變換降維算法

從Hough變換原理可知,其運算過程中將會有大量的時空消耗,減少運算維度和參與運算的像素點數(shù)可以提高Hough變換效率。前期已對靶紙圖像進行預處理得到圖像的二值圖,減少了參與Hough變換的像素點數(shù)。接著,采用Sobel算子對靶紙圓環(huán)進行邊緣提取。圖像邊緣是圖像局部特征不連續(xù)的表現(xiàn),出現(xiàn)在兩個不同圖像區(qū)域的交界,常常是灰度突變的結果,在灰度突變處進行微分運算將產生高值[8]。MATLAB中通過調用edge()函數(shù)進行邊緣提取,函數(shù)計算結果為和輸入圖像一樣大小的二值圖。邊緣提取對圖像的特征信息進行提取,進一步減少Hough變換算法的工作量,減少運算時間。

由于靶紙圓環(huán)均為同心圓環(huán),只存在一個位置固定的圓心。經邊緣提取后的圖像是由像素點組成的多個同心圓環(huán),圓環(huán)特征較為明顯,考慮降低Hough變換的計算維度來提高計算速度[9],先進行靶紙圓心的提取,將圓心橫縱坐標分別提取。首先是橫坐標的提取,以平行于X軸的掃描線,自圖像頂部向下縱向掃描。此時靶紙上圓環(huán)邊緣點值為“1”,背景為“0”,因此每向下掃描一行,記錄該行i中間距最大的兩個“1”值像素點的橫坐標分別為、,直至掃描完圖像。接著,以平行于Y軸的掃描線,自圖像左邊向右橫向掃描,記錄像素點縱坐標分別為ali、a2i,直至掃描完圖像。若某行只存在一個“1”值點,則跳過該行。距離最遠的兩“1”值點為最外圈圓環(huán)上的點,坐標中值(ami,bmi)即為對應圓心坐標,計算公式如下:

由于邊緣提取后的圓環(huán)邊緣不完全連續(xù),且可能存在彈孔邊緣信息以及噪聲點,若以文獻[10]中盡量多弦交點的簡單統(tǒng)計平均來計算坐標,將引入上述影響因素,導致圓心定位出現(xiàn)誤差。因此,采用類似Hough變換證據積累的判斷方法,對每行/列掃描得出的中值坐標采取投票的積累方式,出現(xiàn)相同的中值點坐標時則對該坐標對應“票數(shù)”Na[ami]加1,當遍歷完整幅圖像時,找出“票數(shù)”最多的中值點坐標ammax。此處,可設置一個閾值Ta,考慮到圖像像素點的離散化以及邊緣提取帶來的影響,將中值坐標滿足

內的對應點ami求和,接著求取平均值,此平均值記為圓心坐標a。同理得b。通過這種方法可以有效減少非最外圈圓環(huán)上弦交點即錯誤點或者噪聲點的干擾的影響。MATLAB中調用sum()函數(shù)用于求和,調用max()函數(shù)用于求取最大值。坐標關系式如下:

上述算法的部分MATLAB代碼如下:

%BW為邊緣提取后靶紙圖

[rows,cols]=find(BW); %搜索1值像素點

mount=size(rows); number=mount(1);

i=1; j=1;

while(i

xjd(j,1)=rows(a);

while(i

if(cols(i)==cols(i+1))

xjd(j,2)=rows(i+1);i=i+1;

else

i=i+1; j=j+1; break;

end

end

end

number=length(xjd); Na=zeros(1,number);

for n=1:number%for循環(huán)計算中值及票數(shù)

zz(n)=round((xjd(n,1)+xjd(n,2))/2);

Na(zz(n))=Na(zz(n))+1;

end

[amax,id]=max(Na); %找出票數(shù)最多中值點

a=(Na(id)*id+Na(id-Ta)*(id- Ta)+Na(id+Ta)*(id+Ta))/

sum(Na(id-Ta:id+Ta))%基于閾值Ta計算均值得坐標a

根據機器視覺中的ROI(Region Of Interest)理論,恰當選取ROI能有效減少圖像運算的計算量[11]。根據先驗知識圖像采集時圓心處于圖像中部區(qū)域,將待驗證像素點所處范圍設定為圖像中部的矩形區(qū)域,該矩形區(qū)域邊長設為圖像邊長的1/4,由此進一步減少參與運算的像素點。本算法將圓的參數(shù)方程寫為極坐標形式:

已知圓心坐標,根據先驗知識設定r的可能取值范圍,遍歷計算感興趣區(qū)域中的邊緣點,采用上述Hough變換證據積累的方法得到r[9],且設定一個閾值Tr,減少離散數(shù)據帶來的誤差。閾值的設定使得對于一些存在干擾的靶紙圖像也能有效地進行圓環(huán)檢測,例如靶紙存在一定形變或者是子彈擊中內圓環(huán)帶來的干擾,提高了算法的魯棒性。

4 基于圖像差影法的彈孔定位[12]

4.1 圖像差影算法[2,4]

本文在彈孔定位的分析上,將彈孔視為一個運動目標,每次射擊后彈著點都不同,近似為目標的運動過程。運動目標的檢測算法有幀間差分法、背景差分法以及基于光流場的檢測方法,圖像差影法是利用當前圖像與初始圖像進行減運算來提取目標的一種檢測方法[13]。首先,采集射擊前的靶紙圖像以及本次射擊后的靶紙圖像,將兩幅圖像視為視頻中的前后兩幀圖像,接著采用幀間差分法獲得彈孔信息,并將彈孔圖像二值化處理。

4.2 形態(tài)學濾波處理[3]

提取的彈孔圖像可能會包含噪聲,將會導致彈孔定位出現(xiàn)誤差,對該圖像進行先腐蝕后膨脹處理的開運算[5]。在MATLAB中調用imerode()函數(shù)對圖像進行腐蝕操作,去除圖像中小而無意義的噪聲像素點;接著調用imdilate()函數(shù)對圖像進行膨脹操作,使彈孔區(qū)域恢復至原始大小,即消除由于腐蝕對彈孔面積帶來的影響。兩個函數(shù)均采用strel()函數(shù)定義一個結構元素,其在形態(tài)學中的作用好比濾波器中的濾波窗口,該函數(shù)支持創(chuàng)建線形、矩形、方形、球形和自定義類型等的結構元素。

實現(xiàn)彈孔提取及定位的部分MATLAB代碼如下:

b=imread('current.jpg'); %靶紙讀取

B=I-b; %射擊前后的靶紙圖像差影

B=im2bw(B,T); %基于閾值T進行二值化

subplot(221),imshow(B)

se=strel('square',2); %定義方形結構元素

imeBW=imerode(B,se); %圖像腐蝕

subplot(222),imshow(imeBW)

imdBW=imdilate(imeBW,se); %圖像膨脹

subplot(223),imshow(imdBW)

[row,col]=find(imdBW==1); %搜索彈孔

x=min(col); w=max(col)-x;

y=min(row); h=max(row)-y;

subplot(224),imshow(imdBW)

hold on; %圖像保持

rectangle('Position',[x,y,w,h],'LineWidth',1,'EdgeColor',

'w'); %框彈孔區(qū)域

5 實驗結果

仿真實驗在2.3GHz,RAM為4GB的計算機上進行,采用MATLAB8.2語言編寫代碼。本次實驗采用靶紙滿環(huán)11環(huán),且不同環(huán)數(shù)圓環(huán)半徑差相同。實驗結果如圖2、圖3和圖4所示。

求得彈著點環(huán)數(shù)及誤差。其中(a,b)為環(huán)心坐標,(xd,yd)為彈孔坐標,r為中心圓環(huán)半徑,Hj為環(huán)數(shù)計算值,Sj為人工計算值(采用尺規(guī)法測量),ρ為環(huán)數(shù)相對誤差。計算結果若為負數(shù),則判為脫靶。靶紙測試結果如表1所示。

6 總結

基于MATLAB函數(shù)工具箱的圖像處理,函數(shù)調用方便,程序設計高效。首先通過圖像預處理去除無用信息,接著將Hough變換算法降維進行內圓環(huán)的定位,最后搜索定位彈孔,求出彈著點坐標,方案適用于圓環(huán)完整的靶紙識別。計算出的射擊環(huán)數(shù)相比人工計算誤差在0.1環(huán)以內,且計算速度較快。進一步,可考慮靶紙形變帶來的影響或將方案轉換為硬件系統(tǒng)以提高實時處理性能,可以應用于射擊比賽中的自動報靶系統(tǒng),免去人工報靶可能帶來的不確定性因素,提高比賽的公正度和效率。

參考文獻(References):

[1] 周曉偉.基于圖像處理的自動報靶系統(tǒng)研究[D].中北大學碩

士學位論文,2011.

[2] 陳海萍.基于機器視覺技術的模擬射擊訓練系統(tǒng)研究與設計[D].

廈門大學碩士學位論文,2012.

[3] 羅真.基于圖像處理的自動報靶系統(tǒng)設計[D].中南大學碩士

學位論文,2014.

[4] 謝殿強.基于ARM-Linux機器視覺的軍用自動報靶系統(tǒng)的

研究[D].山東大學碩士學位論文,2009.

[5] 周品.MATLAB圖像處理與圖形用戶界面設計[M].清華大學

出版社,2013.

[6] 葉雯.基于MATLAB的圖像去噪研究[J].計算機時代,

2015.6:10-12

[7] 陳小艷,王強,李柏林.改進的Hough變換檢測圓方法[J].計算

機系統(tǒng)應用,2015.8:197-201

[8] 蔣先剛.數(shù)字圖像模式識別工程軟件設計[M].中國水利水電

出版社,2008.

[9] 趙京東.用兩步Hough變換檢測圓[J].計算機應用,2008.7:

1761-1763

[10] 孫蓉蓉.圖像處理技術在自動報靶系統(tǒng)中的應用研究[D].南

京理工大學碩士學位論文,2006.

[11] 孫國棟,趙大興.機器視覺檢測理論與算法[M].科學出版社,

2015.

[12] 崔亞琳.基于計算機視覺的射箭精確自動報靶系統(tǒng)研究[J].

火控雷達技術,2015.12:27-30

第5篇

關鍵詞:數(shù)字圖像處理 教學模式 教學改革

中圖分類號:G642

文獻標識碼:A

文章編號:1004-4914(2013)05-216-02

一、引言

隨著電子和信息技術的迅速發(fā)展,數(shù)字圖像處理已成為當今信息處理技術中發(fā)展很快且應用面很廣的新興學科之一。“數(shù)字圖像處理”課程也成為了高校本科計算機與信息類專業(yè)的一門專業(yè)核心課程。但由于數(shù)字圖像處理學科所涉及的知識面廣,理論復雜,對數(shù)學基礎的要求高,實踐環(huán)節(jié)動手能力要求強,其課程內容也在不斷更新豐富。在以往傳統(tǒng)教學過程中呈現(xiàn)出了以下弊端:(1)教材中大量理論和算法推導給學生的學習帶來困難;(2)單一的單機版多媒體教學,無法滿足學生對新知識、新技術、新應用的了解和深入學習;(3)沒有完善系統(tǒng)的實驗指導書,促使學生學習的積極性下降,導致實驗效果不佳;(4)沒有實際項目作為應用鍛煉,造成理論與實踐脫鉤,無法激發(fā)學生的學習動力和興趣等。

針對數(shù)字圖像處理教學過程中出現(xiàn)的上述問題,國內很多教學專家和學者,結合自己的實際教學過程,各抒己見,陸續(xù)提出了很多寶貴的改革建議和方案,取得了相應的教學改革成果。如山東工商學院的魏廣芬和王永強等于2009年針對“數(shù)字圖像處理”課程和學生特點,介紹了教學過程中實施的一些改革措施,包括采用現(xiàn)代化教學手段,“設問-思考-引導-嘗試-總結”的教學模式和學生分組的學習方式,加強實驗和課程設計教學環(huán)節(jié)以及完善評分機制等方面。并對教學過程中發(fā)現(xiàn)的相關問題進行探討。西北民族大學的李向群和王書文于2010年從教學內容建設、教學手段改革、實驗環(huán)境建立、考核方式改革等方面入手進行了深入細致的探討,并將這些方法應用到實際教學過程中,收到了較好的效果。中國傳媒大學的呂朝輝也于2010年根據數(shù)字圖像處理課程的特點,探討了本門課程的教學改革和實踐,經過五年來的教學實施,取得了良好的教學效果。南通大學的趙敏于2011年,針對該課程的特點,論述了在教學中引入案例教學法的可行性和具體實施方案。

通過對上述數(shù)字教學改革的學習和研究,結合我校“大德育,大工程,大實踐”的辦學理念和信息與計算科學專業(yè)“3+1”教育模式(本專業(yè)“3+1”教育模式是指3年在學校完成理論課學習,1年在軟件實習公司等完成工程實訓、生產實習、畢業(yè)實習和畢業(yè)設計等實踐環(huán)節(jié),以培養(yǎng)應用型人才為培養(yǎng)目標)及本科生的特點。對本專業(yè)數(shù)字圖像處理課程的教學進行了改革研究和實踐。建立了一個以學生為主體,以現(xiàn)代網絡多媒體教學為平臺,以大學生科研立項為載體,以大學生就業(yè)或考研深造為目標的一套較為完善的數(shù)字圖像處理課程教學體系結構。

二、課程改革內容

結合傳統(tǒng)教學中存在的問題,和現(xiàn)代網絡多媒體教學建設的需要。本課題研究內容主要將通過教學內容、教學方法、教學手段和考核機制來探索和實施。

1.優(yōu)化教學內容。數(shù)字圖像處理課程的基本內容包括圖像處理的基礎知識、圖像增強、圖像變換、圖像分割、圖像復原、圖像特征提取與選取以及圖像壓縮編碼等知識。但隨著信息化時代知識的加快更新、技術快速革新,數(shù)字圖像處理課程已成為模式識別和計算機視覺等新學科的基礎,并根據學生就業(yè)需求的主線要求。通過對教學內容的深入研究,在本專業(yè)新版教學大綱中,對授課內容中要求以基礎理論知識為基礎,把相關的科研項目和實際項目滲透到授課中。例如在介紹圖像處理的基礎知識的時候,我們可以結合案例驅動來講述圖像處理的過程;將車牌識別、人臉識別、筆記識別等實際項目穿插到圖像增強、圖像分割、頻域處理以及特征提取與選取中。同時,我們把信息熵、模糊數(shù)學和小波分析等概念滲透到部分章節(jié)中,并給出該理論解決問題的結果,以提高學生學習新理論的興趣,促使部分同學自學新的理論,培養(yǎng)學生的自學能力。在講述專業(yè)基礎知識的過程中,我們將適時地增強相關的軟件的學習和資源庫的介紹,例如通過實驗和實訓的教學加強學生對Matlab和VC++等語言的學習和實踐。通過CNKI和IEEE Tran文章的介紹,提高學生對最新科研成果的了解,激發(fā)學生學習的興趣,培養(yǎng)學生對新事物的學習能力。鼓勵學生進行大學生參加校內科研立項,引導學生分析問題和解決實際問題的能力,進一步提高學生的綜合素質能力。

2.豐富教學方法。在以往的教學過程中,數(shù)字圖像處理課程的教學主要以“填鴨式”教學方法為主,只注重對學生的教,而忽視了學生的學和做,沒能產生良好的教學效果。通過對當前主要教學方法的研究與探索,我們豐富了數(shù)字圖像處理課程的教學方法,以“啟發(fā)式”教學方法為主,以綜合運用講授法、研究法、討論法、實驗法等教學法,把“教、學和做”很好地穿插起來,發(fā)揮各種方法的優(yōu)勢,引導學生積極參與教學,實現(xiàn)教與學深層次互動。促進學生對數(shù)字圖像處理基本知識和方法的掌握及動手能力的培養(yǎng)。

3.提升教學手段。針對該門課程理論性強、乏味單調的特點,應用現(xiàn)代網絡多媒體教學手段,借鑒當前較為流行的CDIO教學模式,進行教學手段的提升。結合教學內容的組合的優(yōu)化和教學方法的豐富,在教學中以現(xiàn)代網絡多媒體為教學媒體,通過制作多媒體課件,以“少而精”和“圖文并茂”為原則,并結合Matlab和VC++等軟件編程實例的案例教學,在課堂教學中適時引入前沿熱點圖例分析和編程處理實例,引導學生進行理論知識的學習,使學生體會到易學、樂學和會做。

4.改善考核機制。摒棄了以往“一考定乾坤”的考核方式,將平時出勤與課堂表現(xiàn)情況、作業(yè)和實驗成績等進行量化,納入最終成績的綜合評核。并結合“3+1”創(chuàng)新教育模式對學生實踐能力和CDIO培養(yǎng)大綱對學生素質進行全面考核的要求。側重學生對基礎知識的把握、個體實踐能力、團隊協(xié)作能力的考核。

三、實踐效果

通過數(shù)字圖像處理教學內容、教學方法、教學手段和考核機制等四方面的改革研究與實踐,近幾年本專業(yè)每年都有10%左右的學生選擇數(shù)字圖像處理的相關研究內容作為本科畢業(yè)論文選題,并取得了較好的成績。通過對畢業(yè)生的跟蹤調查發(fā)現(xiàn),考研深造的部分學生也把圖像處理及新興相關學科前沿方向作為自己的學術研究方向,工作就業(yè)的部分學生也從事了與數(shù)字圖像處理相關的研究工作領域。

四、結束語

本文對以往數(shù)字圖像處理課程教學過程中存在的主要問題進行了簡要的介紹,并對主要相關學者的教學改革內容進行了闡述。結合我校的教學理念以及本專業(yè)的“3+1”教學改革模式,針對本專業(yè)本科生的特點,進行了數(shù)字圖像處理教學的改革研究和實踐。實踐表明,此次教學改革提高了教學效果,得到了學生的認可和好評。完成了對本專業(yè)學生在知識、能力與素質等方面要求的綜合培養(yǎng)。

[基金項目:黑龍江省教育科學“十二五”規(guī)劃研究課題(GBC1212076);黑龍江科技學院教學研究項目]

參考文獻:

1.魏廣芬,王永強,丁昕苗,何愛香.“數(shù)字圖像處理”課程教學改革的嘗試.電氣電子教學學報,2009(6)

2.李向群,王書文.《數(shù)字圖像處理》課程的教學改革初探.微計算機信息,2010(3-2)

3.呂朝輝.數(shù)字圖像處理課程教學改革與實踐.高教論壇,2010(11)

4.趙敏.MATLAB用于數(shù)字圖像處理的教學實踐研究.電腦知識與技術,2012(31)

5.查建中.CDIO:顛覆性的工科教育模式改革[J].中國遠程教育,2009(3)

第6篇

關鍵詞:注冊;識別;圖像獲取

1.指紋識別技術的發(fā)展

在生活中較常見的指紋識別應用有:指紋鎖、指紋考勤、指紋門禁、指紋保管箱、筆記本電腦指紋登陸模塊、手機指紋開機驗證模塊、指紋網上銀行。相信隨著技術發(fā)展成熟,應用成本越來越低,指紋識別技術會越來越廣泛地應用到我們日常生活中來。

指紋識別由于其電子門鎖技術的成熟和成本降低,開始徹底走向民用。國內生物識別未來將形成上百億元的市場,其中安防業(yè)是最重要的應用領域之一,市場空間很大。目前,羅湖口岸已經用了指紋通關,德國將指紋識別付款應用到某些超市中。預計指紋門禁、指紋讀卡器、指紋智能鎖,指紋門禁考勤一體機及相關指紋身份識別系統(tǒng)將會迅速普及到每一個安全防范項目和智能大廈,目前國內年門禁安裝數(shù)量大約是在50萬門以上,其中指紋識別的在門禁應用大概只有1%左右,而一般國外這個比例大約應為20%以上。換句話說,在國內安防業(yè),生物識別產品的市場缺口在9.5萬臺左右,另一個比較明顯的狀況是,目前專門從事指紋讀頭和電子門鎖指紋門禁生產和銷售企業(yè)很少,所以綜合起來看這個市場有兩個明顯的特點:市場大,競爭少。

社會在不斷的進步,身份的鑒別工作也提出越來越高的要求,在各種生物特征識別技術中,歷史最悠久、使用最廣泛的無疑是指紋識別技術,是一種相對比較成熟的身份鑒別方法,無論是在科學研究還是在工業(yè)界的實際應用中都得到了人們的廣泛關注。盡管指紋識別技術在研究與使用得到了關注,但其發(fā)展還是不能滿足社會日益增長的需求,究其原因是指紋識別在識別率、穩(wěn)定性以及識別速度等方面還不能夠滿足實際使用時的要求。

 2.指紋識別技術的應用

   毫無疑問,指紋識別技術具有廣泛的市場前景,其社會效益及經濟效益是具大的,一般的自動指紋識別技術都需要有四個過程,即指紋圖像的獲取、指紋圖像的處理、指紋特征提取和指紋匹配,也就是說,指紋識別的大部分工作都是數(shù)字圖像處理的工作,而本文的主要研究內容也是數(shù)字圖像處理在指紋識別中的應用。在數(shù)字圖像處理中,圖像獲取就是把一幅模擬圖像(如照片、畫片等)轉換成適合計算機或數(shù)字設備的數(shù)字信號。這一過程主要包換攝取圖像、光電轉換、數(shù)字化等步驟,而指紋圖像的獲取就是通過一定的設備采集手指表面的指紋凹凸信息同時將之轉化為數(shù)字信號圖像的過程;而在指紋圖像處理的過程中,包含了幾種常用的圖像處理手段,如圖像增強,圖像分割等,其中在圖像增強的過程中又包含了灰度與對比度的處理過程,主要是為了突出圖像中感興趣的信息,衰減或去除不需要的信息,從而使有用的信息得到增強,便于目標區(qū)分或對像理解;指紋特征提取則是從經過預處理的圖像中提取指紋特征;指紋匹配顧名思義是指匹配指紋的特征,從而進行識別。故對幾幅指紋圖像進行匹配一般是從圖像中提取的特征進行匹配。

一般來說,指紋圖像有全局特征和局部特征兩大特征,能夠反映指紋整體開關特征的是全局特征,這個特征的提取一般局于指紋分類;能夠反映指紋細節(jié)特點是局部特征,這個特征一般用于指紋對比。指紋線中的中斷點、交叉點及拐點是指紋的特征點。

指紋識別系統(tǒng)的主要工作分為兩個階段,即注冊階段與識別階段,也就是提取指紋特征和識別指紋特征的過程。一般在注冊階段,都要求輸入各自的用戶名以及對應的指紋,該過程需要將手指放在專門的采集指紋窗口上,經過指紋識別系統(tǒng)的指定模塊特征提取模塊將輸入指紋的特征提取出來,結合用戶名形成一個數(shù)據庫;識別階段時,該系統(tǒng)會將輸入的指紋與數(shù)據庫中現(xiàn)在有的指紋中進行一系列的匹配,特征點特征線等,這個過程需要讀取數(shù)據庫中保存的指紋特征信息。通用的指紋識別系統(tǒng)的流程圖如圖1所示。

圖1指紋識別系統(tǒng)

就使用情況看,現(xiàn)有的指紋識別系統(tǒng)通常分為兩大類,即嵌入式系統(tǒng)和計算機終端指紋識別系統(tǒng)。嵌入式系統(tǒng)是一個獨立的系統(tǒng),它不需要其它的設備就可以完成工作,這方面的應用有指紋鎖,指紋考勤機(此處的指紋考勤機需要定期連接設備讀取存檔)等;計算機終端的指紋識別系統(tǒng)的設計與使用則更加靈活,通過計算機的分配,可以使多個系統(tǒng)共同使用指紋數(shù)據庫,若用在考勤設備中,則可以實時顯示該工作人員是否在崗。

除了公司等地的考勤、安保等地,還有一個與我們是日常生活更為接近的使用場合,即筆記本的指紋識別系統(tǒng),現(xiàn)在,有很多品牌的筆記本已經將指紋識別系統(tǒng)應用到計算機上,筆記本的指紋識別系統(tǒng)大概經歷了兩代,第一代的指紋識別系統(tǒng)使用的是光學識別系統(tǒng),這種技術容易出錯而且不穩(wěn)定,而第二代指紋識別系統(tǒng)采用的是電容傳感技術,利用小信號創(chuàng)建指紋圖像的半導體設備,電容傳感器產生的電子信號可以直接達到真皮層讀取指紋圖案,提高了整個系統(tǒng)的可靠性。

3.結束語

   指紋作為生物特征之一,其先天具有的不變性,唯

一性和可分類性,是公認的具有法律地位的個人身份特

征的可靠證據。指紋識別系統(tǒng)相對其他生物識別系統(tǒng),

起點較早、種類最多應用最廣泛,由于指紋識別系統(tǒng)成

本低,可以集成在很小的芯片上進行處理,已經普遍被

用來替換用戶名/ 口令、電子令牌等傳統(tǒng)的身份認證終

端設備。目前,指紋識別系統(tǒng)已用到了幾乎所有需要進

行安全性防范的場合,遍及諸多領域。

參考文獻:

[1] 郭浩.基于嵌入式隱Markov模型的指紋分類和匹配研究.[博士學位論文].大連:大連理工大學,2004

[2] Jain A K, Pankanti S. Automated Fingerprint Identification and Imaging Systems. Technical Report. Miehigan State University,1999.

[3] 李曉昆.基于結構特征的指紋識別.計算機工程與科學.1999,21(2):25~29

[4] 王崇文,李見為等.自動指紋識別系統(tǒng)的設計與實現(xiàn).計算機應用.2001,12:63~65

[5] 章毓晉.中國圖像工程及當前的兒個研究熱點.計算機輔助設計與圖形學學報,2002,14(6):489~193

[6] 高靖靖.指紋識別預處理算法研究:[碩士學位論文].成都:電子科技大學,2007

第7篇

關鍵詞:表格圖像處理;性能評測;表格版面結構;線條交點

中圖分類號:TP751文獻標識碼:A文章編號:1009-3044(2007)03-10754-02

1 引言

隨著圖像處理技術的不斷發(fā)展,對文檔圖像的處理已經從一個字符識別器發(fā)展到一個復雜的包含圖文分割、公式識別、表格識別等功能的智能化系統(tǒng)。其中表格圖像最為常見,對于表格圖像的識別也是DIP(Document Image Processing)領域的一個研究重點[1]。

表格圖像中表格結構的存在是不確定的,表格結構存在的數(shù)量和位置也是不固定的。表格圖像處理的目的就是從包含有表格數(shù)據的圖像中定位出表格的位置,然后再對表格內部版面結構進行分析,最后按照某種格式保存,變成計算機能夠處理的表格信息。表格圖像處理技術是一個有相當難度的課題[1],許多處理方法不盡完善,需要不斷探索,針對表格圖像處理系統(tǒng)建立一個完整的評測體系尤為重要。目前的評測方法主要有兩種:一種是手工評測,一種是自動評測。手工評測是由評測人員用肉眼來觀察處理結果的好壞,自動評測是利用評測軟件分析系統(tǒng)的處理性能,評測過程是自動或半自動的。

本文針對表格版面結構定位與分析的性能評測問題展開研究,在前人提出的“線條交點矩陣”匹配的評測機制[8]基礎上,做了優(yōu)化和改良,建立了完整的評測系統(tǒng),最后,基于南開大學機器智能研究所RTK系統(tǒng),進行實際的測試分析,得出實驗結果。

2 表格圖像處理自動評測模型

2.1 性能評測基本概念

首先我們引入DIP系統(tǒng)評測機制中使用的概念:

(1)性能評測(Performance Evaluation):根據一系列基準數(shù)據對系統(tǒng)進行性能測試。

(2)理想系統(tǒng)(Ideal System):相對實際待評測系統(tǒng)而言的,是個理想化的系統(tǒng),對于一定的輸入,產生期望的輸出。每個實際系統(tǒng)都有個對應的理想系統(tǒng)。

(3)測試樣本(Test Sample):在系統(tǒng)測試或者評測過程中需要的對實際系統(tǒng)的輸入。

(4)測試基準(Ground Truth):就是標準結果,測試樣本輸入理想系統(tǒng)得到的結果[3]。

(5)處理結果(Processing Result):將測試基準作為實際系統(tǒng)的輸入,得到的結果就是處理結果。

(6)評測機制(Evaluation Mechanism):包括確定評測內容、設計評測方法、制定評測標準和評測參數(shù)、選擇評測樣本、監(jiān)督評測實施和分析評測結果。

2.2 自動性能評測流程

圖1簡單描述了表格圖像處理性能評測的流程:

圖1 性能評測流程簡圖

其中標準結果是評測系統(tǒng)的一個基準,它是表格的所有線條和交點的集合,我們構建一個數(shù)據庫來存放表格的標準結果;實際系統(tǒng)是我們待評測的表格處理系統(tǒng);評測函數(shù)是自動評測的核心。一個有效的評測算法是做到自動評測的關鍵[4],本文采用的是“線條交點”的評測機制,從整體和局部都能找到錯誤的原因,為表格圖像的處理性能提高和完善提供指導信息;性能評測的結果是評測的比較結果,我們以圖形和表格等信息來描述評測結果。

2.4 基于線條交點的評測模型

表格的復雜版面結構可以用表格中水平和豎直線的交點來描述,如圖2是一個表格圖像,它的結構可以用圖3所示的線條交點來描述,其中表格邊線缺失的情況用虛線補齊。

圖2

圖3

(1)表格版面結構定位的評測算法思想。采用由粗到精的比對算法對表格結構的定位性能進行評測,將表格定位的處理結果與標準結果相比較,如果處理結果正確,那么它的表格定位的位置和標準結果應該一致(實際算法考慮閾值范圍),否則存在識別錯誤,我們以此為標準來判斷處理結果中表格是否被定位。確定了表格是否被定位以后,再根據表格定位區(qū)域的區(qū)域是否標準結果區(qū)域重合來判斷定位的精度。

(2)表格版面分析的評測算法思想。表格圖像經過處理以后得到的版面結構是一個單元格(由行線和列線圍成的的最小矩形區(qū)域)鏈表,基于單元格對版面分析的結果的描述是一個非常復雜的問題(單元格為二維結構,其合理處理結果表現(xiàn)為二維平面的可接受面積),所以通過直接比較單元格鏈表的方法來評測版面分析的結果好壞,實現(xiàn)起來比較困難,效率也很低。

通過大量的實踐和觀察,我們發(fā)現(xiàn)兩個規(guī)律:(1)線條交點可以確定單元格;(2)線條交點的關聯(lián)性可以判斷單元格的正確性。因此我們可以通過比較表格線條交點的關聯(lián)性來確定單元格匹配是否成功。算法的實現(xiàn)過程見流程圖4:

圖4 表格評測算法整體流程

3 表格圖像處理性能評測環(huán)境

首先,挑選了100頁樣本作為本次實驗的數(shù)據,并且對其進行了詳細分類:

表1是根據圖像的效果進行分類,表2是根據表格的數(shù)目進行的分類:

表1 測試樣本分類統(tǒng)計表

表2 測試樣本分類統(tǒng)計

這些樣本圖像文件放在一個單獨的目錄TableImageSet中。

其次,我們對所選的100頁樣本的處理結果做了人工評測,因為樣本數(shù)目較小,所以得到的結果是準確和有效的,將它作為評測系統(tǒng)的衡量標準,來衡量自動評測系統(tǒng)的結果,由此可以得出本系統(tǒng)的可靠性和有效性。

該自動評測系統(tǒng)在VC6.0環(huán)境中開發(fā),運行環(huán)境是Pentium4,CPU 1.80GHz。下面一節(jié)將對評測的結果進行分析總結。

4 實驗結果

我們以TableImageSet中的樣本集作為輸入數(shù)據,以RTK7.0的表格定位與分析模塊為評測對象,用我們的程序對其進行性能評測。首先分析其表格版面結構定位性能,得出表3的結果,然后針對定位正確的表格進行結構分析的評測,得出表4的結果。

這些評測數(shù)據不僅反映出表格處理系統(tǒng)的整體性能,還定量的給出了系統(tǒng)的錯誤的所在,使開發(fā)人員可以根據錯誤的發(fā)生情況,對系統(tǒng)進行有針對性的改進。

參考文獻:

[1]C. Peterman, C.H. Chang, andH. Alam. A system for table understanding. InProceedings of the Symposiun on Document Image Understanding Technonogy(SDIUT'97),pp. 55-62, Annapolis, MD, April/May 1997.

[2](美)Mark Fewster &Dorothy Graham. 軟件測試自動化技術與實例詳解[M], 電子工業(yè)出版社.

[3]Jianying Hu,Ramanujan Kashi,Daniel Lopresti,George Nagy,Gordon Wilfong. "Why Table Ground-Truthing is Hard." ICDAR 2001(Djvu) pp.129-133.

[4]V. F. Margner, P.Karcher, A.K.Pawlowski. "On BenchMarking of Document Analysis System", August, 1997. Proceedings of 4th International Conference Document Analysis and Recognition, Ulm, Germany(ICDAR'97). pp. 331-336.

[5]G. Nagy, "Document image analysis: Automated performance evaluation," in Document Analysis s\Systems, A. L. Spitz and Dengel, eds., pp. 137-156, World Scientific, Singapore, 1995.

[6]Jing. Hu, R. Kashi, D. Lopresti and G. Wilfong, "Table Structure Recognition and Its Evaluation", SPIE Document Recognition and Retrieval VIII San Jose, California, January 2001.

[7]Jianyin Hu, Ram Kashi, Daniel Lopresti, Gordon Wilfong, "Medium-Independent Table Detection", in Proceedings of Document Recognition and Retrieval VII (IS&T/SPIE Electronic Imaging),volume 3967,California,USA,January 2000,pp.291-302.

第8篇

關鍵詞:結構化局部邊緣模式;文檔圖像;模式分類

目前,文檔圖像具有很多種模式形態(tài),其分類方法也多種多樣。在過去,人們比較常用的分類方法是光學字符識別系統(tǒng),該系統(tǒng)主要根據文本特征、結構特征、混合特征三種方法對文檔進行識別分類,但是該分類方法的分類速度比較慢,對所處理圖像解析度的要求比較高。因此,該方法逐漸被結構化局部邊緣模式分類方法所替代。

1 結構化局部邊緣模式下處理圖像分類的預備知識

文本管理工作主要包括:壓縮、管理、歸檔、文本分析等,在進行文檔工作處理的時候,相對準確的文檔類型信息能夠有效的提高文本檢索的速度以及工作人員的工作效率。文檔具有多種模式形態(tài),每種形態(tài)都有自己的獨特性以及形態(tài)之間的相似性。結構化局部邊緣模式的使用,不僅可以實現(xiàn)對圖像分割模式的自由調節(jié),還能夠有效的提高文檔圖像特征提取的準確性,在使用結構化局部邊緣模式進行文檔圖像特征提取的時候,采用的是圖像區(qū)塊之間重疊的方法,通過這種方式有效的確保圖像分割區(qū)域特征本身的連貫型性。

2 采用結構化局部邊緣模式下,文檔圖像分類特征的提取

本文在對結構化局部邊緣模式下文檔圖像分類處理的研究中,進行分類對比采用的是HOG。結構化局部邊緣系統(tǒng)通過LEP特征,根據圖像像素鄰域的邊緣方向進行了相關的編碼。文檔圖像本身特征就比較明顯,例如影像圖片的像素數(shù)值變化比較大;一般學術論文的格式比較規(guī)整且字數(shù)比較多;灰度圖像之相似性比較大,沒有明顯的規(guī)律可循;表格文件的特征性比較明顯,橫線和豎線比較多;PPT幻燈片的圖像、文字等變化性比較明顯,但是在排版方面具有一定的規(guī)律可以遵循,為了方便結構化局部邊緣模式在處理文檔圖像方面的研究工作,上述幾種圖像類型的邊緣信息都比較明顯。

3 結構化局部邊緣模式和HOG的主要特征

3.1 模式分類框架

文中在進行結構化局部邊緣模式下,文檔圖像的分類處理研究中,還沒有形成一一個完整通用的基準數(shù)據庫進行相關的實驗研究,并且受其它因素的限制也比較明顯。所以,本文在進行處理研究的時候,通過綜合對比研究選取了含有5000張圖像并具有四種文檔圖像類別,每種類型都包含1250張圖像,類型包括:影像圖片、學術論文、PPT幻燈影片以及含有表格的文件。另外,在進行文檔圖像處理研究時,圖片都是隨機獲取的。

3.2 結構化局部邊緣模式的特征描述

結構化局部邊緣模式主要是利用計算機模擬技術對對視覺、圖像等進行處理,在使用的過程中,根據圖片中重復出現(xiàn)的不同pixel,并將其按照不同的方向延伸成九宮格的形狀作為參考的重點。在模式計算的過程中,首先要獲取到原始的邊緣圖像,并建立一個3*3的鄰域窗口,在這一過程中,文本會被分為比較小的空間區(qū)塊,其計算方式為:結構化局部邊緣模式(SLEP)=Ni/N,i=0,1,2,…31,其中結構化邊緣模式的變化范圍是在0到31之間,Ni中的i代表的是pixel的數(shù)目,n代表的是piexl的總數(shù)目。

3.3 HOG的特征描述

HOG特征是目前人們比較常用的圖像特征提取方法,該方法在計算的時候選取的是320*256的圖像區(qū)域,在此基礎上,把區(qū)塊的大小劃分為32*32,其中九宮格的大小為16*16,將九宮格的每一格作為最基本地計算單元,然后進行相關的串聯(lián)計算。方法步驟如下。第一,可以對圖像進行卷積處理,目的是了解圖像中像素的梯度以及方向變化,一般將范圍值控制在[-1,0,1]或者是[1,0,-1]。第二,對每個格子進行量化處理,角度量化的范圍值是[0,180],然后根據每個像素的模建立九維方向角直方圖。第三,把區(qū)塊內部各格子之間的直方圖進行串聯(lián)處理,然后組成36維直方圖的特征向量。第四,把所有的特征向量串聯(lián)在一起,就會形成最后的直方圖特征向量。

4 結構化局部邊緣模式的處理分析

在對上述四種類型的圖像特征進行信息提取研究以后,了解到在進行圖像分析的過程中,圖像的解析度分別為:80*64,160*128,這組數(shù)據說明和HOG相比,結構化局部邊緣模式在運用過程中性能效果比較好,分辨率也比較高。這說明結構化局部邊緣系統(tǒng)在不適用OCR系統(tǒng)的條件下,也具有高質量的文檔圖像分辨率。當圖像大小為80*64,文檔圖像的類別為影像照片以及規(guī)范化的學術論文的時候,SLEP測試效果要比HOG高0.1到1.6個百分點,但是當進行表格文件處理的時候,百分點就會比HOG的百分點低,當進行PPT幻燈片測試的時候,百分點又會比HOG高,這表明,結構化局部邊緣模式在文檔圖像處理的時候,使用整體效能比較高。當圖像大小逐漸變大的時候,除表格文件的測試百分點比較低之外,其余也呈現(xiàn)逐漸增高的現(xiàn)象。上述研究表明,當圖像文檔比較混亂的時候,梯度方向呈現(xiàn)混亂的狀態(tài),進行文檔圖像、影片特征分類會比較方便,但是在進行表格文檔處理的時候,使用HOG取得的效果會更加的明顯。

[參考文獻]

第9篇

關鍵詞: 三維坐標; 多目視覺; 雙目交匯; 硅棒; 特征點

中圖分類號: TP 274.2文獻標識碼: Adoi: 10.3969/j.issn.10055630.2013.02.001

引言硅棒的實際尺寸參數(shù)與硅棒本身的特征點提取密切相關,獲取硅棒特征點的三維坐標信息可有效反映硅棒尺寸參數(shù)和產品質量,為產品的質量監(jiān)控提供依據[1]。然而針對硅棒,無論是整體尺寸還是局部特征的檢測,國內目前尚無相關儀器,在我國這些參數(shù)的檢測還主要是依靠人工完成[2]。人工檢測是一種非在線、接觸式的傳統(tǒng)檢測方式,采用直角尺、游標卡尺、鋼板尺等工具進行檢驗,檢測精確度和重復性受到檢測人員工作狀態(tài)干擾,很難保證統(tǒng)一標準,總體上來說檢測速度和檢測精度不高;同時接觸式檢測過程中需反復搬動樣品不可避免地造成對樣品的二次傷害,效率低,儀器損耗大[2]。結合視覺成像技術和圖像處理技術出現(xiàn)的機器視覺檢測技術,不僅摒棄了傳統(tǒng)檢測方法的不足,滿足了實時檢測要求,同時還具有非接觸、精度高等優(yōu)點,是現(xiàn)場實時三維坐標測量的首選方法之一[35]。國內外關于三維坐標的相關測量方法主要有:電子經緯儀法和三坐標測量機法[3]。坐標測量機的測量精度可達微米級,但是龐大的機身、厚重的底座、復雜的操作以及昂貴的成本限制了其現(xiàn)場的應用[4];經緯儀、激光跟蹤儀便攜性好,但采用多點對準,效率低,不適合于現(xiàn)場在線檢測[5]。機器視覺檢測系統(tǒng)組建非常靈活,既可由單目視覺測量系統(tǒng)構成,亦可選擇雙目甚至多目視覺測量系統(tǒng)搭建而成。因為單目視覺測量三維空間坐標測量不確定度偏差較大[4],所以選擇由四CCD構成的多目視覺系統(tǒng),該多目視覺檢測系統(tǒng)中,相鄰的兩CCD構成正交雙目交匯視覺測量子模塊系統(tǒng),基于雙目視覺原理的子模塊克服了單目視覺檢測的缺陷,精度更高。該多目機器視覺系統(tǒng)在保證較高精度的前提下,作為機器視覺前端采集系統(tǒng),實現(xiàn)了硅棒全范圍大尺寸輪廓檢測,檢測效率和速度較高。1硅棒坐標檢測機器視覺系統(tǒng)組成典型的基于機器視覺的硅棒坐標檢測系統(tǒng)組成如圖1所示:

圖1機器視覺的坐標檢測系統(tǒng)組成

Fig.1The design of machine vision for coordinate detection system

硅棒坐標測量系統(tǒng)主要包括上位機界面、數(shù)據采集模塊、圖像處理模塊、輸入輸出接口以及機械搭建平臺組成。上位機作為人機交互平臺負責數(shù)據顯示和存儲,總體管理數(shù)據采集模塊和圖像處理模塊。數(shù)據采集系統(tǒng)作為機器視覺檢測的核心之一完成硅棒輪廓信息圖像采集,涉及光源、鏡頭、CCD相機以及圖像采集卡,采集系統(tǒng)工作流程為:光源照射待測硅棒,CCD相機采集圖像信息經過圖像采集卡將圖像信息轉換為數(shù)字信息送入上位機并實時保存起來。數(shù)據采集完成之后,圖像處理模塊讀取圖像通過相應算法提取特征點最終計算特征點空間三維坐標。圖1還可以看出整個數(shù)據采集模塊搭建在機械平臺上由執(zhí)行機構驅動,不僅可以實現(xiàn)待測目標的小范圍檢測,同時還可以配合機械平臺運動,驅動數(shù)據采集系統(tǒng)實現(xiàn)待測物體的大范圍全尺寸檢測。2硅棒特征點三維坐標檢測原理

2.1四目視覺全范圍檢測系統(tǒng)組成硅棒特征點坐標視覺檢測技術基于四目視覺原理,整個四目視覺系統(tǒng)作為機器視覺檢測系統(tǒng)的數(shù)據采集模塊負責為后續(xù)圖像處理模塊提供硅棒圖像信息,采集的圖像質量直接影響到后續(xù)圖像處理的難易程度和結果的計算精度。四目視覺原理如圖2所示:數(shù)據采集模塊由四臺CCD相機組成,分別在待測硅棒每個側面安裝一臺CCD面陣相機,保持相機與硅棒待測面垂直放置,在自然光源照射下硅棒表面成像于與之垂直的CCD相機上,則相機分別獲得每個硅棒表面特征的圖像。該圖像可以通過一個四路camelink接口圖像采集卡或者2個雙路camelink接口圖像采集卡送入上位機進行后續(xù)圖像處理。整個數(shù)據采集系統(tǒng)要實現(xiàn)的功能就是確保不降低系統(tǒng)檢測精度的前提下,維持盡量大的有效視場范圍,實時采集獲取清晰的硅棒圖像。

2.2四目視覺系統(tǒng)視場約束為了實現(xiàn)最優(yōu)檢測目的,必須保證待測硅棒在檢測過程中始終處于四目視覺系統(tǒng)的有效視場范圍內,若硅棒對應于相機上像點的坐標為(xi,yi),通過針孔模型透視變換公式就能得出某個特征點在有效視場內的世界坐標為OXWiYWiZWi。圖3為四目視覺系統(tǒng)有效視場示意圖,以四臺CCD交匯中心建立世界坐標系。

圖2四目視覺系統(tǒng)組成

Fig.2The composition of the 4 CCDs

vision system圖3四目全范圍檢測原理及有效視場分析

Fig.3The principle and the analysis of effective

vision field for 4CCDs′ full range detection

如圖所示:四臺面陣相機型號相同,焦距f均為鏡頭中心到CCD靶面中心的距離,相鄰相機之間的基線長度均為B(B=O1O2=O2O3=O3O4=O4O1),O1Xc1Yc1Zc1、O2Xc2Yc2Zc2、O3Xc3Yc3Zc3、O4Xc4Yc4Zc4是分別以CCD相機各自的鏡頭中心建立相機坐標系,以CCD1和CCD2光軸的交點為原點建立世界坐標系OXWYWZW,O1Xc1Yc1Zc1、O2Xc2Yc2Zc2、O3Xc3Yc3Zc3、O4Xc4Yc4Zc4均位于OXWYWZW內,最終計算時必須將O1Xc1Yc1Zc1、O2Xc2Yc2Zc2、O3Xc3Yc3Zc3、O4Xc4Yc4Zc4這四個相機坐標系轉換到同一個參考坐標系OXWYWZW。假設CCD相機像平面平均尺寸為2Tx×2Ty,相鄰相機光軸夾角為2α,則四目視覺系統(tǒng)的有效視場為ABCDEFGH圍成的八邊形。為了準確描述有效視場,在八邊形ABCDEFGH內做內切圓,內切圓面積就反映有效視場的大小,采用內切圓的半徑R對有效視場進行描述??紤]Tx遠遠小于焦距f,則有效視場R可以采用如下近似公式描述:R=Bcosβ/2sinα=Bcos(arctan(Tx/f))/2sin45°≈22BTx/f(1)由式(1)可知:CCD相機間基線長度B、視場角β以及相機夾角α這三個參數(shù)不僅直接限制有效視場的大小,還會嚴重影響四目視覺系統(tǒng)的測量精度。引起測量精度的誤差包括相機本身參數(shù)(Tx、Ty)以及相機分布結構參數(shù)、參數(shù)本身的測量誤差(B、f)[6],它們共同決定了機器視覺采集系統(tǒng)的精度。

2.3雙目交會原理如圖2可知:四目視覺系統(tǒng)中的任意相鄰的兩個CCD構成雙目交匯視覺測量系統(tǒng),所以整個四目視覺系統(tǒng)可以看作四個雙目交匯視覺子系統(tǒng)組成,其中CCD1和CCD2構成子系統(tǒng)1,CCD2和CCD3構成子系統(tǒng)2,CCD3和CCD4構成子系統(tǒng)3,CCD4和CCD1構成子系統(tǒng)4。因為每個子系統(tǒng)光軸互相垂直,所以子系統(tǒng)基于正交雙目交匯視覺原理。正交雙目交匯測量比單目測量準確度高,它的相機夾角2α=90°有效降低安裝誤差[7],保證基線長度,形成相對較大的有效視場利于實現(xiàn)大尺寸檢測,同時α=45°滿足α∈(40°-70°)放置時測量誤差最小要求[4]。以雙目交匯視覺子系統(tǒng)1為例:CCD1和CCD2分別滿足針孔成像模型:zc1 u

(3)其中矩陣M是由相機內部參數(shù)(r1~r9)和相機外部參數(shù)(T1~T3)構成的一個3×4的綜合矩陣。聯(lián)立式(2)和式(3)求解則可得到CCD1和CCD2的采集圖像上的公共特征點的三維坐標,即硅棒第1對棱邊上的特征點坐標,同理對于雙目交匯視覺子系統(tǒng)2、雙目交匯視覺子系統(tǒng)3、雙目交匯視覺子系統(tǒng)4可依次求得第2對、第3對、第4對棱邊上的特征點坐標,從而在保證精度前提下實現(xiàn)硅棒全范圍檢測目的。3硅棒特征點三維坐標檢測方法的實現(xiàn)為了驗證硅棒特征點三維坐標視覺檢測系統(tǒng)的可行性,在實驗室搭建了機器視覺檢測試驗樣機進行試驗,完成四目視覺采集系統(tǒng)的相機標定實驗,同時以CCD1和CCD2構成的正交雙目子系統(tǒng)為例進行一對硅棒表面圖像的數(shù)據采集實驗,基于Visual Studio 2008平臺編寫核心圖像處理算法。

3.1標定實驗相機標定是視覺測量過程中不可缺少的關鍵技術,標定通過針孔成像原理求取相機內部屬性參數(shù)和外部位置參數(shù)從而確定空間坐標系中物點和像點的對應關系[8]。針對本文的多目視覺系統(tǒng)首先對每個相機進行單目標定。單目標定選擇一種介于傳統(tǒng)標定技術和自標定技術之間的方法:張氏平面標定法。標定流程為:首先將自制一個大小為11×11標準棋盤格模板,每個棋盤格大小為10 mm×10 mm。該模板置于視覺系統(tǒng)有效視場內,改變模板位置多角度(不小于3個)分別拍攝,拍攝完成后進行角點檢測,單應性矩陣求解和參數(shù)優(yōu)化,每個CCD獲得一個相應的相機標定文件calib_CCD_1.mat、calib_CCD_2.mat、calib_CCD_3.mat、calib_CCD_4.mat。這種標定方法比傳統(tǒng)標定簡單,算法計算量減少且精度高于自標定方法。通過單目標定得到X方向和Y方向有效焦距(ax,ay)、CCD靶面中心坐標(u0,v0)以及徑向或者切向畸變等相機內部參數(shù),由于切向畸變較小,此處忽略不計,主要考慮徑向畸變參數(shù)(k1,k2),單目標定結果見表1。單目標定完成之后進行立體標定,分別獲得相機坐標系O1Xc1Yc1Zc1、O2Xc2Yc2Zc2、O3Xc3Yc3Zc3、O4Xc4Yc4Zc4相對于世界坐標系的旋轉矩陣R和平移矩陣T。立體標定結果見表2。表1單目相機標定結果

Tab.1The result of monocular camera calibration

CCD1CCD2CCD3CCD4(ax,ay)(1 537.644 971 864.834 93)(1 533.415 091 857.500 18)(1 535.344 071 860.932 01)(1 539.700 31 865.793 31)(u0,v0)(350.602 11272.778 93)(360.149 42285.268 16)(357.021 19279.775 49)(351.339 08288.441 09)(k1,k2)(-0.382 631.710 26)(-0.372 052.034 223)(-0.367 811.901 27)(-0.380 091.947 37)像素誤差(0.321 280.370 39)(0.275 690.223 16)(-0.332 810.201 27)(-0.339 610.291 27)

表2多目相機標定結果

Tab.2The result of multicamera calibration

O1Xc1Yc1Zc1O2Xc2Yc2Zc2O3Xc3Yc3Zc3O4Xc4Yc4Zc4R10010.003 70.04310.002 90.004 310.003 70.040 3010-0.003 61-0.006 50.043 61-0.046 5-0.007 11-0.047 3001-0.004 50.066 81-0.003 90.061 71-0.006 50.057 91T0.242 81 000.229 00999.233 70.100 20.297 50.441 70.020 9-998.001 90.199 51 002.336 70.019 7

圖4硅棒圖像

Fig.4Images of silicon rods3.2圖像采集實驗實驗采用四個IMPERX面陣CCD相機、相機配接15 mm的標準鏡頭,兩個X64CL Prio圖像采集卡,兩個鏡頭基線距離為1 408.6 mm搭建實驗樣機,有效線視場為236.544 mm,將待測硅棒置于CCD交匯的有效視場范圍內,配置圖像采集卡輸出格式為Cameralink Base Mono #1,導入IPX_VGA210相機.cfg配置文件,通過X64CL Prio圖像采集卡將一對像素為640×480黑白硅棒圖像實時送入上位機。其中正交雙目視覺子模塊1采集到的一對圖像如圖4所示。

3.3圖像處理特征點坐標檢測視覺系統(tǒng)第二個核心組成是圖像處理模塊,該模塊通過完成對采集數(shù)據的后續(xù)圖像處理獲得目標特征點的三維空間坐標,技術難點在于機器視覺數(shù)據采集模塊中CCD相機得到的是二維圖像信息,而系統(tǒng)最終要求是得到目標特征點的空間三維坐標。針對問題論文提出一種二維圖像上恢復特征興趣點三維坐標的解決方法:首先提取待處理圖像上的特征興趣點,建立特征興趣點對應關系即同名點識別,接著通過同名點立體匹配獲取對應點視差從而得到特征興趣點3D坐標。

3.3.1Harris角點檢測論文以硅棒角點作為研究的特征興趣點,采用一種基于灰度值相關的角點檢測算子:Harris算子進行硅棒角點檢測。Harris角點檢測的目的是提取待測目標的特征點,依靠特征點來傳遞圖像所表征的參數(shù)信息,算法不受相機姿態(tài)及光照影響,檢測精度達到像素級別[9]。Harris算子數(shù)學表達形式為:M=G(S)gxgxgy

gxgygy(4)

I=Det(M)-k×Trace2(5)M為自相關聯(lián)系矩陣、Det(M)為自相關矩陣行列式的值,Trace為矩陣的跡,k為默認常數(shù),取0.04。式(5)稱為Harris算法響應函數(shù),該函數(shù)給出局部范圍內的興趣值大小。Harris算法采用局部范圍內的極大興趣值對應的像素點作為特征點,因此通過對算法中的門限閾值、局部鄰域大小、高斯窗口大小和高斯方差多次調整,保證在局部鄰域內只留下最大極值點作為興趣點,實現(xiàn)特征最優(yōu)角點的提取。

3.3.2特征點立體匹配特征點立體匹配就是在待匹配圖像上尋找標準圖像上每個特征點的同名點,從而將不同圖像中原本獨立的特征興趣點聯(lián)系起來[1011],特征點匹配不是盲目進行,它遵循一定約束條件,本文同名點匹配基于極線約束。極線約束規(guī)定了一幅圖像上任意一點在另一幅圖像上的對應點只可能位于一條特定的極線上,通過該約束特征點匹配搜索空間從二維降為一維,減少計算量[10]。匹配流程為:首先在現(xiàn)有圖像中設定一個標準圖像,對于標準圖像中的特征點Pl,找出待匹配圖像中與其有最近歐氏距離的前兩個特征點Pr1和Pr2,計算兩個特征點中最近的距離Dmin與次近的距離Pcmin的比值,如果該比值小于匹配閾值,則表示待匹配圖像上歐氏距離最近的點是標準圖像中Pl特征最優(yōu)匹配點。其次以待匹配圖像中Pr1為特征點,重復步驟1的過程,求取標準圖像中Pr1的候選匹配點P′l。最后如果Pl 和P′l是相同點,則Pl 和Pr1匹配成功,否則棄之。重復這個流程,直到匹配完成。同名點匹配完成之后,由雙目視覺視差公式即可得出特征點3D坐標。最后對采集系統(tǒng)拍攝的兩幅硅棒圖像進行角點檢測及匹配算法驗證,獲得了圖像中的4對公共角點3D點坐標值,結果見表3。

表3特征點3D坐標計算結果

Tab.3The calculation result of characteristic points′ 3D coordinatemm

特征角點X實測值X理論值Y實測值Y理論值Z實測值Z理論值153.59154-79.833-80.5-63.422-63263.32263-80.032-80.5-53.709-54353.6195480.20080.5-63.192-63463.2096379.90280.5-53.991-54

通過表3可以看出:理論計算結果和實際測量結果基本吻合,且實際測量精度明顯高于理論計算精度。4結論論文提出一種基于機器視覺的非接觸、實時硅棒特征點檢測技術,搭建了多目視覺硅棒采集系統(tǒng)進行圖像采集實驗,重點研究了多目視覺有效視場確定和正交雙目交匯視覺測量原理,基于Visual Studio 2008平成了硅棒角點特征提取以及同名角點立體匹配等后續(xù)圖像處理算法,整個檢測過程時間不超過0.5 min。實驗結果表明,該技術可準確快速獲取待檢測硅棒的特征點三維坐標,檢測精度可以達到像素級別,適合于硅棒參數(shù)的非接觸式高精度檢測。為下一步開展硅棒面形檢測研究奠定了基礎。參考文獻:

[1]郭海霞,解凱.焦點檢測技術研究[J].哈爾濱師范大學自然科學學報,2007,23(2):73-75.

[2]徐岳生,劉彩池,王海云,等.直拉硅的現(xiàn)狀與發(fā)展[C]∥中國有色金屬學會第六屆學術年會論文集.長沙:中南大學出版社,2005:62-69.

[3]彭凱,劉麗冰.雙攝像機光學三坐標測量系統(tǒng)的研究[J].工藝與檢測,2008,10(9):115-117.

[4]彭凱,劉麗冰,劉書桂.基于雙相機的計算機視覺坐標測量系統(tǒng)[J].光電工程,2008,35(7):95-98.

[5]管業(yè)鵬,童林夙.雙目立體視覺測量方法研究[J].儀器儀表學報,2003,24(6):581-588.

[6]劉佳音,王忠立,賈云得.一種雙目立體視覺系統(tǒng)的誤差分析方法[J].光學技術,2003,29(3):354-360.

[7]郭玉波,姚郁.雙目視覺測量系統(tǒng)結構參數(shù)優(yōu)化問題研究[J].紅外與激光工程,2006,35(增刊):506-509.

[8]羅世民,李茂西.雙目視覺測量中三維坐標的求取方法研究[J].計算機工程與設計,2006,27(19):3622-3624.

[9]張春生.基于點特征匹配的SUSANHarris算子比較[J].西安科技大學學報,2007,27(4):608-616.