時間:2018-01-15 11:11:47來源:網(wǎng)絡(luò)轉(zhuǎn)載
1、引言
機(jī)器視覺又稱計(jì)算機(jī)視覺,是用計(jì)算機(jī)來實(shí)現(xiàn)人的視覺功能,也就是用機(jī)器代替人眼來做測量和判斷。機(jī)器視覺技術(shù)包含光源照明技術(shù)、光成像技術(shù)、傳感器技術(shù)、數(shù)字圖像處理技術(shù)、機(jī)械工程技術(shù)、檢測控制技術(shù)、模擬與數(shù)字視頻技術(shù)、計(jì)算機(jī)技術(shù)、人機(jī)接口技術(shù)等相關(guān)技術(shù),是實(shí)現(xiàn)計(jì)算機(jī)集成系統(tǒng)的基礎(chǔ)技術(shù)。
對于交通燈的識別,將使世界上7~8%的色盲、色弱患者駕駛汽車成為可能,也為無人駕駛汽車在技術(shù)上前進(jìn)一步。因而將為汽車工業(yè)以及汽車電子工業(yè)帶來更大的經(jīng)濟(jì)效益,和更大的社會效益,并可在國際上填補(bǔ)該領(lǐng)域的空白。
2、基于機(jī)器視覺的交通燈識別方法
2.1、交通燈識別方法的流程圖如下所示
2.2、交通燈定位
當(dāng)獲取一張?jiān)嫉膱D像時,考慮到背景的變化及其他物體對交通燈識別的干擾,我們需要將圖像中交通燈的部分提取出來。在此本文用交通燈的形狀及灰度值來定位交通燈在圖像中的位置。
2.2.1、交通燈形狀的矩形度與圓形度
可以通過交通燈的矩形度來找出交通燈一定的范圍,在此采用一種簡單的矩形度計(jì)算方法rectangularity算子,即將上述低灰度值的分散區(qū)域作為輸入?yún)^(qū)域,當(dāng)?shù)玫侥骋痪匦魏洼斎雲(yún)^(qū)域有相同的一、二階矩時,計(jì)算出輸入?yún)^(qū)域的面積和該矩形面積的比,即為矩形度rectangularity的值。顯然當(dāng)輸入?yún)^(qū)域?yàn)榫匦螘r,得到矩形度的最大值1;輸入的區(qū)域越接近矩形,則矩形度越接近與1(無輸入?yún)^(qū)域時矩形度為0)。
通過上述矩形度的算法,可以在低灰度值的區(qū)域中篩選出一定范圍(包含交通燈輪廓)的類矩形,最后通過交通燈在圖像中占據(jù)的面積定位出交通燈的輪廓。
圖2-1通過形狀定位出交通燈的位置
然后在上圖的基礎(chǔ)上,采用一種簡單的Circularity算子,確定出包含有交通燈的輪廓。
具體的算法如下:
假設(shè)F是一個閉合區(qū)域的面積,max這個區(qū)域內(nèi)中心點(diǎn)到邊界或輪廓的最大距離,那么:
circularity=F/(max^2*π)(2-1)
根據(jù)式2-1可得圓的circularity為1。由此可知對于一個輪廓或多邊形包圍的區(qū)域如果其circularity接近與1,那么這個輪廓近似于一個圓??梢酝ㄟ^一個閾值選取出與圓的相似的輪廓,例如可以選取circularity在[0.8,1]范圍內(nèi)的輪廓。如果有多個輪廓符合,則將這些輪廓所對應(yīng)的區(qū)域存放入一個數(shù)組之內(nèi)。
2.3、顏色空間變化
當(dāng)確認(rèn)交通燈的位置后,我們需要通過顏色識別來確定交通燈的狀態(tài)。
由于RGB顏色空間的相似不能代表顏色的相似,HSI顏色空間則沒有這個方面的問題,它們很適合人們?nèi)庋鄣姆直?,較好地反映人對顏色的感知和鑒別能力。因此可以先將RGB顏色空間轉(zhuǎn)化為HSI顏色空間。
RGB空間轉(zhuǎn)化為HSI空間的一般公式如下:
圖2-2通過飽和度提取的交通燈信息
2.4、顏色識別
本文通過圖像分割來識別交通燈的顏色。將圖像通過選定的閾值分割后,找出所需要的圖形。
2.4.1、基于閾值的分割
這是一種最常用的區(qū)域分割技術(shù),閾值是用于區(qū)分不同目
標(biāo)的灰度值。如果圖象只有目標(biāo)和背景兩大類,那么只需選取一個閾值稱為單閾值分割。這種方法是將圖象中每個象素的灰度值和閾值比較,灰度值大于閾值的象素為一類,灰度值小于閾值的象素為另一類。如果圖象中有多個目標(biāo),就需要選取多個閾值將各個目標(biāo)分開,這種方法稱為多閾值分割。閾值分割的結(jié)果依賴于閾值的選取,確定閾值是閾值分割的關(guān)鍵,閾值分割實(shí)質(zhì)上就是按照某個標(biāo)準(zhǔn)求出最佳閾值的過程。
在背景和目標(biāo)圖像的先驗(yàn)概率相等這一特定條件下,最佳閾值是背景灰度均值與目標(biāo)圖像灰度均值之均值。即:
通常閾值化分割方法根據(jù)某種測度準(zhǔn)則確定分割閾值。如果僅使用象素的灰度級確定分割閾值,則閾值化是點(diǎn)相關(guān)的;如果由每個象素鄰域的局部特性決定門限,則閾值化是區(qū)域相關(guān)的?;邳c(diǎn)相關(guān)的閾值化方法有P-TIle方法,直方圖凹形分析法,最大類間方差法,最大熵法以及矩不變門限法等?;趨^(qū)域相關(guān)的分割方法有直方圖轉(zhuǎn)換法,基于二階灰度統(tǒng)計(jì)的方法,松弛法以及基于過度區(qū)提取的分割方法等。
圖2-3顏色識別的結(jié)果
2.5、數(shù)字識別
在本例中,OCR被用來識別出交通數(shù)字燈上的數(shù)字顯示變化,使用OCR之前應(yīng)先將圖像的灰度值取反。
2.5.1、灰度值轉(zhuǎn)換
灰度值轉(zhuǎn)換是將圖像的灰度值顛倒過來,其中圖像的bite和cyclic類型的計(jì)算公式為g‘=255-g
圖像的direcTIon類型轉(zhuǎn)化公式為:
g’=(g+90)modulo180(2-6)
圖2-4灰度值取反結(jié)果
2.5.2、OCR
OCR是英文OpTIcalCharacterRecogniTIon的縮寫,意思為光學(xué)字符識別,通稱為文字識別,它的工作原理為通過掃描儀或數(shù)碼相機(jī)等光學(xué)輸入設(shè)備獲取紙張上的文字圖片信息,利用各種模式識別算法分析文字形態(tài)特征,判斷出漢字的標(biāo)準(zhǔn)編碼,并按通用格式存儲在文本文件中,由此可以看出,OCR實(shí)際上是讓計(jì)算機(jī)認(rèn)字,實(shí)現(xiàn)文字自動輸入。它是一種快捷、省力、高效的文字輸入方法。
圖2-5OCR識別數(shù)字結(jié)果
因OCR是通過檢測暗的模式確定其形狀,所以在上一步的灰度值轉(zhuǎn)化過程中先將原圖像的灰度值取反,把原本灰度值高的部分轉(zhuǎn)換成灰度值低的部分,然后用字符識別方法將形狀翻譯成計(jì)算機(jī)文字,即對文本資料進(jìn)行掃描,然后對圖像文件進(jìn)行分析處理,最后獲取文字及版面信息。
3、結(jié)論
交通數(shù)字信號燈是指揮交通必不可少的、無人職守的公共交通設(shè)施,其重要性是人所共知的。本文建立的交通數(shù)字信號識別系統(tǒng)采用機(jī)器視覺技術(shù),對交通信號燈的顏色及其數(shù)字進(jìn)行自動識別。眾所周知,色弱、色盲是一種遺傳疾病。根據(jù)統(tǒng)計(jì),全世界約有7%~8%的人患有不同程度的色盲、色弱疾病,這給患者的工作和生活帶來了一定的障礙和困難,許多工作和專業(yè)都對色盲、色弱患者關(guān)閉了大門。在我國,色盲者從出生開始直至壽終正寢,駕駛機(jī)動車的權(quán)利就被硬性法規(guī)標(biāo)準(zhǔn)所剝奪!若能夠運(yùn)用機(jī)器視覺技術(shù)讓色盲患者正確區(qū)分紅綠等多種顏色,辨別彩色圖像中的種種事物,賦予他們正常人的生活權(quán)利,意義深遠(yuǎn)。
標(biāo)簽:
中國傳動網(wǎng)版權(quán)與免責(zé)聲明:凡本網(wǎng)注明[來源:中國傳動網(wǎng)]的所有文字、圖片、音視和視頻文件,版權(quán)均為中國傳動網(wǎng)(m.u63ivq3.com)獨(dú)家所有。如需轉(zhuǎn)載請與0755-82949061聯(lián)系。任何媒體、網(wǎng)站或個人轉(zhuǎn)載使用時須注明來源“中國傳動網(wǎng)”,違反者本網(wǎng)將追究其法律責(zé)任。
本網(wǎng)轉(zhuǎn)載并注明其他來源的稿件,均來自互聯(lián)網(wǎng)或業(yè)內(nèi)投稿人士,版權(quán)屬于原版權(quán)人。轉(zhuǎn)載請保留稿件來源及作者,禁止擅自篡改,違者自負(fù)版權(quán)法律責(zé)任。