計(jì)算機(jī)視覺研究的目的范文

時(shí)間:2023-12-25 17:52:47

導(dǎo)語:如何才能寫好一篇計(jì)算機(jī)視覺研究的目的,這就需要搜集整理更多的資料和文獻(xiàn),歡迎閱讀由公務(wù)員之家整理的十篇范文,供你借鑒。

計(jì)算機(jī)視覺研究的目的

篇1

關(guān)鍵詞 計(jì)算機(jī)視覺;立體匹配;研究情況

中圖分類號(hào):TP391 文獻(xiàn)標(biāo)識(shí)碼:A 文章編號(hào):1671-7597(2014)07-0001-01

隨著科學(xué)技術(shù)的快速發(fā)展,計(jì)算機(jī)技術(shù)也得到了飛速的發(fā)展。將計(jì)算機(jī)技術(shù)應(yīng)用于人類的視覺系統(tǒng),并輔助人們觀察到一些眼睛難以看到的東西,已經(jīng)逐漸成為一門大家所熱捧和追逐的技術(shù)。隨著人們對(duì)視覺傳感器技術(shù)越來越多的探索,人們也逐漸實(shí)現(xiàn)了古代時(shí)想擁有千里眼的夢(mèng)想。目前,人們已經(jīng)把視覺傳感器技術(shù)和計(jì)算機(jī)技術(shù)良好的結(jié)合在一起,并把這些技術(shù)應(yīng)用到食品、建筑、醫(yī)藥、電子、航天航空等眾多領(lǐng)域當(dāng)中。而該項(xiàng)技術(shù)的快速發(fā)展,也幫助人們解決了一些日常工作當(dāng)中人類視覺存在盲區(qū)的問題,保證了人們工作過程的安全。視覺技術(shù)與IT技術(shù)的完美結(jié)合使得人們的生活變得更加便利,讓人們親身體會(huì)到了IT技術(shù)給人們生活帶來的便捷。

1 雙目立體視覺概述

雙目立體視覺又稱雙目視覺技術(shù),是目前計(jì)算機(jī)視覺應(yīng)用領(lǐng)域的重要研究內(nèi)容。雙目立體視覺控制系統(tǒng)的組成因其采用的原理和應(yīng)用功能的不同,組成也都各不相同。

雙目立體視覺的實(shí)現(xiàn)原理是基于人眼的視網(wǎng)膜看物體的特性,從兩個(gè)不同的方向來觀看同一個(gè)物體的不同角度,從而實(shí)現(xiàn)清楚的了解到物體的圖像的目的。雙目立體視覺從不同的角度獲得物體的投影信息,并根據(jù)匹配的結(jié)果,獲取同一個(gè)物體不同偏差位置的信息。最后在依據(jù)三角測(cè)量技術(shù),根據(jù)已經(jīng)獲得的這些偏差信息從而獲得這些不同點(diǎn)對(duì)應(yīng)的距離信息,并最終獲得這些實(shí)際物體的具體坐標(biāo)位置信息。

視差測(cè)距技術(shù)告訴我們,要清楚的觀察到一個(gè)物體的全貌,需要兩個(gè)觀察物從不同的方向,或者固定一個(gè)觀察物,移動(dòng)另外一個(gè)觀察物的方式,以達(dá)到拍攝同一個(gè)物體的目的。根據(jù)同一個(gè)物體在兩個(gè)觀察物當(dāng)中的位置偏差,從而確定該物體的三維信息。一般來說,雙目立體視覺的組成包括:圖像獲取設(shè)備、圖像預(yù)處理設(shè)備、攝像機(jī)標(biāo)定設(shè)備、立體匹配設(shè)備、根據(jù)二維信息實(shí)現(xiàn)三維重構(gòu)設(shè)備等五個(gè)重要設(shè)備。

2 雙目立體視覺技術(shù)的原理

立體畫又可以稱之為三維立體畫,是一種人們可以從三維立體圖中獲取二維平面圖信息的技術(shù)。三維立體圖表面看似毫無規(guī)則,但是假如通過一些特殊的技術(shù)或者通過合理的觀察手段和觀察設(shè)備,就可以看到一組秩序井然的美妙圖片。

三維立體圖是一組重復(fù)的二維圖片有序的堆積積累而成,因此可以呈現(xiàn)出立體效果。人體觀察物體的原理大致如下:當(dāng)人類通過左右眼觀察所在的空間平面的時(shí)候,這些平面圖都只是一些毫無秩序的圖片。而當(dāng)左右眼重新聚焦或者在觀察畫面的時(shí)候呈現(xiàn)一定的層次感,則人類的左右眼觀察到的一組重復(fù)案在經(jīng)過人體識(shí)別以后,這些畫面之間將存在一定的距離差異,從而在腦中生成立體感。

雙目立體視覺技術(shù)正是基于以上的原理,從兩個(gè)不同的方向去觀察物體,并獲得目標(biāo)圖像的信息,并經(jīng)過一定的處理獲得三維重建的物體立體信息的技術(shù)。

雙目立體視覺在計(jì)算機(jī)技術(shù)中實(shí)現(xiàn)三維重建的大致流程

如下。

1)攝像機(jī)定位,并通過單片機(jī)計(jì)算得到要獲取圖像信息需要的外部的參數(shù)的大概值,并根據(jù)這些參數(shù)值設(shè)定攝像機(jī)。

2)用設(shè)定參數(shù)的攝像機(jī)拍攝目標(biāo)場(chǎng)景的畫面,并采集這些畫面的二維圖的信息。

3)通過計(jì)算機(jī)技術(shù)實(shí)現(xiàn)雙目匹配,并判定采集畫面中的二維圖像中的不同點(diǎn)之間的對(duì)應(yīng)關(guān)系。

4)在第三步中若得到兩組二維圖像的關(guān)系是稠密的時(shí)候,則生成三維視差圖。如果不是則進(jìn)一步采集圖片信息。

5)根據(jù)得到的視差圖最終實(shí)現(xiàn)場(chǎng)景的三維圖形的重建。

3 雙目立體匹配技術(shù)的研究難點(diǎn)和未來的發(fā)展方向

盡管目前有很多學(xué)者都投身到雙目立體匹配技術(shù)的研究和開發(fā)當(dāng)中,直至目前為止也解決了很多關(guān)于視覺理論當(dāng)中存在的很多缺陷問題。但是視覺問題是一個(gè)復(fù)雜且難以解決的問題,特別是在雙目立體匹配問題方面更是困難重重。立體匹配技術(shù)的難點(diǎn)已經(jīng)成為限制將雙目技術(shù)應(yīng)用到計(jì)算機(jī)技術(shù)當(dāng)中的重要瓶頸。

立體匹配的主要手段就是找到計(jì)算機(jī)采集到兩幅和多副圖片的中像素的對(duì)應(yīng)關(guān)系,然后根據(jù)這些像素關(guān)系判定并生成三維重建圖。但是二維圖像的匹配存在層層困難,主要體現(xiàn)在以下幾個(gè)方面。

1)由于視角的問題或者觀察物體存在遮擋問題,導(dǎo)致采集回來的圖片信息存在盲點(diǎn),這樣子更難找到圖片的匹配區(qū)域。

2)場(chǎng)景中的一些深度不連續(xù)的區(qū)域大都處在場(chǎng)景當(dāng)中的邊界位置,這些位置容易出現(xiàn)像素不高,邊界不清晰等問題,這些問題也給圖像匹配帶了很多困擾。

3)場(chǎng)景當(dāng)中的低紋理的圖片匹配特征和匹配關(guān)系較少,而且該位置的每個(gè)像素點(diǎn)極為相似。假如只是通過簡單的像素相似性檢測(cè)的話,會(huì)檢測(cè)到很多匹配結(jié)果,而這些匹配結(jié)果當(dāng)中有一大部分是錯(cuò)誤的。這樣子的結(jié)果勢(shì)必會(huì)導(dǎo)致最終的圖像匹配正確率極為低下。

從以上的分析,我們可以看出立體匹配技術(shù)存在很多技術(shù)上的難點(diǎn),這些都在很大程度上限制雙目立體匹配技術(shù)在計(jì)算機(jī)當(dāng)中的應(yīng)用發(fā)展。如何才能設(shè)計(jì)出有效、準(zhǔn)確、快速、通用性強(qiáng)的立體匹配算法將會(huì)是以后雙目立體匹配計(jì)算發(fā)展的重要方向。也只有通過設(shè)計(jì)出一套行之有效的立體匹配算法才能使得雙目立體匹配技術(shù)在計(jì)算機(jī)視覺當(dāng)中得到廣泛的應(yīng)用。

4 結(jié)束語

人們通過眼睛可以感受到外界事物的存在,可以清楚的了解到事物的立體信息,分辨出觀察物的廣度和深度,以及物體的遠(yuǎn)近。因此人類視覺感知系統(tǒng)就是一個(gè)雙目的立體感知系統(tǒng)。本文講述的計(jì)算機(jī)中的雙目立體匹配技術(shù)正是基于人眼視覺觀察物體的原理,通過雙目立體視覺原理,對(duì)計(jì)算機(jī)采集獲得兩幅二維圖像的信息進(jìn)行分析,并結(jié)合計(jì)算機(jī)的分析,最終獲得同人類眼睛一樣觀察到物體三維表面信息的目的。雙目立體匹配技術(shù)與計(jì)算機(jī)技術(shù)的完美結(jié)合幫助人們可以更加輕易的獲得物體的信息。希望在不久的將來,可以將該項(xiàng)技術(shù)應(yīng)用于人類的視網(wǎng)膜當(dāng)中,以幫助一些視網(wǎng)膜存在問題的人們,讓他們重新感受到光明,感受世間的溫暖。

參考文獻(xiàn)

[1]高文,陳熙霖.計(jì)算機(jī)視覺算法與系統(tǒng)原理[M].北京:清華大學(xué)出版社,2002.

[2]明祖衡.雙目立體視覺測(cè)距算法研究[M].北京:北京理工大學(xué),2008.

[3]劉昌,郭立,李敬文,劉俊,楊福榮,羅鋒.一種優(yōu)于SAD的匹配準(zhǔn)則及其快速算法[J].電路與系統(tǒng)學(xué)報(bào),2007,12(4):137-14.

[4]陳蛟.雙目立體匹配的算法研究及其多核并行化[M].南京:南京郵電大學(xué),2012.

篇2

一、計(jì)算機(jī)視覺檢測(cè)技術(shù)含義

計(jì)算機(jī)的視覺又叫做機(jī)器視覺,通過利用計(jì)算機(jī)或者是其他的一些機(jī)械設(shè)備來幫助人們視線事物到圖片的過程,從而進(jìn)行三維世界的感知活動(dòng)。計(jì)算機(jī)的快速發(fā)展,離不開神經(jīng)心理學(xué),心理學(xué)和認(rèn)知科學(xué)方面的研究和發(fā)展,計(jì)算機(jī)視覺檢測(cè)技術(shù)的發(fā)展方向就是對(duì)周圍的三維空間進(jìn)行感知和分析。一旦能夠擁有這種能力,計(jì)算機(jī)不僅能感知到周圍的總體環(huán)境,而且,還能夠具有對(duì)物體進(jìn)行描述,識(shí)別理解和儲(chǔ)存的能力。

二、計(jì)算機(jī)視覺檢測(cè)的基本原理

要實(shí)現(xiàn)人工智能對(duì)視覺的計(jì)算機(jī)處理是很重要的方面在計(jì)算機(jī)視覺應(yīng)用領(lǐng)域中如果要讓我們的計(jì)算機(jī)明白圖像的信息就必須經(jīng)過一系列的處理過程―――數(shù)字圖像處理.數(shù)字圖像的處理包括5個(gè)步驟:圖像預(yù)處理(去除噪聲)、分割處理分割后區(qū)域、測(cè)量、圖像判讀、圖像技術(shù).根據(jù)抽象程度和處理方法的不同圖像技術(shù)可分為三個(gè)層次:圖像處理、圖像分析和圖像理解.這三個(gè)層次的有機(jī)結(jié)合也稱為圖像工程.而計(jì)算機(jī)視覺(Computer vision)則是用計(jì)算機(jī)實(shí)現(xiàn)人的視覺功能對(duì)客觀世界三維場(chǎng)景的感知、識(shí)別和理解.視覺檢測(cè)按其所處理的數(shù)據(jù)類型又大致可分為二值圖像、灰度圖像、彩色圖像和深度圖像的視覺檢測(cè).另外還有X射線檢測(cè)、超聲波檢測(cè)和紅外線檢測(cè)。

作為新興檢測(cè)技術(shù)計(jì)算機(jī)視覺檢測(cè)充分利用了計(jì)算機(jī)視覺研究成果采用像傳感器來實(shí)現(xiàn)對(duì)被測(cè)物體的尺寸及空間位置的三維測(cè)量能較好地滿足現(xiàn)代制造業(yè)的發(fā)展需求.與一般意義上的圖像處理相比計(jì)算機(jī)視覺檢測(cè)更強(qiáng)調(diào)精度、速度和無損性以及工業(yè)現(xiàn)場(chǎng)環(huán)境下的可靠性.例如基于三角法的主動(dòng)視覺測(cè)量理具有抗干擾能力強(qiáng)、效率高、精度合適等優(yōu)點(diǎn)非常適合制造業(yè)生產(chǎn)現(xiàn)場(chǎng)的在線、非接觸產(chǎn)品檢測(cè)及生產(chǎn)監(jiān)控.對(duì)人類視覺感知能力的計(jì)算機(jī)模擬促進(jìn)了計(jì)算機(jī)視覺技術(shù)的產(chǎn)生和發(fā)展制造業(yè)上獲取這些信息的目的有:(1)計(jì)算出觀察點(diǎn)到目標(biāo)物體的距離;(2)得出觀察點(diǎn)到目標(biāo)物體的運(yùn)動(dòng)參數(shù);(3)甚至可以判斷出目標(biāo)物體的內(nèi)部特性;(4)推斷出目標(biāo)物體的表面特征有時(shí)要求形成立體視覺。

三、亞像素檢測(cè)技術(shù)

隨著工業(yè)檢測(cè)等應(yīng)用對(duì)精度要求的不斷提高,像素級(jí)精度已經(jīng)不能滿足實(shí)際檢測(cè)的要求,因此需要更高精度的邊緣提取算法,即亞像素算法。亞像素級(jí)精度的算法是在經(jīng)典算法的基礎(chǔ)上發(fā)展起來的,這些算法一般需要先用經(jīng)典算法找出邊緣像素的位置,然后使用周圍像素的灰度值作為判斷的補(bǔ)充信息,利用插值、擬合等方法,使邊緣定位于更加精確的位置?,F(xiàn)在的亞像素提取算法很多,如重心法、概率論法、解調(diào)測(cè)量法、多項(xiàng)式插值法、濾波重建法、矩法等。由于這些算法的精度、抗噪聲能力和運(yùn)算量各不相同,他們的應(yīng)用場(chǎng)合也是各不相同的。

邊緣是圖像的基本特征,所謂邊緣是指圖像中灰度存在階躍或尖頂狀變化的像素的集合,邊緣廣泛存在于物體與物體、物體與背景之間。圖像測(cè)量是通過處理被測(cè)物體圖像中的邊緣而獲得物體的幾何參數(shù)的過程,邊緣的定位精度直接影響最終的測(cè)量結(jié)果。因此,圖像邊緣提取方法是檢測(cè)的基礎(chǔ)和關(guān)鍵之一。在視覺測(cè)量領(lǐng)域中,早期使用的都是像素級(jí)邊緣檢測(cè)方法,例如常用的梯度算子、Lapacian算子和門式算子等。以上的邊緣檢測(cè)方法的精度可以達(dá)到像素級(jí)精度,即可以判斷出邊緣位于某個(gè)像素內(nèi),但不能確定邊緣在該像素內(nèi)的更精確的位置。如果一個(gè)像素對(duì)應(yīng)的實(shí)際長度較大,就會(huì)產(chǎn)生較大的誤差,傳統(tǒng)的整像素邊緣檢測(cè)方法就不再適用。

四、計(jì)算機(jī)視覺檢測(cè)技術(shù)在機(jī)加工零件檢測(cè)中的應(yīng)用要素與過程

(一)曲陣CCD相機(jī)

面陣CCD是本項(xiàng)目圖像采集系統(tǒng)中的主要設(shè)備之一,其主要功能是采集實(shí)驗(yàn)圖像。該CCD相機(jī)主要由CCD感光芯片、驅(qū)動(dòng)電路、信號(hào)處理路、電子接口電路和光學(xué)機(jī)械接口等構(gòu)成。

(二)工業(yè)定焦鏡頭

在圖像測(cè)量系統(tǒng)中,鏡頭的主要作用是將目標(biāo)聚焦在圖像傳感器的光敏面上。鏡頭的質(zhì)量直接影響到圖像測(cè)量系統(tǒng)的整體性能,合理選擇并安裝光學(xué)鏡頭是圖像測(cè)量系統(tǒng)設(shè)計(jì)的重要環(huán)節(jié)。

(三)數(shù)字圖像采集卡

隨著數(shù)字信號(hào)處理技術(shù)和嵌入式處理器技術(shù)在圖像采集卡中的應(yīng)用,使得圖像采集卡向高速度、多功能和模塊化方向不斷發(fā)展。這類圖像采集卡不僅具有高速圖像采集功能,同時(shí)還具備部分圖像處理功能,因此又可以稱之為圖像處理卡。

(四)標(biāo)定板

為提高測(cè)量精度,需要進(jìn)行攝像機(jī)標(biāo)定。標(biāo)定過程中,采用NANO公司的CBC75mm}.0型高精度標(biāo)定板,外形尺寸為75mmx75mmx3.0mm,圖形為棋盤格,其尺寸為2.0mmx2.0mm,精度為1級(jí),即圖形尺寸精度與圖形位置精度為。

(五)背光源

背光方式只顯示不透明物體的輪廓,所以這種方式用于被測(cè)物需要的信息可以從其輪廓得到的場(chǎng)合。因此,為精確提取軸的圖像中的邊緣特征,需采用背光源。為使圖像邊緣更銳利,光源顏色選擇紅色。

五、結(jié)語

隨著計(jì)算機(jī)技術(shù)和光電技術(shù)的發(fā)展,已經(jīng)出現(xiàn)了一種新的檢測(cè)技術(shù)―基于計(jì)算機(jī)視覺的檢測(cè)技術(shù),利用CCD攝像機(jī)作為圖像傳感器,綜合運(yùn)用圖像處理等技術(shù)進(jìn)行非接觸測(cè)量的方法,被廣泛地應(yīng)用于零件尺寸的精密測(cè)量中。本文以面陣CCD為傳感器,研究了零件在線測(cè)量的方法,實(shí)現(xiàn)了零件尺寸的圖像邊緣亞像素定位測(cè)量,對(duì)面陣CCD在高精度測(cè)量方面的應(yīng)用作了進(jìn)一步的探索和研究,為面陣CCD在復(fù)雜零件尺寸高精度測(cè)量的實(shí)現(xiàn)打下了基礎(chǔ)。

【參考文獻(xiàn)】

篇3

關(guān)鍵詞: 計(jì)算機(jī) 視覺注意機(jī)制 計(jì)算機(jī)視覺注意模型

1.引言

隨著信息技術(shù)的不斷發(fā)展,數(shù)據(jù)處理量劇增,以及用戶不斷擴(kuò)大的個(gè)性化需求,對(duì)計(jì)算機(jī)信息處理能力提出了越來越高的要求。如何在場(chǎng)景中快速準(zhǔn)確地找到與任務(wù)相關(guān)的局部信息,即物體選擇與識(shí)別,已經(jīng)成為計(jì)算機(jī)信息處理領(lǐng)域的一個(gè)研究熱點(diǎn)。隨著在心理學(xué)領(lǐng)域注意機(jī)制研究的不斷發(fā)展,將注意機(jī)制引入信息處理領(lǐng)域來解決物體識(shí)別問題,已經(jīng)不再是紙上談兵。

人類視覺系統(tǒng)進(jìn)行視覺信息處理時(shí),總是迅速選擇少數(shù)幾個(gè)顯著對(duì)象進(jìn)行優(yōu)先處理,忽略或舍棄其他的非顯著對(duì)象。進(jìn)入人類視野的海量信息,通過注意選擇機(jī)制進(jìn)行篩選,就能使我們有選擇地分配有限的視覺處理資源,保證視覺信息處理的效率,這就是視覺選擇注意機(jī)制的原理。依據(jù)人類視覺選擇注意的基本原理,開發(fā)能夠進(jìn)行智能圖像信息處理的計(jì)算機(jī)系統(tǒng),就成為一大任務(wù)。我們研究的主要方向是使計(jì)算機(jī)處理對(duì)象時(shí),能夠具備與人類相似的視覺選擇注意能力。

2.視覺注意機(jī)制

研究視覺注意機(jī)制是個(gè)多學(xué)科交叉的問題,目前多個(gè)領(lǐng)域的研究人員都取得了研究成果,并且對(duì)視覺注意的理論都形成了一些共識(shí)。目前普遍認(rèn)為注意既可以是按自底向上(自下而上)的圖像數(shù)據(jù)驅(qū)動(dòng)的,也可以是安自頂向下(自上而下)的任務(wù)驅(qū)動(dòng)的。其中,自下而上的研究主要來自圖像中物體數(shù)據(jù)本身的顯著性。例如,在視覺搜索實(shí)驗(yàn)中,顯著的物體會(huì)自動(dòng)跳出,如圖1中的圓點(diǎn)通過特征對(duì)比,以形狀跳出的形式獲得注意。自上而下的引導(dǎo)主要來自當(dāng)前的視覺任務(wù),以及場(chǎng)景的快速認(rèn)證結(jié)果,即我們可以“故意”去注意任何一個(gè)“不起眼”的物體,如我們可以在圖書館浩如煙海的藏書中,找到自己感興趣的那本書。

研究視覺注意機(jī)制的重要方法是研究眼睛在搜索目標(biāo)時(shí)的表現(xiàn)。顯著圖中的各目標(biāo)在競(jìng)爭(zhēng)中吸引注意點(diǎn),注意點(diǎn)在各個(gè)注意目標(biāo)間轉(zhuǎn)移。根據(jù)注意點(diǎn)轉(zhuǎn)移時(shí)是否伴隨眼動(dòng),視覺注意也分為隱式注意和顯式注意。隱式注意的中央凹不會(huì)隨著注意點(diǎn)的轉(zhuǎn)移而移動(dòng),而顯式注意的中央凹隨每次注意點(diǎn)的轉(zhuǎn)移而運(yùn)動(dòng)。

對(duì)視覺注意機(jī)制的研究為計(jì)算機(jī)視覺的發(fā)展提供了可能。計(jì)算機(jī)視覺借鑒人類視覺的注意機(jī)制,建立視覺注意的計(jì)算模型。通過“注意點(diǎn)”的選擇與轉(zhuǎn)移,實(shí)現(xiàn)對(duì)復(fù)雜場(chǎng)景中任務(wù)的搜索與定位,最終來實(shí)現(xiàn)實(shí)時(shí)信息的響應(yīng)處理。在計(jì)算機(jī)視覺的研究中,顯式注意應(yīng)用較多。

3.計(jì)算機(jī)視覺注意模型

從人的角度來看,人類視覺系統(tǒng)通過視覺,選擇注意在復(fù)雜的場(chǎng)景中迅速將注意力集中在少數(shù)幾個(gè)顯著的視覺對(duì)象上。從場(chǎng)景的角度來看,場(chǎng)景中的某些內(nèi)容比其他內(nèi)容更能引起觀察者的注意,我們稱之為視覺顯著性,兩者其實(shí)是從不同的角度對(duì)視覺選擇注意過程的描述。

我們把引起注意的場(chǎng)景內(nèi)容定義為注意焦點(diǎn)FOA(Focus of Attention)。Treisman的特征整合理論中將視覺信息處理過程劃分為前注意和注意兩個(gè)階段,各種視覺特征在前注意階段被以并行的方式提取出來,并在注意階段以串行方式整合為視覺客體,即注意的特征和客體是通過不同方式進(jìn)行的。在注意焦點(diǎn)的選擇和轉(zhuǎn)移上,Koch[2]進(jìn)行了深入的研究,他提出注意焦點(diǎn)FOA的變化具有四個(gè)特征,即單焦點(diǎn)性:同一時(shí)刻只能存在一個(gè)FOA;縮放性:FOA的空間范圍可以擴(kuò)大或者縮小;焦點(diǎn)轉(zhuǎn)移性:FOA能夠由一個(gè)位置向另一個(gè)位置轉(zhuǎn)移;鄰近優(yōu)先性:FOA轉(zhuǎn)移時(shí)傾向于選擇與當(dāng)前注視內(nèi)容接近的位置。同時(shí)注意焦點(diǎn)具有抑制返回的特點(diǎn),即FOA轉(zhuǎn)移時(shí)抑制返回最近被選擇過的注視區(qū)域。在此基礎(chǔ)上,視覺注意的研究人員提出了多種視覺注意模型。

4.視覺注意模型的研究現(xiàn)狀

人類的視覺注意過程包括兩個(gè)方面:一方面是對(duì)自下而上的初級(jí)視覺特征的加工,另一方面是由自上而下的任務(wù)的指導(dǎo),兩方面結(jié)合,共同完成了視覺的選擇性注意。與此對(duì)應(yīng),當(dāng)前的計(jì)算機(jī)視覺注意研究也分為這兩個(gè)方面。

4.1自下向上的數(shù)據(jù)驅(qū)動(dòng)注意模型研究及分析

在沒有先驗(yàn)任務(wù)指導(dǎo)的情況下,視覺注意的目標(biāo)選擇主要是由場(chǎng)景中自下而上的數(shù)據(jù)驅(qū)動(dòng)的,目標(biāo)是否被關(guān)注,由它的顯著性決定。現(xiàn)在,自下而上的注意研究主要基于Treisman的特征整合理論和Koch&Ullman的顯著性模型,Itti、satoh等人均在此基礎(chǔ)上提出了自己的研究模型,并做了一些模型的改進(jìn)研究。自下而上的研究方法通過對(duì)輸入圖像提取顏色、朝向、亮度等方面的基本視覺特征的研究,形成各個(gè)特征對(duì)應(yīng)的顯著圖。另外,一些研究者采用基于局部或全局對(duì)比度的方法,來得到圖中每個(gè)像素的顯著性,進(jìn)而得到顯著圖。

現(xiàn)有的自下而上的視覺注意計(jì)算模型中,Itti的顯著圖模型(簡稱Itti模型)最具代表性。該模型主要包含3個(gè)模塊:特征提取、顯著圖生成和注意焦點(diǎn)轉(zhuǎn)移。模型通過初級(jí)特征的提取,將多種特征、多種尺度的視覺空間通過中央―周邊算子得到的各個(gè)特征的顯著性圖合成一幅顯著圖。顯著圖中的各個(gè)目標(biāo)通過勝者為王的競(jìng)爭(zhēng)機(jī)制,選出唯一的注意目標(biāo),其中注意焦點(diǎn)的轉(zhuǎn)移用的是禁止返回機(jī)制。但該模型也有一些缺點(diǎn),如顯著區(qū)與目標(biāo)區(qū)域有偏差、計(jì)算量較大、運(yùn)行時(shí)間較長、動(dòng)態(tài)場(chǎng)景中實(shí)時(shí)處理不平等。

在動(dòng)態(tài)場(chǎng)景之中,由于Itti模型很難滿足實(shí)時(shí)性的要求,科研工作者們正在努力研究動(dòng)態(tài)場(chǎng)景的特性,并建立相應(yīng)的動(dòng)態(tài)模型。如Wolfe[1]指出,影響前注意的特征包括顏色、方向、曲率、尺寸、運(yùn)動(dòng)、深度特征、微調(diào)支距、光澤、形狀,等等,其中又以運(yùn)動(dòng)特征最為敏感。而You等采用了一種空間域特征和時(shí)間域特征相結(jié)合的視覺注意模型,該模型假設(shè)當(dāng)場(chǎng)景中存在全局運(yùn)動(dòng)時(shí),視覺注意對(duì)象將極少做運(yùn)動(dòng)。然而,許多真實(shí)的場(chǎng)景并不能滿足這個(gè)假設(shè),限制了模型的適用范圍。Hang等人提出了一種運(yùn)動(dòng)圖的計(jì)算方法,并把運(yùn)動(dòng)圖作為特征之一,與顏色、亮度、方向等特征結(jié)合。這些研究關(guān)注了運(yùn)動(dòng)特征對(duì)視覺的影響,但是均存在一定的局限性,對(duì)于復(fù)雜的運(yùn)動(dòng)場(chǎng)景的注意焦點(diǎn)計(jì)算很難取得良好的效果。

我國研究者也在Itti注意模型的基礎(chǔ)上研究了適合動(dòng)態(tài)場(chǎng)景中的注意模型,形成了一些理論成果。如曾志宏[2]等人提出注意焦點(diǎn)計(jì)算模型,鄭雅羽[3]等提出基于時(shí)空特征融合的視覺注意計(jì)算模型。這些模型都能較好地提取動(dòng)態(tài)場(chǎng)景下的視覺目標(biāo)。

4.2自上而下的任務(wù)驅(qū)動(dòng)的注意模型研究及分析

自上而下的注意即任務(wù)驅(qū)動(dòng)的注意,通過目標(biāo)和任務(wù)的抽象知識(shí),在一定程度上指導(dǎo)注意焦點(diǎn)的選擇。在自上而下注意模型的研究方面,Laar(1997)提出了一個(gè)用于隱式視覺注意的模型,該模型通過任務(wù)學(xué)習(xí),將注意集中于重要的特征。Rabak[4]提出了基于注意機(jī)制的視覺感知識(shí)別模型,該模型在定義目標(biāo)顯著性時(shí),通過語義分析對(duì)其他三個(gè)自下向上的視覺控制參數(shù)項(xiàng)進(jìn)行線性組合。Salah將可觀測(cè)馬爾科夫模型引入到模擬任務(wù)驅(qū)動(dòng)的注意模型研究中,并在數(shù)字識(shí)別和人臉識(shí)別的實(shí)驗(yàn)中取得了很好的效果。Itti提出以調(diào)節(jié)心理閾值函數(shù)的形式來控制視覺感知。

目前對(duì)自下而上的數(shù)據(jù)驅(qū)動(dòng)方面的研究較多,而對(duì)自下而上的任務(wù)驅(qū)動(dòng)方面研究較少。因?yàn)槿蝿?wù)驅(qū)動(dòng)的注意與人的主觀意識(shí)有關(guān),同時(shí)受到場(chǎng)景的全局特征影響。自上而下的注意涉及記憶、控制等多個(gè)模塊的分工協(xié)作,其過程非常復(fù)雜。

5.計(jì)算機(jī)視覺注意模型研究的趨勢(shì)

自底向上和自頂向下的加工是兩種方向不同的信息處理機(jī)制,兩者的結(jié)合形成了統(tǒng)一的視知覺系統(tǒng)。人類的視覺信息處理系統(tǒng)只有遵循這樣的方法,才能有效地實(shí)現(xiàn)視覺選擇注意的目的。

實(shí)踐證明,把自底向上和自頂向下的研究相分離的研究方法并不能很好地解決計(jì)算機(jī)的視覺注意過程。要想使計(jì)算機(jī)能夠準(zhǔn)確模擬人類的視覺注意過程,實(shí)現(xiàn)主動(dòng)的視覺選擇注意的目的,采用兩種研究方法相結(jié)合的形式勢(shì)在必行。自底向上的視覺注意計(jì)算往往離不開與自頂向下的有機(jī)結(jié)合,實(shí)現(xiàn)二者的優(yōu)勢(shì)互補(bǔ)是以后計(jì)算機(jī)視覺注意研究的一個(gè)趨勢(shì)。

參考文獻(xiàn):

[1]Wolf J M,Cave K R.Deploying visual attention:the guided search model.In:Troscianko T,Blake A,eds.AI and the Eye.Chichester,UK:Wiley press,1990.

[2]曾志宏,周昌樂,林坤輝,曲延云,陳嘉威.目標(biāo)跟蹤的視覺注意計(jì)算模型[J].計(jì)算機(jī)工程,2008,(23).

[3]鄭雅羽,田翔,陳耀武.基于時(shí)空特征融合的視覺注意模型[J].吉林大學(xué)學(xué)報(bào),2009,(11).

[4]Rabak I A,Gusakova V I,Golovan A V,et al.A model of attention-guided vision perception and recognition.Vision Research,1998,38.

篇4

關(guān)鍵詞:計(jì)算機(jī);交通監(jiān)管系統(tǒng);視覺

中圖分類號(hào):TP277

近年來,道路交通安全問題因公路交通事業(yè)的快速發(fā)展而受到越來多關(guān)注。據(jù)2002年世界銀行統(tǒng)計(jì),全球平均每年死于道路交通事故高達(dá)117萬人。而在中國,據(jù)2008年公安部交通管理局公布的數(shù)據(jù)顯示,全國道路交通事故多達(dá)265204起,死亡人數(shù)為73484人。

全國道路交通事故防御工作隨公路里程、機(jī)動(dòng)車保有量、道路交通流量、駕駛?cè)藬?shù)的增加成遞增趨勢(shì)。而通過必要的技術(shù)手段構(gòu)建交通安全保障機(jī)制,降低交通事故是重中之重。若要好的為基礎(chǔ)的交通違規(guī)行為檢測(cè)技術(shù)的不斷更新,市場(chǎng)上已出現(xiàn)了自動(dòng)檢測(cè)與記錄的商業(yè)化產(chǎn)品,能實(shí)時(shí)記錄出闖紅燈、違規(guī)超車、違規(guī)停車、超速、逆行等違規(guī)行為。然而,我國高速交通監(jiān)控體系仍比較落后,大多在交叉路口設(shè)置電子警察系統(tǒng)以此檢測(cè)車輛闖紅燈的違規(guī)行為。交通管理部門并不能對(duì)出現(xiàn)違規(guī)行為的車輛進(jìn)行及時(shí)的交通管制和處理,概括來說管理與檢測(cè)仍處于管理誤區(qū)與盲目狀態(tài)。針對(duì)該現(xiàn)象,文本研究了基于計(jì)算機(jī)的交通監(jiān)管系統(tǒng)設(shè)計(jì)與實(shí)現(xiàn)。

1 智能交通管理系統(tǒng)簡介

ITS系統(tǒng),該系統(tǒng)綜合先進(jìn)的現(xiàn)代計(jì)算機(jī)網(wǎng)絡(luò)技術(shù)、信息電子通訊技術(shù)、現(xiàn)代信息技術(shù)以及自動(dòng)控制技術(shù)等,并將其在整個(gè)交通運(yùn)輸管理體系進(jìn)行有效的運(yùn)用,為此建立起一種實(shí)時(shí)、有效、準(zhǔn)確、范圍廣的全方位發(fā)揮作用的交通運(yùn)輸控制體系和綜合管理系統(tǒng)。近幾年人流、車流隨著城市發(fā)展而猛增,交通職能部門對(duì)更加智能的交通管理系統(tǒng)的需求越來越急迫。所以,ITS成為21世紀(jì)地面交通管理、運(yùn)輸科技、運(yùn)營的主要研究方向,帶領(lǐng)著交通運(yùn)輸一場(chǎng)偉大的變革。北美、西歐、日本自上世紀(jì)80年代末就開始競(jìng)相發(fā)展智能運(yùn)輸系統(tǒng),并制定相應(yīng)的開發(fā)計(jì)劃加以實(shí)施,而發(fā)展中國家也開始對(duì)ITS系統(tǒng)的全面研究與開發(fā)。

2 認(rèn)識(shí)基于計(jì)算機(jī)視覺的智能交通監(jiān)控系統(tǒng)

2.1 計(jì)算機(jī)視覺技術(shù)

所謂計(jì)算機(jī)視覺,理解為使用可替代人眼的高清攝影機(jī)設(shè)備或其他現(xiàn)代高清電子影像攝錄裝備進(jìn)行觀察,實(shí)現(xiàn)對(duì)目標(biāo)的追蹤定位、圖像識(shí)別、模擬數(shù)據(jù)測(cè)量等,并對(duì)采集的視覺數(shù)據(jù)信息送達(dá)遠(yuǎn)端計(jì)算機(jī)服務(wù)器,通過計(jì)算機(jī)服務(wù)器的信號(hào)圖形圖像處理技術(shù)對(duì)視頻數(shù)據(jù)信息進(jìn)行進(jìn)一步加工,實(shí)現(xiàn)三維重現(xiàn)現(xiàn)實(shí)情景的計(jì)算機(jī)觀察呈現(xiàn)技術(shù)。

2.2 智能交通監(jiān)測(cè)系統(tǒng)

通過使用現(xiàn)有的、先進(jìn)的計(jì)算機(jī)智能化、視覺化、信息化科技對(duì)國內(nèi)各大路況交通運(yùn)輸實(shí)施監(jiān)測(cè),為工作于交通運(yùn)輸人員呈現(xiàn)數(shù)據(jù)信息的自動(dòng)化采集、分析、處理等的智能化服務(wù),且該交通管理系統(tǒng)存在一定自作能力和指揮能力,即為智能交通系統(tǒng)。隨著道路、車輛的飛速發(fā)展,人民生活水平及國民生產(chǎn)總值的不斷提高,智能交通系統(tǒng),在國內(nèi)外受到越來越多的青睞。近幾年,各道路關(guān)鍵路段、路口隨著道路監(jiān)控機(jī)制的普遍建立,也都基本完成了視頻監(jiān)控。

2.3 基于計(jì)算機(jī)視覺的智能交通監(jiān)控機(jī)制

根據(jù)前面2.1對(duì)計(jì)算機(jī)視覺技術(shù)和2.2對(duì)智能化交通監(jiān)控系統(tǒng)概念的解析與理解,可總結(jié)出以計(jì)算機(jī)視覺為基礎(chǔ)的智能化交通監(jiān)控機(jī)制,其是通過現(xiàn)代高端計(jì)算機(jī)對(duì)視覺信息收集、提取、處理、分析等技術(shù),實(shí)現(xiàn)對(duì)城市道路交通信息的實(shí)時(shí)監(jiān)控、視頻數(shù)據(jù)的收集、信息分析處理,并對(duì)城市交通狀況使用智能交通機(jī)制狀況,并通過視頻影像引導(dǎo)車輛行駛,以此降低或避免各種各樣交通事故發(fā)生的智能化交通監(jiān)控機(jī)制。

3 構(gòu)建以計(jì)算機(jī)視覺為基礎(chǔ)的智能交通監(jiān)控機(jī)制及配套措施

3.1 基于計(jì)算機(jī)視覺的智能交通監(jiān)控機(jī)制的構(gòu)建

監(jiān)控指揮系統(tǒng)、實(shí)時(shí)交通信息收集系統(tǒng)、高質(zhì)量信息傳輸系統(tǒng)是基于計(jì)算機(jī)視覺的智能交通監(jiān)控的三大系統(tǒng)。實(shí)時(shí)交通信息收集系統(tǒng)由多套信息收集裝置組成,通過這些信息采集裝置實(shí)時(shí)監(jiān)控不同位置交通現(xiàn)狀。實(shí)時(shí)交通信息收集系統(tǒng)不僅能進(jìn)行路段監(jiān)控與實(shí)時(shí)交通信息采集的工作,還能將收集數(shù)據(jù)信息,經(jīng)由高質(zhì)量信息傳輸系統(tǒng)實(shí)施輸送,或在服務(wù)器中存儲(chǔ)已處理的信息;一個(gè)中央數(shù)據(jù)庫與一個(gè)中央服務(wù)器是高質(zhì)量信息存儲(chǔ)傳輸系統(tǒng)核心部分,其中中央數(shù)據(jù)庫對(duì)獲取到的實(shí)時(shí)交通路況信息進(jìn)行存儲(chǔ)。而為了便于工作者能通過界面對(duì)中央數(shù)據(jù)庫實(shí)施提取、查詢、查看等操作,因此該界面就由中央服務(wù)器來提供,此外該服務(wù)器還能將已處理的實(shí)時(shí)路況數(shù)據(jù)通過高質(zhì)量的傳輸系統(tǒng)輸送到監(jiān)控指揮機(jī)制,達(dá)到對(duì)各路段的交通進(jìn)行管制、部署及指揮的目的。

3.2 專業(yè)技術(shù)人員的儲(chǔ)備

以計(jì)算機(jī)視覺技術(shù)為基礎(chǔ)的智能交通監(jiān)控機(jī)制是一個(gè)龐大的系統(tǒng),具有突出點(diǎn)的優(yōu)點(diǎn),該系統(tǒng)集自動(dòng)化、信息化、智能化為一體,只有專業(yè)的技術(shù)人才才能使該系統(tǒng)高效工作,因此開展培訓(xùn)儲(chǔ)備相關(guān)技術(shù)人員至關(guān)重要。實(shí)時(shí)交通信息借助于先進(jìn)的高清裝置的正常采集工作,所以儲(chǔ)備一批針對(duì)高清裝置安裝、檢測(cè)、調(diào)試及故障修復(fù)的技術(shù)人員極為重要?,F(xiàn)代基于計(jì)算機(jī)視覺的智能交通監(jiān)控機(jī)制雖然本身具有一定的圖形圖像分析及處理能力,然而有些工作人是永遠(yuǎn)被替代的,所以培養(yǎng)儲(chǔ)備一批專業(yè)的圖形圖像處理技術(shù)人員也是重要的。儲(chǔ)備服務(wù)器維護(hù)技術(shù)工,每天以計(jì)算機(jī)視覺技術(shù)為基礎(chǔ)的智能交通監(jiān)控機(jī)制都會(huì)獲取大量的監(jiān)控信息數(shù)據(jù),然而只有大型的服務(wù)器才能存儲(chǔ)這些數(shù)據(jù),可想而知一旦服務(wù)器癱瘓就會(huì)引發(fā)整個(gè)機(jī)制的崩潰,造成嚴(yán)重的后果,因此專業(yè)服務(wù)器維護(hù)工作者的儲(chǔ)備與培養(yǎng)也尤為重要。基于計(jì)算機(jī)視覺技術(shù)的智能交通監(jiān)控機(jī)制并不能取代交通指揮員,其僅是用來采集實(shí)時(shí)交通信息的系統(tǒng),僅為了協(xié)助交通指揮員監(jiān)管及疏導(dǎo)城市交通,因此要求儲(chǔ)備一批高素質(zhì)、高質(zhì)量的交通指揮員也極為必要。

3.3 交通知識(shí)的宣傳

大城市的交通問題,并不是依靠單純的開發(fā)先進(jìn)的計(jì)算機(jī)視覺智能交通監(jiān)控系統(tǒng)就能處理解決,也不是單單要求市政建設(shè)增加公交數(shù)量、增鋪幾條公路或增開通幾條地鐵就能解決的,以上這些僅是輔助方法。關(guān)鍵在于開展交通知識(shí)的宣傳與教育工作,強(qiáng)化駕駛員的素質(zhì),倡導(dǎo)不酒駕、不逆行、不超速、限號(hào)行駛等,自覺遵守道路交通規(guī)則,提倡公交地鐵出行,減少私家車輛行駛,齊心協(xié)力共同打造和諧的交通環(huán)境。

3.4 獲取政府支持

市政建設(shè)的主要問題之一即是交通問題,政府的支持是萬萬不可缺失的。由于構(gòu)建以計(jì)算機(jī)視覺技術(shù)為基礎(chǔ)的智能交通管制機(jī)制,涉及面廣,包括道路勘測(cè)、先進(jìn)裝置的引進(jìn)、專業(yè)技術(shù)人員的儲(chǔ)備、裝備組織安裝與調(diào)試、后期維護(hù)等等多方面,這些都需要投入大量的人力、財(cái)力、物力,而對(duì)于任何一個(gè)單位、部門或幾個(gè)市政部門來說都無法獨(dú)自承擔(dān),由此可知政府的大力支持是必不可少的,以政府的力量為媒介,將各部門進(jìn)行協(xié)調(diào)、協(xié)作,只有這樣才能構(gòu)建成較健全的交通監(jiān)控體系。

4 結(jié)束語

道路交通雜、亂是國內(nèi)城市交通最突出的特點(diǎn)之一,對(duì)于我國的交通事業(yè)來說進(jìn)行行人識(shí)別勢(shì)在必行。而我國對(duì)于行人識(shí)別的研究仍處于起步階段,還較落后。且基于計(jì)算機(jī)的交通監(jiān)管系統(tǒng)設(shè)計(jì)較為復(fù)雜,涵蓋點(diǎn)較多,因此本文僅對(duì)設(shè)計(jì)進(jìn)行簡要介紹,希望達(dá)到拋磚引玉的效果。

參考文獻(xiàn):

[1]康曉麗.無線網(wǎng)絡(luò)技術(shù)在交通管理中的應(yīng)用[J].科技情報(bào)開發(fā)與經(jīng)濟(jì),2011(21).

[2]鐘振,賴順橋,肖熠琳,張沛強(qiáng).RFID車輛智能管理系統(tǒng)[J].機(jī)電工程技術(shù),2011(02).

[3]文軍.視頻監(jiān)控系統(tǒng)軟件現(xiàn)狀與技術(shù)分析[J].金卡工程,2007(08).

[4]張玉風(fēng).簡述視頻監(jiān)控系統(tǒng)的發(fā)展歷程[J].鐵道通信信號(hào)工程技術(shù),2006(06).

[5]馬伏花,朱青.基于射頻識(shí)別技術(shù)的車輛自動(dòng)識(shí)別系統(tǒng)的實(shí)現(xiàn)[J].中國儀器儀表,2006(11).

篇5

【關(guān)鍵詞】株高 HALCON 雙目視覺 誤差修正

1 引言

計(jì)算機(jī)視覺技術(shù)是近幾年來發(fā)展較快的信息處理技術(shù),隨著圖像處理技術(shù)的專業(yè)化、計(jì)算機(jī)硬件成本的降低和速度的提高,計(jì)算機(jī)視覺的應(yīng)用已變得越來越廣泛,其中不乏在農(nóng)業(yè)中的應(yīng)用。

株高是植物生長指標(biāo)的重要參數(shù),是一個(gè)物種爭(zhēng)奪陽光的能力的主要決定因素[1]。對(duì)于作物來講,株高參數(shù)是作物產(chǎn)量預(yù)估不可或缺的參數(shù)。

然而對(duì)于具體的利用機(jī)器視覺方法直接測(cè)量株高的研究還是比較少的,本文就是利用HALCON軟件,采用雙目計(jì)算機(jī)視覺方法來實(shí)現(xiàn)株高的測(cè)量。

2 雙目視覺原理

雙目視覺的基本原理是從兩個(gè)視點(diǎn)觀察同一景物,獲取不同視角下的兩幅圖像,然后根據(jù)三角測(cè)量原理計(jì)算不同圖像對(duì)應(yīng)像素間的視差(disparity ),獲取景物的三維信息,從而實(shí)現(xiàn)場(chǎng)景三維重構(gòu)。

根據(jù)兩個(gè)攝像機(jī)位姿的不同,雙目視覺有多種模式,常用的有雙目橫向模式,雙目橫向會(huì)聚模式以及雙目縱向模式(也稱雙目軸向模式)。

為了增加測(cè)量精度,基線一般不能太小,但基線長度也不可太長,否則,由于物體各部分相互遮擋,兩個(gè)攝像機(jī)可能不能同時(shí)觀察到目標(biāo)點(diǎn)。

圖1是會(huì)聚雙目成像中的視差原理圖。圖中給出兩鏡頭連線所在平面(XZ平面),兩鏡頭中心間的距離(即基線)是B,兩光軸在XZ平面相交于(0,0,Z)點(diǎn),交角為(未知)?,F(xiàn)在來看如果已知像平面坐標(biāo)點(diǎn)(x1, y1)和(x2, y2 ),如何求取世界點(diǎn)W的坐標(biāo)(X,Y,Z)。

根據(jù)相似三角形的關(guān)系可以很明顯得出: (2.1)

(2.2)

(2.3)

其中r為從(任一)鏡頭中心到兩系統(tǒng)會(huì)聚點(diǎn)的距離(未知)。將式(2.2)和(2.3)聯(lián)立, 可得:

(2.4)

上式把物體和像平面的距離Z與視差d直接聯(lián)系起來,若想求解式(2.4),除視差d外,還需要知道x1和x2本身。另外,由圖1可以得到:

(2.5)

代入式(2.2)或(2.3)可得:

代入式(2.2)或(2.3)可得:

(2.6)

現(xiàn)實(shí)測(cè)量中,兩相機(jī)的光軸與世界坐標(biāo)Z軸的夾角不可能相等,不過即便如此,也只會(huì)引入幾個(gè)待確定的三角函數(shù),而這些三角函數(shù)在相機(jī)標(biāo)定時(shí)即可確定。

3 測(cè)量過程

實(shí)現(xiàn)該測(cè)量過程包括如下幾個(gè)功能模塊:圖像獲取、攝像機(jī)標(biāo)定、特征提取、立體匹配與三維信息恢復(fù)、后處理。本實(shí)驗(yàn)采用是分比率為960×720的雙攝像頭。被測(cè)區(qū)域大小約為56cm×42cm,所以采用的標(biāo)定板應(yīng)為被測(cè)區(qū)域1/3大小的HALCON專用的200mm標(biāo)定板。標(biāo)定數(shù)為24×2張圖片。利用HALCON自帶的標(biāo)定助手,可以輕松實(shí)現(xiàn)單目標(biāo)定。

雙目標(biāo)定時(shí),需要有15張以上左右相機(jī)相同時(shí)刻拍攝的標(biāo)定板的圖片。再利用for循環(huán),find_caltab函數(shù),find_marks_and_pose函數(shù)以及binocular_calibration函數(shù),可以實(shí)現(xiàn)雙目標(biāo)定。將標(biāo)定過程中,獲得的攝像機(jī)的內(nèi)參以及兩個(gè)攝像機(jī)相對(duì)位置關(guān)系作參數(shù)傳遞給函數(shù)gen_binocular_rectification_map,可以很好地實(shí)現(xiàn)雙目視覺校正的目的,得到兩幅校正后的圖像,還能得到校正后虛擬立體視覺系統(tǒng)中兩個(gè)攝像機(jī)的內(nèi)參和外參。

不同種類的植物其株高定義不同,測(cè)量方式也不盡相同。本文研究的株高只針對(duì)直立型的,是指從植株根部露出土壤部分到植株最高處的株高。

先利用gen_binocular_rectification_map函數(shù)為map_image函數(shù)提供控制參數(shù),再通過map_image函數(shù)對(duì)采集到的圖像做校正處理,利用threshold函數(shù),fill_up_shape函數(shù)以及select等函數(shù)找出校正后圖像中植株的最低和最高點(diǎn),利用intersect_lines_of_sight函數(shù),可獲得植株最低點(diǎn)和最高點(diǎn)的真實(shí)三維坐標(biāo),最后通過幾何運(yùn)算得到雙目測(cè)量結(jié)果。

我們?cè)趫D像采集時(shí)就應(yīng)該考慮到,攝像頭應(yīng)該稍微帶一點(diǎn)俯拍的角度,保證左右兩幅圖像上最高處均為現(xiàn)實(shí)坐標(biāo)中的最高處。切忌俯拍角度不可太大,否則由于拍攝角度而引起的像差會(huì)很大,對(duì)結(jié)果將會(huì)有很大的影響。

經(jīng)過以上幾步驟得到的三維坐標(biāo),常因各種原因而存在一定的誤差,需要進(jìn)行誤差校正。我們對(duì)已知高度的對(duì)象進(jìn)行了測(cè)量,得出結(jié)果如表1:

通過上述數(shù)據(jù)得出的修正關(guān)系如下:

y=-0.0002x2+1.0699x (3.1)

其相關(guān)系數(shù)R2=0.9993

4 實(shí)驗(yàn)結(jié)果

我們對(duì)三種植物進(jìn)行了測(cè)量得出的結(jié)果如下:

從測(cè)量結(jié)果中可以看出,修正后相對(duì)誤差控制在2%之內(nèi),可以接受。誤差引入的原因可能如下:

1、標(biāo)定板的選擇決定了標(biāo)定精度。一定要選用高精度的標(biāo)定板,且標(biāo)定板的大小應(yīng)約為測(cè)量范圍1/3大小。

2、相機(jī)是圖像獲取的根本,高質(zhì)量的圖像離不開高分辨率相機(jī),但是高分比率,高解析度的相機(jī)又會(huì)帶來成本上的提升。本文中,對(duì)于390.0mm左右的對(duì)象,1個(gè)像素的誤差可以帶入約0.4mm的實(shí)際誤差。

3、本文所采用的算法只能針對(duì)比較理想,比較直的植株,算法的不斷優(yōu)化,才能不斷減少誤差,提高精度。

5 結(jié)語

本文介紹了一種基于HALCON的,利用雙目視覺測(cè)量株高的方法。對(duì)于直立型植物,通過對(duì)立體匹配與三維信息恢復(fù)結(jié)果的誤差修正,其株高測(cè)量相對(duì)誤差不超過2%,方法具有一定的可借鑒性。

參考文獻(xiàn)

[1]章毓晉.計(jì)算機(jī)視覺教程 [M].北京: 人民郵電出版社,2011.

作者簡介

郝慧鵬(1988-),男,內(nèi)蒙古烏蘭察布人,碩士研究生,主要研究方向?yàn)橛?jì)算機(jī)視覺技術(shù)在農(nóng)作物檢測(cè)上的應(yīng)用。

指導(dǎo)老師

田躍(1956-),男,北京人,北京科技大學(xué)數(shù)理學(xué)院物理系教授,北京市弱磁檢測(cè)及應(yīng)用工程技術(shù)研究中心副主任。

作者單位

篇6

關(guān)鍵詞:目標(biāo)跟蹤技術(shù);意義;問題;解決方法

中圖分類號(hào):TP18 文獻(xiàn)標(biāo)識(shí)碼:A 文章編號(hào):1009-3044(2015)02-0171-01

1.目標(biāo)跟蹤研究技術(shù)分類

1.1圖像序列中目標(biāo)跟蹤技術(shù)

在圖像中,根據(jù)點(diǎn)與點(diǎn)之間的關(guān)系,可以通過相鄰兩幅圖像的點(diǎn)集中用以實(shí)現(xiàn)跟蹤目標(biāo)。同樣的,根據(jù)線在目標(biāo)跟蹤中的使用,可以更加清晰的分解出圖像的輪廓信息用以描述目標(biāo)圖像。更進(jìn)一步,可以將面應(yīng)用于目標(biāo)跟蹤,了解整個(gè)區(qū)域的外觀信息,在經(jīng)過后期的優(yōu)化和分類處理實(shí)現(xiàn)目標(biāo)跟蹤。

在圖像識(shí)別中,可以根據(jù)圖像本身的空間位置相互依賴的關(guān)系以及圖像塊與圖像塊之間的關(guān)系在建立模型和構(gòu)造置信度圖的時(shí)候,融合空間的上下文信息。使得建立的目標(biāo)跟蹤的模型更加具有科學(xué)的根據(jù),同時(shí)置信度圖更加精確,更利于研究目標(biāo)跟蹤。

1.2視頻序列中目標(biāo)跟蹤技術(shù)

目標(biāo)跟蹤可以通過對(duì)視頻序列中正在運(yùn)動(dòng)的目標(biāo)進(jìn)行分析檢測(cè)、提取數(shù)據(jù)、更進(jìn)一步的進(jìn)行識(shí)別和跟蹤。這樣的過程中,可以獲得目標(biāo)運(yùn)動(dòng)的參數(shù),例如移動(dòng)速度、加速度、運(yùn)動(dòng)的軌跡等,再將所得的結(jié)果進(jìn)行下一步的分析處理,以此實(shí)現(xiàn)對(duì)目標(biāo)的理解以完成任務(wù)跟蹤的目的。

對(duì)于目標(biāo)跟蹤和測(cè)量可以分為三個(gè)階段。首先,有目標(biāo)的檢測(cè)和特征提取,在這兩個(gè)階段中,需要一定的理論知識(shí)和靈活的應(yīng)變能力,可以根據(jù)場(chǎng)合的不同進(jìn)行不同的設(shè)計(jì)。第三個(gè)階段就是目標(biāo)的跟蹤,簡單來說可以理解為目標(biāo)初始狀態(tài)和特征提取從而得到目標(biāo)視覺特征,以此為基礎(chǔ),進(jìn)行時(shí)間和空間相結(jié)合對(duì)目標(biāo)的狀態(tài)進(jìn)行估計(jì)。因此,一個(gè)良好的跟蹤系統(tǒng)必須能滿足顧客準(zhǔn)確、實(shí)時(shí)、可靠的要求?!皽?zhǔn)確”顧名思義,就是要提高目標(biāo)跟蹤的精準(zhǔn)度,最低的要求即要可以跟蹤出目標(biāo)的大致位置,高的要求下必須給出目標(biāo)的準(zhǔn)確方位?!皩?shí)時(shí)”是指的跟蹤目標(biāo)信息的更新速度,數(shù)據(jù)的輸出速度必須要在物體的實(shí)際運(yùn)動(dòng)速度內(nèi),滿足控制系統(tǒng)的動(dòng)態(tài)指標(biāo)要求?!翱煽俊眲t是要求目標(biāo)跟蹤結(jié)果的真實(shí)可靠性,過程必須保證穩(wěn)定,即使是在跟蹤失敗的情況下,也要求具有良好的恢復(fù)能力。只有滿足以上三點(diǎn),才能達(dá)到很好的綜合性能。

2 目標(biāo)跟蹤研究技術(shù)意義

2.1 在民用領(lǐng)域的意義

在民用領(lǐng)域中,目標(biāo)跟蹤技術(shù)研究的新興方向是擁有核心技術(shù)的智能化視頻監(jiān)控。智能化視頻監(jiān)控是高層計(jì)算機(jī)視覺技術(shù),簡單描述則是攝像機(jī)進(jìn)行前期采樣,通過視頻序列圖,對(duì)其中的信息進(jìn)行更進(jìn)一步的分析和理解,從而實(shí)現(xiàn)視頻監(jiān)控系統(tǒng)的智能化。例如有的視頻監(jiān)控中可以智能識(shí)別場(chǎng)景內(nèi)人的行為和語言對(duì)話。從而可以甄別出危險(xiǎn)的人員自動(dòng)報(bào)警。在交通管理中,也可以通過智能檢測(cè)實(shí)現(xiàn)對(duì)車輛的管理,實(shí)時(shí)監(jiān)控道路車流量和對(duì)異常的車輛進(jìn)行調(diào)查,可以很大程度上減少交通事故的發(fā)生,和更快速的進(jìn)行事后處理。

2.2在軍事領(lǐng)域的意義

在軍事領(lǐng)域中,目標(biāo)跟蹤技術(shù)對(duì)于增強(qiáng)國防有很大的意義。視頻監(jiān)控可以及時(shí)掌握戰(zhàn)爭(zhēng)中的環(huán)境和更快速地對(duì)敵方的目標(biāo)進(jìn)行搜索和跟蹤。對(duì)于環(huán)境的掌握和檢測(cè)有利于尋找和提取目標(biāo)和場(chǎng)景、還有攝像機(jī)的機(jī)位等信息來進(jìn)行實(shí)時(shí)的反饋控制,可以了解敵方動(dòng)態(tài)在戰(zhàn)爭(zhēng)中處于主導(dǎo)地位。還可以將目標(biāo)跟蹤技術(shù)和機(jī)器人技術(shù)結(jié)合,研究機(jī)器人視覺導(dǎo)航系統(tǒng),安裝在機(jī)器人體內(nèi)的攝像機(jī)可以實(shí)現(xiàn)實(shí)時(shí)環(huán)境檢測(cè),獲取更為詳細(xì)的環(huán)境信息。同時(shí),目標(biāo)跟蹤中的智能視頻監(jiān)控也有利于發(fā)現(xiàn)邊防的不利狀況和嫌疑人員,更大程度上保護(hù)我國軍事機(jī)密。

3 目標(biāo)跟蹤研究技術(shù)應(yīng)用

3.1在道路車輛監(jiān)控上的應(yīng)用

在現(xiàn)實(shí)生活中,可以利用目標(biāo)跟蹤技術(shù)實(shí)時(shí)監(jiān)控道路上的車輛,在移動(dòng)過程中,車輛在視窗中的大小和形狀會(huì)發(fā)生特定的變化。例如我們可以選取一組在實(shí)際環(huán)境中拍攝的照片進(jìn)行研究,車輛由近及遠(yuǎn)的移動(dòng)過程中,車輛目標(biāo)區(qū)域的形狀會(huì)慢慢變小,目標(biāo)形狀變化不大會(huì)取得比較成功的跟蹤效果。但是存在缺陷的是,目標(biāo)變小時(shí),跟蹤的準(zhǔn)確性也隨之變小,有時(shí)所反應(yīng)的結(jié)果已經(jīng)偏離了目標(biāo)所在的實(shí)際位置。導(dǎo)致目標(biāo)跟蹤出現(xiàn)問題,甚至錯(cuò)誤的跟蹤了其他目標(biāo)。因此,在道路中車輛的監(jiān)控方面,還要進(jìn)一步改正,加強(qiáng)精準(zhǔn)度,才能讓科技更好為交通事業(yè)做出貢獻(xiàn)。

3.2在礦井安全監(jiān)控中的應(yīng)用

在生活中,井下工作是安全風(fēng)險(xiǎn)最大的工作之一??梢岳媚繕?biāo)跟蹤技術(shù),對(duì)井下危險(xiǎn)區(qū)域運(yùn)動(dòng)目標(biāo)進(jìn)行檢測(cè)和跟蹤,在這樣的檢測(cè)下,可以提前得到風(fēng)險(xiǎn)預(yù)測(cè),提前預(yù)警可以有效防止危險(xiǎn)事故的發(fā)生。利用數(shù)學(xué)領(lǐng)域的利用背景建立模型和利用背景差法在線有效的調(diào)節(jié)速率,這種方法可以應(yīng)對(duì)光線的變化和突變的環(huán)境下對(duì)移動(dòng)目標(biāo)的監(jiān)控,利用目標(biāo)跟蹤技術(shù)在發(fā)生突發(fā)狀況時(shí)可以準(zhǔn)確的定位和實(shí)時(shí)的跟蹤目標(biāo)??梢蕴岣咄话l(fā)事故的存活率,給礦工們的生命多一層保障。

3.3在社會(huì)生活中的作用

在社會(huì)工作中,未來發(fā)展的趨勢(shì)電子化越來越普及于生活的任何角落,與現(xiàn)有階段的鍵盤和鼠標(biāo)表達(dá)思想不同,未來的人和計(jì)算機(jī)的交互影響應(yīng)該會(huì)更加方便,科學(xué)家希望計(jì)算機(jī)能夠像一個(gè)人一樣善解人意,這就需要計(jì)算機(jī)能夠讀懂人類的語言、表情、手勢(shì)、動(dòng)作等。利用目標(biāo)跟蹤技術(shù),實(shí)現(xiàn)視頻的智能化,計(jì)算機(jī)可以通過采集人們的動(dòng)作圖像等進(jìn)行分析,更理解場(chǎng)景中的人和事。例如在醫(yī)療領(lǐng)域,可以利用這個(gè)智能的電腦來監(jiān)護(hù)生病的兒童和老人,他可以很快的明白病人的需求,所以可以更好的照顧從而促進(jìn)醫(yī)療事業(yè)的革新;在教育領(lǐng)域中,利用視頻智能的分析技術(shù),比普通老師更快的了解學(xué)生對(duì)于知識(shí)的掌握了解情況,判斷學(xué)生的學(xué)習(xí)興趣,可以因材施教,更好更快的教好學(xué)生;在游戲時(shí),智能的計(jì)算機(jī)能更快地了解游戲者的意圖和興趣,分析出更適合游戲者的游戲,讓游戲者開心的融入氛圍體驗(yàn)娛樂生活的樂趣。

參考文獻(xiàn):

[1] 丁業(yè)兵,王年,唐俊,等.基于顏色和邊緣特征CAM Shift目標(biāo)跟蹤算法[J].華東理工大學(xué)學(xué)報(bào):自然科學(xué)版,2012,38(l):69-74.

篇7

計(jì)算機(jī)特效與電影的結(jié)合:形式與內(nèi)容的統(tǒng)一

關(guān)于影視中形式與內(nèi)容的關(guān)系已不是一個(gè)新的話題,形式是內(nèi)容,內(nèi)容也是形式,任何元素都不能單獨(dú)完成一個(gè)作品,內(nèi)容和形式只有有機(jī)地結(jié)合在一起。影片才具有意義。同樣。從形式和內(nèi)容的關(guān)系角度來講,計(jì)算機(jī)特效是形式,也是內(nèi)容。在內(nèi)容不足以支撐起計(jì)算機(jī)特效的表現(xiàn)力時(shí)。影片會(huì)因?yàn)樾问酱笥趦?nèi)容而顯得空洞無力。如全CGI制作的《最終幻想》。畫面唯美,但故事內(nèi)容晦澀難懂,無法給人留下印象,這讓人不禁思考其失敗的原因。比較《最終幻想》和《駭客帝國》,這兩部影片同屬于科幻片類型,講述的都是未來世界毀滅和拯救的故事?!恶斂偷蹏分薪忉屛磥硎澜鐨缭虻牧⒆泓c(diǎn)是計(jì)算機(jī)科技和網(wǎng)絡(luò)的過分發(fā)展給人類帶來的危機(jī),在《駭客帝國》中敘事的形式是虛擬和現(xiàn)實(shí)的結(jié)合。計(jì)算機(jī)特效鏡頭的表達(dá)也同樣具有統(tǒng)一的主題思想。描述了關(guān)于人類本體一聯(lián)想一時(shí)空關(guān)系。具有哲學(xué)的意味,其特效形式極具暗示感,它用視覺啟發(fā)觀眾聯(lián)想,最終用視覺形式指引觀眾對(duì)影片內(nèi)容進(jìn)行思索。其內(nèi)容和形式的選擇相互支撐。因此,計(jì)算機(jī)技術(shù)在提升電影表現(xiàn)形式的同時(shí),也給電影藝術(shù)的內(nèi)容提升提出了更高的要求,即使是表達(dá)幻想也應(yīng)來源于真實(shí)可信的現(xiàn)實(shí)生活基礎(chǔ),而形式的設(shè)計(jì)和選擇要能切合所表達(dá)的內(nèi)容。

當(dāng)我們?cè)谟^看《泰坦尼克號(hào)》的時(shí)候,會(huì)被ROSE和JACK的愛情深深打動(dòng),被真實(shí)的海難震驚。而不會(huì)想到這些愛情和災(zāi)難都是用計(jì)算機(jī)特效來完成的。所以,特效鏡頭的形式選擇和表現(xiàn)的目的,是要恰如其分地表現(xiàn)影片的內(nèi)容。以2007年的高科技特效影片《變形金剛》為例,華麗炫目的3D特效給人的視覺感并不僅僅是為了炫耀特效而做特效,透析電影中計(jì)算機(jī)虛擬攝像機(jī)攝影和剪輯。如MTV般風(fēng)格。運(yùn)用得行云流水、全方位、角度多變;場(chǎng)面調(diào)度,絢爛的爆炸場(chǎng)面和驚心動(dòng)魄的機(jī)器人大戰(zhàn),真實(shí)特效場(chǎng)面和CGI的機(jī)器人域面的完美結(jié)合,讓CGI角色的動(dòng)作場(chǎng)面更炫更逼真。在視覺之外,再配上人類情感和友誼、愛情等感人要素的線索并穿插其中,讓冰冷的高科技機(jī)器人故事劇情變得生動(dòng)豐富。這些相互聯(lián)系的元素組合在一起,幫助影片在各部分之間建立關(guān)系。變形金剛科技感極強(qiáng)的造型,并沒有給我們帶來距離感。仿佛它們就是我們身邊的朋友。不論是精彩寫實(shí)的金剛變形還是行云流水的虛擬攝影機(jī)運(yùn)動(dòng),給人以輕松富有人情味的生活感,視覺設(shè)計(jì)元素是為故事和情節(jié)服務(wù)的。所以影片的最終視覺效果風(fēng)格和故事內(nèi)容建立有機(jī)聯(lián)系,達(dá)到形式節(jié)奏情感的統(tǒng)一。

計(jì)算機(jī)視覺特效鏡頭:由“寫實(shí)”到“表現(xiàn)”的變遷

在計(jì)算機(jī)特效視覺領(lǐng)域,探索CGI視覺設(shè)計(jì)的風(fēng)格,這是近些年來國際上在計(jì)算機(jī)影像技術(shù)和豈術(shù)方面的趨勢(shì)。CG的繪制技術(shù)可以分為兩類:真實(shí)感繪制和非真實(shí)感繪制。真實(shí)感繪制技術(shù)已經(jīng)有了很長的歷史,而非真實(shí)感繪制技術(shù)則是國際上近幾年在計(jì)算機(jī)視覺領(lǐng)域新興的一個(gè)研究課題。非真實(shí)感繪制以真實(shí)感繪制為基礎(chǔ),它可以使繪制的圖像具有卡通效果以及某種藝術(shù)性效果。由真實(shí)到非真實(shí)感的變遷。也是計(jì)算機(jī)視覺藝術(shù)從寫實(shí)進(jìn)化到抽象的技術(shù)性基礎(chǔ)。隨著計(jì)算機(jī)硬件和算法的不斷發(fā)展,到上世紀(jì)90年代中期,人們已能真實(shí)地模擬各種自然界的客觀現(xiàn)象和想象中的特殊效果了。當(dāng)出現(xiàn)了《泰坦尼克號(hào)》、《星球大戰(zhàn)》、《駭客帝國》這樣的影片。真實(shí)感圖像與電影膠片攝制出的圖像得到了完美的結(jié)合。從這個(gè)意義上講。真實(shí)感圖像達(dá)到了它所追求的“像照片一樣真實(shí)”的效果,技術(shù)已經(jīng)不是太大的問題。

技術(shù)的實(shí)現(xiàn)水平使得計(jì)算機(jī)影像領(lǐng)域開始對(duì)藝術(shù)風(fēng)格的全面探索?;仡欉@幾年在國際上獲獎(jiǎng)的優(yōu)秀CG作品,最引人注目的特征是:它們都具有強(qiáng)烈而獨(dú)特的視覺藝術(shù)風(fēng)格。從Siggraph2006的最佳動(dòng)畫短片“One rat short”,到米勒同名漫畫的“罪惡之城”(SIN CITY),以及從一亮相就備受關(guān)注的黑白動(dòng)畫“復(fù)活”,這些短片的視覺影像風(fēng)格的探索給人啟迪。獲得2006年法國國際動(dòng)畫節(jié)水晶獎(jiǎng)的“復(fù)活”,整部影片均采用黑白創(chuàng)作,渲染也是只用黑白兩個(gè)值來表現(xiàn)畫面。展現(xiàn)一種具有視覺沖擊力的版畫風(fēng)格特征。還有2007年Siggraph的最佳作品“方舟”。從角色、場(chǎng)景、道具造型到色彩都極具特色。充滿夢(mèng)境般的油畫視覺感。“方舟”里的人物造型是極為與眾不同的,色彩是印象的、表現(xiàn)主義的,通過視覺把觀眾對(duì)影片的體驗(yàn)和思考引向遙遠(yuǎn)的圣經(jīng)故事,同時(shí)又是指向未來的思索。

電影風(fēng)格化的表現(xiàn):計(jì)算機(jī)特效的超現(xiàn)實(shí)化

從制作的角度分析,電影《斯巴達(dá)300》可以說是一部用計(jì)算機(jī)做出來的影片。計(jì)算機(jī)特效的大量介入,給視覺特效提供了一場(chǎng)全面的風(fēng)格化探索的嘗試,影片共有1500個(gè)鏡頭。幾乎所有的鏡頭都運(yùn)用了電腦特效。影片把電影的“拍攝”和“繪畫性”醒目地結(jié)合在一起,它利用了計(jì)算機(jī)特效后期制作中層的概念。并把這種層的技術(shù),從藝術(shù)的角度發(fā)揮到極致,使影片整體的藝術(shù)效果像一幅流動(dòng)的油畫。視覺特效的風(fēng)格應(yīng)該和影片的整體氛圍一致,特效鏡頭要為鏡頭后表達(dá)的思想服務(wù),特效的表達(dá)要和情節(jié)、影片故事的設(shè)計(jì)整體構(gòu)架一致,只有這樣,特效和影片的內(nèi)涵才能形神兼?zhèn)?。以《斯巴達(dá)300》為例,影片既保持了米勒漫畫的結(jié)構(gòu)細(xì)節(jié)、濃郁厚重的色調(diào)和繪畫藝術(shù)的眾多特點(diǎn)。又借助計(jì)算機(jī)特效創(chuàng)造出與眾不同的繪畫效果。

“超現(xiàn)實(shí)主義電影所追求的最高美學(xué)境界,就是把藝術(shù)創(chuàng)造視為一種偶然的啟示或悲劇式的預(yù)言?!痹谟捌?,特效部分場(chǎng)景設(shè)計(jì)的造型簡潔、夸張。給原本平凡的現(xiàn)實(shí)事物賦予了新的面貌?!端拱瓦_(dá)300》影片中所有的場(chǎng)景都在計(jì)算機(jī)特效中完成,大量的特效工作分散到全世界的十個(gè)工作室。為了保證影片的視覺藝術(shù)效果的統(tǒng)一,影片特效采用了超現(xiàn)實(shí)風(fēng)格化手法來處理場(chǎng)景設(shè)計(jì)。真實(shí)感是電影特效追求的重要原則,《斯巴達(dá)300》卻給予畫面一種變形的突破??桃庾非笠环N超現(xiàn)實(shí)的奇幻風(fēng)格。所有的畫面都經(jīng)過Photoshop的濾鏡處理,用一個(gè)非常細(xì)節(jié)化的處理來體現(xiàn)這一藝術(shù)化的變形,例如,影片中的斯巴達(dá)戰(zhàn)士眼睛里的光芒都經(jīng)過了繪畫式的處理,這一點(diǎn),是視覺特效設(shè)計(jì)的創(chuàng)新,在以往的電影中未曾這樣統(tǒng)一地處理過。所以。這樣的視覺影像使觀者產(chǎn)生了一種夢(mèng)幻般的超現(xiàn)實(shí)感,正是這種風(fēng)格化的處理方式使影片整體的形式達(dá)到統(tǒng)一。

實(shí)拍鏡頭趨向素材化:電影走向“合成電影”

篇8

關(guān)鍵詞:太陽跟蹤; ARM微控制器; 計(jì)算機(jī)視覺; CMOS圖像傳感器

中圖分類號(hào):TN91934; TP36文獻(xiàn)標(biāo)識(shí)碼:A文章編號(hào):1004373X(2012)04007104

Sun-tracking system based on ARM embedded image processing platform

CHEN Lijuan, ZHOU Xin

(Nanjing University of Aeronautics and Astronautics, Nanjing 210016, China)

Abstract: Based on computer vision principle, the realtime tracking of sun was realized by taking ARM microcontroller as the core to construct the embedded image processing platform. The system collects images of sun through CMOS imaging sensor, and computes the sun angles relative to the tracking platform by a microcontroller. With the computed sun angles information, the system controls the turntable through a serial port to make the solar panel perpendicular to the sun radiations. Meanwhile, another tracking mode based on sun trajectory is integrated in the tracking strategy to insure the system reliability. The teat result indicates that the system can reduce the system energy consumption and effectively track sun.

Keywords: suntracking; ARM microcontroller; computer vision; CMOS image sensor

收稿日期:20110813

基金項(xiàng)目:國家自然科學(xué)基金資助項(xiàng)目(61102138);南京航空航天大學(xué)基本科研業(yè)務(wù)費(fèi)專項(xiàng)科研資助項(xiàng)目(V1090031)0引言

隨著社會(huì)的發(fā)展和進(jìn)步,環(huán)保節(jié)能已經(jīng)成為人類可持續(xù)發(fā)展的必要條件。目前,再生能源的開發(fā)和利用越來越受到人們的關(guān)注。太陽能由于其普遍、無害、無限、長久等特點(diǎn),成為最綠色、最理想、最可靠的替代能源[1]。但太陽能同時(shí)存在分散,不穩(wěn)定,效率低等特點(diǎn),太陽能光伏系統(tǒng)為解決這一問題提供了條件[23]。

就目前的太陽能光伏系統(tǒng)而言,如何最大限度提高太陽能的轉(zhuǎn)換率,仍是國內(nèi)外的研究熱點(diǎn)。有研究表明,和始終朝南的固定表面相比,與太陽輻射方向始終保持垂直的表面對(duì)太陽能的利用率提高約33%[4]。太陽跟蹤裝置可以保證太陽輻射方向始終垂直于太陽能電池板平面,使接收到的太陽輻射大大增加,提高了太陽能的接受率與利用率,因而得到廣泛的應(yīng)用。

太陽跟蹤裝置的分類方法有很多,按照跟蹤方法,主要可分為視日運(yùn)動(dòng)跟蹤和光電跟蹤,視日運(yùn)動(dòng)跟蹤又可分為單軸跟蹤和雙軸跟蹤[5]。光電跟蹤裝置有較高靈敏度,結(jié)構(gòu)簡單,能通過反饋消除累積誤差,具有較大優(yōu)勢(shì),但受環(huán)境影響很大。其關(guān)鍵部件是光電傳感器,常用的是光敏電阻。由于光敏電阻安裝位置不連續(xù)和環(huán)境光散射等因素的影響,系統(tǒng)不能連續(xù)跟蹤太陽,精度有限[6]。視日運(yùn)動(dòng)跟蹤能夠全天候?qū)崟r(shí)跟蹤,但是存在累積誤差。其中,單軸跟蹤裝置結(jié)構(gòu)簡單,但跟蹤誤差大;雙軸跟蹤裝置算法復(fù)雜,跟蹤難度較大,但跟蹤精度較高[78]。

本文用基于32位ARM嵌入式微控制器S3C2440來構(gòu)建太陽跟蹤系統(tǒng),采用CMOS圖像傳感器來感知太陽方位,并通過微控制器計(jì)算獲取太陽跟蹤誤差,實(shí)現(xiàn)對(duì)太陽的高精度跟蹤。加入視日運(yùn)動(dòng)規(guī)律,在跟蹤目標(biāo)丟失時(shí),對(duì)系統(tǒng)進(jìn)行重新定位。同時(shí),該系統(tǒng)的結(jié)構(gòu)簡單輕便,功耗低,環(huán)境適應(yīng)能力強(qiáng),能應(yīng)用于各種太陽能設(shè)備。

1硬件設(shè)計(jì)

1.1系統(tǒng)硬件結(jié)構(gòu)

系統(tǒng)以ARM微控制器作為主控制器,采用CMOS圖像傳感器采集圖像,并利用雙軸轉(zhuǎn)臺(tái)來支撐太陽能電池板。其中雙軸轉(zhuǎn)臺(tái)集成了電機(jī)驅(qū)動(dòng)與控制部分,通過串口與主控制器進(jìn)行通信。

如圖1所示是太陽跟蹤系統(tǒng)的硬件結(jié)構(gòu)圖。在圖1中,CMOS圖像傳感器與太陽能電池板處在同一平面,并固連在雙軸轉(zhuǎn)臺(tái)上;ARM處理器與雙軸轉(zhuǎn)臺(tái)的電機(jī)驅(qū)動(dòng)部分采用串口通信方式;系統(tǒng)的供電均由蓄電池支持(包括ARM控制板和轉(zhuǎn)臺(tái)),因而形成了一個(gè)獨(dú)立系統(tǒng)。系統(tǒng)的基本工作原理是:根據(jù)視日運(yùn)動(dòng)規(guī)律或CMOS圖像傳感器采集的天空?qǐng)D像,利用ARM處理器求取系統(tǒng)跟蹤控制參數(shù),并通過串口來控制雙軸轉(zhuǎn)臺(tái)的轉(zhuǎn)動(dòng)。

圖1太陽跟蹤系統(tǒng)的硬件結(jié)構(gòu)圖1.2硬件介紹

(1) ARM微控制器。從實(shí)用角度考慮,太陽跟蹤系統(tǒng)的低功耗設(shè)計(jì)顯得尤為重要,ARM微處理器在保證高性能的前提下能夠盡量降低功耗[9]。相對(duì)于PC機(jī),ARM微處理器占用空間較小,質(zhì)量輕,可靠性強(qiáng),硬件資源豐富,在簡化系統(tǒng)結(jié)構(gòu)的同時(shí)為系統(tǒng)功能擴(kuò)展提供了可能。系統(tǒng)選用32位ARM嵌入式微控制器S3C2440來構(gòu)建控制平臺(tái)。運(yùn)用ARM微控制器構(gòu)建的嵌入式圖像處理平臺(tái)大大提高了圖像的處理速度,同時(shí)有效降低了系統(tǒng)成本。圖像處理系統(tǒng)還具有拆裝方便,配置靈活等優(yōu)點(diǎn),安全性得到大大提高[10]。

(2) 雙軸轉(zhuǎn)臺(tái)。系統(tǒng)采用集成式雙軸轉(zhuǎn)臺(tái),其結(jié)構(gòu)如圖2所示,工作電壓為24 V,可利用蓄電池供電。在圖2中,x向?yàn)樗椒较颍瑈向?yàn)榇怪狈较?。x向轉(zhuǎn)角對(duì)應(yīng)太陽方位角,y向轉(zhuǎn)角對(duì)應(yīng)太陽高度角。該雙軸轉(zhuǎn)臺(tái)x向轉(zhuǎn)動(dòng)范圍為-157°~+157°,y向轉(zhuǎn)動(dòng)范圍為0°~90°,集成了電機(jī)控制模塊,并提供串行接口,控制器可以利用串口通信來控制并驅(qū)動(dòng)轉(zhuǎn)臺(tái)在x向和y向上的轉(zhuǎn)動(dòng)。

(3) CMOS圖像傳感器。圖像傳感器產(chǎn)品主要有CCD,CMOS,CIS三種。其中CMOS圖像傳感器集成度高,價(jià)格低廉,而且可以實(shí)現(xiàn)數(shù)字化輸出,軟件可編程控制,提高了系統(tǒng)設(shè)計(jì)的靈活性,同時(shí)也具有較高的抗干擾性和穩(wěn)定性[11]。系統(tǒng)采用的圖像傳感器為OmniVision公司的OV 9650型COMS攝像頭,其功耗為30 μW,陣列大小為1 300×1 028 pixels,焦距為4.85 mm,像素大小為3.18 μm×3.18 μm,支持軟件可編程控制,輸出圖像格式包括YUV,RGB等。

圖2雙軸轉(zhuǎn)臺(tái)的結(jié)構(gòu)圖2軟件設(shè)計(jì)

2.1跟蹤控制策略

圖3所示是太陽跟蹤系統(tǒng)工作過程流程圖,系統(tǒng)采用的跟蹤控制策略如下:

(1) 系統(tǒng)可設(shè)置2種工作模式,早晨6:00喚醒跟蹤控制系統(tǒng),系統(tǒng)啟動(dòng)跟蹤控制,進(jìn)入跟蹤模式;下午18:00休眠系統(tǒng),系統(tǒng)關(guān)閉跟蹤控制,進(jìn)入待機(jī)模式。同時(shí)系統(tǒng)采用粗跟蹤和精跟蹤2種方式,粗跟蹤采用視日運(yùn)動(dòng)跟蹤方法,精跟蹤采用基于計(jì)算機(jī)視覺的跟蹤方法。粗跟蹤為精跟蹤提供初始工作條件,精跟蹤保證系統(tǒng)的跟蹤精度。

圖3太陽跟蹤系統(tǒng)工作過程流程圖(2) 喚醒跟蹤控制系統(tǒng)時(shí),采用視日運(yùn)動(dòng)開環(huán)計(jì)算方法進(jìn)行粗跟蹤。粗跟蹤的基本過程是:根據(jù)太陽運(yùn)行的天文規(guī)律計(jì)算,利用系統(tǒng)時(shí)間和給定的當(dāng)?shù)亟?jīng)緯度計(jì)算太陽高度角和太陽方位角,并根據(jù)計(jì)算結(jié)果來驅(qū)動(dòng)并控制步進(jìn)電機(jī),從而調(diào)整太陽能電池板的角位置。粗跟蹤的目的是為了讓太陽進(jìn)入圖像傳感器的視野范圍,主要用于首次定位和目標(biāo)丟失后的重新定位。

(3) 系統(tǒng)工作在跟蹤模式時(shí),周期性采集圖像,采用基于計(jì)算機(jī)視覺的閉環(huán)校正方法進(jìn)行精跟蹤。精跟蹤的基本過程是:通過對(duì)采集圖像進(jìn)行處理,獲取太陽角度偏差量。由太陽角度偏差量可得到轉(zhuǎn)臺(tái)應(yīng)轉(zhuǎn)過的角度,從而使太陽能電池板能正對(duì)太陽。精跟蹤的目的是為了保證系統(tǒng)跟蹤精度。

(4) 系統(tǒng)工作在跟蹤模式時(shí),由于陰天、雨天或其他原因,太陽光線很弱或基本看不見,導(dǎo)致CMOS圖像傳感器無法捕捉到太陽。此時(shí),太陽能電池板的工作效率很低,為了減小跟蹤系統(tǒng)能耗,不進(jìn)行電機(jī)動(dòng)作并保持當(dāng)前狀態(tài)。同時(shí)設(shè)置累計(jì)標(biāo)志S,它表示圖像傳感器在連續(xù)S個(gè)采樣周期內(nèi)沒有捕捉到太陽。當(dāng)S累計(jì)到設(shè)定值N時(shí),采用視日運(yùn)動(dòng)開環(huán)計(jì)算方法重新粗定位,并重置累計(jì)標(biāo)志S。這樣在降低系統(tǒng)能耗的同時(shí)可以提高系統(tǒng)可靠性。

2.2基于計(jì)算機(jī)視覺的跟蹤方法

基于計(jì)算機(jī)視覺的跟蹤方法,其基本過程如下:通過對(duì)采集圖像進(jìn)行處理,得到太陽位置偏差量。如果偏差在預(yù)設(shè)閾值范圍內(nèi),則保持當(dāng)前狀態(tài);如果偏差超出預(yù)設(shè)閾值F1的范圍,則根據(jù)偏差的方向和大小調(diào)整轉(zhuǎn)臺(tái),使得通過圖像處理得到的偏差在預(yù)設(shè)閾值F2的范圍內(nèi)。其中閾值F1的范圍比閾值F2的范圍大,這樣可以減小電機(jī)動(dòng)作次數(shù),降低能耗。

(1) 圖像處理方法。圖像傳感器得到圖像后,首先進(jìn)行圖像的灰度化。使用屏蔽字和移位操作來得到R,G,B分量,再進(jìn)行比例轉(zhuǎn)換,得到灰度圖像。設(shè)置閾值,將圖像二值化,得到的圖像中的光斑即為太陽。找到太陽位置,計(jì)算光斑中心與圖像中心的偏差值,將該偏差值換算為太陽方位角和高度角的實(shí)際偏差值。

(2) 偏差角計(jì)算與轉(zhuǎn)臺(tái)控制。記CMOS圖像傳感器的焦距為f,像素大小為kx×ky。假設(shè)采集圖像上太陽位置偏離圖像中心的偏差為px×py,則可以計(jì)算太陽偏差角如下:

太陽方位偏差角:Δα=arctan(px×kx/f) ;

太陽高度偏差角:Δβ=arctan(py×ky/f) 。

根據(jù)太陽方位偏差角和高度偏差角,通過串口控制轉(zhuǎn)臺(tái)轉(zhuǎn)動(dòng),使太陽能電池板正對(duì)太陽。其中轉(zhuǎn)臺(tái)x軸應(yīng)轉(zhuǎn)過的角度為太陽方位偏差角,轉(zhuǎn)臺(tái)y軸應(yīng)轉(zhuǎn)過的角度為太陽高度偏差角。

2.3嵌入式處理平臺(tái)的實(shí)現(xiàn)

系統(tǒng)采用S3C2440作為主控制器。利用Linux內(nèi)核代碼,針對(duì)本處理器和本系統(tǒng)特點(diǎn),對(duì)內(nèi)核進(jìn)行相應(yīng)的配置和裁剪,編譯生成嵌入式內(nèi)核,并選用yaffs作為根文件系統(tǒng),將內(nèi)核映像文件和根文件系統(tǒng)燒寫到微控制器中,并編寫相應(yīng)驅(qū)動(dòng)程序。

程序在主機(jī)上設(shè)計(jì)完成后,需進(jìn)行交叉編譯,然后下載到處理器運(yùn)行。

首先在主機(jī)Linux系統(tǒng)下搭建交叉編譯環(huán)境,這里采用armlinuxgcc4.3.2 with EABI版本的交叉編譯器,并配置主機(jī)和目標(biāo)板的NFS和FTP網(wǎng)絡(luò),以實(shí)現(xiàn)主機(jī)到目標(biāo)板的文件下載和主機(jī)對(duì)微控制器的控制。程序編寫完成后,進(jìn)行交叉編譯,生成可執(zhí)行文件,下載到處理器運(yùn)行即可。

3實(shí)驗(yàn)結(jié)果

3.1基于計(jì)算機(jī)視覺方法的跟蹤實(shí)驗(yàn)

如圖4所示是某次精跟蹤過程的實(shí)驗(yàn)結(jié)果,其中(a)為CMOS圖像傳感器捕捉到的原始圖像;(b)為經(jīng)過灰度化、二值化后的結(jié)果,可以看出圖像中的太陽已經(jīng)被提取出來;(c)為精跟蹤一段時(shí)間后圖像傳感器得到的圖像,可以看出太陽處在圖像中心位置,此時(shí)太陽光線垂直照射太陽能電池板。

圖4視覺跟蹤試驗(yàn)結(jié)果3.2系統(tǒng)技術(shù)指標(biāo)

對(duì)本文提出的太陽跟蹤系統(tǒng)進(jìn)行了性能測(cè)試,通過分析測(cè)試結(jié)果,該系統(tǒng)的技術(shù)指標(biāo)如表1所示。

表1太陽跟蹤系統(tǒng)的技術(shù)指標(biāo)

方位角范圍-157°~+157°高度角范圍0°~90°跟蹤精度0.05°系統(tǒng)自重 /kg11工作溫度范圍 /℃-10~60噪音范圍 /dB≤70系統(tǒng)平均耗電量 /W≤5

4結(jié)語

本文中設(shè)計(jì)的太陽跟蹤系統(tǒng)采用視日運(yùn)動(dòng)跟蹤方法和基于計(jì)算機(jī)視覺的跟蹤方法相結(jié)合的方式,一方面采用視日運(yùn)動(dòng)跟蹤方法進(jìn)行初始粗定位和系統(tǒng)丟失目標(biāo)時(shí)的重新粗定位;另一方面采用基于計(jì)算機(jī)視覺的跟蹤方法進(jìn)行精確跟蹤?;谟?jì)算機(jī)視覺的跟蹤方法采用CMOS圖像傳感器采集太陽光斑,利用ARM微控制器處理采集到的圖像,實(shí)現(xiàn)對(duì)太陽的實(shí)時(shí)跟蹤。實(shí)驗(yàn)結(jié)果表明,該系統(tǒng)可以連續(xù)跟蹤太陽的角度變化,能夠達(dá)到較高的跟蹤精度;當(dāng)跟蹤目標(biāo)丟失時(shí),能夠利用視日運(yùn)動(dòng)跟蹤方法對(duì)系統(tǒng)重新定位,具有較好的環(huán)境適應(yīng)能力。該系統(tǒng)具有較低的日均功耗、較高的跟蹤精度和可靠性,結(jié)構(gòu)簡單輕便,可應(yīng)用于各種太陽能光伏系統(tǒng)。

參考文獻(xiàn)

[1],楊景常,鄭宇.向日葵型跟蹤太陽智能發(fā)電裝置的研制[J].西華大學(xué)學(xué)報(bào):自然科學(xué)版,2007,26(6):1820.

[2]苑瑋琦,金晶晶.基于圖像傳感器的太陽方位檢測(cè)系統(tǒng)研究[J].微計(jì)算機(jī)信息,2007,23(12):141143.

[3]HELWA N H.,BAHGAT A B G.,SHAFEEA M R E, et al. Maximum collectable solar energy by different solar tracking systems \[J\]. Energy Sources, 2000, 22 (1): 2334.

[4]GAY C F, YERKES J W, WILSON J H. Performance advantages of twoaxis tracking for large flatplate photovoltaic energy system \[C\]// Proceedings of 16th IEEE Photovoltaic Specialists Conference. \[S.l.\]: IEEE, 1982: 13681371.

[5]鄭小年,黃巧燕.太陽跟蹤方法[J].能源技術(shù),2003,24(4):149151.

[6]杜偉巍,鄒麗新,尤金正,等.基于CMOS圖像傳感器的太陽自動(dòng)跟蹤控制器設(shè)計(jì)與實(shí)現(xiàn)[J].現(xiàn)代電子技術(shù),2009,32(11):150154.

[7]鄭小年,黃巧燕,張曉黎,等.太陽集熱器跟蹤臺(tái)的設(shè)計(jì)與控制[J].中國機(jī)械工程,2003,14(12):10071009.

[8]KALOGIROU S A. Design and construction of a oneaxis suntracking system \[J\]. So1ar Energy, 1996, 57 (6): 465469.

[9]周立功.ARM微控制器基礎(chǔ)與實(shí)踐[M].北京:北京航空航天大學(xué)出版社,2003.

[10]馬俊青,宋愛國,甘英俊.一種基于ARM的圖像處理系統(tǒng)的設(shè)計(jì)[J].電氣電子教學(xué)學(xué)報(bào),2009,31(4):6669.

[11]何小明.用CMOS芯片取代CCD[N].中國電子報(bào),2000915(5).

[12]孫夢(mèng)宇,趙敏,吳毅杰,等.基于ARM的電子負(fù)載網(wǎng)絡(luò)監(jiān)控系統(tǒng)\[J\].電子科技,2010(3):4649.

篇9

第3期謝珺,等:機(jī)器視覺在輪胎檢測(cè)領(lǐng)域的應(yīng)用研究

(1)算法的精確性提高伴隨著計(jì)算量的成倍增加,處理時(shí)間就成為了實(shí)時(shí)檢測(cè)的軟肋;(2)硬件的分辨率提高了,圖像的分辨率、精度也隨之提高了,但是數(shù)據(jù)量計(jì)算量都因此成倍增加。因此,如何保證檢測(cè)的實(shí)時(shí)性和準(zhǔn)確性,是機(jī)器視覺系統(tǒng)在工業(yè)應(yīng)用中需要解決的核心問題。2視覺檢測(cè)核心技術(shù)

2.1機(jī)器視覺圖像處理技術(shù)機(jī)器視覺就是用機(jī)器代替人眼來做測(cè)量和判斷。機(jī)器視覺系統(tǒng)是指通過機(jī)器視覺產(chǎn)品(即圖像攝取裝置,分CMOS和CCD兩種)將被攝取目標(biāo)轉(zhuǎn)換成圖像信號(hào),傳送給專用的圖像處理系統(tǒng),根據(jù)像素分布和亮度、顏色等信息,轉(zhuǎn)變成數(shù)字化信號(hào);圖像系統(tǒng)對(duì)這些信號(hào)進(jìn)行各種運(yùn)算來抽取目標(biāo)的特征,進(jìn)而根據(jù)判別的結(jié)果來控制現(xiàn)場(chǎng)的設(shè)備動(dòng)作。有大量的文獻(xiàn)和著作給與介紹和討論,其中比較著名的馬頌德的《計(jì)算機(jī)視覺》介紹了計(jì)算機(jī)視覺的算法和理論,以及Richard Hartley的《Multiple View Geometry in Computer Vision》介紹了在計(jì)算機(jī)視覺中的幾何理論和方法[2]。機(jī)器視覺中的圖像處理方法,主要包括圖像增強(qiáng)、數(shù)據(jù)編碼和傳輸、平滑、邊緣銳化、分割、特征抽取、圖像識(shí)別與理解等內(nèi)容。經(jīng)過這些處理后,輸出圖像的質(zhì)量得到相當(dāng)程度的改善,既優(yōu)化了圖像的視覺效果,又便于處理器對(duì)圖像進(jìn)行分析、處理和識(shí)別[3]。機(jī)器視覺理論應(yīng)用于現(xiàn)代檢測(cè)領(lǐng)域,是上世紀(jì)末本世紀(jì)初計(jì)算機(jī)視覺的一個(gè)新的研究方向。它使用計(jì)算機(jī)視覺的理論方法來識(shí)別物體的關(guān)鍵點(diǎn),經(jīng)過分析處理以后,轉(zhuǎn)換成坐標(biāo)數(shù)據(jù),然后產(chǎn)生檢測(cè)數(shù)據(jù)。國內(nèi)已有學(xué)者把機(jī)器視覺技術(shù)運(yùn)用于檢測(cè)領(lǐng)域[4]。但是在輪胎檢測(cè)領(lǐng)域,機(jī)器視覺技術(shù)的應(yīng)用還僅僅停留在理論之上,還沒有可實(shí)際應(yīng)用的商品化的設(shè)備,更不用說結(jié)合機(jī)器視覺和嵌入式兩種技術(shù)的便攜式檢測(cè)儀了。

2.2嵌入式技術(shù)嵌入式系統(tǒng)一般指非PC系統(tǒng),有計(jì)算機(jī)功能但又不稱之為計(jì)算機(jī)的設(shè)備或器材。它是以應(yīng)用為中心,軟硬件可裁減的,適應(yīng)對(duì)功能、可靠性、成本、體積、功耗等綜合性嚴(yán)格要求的專用計(jì)算機(jī)系統(tǒng)。嵌入式系統(tǒng)幾乎包括了生活中的所有電器設(shè)備,如掌上PDA、移動(dòng)計(jì)算設(shè)備、電視機(jī)頂盒、手機(jī)上網(wǎng)、數(shù)字電視、多媒體、汽車、微波爐、數(shù)字相機(jī)、家庭自動(dòng)化系統(tǒng)、電梯、空調(diào)、安全系統(tǒng)、自動(dòng)售貨機(jī)、蜂窩式電話、消費(fèi)電子設(shè)備、工業(yè)自動(dòng)化儀表與醫(yī)療儀器等。嵌入式系統(tǒng)有以下幾大優(yōu)點(diǎn)應(yīng)用的,它通常都具有低功耗、體積小,集成度高等特點(diǎn);(2)嵌入式系統(tǒng)和具體應(yīng)用有機(jī)地結(jié)合在一起,它的升級(jí)換代也是和具體產(chǎn)品同步進(jìn)行的,因此嵌入式系統(tǒng)產(chǎn)品一旦進(jìn)入市場(chǎng),就具有較長的生命周期;(3)由于空間和各種資源相對(duì)不足,嵌入式系統(tǒng)的硬件和軟件都必須設(shè)計(jì),量體裁衣、去除冗余,力爭(zhēng)在同樣的硅片面積上實(shí)現(xiàn)更高的性能,這樣才能在具體應(yīng)用中對(duì)處理器的選擇更具有競(jìng)爭(zhēng)力。本研究選取嵌入式系統(tǒng)中的DSP(數(shù)字信號(hào)處理器)來進(jìn)行開發(fā),具體型號(hào)為TI公司的TMS320。它具有很高的編譯效率和執(zhí)行速度,在信號(hào)處理方面具有優(yōu)勢(shì),它的特點(diǎn)如下:(1)程序和數(shù)據(jù)具有獨(dú)立的存儲(chǔ)空間,有著各自獨(dú)立的程序總線與數(shù)據(jù)總線,可以同時(shí)對(duì)數(shù)據(jù)和程序進(jìn)行尋址,大大提高了數(shù)據(jù)處理能力;(2)由于廣泛采用了流水線操作,減少了指令的執(zhí)行時(shí)間,可以同時(shí)運(yùn)行8條指令;(3)與一般計(jì)算機(jī)不同,乘法(除法)不由加法和移位實(shí)現(xiàn),它具有硬件乘法器,乘法運(yùn)算可以在一個(gè)指令周期內(nèi)完成;(4)指令周期降到了1.67 ns。隨著工作頻率進(jìn)一步提高,指令周期將進(jìn)一步縮短;(5)擁有自己獨(dú)特的專門為數(shù)字信號(hào)處理而設(shè)計(jì)的指令系統(tǒng);(6)相比傳統(tǒng)的處理芯片,它還具有體積小、功耗小、使用方便、實(shí)時(shí)處理迅速、處理數(shù)據(jù)量大、處理精度高、性能價(jià)格比高等許多優(yōu)點(diǎn)。3輪胎檢測(cè)系統(tǒng)構(gòu)成

3.1研究目標(biāo)機(jī)器視覺用于產(chǎn)品表面缺陷檢測(cè)需要面對(duì)以下主要問題:(1)數(shù)據(jù)處理量非常龐大;(2)如何快讀匹配圖像;(3)如何快速實(shí)現(xiàn)缺陷分割并剔除偽缺陷;(4)如何選取缺陷特征,用以實(shí)現(xiàn)缺陷識(shí)別。以具體產(chǎn)品為例,相對(duì)其他輪胎產(chǎn)品,航空輪胎對(duì)質(zhì)量檢測(cè)的要求較為嚴(yán)格,只要航空輪胎的檢測(cè)技術(shù)到位,其他輪胎產(chǎn)品也基本可以檢測(cè)。以航空輪胎的缺陷檢測(cè)為例, 根據(jù)GB/T 9747-2008《航空輪胎試驗(yàn)方法》、GB/T 13652-2004 《航空輪胎表面質(zhì)量》和GB 15323-1994 《航空輪胎內(nèi)胎》等標(biāo)準(zhǔn)的要求,研究表面缺陷在線檢測(cè)的圖像處理方案;開發(fā)一套基于機(jī)器視覺的產(chǎn)品表面缺陷的在線檢測(cè)設(shè)備,同時(shí)根據(jù)GB/T 13653-2004 《航空輪胎X射線檢測(cè)方法》所述,配合X射線發(fā)射儀,利用一對(duì)一的服務(wù)器/客戶機(jī)構(gòu)架的機(jī)器視覺對(duì)標(biāo)準(zhǔn)中所描述的航空輪胎的一系列缺陷,如斷層、氣泡和裂口等進(jìn)行高精度、高實(shí)時(shí)性、高連續(xù)性以及非接觸式的在線缺陷檢測(cè)。具體技術(shù)指標(biāo):(1)能檢測(cè)出最小直徑0.3 mm的輪胎內(nèi)部缺陷(即橫向縱向最小均為0.3 mm)并能對(duì)缺陷進(jìn)行分類識(shí)別,主要包括結(jié)構(gòu)類、氣泡類和夾雜物類,對(duì)缺陷的檢出率要求大于90%;(2)對(duì)缺陷部位進(jìn)行定量和定位分析:讀出缺陷的尺寸(誤差0.5 mm),測(cè)出缺陷距離輪胎表面的深度,決定缺陷在輪胎內(nèi)部的位置;(3)在線檢測(cè)設(shè)備的檢測(cè)檢測(cè)速度與X射線管旋轉(zhuǎn)速度同步,X射線管旋轉(zhuǎn)一周即完成一個(gè)輪胎一個(gè)圓周的缺陷檢測(cè)。

3.2研究內(nèi)容和技術(shù)路線

3.2.1確定機(jī)器視覺檢測(cè)系統(tǒng)的基本框架在數(shù)據(jù)量大時(shí),采用一個(gè)處理器搭配一臺(tái)攝像機(jī)的一對(duì)一方式。在產(chǎn)品表面檢測(cè)中,由于航空輪胎的圓周面比較大,數(shù)據(jù)量也就比較大,通常采用的機(jī)器視覺單攝像機(jī)方式,很難滿足圓周面檢測(cè)分辨率高、數(shù)據(jù)量大的要求,而多臺(tái)攝像機(jī)能滿足分辨率和數(shù)據(jù)量的要求,卻又相應(yīng)帶來實(shí)時(shí)性差的問題。若采用多臺(tái)攝像機(jī)的方式,就需要配備多套成像系統(tǒng),一套成像系統(tǒng)造價(jià)在10萬元左右,基于成本和計(jì)算數(shù)據(jù)量的考慮,本研究選用一對(duì)一方式,利用分時(shí)運(yùn)動(dòng)克服單臺(tái)攝像機(jī)采集數(shù)據(jù)量不足的缺點(diǎn)。具體來說,就是在經(jīng)典的服務(wù)器/客戶端模式架構(gòu)的基礎(chǔ)上設(shè)計(jì)一種基于機(jī)器視覺的系統(tǒng)結(jié)構(gòu)以實(shí)現(xiàn)輪胎圓周面產(chǎn)品表面缺陷的在線檢測(cè),該結(jié)構(gòu)主要由四部分組成:服務(wù)器(嵌入式系統(tǒng))、客戶端(圖像處理子系統(tǒng))、信號(hào)模塊(PLC)、輸出單元。系統(tǒng)框架如圖1所示。每隔一定的時(shí)間(系統(tǒng)初步設(shè)定為5 s),服務(wù)器通過PLC控制步進(jìn)電機(jī)驅(qū)動(dòng)輪胎做圓周轉(zhuǎn)動(dòng),每轉(zhuǎn)過一個(gè)固定角度(系統(tǒng)定為120°),服務(wù)器就調(diào)動(dòng)客戶端完成此區(qū)域內(nèi)相對(duì)獨(dú)立的視覺檢測(cè)任務(wù),一次間隔只檢測(cè)輪胎的三分之一(120/360),經(jīng)過3個(gè)時(shí)間間隔,客戶端即完成了整個(gè)輪胎360°的全面檢測(cè),然后利用拼接原理把各部分拼接起來,統(tǒng)一到一個(gè)坐標(biāo)系下。拼接測(cè)量的關(guān)鍵是利用重疊區(qū)計(jì)算出各次測(cè)量時(shí)基準(zhǔn)的不同,然后消除不同,統(tǒng)一在一個(gè)坐標(biāo)系下。拼接測(cè)量的方法可以直接計(jì)算出被測(cè)輪胎的全面信息。為了保證服務(wù)器和客戶端之間圖像檢測(cè)數(shù)據(jù)可靠、實(shí)時(shí)的交互,本研究采用千兆以太網(wǎng)的方式傳輸數(shù)據(jù)。作為整個(gè)檢測(cè)系統(tǒng)的管理控制單元和人機(jī)交互接口,服務(wù)器不僅要完成檢測(cè)任務(wù)的調(diào)度,還要可以設(shè)定檢測(cè)參數(shù),接收和實(shí)時(shí)顯示客戶端上傳的圖像數(shù)據(jù)和處理結(jié)果(缺陷等),并將信息存入數(shù)據(jù)庫中。此外,服務(wù)器還接收PLC傳來的位置檢測(cè)信號(hào),用于與客戶端的同步,并且根據(jù)檢測(cè)結(jié)果中的位置信號(hào),對(duì)執(zhí)行機(jī)構(gòu)發(fā)出動(dòng)作信號(hào),標(biāo)記并剔除有缺陷的產(chǎn)品。在客戶端處理核心中安裝有圖像采集卡,接收服務(wù)器設(shè)置的參數(shù)和任務(wù)調(diào)度,控制采集卡和攝像機(jī)完成圖像實(shí)時(shí)采集,利用圖像處理算法處理和分析圖像數(shù)據(jù),將最終得到的缺陷位置和分類信息上傳給服務(wù)器,保存缺陷圖像以備查。

3.2.2設(shè)計(jì)編寫表面缺陷檢測(cè)的圖像處理方案在表面缺陷檢測(cè)中,根據(jù)圖像數(shù)據(jù)的特點(diǎn),本研究提出以下圖像處理過程:缺陷分割、特征提取及缺陷分類。首先是缺陷分割:在表面缺陷檢測(cè)的時(shí)候,利用圖像處理算法,處理采集到的產(chǎn)品表面圖像,將缺陷從復(fù)雜的背景圖像中分離出來。接著是特征提取:提取缺陷后,對(duì)缺陷的各種標(biāo)識(shí)性屬性進(jìn)行提取,主要是幾何特征和灰度統(tǒng)計(jì)特征,以保證后續(xù)的缺陷分類和識(shí)別。幾何特征指的是輪廓特征,比如長度、形狀、面積、重心等。灰度統(tǒng)計(jì)特征指的是分布位置、統(tǒng)計(jì)值、均方差等等。還有缺陷分類:本研究采用改進(jìn)的BP算法[7]對(duì)網(wǎng)絡(luò)進(jìn)行訓(xùn)練,構(gòu)建神經(jīng)網(wǎng)絡(luò)分類器來實(shí)現(xiàn)輪胎缺陷分類,為了提高檢測(cè)系統(tǒng)對(duì)偽缺陷的適應(yīng)性,本研究將部分偽缺陷也作為網(wǎng)絡(luò)輸出并對(duì)其進(jìn)行訓(xùn)練。由于圖像處理中需要運(yùn)用大量的計(jì)算機(jī)內(nèi)存處理算法,為避免編程中出現(xiàn)內(nèi)存泄露進(jìn)而造成計(jì)算機(jī)內(nèi)存資源流失的現(xiàn)象,決定采用對(duì)內(nèi)存進(jìn)行托管的C#語言進(jìn)行編程。

3.2.3服務(wù)器和客戶機(jī)系統(tǒng)之間的同步服務(wù)器/客戶端模式架構(gòu)的機(jī)器視覺系統(tǒng)具有獨(dú)立性和并行性的特點(diǎn),它不得不面臨的一個(gè)重要問題是如何解決服務(wù)器和圖像處理子系統(tǒng)之間的同步問題,包括攝像機(jī)同步采集、數(shù)據(jù)同步處理和輪胎運(yùn)動(dòng)同步控制等。本研究利用攝像機(jī)本身的外同步特性,采用對(duì)攝像機(jī)提供統(tǒng)一的線掃描觸發(fā)信號(hào)保證攝像機(jī)采集同步。機(jī)器視覺系統(tǒng)基本組成模塊見圖2。

4結(jié)論實(shí)際測(cè)量結(jié)果證明,應(yīng)用視覺檢測(cè)方法可以較好地解決傳統(tǒng)測(cè)量方法中時(shí)間長、工作量大、測(cè)量效率低的問題。該方法能夠充分利用現(xiàn)代計(jì)算機(jī)技術(shù)的優(yōu)勢(shì),設(shè)備簡單、易用,克服了傳統(tǒng)測(cè)量儀器的許多誤差來源,具有快速、準(zhǔn)確、非接觸測(cè)量的優(yōu)點(diǎn)。在實(shí)驗(yàn)室中初步完成了實(shí)驗(yàn)系統(tǒng)的核心部分(如圖3所示),與傳統(tǒng)的測(cè)量方法相比,原先需要15 min的測(cè)量時(shí)間,現(xiàn)在只需要15~30 s就可完成,操作也更加簡單便捷。該系統(tǒng)可檢測(cè)出最小直徑0.3 mm的輪胎內(nèi)部缺陷(即橫向縱向最小均為0.3 mm)并能對(duì)缺陷進(jìn)行分類識(shí)別,主要包括結(jié)構(gòu)類、氣泡類和夾雜物類,對(duì)缺陷的檢出率為96%。

參考文獻(xiàn):

[1]彭向前.產(chǎn)品表面缺陷在線檢測(cè)方法研究及系統(tǒng)實(shí)現(xiàn)[D].武漢:華中科技大學(xué),2008.

[2]ZHANG Z.Determining the Epipolar geometry and its uncertainty[J].A Review Int Journal on Computer Vision,1998,27(2):161-195.

[3]章毓晉.圖像處理和分析[M].北京:清華大學(xué)出版社,1999.

篇10

關(guān)鍵詞:運(yùn)動(dòng)目標(biāo)識(shí)別;背景差分法;瞬時(shí)差分法;OpenCV

中圖分類號(hào):TP273

0 引 言

運(yùn)動(dòng)目標(biāo)的識(shí)別就是對(duì)包含運(yùn)動(dòng)信息的視頻序列運(yùn)用適當(dāng)?shù)募夹g(shù)進(jìn)行處理,把與背景存在相對(duì)運(yùn)動(dòng)的前景區(qū)分開的過程。它是計(jì)算機(jī)視覺信息提取中的一個(gè)重要問題,也是更高層次視頻分析,如基于對(duì)象的視頻編碼、目標(biāo)跟蹤、運(yùn)動(dòng)分析基礎(chǔ)。目前,運(yùn)動(dòng)目標(biāo)識(shí)別主要有三種方法:背景差分法、瞬時(shí)差分法和光流法。背景差分法可以得到比較完整的運(yùn)動(dòng)目標(biāo)信息,但是背景模型的獲取和更新比較困難。瞬時(shí)差分法容易在目標(biāo)內(nèi)部產(chǎn)生空洞,不能得到完整的目標(biāo)信息。光流法計(jì)算比較復(fù)雜,且抗噪性能差,如果沒有特定的硬件支持,一般很難用于運(yùn)動(dòng)目標(biāo)識(shí)別的實(shí)時(shí)性操作。

在此介紹一種將背景差分法和瞬時(shí)差分法相結(jié)合的運(yùn)動(dòng)目標(biāo)識(shí)別算法,并給出基于OpenCV實(shí)現(xiàn)算法的過程和實(shí)驗(yàn)結(jié)果。

1 算法思想

背景差分法是利用當(dāng)前圖像與背景圖像的差分來識(shí)別出運(yùn)動(dòng)目標(biāo)的方法。背景模型的獲取和更新是該方法中的關(guān)鍵技術(shù)。一種簡單的獲取背景圖像的方法是當(dāng)場(chǎng)景中無任何目標(biāo)出現(xiàn)時(shí)捕獲背景圖像,這種人工的非自適應(yīng)方法獲取的背景圖像僅適用于短時(shí)間內(nèi)的視頻監(jiān)控。目前大多數(shù)算法已經(jīng)放棄這種非自適應(yīng)的背景圖像估計(jì)方法。當(dāng)場(chǎng)景環(huán)境不是很復(fù)雜時(shí),可以使用統(tǒng)計(jì)濾波完成場(chǎng)景中背景圖像的估計(jì),大多數(shù)情況下都可以得到正確的背景估計(jì)圖像,但是當(dāng)場(chǎng)景中有個(gè)別部分做無規(guī)則運(yùn)動(dòng)時(shí),會(huì)引起場(chǎng)景中像素值不斷變化,從而引起估計(jì)誤差?;诟咚菇y(tǒng)計(jì)模型的背景估計(jì)方法在有部分區(qū)域不斷變化的場(chǎng)景中也能比較準(zhǔn)確地估計(jì)出背景模型,但是它的計(jì)算比較復(fù)雜,加上識(shí)別過程中其他操作也可能無法滿足實(shí)時(shí)性需求。

瞬時(shí)差分法是在視頻序列中兩個(gè)相鄰幀間采用基于像素的時(shí)間差分,并且閾值化來提取出運(yùn)動(dòng)目標(biāo)的方法。即將相鄰的兩幀圖像做逐像素相減運(yùn)算,并設(shè)定閾值,若相減的值大于閾值,則將其看作前景圖像(運(yùn)動(dòng)目標(biāo));否則看作是背景圖像。瞬時(shí)差分法對(duì)于動(dòng)態(tài)環(huán)境的適應(yīng)性較強(qiáng),不需要獲取背景圖像。當(dāng)相鄰兩幀圖像的紋理、灰度等信息比較接近時(shí),這種方法通常不能完整地檢測(cè)到目標(biāo)的具體內(nèi)容,在物體內(nèi)部產(chǎn)生空洞。但是它可以較準(zhǔn)確地得到運(yùn)動(dòng)物體的輪廓。

在此將使用一種背景差分法和瞬時(shí)差分法相結(jié)合的方法。首先根據(jù)一定數(shù)量的視頻序列,采用基于高斯統(tǒng)計(jì)模型的方法獲得背景圖像。在后續(xù)處理中,對(duì)于每一幀的視頻圖像,首先用瞬時(shí)差分法識(shí)別出運(yùn)動(dòng)目標(biāo)的輪廓,然后用這幀圖像運(yùn)動(dòng)目標(biāo)輪廓以外的區(qū)域?qū)Ρ尘澳P瓦M(jìn)行基于統(tǒng)計(jì)濾波的更新。這樣就可以減少場(chǎng)景中運(yùn)動(dòng)目標(biāo)對(duì)更新背景模型的影響,同時(shí)保證了系統(tǒng)運(yùn)行時(shí)間的實(shí)時(shí)性,也可以得到較完整的目標(biāo)識(shí)別信息。

2 算法實(shí)現(xiàn)

根據(jù)前文的算法思想,可以得到系統(tǒng)的流程圖如┩1所示。

開放源代碼的計(jì)算機(jī)視覺類庫OpenCV(Open Source Computer Vision Library)是由英特爾公司位于俄羅斯的研究實(shí)驗(yàn)室所開發(fā)的一套可免費(fèi)獲得,并由┮恍┆C函數(shù)和C++類所組成的庫,用來實(shí)現(xiàn)一些常用的圖像處理及計(jì)算機(jī)視覺算法[7[CD*2]10]。下面給出利用OpenCV實(shí)現(xiàn)算法的具體過程和關(guān)鍵部分的代碼:

(1) 捕獲視頻幀

定義捕捉源:

(2) 基于高斯統(tǒng)計(jì)估計(jì)背景模型

定義高斯背景模型:

將高斯背景模型的背景圖像復(fù)制到事先定義的背景圖像pBkImg 中:

(3) 使用瞬時(shí)差分法獲得不包含運(yùn)動(dòng)區(qū)域的當(dāng)前幀,并更新背景。當(dāng)前幀pFrame和前一幀pFrame0做差分,結(jié)果放在差分圖像diff中,并二值化:

接下來要做的操作是,找到差分圖像中的輪廓,得到他們的外接矩形。將面積小的矩形視為噪音拋棄,剩下的則視為運(yùn)動(dòng)目標(biāo)。同時(shí)設(shè)置當(dāng)前幀pFrame和背景pBkImg的ROI為運(yùn)動(dòng)目標(biāo)的外接矩形。先將當(dāng)前幀的ROI置0,再對(duì)當(dāng)前幀與背景的ROI進(jìn)行邏輯(or)運(yùn)算。這樣,對(duì)于運(yùn)動(dòng)目標(biāo)所在區(qū)域,當(dāng)前幀和背景的圖像信息是一樣的,也就達(dá)到了消除運(yùn)動(dòng)目標(biāo)對(duì)背景更新的影響目的。

這段代碼如下所示:

用上述過程得到不包含運(yùn)動(dòng)目標(biāo)信息的當(dāng)前幀更新背景模型:

(4) 進(jìn)行背景差分,得到當(dāng)前幀運(yùn)動(dòng)目標(biāo)識(shí)別結(jié)果的二值圖像pFrImg:

3 實(shí)驗(yàn)結(jié)果

根據(jù)上述算法思想和實(shí)現(xiàn)過程,使用VC++6.0和OpenCV 1.0實(shí)現(xiàn)運(yùn)動(dòng)目標(biāo)的識(shí)別。經(jīng)過計(jì)算,該算法處理每一幀圖像的時(shí)間大約是16 ms,可以滿足實(shí)時(shí)性系統(tǒng)的要求。使用該算法對(duì)一段交通監(jiān)控圖像進(jìn)行運(yùn)動(dòng)目標(biāo)的識(shí)別,結(jié)果如圖2所示。其中,圖2(a)是當(dāng)前幀圖像,圖2(b)是不包含運(yùn)動(dòng)信息的當(dāng)前幀圖像,用矩形框標(biāo)注出了由幀間差分檢測(cè)到運(yùn)動(dòng)目標(biāo)的位置,┩2(c)是當(dāng)前的背景模型,圖2(d)是背景差分的結(jié)果。オ

4 結(jié) 語

由上述實(shí)驗(yàn)結(jié)果可以看出,本文介紹的算法可以較準(zhǔn)確地得到背景圖像,并且實(shí)現(xiàn)運(yùn)動(dòng)目標(biāo)的識(shí)別。

系統(tǒng)尚需改進(jìn)的地方有對(duì)運(yùn)動(dòng)目標(biāo)邊緣的檢測(cè)不夠清楚;如果可以加入陰影的檢測(cè)和去除,應(yīng)該會(huì)取得[LL]更好的識(shí)別效果。這些將是進(jìn)一步研究的工作。

參 考 文 獻(xiàn)

[1]劉雪.基于圖像序列的運(yùn)動(dòng)目標(biāo)檢測(cè)與跟蹤算法研究[D].山東:山東大學(xué),2007.

[2]許志良,周智恒,曹英烈,等.關(guān)于運(yùn)動(dòng)目標(biāo)檢測(cè)的發(fā)展現(xiàn)狀研究[J].移動(dòng)通信,2008(6):35[CD*2]38.

[3]丁忠校.視頻監(jiān)控圖像的運(yùn)動(dòng)目標(biāo)檢測(cè)方法綜述[J].電視技術(shù),2008,32(5):72[CD*2]76.

[4]尹彥,耿兆豐.基于背景模型的運(yùn)動(dòng)目標(biāo)檢測(cè)與跟蹤[J].微計(jì)算機(jī)信息,2008,24(11):298[CD*2]300.

[5]趙占杰,林小竹,張金燕.基于背景重建的運(yùn)動(dòng)目標(biāo)檢測(cè)算法[J].北京石油化工學(xué)院學(xué)報(bào),2008,16(2):27[CD*2]30.

[6]肖麗軍,于哲舟,周栩,等.基于對(duì)稱差分算法的視頻運(yùn)動(dòng)目標(biāo)分割[J].吉林大學(xué)學(xué)報(bào):理學(xué)版,2008,46(4):691[CD*2]696.

[7]賈小軍,喻擎蒼.基于開源計(jì)算機(jī)視覺處理庫OpenCV的圖像處理[J].計(jì)算機(jī)應(yīng)用與軟件,2008,25(4):276[CD*2]278.

[8]馬桂珍,朱玲贊,段麗.基于OpenCV的視頻應(yīng)用程序的開發(fā)方法[J].現(xiàn)代電子技術(shù),2007,30(4):78[CD*2]80.

[9]李振偉,陳,趙有.基于OpenCV的運(yùn)動(dòng)目標(biāo)跟蹤及其實(shí)現(xiàn)[J].現(xiàn)代電子技術(shù),2008,31(20):128[CD*2]131.

[10]劉瑞禎,于仕琪.OpenCV教程基礎(chǔ)篇[M].北京:北京航空航天大學(xué)出版社,2007.