卷積神經(jīng)網(wǎng)絡的主要思想范文
時間:2024-04-11 18:14:55
導語:如何才能寫好一篇卷積神經(jīng)網(wǎng)絡的主要思想,這就需要搜集整理更多的資料和文獻,歡迎閱讀由公務員之家整理的十篇范文,供你借鑒。
篇1
(江蘇科技大學電子信息學院,江蘇鎮(zhèn)江212003)
摘要:在實際交通環(huán)境中,由于運動模糊、背景干擾、天氣條件以及拍攝視角等因素,所采集的交通標志的圖像質量往往不高,這就對交通標志自動識別的準確性、魯棒性和實時性提出了很高的要求。針對這一情況,提出一種基于深層卷積神經(jīng)網(wǎng)絡的交通標志識別方法。該方法采用深層卷積神經(jīng)網(wǎng)絡的有監(jiān)督學習模型,直接將采集的交通標志圖像經(jīng)二值化后作為輸入,通過卷積和池采樣的多層處理,來模擬人腦感知視覺信號的層次結構,自動地提取交通標志圖像的特征,最后再利用一個全連接的網(wǎng)絡實現(xiàn)交通標志的識別。實驗結果表明,該方法利用卷積神經(jīng)網(wǎng)絡的深度學習能力,自動地提取交通標志的特征,避免了傳統(tǒng)的人工特征提取,有效地提高了交通標志識別的效率,具有良好的泛化能力和適應范圍。
關鍵詞 :交通標志;識別;卷積神經(jīng)網(wǎng)絡;深度學習
中圖分類號:TN911.73?34;TP391.41 文獻標識碼:A 文章編號:1004?373X(2015)13?0101?06
收稿日期:2015?01?09
基金項目:國家自然科學基金面上項目(61371114)
0 引言
隨著智能汽車的發(fā)展,道路交通標志的自動識別[1?3]作為智能汽車的基本技術之一,受到人們的高度關注。道路交通標志識別主要包括兩個基本環(huán)節(jié):首先是交通標志的檢測,包括交通標志的定位、提取及必要的預處理;其次是交通標志的識別,包括交通標志的特征提取和分類。
如今,交通標志的識別方法大多數(shù)都采用人工智能技術,主要有下述兩類形式[4]。一種是采用“人工特征+機器學習”的識別方法,如基于淺層神經(jīng)網(wǎng)絡、支持向量機的特征識別等。在這種方法中,主要依靠先驗知識,人工設計特征,機器學習模型僅負責特征的分類或識別,因此特征設計的好壞直接影響到整個系統(tǒng)性能的性能,而要發(fā)現(xiàn)一個好的特征,則依賴于研究人員對待解決的問題的深入理解。另一種形式是近幾年發(fā)展起來的深度學習模型[5],如基于限制波爾茲曼機和基于自編碼器的深度學習模型以及卷積神經(jīng)網(wǎng)絡等。在這種方法中,無需構造任何的人工特征,而是直接將圖像的像素作為輸入,通過構建含有多個隱層的機器學習模型,模擬人腦認知的多層結構,逐層地進行信息特征抽取,最終形成更具推廣性和表達力的特征,從而提升識別的準確性。
卷積神經(jīng)網(wǎng)絡作為深度學習模型之一,是一種多層的監(jiān)督學習神經(jīng)網(wǎng)絡,它利用一系列的卷積層、池化層以及一個全連接輸出層構建一個多層的網(wǎng)絡,來模仿人腦感知視覺信號的逐層處理機制,以實現(xiàn)視覺特征信號的自動提取與識別。本文將深層卷積神經(jīng)網(wǎng)絡應用于道路交通標志的識別,通過構建一個由二維卷積和池化處理交替組成的6層網(wǎng)絡來逐層地提取交通標志圖像的特征,所形成的特征矢量由一個全連接輸出層來實現(xiàn)特征的分類和識別。實驗中將加入高斯噪聲、經(jīng)過位移、縮放和旋轉處理的交通標志圖像以及實際道路采集交通標志圖像分別構成訓練集和測試集,實驗結果表明,本文所采用的方法具有良好的識別率和魯棒性。
1 卷積神經(jīng)網(wǎng)絡的基本結構及原理
1.1 深度學習
神經(jīng)科學研究表明,哺乳動物大腦皮層對信號的處理沒有一個顯示的過程[5],而是通過信號在大腦皮層復雜的層次結構中的遞進傳播,逐層地對信號進行提取和表述,最終達到感知世界的目的。這些研究成果促進了深度學習這一新興研究領域的迅速發(fā)展。
深度學習[4,6?7]的目的就是試圖模仿人腦感知視覺信號的機制,通過構建含有多個隱層的多層網(wǎng)絡來逐層地對信號特征進行新的提取和空間變換,以自動學習到更加有效的特征表述,最終實現(xiàn)視覺功能。目前深度學習已成功地應用到語音識別、圖像識別和語言處理等領域。在不同學習框架下構建的深度學習結構是不同的,如卷積神經(jīng)網(wǎng)絡就是一種深度的監(jiān)督學習下的機器學習模型。
1.2 卷積神經(jīng)網(wǎng)絡的基本結構及原理
卷積神經(jīng)網(wǎng)絡受視覺系統(tǒng)的結構啟發(fā)而產(chǎn)生,第一個卷積神經(jīng)網(wǎng)絡計算模型是在Fukushima 的神經(jīng)認知機中提出的[8],基于神經(jīng)元之間的局部連接和分層組織圖像轉換,將有相同參數(shù)的神經(jīng)元應用于前一層神經(jīng)網(wǎng)絡的不同位置,得到一種平移不變神經(jīng)網(wǎng)絡結構形式。后來,LeCun 等人在該思想的基礎上,用誤差梯度設計并訓練卷積神經(jīng)網(wǎng)絡[9?10],在一些模式識別任務上得到優(yōu)越的性能。
卷積神經(jīng)網(wǎng)絡本質上是一種有監(jiān)督的深度學習算法,無需事先知道輸入與輸出之間精確的數(shù)學表達式,只要用已知的模式對卷積神經(jīng)網(wǎng)絡加以訓練,就可以學習到輸入與輸出之間的一種多層的非線性關系,這是非深度學習算法不能做到的。卷積神經(jīng)網(wǎng)絡的基本結構是由一系列的卷積和池化層以及一個全連接的輸出層組成,可以采用梯度下降法極小化誤差函數(shù)對網(wǎng)絡中的權值和閾值參數(shù)逐層反向調節(jié),以得到網(wǎng)絡權值和閾值的最優(yōu)解,并可以通過增加迭代次數(shù)來提高網(wǎng)絡訓練的精度。
1.2.1 前向傳播
在卷積神經(jīng)網(wǎng)絡的前向傳播中,輸入的原始圖像經(jīng)過逐層的卷積和池化處理后,提取出若干特征子圖并轉換成一維特征矢量,最后由全連接的輸出層進行分類識別。
在卷積層中,每個卷積層都可以表示為對前一層輸入圖像的二維卷積和非線性激勵函數(shù),其表達式可用式(1)表示:
式中:Yj 表示輸出層中第j 個輸出;Y l + 1i 是前一層(l + 1層)
的輸出特征(全連接的特征向量);n 是輸出特征向量的長度;Wij 表示輸出層的權值,連接輸入i 和輸出j ;bj表示輸出層第j 個輸出的閾值;f (?) 是輸出層的非線性
1.2.2 反向傳播
在反向傳播過程中,卷積神經(jīng)網(wǎng)絡的訓練方法采用類似于BP神經(jīng)網(wǎng)絡的梯度最速下降法,即按極小化誤差的方法反向傳播調整權值和閾值。網(wǎng)絡反向傳播回來的誤差是每個神經(jīng)元的基的靈敏度[12],也就是誤差對基的變化率,即導數(shù)。下面將分別求出輸出層、池采樣層和卷積層的神經(jīng)元的靈敏度。
(1)輸出層的靈敏度
對于誤差函數(shù)式(6)來說,輸出層神經(jīng)元的靈敏度可表示為:
在前向傳播過程中,得到網(wǎng)絡的實際輸出,進而求出實際輸出與目標輸出之間的誤差;在反向傳播過程中,利用誤差反向傳播,采用式(17)~式(20)來調整網(wǎng)絡的權值和閾值,極小化誤差;這樣,前向傳播和反向傳播兩個過程反復交替,直到達到收斂的要求為止。
2 深層卷積神經(jīng)網(wǎng)絡的交通標志識別方法
2.1 應用原理
交通標志是一種人為設計的具有特殊顏色(如紅、黃、白、藍、黑等)和特殊形狀或圖形的公共標志。我國的交通標志主要有警告、禁令、指示和指路等類型,一般采用顏色來區(qū)分不同的類型,用形狀或圖形來標示具體的信息。從交通標志設計的角度來看,屬于不同類型(不同顏色)的交通標志在形狀或圖形上有較大的差異;屬于相同類型(相同顏色)的標志中同類的指示信息標志在形狀或圖形上比較接近,如警告標志中的平面交叉路口標志等。因此,從機器視覺的角度來分析,同類型中同類指示信息的標志之間會比不同類型的標志之間更易引起識別錯誤。換句話說,相比于顏色,形狀或圖形是正確識別交通標志的關鍵因素。
因此,在應用卷積神經(jīng)網(wǎng)絡識別交通標志時,從提高算法效率和降低錯誤率綜合考慮,將交通標志轉換為灰度圖像并作二值化處理后作為卷積神經(jīng)網(wǎng)絡的輸入圖像信息。圖2給出了應用卷積神經(jīng)網(wǎng)絡識別交通標志的原理圖。該網(wǎng)絡采用了6層交替的卷積層和池采樣層來逐層提取交通標志的特征,形成的特征矢量由一個全連接的輸出層進行識別。圖中:W1i(i=1,2,…,m1),W1(j j=1,2,…,m2),…,W1k(k=1,2,…,m(n?1))分別表示卷積層L1,L3,…,Ln - 1 的卷積核;Input表示輸入的交通標志圖像;
Pool表示每個池采樣層的采樣池;map表示逐層提取的特征子圖;Y 是最終的全連接輸出。
交通標志識別的判別準則為:對于輸入交通標志圖像Input,網(wǎng)絡的輸出矢量Y = [y1,y2 ,…,yC ],有yj = Max{y1,y2 ,…,yC},則Input ∈ j,即判定輸入的交通標志圖像Input為第j 類交通標志。
2.2 交通標志識別的基本步驟
深層神經(jīng)網(wǎng)絡識別交通標志主要包括交通標志的訓練與識別,所以將交通標志識別歸納為以下4個步驟:(1) 圖像預處理:利用公式Gray= 0.299R +0.587G + 0.114B 將彩色交通標志圖像轉換為灰度圖像,再利用鄰近插值法將交通標志圖像規(guī)格化,最后利用最大類間方差將交通標志圖像二值化。
(2)網(wǎng)絡權值和閾值的初始化:利用隨機分布函數(shù)將權值W 初始化為-1~1之間的隨機數(shù);而將閾值b 初始化為0。
(3)網(wǎng)絡的訓練:利用經(jīng)過預處理的交通標志圖像構成訓練集,對卷積神經(jīng)網(wǎng)絡進行訓練,通過網(wǎng)絡前向傳播和反向傳播的反復交替處理,直到滿足識別收斂條件或達到要求的訓練次數(shù)為止。
(4)交通標志的識別:將實際采集的交通標志圖像經(jīng)過預處理后,送入訓練好的卷積神經(jīng)網(wǎng)絡中進行交通標志特征的提取,然后通過一個全連接的網(wǎng)絡進行特征分類與識別,得到識別結果。
3 實驗結果與分析
實驗主要選取了我國道路交通標志的警告標志、指示標志和禁令標志三類中較常見的50幅圖像??紤]到在實際道路中采集到的交通標志圖像會含有噪聲和出現(xiàn)幾何失真以及背景干擾等現(xiàn)象,因此在構造網(wǎng)絡訓練集時,除了理想的交通標志以外,還增加了加入高斯噪聲、經(jīng)過位移、旋轉和縮放處理和實際采集到的交通標志圖像,因此最終的訓練樣本為72個。其中,加入的高斯噪聲為均值為0,方差分別為0.1,0.2,0.3,圖像的位移、旋轉、縮放的參數(shù)分別隨機的分布在±10,±5°,0.9~1.1的范圍內。圖3給出了訓練集中的交通標志圖像的示例。圖4是在實際道路中采集的交通標志圖像構成的測試集的示例。
在實驗中構造了一個輸入為48×48個神經(jīng)元、輸出為50 個神經(jīng)元的9 層網(wǎng)絡。網(wǎng)絡的輸入是像素為48 × 48 的規(guī)格化的交通標志圖像,輸出對應于上述的50種交通標志的判別結果。網(wǎng)絡的激活函數(shù)采用S型函數(shù),如式(2)所示,其輸出范圍限制在0~1之間。
圖6是交通標志的訓練總誤差EN 曲線。在訓練開始的1 500次,誤差能迅速地下降,在迭代2 000次以后是一個平穩(wěn)的收斂過程,當?shù)?0萬次時,總誤差EN可以達到0.188 2。
在交通標志的測試實驗中,為了全面檢驗卷積神經(jīng)網(wǎng)絡的識別性能,分別針對理想的交通標志,加入高斯噪聲、經(jīng)過位移、旋轉和比例縮放以及采集的交通標志圖像進行實驗,將以上測試樣本分別送入到網(wǎng)絡中識別,表2給出了測試實驗結果。
綜合分析上述實驗結果,可以得到以下結論:(1)在卷積神經(jīng)網(wǎng)絡的訓練學習過程中,整個網(wǎng)絡的誤差曲線快速平穩(wěn)的下降,體現(xiàn)出卷積神經(jīng)網(wǎng)絡的訓練學習具有良好的收斂性。
(2)經(jīng)逐層卷積和池采樣所提取的特征具有比例縮放和旋轉不變性,因此對于旋轉和比例縮放后的交通標志能達到100%的識別率。
(3)與傳統(tǒng)的BP網(wǎng)絡識別方法[11]相比較,卷積神經(jīng)網(wǎng)絡能夠達到更深的學習深度,即在交通標志識別時能夠得到更高的所屬類別概率(更接近于1),識別效果更好。
(4)卷積神經(jīng)網(wǎng)絡對實際采集的交通標志圖像的識別率尚不能達到令人滿意的結果,主要原因是實際道路中采集的交通標志圖像中存在著較嚴重的背景干擾,解決的辦法是增加實際采集的交通標志訓練樣本數(shù),通過網(wǎng)絡的深度學習,提高網(wǎng)絡的識別率和魯棒性。
4 結論
本文將深層卷積神經(jīng)網(wǎng)絡應用于道路交通標志的識別,利用卷積神經(jīng)網(wǎng)絡的深層結構來模仿人腦感知視覺信號的機制,自動地提取交通標志圖像的視覺特征并進行分類識別。實驗表明,應用深層卷積神經(jīng)網(wǎng)絡識別交通標志取得了良好的識別效果。
在具體實現(xiàn)中,從我國交通標志的設計特點考慮,本文將經(jīng)過預處理二值化的圖像作為網(wǎng)絡的輸入,主要是利用了交通標志的形狀信息,而基本略去了顏色信息,其優(yōu)點是在保證識別率的基礎上,可以簡化網(wǎng)絡的結構,降低網(wǎng)絡的計算量。在實際道路交通標志識別中,將形狀信息和顏色信息相結合,以進一步提高識別率和對道路環(huán)境的魯棒性,是值得進一步研究的內容。
此外,本文的研究沒有涉及到道路交通標志的動態(tài)檢測,這也是今后可以進一步研究的內容。
參考文獻
[1] 劉平華,李建民,胡曉林,等.動態(tài)場景下的交通標識檢測與識別研究進展[J].中國圖象圖形學報,2013,18(5):493?503.
[2] SAHA S K,DULAL C M,BHUIYAN A A. Neural networkbased sign recognition [J]. International Journal of ComputerApplication,2012,50(10):35?41.
[3] STALLKAMP J,SCHLIOSING M,SALMENA J,et al. Man vs.computer:benchmarking machine learning algorithms for traf?fic sign recognition [J]. Neural Network,2012,32(2):323?332.
[4] 中國計算機學會.深度學習:推進人工智能夢想[EB/OL].[2013?06?10].http://ccg.org.cn.
[5] 鄭胤,陳權崎,章毓晉.深度學習及其在目標和行為識別中的新進展[J].中國圖象圖形學報,2014,19(2):175?184.
[6] FUKUSHIMA K. Neocognition:a self ? organizing neural net?work model for a mechanism of pattern recognition unaffectedby shift in position [J]. Biological Cybernetics,1980,36(4):193?202.
[7] LECUN Y,BOTTOU L,BENGIO Y,et al. Gradient ? basedlearning applied to document recognition [J]. IEEE Journal andMagazines,1989,86(11):2278?2324.
[8] LECUN Y,BOTTOU L,BENGIO Y,et al. Backpropagationapplied to handwritten zip code recognition [J]. Neural Compu?tation,1989,1(4):541?551.
[9] CIRESAN D,MEIER U,MAsci J,et al. Multi?column deepneural network for traffic sign classification [J]. Neural Net?works,2012,32(2):333?338.
[10] NAGI J,DUCATELLE F,CARO D,et al. Max?pooling con?volution neural network for vision?based hand gesture recogni?tion [C]// 2011 IEEE International Conference on Signal andImage Processing Application. Kuala Lumpur:IEEE,2011,342?347.
[11] 楊斐,王坤明,馬欣,等.應用BP神經(jīng)網(wǎng)絡分類器識別交通標志[J].計算機工程,2003,29(10):120?121.
[12] BUVRIE J. Notes on convolutional neural networks [EB/OL].[2006?11?12]. http://cogprints.org/5869/.
[13] 周開利,康耀紅.神經(jīng)網(wǎng)絡模型及其Matlab 仿真設計[M].北京:清華大學出版社,2005.
[14] 孫志軍,薛磊,許陽明,等.深度學習研究綜述[J].計算機應用研究,2012,29(8):2806?2810.
[15] 劉建偉,劉媛,羅雄麟.深度學習研究進展[J].計算機應用研究,2014(7):1921?1930.
篇2
關鍵詞:人工智能 機器學習 機器人情感獲得 發(fā)展綜述
中圖分類號:TP18 文獻標識碼:A 文章編號:1003-9082 (2017) 04-0234-01
引言
人類自從工業(yè)革命結束之后,就已然開始了對人工智能的探索,究其本質,實際上就是對人的思維進行模仿,以此代替人類工作。人工智能的探索最早可以追溯到圖靈時期,那時圖靈就希望未來的智能系統(tǒng)能夠像人一樣思考。在20世紀五十年代,人工智能被首次確定為一個新興的學科,并吸引了大批的學者投入到該領域的研究當中。經(jīng)過長時間的探索和嘗試,人工智能的許多重要基本理論已經(jīng)形成,如模式識別、特征表示與推理、機器學習的相關理論和算法等等。進入二十一世紀以來,隨著深度學習與卷積神經(jīng)網(wǎng)絡的發(fā)展,人工智能再一次成為研究熱點。人工智能技術與基因過程、納米科學并列為二十一世紀的三大尖端技術, 并且人工智能涉及的學科多,社會應用廣泛,對其原理和本質的理解也更為復雜。 一、人工智能的發(fā)展歷程
回顧人工智能的產(chǎn)生與發(fā)展過程 ,可以將其分為:初期形成階段,綜合發(fā)展階段和應用階段。
1.初期形成階段
人工智能這一思想最早的提出是基于對人腦神經(jīng)元模型的抽象。其早期工作被認為是由美國的神經(jīng)學家和控制論學者 Warren McCulloch與Walter Pitts共同完成的。在1951年,兩名普林斯頓大學的研究生制造出了第一臺人工神經(jīng)元計算機。而其真正作為一個新的概念被提出是在1956年舉行的達茅斯會議上。由麥卡錫提議并正式采用了“人工智能”(Artificial Intelligence)礱枋穌庖謊芯咳綰斡沒器來模擬人類智能的新興學科。1969年的國際人工智能聯(lián)合會議標志著人工智能得到了國際的認可。至此,人工智能這一概念初步形成,也逐漸吸引了從事數(shù)學、生物、計算機、神經(jīng)科學等相關學科的學者參與該領域的研究。
2.綜合發(fā)展階段
1.7 7年, 費根鮑姆在第五屆國際人工智能聯(lián)合會議上正式提出了“知識工程”這一概念。而后其對應的專家系統(tǒng)得到發(fā)展,許多智能系統(tǒng)紛紛被推出,并應用到了人類生活的方方面面。20世紀80年代以來,專家系統(tǒng)逐步向多技術、多方法的綜合集成與多學科、多領域的綜合應用型發(fā)展。大型專家系統(tǒng)開發(fā)采用了多種人工智能語言、多種知識表示方法、多種推理機制和多種控制策略相結合的方式, 并開始運用各種專家系統(tǒng)外殼、專家系統(tǒng)開發(fā)工具和專家系統(tǒng)開發(fā)環(huán)境等等。在專家系統(tǒng)的發(fā)展過程中,人工智能得到了較為系統(tǒng)和全面的綜合發(fā)展,并能夠在一些具體的任務中接近甚至超過人類專家的水平。
3.應用階段
進入二十一世紀以后,由于深度人工神經(jīng)網(wǎng)絡的提出,并在圖像分類與識別的任務上遠遠超過了傳統(tǒng)的方法,人工智能掀起了前所未有的。2006年,由加拿大多倫多大學的Geoffery Hinton及其學生在《Science》雜志上發(fā)表文章,其中首次提到了深度學習這一思想,實現(xiàn)對數(shù)據(jù)的分級表達,降低了經(jīng)典神經(jīng)網(wǎng)絡的訓練難度。并隨后提出了如深度卷積神經(jīng)網(wǎng)絡(Convolutional Neural Network, CNN),以及區(qū)域卷積神經(jīng)網(wǎng)絡(Region-based Convolutional Neural Network, R-CNN),等等新的網(wǎng)絡訓練結構,使得訓練和測試的效率得到大幅提升,識別準確率也顯著提高。
二、人工智能核心技術
人工智能由于其涉及的領域較多,內容復雜,因此在不同的應用場景涉及到許多核心技術,這其中如專家系統(tǒng)、機器學習、模式識別、人工神經(jīng)網(wǎng)絡等是最重要也是發(fā)展較為完善的幾個核心技術。
1.專家系統(tǒng)
專家系統(tǒng)是一類具有專門知識和經(jīng)驗的計算機智能程序系統(tǒng),通過對人類專家的問題求解能力建模,采用人工智能中的知識表示和知識推理技術來模擬通常由專家才能解決的復雜問題,達到具有與專家同等解決問題能力的水平。對專家系統(tǒng)的研究,是人工智能中開展得較為全面、系統(tǒng)且已經(jīng)取得廣泛應用的技術。許多成熟而先進的專家系統(tǒng)已經(jīng)被應用在如醫(yī)療診斷、地質勘測、文化教育等方面。
2.機器學習
機器學習是一個讓計算機在非精確編程下進行活動的科學,也就是機器自己獲取知識。起初,機器學習被大量應用在圖像識別等學習任務中,后來,機器學習不再限于識別字符、圖像中的某個目標,而是將其應用到機器人、基因數(shù)據(jù)的分析甚至是金融市場的預測中。在機器學習的發(fā)展過程中,先后誕生了如凸優(yōu)化、核方法、支持向量機、Boosting算法等等一系列經(jīng)典的機器學習方法和理論。機器學習也是人工智能研究中最為重要的核心方向。
3.模式識別
模式識別是研究如何使機器具有感知能力 ,主要研究圖像和語音等的識別。其經(jīng)典算法包括如k-means,主成分分析(PCA),貝葉斯分類器等等。在日常生活各方面以及軍事上都有廣大的用途。近年來迅速發(fā)展起來應用模糊數(shù)學模式、人工神經(jīng)網(wǎng)絡模式的方法逐漸取代傳統(tǒng)的基于統(tǒng)計學習的識別方法。圖形識別方面例如識別各種印刷體和某些手寫體文字,識別指紋、癌細胞等技術已經(jīng)進入實際應用。語音識別主要研究各種語音信號的分類,和自然語言理解等等。模式識別技術是人工智能的一大應用領域,其非常熱門的如人臉識別、手勢識別等等對人們的生活有著十分直接的影響。
4.人工神經(jīng)網(wǎng)絡
人工神經(jīng)網(wǎng)絡是在研究人腦的結構中得到啟發(fā), 試圖用大量的處理單元模仿人腦神經(jīng)系統(tǒng)工程結構和工作機理。而近年來發(fā)展的深度卷積神經(jīng)網(wǎng)絡(Convolutional neural networks, CNNs)具有更復雜的網(wǎng)絡結構,與經(jīng)典的機器學習算法相比在大數(shù)據(jù)的訓練下有著更強的特征學習和表達能力。含有多個隱含層的神經(jīng)網(wǎng)絡能夠對輸入原始數(shù)據(jù)有更抽象喝更本質的表述,從而有利于解決特征可視化以及分類問題。另外,通過實現(xiàn)“逐層初始化”這一方法,實現(xiàn)對輸入數(shù)據(jù)的分級表達,可以有效降低神經(jīng)網(wǎng)絡的訓練難度。目前的神經(jīng)網(wǎng)絡在圖像識別任務中取得了十分明顯的進展,基于CNN的圖像識別技術也一直是學術界與工業(yè)界一致追捧的熱點。
三、機器人情感獲得
1.智能C器人現(xiàn)狀
目前智能機器人的研究還主要基于智能控制技術,通過預先定義好的機器人行動規(guī)則,編程實現(xiàn)復雜的自動控制,完成機器人的移動過程。而人類進行動作、行為的學習主要是通過模仿及與環(huán)境的交互。從這個意義上說,目前智能機器人還不具有類腦的多模態(tài)感知及基于感知信息的類腦自主決策能力。在運動機制方面,目前幾乎所有的智能機器人都不具備類人的外周神經(jīng)系統(tǒng),其靈活性和自適應性與人類運動系統(tǒng)還具有較大差距。
2.機器人情感獲得的可能性
人腦是在與外界永不停息的交互中,在高度發(fā)達的神經(jīng)系統(tǒng)的處理下獲得情感。智能機器人在不斷的機器學習和大數(shù)據(jù)處理中,中樞處理系統(tǒng)不斷地自我更新、升級,便具備了獲得情感的可能性及幾率。不斷地更新、升級的過程類似于生物的進化歷程,也就是說,智能機器人有充分的可能性獲得與人類同等豐富的情感世界。
3.機器人獲得情感的利弊
機器人獲得情感在理論可行的情況下,伴之而來的利弊則眾說紛紜。一方面,擁有豐富情感世界的機器人可以帶來更多人性化的服務,人機合作也可進行地更加深入,可以為人類帶來更為逼真的體驗和享受。人類或可與智能機器人攜手共創(chuàng)一個和諧世界。但是另一方面,在機器人獲得情感時,機器人是否能徹底貫徹人類命令及協(xié)議的擔憂也迎面而來。
4.規(guī)避機器人情感獲得的風險
規(guī)避智能機器人獲得情感的風險應預備強制措施。首先要設計完備的智能機器人情感協(xié)議,將威脅泯滅于未然。其次,應控制智能機器人的能源獲得,以限制其自主活動的能力,杜絕其建立獨立體系的可能。最后,要掌控核心武器,必要時強行停止運行、回收、甚至銷毀智能機器人。
三、總結
本文梳理了人工智能的發(fā)展歷程與核心技術,可以毋庸置疑地說,人工智能具有極其廣闊的應用前景,但也伴隨著極大的風險?;仡櫰浒l(fā)展歷程,我們有理由充分相信,在未來人工智能的技術會不斷完善,難題會被攻克。作為世界上最熱門的領域之一,在合理有效規(guī)避其風險的同時,獲得情感的智能機器人會造福人類,并極大地幫助人們的社會生活。
參考文獻
[1]韓曄彤.人工智能技術發(fā)展及應用研究綜述[J].電子制作,2016,(12):95.
[2]曾毅,劉成林,譚鐵牛.類腦智能研究的回顧與展望[J].計算機學報,2016,(01):212-222.
[3]張越.人工智能綜述:讓機器像人類一樣思考
篇3
Abstract: Classifier selection is the key factor for data classification. K-mean classifier, ISODATA classifier and SOFM neural network classifier are compared in computational complexity and classification performance. The experiments show that three kinds of classifiers cost equal time on the same image, but the self organizing feature map neural network classifier is optimal in classification performance.
關鍵詞: K-均值分類器;ISODATA分類器;SOFM神經(jīng)網(wǎng)絡分類器
Key words: K-mean classifier;ISODATA classifier;SOFM neural network classifier
中圖分類號:TP7 文獻標識碼:A 文章編號:1006-4311(2013)04-0182-02
0 引言
K-均值分類器、迭代自組織數(shù)據(jù)分類器和自組織特征映射神經(jīng)網(wǎng)絡分類器在遙感圖像分類方面應用廣泛。王曉軍等人將非監(jiān)督K-均值分類用在合成孔徑雷達SAR圖像各極化通道上進行參數(shù)估計[1]。包健等人將K-均值算法用于高光譜遙感影像的非監(jiān)督分類中,具有較強的實用性[2]。賈明明等人選取對氣候變化敏感的澳大利亞作為研究區(qū)。利用了ISODATA分類結果、NDVI閾值及其時間序列主成分分析特征量對研究區(qū)土地利用/覆被進行分類[3]。李正金等人進行了基于TM衛(wèi)星遙感技術和小麥估產(chǎn)模型的冬小麥產(chǎn)量監(jiān)測研究,采用優(yōu)化的ISODATA分類方法,結合人機交互式判讀解譯作物信息[4]。夏浩銘等提取地物在空間上的聯(lián)系,利用神經(jīng)網(wǎng)絡分類,獲得較好的地物分類精度[5]。文章闡述了三種分類器的工作原理,分析了三種分類器的計算復雜度和分類效果。
1 K-均值分類器
基本K-均值思想很簡單。首先,選擇k個初始聚類中心,其中k是目標分類數(shù)目。每個樣本按照距離函數(shù)計算與所有聚類中心的距離,樣本加入到與之距離最短的聚類中心所在分組。新樣本加入后,更新該分組的聚類中心。重復訓練和更新,直到每類的聚類中心不發(fā)生變化為止。當分類數(shù)目已知時,利用K-均值分類方法能夠方便地計算出樣本聚類中心。但是在實際應用中,分類數(shù)目可能無法估算,這在一定程度上限制了這種方法的應用。
K-均值算法特點是每次調整樣本后,修改一次聚合中心和準則值,當考察完n個樣本后,一次迭代運算完成,新的聚合中心和準則值也計算出來。在迭代過程中,準則值逐漸減小,直到它的最小值為止。如果在一次迭代前后,準則值沒有變化,說明算法已經(jīng)收斂。
2 ISODATA分類器
ISODATA算法通過對樣本迭代來確定聚類的中心。每一次迭代時,首先是在不改變類別數(shù)目的情況下改變分類。然后將樣本平均矢量之差小于某一閾值的類別合并起來,根據(jù)樣本協(xié)方差矩陣來決定其分裂與否。主要環(huán)節(jié)是聚類、集群分裂和集群合并等處理。
ISODATA分類算法最優(yōu)迭代次數(shù)很難設定,一般遙感圖像的數(shù)據(jù)量大,若迭代誤差取值較小,分類也很難實現(xiàn)。沈照慶等人[6]以某次迭代中“合并”和“分裂”都為零為求最優(yōu)分類數(shù)的迭代條件,而不是預先設定迭代次數(shù);取最大和最小隸屬度取代每一個隸屬度為比對特征值,提高了分類速度和精度;利用等效轉換研究隸屬度矩陣的迭代誤差變化規(guī)律,得出變化速度趨于穩(wěn)定時為求解最優(yōu)隸屬度矩陣的智能迭代控制,減少人為事先干預。
3 SOFM神經(jīng)網(wǎng)絡分類器
神經(jīng)網(wǎng)絡由被稱作神經(jīng)元的相互連接處理單元組成。自組織特征映射(Self-Organizing Feature Map,簡稱SOFM)網(wǎng)絡模擬大腦的神經(jīng)系統(tǒng)自組織特征映射的功能,在學習過程中不需要指導,進行自組織學習。SOFM網(wǎng)絡可用于圖像壓縮、語言識別、機器學習和優(yōu)化問題等。
訓練SOFM網(wǎng)絡時首先初始化連接權重為小的隨機數(shù),訓練開始后,輸入向量送入網(wǎng)絡。每輸入一個樣本矢量,各神經(jīng)元的加權和中必然有一個最大值,經(jīng)過側反饋作用,在最大值點周圍連接權重自適應調節(jié)。SOFM網(wǎng)絡已經(jīng)證明,網(wǎng)絡通過反復學習輸入模式,可使連接加權矢量空間分布密度與輸入模式的概率分布趨于一致,也就是連接權矢量空間分布能反應輸入模式的統(tǒng)計特征。訓練好的網(wǎng)絡在競爭層產(chǎn)生了一個或幾個最大輸出,它們在競爭層中的位置反映了輸入向量在自身空間的特征。
4 實驗結果分析
實驗選取2003年青島市一景SPOT5圖像作為數(shù)據(jù)源,截取城鄉(xiāng)結合部某地作為實驗區(qū)域,實驗區(qū)域在紅波波段顯示為圖1(a)。對于實驗區(qū)的遙感圖像分別采用上述分類器進行地物分類實驗。
用ENVI 4.3的分類功能根據(jù)K-均值算法分類。參數(shù)設置為:分類數(shù)量15(一般為最終輸出分類數(shù)的2-3倍),最大迭代次數(shù)為40(默認是15),其它參數(shù)取默認值。K-均值關注的是不同波段的灰度信息,系統(tǒng)自動分類時,得到的分類數(shù)目為八類,結果如圖1(b)所示。從分類結果上可以看出,K-均值分類算法對水體的分類效果較好,水體用紅色表示,不但能分出主河道而且顯示出在耕地中有一條灌溉溝渠。綠地在分類圖中用綠色表示,圖上中部的綠地分類正確,但在河道附近,部分耕地錯分為綠地了。耕地被分為藍色、黃色和暗綠色三類。反射系數(shù)高的南北方向道路和屋頂較亮的廠房被歸為一類,東西走向的道路兩邊毛刺現(xiàn)象嚴重。建筑物錯分率也較高。
在ENVI 4.3環(huán)境下,利用ISODATA算法分類。參數(shù)設置為:類別數(shù)范圍[5-15](一般最小數(shù)量不能小于最終分類數(shù),最大數(shù)量為最終分類數(shù)量的2-3倍),最大迭代次數(shù)為40(默認是15),其它參數(shù)取默認值,結果見圖1(c)。從分類結果上看,ISODATA分類算法對灰度值一致性好的水體分類效果較好,水體用紅色表示。能區(qū)分出主河道而且顯示出在耕地中有一條灌溉溝渠,但將圖像下方,靠近南北走向的道路的一間面積較大的廠房錯分為水體。綠地在分類圖中用綠色表示,圖上中部的綠地分類正確較好,但在河道附近,相當一部分耕地錯分為綠地了。耕地分類效果表較好,但有部分錯分為綠地。東西走向的道路線條比較連貫,兩邊有點毛刺現(xiàn)象,但不嚴重。的空地用粉紅色表示,居民區(qū)是暗綠色,部分工廠廠房的屋頂錯分為水體。
SOFM網(wǎng)絡利用MATLAB中的神經(jīng)網(wǎng)絡工具箱實現(xiàn)。設定SOFM網(wǎng)絡的輸入矢量各維的數(shù)據(jù)范圍是像素灰度在[1,32]之間,鄰域像素卷積[25,800]之間,學習率為0.9,距離函數(shù)是歐氏距離函數(shù),訓練步長是5000。輸入訓練樣本,每類500個,5類共2500個樣本,距離為5類,每類表征一種地物類型。網(wǎng)絡對類型的定義儲存在訓練網(wǎng)絡中。利用訓練好的網(wǎng)絡對實驗圖像所有像元進行分類。分類結果用灰度圖像表示,像素的顏色代表分類的類型,像素的位置對于測試圖像同位置的地物,如圖1(d)所示。白色表示道路,淺灰表示建筑物,灰色表示綠地,深灰表示耕地,黑色表示水體。從分類結果圖上看,縱橫貫穿郊區(qū)的主干道和樓區(qū)內的道路基本能夠正確分類。由于反射系數(shù)與道路相近,工廠廠房的屋頂也被錯分為道路。建筑物、耕地和綠地總體上分類正確。水體的分類結果令人滿意,主水道和灌溉的溝渠都能清楚地分出。分類器處理樣本圖像的時間接近,都是20分鐘左右。
5 總結
K-均值分類中耕地被分三類,道路兩邊毛刺現(xiàn)象嚴重,建筑物錯分率也較高,分類效果最差。SOFM網(wǎng)絡對道路、水體、耕地和綠地總體上分類正確,分類正確率最高。ISODATA分類對水體、耕地、道路分類基本正確,建筑物錯分較多。
參考文獻:
[1]王曉軍,王鶴磊,李連華,孟藏珍,馬寧.基于C均值分類的極化SAR圖像白化斑點濾波方法[J].系統(tǒng)工程與電子技術,
2008,30(12):2389-2392.
[2]包健,厲小潤.K均值算法實現(xiàn)遙感圖像的非監(jiān)督分類.機電工程,2008,25(3):77-80.
[3]賈明明,劉殿偉,宋開山,王宗明,姜廣甲,杜嘉,曾麗紅.基于MODIS時序數(shù)據(jù)的澳大利亞土地利用/覆被分類與驗證.遙感
技術與應用,2010,25(3):379-386.
[4]李正金,李衛(wèi)國,申雙.基于ISODATA法的冬小麥產(chǎn)量分級監(jiān)測預報.遙感應用,2009,8:30-32.
篇4
關鍵詞:水尺 檢測 圖像識別
中圖分類號:TP274 文獻標識碼:A 文章編號:1007-9416(2013)01-0114-02
1 引言
隨著航運技術的發(fā)展,船舶運輸越來越受到人們的關注。船舶的水尺計重作為一種科學的計重方法,具有一定的準確性,在國際上已廣泛應用,其計算結果可作為商品交接結算、理賠、計算運費和通關計稅的依據(jù)。其適用于價值較低,衡重困難的大宗散裝固體商品,例如煤炭、鐵礦石、水泥、糧食等商品的重量計算。水尺計重的優(yōu)點是省時、省力、省費用,能迅速計算出整船貨物的重量,但是計算過程較為復雜,影響計重結果的客觀因素較多,特別船舶刻度觀測水平是影響水尺準確性最重要因素。船舶吃水線的檢測目前主要依靠經(jīng)過長期訓練的觀察人員目測船舶的水尺標志而獲得船舶的實際吃水值,為了獲得較為精確的數(shù)值,需要觀察人員多次查看,以求得平均值。這種人眼目測船舶吃水線數(shù)值的方式,往往帶有主觀性,存在較大的局限性,例如:觀測不方便,受環(huán)境影響大,并且觀測存在一定危險。因此,本文提出采用Matlab7.0作為仿真環(huán)境,利用圖像處理技術,設計船舶吃水線自動檢測的算法來自動檢測船舶水尺刻度數(shù)值,可以克服人工目測所引起的一系列問題,完整的記錄整個觀測階段的吃水線位置,并使后續(xù)的數(shù)據(jù)處理成為可能。降低了系統(tǒng)復雜性,又提高了效率和準確度。
2 圖像識別技術的原理
近年來,拍攝設備性能的不斷完善,設備的分辨率能夠達到很精確的程度,圖片質量清晰度非常高,同時計算機體系結構和算法的快速發(fā)展,使得圖像處理的性能和運算速度得到了較大提高,這些都為吃水線的求取提供了可能。一幅圖像在計算機中可以定義為一個二維函數(shù)f(x,y),其中x和y是空間(平面)坐標,而在任何一對空間坐標(x,y)處的幅值f稱為該點處的灰度,當x,y和灰度值f是有限的離散數(shù)值時,我們稱該圖像為數(shù)值圖像,數(shù)字圖像處理就是借助計算機來處理上述這些數(shù)字圖像。數(shù)字圖像是由有限數(shù)量的元素組成的,每個元素都有一個特殊的位置和數(shù)值,要將一副圖像轉化為數(shù)字形式,就要求數(shù)字化x,y和灰度值f。在此基礎上,利用上述數(shù)值,設計相應的算法即可得到船舶水尺精確的刻度值。
3 船舶吃水線刻度檢測算法的設計
3.1 總體結構設計
本文利用Matlab7.0作為仿真環(huán)境,通過采集到的視頻圖像序列,首先設計計算法檢測出吃水線邊緣,找到吃水線的位置,然后對船幫上刻度字進行分割,并求出水平面距離所在刻度上邊緣的距離,利用BP神經(jīng)網(wǎng)絡對水尺刻度線進行識別,得到吃水線的數(shù)值。吃水線檢測算法的總流程圖如(圖1)所示:
3.2 船舶吃水線刻度檢測算法關鍵步驟的處理
3.2.1 圖像的灰度化和二值化處理
相比彩色圖像,灰度圖像的邊緣檢測較為方便和快捷,計算量小,所以先將獲取到的彩色圖像轉為灰度圖像。而圖像的二值化處理就是將圖像上的像素點的灰度值設置為0至255,將采樣后所得到的各像素的灰度值用矩陣表示,即灰度圖的量化。所有灰度值大于或者等于閥值的像素被判定為特殊物體,灰度值小于閥值的則表示為背景或者其他物體區(qū)域。通過將灰度值投影到曲線上,則可以獲得灰度值的分布特征。
3.2.2 選擇合適的邊緣檢測算法找到吃水線的邊緣
數(shù)字圖像的邊緣檢測是圖像分割,目標區(qū)域識別,區(qū)域形狀提取等圖像領域中十分重要的基礎,邊緣是圖像的最基本特征之一,它是利用周圍像素灰度有階躍變化或屋頂變化的像素的集合。邊緣檢測算法大致分為兩類:基于查找和基于零穿越的邊緣檢測。常用的邊緣檢測算法有:Roberts、Prewitt、Sobel、LOG、Canny算法等。
3.2.3 選擇合適的閥值對刻度字的分割
圖像分割是一種重要的圖像分析技術,在對圖像的研究和應用中,人們往往僅對圖像中的特定部分感興趣。為了識別和分析圖像中得目標,需要將它們從圖像中分離提取出來,在此基礎上才有可能進一步對目標進行測量和對圖像進行利用。而分割字符的思想就是利用刻度字區(qū)域黑色像素點比較多,比較集中,同時根據(jù)水尺標志的特點,每個字符之間有10cm的空隙間隔隔開,這樣得到的投影圖有幾個比較集中卻又有明顯分割的投影峰值群,通過設定特定的閥值來判定特定物體,通過這種方法將找出船幫上刻度字的左右邊界。
3.2.4 選擇BP神經(jīng)網(wǎng)絡對船幫處水尺字符進行識別
字符識別的主流技術有:統(tǒng)計決策法、人工智能法、模板匹配法和人工神經(jīng)元網(wǎng)絡法等。同在字符識別領域相對比較成熟的光學字符(OCR)識別、車牌識別相比,船幫處水尺刻度字符由于表面凹凸、油漆掉色或攝像時水面反光等情況造成的字符畸變。為了提高系統(tǒng)的抗干擾性和自適應性,本文計劃采用對噪聲干擾和形變有較好適應性的BP神經(jīng)網(wǎng)絡模型方式來進行識別。BP網(wǎng)絡是神經(jīng)網(wǎng)絡的一個分支,又稱誤差信號反饋網(wǎng)絡,是神經(jīng)網(wǎng)絡中使用最廣泛的一類。并嘗試通過改善收斂性,神經(jīng)元的個數(shù),提高系統(tǒng)的識別率。
3.3 Matlab軟件的使用
Matlab由美國的MathWorks公司出品,它的指令表達式與數(shù)學,工程中常用的形式十分相似。其典型的應用包括:(1)數(shù)學和計算;(2)算法開發(fā);(3)數(shù)據(jù)獲取;(4)建模、模擬和原型設計;(5)數(shù)據(jù)分析、研究和可視化;(6)科學和工程圖形;(7)應用開發(fā),包括圖像用戶界面的構建。MATLAB中補充了許多針對特殊應用的工具箱,圖像處理工具箱是一個MATLAB函數(shù)集合,能進行圖像的和、差等線性運算,以及卷積、相關、濾波等非線性運算,幾乎包括了常用的圖像處理操作的各種函數(shù),只需了解這些函數(shù)的使用方法,正確調用函數(shù)就可以實現(xiàn)常用的各種圖像處理的操作。MATLAB能支持包括:TIFF、BMP、JPEG等的圖形文件的格式,用它來解決圖像問題比用C,F(xiàn)ortran等語言完成相同的事情簡捷的多。因此利用此工具,我們可以方便地從各個方面對圖像的性質進行深入的研究。
本文所研究的內容是在靜態(tài)圖像上對吃水線進行檢測,其技術路線包括圖像的預處理,利用邊緣檢測算子對吃水線邊緣進行擬合,去除干擾,得到吃水線的位置。利用船舶刻度字的特點,對其進行分割,對分割出來的字符進行識別后,得到吃水線的數(shù)值。以上都可以通過Matlab調用不同的工具箱和函數(shù)來實現(xiàn)。
4 結語
由于經(jīng)濟利益,發(fā)貨人、收貨方和承運人都對貨物的重量非常重視,而且越來越精細、嚴格,如何準確計算船舶載重量成為亟待解決的問題。作為近年來快速發(fā)展起來的一個計算機學科,通過使用圖像處理和分析的手段,獲得水平面在圖像中的準確位置,既可以克服人工目測所引起的一系列問題,完整的記錄整個觀測階段的吃水線位置,使后續(xù)的數(shù)據(jù)處理成為可能,既降低了系統(tǒng)復雜性,又提高了效率和準確度。圖像處理的對象是一幅幅拍攝下的照片,其中的吃水線位置是固定的,這樣就為后續(xù)的處理和計算奠定了一個靜態(tài)的基礎,不會發(fā)生象人眼目測,由于景物晃動而產(chǎn)生的錯覺。同時,拍攝下的照片作為測量的記錄保存,可以滿足今后復核或是查對的要求。再次,利用圖像處理技術,可以大幅度降低對有經(jīng)驗觀測人員的依賴。因此利用圖像識別技術對船舶水尺測量具有廣泛的應用價值。
參考文獻
[1]SN/T 0187-93 進出口商品重量鑒定規(guī)程——水尺計重.
[2]陳德為,張培銘.轉動式交流接觸器動態(tài)過程分析與控制[J].福州大學學報:自然科學版,2008,36(1):95—99.
[3]陳德為,張培銘.采用高速攝像機的智能交流接觸器控制及其測試裝置的研制[M].電工電能新技術:2009,28(3):58-61,72.
[4]周廣程.圖像處理技術在船舶吃水自動檢測系統(tǒng)中的應用[D].南京:南京理工大學,2006.
篇5
關鍵詞:拉格朗日力學; 圖像預測; 圖像追蹤; 天氣雷達; 臨近預報
DOIDOI:10.11907/rjdk.162240
中圖分類號:TP317.4
文獻標識碼:A文章編號:1672-7800(2016)012-0001-04
0 引言
多普勒天氣雷達(以下簡稱雷達)是現(xiàn)代氣象業(yè)務研究及應用中不可或缺的重要工具,基于雷達回波及圖像的追蹤與外推是短時臨近預報的關鍵性技術,也是長期以來的難點問題。準確而及時的雷達外推預報,可以為局地龍卷風、雷暴、短時強降水等極端災害性天氣提供預警,以便做好防御措施,最大限度保障人民及生命財產(chǎn)安全。
近半個世紀以來,很多學者在基于雷達資料的預報領域作出了大量卓有成效的貢獻,并逐步形成了一系列較為通行的方法。例如,TREC算法通過逐區(qū)域尋求相鄰時刻雷達反射率的最大相關,跟蹤整個回波區(qū)域的移動,并且假設回波具有一致的移動方向[1]。CTREC算法則利用交叉相關分析,跟蹤反射率因子大于一定閾值區(qū)域的移動,進而推算回波的發(fā)展[2]。TITAN是由美國國家大氣研究中心(NCAR) 研發(fā)的一套風暴識別、跟蹤、分析和預報系統(tǒng),其利用雷達一次完整體掃所構成的三維結構數(shù)據(jù)對強回波中心進行識別追蹤[3-4]。SCIT算法則更加側重對雷暴單體的有效追蹤和預測[5-7]。近年來,又有一些學者試從圖形圖像學中的光流技術入手,通過分析雷達回波時序圖像中的光流場特征進行回波強度和位置的外推預測[8-11]。此外,還有基于神經(jīng)網(wǎng)絡、模式匹配等多種方法[12-14]。
總體來說,這些方法的共同之處是需要分析相鄰時刻雷達圖像(或基數(shù)據(jù))中區(qū)域的相似性,而該相似性的度量,如最大相關法,雖然可以計算出最匹配的位置,但匹配和外推結果往往表現(xiàn)出發(fā)散性或多個最優(yōu)解。并且,基于窗口平移的模板匹配算法無法適應區(qū)域圖像的旋轉和變形等情況。
為了克服相關性度量算法所遇到的問題,本文考慮對位移場的分析加以分層,也就是每個特征運動被認為是確定在相對粗糙的空間分辨率下的平穩(wěn)變化趨勢的總和,然后衍生為更高的空間分辨率下的小幅度局部修正,并對此過程進行多次迭代。對于位移場的分析,將充分考慮雷達回波所指示風暴的動力學特征,運用拉格朗日力學相關理論構建預測模型。該方法的研究意義在于進一步提高中小尺度、強對流天氣事件的預測能力,且相對于光流等一些大運算量算法,本方法運算規(guī)模更小,進而能夠更好地滿足短臨預報業(yè)務高時效性的要求。
1 理論與方法基礎
1.1 雷達回波外推預測
大量研究表明,合理的外推預測算法可以為降水、雷暴、冰雹等對流天氣的預報提供重要支撐[15-17]?;谕馔祁A報的一般性描述為:
其中,pt(x,y)表示任一位置的回波強度,U和V分別表示回波在水平和垂直方向上的偏移量,由U和V共同組成回波移動的速度矢量。g表示一個函數(shù),用來計算單位時間間隔后回波強度的變化。根據(jù)式(1),Δpt(x,y)反映了任一點(x, y) 在t 時刻回波強度的變化情況,U和V反映了回波移動的方向和速度。此外,函數(shù)g代表一個拉格朗日動力學過程,在此過程中雷達回波的強度是由其沿回波路徑移動時在拉格朗日坐標系統(tǒng)中的歷史變化推導出的,也就是用當前回波演變的趨勢預測回波未來的位置和強度。究其趨勢預測的方法,多年來諸多學者作出很多研究,本文主要從拉格朗日力學角度進行分析,提出一種雷達回波圖像追蹤預測的方法。
1.2 拉格朗日力學
拉格朗日力學是由Joseph Lagrange[18-19]最早提出的一種力學分析方法。由于該方法引用了廣義坐標的概念,使得對力學相關問題的研究更具普適性。
在雷達回波圖像預測研究中,如何準確得到回波運動矢量是預測需要解決的關鍵問題。在不考慮天氣系統(tǒng)的非線性變化時,拉格朗日力學模型能夠滿足構建回波發(fā)展演變過程的算法要求,式(1) 可以改寫為:
有研究表明,對整個回波圖像采用統(tǒng)一的U和V所構成的位移矢量,可適用于對大尺度天氣系統(tǒng)的預測分析,如對衛(wèi)星圖像的外推預測和云導風的分析[20]。但對于局地強對流天氣系統(tǒng),預測結果往往與實際偏差較大。因此,這也是本文將重點闡述解決的問題。
2 雷達圖像追蹤預測
2.1 基于拉格朗日力學的追蹤算法
在上述理論基礎上,根據(jù)大氣運動演變發(fā)展的規(guī)律及其在雷達回波圖像上的表征特點,構建基于拉格朗日力學的追蹤算法模型,如式(3) 所示。
該模型假定所預測的回波圖像是當前和過去若干個回波圖像以固定時間間隔而變化的函數(shù)。f2表征一個用于估測單位時間間隔前后回波圖像各相應網(wǎng)格點回波強度值變化率的函數(shù),即回波的演變趨勢。在不斷生消、發(fā)展的對流系統(tǒng)中,ΔP可以為正,也可以為負數(shù)。式(4)~式(6) 進一步表明了函數(shù)f1和f2,即回波移動矢量及回波強度的計算方法。
2.2 中心極值濾波
為了降低雷達雜波對位移矢量計算的不良影響,本節(jié)提出采用一種濾波器對雷達基數(shù)據(jù)進行濾波處理。其基本思想是:逐網(wǎng)格分析回波強度特征,如果某格點的值大于周邊最相鄰一圈(共8個網(wǎng)格)的最大值,或者該值小于周邊最相鄰一圈的最小值,則將當前網(wǎng)格點回波強度值用上述8個網(wǎng)格的最大值或最小值替代。
如圖1所示,位于當前中心點的數(shù)值39大于其最鄰近一圈8個網(wǎng)格的最大值。因此,使用數(shù)值23替換當前網(wǎng)格的39。
從圖像上看,該濾波方法可顯著降低圖像中的椒鹽噪聲,從實際效果上看,該方法可以有效過濾單點的雜波奇異值,較傳統(tǒng)的均值濾波和中值濾波更好地保留了回波細節(jié)[21-22],特別是回波中梯度變化較大的邊緣區(qū)域。
2.3 分層外推預測算法
由于天氣系統(tǒng)復雜多變,特別是尺度較小的局地強對流,其生命周期短的只有幾分鐘到幾十分鐘,由于其空間尺度小,生消速度快,因此,包括基于拉格朗日力學在內的各種線性關系外推算法,其預測準確性都存在一定的局限性。為了改善這一問題,本節(jié)提出采用分層的外推預測方法。該思想最早由Bellerby等 [20]提出,并研究應用于衛(wèi)星圖像的云頂平流場分析中。
該算法的關鍵流程為:先將當前雷達回波圖像逐級抽稀,降低圖像的分辨率,以模糊回波細節(jié),由此粗略估算出回波主體的移動趨勢;然后再反向逐級提高圖像分辨率,在較粗的移動趨勢基礎上,細化和訂正位移矢量的細節(jié)。從而產(chǎn)生一個在空間上連續(xù)和平滑的且不受模板邊界不連續(xù)性影響的矢量場。計算方法如式(7)所示:
對于每一級抽稀計算,都是將當前一級各網(wǎng)格點的回波強度值經(jīng)由公式(7)計算,并往復迭代。其中P表示某一點的回波強度,L和L-1代表抽稀的層級,在本文下述實驗中,采用的最高層級為4。
在計算兩個相鄰時刻圖像中回波的位移時,可以借鑒交叉相關法,計算方法如式(8),在每個選定的匹配窗口遍歷出最大相關矩陣的位置,從而輸出位移矢量。
式(8) 中,P和P’ 分別表示相鄰兩個時刻(如t-Δt與t)的回波,(x, y) 表示圖像中的某一點,X和Y表示匹配窗口的大小。再將兩幅回波圖像之間的網(wǎng)格還原或內插到其先前空間分辨率的兩倍,重復上述匹配。該迭代過程還考慮到了由非矩形網(wǎng)格代表的局部扭曲,結合這些局部扭曲,使外推預測算法能夠適應旋轉、擴展、縮小等回波圖像形態(tài)上的變化。如此插值和匹配計算,迭代直到網(wǎng)格分辨率達到原始雷達圖像分辨率。
3 實驗與結果分析
3.1 實驗數(shù)據(jù)說明
為檢驗所述方法的預測效果,本實驗數(shù)據(jù)使用2016年6月南京地區(qū)多普勒天氣雷達的基數(shù)據(jù)文件。該雷達使用VCP-21體掃模式,探測周期為6分鐘。實驗選用1.5°和2.4°仰角的基本折射率數(shù)值。為方便計算,實驗前將原始數(shù)據(jù)由極坐標系統(tǒng)轉換為平面直接坐標系統(tǒng),數(shù)據(jù)的圖像分辨率為920×920。為減少樣本數(shù)量,從全部7199個基數(shù)據(jù)文件中篩選出以230庫長為半徑,其覆蓋區(qū)域內具有大面積強回波的數(shù)據(jù)文件,共計880個。
3.2 實驗結果分析
為檢驗雷達回波圖像預測的準確性,使用與預測同一時刻的雷達實際探測數(shù)據(jù)作比對分析,計算過程采用交叉相關檢驗法。
首先以自然日為單位,統(tǒng)計逐日樣本數(shù)據(jù)中每份預測結果與實況交叉檢驗的相關系數(shù)的平均值,如圖2所示。
圖2中3種圖案標記分別表示預測6分鐘、30分鐘和60分鐘的檢驗結果,每個值代表當日所有樣本檢驗結果的平均值。橫坐標為2016年6月的逐個日期,縱坐標為相關系數(shù),其中橫坐標4、5、9、10等日期沒有標記圖案,原因是這些日期的當日為晴天或少云,體現(xiàn)在雷達上沒有強的大面積回波,因此沒有列入樣本數(shù)據(jù)進行分析。從圖2中還可以看出,本方法預測未來6分鐘的結果與實況相比,相關系數(shù)超過87%,平均達到93%以上,而隨著預測時效的延長,預測準確率逐步下降,在未來60分鐘的預測中,全月平均相關系數(shù)為70%左右。
進一步統(tǒng)計分析每次預測準確率的穩(wěn)定性。以6月19日全天樣本數(shù)據(jù)為例,統(tǒng)計每批樣本所預測6、12、18至60分鐘結果分別與實況交叉相關檢驗的情況,如圖3所示。
圖3中,每個柱狀條的頂端和底端分別表示檢驗的相關系數(shù)的最大值和最小值,柱狀條中間的黑色方形表示相關系數(shù)的均值??梢钥闯?,隨著預測時效的增長,其預測準確率的個體差異也隨之增大。在前6分鐘的預測中,該差異約為3%,30分鐘時約為8%,而到預測60分鐘時,差異進一步增大到20%。結果與強對流天氣系統(tǒng)具有生命史短、突發(fā)性強,水氣生消發(fā)展變化快的特點是相一致的。
4 結語
由于天氣系統(tǒng)復雜多變,特別是對于中小尺度的對流系統(tǒng),其生消、發(fā)展時間短、變化快,如何進行準確、有效的預報是提升當今短時臨近預報的關鍵環(huán)節(jié)之一??紤]到大氣中水氣等物質的移動變化應遵循一般力學規(guī)律,而拉格朗日力學正是表征和計算動力學問題的普適性方法,因此,本文的預測動力模型建立在拉格朗日力學關系基礎之上。又由于天氣系統(tǒng)的變化表現(xiàn)在雷達圖像上,其回波圖形具有相當?shù)牟淮_定性,因此,本文提出采用分層的位移場分析方法,先假定位移矢量是在相對粗糙的空間分辨率下的平穩(wěn)變化趨勢的總和,然后在更高空間分辨率下作小幅度局部修正,并如此進行多次迭代。為了減少低仰角雜波對實驗結果的影響,提出采用中心極值濾波對實驗數(shù)據(jù)進行處理。結合上述理論構建起基于拉格朗日力學的追蹤預測模型及算法流程,以雷達基本反射率因子作為輸入場,追蹤和預測回波在空間和時間上的位移矢量,并由此預測未來一段時間雷達回波的位置和強度。
實驗部分采用1個月樣本數(shù)據(jù)對本算法模型進行檢驗,通過預測結果與同時刻實況的比對分析,得出兩者的相關性和個例穩(wěn)定性等評價指標。結果表明,該方法能夠較好地預測局地天氣系統(tǒng)的演變過程,在未來30分鐘的預測中準確率平均超過80%,且對于輔助預報未來60分鐘內的局地龍卷風、強降水、雷暴等災害性事件具有實踐應用的價值。
參考文獻:
[1] 劉紅艷,魏鳴.多普勒雷達風場資料在臨近預報中的應用[J].大氣科學學報,2015(4):483-491.
[2] 鄭永光,林隱靜,朱文劍,等.強對流天氣綜合監(jiān)測業(yè)務系統(tǒng)建設[J].氣象,2013(2):234-240.
[3] 周康輝,鄭永光,藍渝.基于閃電數(shù)據(jù)的雷暴識別、追蹤與外推方法[J].應用氣象學報,2016,(2):173-181.
[4] DIXON M, WIENER G.TITAN:thunderstorm identification,tracking,analysis,and nowcasting―a radar-based methodology[J].Journal of Atmospheric & Oceanic Technology, 1993, 10(6):785-797.
[5] SHAH S, NOTARPIETRO R, BRANCA M.Storm identification,tracking and forecasting using high-resolution images of short-range X-band radar[J].Atmosphere, 2015, 6(5):579-606.
[6] 莊旭東,胡勝,陳榮,等.“雨燕”中風暴算法與新一代雷達SCIT產(chǎn)品的對比分析[J].熱帶氣象學報,2011(3):299-306.
[7] DUAN Y, XU Y, ZHI S.Application analysis of the hail suppression operation based on the improved SCIT Algorithm[J].Meteorology & Disaster Reduction Research, 2014(15):23-29.
[8] 曹春燕,陳元昭,劉東華,等.光流法及其在臨近預報中的應用[J].氣象學報,2015(3):471-480.
[9] GARCIA F, CERRI P, BROGGI A, et al.Data fusion for overtaking vehicle detection based on radar and optical flow[J].2012, 7(2272):494-499.
[10] 王興,王新,苗春生,等.基于GPU加速的雷暴追蹤外推方法研究[J].南京師范大學學報:工程技術版,2015(1):35-42.
[11] STAINVAS OLSHANSKY I, BILIK I, BIALER O.Doppler-Based Segmentation and Optical Flow in Radar Images: US20160084953[P].2016.
[12] 盛仲飆.BP神經(jīng)網(wǎng)絡在數(shù)據(jù)預測中的應用[J].軟件導刊,2016(1):147-148.
[13] 王利卿,黃松杰.基于多尺度卷積神經(jīng)網(wǎng)絡的圖像檢索算法[J].軟件導刊,2016(2):38-40.
[14] WANG X, GU Y H, MIAO C S, et al.Parallelization and performance optimization of radar extrapolation algorithm with OpenCL[J].Journal of Internet Technology, 2016(17):323-330.
[15] .雷達外推預報與暴雨數(shù)值模式融合預報降水方法研究[D].北京:中國氣象科學研究院,2013.
[16] 張蕾.多普勒雷達回波演變的動力學分析及臨近預報算法改進[D].南京:南京信息工程大學,2015.
[17] FOX N I, WEBB R, BALLY J, et al.The impact of advanced nowcasting systems on severe weather warning during the sydney 2000 forecast demonstration project:3 November 2000[J].Weather & Forecasting, 2004, 19(1):97-114.
[18] 李艷艷.相似空間中不變的歐拉-拉格朗日方程[J].河南大學學報:自然科學版,2014,03:273-276.
[19] ERICKSEN R E, GUITERAS J J, LARRIVEE J A, et al.A parachute recovery system dynamic analysis [J].Journal of Spacecraft & Rockets, 1967, 4(3):321-326.
[20] BELLERBY T J.High-resolution 2-D cloud-top advection from geostationary satellite imagery[J].IEEE Transactions on Geoscience & Remote Sensing, 2006, 44(12):3639-3648.
篇6
中圖分類號:TN919-34;TP391.4 文獻標識碼:A
文章編號:1004-373X(2010)18-0101-03
Image Matching Algorithm Based on SIFT Feature Point
GAO Feng1, WEI Shao-hua1, WANG Xue-tong2
(1. North Institute of Information Engineering, Xi’an Technological University, Xi’an 710025, China;
2. School of Computer Science and Engineering, Xi’an University of Technology, Xi’an 710048, China)
Abstract: SIFT feature point is a kind of feature which is invariant to scale. Method for generation scale space of image is presented, then steps for picking up sift key point are provided. Vectors for describing key point are generated based on the gradient magnitude and orientation of pixels neighboring to the key point. Matching algorithm is presented based on vectors. The experiment shows that it is efficient for image matching.Keywords: SIFT algorithm; image matching; scale space; Gaussian kernel
0 引 言
圖像匹配技術是圖像處理和計算機視覺領域的┮幌瞠重要技術。圖像匹配,就是在機器識別事物的過程中,將已知圖像與陌生圖像的全部或部分在空間上對準,根據(jù)已知模式的圖像在一幅陌生圖像中尋找對應該模式的子圖像過程。圖像匹配所涉及的應用領域包括工業(yè)檢測、遙感地形匹配、光學和雷達圖像跟蹤、工業(yè)流水線自動監(jiān)控、交通管理、醫(yī)療診斷、圖像檢索等諸多領域。
目前,圖像匹配技術有基于與像素灰度相關的匹配、基于圖像特征的匹配、基于語義網(wǎng)絡的匹配以及基于神經(jīng)網(wǎng)絡和遺傳算法的匹配等多類方法。近年來,基于局部不變量描述符的方法在圖像匹配領域取得了顯著進展。SIFT[1](scale invariant feature transform)方法是Lowe在2004年提出的一種局部不變特征點的提取方法。SIFT特征是圖像的局部特征,對旋轉、尺度縮放和亮度變化保持不變,對視角變化、仿射變換和噪聲也保持一定程度的穩(wěn)定性。SIFT還具有獨特性、多量性和可擴展性等多項特點?;赟IFT特征的算法目前在圖像拼接[2]、遙感圖像[3]的配準等很多領域都得到了應用。
1 SIFT算法
SIFT是通過在圖像的尺度空間內,將定位極值點作為匹配候選關鍵點,并提取極值點的方向參數(shù),最后獲得匹配所需關鍵點描述符的一種算法。使用SIFT算法實現(xiàn)圖像匹配主要有以下幾個步驟:
1.1 檢測尺度空間極值點
尺度空間(Scale space)思想最早由Iijima于1962年提出,20世紀80年代Witkin和Koenderink[4]的奠基性工作使得尺度空間方法獲得較快發(fā)展。1994年Lindeberg等人建立的線性尺度空間方法被廣泛采用[5-6]。
尺度空間方法的基本思想是:在視覺信息的處理過程中引入一個尺度參數(shù),通過連續(xù)變化的尺度參數(shù)獲得不同尺度下的視覺處理信息,然后綜合這些信息以便深入挖掘圖像的本質特征[5]。
給定圖像I(x,y),其所對應的尺度空間表示L(x,y)Э梢雜梢桓鼉砘核和圖像卷積得到[7]。
L(x,y;δ)=g(x,y;δ)*I(x,y)(1)
g(x,y;δ)=12πδ2e-(x2+y2)/(2δ2)(2)
式中:g(x,y;δ)是高斯卷積核,也是尺度變換惟一的線性核[8],其中,δ是尺度參數(shù),對應高斯核函數(shù)的方差,改變δ的值可以獲得一組圖像的尺度空間表示[2]。
對相鄰尺度的圖像做差分,可以獲得一組DoG(difference of gauss)圖像D(x,y;δ)。
D(x,y;δ)=[g(x,y;kδ)-g(x,y;δ)]*I(x,y)
=L(x,y;kδ)-L(x,y;δ)(3)
圖像的空間極值點是該點與其相鄰8個點及相鄰兩個尺度所對應位置的18個點共27個點中的最大值點[9],如圖1所示。
圖1 DoG尺度空間局部極值檢測
1.2 精確定位極值點
DoG算子會產(chǎn)生較強的邊緣響應,且在1.1節(jié)中檢測到的極值點精度為像素級。
通過擬合三維二次函數(shù)可以將極值點插值定位到亞像素精度。將D(x,y;δ)Taylor展開可得:
D(x)=D+DTXX+12XT2DX2X(4)
式中:D及其導數(shù)是采樣點的估計值;X是距采樣點的偏移量。此時,極大值點的位置X′Э梢雜上率餃范:
X′=-D-1X2•DX(5)
一個定義不好的高斯差分算子的極值在橫跨邊緣處有較大的主曲率,而在垂直邊緣的方向有較小的主曲率。主曲率是通過一個2×2的Hessian矩陣H求出的。即:
H=DxxDxy
DxyDyy(6)
導數(shù)由采樣點相鄰差估計得到。主曲率由H的特征值計算得出,令│廖最大特征值,β為最小特征值,令│=rβ,г蛑髑率由下式確定:
Tr(H)2Det(H)=(α+β)2αβ=(r+1)2r(7)
選取合適的主曲率閾值,可以去除不穩(wěn)定的邊緣響應點,從而獲得精確定位的極值點作為關鍵點。
1.3 指定關鍵點方向參數(shù)
利用關鍵點鄰域像素的梯度方向分布特性為每個點指定方向參數(shù),可以使算子具有旋轉不變性。
梯度m(x,y)和方向θ(x,y)Э梢雜上旅嫻墓式計算:
m(x,y)=[L(x+1,y)-L(x-1,y)]2+[L(x,y+1)-L(x,y-1)]2
θ(x,y)=atan 2[(L(x,y+1)-L(x,y-1)]/[L(x+1,y)-L(x-1,y)]}(8)
實際計算時,在以關鍵點為中心的鄰域窗口內采樣,并用直方圖統(tǒng)計鄰域像素的梯度方向。梯度直方圖的范圍是0~360°,其中每10°為一個柱。直方圖的峰值代表了該關鍵點處鄰域梯度的主方向,即作為該關鍵點的方向。
當存在另一個相當于主峰值80%能量的峰值時,將這個方向認為是該關鍵點的輔方向。一個關鍵點可以被指定具有多個方向,這可以增強匹配的魯棒性。
至此,每個關鍵點已經(jīng)檢測完畢,每個關鍵點具有3個信息:位置、所處尺度和方向,由此可以確定1個SIFT特征區(qū)域。
1.4 生成關鍵點描述符
先將坐標軸旋轉為關鍵點的方向,以確保旋轉不變性;再以關鍵點為中心取8×8的窗口,圖2左邊的中央黑點為當前關鍵點的位置,每個小格代表關鍵點鄰域所在尺度空間的一個像素,箭頭方向代表該像素的梯度方向,長度代表梯度模值,圓形區(qū)域為高斯加權范圍;然后在4×4的小區(qū)域上計算8個方向的梯度方向直方圖,繪制每個梯度方向的累加值,即可形成1個種子點,如圖的右部分所示。此圖中一個關鍵點由2×2共4個種子點組成,每個種子點共有8個方向向量信息。鄰域方向性信息聯(lián)合的思想增強了算法的抗噪聲能力,同時對于含有定位誤差的特征匹配提供了較好的容錯性。
圖2 關鍵點鄰域方向和方向特征向量
這樣,對于一個關鍵點就可以產(chǎn)生2×2×8共32個數(shù)據(jù),形成一個32維的特征向量。此時的SIFT特征向量已經(jīng)去除了尺度變化、旋轉等幾何變形因素的影響。再繼續(xù)將特征向量規(guī)一化,可以去除光照變化的影響。
1.5 匹配
生成2幅圖像的特征向量后,采用關鍵點特征向量的歐幾里德距離作為兩幅圖像中關鍵點相似性的判定度量。取一幅圖像中的某個關鍵點,并找出其與另一幅圖像中距離最近的前2個關鍵點,在這兩個關鍵點中,如果最近的距離除以次近距離小于某個閾值Th,則接受這一對匹配點。降低這個比例閾值,匹配點數(shù)量會減少,但匹配過程更穩(wěn)定。反之,匹配點數(shù)量會增多,但穩(wěn)定性隨之會變得稍差。
1.6 實驗及結果
在圖3(a)和圖3(b)中各包含了兩幅圖像,每幅圖像大小均為326×245像素。其中,右邊為待匹配物品的圖像,左邊為待匹配物品放入復雜場景后所形成的圖像。圖中連線的兩端是兩幅圖像中對應的匹配點。
圖3 SIFT匹配結果
為了增強匹配的穩(wěn)健性,在匹配過程中,對每個關鍵點使用4×4共16個種子點描述,這樣對于一個關鍵點會產(chǎn)生一個128維的特征向量。匹配過程中采用閾值Th=0.6,在去除不穩(wěn)定響應點時采用r=10。
在圖3(a)左邊的圖像中,除了匹配區(qū)域的尺度有變化外,被匹配的目標區(qū)域還發(fā)生了遮擋,但未遮擋部分仍與右側圖像中的模板圖像正確匹配。圖3(b)中的待匹配圖像區(qū)域是物體在發(fā)生約90°旋轉后所形成的,此時仍能正確匹配。
2 結 語
通過原理分析和實驗結果驗證,用SIFT算法提取的匹配關鍵點是一種局部描述符。使用SIFT算法實現(xiàn)圖像匹配具有對尺度變化、旋轉、光照和視角變化的穩(wěn)定性。當發(fā)生部分遮擋時,仍可實現(xiàn)有效匹配?;赟IFT特征點實現(xiàn)圖像匹配是一種有效方法。SIFT可進一步應用于圖像檢索,視頻跟蹤等多個領域。
參考文獻
[1]LOWE D. Distinctive image features from scale-invariant keypoints[J].International Journal of Computer Vision,2004;60(2):91-110.
[2]張朝偉,周焰,吳思勵,等.基于SIFT特征匹配的監(jiān)控圖像自動拼接[J].計算機應用,2008,28(1):191-194.
[3]李曉明,鄭鏈,胡占義.基于SIFT特征的遙感影像自動配準[J].遙感學報,2006,10(6):885-891.
[4]WITKIN A P. Scale-space filtering[C]//Proc. 7th International Joint Conference on Artificial Intelligence.[S.l.]: IJCAI, 1993:1019-1022.
[5]孫劍,徐宗本. 計算機視覺中的尺度空間方法[J].工程數(shù)學學報,2005,22(6):951-962.
[6]LOWE D. Object recognition from local scale-invariant features[C]//International Conference on Computer Vision. Greece: ICCV,1999:1150-1157.
[7]LINDEBERG T P. Internal report TRI TA-NA-P8808[R]. Stockholm, Sweden: Royal Institute of Technology, 2000.
[8]BABAUD J, WITKIN AP, BAUDIN M, et al. Uniqueness of the Gaussian kernel for scale-space filtering[J]. IEEE Transactions on Pattern Analysis and Machine Intelligence, 1986, 8(1): 26-33.
篇7
[關鍵詞] 電力系統(tǒng) 勵磁涌流 小波變換 應用
0.引言
小波變換(wavelet analysis)作為數(shù)學學科的一個分支,汲取了現(xiàn)代分析學中諸如泛函分析、數(shù)值分析、Fourier分析、樣條分析、調和分析等眾多分支的精華。它是泛函分析、傅立葉分析、樣條分析、調和分析和數(shù)值分析的完美結晶,小波變換在短短的幾年中,受到了科學界、工程界的高度重視,并且在信號處理、圖像處理、模式識別、量子場論、天體識別、地震預報、礦產(chǎn)勘測、故障診斷、狀態(tài)監(jiān)視、機器視覺、CT成像、話音識別、彩色復印、數(shù)據(jù)電視、音樂、雷達、刑事偵破等十幾個學科領域中得到(或將得到)廣泛的應用。
小波變換是一種時域-頻域分析,它在時域-頻域同時具有良好的局部化性質。它可以根據(jù)信號不同的頻率成份,在時域和空間域自動調節(jié)取樣的疏密頻率高時,則密;頻率低時,則疏。基于小波變換的這些優(yōu)良特性,可以觀察函數(shù)、信號、圖像的任意細節(jié),并加以分析。從而,小波變換在信號分析與重構、信號和噪聲分離技術、特征提取、數(shù)據(jù)壓縮等工程應用上,顯示出優(yōu)越性,而這些正是100多年來大量應用于工程領域的Fourier變換所無法做到的。它在時域和頻域同時具有良好的局部化性質以及多分辨率(MultiresolutionAnalysis)分析的特點。具體表現(xiàn)在:
(1)小波變換能隨信號頻率的變化自動調節(jié)時域-頻域窗口,能敏感信號的變化;
(2)多分辨分析可以以任意精度表示出信號;
(3)利用小波包可得到信號在時域-頻域空間的最佳分解;
(4)利用快速小波變換可快速進行矩陣運算;
(5)利用多尺度邊緣回復理論,能以較高的壓縮比壓縮數(shù)據(jù)。
對于具有奇異性的信號分析用傅立葉變換是無能為力的,這是因為傅立葉變換是純頻域分析方法,它在時域上沒有任何分辨能力。它即不能刻劃出暫態(tài)行波到達觀測點的準確時刻,也不能確定行波幅度和極性。為小波變換的數(shù)學理論和方法在數(shù)學界被認為是傅立葉分析的重大發(fā)展,在應用科學領域被認為是工具和方法上的重大突破,它迅速地在信號處理、圖象邊緣檢測、模式識別等領域得到有效廣泛的應用。
電力系統(tǒng)繼電保護是一門綜合性的科學,它既古老又年輕,這是因為它已有著近一百年的歷史,同時又像一些新興科學一樣處于不斷發(fā)展中。
在斷電保護中,最關健的環(huán)節(jié)是故障信息的提取與識別。微機保護中,數(shù)字信號處理已成為故障信息的提取與識別的基本手段。目前微機保護原理基本上是用工頻量實現(xiàn)的,有些保護中也用到二次、三次或五次諧波,為了從故障信息中獲取上述分量,傅立葉變換是一個十分有效工具,并得到非常廣泛的應用。從繼電保護技術觀點看,小波變換最突出的特點是:它在時域和頻域同時具有良好的局部化性質,因此成為分析象暫態(tài)行波這樣非平穩(wěn)變化或具有奇異性的其它故障信號的銳利工具。
1.小波變換理論基礎
1.1 小波變換
小波變換的誕生為信號特別是非平穩(wěn)信號分析在工具和方法上取得了重大突破?!靶〔ā钡男∈侵妇植糠橇悖哂芯o支型和衰減性;“波”是指具有波動性,包含頻率的特性。小波變換的目的就是既要看到信號的全貌,又要看到信號的細節(jié)。
短時傅里葉變換(STFT)的窗口函數(shù)是通過函數(shù)時間軸的平移與頻率限制得到,由此得到的時頻分析窗口具有固定的大小。對于非平穩(wěn)信號而言,需要時頻窗口具有可調的性質,即要求在高頻部分具有較好的時間分辨率特性,而在低頻部分具有較好的頻率分辨率特性。為此特引入窗口函數(shù),設則可定義關于的連續(xù)小波變換為:
(1)
其中,aR且a≠0。式(1)定義了連續(xù)小波變換,a為尺度因子,表示與頻率相關的伸縮,b為時間平移因子。
很顯然,并非所有函數(shù)都能保證式(1)中表示的變換對于所有f∈L2(R)均有意義;另外,在實際應用尤其是信號處理以及圖像處理的應用中,變換只是一種簡化問題、處理問題的有效手段,最終目的需要回到原問題的求解,因此,還要保證連續(xù)小波變換存在逆變換。同時,作為窗口函數(shù),為了保證時間窗口與頻率窗口具有快速衰減特性,經(jīng)常要求函數(shù)ψ(x)具有如下性質:
其中,C為與x,無關的常數(shù),ε>0。
小波變換原理示意圖如圖1所示。
同時可定義相應的小波變換的逆變換為:
等式(3)右端前面的尺度因子保證小波基函數(shù)的范數(shù)(norms)全都相等。因為:
1.2 小波變換的多分辨率分解
在實際應用中,信號的可測分辨率是有限的,我們不可能計算在所有的尺度2j上的小波變換,分辨率2j應取有限值。我們把變換限定在一個最大尺度和最小尺度之間,20表示最高分辨率,2j表示最低分辨率。為了建立小波變換的信號分辨率分解表示,引入函數(shù),且其Fourier變換滿足條件:
因為小波滿足,我們可得到,F(xiàn)ourier變換的能量集中在低頻,所以為低通特性的平滑函數(shù)。定義平滑算子
其中,它表示在分辨率為2j時信號的低通濾波分量。
能量轉換公式:
式中,表示信號的細節(jié)分量,表示信號的低通平滑分量。當2j越大時,包含的信號細節(jié)(高頻成分)越少,且這部分丟失的信息可以從小波變換中來恢復。此時稱集合為信號的小波變換多分辨率分解表示,也即是有限尺度的小波變換。以上分析為信號處理提供了一個清晰的分層框架。
1.3 圖象的二進小波變換
設是一適當平滑的二元函數(shù),滿足條件,。記,圖象被函數(shù)在尺度下的平滑作用由卷積運算實現(xiàn),即。取基本函數(shù)如下:
則相應的小波變換如下:
當尺度時,如果、的Fourier變換滿足:
則稱為的二維二進小波變換。可以導出:
分別表征了圖象 沿方向的偏導數(shù),因此二維小波變換矢量就是梯度。
1.4 Mallat 算法
Mallat 和 Meyer 等人從不同尺度間信息增量表示方法出發(fā),運用多分辨分析思想,并結合數(shù)字濾波器理論,提出正交小波變換的一種塔式結構快速算法,稱為Mallat算法,其在小波變換中的地位相當于FFT在經(jīng)典傅里葉分析中的地位。由雙尺度方程可以推出濾波器組方程:
Mallat算法分解過程如圖2所示。
分解公式為:
S為離散信號與低通分解濾波器h(k)經(jīng)過卷積運算,然后下采樣可得到尺度1上的近似信號a0(原信號中的低頻分量);S與高通分解濾波器g(k)經(jīng)過同樣的步驟可得到尺度1上的細節(jié)信號d1 (原信號中的高頻分量)。連續(xù)進行下去,即可得到S在不同尺度上的近似信號以及細節(jié)信號。這就是Mallat的分解算法。設原始信號長度為N,在一次算法過程中,由于將卷積運算后的信號進行了下采樣,即只取運算結果的一半長度,因此得到的結果數(shù)據(jù)長度為前一個數(shù)據(jù)長度的一半,依次分解下去,則數(shù)據(jù)長度越來越少,如分解n次后,數(shù)據(jù)長度即為2-nN。
Mallat重構算法的思想是:原始信號可由分解算法所得的近似信號和細節(jié)信號經(jīng)逐級重構后近似逼進,這種逼進的精確度與所選的小波函數(shù)相關,這就是Mallat塔式重構算法的思想。在重構算法中,其濾波器組為h(k)和g 2.小波變換在電力系統(tǒng)中的應用
小波變換作為一種先進的數(shù)學理念,在數(shù)學研究領域方面取得了杰出的成果?,F(xiàn)在小波變換己經(jīng)滲透到自然科學、應用科學、社會科學等諸多領域,當然在電力系統(tǒng)中的應用也不例外,小波變換在電力系統(tǒng)中的應用主要在以下幾個方面:
2.1電力設備狀態(tài)監(jiān)視、故障的診斷方面
電力系統(tǒng)中,有相當一部分的電氣故障都是由于不同原因所導致的絕緣劣化和損壞引起的。絕緣的劣化和損壞,首先表現(xiàn)為絕緣內部和表面局部放電,然后發(fā)展為故障。如果對電力設備的絕緣內部和表面局部放電現(xiàn)象事先進行檢測和分析.就可以大大較少電力系統(tǒng)電力設備的故障率。通過檢測局部放電的性質和強弱,可以了解絕緣損壞大程度,判斷進一步發(fā)生繞組短路等嚴重故障的可能性,好作預防和解決措施。對變壓器局部放電信號的小波變換,基于小波變換的脈沖極性別方法,用以鑒別變壓器內、外部放電,并選用Haar小波作為小波基,實際明能夠有效地區(qū)分內、外部放電,并能有效地消除外部放電的影響。
2.2電力系統(tǒng)的電能質量分析方面
電力系統(tǒng)電能質量主要表現(xiàn)為電力系統(tǒng)的電流、電壓、頻率的質量。由于變頻調速設備、可編程邏輯控制器、各種自生產(chǎn)線等對電能質量敏感的用電設備廣泛應用于電力系統(tǒng),以及計算機產(chǎn)業(yè)的快速發(fā)展,過電壓、欠電壓、電壓凹陷和凸起、電壓間斷、電壓波動和閃變、各種電壓瞬變現(xiàn)象及諧波等電能質量問題,引起了電力部門和用戶的廣泛關注。因此必須采取合理的措施以提高電能質量。建立電能質量檢測和分析系統(tǒng),對其進行正確地檢測、評估和分類是十分必要的。
將小波變換應用于電能質量偏差故障的檢測、定位和研究。其核心思想是把一個給定的干擾信號分解為原信號的平滑和細節(jié)的兩種信號,但其獨特之處是構造了一個雙正交復小波,采用了Mallat的塔式二進制快速算法,只須計算分解后1-3尺度上的平滑分量與尺度4上的細節(jié)分量,而不像其他方法上必須同時計算各個尺度上的細節(jié)分量與平滑分量,節(jié)省了將近一半的計算時一間。
2.3電力系統(tǒng)諧波分析方面
電力系統(tǒng)中發(fā)生故障時,諧波是不可避免地要出現(xiàn)的成分。由于諧波的存在,電力設備的正常工作要受到影響,因此我們需要進行諧波治理。電力系統(tǒng)諧波,增加了不必要的損耗,而且給通信設備的運行要造成有害的干擾等。為了避免這些諧波的不良影響,就有必要對其加以分析和抑制。小波變換將在此類信號變換投影到不同的尺度上會明顯地表現(xiàn)出高頻、奇異高次諧波信號的特性,特別是小波包具有將頻率空間進一步細分的特性,將很好的為抑制高次諧波提供依據(jù).進行電力系統(tǒng)諧波分析與處理,是小波變換在電力系統(tǒng)中應用的重要任務之一。
2.4電力系統(tǒng)的暫態(tài)穩(wěn)定分析方面
當電力系統(tǒng)受到大擾動時,表征系統(tǒng)運行狀態(tài)的各種電磁信號參數(shù)均會發(fā)生急劇變化和振蕩。對這樣的一個突變、局部化的信號進行分析,小波變換無疑是一個很好的選擇。小波變換捕捉和處理微弱突變信號的能力可用于基于微弱信號的電力系統(tǒng)暫態(tài)穩(wěn)定預測研究上,其“局部細化與放大”的特性,能夠識別和追蹤系統(tǒng)變量的微弱突變,進而推斷出引起突變的局部故障時間和地點,提高電力系統(tǒng)暫態(tài)穩(wěn)定預測的實時性和準確性。隨著電力系統(tǒng)向巨大化、復雜化發(fā)展,暫態(tài)信號的分析和檢測對電力系統(tǒng)的故障診斷和電能質量的評估具有重要意義。最近幾年來,小波變換在電力系統(tǒng)故障分析,特別是暫態(tài)信號的分析中進行了廣泛的研究??衫眯〔ㄗ儞Q的奇異性特質,對故障暫態(tài)信號進行詳細性劃分,選擇合適的小波函數(shù)對故障暫態(tài)信號進行檢測。
2.5電力系統(tǒng)動態(tài)安全分析方面
當電力系統(tǒng)受到擾動時會造成系統(tǒng)電壓波動,過低的電壓會危及電力系統(tǒng)運行穩(wěn)定性,嚴重時可能造成“電壓崩潰”。因此,研究電壓的動態(tài)響應日趨重要。當系統(tǒng)受到擾動后便電壓突變信號。應用小波變換將突變信號分解到不同尺度上再分別分析這些突變信號的幅值和相位的大小,以便判別電力系統(tǒng)動態(tài)安全運行狀況。
在合閘或開閘瞬間產(chǎn)生沖擊的高幅值電壓經(jīng)常破壞變壓器繞組的絕緣。檢測變壓器繞組絕緣的通常是使用標準沖擊試驗方法,該方法應用傅立葉變換算法分析變壓器頻域內的信號分解結果。然而FFT分析在頻譜尖峰時刻存在頻譜遺漏。為了獲得更好的信號分析,該文應用小波變換技術在變壓器繞組故障時的暫態(tài)現(xiàn)象,選擇Db系小波作為小波基,并在單相變壓器正常情況和繞組匝間短路情況下進行不同測試。
2.6輸電線路的故障定位方面
現(xiàn)代數(shù)字式行波保護和故障點測距裝置在測量點所感受到的故障暫態(tài)電壓和電流信號實質上是一種非平穩(wěn)信號,持續(xù)時間也很短(約為幾個毫秒),而故障信息便主要蘊含于各個行波浪涌到來時所產(chǎn)生的信號奇異點中。因而我們必須用高速的數(shù)據(jù)采集技術來捕捉行波信號,并同時監(jiān)視多條線路,這就需要保存多次的故障記錄,會產(chǎn)生大量的數(shù)據(jù)需要存儲和遠距離運輸。過多的數(shù)據(jù)會增加傳輸?shù)臅r間甚至影響傳輸?shù)目煽啃?,因此很有必要對采集到的故障暫態(tài)行波信息進行壓縮處理。
將離散小波變換用于輸電線路故障暫態(tài)行波信息的壓縮,并對信號壓縮的比例進行了相應的研究,實驗證明信號的采樣點數(shù)越多,奇異點越少,則越有利于故障信息的壓縮,經(jīng)重構后信號中的信息損失也越小。利用輸電線路故障后的暫態(tài)電流行波中所包含的故障信息,故障的突變點和其小波變換模極大值之間的關系來進行故障定位。通過分析模極大值分布,電流行波的不同成分被明顯地區(qū)分開來,這樣故障和折射行波就可以識別。無用的成分被過濾掉,折射的行波到達時間不同表明故障的位置。
2.7 電力系統(tǒng)的負荷預測方面
由于用戶用電的隨機性,電力系統(tǒng)的負荷是在隨時變化著的,相應的電力系統(tǒng)的功率分布、母線電壓、功率損耗以及電能損耗等也在隨時地變化。因此在計算上述的電力系統(tǒng)的參數(shù)時,必須了解負荷隨時間的變化規(guī)律。己采用的各種負荷預測的方法有時間序列法,神經(jīng)網(wǎng)絡法等等。電力負荷具有特殊的周期性,負荷以天、周、年為周期發(fā)生波動,大周期中套小周期。小波變換能將各種交織在一起的不同頻率組成的混合信號分解成不同頻帶上的塊信號,對負荷序列進行小波變換,可以將負荷序列分別投影到不同的尺度上。各個尺度上的子序列分別代表著原序列中不同頻域的分量,它們可以清楚地表現(xiàn)出負荷序列的周期性。
基于多分辨分析的思想,對負荷序列進行正交二進小波變換,把原負荷序列投影到各個不同的尺度上,可以清楚地看到負荷序列逐漸細微的周期性。在此基礎上,分別對各個尺度上變換得到的負荷子序列進行預測,再利用預測結果進行信號重構,就可以得到完整的預測結果。
2.8小波變換用于信號奇異性檢測原理
雖然涌流與故障電流都是暫態(tài)量,但由于其產(chǎn)生機理不同,其表現(xiàn)形式不同,主要是其各自的諧波成分不同,而諧波成份相對于基波來說是比較小的,這樣由于基波的影響就可能造成涌流與故障電流間微小差別的消失。具體就是它們各自的某些奇異點會變得隱蔽起來。如果我們將基波濾掉,就會使這些本己不明顯的奇異點顯露出來。然后我們就可通過小波變換找出這些奇異點,由于涌流和短路電流的諧波成份不同,其奇異點的分布應不同。這樣我們可根據(jù)其奇異點的不同分布,即小波變換模極大值的不同分布將其區(qū)分開來。
奇異性信號是指信號本身或它的某階導數(shù)在某一時刻存在突變的信號,信號的奇異性通常攜帶有最重要的信息。奇異性檢測就是要將信號的奇異點識別出來,并判斷其奇異性程度。長期以來,傅里葉變換一直是研究函數(shù)(即信號)奇異性的主要工具。但是,由于傅里葉變換缺乏空間局部特性,它只能確定一個函數(shù)奇異性的整體性質,難以確定奇異點在空間的位置及分布情況,而信號的奇異性或突變性在很多情況下是非平穩(wěn)信號最關鍵和最重要的性質。例如:機械故障、電力系統(tǒng)故障、腦電圖心電圖中的異常等,都對應于測試信號的突變點。雖然它們發(fā)生的背景不同,但如果將測得的數(shù)據(jù)作為一個信號來看,都集中體現(xiàn)在如何提取信號中的突變點的位置及判定其奇異性(或光滑性)的問題上,因此對信號奇異性的檢測具有特別重要的現(xiàn)實意義。由于小波變換同時具有良好的時域和頻域局部特性以及對信號的自適應能力,所以利用小波變換來分析非平穩(wěn)信號的奇異性是一種行之有效的方法。
2.9利用小波變換的奇異檢測法鑒別勵磁涌流
在電力系統(tǒng)故障信號分析中,人們關注的是故障電流或電壓的突發(fā)時刻及其對應的頻譜特征,希望可以及時的判斷出故障類型和故障的突發(fā)時刻。對這樣的突發(fā)信號的分析,傅立葉分析是無能為力的。
目前,小波變換在變壓器勵磁涌流與內部故障的判別的應用研究主要集中于高次諧波檢測和奇異點檢測。高頻檢測反映的是差流狀態(tài)突變產(chǎn)生的高次諧波,高頻細節(jié)出現(xiàn)的位置對應于變壓器飽和、退飽和時刻或故障發(fā)生時刻。若差流的高頻細節(jié)突變周期出現(xiàn),則為勵磁涌流;若出現(xiàn)一次后便很快衰減為0,則為內部故障。奇異點檢測利用了小波變換模極大值原理,檢測的是差流狀態(tài)突變而產(chǎn)生的第2類間斷點,奇異點與涌流間斷角相對應。
小波變換雖然是一種先進的數(shù)學理論,但它跟Fourier變換一樣也僅僅只是一種信號處理的工具。在勵磁涌流識別中的應用也只是作為一種工具,正因為跟傅氏變換的相似性,它在涌流識別方血的應用也局限于波形識別和諧波分析方面,具體的說可以應用它在檢測信號奇異性和特征抽取方面的特長。
小波變換作為一種多分辨率的時一頻局部分析方法,它在信號突變點(邊緣)和奇異檢測方面具有優(yōu)良特性,它的極值點往往跟信號的奇異點相聯(lián)系。而勵磁涌流在間斷角處的電流非常小(接近于零),拐點處對應于鐵芯磁化曲線拐點S,該處具有一定的奇異性。我們可以通過分析涌流的小波分解系數(shù)極值點在各尺度上的變化來檢測間斷處,從而測量出間斷角。該原理從本質上來說還是屬于間斷角原理。
3.結束語
本文依據(jù)信號變換的理論和方法,介紹了小波變換應用于工程的基本理論和方法,并從電力系統(tǒng)的角度出發(fā)討論了小波變換的特點及應用現(xiàn)狀和發(fā)展前景。多尺度分析體現(xiàn)在小波的時頻窗具有自適應性,能夠對信號進行由粗及精地分析?;诙喑叨确治隼碚?,建立了類似于FFT的小波變換Mallat快速算法,使小波變換技術走向實用。奇異性檢測理論反映了小波具有在時、頻兩域突出信號局部特征的能力。信號的突變邊緣往往包含豐富的信息,小波變換后突變的奇異點會有不同于其它的特征出現(xiàn),在工程應用中主要使用模極大值來表征這些瞬變點。電力系統(tǒng)中發(fā)生故障會出現(xiàn)某些電氣量的突變,利用奇異性檢測理論對故障信號進行特征提取,再建立起相應的判斷依據(jù),這是基于小波變換的微機保護基本思路。
本文總結了小波變換在電力系統(tǒng)中的應用方向,并把小波變”換應用于勵磁涌流的鑒別。利用小波變換在信號奇異性檢測抽取方面的特長來區(qū)分勵磁涌流和故障電流的方法。利用小波變換對電力系統(tǒng)的非平穩(wěn)信號進行分析和處理,可突出短路故障信號,同時濾掉大量的噪聲干擾信號,大大提高了保護裝置的可靠性。
參考文獻:
[1]張賢達.現(xiàn)代信號處理(第二版)[M].清華大學出版社,2002.10.
[2]趙曉坦,蘇鵬聲.離散序列小波變換在微機繼電保護中的應用[J].繼電器,2002,30(10).
[3]蔡暉.小波變換在變壓器微機保護中的應用[D].河海大學碩士學位論文,2002.3.
[4]王建賾,李威,冉啟文,紀延超.解析信號小波變換及其在電力系統(tǒng)中的應用[J].電力系統(tǒng)自動化,2000.11.25.
[5]葛寶明,王祥珩等.電力變壓器的勵磁涌流判據(jù)及其發(fā)展方向[J].電力系統(tǒng)及其自動化,2003.27(22).