卷積神經網絡的特性范文
時間:2024-04-02 11:39:16
導語:如何才能寫好一篇卷積神經網絡的特性,這就需要搜集整理更多的資料和文獻,歡迎閱讀由公務員之家整理的十篇范文,供你借鑒。
篇1
【關鍵詞】深度學習 卷積神經網絡 權值共享 下采樣 R-CNN Fast-R-CNN
1 緒論
隨著電子信息技術的快速發(fā)展,芯片的設計與生產進入了納米時代,計算機的計算能力與計算速度得到了空前的提高,但是人們的需求是無限的,要求計算機能更加任性化的服務于我們的生活,這也就要求計算機本身能像人一樣識別與感知周圍的環(huán)境,并對復雜的環(huán)境做出正確的判斷。而圖片信息是我們周圍環(huán)境最直觀的,最容易獲取的信息,要求計算機能對為的環(huán)境做出識別與判斷也就要求計算機能夠智能的識別圖像信息。深度學習是機器學習中的一個新的研究領域。通過深度學習的方法構建深度網絡來抽取目標特征進而識別周圍的環(huán)境。卷積神經網絡對圖像的處理具有平移,旋轉,扭曲不變的優(yōu)良特性。在處理圖像是更加快捷和便利。卷積神經網絡使得計算機在感知識別周圍環(huán)境的能力有了巨大的提升,使得計算機更加智能。卷積神經網絡擁有強大的特征提取能力,使得其在圖像分類識別,目標跟蹤等領域有著強大的運用。
1.1 國內外研究現(xiàn)狀
1986年,Rumelhart和Mc Celland提出BP算法。BP算法反向傳導神經網絡輸出誤差進行訓練神經網絡。通過BP算法,神經網絡能夠從大量訓練數據中的學習到相關統(tǒng)計信息,學習到的數據統(tǒng)計信息能夠反映關于輸入-輸出數據模型的函數映射關系。
自2006年以來,Geoffery Hinton教授提出深度信念網絡。從此深度學習在學術界持續(xù)升溫。深度學習不僅改變著傳統(tǒng)的機器學習方法,也影響著我們對人類感知的理解,迄今已在語音識別和圖像理解等應用領域引起了突破性的變革。各種相關的算法和模型都取得了重要的突破,使得深度學習在圖像分類,語音識別,自然語言處理等領域有廣泛的運用。
2013年百度成立百度深度學習研究院以來我國的人工智能領域取得了長足的進步。在人工智能專家吳恩達的帶領下,百度陸續(xù)推出一系列人工智能產品,無人駕駛技術,DuerOS語音交互計算平臺,人臉識別技術,美樂醫(yī)等優(yōu)秀產品。此外Imagenet圖像識別大賽中也誕生了一系列經典的神經網絡結構,VGG,F(xiàn)ast-R-CNN,SPP-net等等,可以說人工智能技術在近幾年得到了空前的發(fā)展。
2 深度學習概述
深度學習是機器學習的一個新方向,通過學習樣本數據內在規(guī)律和深層特征深度,深度學習神經網絡能夠像人一樣有分析和學的能力,尤其在文字處理,圖像識別,語音等領域更加突出。能夠自主學習一些新的東西。目前深度學習使用的典型技術是通過特征表達和分類器來進行目標識別等任務的。并在語音識別、圖像處理、機器翻譯等領域取得很多成果。
深度學習不同于以往的淺層學習,淺層學習模型值包含一個隱藏層,或者不存在隱藏層,深度學習則是由很多隱藏層組成的,上一層的輸出作為下一層的輸入,實驗對輸入信息進行分級表達。目前深度學習框架主要包含三種深度學習框架,如圖1、2、3所示。
3 卷積神經網絡
卷積神經網絡的結構層次比傳統(tǒng)的神經網絡復雜,卷積神經網絡包含大量的隱藏層,相鄰的卷積核或者下采樣核采用局部感受野全鏈接,神經元權值共享的規(guī)則,因此卷積神經網絡訓練參數的數量遠比傳統(tǒng)神經網絡少,卷積神經網絡在訓練和前向測試的復雜度大幅度降低,同時也減少了神經網絡訓練參數過擬合的幾率。卷積神經網絡主要有兩部分,分別是卷積核和下采樣核。卷積核主要對上一層的圖像進行卷積運算,提取圖像特征,下采樣核則是對上層的數據進行將為處理,減少神經網絡的復雜度。
卷積神經網絡中每一個神經元的輸入與前一層的局部感受野相連,提取局部感受野的特征,比如圖像的輪廓,顏色等特征,而這些特征不僅包括傳統(tǒng)人類能理解的特征,也包括神經網絡自身能夠識別的特征,卷積核全職共享,因此這些特征提取與圖像的位置無關。
圖4是經典的LeNet5卷積神經網絡架構,LeNet5架構中卷積核和下采樣核交替出現(xiàn),下采樣核及時的將卷積核生成的特征向量進行降維,減少神經網絡的運算量。LeNet5算法在1962年幼Hubel等人提出,在識別手寫數字mnist中有極高的準確率。
4 R-CNN、Fast-R-CNN對比分析
卷積神經網絡在對圖像進行識別具有平移,旋轉,扭曲不變的優(yōu)良特性,并且能夠實現(xiàn)高準確率識別圖像,但是在現(xiàn)實生活運用中往往需要神經網絡標記出目標的相對位置,這是傳統(tǒng)卷積神經網絡不具備的功能。因此在前人傳統(tǒng)卷積神經網路基礎上對卷積神經網絡進行改進,產生了具有對圖像中目標進行識別和定位的卷積神經網絡R-CNN,F(xiàn)ast-R-CNN等改良算法。
4.1 R-CNN
R-CNN為Region Convoluntional Neural Network的縮寫即對圖像進行局部區(qū)域的卷積處理,其核心思想主要是利用候選區(qū)圖像對物體探測中位置信息進行精確處理和利用監(jiān)督式預訓練和區(qū)域特殊化的微調方法,代替了傳統(tǒng)的非監(jiān)督式預訓練和監(jiān)督式微調。
在CNN中,全連接層輸入是固定大小的,因此R-CNN用計算機視覺算法將每一張圖片分割成1000-2000張的候選區(qū)圖片后,要將這些候選區(qū)圖片進行變換,生成固定大小的候選圖片,在訓練提取特征時一般采用經過預訓練的模型參數進行finetuning,榱嗽黽友盜費本,模型在也將生成的候選框以及標定的標簽作為訓練樣本進行訓練。R-CNN采用SVMs分類器對特征向量進行分類,在訓練SVMs時將候選框經過卷積神經網絡提取的特征和SVM標定結果輸入到SVMs分類器訓練分類器模型。而在測試時將圖像全部候選框經過卷積神經網絡提取的特征輸入到SVMs分類器中,得到每一類的評分結果。但是R-CNN在處理一張圖片是要處理需要對一張圖片1000-2000個候選區(qū)圖像進行前向運算,保存所有后選取圖片的特征值,要求計算硬件有大量的存儲空間,同時處理每一張圖片的時間也會增加。由于訓練集龐大,本文采用hard negative mining method方法提高存儲的利用率。
R-CNN的體現(xiàn)出了極大的優(yōu)勢,其中MAP也可以大幅度提高,但是正如本文上述,R-CNN計算的時間成本很大,達不到實時的計算效果,R-CNN在對候選區(qū)進行處理時會使得圖像失真,部分信息丟失。
4.2 Fast-R-CNN
Fast-R-CNN則是再次改進的一種基于卷積神經網絡目標跟蹤定位算法。相比于R-CNN,F(xiàn)ast-R-CNN從單輸入變?yōu)殡p輸入,在全連接層后有了兩個輸出,引入了Rol層。
Fast-R-CNN在運行的時候同樣會生成大量的候選區(qū),同時將原始的圖片用卷積神經網絡進行特征提取,將原始圖片提取的特征與生成的候選區(qū)坐標送入Rol層為每一個候選區(qū)生成一個固定大小的特征向量。最后將Rol生成的特征向量全連接層產生最終的LOSS。Fast-R-CNN中的LOSS采用多LOSS模式,SoftMax LOSS用于計算K+1分類的損失,K為第K個目標,1為背景;Regression LOSS計算候選區(qū)的四個角的坐標。
Fast-R-CNN在MAP上有了大幅度的提升,速度也得到了提升,但是在計算候選區(qū)是仍存在瓶頸,這也是限制Fast-R-CNN速度的因素。
5 實驗測試
對于本文提出的卷積神經網絡識別圖像定位圖像目標算法R-CNN,F(xiàn)ast-R-CNN,在本章給出實驗結果。實驗平臺為基于Linux系統(tǒng)的debian8下運行caffe進行訓練,采用顯卡K620進行實驗。
訓練模型初始化參數在是服從高斯隨機分布,R-CNN采用的網絡結構如圖7所示,F(xiàn)ast-R-CNN的網絡結構如圖8所示。
本次實現(xiàn)的訓練樣本為錄制實驗室視頻數據,將視頻數據轉換成幀圖片,對每張圖片數據進行裁剪,裁剪后圖像大小在256*256,共有500張,再將裁剪后的圖片進行旋轉,平移,扭曲,鏡像,加噪聲等處理,最后生成144萬張樣本圖片,其中136.8萬張圖片作為訓練樣本,7.2萬張作為測試樣本。
6 總結
在目標識別定位領域,卷積神經網絡具有強大的圖像處理能力,對圖像的識別定位具有很高度平移,旋轉,扭曲不變形的優(yōu)良性能。卷積神經網絡架構R-CNN和Fast-R-CNN都有強大的圖像處理能力。Fast-R-CNN在識別準確率上比R-CNN高。R-CNN算法復雜,對一張圖片需要進行1000-2000次的卷積運算,特征重復提取。因此在訓練和前向測試時,R-CNN用的時間長,不能很好的適用于處理實時圖片數據,尤其視頻數據。R-CNN在對每個候選區(qū)進行特征提取之后需要將提取的特征向量存入內存,降低訓練測試時間的同時也需要耗費大量內存。因此從各方面分析可知,F(xiàn)ast-R-CNN性能優(yōu)于R-CNN。
參考文獻
[1]謝寶劍.基于卷積神經網絡圖像分類方法研究[D].合肥工業(yè)大學,2015.
[2]鄭胤,陳權崎,章毓晉.深度學習及其在目標和行為識別中的新進展[J].中國圖象圖形學報,2014(02):175-184.
[3]陳先昌.基于卷積神經網絡的深度學習算法與運用研究[D].杭州:浙江工商大學,2006(04):603-617.
[4]李彥冬,郝宗波,雷航等.卷積神經網絡研究綜述[J].計算機應用,2016.
[5]Gibson.J J.The perception of the Visual World[J].Cambridge,England,1950.
[6]HORN B,SCHUNCK P.Determining optical flow[J].Artificial Intelligence, 1981,17:185-203.
[7]R.Girshick,J.Donahue,T. Darrell,and J.Malik,“Rich feature hierarchies for accurate object detection and semantic segmentation,”in CVPR,2014
[8]Ross Girshick,Wicrosoft Research. Fast R-CNN,.
[9]R.Girshick.Fast R-CNN. arXiv:1504.08083,2015.
篇2
關鍵詞:圖像復原;盲復原;逆濾波;神經網絡復原
1 圖像退化及復原模型
1.1 圖像降質的數學模型
圖像復原處理的關鍵問題在于如何建立退化模型。假定輸入圖像f(x,y)經過某個退化系統(tǒng)后輸出的是一幅退化的圖像。為了方便討論, 把噪聲引起的退化(即噪聲)對圖像的影響一般作為加性噪聲考慮,這也與許多實際應用情況一致,如圖像數字化時的量化噪聲、隨機噪聲等就可以作為加性噪聲,即使不是加性噪聲而是乘性噪聲,也可以用對數方式將其轉化為相加形式。原始圖像f(x,y) 經過一個退化算子或系統(tǒng)H(x,y) 的作用,然后和噪聲n(x,y)進行疊加,形成退化后的圖像g(x,y)。圖像退化的過程可以用數學表達式寫成如下的形式:
g(x,y)=H[f(x,y)]+n(x,y)
n(x,y)是一種統(tǒng)計性質的信息下圖表示退化過程的輸入和輸出的關系,其中H(x,y)包含了退化系統(tǒng)的物理過程,即所要尋找的退化數學模型。
1.2 圖像的退化恢復模型
數字圖像的圖像恢復問題可以看作是:根據退化圖像g(x ,y)和退化算子H(x ,y)的形式,沿著逆向過程去求解原始圖像f(x ,y), 或者說逆向地尋找原始圖像的最佳近似估計。
2 研究背景與意義
圖像復原是數字圖像處理技術的一個重要研究方向,在現(xiàn)實生活中,有著非常廣闊的應用前景和市場。數字圖像處理研究很大部分是服務于數字圖像復原的,而運動模糊圖像的復原又是圖像復原中的重要課題之一,從六十年代起就有人研究它。初期研究的主要原因是對衛(wèi)星所拍攝的圖像進行復原,因為衛(wèi)星相對地球是運動的,所拍出的圖像是模糊的(當然衛(wèi)星所拍攝圖像的模糊原因不僅僅是相對運動而造成的,還有其他原因如大氣湍流所造的模糊等等)。美國的噴氣推進實驗室(JPL)對徘徊者飛行器發(fā)回的月球照片進行了圖像恢復處理。傳統(tǒng)的圖像恢復方法可以很好地恢復出來原始圖像,但是需要事先知道系統(tǒng)的先驗知識(例如系統(tǒng)的點擴散函數)。在先驗知識不足的情況下,如何恢復出來原始圖像?這就需要模糊圖像盲恢復技術。根據不同的應用背景和先驗知識,大致可以兩種方法恢復兩種類型的模糊圖像,以滿足不同的應用要求。
第一種方法:如何快速恢復模糊圖像,進行適時性圖像處理?這個技術在實際生活中有著廣泛應用。
第二種方法:如何在事先不能確定模糊系統(tǒng)點擴散函數的情況下,恢復模糊圖像,改善圖像的質量,這就是圖像盲恢復的問題。
3 國際國內研究發(fā)展和現(xiàn)狀
從歷史上來看,數字圖像處理研究有很大部分是在圖像恢復方面進行的,包括對算法的研究和針對特定問題的圖像處理程序的編寫。數字圖像處理中很多值得注意的成就就是在這兩方面取得的。
在六十年代中期,去卷積(逆濾波)開始被廣泛地應用于數字圖像恢復。這一階段對模糊圖像的研究主要是把因相對運動而拍攝的模糊圖像復原過來,從而增強人們的判讀能力。早期做圖像復原研究,主要強調盡可能使模糊圖像復原到原貌,增加它的判讀性,在此發(fā)展了很多的復原方法,諸如:差分復原、維納濾波等.這些方法各有特點,較好的解決了運動模糊圖像的判讀問題,但是在應用上均有一定的限制。
雖然經典的圖象復原方法不少,但歸納起來大致可分為逆濾波法,或稱相關變換法( inv ersefiltering or t ransfo rm related techniques) 和代數方法( alg ebraic techniques) 兩種。
3.1 傳統(tǒng)復原法
3.1.1 逆濾波方法
逆濾波法大致有經典逆濾波法、維納濾波法、卡爾曼濾波法等. 其中,在傅立葉變換域,經典逆濾波的變換函數是引起圖象失真的變換函數的逆變換,其雖在沒有噪聲的情況下,可產生精確的復原圖象,但在有噪聲時,將對復原圖象產生嚴重的影響,雖然濾波函數經過修改,有噪聲的圖象也能復原,但它僅適用于極高信噪比條件下的圖象復原問題; 維納濾波法是通過選擇變換函數,同時使用圖象和噪聲的統(tǒng)計信息來極小化均方復原誤差,這雖然在一定程度上克服了逆濾波法的缺點,但是維納濾波法需要較多有關圖象的先驗知識,如需要對退化圖象進行滿足廣義平穩(wěn)過程的假設,還需要知道非退化圖象的相關函數或功率譜特性等等,而在實際應用中,要獲得這些先驗知識有較大的困難,為此,Ozkan 等人在研究圖象序列的復原問題時,提出了一種解決空間和時間相關性的多幀維納濾波法,是近年來維納濾波法的新發(fā)展; 卡爾曼濾波是一種遞歸濾波方法,其雖可用于非平穩(wěn)圖象的復原,但是因計算量過大,而限制了其實際應用的效果。 Wu 和Kundu 又對卡爾曼濾波方法進行了改進,不僅提高了速度,并考慮了應用于非高斯噪聲的情況; Cit rin 和Azimi-Sadjadi 也對卡爾曼濾波方法進行了改進,提出了塊卡爾曼濾波方法; Koch 等提出了擴展卡爾曼濾波( extended Kalmam filter) 復原方法,該方法可以較好地復原模糊類型不相似的退化圖象.除了上述的逆濾波方法外,還有參數估計濾波法,它實質上是維納濾波法的變種. 20 世紀90 年代初,又提出了基于遞歸圖象濾波的自適應圖象復原方法及合成濾波方法,它代表了濾波方法新的發(fā)展方向. 1998 年Kundur 等人首先明確提出了遞歸逆濾波( recursiv e inv er se filter ing ) 算法 ,2000 年Chow 等人又進行了改進,即在代價函數中增加了空間自適應正則化項,從而很好地抑制了噪聲,并減少了振鈴現(xiàn)象,較好實現(xiàn)了在低SNR 條件下的盲圖象復原. 2001 年,Eng 等人結合模糊集的概念,提出了自適應的軟開關中值濾波方法,它能在有效地去掉脈沖噪聲的同時,很好地保存圖象的細節(jié),是一種值得重視的新的圖象復原方法。
3.1 2 代數方法
Andrews 和Hunt 提出了一種基于線性代數的圖象復原方法。這種方法可能比較適合那些相對于積分運算,則更喜歡矩陣代數,而相對于分析連續(xù)函數,又更喜歡離散數學的人的口味。它為復原濾波器的數字計算提供了一個統(tǒng)一的設計思路。代數方法可分為偽逆法、奇異值分解偽逆法、維納估計法和約束圖象復原方法等。 其中,偽逆法,實質上是根據圖象退化的向量空間模型來找到引起圖象退化的模糊矩陣,但由于模糊矩陣總是很大的,因此在計算上往往不可行; 而奇異值分解偽逆法則是利用矩陣可分解成特征矩陣系列的思想,將模糊矩陣進行分解,由于簡化了計算,從而有利于模糊矩陣的估計計算,但在有噪聲存在時,經常會出現(xiàn)不穩(wěn)定的現(xiàn)象; 維納估計法雖然考慮了噪聲的情況,但它僅適合噪聲是二維隨機過程,且已知其期望和協(xié)方差的情況。前面的方法僅把圖象看成是數字的陣列,然而一個好的復原圖象應該在空間上是平滑的,其在幅度值上是正的,而約束圖象復原方法就是將這些因素作為約束條件,如基于維納估計法和回歸技術而提出的圖象復原方法就是一種約束圖象復原方法,而且通過選取不同的約束參數和回歸方法可以得到不同的圖象復原算法。傳統(tǒng)的圖象復原算法或面臨著高維方程的計算問題,或要求恢復過程滿足廣義平穩(wěn)過程的假設,這就是,使得具有廣泛應用價值的圖象復原問題沒有得到圓滿的解決的根本原因。
3.2 神經網絡圖象復原的方法
神經網絡圖象復原方法的發(fā)展方向自從神經網絡圖象復原首次提出十多年來,其研究在不斷地深入和發(fā)展,描述它的現(xiàn)狀已屬不易,展望它的未來更是困難,況且科學研究具有不確定性. 據筆者判斷,如下諸方面是亟待解決的問題,或研究活動已有向這些方面集中的趨勢。
3. 2.1小波神經網絡用于圖象復原將是研究的重點
自1992 年Zhang 提出小波神經網絡以來,如今已提出了各種類型的小波網絡,且小波與神經網絡的結合成了一個十分活躍的研究領域。通過學者們的理論分析和模擬實驗表明: 由于小波神經網絡具有逼近能力強、可顯著降低神經元的數目、網絡學習收斂的速度快、參數( 隱層結點數和權重) 的選取有理論指導、能有效避免局部最小值問題等優(yōu)點,因此將其用于圖象復原是一個值得研究的方向。將小波的時頻域局部性、多分辨性等性質,與神經網絡的大規(guī)模并行性、自學習特性等優(yōu)點結合起來,不僅將使用于圖象復原的小波神經網絡具有自適應分辨性,也將使正則化參數的選取更具有自適應能力. 最終使復原圖象既能保持圖象的細節(jié),又能很好地抑制圖象中的各種噪聲。
3.2.2細胞神經網絡、BP 網絡、自組神經網絡
值得進一步研究細胞神經網絡( CNN ) 由于其具有易于硬件實現(xiàn)的特點,因而具有很強的商業(yè)價值,但由于其自身還有很不成熟的地方,因此值得深入地研究. 其研究方向有: 細胞神經網絡理論基礎的進一步完善及在此基礎上建立細胞神經網絡中鄰域系統(tǒng)的概念; 與圖象數據局部相關性等概念結合起來研究,以建立新的圖象復原理論,形成新的圖象復原技術。BP 網絡對受污染或帶噪聲的訓練樣本,不僅能進行正確的映射,且與其純樣本仍相似。 正是BP 網絡的泛化能力強,使它在解決圖象復原問題時,可能比其他神經網絡具有更好的潛在性能。 將BP 網絡用于圖象復原是很值得進一步研究的.大家知道,人腦的學習方式是“自主的”,即有自組織和自適應的能力的,即人腦能在復雜、非平穩(wěn)和有“干擾”的環(huán)境及其變化的情況下,來調整自己的思維和觀念,還能根據對外界事物的觀察和學習,找到其內在的規(guī)律和本質屬性,并能在一定的環(huán)境下,估計到可能出現(xiàn)的情況以及預期會遇到和感覺到的各種內容及情況。 自組織神經網絡(SONN) 正是基于人腦的這些功能而生成的,由于它具有能從輸入的數據中,揭示出它們之間內在關系的能力,因此將其用于“盲圖象”的復原將是非常有利的。
3.2.3 需要提出更適合圖象復原的新神經網絡模型
小波神經網絡是為逼近任意非線性函數而提出來的,但為了圖象復原的需要,可考慮針對圖象復原的特殊情況,提出新的神經網絡模型。 如,因為大多數圖象是由平滑區(qū)域和輪廓細節(jié)組成的,其圖象數據在平滑區(qū)域雖具有較強的相關性,但與輪廓細節(jié)相鄰的數據應極不相關,所以,提出一種專用于圖象復原的“相關性神經網絡模型”是必然的期待; 再有,因為多項式具有較廣的擬合性和較好的收斂性,所以應提出的“多項式神經網絡”,將它們用于圖象復原也是值得研究的。
3.2.4 神經網絡與其他理論的結合
研究是尋求新模型、新方法的重要途徑目前神經網絡的研究正由單純的神經計算轉向計算智能,并結合腦科學的研究向生物智能方向發(fā)展。 為此,神經網絡圖象復原的研究也應考慮吸收模糊、分形、混沌、進化計算、信息融合等交叉學科的研究成果。 與模糊系統(tǒng)的結合將是一個重要的研究方向,因為,神經網絡與模糊系統(tǒng)有如下很多的相同之處: ( 1) 它們在處理和解決問題時,無需建立對象的精確數學模型,而只需要根據輸入的采樣數據去估計其要求的決策; ( 2) 在對信息的加工處理過程中,均表現(xiàn)出了很強的容錯能力; ( 3) 它們都可以用硬件來實現(xiàn). 由此可見,將神經網絡與模糊系統(tǒng)結合,用于圖象復原將是有意義的研究工作。
4 未來展望
圖像恢復發(fā)展到現(xiàn)在,已經有了許多成熟的算法,但是還是存在許多問題,等待著我們去解決。目前圖像恢復的最新發(fā)展有:
1. 非穩(wěn)圖像復原,即空間可變圖像復原。
2. 退化視頻信號的復原問題,以及攝像機拍照圖像復原,這是一個需要進一步研究的領域。
3. 運動補償時空復原濾波,同時將時間相關應用到運動補償中。
4. “Telemedicine“的出現(xiàn),遠程診斷極大的依賴于遠程接受的圖像質量,圖像恢復在醫(yī)學領域中有相當重要的作用。
5. 模糊 PSF 的 Identification 仍然是一個困難的問題,尤其在空間可變的 PSF 的估計中。
6. 空間可變恢復方法,可以利用 Wavelets 和 Markov 隨機場等方法進行復圖像恢復,這是一個具有發(fā)展?jié)摿Φ难芯糠较颉?/p>
參考文獻
1 馮久超,黃海東. 基于神經網絡的盲圖象恢復[ J ] . 計算機科學,2000,27( 1) : 67~68.
2 Er ler K,Jernigan E. Adaptive image restorat ion using recursive image f ilters [ J ] . IEE E Trans actions on Signal Process ing,1994,42( 7) : 1877~1881.
篇3
關鍵詞: 超分辨率; 深度學習; 卷積; 神經網絡; 視覺特征; 映射
中圖分類號:TP399 文獻標志碼:A 文章編號:1006-8228(2017)07-38-04
Application of deep learning in super-resolution image reconstruction
Han Sensen
(School of Computer and Information Engineering, Henan University, Kaifeng, Henan 475000, China)
Abstract: Super-resolution image reconstruction can reconstruct a high-resolution image using low-resolution images; it has become a hotspot in image processing. Deep learning is a popular branch of machine learning, which by combining low-level features to form more abstract high-level visual features, to avoid the artificial extraction of features. This paper divides the current reconstruction algorithm into three categories, which are based on interpolation, based on reconstruction and based on learning, and especially focuses on the reconstruction algorithms based on deep learning. Finally the future research direction of super-resolution image reconstruction technology is prospected.
Key words: super-resolution; deep learning; convolution; neural networks; visual feature; mapping
0 引言
單幀圖像的超分辨率(super resolution,SR)重建是指利用已知的低分辨率圖像,重構出具有更高像素密度的圖像,并且重構出的圖像還能夠保持豐富的紋理、質地等細節(jié)信息。它在視頻監(jiān)控、圖像打印、醫(yī)學圖像處理、衛(wèi)星成像等領域有較廣泛的應用。
超分辨率圖像的重建本質上是一個病態(tài)(ill-posed)問題,因為不完全相同的多張圖像高分辨圖像在經過相同的降采樣都可以產生相同的低分辨圖像,這是一種典型的一對多問題,因此存在惟一解,特別是在放大倍數較高的情況下該問題將變得更為復雜。
1 算法分類
當前的超分辨算法大致可分為三類:基于插值的超分辨率重建算法,基于重構的超分辨率重建算法和基于學習的超分辨率重建算法。
基于插值的重建算法假設像素的灰度值是連續(xù)變化的,并利用鄰近像素的灰度值計算待插值像素的灰度值,然而實際應用中許多圖像并不滿足這種假設。并且該算法通過一個預定義的數學公式直接將低分辨率圖像生成高分辨率的圖像而不考慮任何的圖像特性,也不接受任何的訓練。所以基于差值方法得到的重建圖像容易產生模糊、鋸齒現(xiàn)象。常見的線性插值方法有最近鄰插值方法,雙線性插值方法,雙三次插值方法等。
基于重構的超分辨率重建算法是依照特定的退化模型,將已知的低分辨率圖像序列中不同鼉暗男畔⒔行融合來重建出高分辨率圖像,因此該算法需要對圖像進行配準。常見重構算法有種迭代反向投影[1](IBP)、凸集投影法[2](POCS)。
基于學習的分辨率重建算法則是通過機器學習方法從大量的低分辨圖像和高分辨圖像對中學習它們之間的映射函數,利用學習到的函數對測試圖像進行預測來產生高分辨率圖像。常見的基于學習的分辨率重建算法有嵌套的鄰域嵌入[3](Neighbor Embedding with Locally Linear Embedding)、固定鄰域回歸[4](Anchored Neighborhood Regression)、稀疏編碼[5](Sparse Coding)。
相比較于其他兩類算法而言,基于學習的SR算法直接學習分辨率圖像與高分辨率圖像端到端的映射函數,比傳統(tǒng)的插值和重構的方法具有更突出的性能。本文著重介紹幾種基于深度學習的超分辨算法,包括SRCNN[6],DRCN[7], ESPCN[8]和SRGAN[9]等。
2 SRCNN
SRCNN(Super-Resolution Convolutional Neural Network)是較早地使用卷積神經網絡來做SR的網絡模型。該網絡結構十分簡單,僅僅用了三個卷積層。對于一張低分辨率圖像,SRCNN首先使用雙三次插值將它放大到將要放大的尺寸,再通過三層卷積神經網絡做非線性映射,得到的輸出結果作為重建的高分辨率圖像。整個過程可分為三個部分:圖像塊的提取和特征表示,特征非線性映射和最終的重建。
圖像塊提取與表示:該過程從低分辨率圖像中提取出部分重疊的圖像塊,并將每個圖像塊表示為一個高維向量,這些向量包含一些特征映射,映射的個數與向量的維數相同。
非線性映射:這個功能將每個高維向量非線性地映射成另外一個高維向量。從概念上來講每個映射后的向量代表了一個高分辨率圖像塊。這些向量構成了另外一個特征集。
重建:這個處理聚集以上高分辨率基于像素塊的替代對象,用于生成最終的高分辨率圖像。并且我們希望這個圖像能盡可能與高分辨率原圖相近。
對重建后的超分辨率圖像的質量進行定量評價的兩個常用指標是PSNR[10](Peak Signal-to-Noise Ratio)和SSIM[11](Structure Similarity Index)。這兩個值代表重建圖像的像素值和原始圖像像素值的接近程度,具體對比結果如表1,在2、3、4的放大倍數下,SRCNN與傳統(tǒng)方法的對比,可以看出無論是在哪個放大倍數下,SRCNN的PSNR值都比其他的重建算法要高出0.4Db左右。
SRCNN的網絡層數較少,同時局部感受野也較小,所以從輸入圖像中提取到的信息就非常有限。因此DRCN(Deeply-Recursive Convolutional Network for Image Super-Resolution)提出在網絡中增加更多的卷積層增加局部感受野的大小,這樣可利用更多的鄰域像素。同時為了避免過多W絡參數,DRCN提出使用遞歸神經網絡RNN(Recurrent neural network)。
與SRCNN比較類似DRCN的網絡結構可分為三個部分,第一個是Embedding network,相當于SRCNN中的特征提取,第二個是Inference network,相當于SRCNN中的非線性變換,第三個是Reconstruction network,即從特征圖像得到最后的重建結果。其中的Inference network是一個遞歸網絡,即數據循環(huán)地通過該層進行多次遞歸。將這個遞歸過程展開后可以看出,它等效于多個串聯(lián)的卷積層共享同一組參數,Inference network展開后的網絡結構是由D個共享參數的卷積層組成。DRCN將每一層的卷積輸出都送入同一個Reconstruction Net來作為其輸入,由于遞歸的深度是D,從而一共可得到D個重建圖像,再把它們加權平均得到最終的輸出。此外DRCN受ResNet[14]的啟發(fā)通過skip connection將輸入圖像與Inference net的輸出HD疊加作為Reconstruction Net的輸入,這就相當于Inference Net學習的是高分辨率圖像與低分辨率圖像的殘差圖像,即圖像的高頻信息。
實驗部分,DRCN同樣也使用了包含91張圖像的Set91[4]數據集進行訓練,與SRCNN不同的是DRCN使用的訓練數據是在多個方法倍數下生成的,而不像SRCNN那樣在單一的放大倍數下生成,這樣可以利用不同尺度圖像間的信息進行互補,理論上DRCN的重建效果會由于SRCNN,具體的對比結果如表2所示,可以看出DRCN的重建圖像的PSNR與SRCNN相比有了較大提高。
4 ESPCN
在SRCNN和DRCN中,低分辨率圖像都需要先使用雙三次插值得到與高分辨率圖像大小相同的低分辨率圖像來為網絡輸入,這意味著卷積的計算將在較高分辨率的圖像上進行,這與在低分辨率圖像上計算卷積相比于會需要較大的計算開銷。因此ESPCN(Real-Time Single Image and Video Super-Resolution Using an Efficient Sub-Pixel Convolutional Neural Network)提出在低分辨率圖像上直接計算卷積來得到高分辨率圖像。
ESPCN的核心思想是亞像素卷積層(Sub-pixel Convolutional Layer)。網絡的輸入是原始的低分辨率圖像,經過兩個卷積層后得到的特征圖像大小與輸入圖像一樣,但是特征的通道數變?yōu)閞2,γ是圖像的目標放大倍數。然后將每個像素上的r2個通道重新排列成一個γ×γ的區(qū)域,該區(qū)域對應于高分辨率圖像中的一個區(qū)域大小為γ×γ的子塊,從而對于一個大小為r2×H×W的特征圖像在通道上進行重新排列會形成一個大小為1×rH×rW的圖像,該圖像的尺寸是輸入圖像尺寸的r倍,從而間接地實現(xiàn)了輸入圖像的放大。
通過使用sub-pixel convolution可以間接的實現(xiàn)圖像的放大過程,即插值函數是隱含地包含在前面的卷積層中,只在網絡的最后一層對圖像大小做變換,前面的卷積運算由于在低分辨率圖像上進行,因此效率會有很明顯的較高。
ESPCN的訓練與SRCNN類似,在重建效果上,以PSNR為評價指標來看ESPCN比SRCNN有進一步的提高,具體對比如表3所示。而時間效率方面對于一個1080HD的視頻圖像,對其放大四倍進行的高分辨率重建,SRCNN需要的時間為0.434s,而ESPCN只需要0.029s。
SRGAN(Photo-Realistic Single Image Super Resolution Using a Generative Adversarial Network)是將生成對抗網絡用于SR問題的處理。其出發(fā)點是傳統(tǒng)的方法一般只能處理的是較小的放大倍數,當圖像的放大倍數在4以上時,得到的結果往往顯得過于平滑,從而重建出的圖像在視覺上卻少一些質地細節(jié)的真實感,因此SRGAN使用GAN來生成圖像中的細節(jié)。
SRGAN網絡由兩部分組成:生成網和判別網,生成網用于生成一些圖像,判別網用于判斷接收到的輸入圖像是由生成網生成的還是來自于真實樣本中的原始圖像。訓練時如果判別網無法區(qū)分出來輸入的樣本來自于哪里就達到了預期的效果。
傳統(tǒng)方法一般使用圖像的最小均方差(MSE)作為誤差函數,即該誤差函數使重建圖像有較高的PSNR,但是重建圖像缺少了必要的高頻信息,因而在重建后的圖像中容易出現(xiàn)過度平滑的紋理。在SRGAN的誤差函數中又增加了一個內容誤差項和生成誤差項。
內容誤差用于衡量重建出圖像與原始圖像在更高級的視覺特征上的差e。其具體定義由以下公式描述。
生成誤差項基于判別網輸出的概率,其輸出值表示輸入數據來自于真實樣本的概率大小。其具體定義由以下公式描述。
其中是一個圖像屬于真實的高分辨率圖像的概率。是重建的高分辨率圖像。
SRGAN的訓練過程與前面的網絡類似,同樣使用PSNR和SSIM評價標準對算法的重建效果進行測試,SRGAN生成的高分辨率圖像看起來更真實,具體的對比如表4所示。
6 結束語
深度學習已經在超分辨率圖像重建領域取得了突破性的成績,同時它仍然存在一些問題,例如它與傳統(tǒng)的機器學習方法一樣,通常假設訓練數據與測試數據服從同樣的分布,而實際上這兩者存在一定的偏差。此外當前的重建算法仍然只使用于較小的放大倍數,對于較大的放大倍數得到重建圖像仍然過于平滑模糊,因此如何充分利用深度學習來增強算法在較高的放大倍數下的重建性能是目前深度學習研究的重點。
參考文獻(References):
[1] Irani M, Peleg S. Improving resolution by image registration[J].
CVGIP: Graphical models and image processing,1991.53(3):231-239
[2] Stark H, Oskoui P. High-resolution image recovery from
image-plane arrays, using convex projections[J].JOSA A,1989.6(11):1715-1726
[3] Timofte R, De Smet V, Van Gool L. A+: Adjusted
anchored neighborhood regression for fast super-
resolution[C],2014:111-126
[4] Timofte R, De Smet V, Van Gool L. Anchored
neighborhood regression for fast example-based super-
resolution[C],2013:1920-1927
[5] Yang J, Wright J, Huang T S, et al. Image
super-resolution via sparse representation[J]. IEEE transactions on image processing,2010.19(11):2861-2873
[6] Bruna J, Sprechmann P, Lecun Y, et al. Image
Super-Resolution Using Deep Convolutional Networks[J]. Computer Science,2015.
[7] Kim J, Lee J K, Lee K M. Deeply-Recursive Convolutional
Network for Image Super-Resolution[J]. arXiv preprint arXiv:1511.04491,2015.
[8] Shi W, Caballero J, Huszár F, et al. Real-Time Single
Image and Video Super-Resolution Using an Efficient Sub-Pixel Convolutional Neural Network[J],2016.
[9] Ledig C, Theis L, Huszar F, et al. Photo-Realistic Single
Image Super-Resolution Using a Generative Adversarial Network[J],2016.
[10] Hore A, Ziou D. Image Quality Metrics: PSNR vs. SSIM[J],
2010:2366-2369
[11] Wang Z, Bovik A C, Sheikh H R, et al. Image quality
assessment: from error visibility to structural similarity[J].IEEE Transactions on Image Processing,2004.13(4):600-612
[12] Kim K I, Kwon Y. Single-image super-resolution using
sparse regression and natural image prior[J]. Pattern Analysis & Machine Intelligence IEEE Transactions on,2010.32(6):1127-1133
[13] Dong C, Loy C C, He K, et al. Image super-resolution
using deep convolutional networks[J]. IEEE transactions on pattern analysis and machine intelligence,2016.38(2):295-307
篇4
關鍵詞:灰值動態(tài)學卷積模板卷積投影牌照識別
基于圖像理解的汽車牌照自動識別系統(tǒng)是智能交通系統(tǒng)一個重要分支,有著非常廣泛的應用前景,而把汽車牌照從復雜的汽車圖像中分割出來是汽車牌照自動識別系統(tǒng)必須解決的關鍵問題。在過去的十幾年中,各國的科研人員提出了不少提取汽車牌照的方法。Choi和Kim提出利用Hough變換尋找垂直邊緣提取汽車牌照的方法,此方法由于許多汽車前部散熱器產生的垂直邊緣和某些牌照邊框的扭曲或某些汽車牌照沒有邊框而魯棒性較差。S.K.Kim和H.J.Kim提出的基于遺傳算法分割提取汽車牌照的方法,最大缺點是耗時長,難以進行實時處理。S.H.Park提出的一種基于神經網絡提取汽車牌照的方法,使用二個時延神經網絡在水平和垂直方向對輸入圖像進行濾波,得到牌照的候選區(qū)域,然后利用牌照的長寬比、面積、面積與周長比來區(qū)分真正的牌照區(qū)域與類牌照區(qū)域。此方法要求圖像中的牌照尺寸基本不變,一旦圖像中的牌照尺寸發(fā)生了較大的變化,必須對神經網絡重新進行訓練。T.R.Crimmins提出了一種數字形態(tài)學方法,此方法用不同尺寸的每個可能字符作為結構元素,采用擊中擊不中方法先提取輸入圖像中的字符,再根據牌照字符的語法得到汽車牌照,這種方法計算量非常大且易受噪聲影響。C.H.Poon提出了一種灰值形態(tài)學方法,它通過檢測字符中的直線段和字符間的空間來提取牌照,這種方法耗時較多,且沒有利用版照的尺寸信息。C.M.Hwang提出了空間頻率方法,它利用牌照區(qū)域內空間頻率變化大的特性,對圖像進行一階差分。差分圖在牌照區(qū)域內形成多個峰,然后利用峰的幅度、寬度和密度區(qū)分真正的牌照區(qū)域與類牌照區(qū)域。這種方法具耗時少、抗噪能力強的優(yōu)點。本文提出的灰值形態(tài)學方法僅利用了牌照區(qū)域內空間頻率變化大的特性而且利用了牌照區(qū)域字符筆劃具有高曲的特性,因而比單純的空間頻率方法更加有效。通過建立牌照與卷積算子形態(tài)學結構元素尺寸的相互關系。本文提出的方法對不同尺寸牌照具有很好的魯棒性。
1數字形態(tài)學
數字形態(tài)學是一種重要的數字圖像處理方法和理論。在數字形態(tài)學中,兩種最基本的變換或運算是腐蝕和膨脹,其它形態(tài)學變換都可通過它們來定義。下面列出了一些灰值形態(tài)學變換的定義。
圖像f(x,y)平移(a,b)定義為:
f(a,b)(x,y)=f(x-a,y-b)
圖像f(x,y)相對于原點的反射為:
f^(x,y)=f(-x,-y)
二幅圖像f(x,y)和g(x,y)的最小記為(f∧g)(x,y)。
當(x,y)位于圖像f的定義域D(f)和圖像g的定義域D(g)的交集D(f)∩D(g)內時:
(f∧g)(x,y)=min{f(x,y),g(x,y)}
否則:
(f∧g)(x,y)=0
二幅圖像f(x,y)和g(x,y)的最大記為(f∨g)(x,y)。
當(x,y)位于圖像f的定義域D(f)和圖像g的定義域D(g)的交集D(f)∩D(g)內時:
(f∨g)(x,y)=max{f(x,y),g(x,y)}
當(x,y)∈D(f)且(x,y)∈D(g)時
(f∨g)(x,y)=f(x,y)
當(x,y)∈D(g)且(x,y)∈D(f)時
(f∨g)(x,y)=g(x,y)
f(x,y)被g(x,y)膨脹定義為:
(fg)(x,y)=max{f(x-a,y-b)+g(a,b)}
(a,b)∈D(g)
f(x,y)被g(x,y)腐蝕定義為:
(fg)(x,y)=max{f(x-a,y-b)-g(a,b)}
(a,b)∈D(g)
開運算定義:
fog=(fg)g
閉運算定義:
f·g=(fg)g
Top-Hat變換定義:
Hat(f,g)=f-fog
與Top-Hat變換相對的是波谷檢測器(Valley變換),其定義為:
Valley(f,g)=(f·g)-f
形態(tài)學梯度有下面三種形式:
Grad(f)=f-(fg)
Grad(f)=(fg)-f
Grad(f)={[(fg)-(fg)]}/2
2牌照提取算法
在牌照提取算法中,需要用到卷積、模板卷積和卷積投影等概念。下面對它們進行定義。
對于圖像[aij]m×n,i=0...m-1,j=0...n-1,模板[aij]p×q。p<m,q<n,其卷積、模板卷積和卷積投影都是一維數組。
水平模板卷積
垂直模板卷積投影vmp:
水平模板卷積投影hmp:
圖1中牌照區(qū)域的長為173象素、高為36象素。從左到右、從上到下的8條曲線依次為牌照區(qū)域灰度圖第10~17條水平方向的灰度值。通過觀察發(fā)現(xiàn),在牌照區(qū)域的水平方向不令空間頻率變化大,而且具有許多陡峭的峰(欲)和高曲率點。而灰值形態(tài)學的梯度變換可以對圖像進行高通濾波,灰值形態(tài)學的Top-Hat變換和Valley變換可以撮高曲率點、波峰和波谷。
進行形態(tài)學變換,需要考慮二個因素:結構元素和變換類型。變換類型準備采用灰值形態(tài)學的梯度變換、Top-Hat變換和Valley變換。結果元素采用n×1的維水平結構,以提取水平方向上的高頻分量、波峰和波谷。結構元素的大小n對Top-Hat變換和Valley變換的結果結構元素的大小n對Top-Hat變換和Valley變換的結果有著很大的影響,因此問題的關鍵是怎樣確定n。
分析圖1中水平方向的灰度曲線,發(fā)現(xiàn)在穿過字符的水平線上,灰度曲線波峰的寬度與字符垂直筆劃的寬度存在著某種線性關系。根據中國汽車牌照的一般規(guī)范,牌照上字符的垂直筆劃寬度與牌照的寬度也存在著某種線性關系。結構元素的尺寸n與灰度曲線波峰的寬度又可建立一種線性關系。因此可建立n與牌照寬度w的一種近似線性的關系:
n=Integer{(w/k)+b}
式中的Integer()表示對括號內的值取整。w、b都為整數。根據經驗令w、b分別為25和0,則:
n=Integer(w/25)
由上式可知,當牌照的寬度w變化25個象素時,結構元素的大小n才變化1個單位,也就是說n對w不是很敏感。
牌照區(qū)域提取算法包括以下幾步:
(1)縮小圖像:對輸入的灰值汽車圖像進行隔行隔列抽樣,得到一幅大小為四分之一原因的新圖像。接下列抽樣,得到一幅大小為四分之一原圖的新圖像。接下來的處理均在新圖像上進行,這樣可以大大減少處理時間,提高算法的效率。根據形態(tài)學的尺度變換兼容性原理,對圖像縮?。ǚ糯螅┖笤龠M行形態(tài)學變換,只要對結構元素做相應的變換,結果不變。
(2)水平分割:對汽車圖像進行水平分割,得到幾個可能含牌照的水平區(qū)域。
(3)垂直分割:對第(2)步所得到的每一個水平區(qū)域進行垂直分割,得到一些牌照的候選區(qū)域。
(4)牌照區(qū)域甄別:分析各個候選區(qū)域得出真正的牌照區(qū)域。
2.1水平分割
分別對汽車圖像進行灰值形態(tài)學的梯度變換、Top-Hat變換和Valley變換,如圖2。一般來說,在大多數汽車車牌照自動識別系統(tǒng)應用中,CCD攝取的汽車圖像中牌照的大致寬度和高度是已知的。如果牌照的寬度為w∈(a,b),則取水平模板m×1,其中m=(a+b)/2。用模板分別對圖像的梯度圖、Top-Hat變換圖和Valley變換圖進行水平模板卷積。對每幀變換圖取每一行模板水平卷積的最大值,得到1個一維數組,3幅變換圖共得到3個一維數組g1,ti和vi,其中i大于等于1,而小于等于圖像的高度,其曲線如圖2的b、c、d。觀察圖2可以發(fā)現(xiàn),由于受車體上其它字符和車前燈等因素的影響,僅僅依靠梯度圖較難對牌照進行水平定位,而結合Top-Hat變換圖和Valley變換圖,能更好地對牌照進行水平定位。據此,構成了1個一維數組pi。
pi=gi×ti×vi
其曲線如圖3。取圖3中最高峰的位置作為牌照的水平中線,為了確保不會出錯,把次高峰也作為牌照的另一備選位置。了高峰和次高峰的位置,分割出2個寬為汽車圖像寬度,高為牌照的最大可能高度b的區(qū)域,如圖4中的a和b。
2.2垂直分割
對圖4中的a和b二個區(qū)域分別進行灰值形態(tài)學的梯度變換、Top-Hat變換和Valley變換,并在垂直方向對變換圖進行卷積得到3個一維數組gi、ti和vi,其中i大于等于1,而小于等于圖像的寬度w,其曲線如圖5和圖6。qi=gi×ti×vi
的曲線如圖7。利用下面的公式分別對圖4中的a和b進行垂直分割。
{(m,n)|qi>kT,i=m...n,n-m+1∈(a,b)}
其中:T=Max(qi),k為一經驗值,(a,b)為牌照的寬度范圍。
i=l...w
分割結果如圖8所示。
2.3牌照區(qū)域甄別
篇5
關鍵詞: 糧蟲檢測; 特征提取; RBF神經網絡; 圖像識別
中圖分類號: TN911.73?34; S24 文獻標識碼: A 文章編號: 1004?373X(2017)04?0107?04
Application of image recognition processing technology in agricultural engineering
ZHOU Qingsong, TANG Xiuzhong
(School of Technology, Puer University, Puer 665000, China)
Abstract: A grain insect detection method based on image recognition processing is studied. The image recognition processing technology is applied to the agricultural engineering. The gray processing, binaryzation, smoothing and sharpening techniques are used to preprocess the grain insect image to make it easier to conduct the edge detection and image feature extraction. The commonly?used four edge detection methods are adopted to detect the edge of the grain insect image under recognition. Eight regional descriptor features of the grain insect image are taken as the input characteristics of the grain insect recognition model. Three familiar grain insects of maize weevil, tribolium and coleoptera are selected as the research objects, and the identification model based on RBF neural network is used to recognize the geometric feature of three grain insect images.
Keywords: grain insect detection; feature extraction; RBF neural network; image recognition
0 引 言
目前儲糧害蟲問題是世界上很多國家所面臨的困難,在很多國家每年都會因為糧食害蟲而損失很多糧食。在遭受到糧食害蟲的侵害以后糧食的籽粒會被破壞,容易變質、Y塊、發(fā)熱以及發(fā)霉,另外在老化死去害蟲尸體、糞便以及有毒液體的影響下糧食會受到較為嚴重的污染[1]。
總的來說,目前主要有四種方法來檢測糧食害蟲:首先是取樣法,將所制作的扦樣器按照區(qū)域定點的方法安裝在儲糧庫內。采用電機或者人工的方法吸取糧食樣本,然后交由技術人員分類、鑒別以及篩選,這樣就可以對庫區(qū)糧食害蟲密度進行確定。這種方法需要較大的勞動量,降低了工作效率,另外人為主觀因素容易對最后的結果產生影響,因此產生了較大的誤差。其次是誘捕法,通過對糧食害蟲生理特性以及習性的利用來采取合適的誘捕方式,主要包括糧食害蟲生理特性誘集法以及陷阱式誘集法兩種。但是在應用誘捕法的過程中需要制作誘導劑以及提取糧食害蟲的信息素,由于具有較強的針對性,而且具有種類繁多的糧食害蟲,因此所消耗的成本比較大,所以以上兩種方法也存在著一定的缺陷。再次是聲測法,通過對聲音監(jiān)測裝置的應用,分析害蟲爬行以及吃食時的聲音,進而就可以獲取糧食害蟲密度信息。在應用這種方法的過程中會在周圍產生較大的噪音,同時需要花費較大的資金來制造聲音監(jiān)測裝置,所以目前這種方法并沒有得到廣泛的應用。最后一種方法是近紅外反射光譜識別法,糧食害蟲的C,H,N成分存在著很大的差距,因此就會產生不同的近紅外線光譜,這種不同種類的糧食害蟲就可以通過NIR 的掃描來進行識別。但是這種方法仍然存在著一定的缺陷,例如糧食的不完整顆粒以及顆粒大小等物理因素會對掃描結果產生一定的影響,使得無法獲得準確和清晰的NIR 掃描圖像[2?3]。
除了使用聲音檢測方法外,其他方法不利于實現(xiàn)自動化糧蟲檢測,人工檢測方法效率低、成本高,因此本文研究一種基于圖像識別處理的糧蟲檢測方法,將圖像識別處理技術應用于農業(yè)工程。
1 糧蟲圖像預處理
1.1 圖像灰度化處理
在分析糧蟲圖像的過程中首先需要進行圖像顏色之間的轉換,通常是將彩色轉換為灰色,這樣既能夠加快圖像的處理速度,另外還能夠方便地將處理后的信息向原來的圖像上進行轉移。
通常利用最大值法、加權平均法以及平均值法來進行彩色圖像和灰色圖像之間的轉換。本文在進行彩色圖像灰度化處理的過程中主要采用了最大值法,這種方法比較簡單,采用三原色R,G,B來對圖像的灰度值進行描述[4]。
1.2 二值化
采用二值化手段來處理糧蟲圖像,這樣能夠重點顯示對象區(qū)域,對于后續(xù)的分析和辨別非常有利。由于在灰度上目標圖像與背景圖像存在著較大的差距,因此可以根據灰度值的不同來對目標圖像進行區(qū)分。分別用0和1來表示目標圖像和背景圖像,這樣就能夠實現(xiàn)灰色圖像和二值圖像之間的轉換,具有較高的識別度。本文只對單個的背景和圖像進行了分析。因此在數據對比的過程中使用了一個閾值Th,達到分類像素群的目的。將圖像中的背景灰度值以及目標灰度值分別設置[5]為1和0。
1.3 圖像平滑
本文使用鄰域平均法對糧蟲圖像進行平滑處理。所應用的均值濾波的鄰域平均法實際上就是進行空域平滑處理,首先在相同的窗口上放置圖像,平均所有的像素灰度值,通過對中心部位像素灰度值的替代就能夠達到平滑的目的。均值濾波和低通濾波器具有相同的作用,輸出的圖像可以用離散卷積來進行表示[6]。
1.4 圖像銳化
通過對圖像的銳化處理能夠達到修復外部形狀以及進行圖像邊緣聚焦的目的。通過圖像灰度顏色的加深以及外援色彩數值的對比能夠對圖像的清晰度進行提升。目前Sobel算子、Laplace算子以及Robert算子是圖像銳化過程中經常采用的算子,本文在圖像銳化的過程中采用了Robert算子。
2 邊緣檢測
在經過上述的預處理后,能夠顯著地提升圖像的質量,但是還需要采用圖像邊緣檢測技術來對圖像中的背景和目標進行區(qū)分[7]。
(1) Roberts 邊緣檢測算子。Roberts 邊緣檢測算子是使用局部差分算法實現(xiàn)。其中原始圖像用f(x,y)表示,邊緣檢測后輸出的圖像用g(x,y)表示:
(1)
利用互相垂直方向上的差分Roberts 邊緣檢測算子就可以對梯度進行計算,另外邊緣之間的檢測可以利用對角線方向相鄰像素之差來實現(xiàn)。
通過對模板的利用能夠對Roberts 的梯度幅度G進行計算,進而得到合適的閾值T,當G>T時,該點就是階躍邊緣點,進而獲取邊緣圖像。
(2) Sobel 邊緣檢測算子。Sobel邊緣檢測算子考察各個像素的鄰域加權差,加權差值最大的點就是邊緣點:
(2)
算子模板為:
(3)
(3) Prewitt 邊緣檢測算子。算子和算子具有相似的特點:
(4)
算子模板為:
(5)
(4) Laplacian 邊緣檢測算子。邊緣檢測算子,通過在邊緣處產生陡峭的零交叉來實現(xiàn)邊緣檢測的目的[8]:
(6)
本文選取常見的玉米象、擬谷盜和鋸谷盜三種糧蟲為研究對象,使用上述四種邊緣檢測方法對糧蟲圖像邊緣進行檢測,其中檢測效果最好的是使用邊緣檢測算子,檢測效果最差的是使用邊緣檢測算子。兩種算子檢測結果如圖1所示。
圖1 兩種算子對玉米象、擬谷盜和鋸谷盜三種糧蟲的邊緣檢測
3 糧蟲圖像特征提取
區(qū)域描述子特征在圖像分析的過程中具有非常強的實用效果。因此本文使用糧蟲圖像的八種區(qū)域描述子特征作為糧蟲識別模型的輸入特征[9?10]:
(1) 面積A:圖像中待識別對象面積像素點個數總和:
(7)
(2) 周長P:待識別對象的周長:
(8)
式中,SUM(in)為4鄰域內像素均為待識別對象的像素個數總和。
(3) 相對面積RA:待識別對象面積占圖像總體比例:
(9)
(4) 延伸率S:待R別糧蟲圖像的最小外接矩形的寬度比上長度值[11]:
(10)
(5) 復雜度C:待識別對象緊湊性:
(11)
(6) 占空比B:反應待識別對象的復雜程度:
(12)
(7) 等效面積圓半徑R:
(13)
(8) 偏心率E:待識別對象長短軸長度之比,描述了待識別對象的緊湊性,使用Tenebaum近似計算公式對偏心率E求解:
平均向量求解:
(14)
j+k階中心矩求解:
(15)
方向角求解:
(16)
偏心率E近似求解[12?13]:
(17)
4 糧蟲識別實驗
本文選取常見的玉米象、擬谷盜和鋸谷盜三種糧蟲為研究對象,對其圖像進行處理識別。分別使用邊緣檢測算子、邊緣檢測算子、邊緣檢測算子和邊緣檢測算子對其圖像進行邊緣檢測,并提取其圖像的面積A、周長P、相對面積RA、延伸率S、復雜度C、占空比B、等效面積圓半徑R和偏心率E這八個特征用于對三種糧蟲的識別,具體特征值如表1所示。
使用基于RBF神經網絡的識別模型對三種糧蟲圖像的幾何形態(tài)特征進行識別,識別原理如圖2所示。
選取50張玉米象圖像、50張擬谷盜圖像和50張鋸谷盜圖像以及20張無糧蟲圖像對基于RBF神經網絡的識別模型進行訓練,提高其識別糧蟲圖像的泛化能力。
基于RBF神經網絡的識別模型的輸入向量為糧蟲圖像的八種特征,即輸入節(jié)點數為8;基于RBF神經網絡的識別模型的輸出向量結果為玉米象圖像、擬谷盜圖像、鋸谷盜圖像以及無糧蟲圖像4種,即輸出節(jié)點數為4;隱含層節(jié)點數根據經驗公式計算。
分別使用20張玉米象圖像、20張擬谷盜圖像和20張鋸谷盜圖像對訓練后的基于RBF神經網絡的識別模型進行測試。
能夠得到使用邊緣檢測算子、邊緣檢測算子、邊緣檢測算子和邊緣檢測算子對其圖像進行邊緣檢測后,以及使用基于RBF神經網絡的識別模型對糧蟲圖像的識別結果如圖3所示。
從基于RBF神經網絡識別模型的糧蟲識別結果可以看出,分別使用邊緣檢測算子、邊緣檢測算子、邊緣檢測算子和邊緣檢測算子對其圖像進行邊緣檢測后,識別模型對三種糧蟲的平均識別率為80.65%,81.96%,80.34%和78.56%,說明在其他情況相同情況下,使用Sobel 邊緣檢測算子對糧蟲圖像邊緣檢測對于糧蟲圖像識別準確率是最有利的,而使用Laplacian 邊緣檢測算子后糧蟲圖像的識別率最低。
5 結 論
本文研究一種基于圖像識別處理的糧蟲檢測方法,將圖像識別處理技術應用于農業(yè)工程。選取常見的玉米象、擬谷盜和鋸谷盜三種糧蟲為研究對象,對其圖像進行處理識別。分別使用邊緣檢測算子、邊緣檢測算子、邊緣檢測算子和邊緣檢測算子對其圖像進行邊緣檢測,并提取其圖像的面eA、周長P、相對面積RA、延伸率S、復雜度C、占空比B、等效面積圓半徑R和偏心率E這八個特征用于對三種糧蟲的識別,使用基于RBF神經網絡的識別模型對三種糧蟲圖像的幾何形態(tài)特征進行識別。結果表明,在本文的研究條件下,使用邊緣檢測算子對糧蟲圖像邊緣檢測對于糧蟲圖像識別準確率是最有利的,而使用邊緣檢測算子后糧蟲圖像的識別率最低。
參考文獻
[1] 代亭.糧食害蟲智能檢測及分類方法研究[D].鄭州:河南工業(yè)大學,2012.
[2] 張明真.儲糧害蟲活動聲信號識別研究[D].西安:陜西師范大學,2013.
[3] 張紅濤.儲糧害蟲圖像識別中的特征抽取研究[D].鄭州:鄭州大學,2002.
[4] 張成花.基于圖像識別的儲糧害蟲分類的研究[D].鄭州:鄭州大學,2002.
[5] 韓瑞珍.基于機器視覺的農田害蟲快速檢測與識別研究[D].杭州:浙江大學,2014.
[6] 葛恒赫.基于機器視覺的外螺紋表面缺陷檢測技術研究[D].重慶:重慶大學,2014.
[7] 王凡.基于機器視覺的螺紋缺陷檢測技術研究和系統(tǒng)開發(fā)[D].成都:電子科技大學,2011.
[8] 梅雪.基于圖像識別的儲糧害蟲檢測專家系統(tǒng)的研究[D].北京:北京郵電大學,2009.
[9] 張衛(wèi)芳.基于圖像處理的儲糧害蟲檢測方法研究[D].西安:陜西師范大學,2010.
[10] 張紅梅,范艷峰,田耕.基于數字圖像處理技術的儲糧害蟲分類識別研究[J].河南工業(yè)大學學報(自然科學版),2005(1):19?22.
[11] 胡祝華,趙瑤池,白勇,等.基于圖像處理技術的儲糧害蟲快速識別[J].安徽農業(yè)科學,2014(30):10784?10787.
[12] 蘇庭奕.基于圖像處理的儲糧害蟲檢測及識別方法研究[D].鄭州:河南工業(yè)大學,2015.
篇6
關鍵詞:小波變換,非整數次諧波,諧波檢測
1 引言
近年來,隨著電力電子技術的迅速發(fā)展,各種變頻器、變流器、開關電源和電抗器等非線性設備的應用日益增多,產生了大量的高次諧波,造成電力系統(tǒng)電壓、電流嚴重畸變,引發(fā)了一系列問題。
傳統(tǒng)的快速傅氏變換以求和替代積分,以降低精度為代價來提取實時性,可以得出各次諧波的幅值相位。
瞬時無功功率理論自20世紀80年代提出后,突破了傳統(tǒng)的平均值為基礎的功率定義,具有較好的實時性,抗干擾能力強。
神經網絡方法其特點是算法基于誤差曲面上的梯度下降,權調數量與輸入量一致,并保持與誤差的負梯度方向一致,因此能保證網絡的收斂性。
小波變換理論適合于對局部頻域進行精確分析,它提供了一個自適應的可調采樣窗口,具有更強的實時性。而且小波變換理論分析時頻問題的良好特性使得它在檢測非整數次諧波方面優(yōu)于其他理論。本文采用連續(xù)小波變換分析系統(tǒng)中的整數次與非整數次諧波,并通過Matlab仿真得到了較好的分析結果,表明了小波變換具有檢測電力系統(tǒng)中各種諧波的良好功能。
2 諧波檢測原理
小波變換公式:。論文格式。
其中,為小波基函數,a為伸縮因子,為平移因子,x(t)為待分析信號。
由上式可知,小波變換實質上是信號x(t)與小波母函數的卷積,是對信號滿足一定附加條件的濾波。而濾波的范圍則是由參數α, 來決定,反映在小波母函數和小波因子的選擇上??梢?,小波變換是按頻帶而不是按頻點的方式處理頻域,因此信號頻率的微小波動不會對處理產生很大影響,且不要求對信號進行整周期采樣;其次,由小波變換的時間局部性可知,在信號局部發(fā)生波動時,它不會像傅立葉變換那樣把影響擴散到整個頻譜,而只改變當時一小段時間的頻譜分布,這使其可以跟蹤時變信號和暫態(tài)信號。
由于小波變換具有良好的時頻局部化特征,使得小波變換應用于電力系統(tǒng)的諧波檢測有著很好的理論基礎,可以根據不同尺度的小波變換系數的幅值來測量諧波的頻率。由連續(xù)小波變換公式可見,信號的連續(xù)小波變換相當于信號通過有限長的帶通濾波器不同的尺度因子α決定帶通濾波器的帶通特性。如果能夠使不同頻率的諧波位于不同的頻帶中,就能夠把包括整數次非整數次的不同頻率的諧波分離出來。因此,利用小波變換可以實現(xiàn)整數次和非整數次的諧波含量的測量。
本文中采用Daubechies小波對函數進行小波變換。論文格式。一般將其簡寫為dbN,N是小波的階數。dbN沒有明確的表達式(除了N=1外),但轉換函數h的平方模是很明確的。
令,其中為二項式的系數,則有:
式中,。
3 仿真結果分析
對本文提出的檢測方法進行數字仿真,其中3.1是對于含有基波、2、3.4次諧波檢測信號的仿真,3.2是對含噪的的諧波信號檢測的仿真。論文格式。
3.1 含有基波、2、3.4次諧波檢測信號的仿真
由于非線性元件和電力電子器件的廣泛應用,使電力系統(tǒng)中存在著大量的整數次與非整數次諧波。采樣一個周期,而系統(tǒng)中分別有基波、2、3.4次諧波時,采用db3小波對信號進行5層分解。
圖1 線形組合后的信號
圖2 小波分解后各層的逼近信號
圖3 小波分解后各層的細節(jié)信號
當信號中含有基波、2次、3.4次諧波時,其線形組合后的信號如圖1所示,對組合信號進行5層db3分解后的逼近信號如圖2所示,細節(jié)信號如圖3所示。從圖2可以看出,逼近信號a1顯示了3.4次諧波,逼近信號a2顯示了基波,二次諧波則出現(xiàn)在細節(jié)信號d2中。由此可知,對于常規(guī)傅立葉變換不能檢測非整數次諧波的問題,可以利用小波變換分析系統(tǒng)中存在的非整次諧波。通過分析小波變換對諧波檢測的特點,選用了db3小波變換并分析了含有非整次諧波的系統(tǒng),證明了小波變換對于解決含有非整次諧波的檢測和分析具有良好的特性。
3.2對含噪的諧波信號的仿真
在電網電壓中,由于各種現(xiàn)代電力電子設備的干擾,不但存在諧波信號,而且有著廣泛的噪聲信號。采樣一個周期,而系統(tǒng)中分別含有3.7次諧波和噪聲信號時,采用db3小波對信號進行5層分解。
圖4 含噪聲信號線形組合后的信號
圖5 含噪聲信號小波分解后各層的逼近信號
圖6 含噪聲信號小波分解后各層的細節(jié)信號
當信號中含有3.7次諧波和噪聲信號時,其線形組合后的信號如圖4所示,對組合信號進行5層db3分解后的逼近信號如圖5所示,細節(jié)信號如圖6所示。從圖6可以看出,3.7次諧波體現(xiàn)在逼近信號部分,而白噪聲體現(xiàn)在細節(jié)信號部分。由此可知,小波變換不但具有良好的非整次諧波的檢測能力還具有良好的噪聲分辨能力。
4 結論
小波變換是針對快速傅立葉變換在分析非穩(wěn)態(tài)信號方面的局限性形成和發(fā)展起來的一種十分有效的時頻分析工具,它克服了快速傅立葉變換的缺點,采用不同尺度的分析方法,能在信號的不同部位得到最佳的時域分辨率和頻域分辨率,為非穩(wěn)態(tài)信號的分析提供了一條新的途徑,通過本文的仿真可知,它對于含有整數次、非整數次諧波和含噪諧波的檢測有著很大的優(yōu)越性。
參考文獻
1 石國萍、田立軍. 基于小波變換的統(tǒng)一電能質量控制器檢測方法研究. 2004,16(1):34-37
2 林易群等. 基于小波多孔算法的暫態(tài)電能質量檢測方法. 中國電力,2002,35(10):54-57
3 張慶超. 基于小波神經網絡的輸電線路故障檢測. 天津大學學報,2003,36(6):710-713
4 薛蕙、楊仁剛. 利用Morlet連續(xù)小波實現(xiàn)非整次諧波檢測. 電網技術,2002,26(12):41-44
5 歐陽森. 基于小波原理的電能質量檢測數據實時壓縮方法. 電網技術,2003,27(2):37-39
篇7
關鍵詞: 數字信號處理課程 教學改革 優(yōu)化知識結構 加強實驗教學 綜合化教學模式
數字信號處理所涉及的內容非常繁多、廣泛。其所應用的數學工具涉及微積分、隨機過程、數值分析、復變函數和各種變換等;其理論基礎包括網絡理論、信號與系統(tǒng)、神經網絡等;其應用領域包括通信、雷達、人工智能、模式識別、航空航天、圖像處理、語音處理等。在GSM手機中應用數字信號處理技術可將語音壓縮至13kps;在語音信箱、留言電話方面也均可以采用數字信號處理技術。
學生在學習數字信號處理課程時,常常會覺得枯燥乏味,不僅覺得概念抽象,而且對其中的分析方法與基本理論不能很好地理解與掌握。為了有利于學生系統(tǒng)地理解和掌握課程中的基本內容,充分鍛煉實驗的應用能力,我對數字信號處理課程的教學進行了針對性的改革與探討。
1.優(yōu)化知識結構
數字信號處理課程中知識點比較多,數學推導十分復雜。我通過對本門課程進行深入研究,類比各知識點,發(fā)現(xiàn)有一條線路貫穿于課程之中,只要在課程教學中把握好這條線路,復雜的數學推導將會變得清晰,容易識記。我將該課程優(yōu)化成兩大模塊:變換域的知識結構和數字濾波器的知識結構。
1.1變換域的知識結構
變換域的知識結構是該課程的第一大模塊結構。先引入時域離散信號與系統(tǒng),通過時域采樣定理對模擬信號進行采樣得到離散時間信號(序列)內容進行展開討論,對于幾種典型序列和時域離散系統(tǒng)性質:線性、時不變、因果性和穩(wěn)定性進行重點介紹。其次講述DTFT、DFS、ZT(IZT)、DFT變換的定義、性質和定理。其中每個變換都遵循嚴密的數學推理,都圍繞著變換的定義、性質和定理展開內容講解。在教學過程中除了詳細講解各個知識點之外,還要建立之間的聯(lián)系,歸納出變換之間的聯(lián)系如圖1所示。在建立聯(lián)系時不僅要從數學公式上進行變換證明,而且要用物理意義進行直觀的講解,使學生能夠完全掌握。例如DTFT是單位圓上的Z變換,DFT是DTFT的等間隔采樣,等等。
1.2數字濾波器的知識結構
數字濾波器的知識結構是該課程的第二大模塊結構,其主要圍繞數字濾波器網絡結構及其設計方法展開討論。數字濾波器的網絡結構分為:IIR網絡結構和FIR網絡結構。通過狀態(tài)變量分析法對網絡結構進行分析,確定狀態(tài)變量,求出狀態(tài)方程和輸出方程。應用脈沖響應不變法和雙線性變換法設計低通、帶通IIR數字濾波器,分析理解兩種具體方法的特點和區(qū)別,與分別設計的數字濾波器的頻域特性。窗函數法和頻率采樣法是設計FIR濾波器基本方法,通過實驗使學生熟悉線性相位FIR濾波器的幅頻特性和相頻特性,了解不同窗函數對濾波器性能的影響。數字濾波器的設計和網絡結構分析如圖2所示。
2.加強實驗教學
數字信號處理課程中的理論和結論大都是經過數學推導得來的,比較抽象,也較難理解。MATLAB語言對諸如離散線性卷積、循環(huán)卷積、抽樣定理、對Z變換進行等間隔采樣實現(xiàn)DFT、數字濾波器設計等一系列問題都可通過圖形建模使之可視化。實驗教學平臺可以選擇MATLAB軟件平臺和DSP硬件平臺,MATLAB軟件平臺主要用來演示數字信號處理的概念、性質和原理。例如序列的傅立葉變換、Z變換、離散傅立葉變換的概念和性質等;硬件平臺主要實現(xiàn)數字信號處理的算法,例如卷積、FFT算法、FIR濾波器和IIR濾波器設計方法等。
2.1基于MATLAB基礎理論實驗
數字信號處理課程具有理論性強和應用性強等特點,在教學中教師要加強理論教學。實驗教學的設計可以更好地讓學生理解理論教學內容,具有啟發(fā)性,能培養(yǎng)學生的思考能力和科研能力。
針對理論知識點的內容,可將實驗各部分的內容劃為:系統(tǒng)響應及系統(tǒng)穩(wěn)定性;時域采樣與頻域采樣;用FFT對信號作頻譜分析;IIR數字濾波器設計及軟件實現(xiàn);FIR數字濾波器設計與軟件實現(xiàn)。對于所涉及的實驗教學內容,要突出強調對實驗結果的“物理意義”的理解,使知識點覆蓋基本完整且重點突出。
2.2綜合性課程設計
在基礎理論實驗的基礎上,為了充分調動學生主動學習的積極性,提高學生鉆研科學的興趣,綜合性課程設計是非常有必要的。其可以充分發(fā)揮學生的主觀能動性,更有利于培養(yǎng)他們獨立思考、善于創(chuàng)造、綜合運用知識的能力。
根據數字信號處理在雙音多頻撥號系統(tǒng)中的實際應用,我進行了綜合性、設計性實驗的探討。雙音多頻(Dual Tone Multi Frequency,DTMF)信號是音頻電話中的撥號信號。DTMF信號系統(tǒng)是一個典型的小型信號處理系統(tǒng),它用數字方法產生模擬信號并進行傳輸,其中還用到了D/A變換器;在接收端用A/D變換器將其轉換成數字信號,并進行數字信號處理與識別。
3.綜合化教學模式
由于數字信號處理的DTFT、DFS、ZT(IZT)、DFT變換的定義、性質和定理和數字濾波器設計的內容涉及的公式繁多、概念抽象,在學習過程中,學生對其都具有犯難情緒,因而在授課中需要采用形象化教學方法、多樣化教學手段、創(chuàng)造自主化學習情境,提高學生的學習興趣,幫助學生理解公式的物理意義,便于對知識的識記和應用。
3.1形象化教學方法
數字信號處理課程中大量的抽象概念都是用繁瑣的公式來描述,其推導過程也相當復雜。在實際的教學中,教師需要采用課程板書的形式,讓學生跟上你的思路一步一步去解析公式,完全細化每一個變換的來源。而不是急于把最新的知識、最新的技術一股腦地塞給學生。教師在教學中,必須從公式所代表的具體意義去理解公式,注重物理意義的表達,也要相信學生在打好基礎后,能舉一反三,學一知十,例如:X(k)=X(e)|k=0,1,…,N-1,說明X(k)為x(n)的傅里葉變換X(e)在區(qū)間[0,2π]上的N點等間隔采樣。在講解相關抽象化的知識點時,教師可采用繪制波形圖或框圖的方法將抽象概念形象化,用直觀圖形進行解讀公式的意義。在教學中,教師可采取合理應用形象化的方法,培養(yǎng)學生看到公式可以聯(lián)想到公式的物理意義,突破公式難懂難記的問題。
3.2多樣化教學手段
在習題課和一些基本原理、基本方法的推導和證明中,教師要采用課堂板書形式,解答思路清晰,在板書的過程中,也要留給學生足夠的時間進行領會。
對于難以理解的抽象概念,需要用形象化的圖形來進行解析,采用多媒體教學手段,可以節(jié)約大量的板書時間,可以化抽象為形象,化枯燥為生動,增加課堂信息量,使學生把重點放到加深對抽象概念的理解上。同時,PPT要有一定的吸引力,比如適當地粘貼一些圖片性內容,遠比文字要形象和生動,還可以粘貼一些調節(jié)氣氛的有意思圖片,但不可太花哨,速度要放慢,講一行放一行,切不可地所有的一次都放出來,否則容易誤導學生去費勁地閱讀PPT上的文字。多媒體教學手段與傳統(tǒng)的板書教學相融合,不但可以發(fā)揮多媒體手段信息量大、形象、直觀等優(yōu)勢,而且板書可以對多媒體的推導細節(jié)進行補充,放慢上課節(jié)奏,使教學邏輯更嚴密、交互性更強,其實際效果比單獨使用其中的一種都要好。
3.3自主化學習情境
在實際教學中,教師要站在學生的立場上,找到學習入門的最好切入點:結合課堂提問、作業(yè)布置、習題講解等手段,使學生達到基本的教學要求。適當地提問,可以檢驗學生學得怎么樣,將學生的狀況及時的反饋給老師,老師再適當地在教學中作調整,將取得很好的教學效果,同時也可加強與學生的雙向交流,活躍課堂氣氛。
由于該門課程比較抽象,公式又相對繁瑣,單靠課堂講解學生當時可能聽得明白,但是課后若不加以鞏固,掌握情況也不會太理想,因此每次課后要給學生布置適量的作業(yè),通過批改作業(yè)來發(fā)現(xiàn)存在的問題并及時解決。
3.4完善化考試模式
本門課程的成績考核采取傳統(tǒng)模式,即由平時表現(xiàn)成績、期末筆試成績按比例綜合計算。這樣的考核方式簡單易于操作,這也是一些學生不重視實驗、不注重如何應用所學知識解決實際問題的原因之一,結果造成理論聯(lián)系實際和解決實際問題的能力差。
完善化考試模式,增加上機考試,要求MATLAB上機考試,這能極大地強化學生的自主學習能力及動手實踐能力。
4.結語
我針對數字信號處理課程的特點,應用知識的連貫性,建立了各個知識點之間的聯(lián)系,便于學生理解與聯(lián)想記憶。MATLAB的引入為數字信號處理教學提供了全新的方法,激發(fā)了學生的學習興趣,變被動學習為主動探索,加強了理論與實踐相結合,提高了綜合運用知識及解決實際問題的能力。采用了傳統(tǒng)板書和多媒體教學相結合的手段,提高了學生的學習興趣,做到了用中學、學中用,使學生大大增強了學習的興趣。
參考文獻:
[1]高西全,丁玉美.數字信號處理[M].陜西:西安電子科技大學出版社,2008.
[2]A?V?奧本海姆,R?W?謝弗.離散時間信號處理[M].西安:西安交通大學出版社,2001.
[3]姜恩華.數字信號處理課程“教與學”探索[J].淮北煤炭師范學院學報,2009,30,(3):78-81.
[4]王祥春.“數字信號處理”教學方法探討[J].科技創(chuàng)新導報,2010,16:248.
篇8
論文關鍵詞:圖像盲恢復現(xiàn)狀前景
論文摘要:當點擴展函數未知或不確知的情況下,從觀察到的退化圖像中恢復原始圖像的過程稱為圖像盲復原。近年來,圖像盲復原算法得到了廣泛的研究。本文在介紹了盲圖像恢復算法的現(xiàn)狀的基礎上進一步研究其的發(fā)展方向。
一、引言
圖像恢復是圖像處理中的一大領域,有著廣泛的應用,正成為當前研究的熱點。圖像恢復的主要目的是使退化圖像經過一定的加工處理,去掉退化因素,以最大的保真度恢復成原來的圖像。傳統(tǒng)的圖像恢復假設圖像的降質模型是己知的。而許多情況下,圖像的降質模型未知或具有較少的先驗知識,必須進行所謂的盲恢復。其重要性和艱巨性而成為一個研究熱點。目前所能獲取的觀測圖像是真實圖像經過觀測系統(tǒng)成像的結果。由于觀測系統(tǒng)本身物理特性的限制,同時受觀測環(huán)境的影響,觀測圖像和真實圖像之間不可避免地存在著偏差和失真,稱觀測系統(tǒng)對真實圖像產生了降質。圖像恢復的目的就是根據降質的觀測圖像分析和計算得出真實圖像。
二、圖像盲恢復算法的現(xiàn)狀
總體來說,圖像盲復原方法主要分為以下兩類:一是首先利用真實圖像的特別特征估計PSF,然后借助估計得到的PSF,采用經典的圖像復原方法進行圖像的復原。這類方法將PSF的估計與圖像的復原過程分為2個不同的過程,因而具有較少計算量的特點;二是PSF辨識和真實圖像估計相結合,同時辨識PSF和真實圖像。這類算法較為復雜,計算量較大。另外,對于點擴展函數也考慮了空間變化的復雜情況。針對目前的盲復原算法的現(xiàn)狀,根據退化模型的特點,重新將算法分為空間不變的單通道盲復原算法、空間不變多通道盲復原算法和空間變化圖像盲復原算法3類。
(一)單通道空間不變圖像盲復原算法
在這類算法中,最為常用的是參數法和迭代法。
1)參數法。所謂參數法,即模型參數法,就是將PSF和真實圖像用某一類模型加以描述,但模型的參數需要進行辨識。在參數法中,典型的有先驗模糊辨識法和ARMA參數估計法,前者先辨識PSF的模型參數,后辨識真實圖像,屬于第1種類型的圖像盲復原算法,因而計算量較??;后者同時辨識PSF和真實圖像模型參數,屬于第2種類型圖像盲復原算法。
2)迭代法。所謂的迭代法,不是通過建立模型而是通過算法的迭代過程,加上有關真實圖像和PSF的約束來同時辨識PSF和真實圖像的方法。迭代法是單通道
圖像盲復原算法中應用最廣泛的一類算法,它不需建立模型,也不要求PSF為最小相位系統(tǒng),因而跟實際更為接近。在這類算法中,迭代盲復原算法(IBD),基于非負性和決策域的遞歸逆濾波器算法(NAR2RIF),基于高階統(tǒng)計特性的最小
熵算法等最為典型。
(二)多通道二維圖像盲復原
多通道二維圖像盲復原,這類方法將數字通訊領域應用的一維多通道盲原分離算法擴展到二維情況并用于圖像的盲恢復。這類算法中有兩種代數方法,一種是先辨識模糊函數,再采用常規(guī)的恢復算法進行復原;另一種是直接對逆濾波器進行估計。此類算法的優(yōu)點在于不需對初始圖像進行估計,也不存在穩(wěn)定性和收斂性問題,對圖像以及模糊函數的約束是松弛的,算法具有一般性。但是第1種算法要求采用復原算法具有收斂性;第2種算法對噪聲敏感。
(三)空間改變的圖像盲復原方法
在許多實際的應用中,模糊往往是空間變化的,但由于處理工作的難度,目前的研究較少,基本有相關轉換恢復和直接法兩類。
相關轉換恢復的基本思想是區(qū)域分割,即將整幅圖像分為若干局部區(qū)域,然后假設在各個局部區(qū)域模糊是空間不變的,利用空間不變的圖像復原有關算法進行復原。這類方法都是基于窗口的模糊辨識技術,圖像的估計取決于窗口的大小,由于模糊參數是連續(xù)變化的,在范圍較大時空間不變的假設是不成立的,因而模糊的估計精度較差,而且這種方法只能針對部分空間變化的模糊進行處理,缺乏通用性;其次在區(qū)域的邊上存在振鈴現(xiàn)象。
直接法的基本思想是直接對圖像進行處理。如采用簡化的二維遞推卡爾曼濾波器進行圖像模型和模糊模型的直接轉換方法,其缺點是只能針對有限的模型,而且模型數增加,計算量會顯著增大;采用共軛梯度迭代算法,但只見到一個31×31的文本圖像處理的結果報道,對于大圖像處理效果尚需進一步的研究;將空間變化圖像系統(tǒng)建立成馬爾苛夫隨機模型,對復原過程,采用模擬退火算法進行最大后驗估計的方法,這種方法避免了圖像的窗口化,并能克服模糊參數不連續(xù)性造成的影響,但這種方法只能局限于將模糊過程建立成單參數的馬爾苛夫隨機模型的情況,而且計算量也較大。
三、圖像盲恢復的應用前景
(1)現(xiàn)有算法的改進以及新的算法研究?,F(xiàn)有各種算法還存在許多不足,有必要對算法進一步改進。如IBD算法中,如何選擇初始條件才能保證算法的收斂;如何選擇算法終止條件才能保證恢復的質量;如何選擇濾波器中的噪聲參數才能減少噪聲的影響。又如NAR2RIF算法中,如何進一步解決噪聲敏感問題,支持域的確定以及如何將算法擴展到非均勻背景的情況等。提出新的算法更好地解決圖像盲復原問題,也是今后研究的熱點。
(2)基于非線性退化模型的圖像盲復原算法。在實際應用中,嚴格來講,所有的退化模型都是非線性的。對模型采用線性化的方法進行近似處理,雖然算法簡單,但對非線性嚴重的情況處理效果并不理想?;诙囗検揭约吧窠浘W絡兩種參數模型處理非線性信號盲分離算法,算法擴展到二維圖像情況需要進一步研究。研究基于非線性退化模型的圖像盲復原算法也是下一步研究方向之一。
(3)去噪處理算法研究。加性噪聲的存在,使圖像的復原問題變成了一個病態(tài)問題,而且由于一般假設只知道噪聲的統(tǒng)計特性,因此要從退化圖像中完全去除噪聲是不可能的。另外,由于噪聲的存在,恢復的效果并不理想,結合降噪的圖像盲恢復的算法研究有很現(xiàn)實的意義,這方面也進行了部分工作。為克服噪聲的影響,一般采用先進行降噪,后進行復原;二是將降噪和復原同時進行這兩類方法。目前,大多數算法中將噪聲描述成高斯噪聲進行研究,在實際應用時有較大局限性。對于非高斯情況的研究采用基于噪聲的高階統(tǒng)計特性的去噪算法研究也是很重要的研究方向,也可采用其他類型的方法進行降噪,利用自組織映射的非線性獨立組件分析方法進行圖像降噪處理算法。
篇9
關鍵詞:化學計量 化學分析 重要作用
隨著科學技術的發(fā)展,化學計量在日常生活中發(fā)揮了越來越的作用?;瘜W計量學包括了整個化學量測的過程,主要有采樣理論、實驗設計、實驗條件、選擇和優(yōu)化、數據分析以及單變量和多變量信號的處理,這些都滲透了化學計量的應用?;瘜W計量學主要是對化學的一些測量數據進行分析和處理,通過對測量程序的設計和選擇,應用實驗方法,將這些測量數據進行全面的解析,從而獲取更多的化學信息?;瘜W計量學的應用,對化學實驗設計、信號解析、化學分類等都起到了很大程度的作用,打破了我國傳統(tǒng)的化學研究方法困難復雜的局面。
1、化學計量學對化學測量的作用
隨著國家的經濟和技術的不斷發(fā)展,越來越多的化學儀器和化學技術被不斷的開發(fā)和應用,分析化學的體系也不斷得到健全和完善,分析測試工作也開始向自動化、儀器化以及計算機化的方向進行發(fā)展。在目前,分析儀器的應用為分析工作的研究提供了大量的測量數據,具有較高的準確性和可靠性。如何將這些復雜的化學測量數據進行科學解析,也成為了分析工作者的難題之一。
化學計量在食品安全的實驗室測量過程同樣中發(fā)揮了重要作用,例如對奶粉中三氯氰胺含量的檢測,對食品中蘇丹紅的檢測等?;瘜W計量方法的應用,使得這些食品中蘊含的有效信息能夠完整地被挖掘,使數據的利用率得到了很大的提高?;瘜W計量學的應用,給化學測量提供了一套有效的科學方法,為化學領域的研究和發(fā)展注入了新的動力。
2、化學計量學在化學分析中的應用
化學計量學與化學分析有著密切的聯(lián)系,化學計量學主要由化學分析的信息理論基礎、化學測量過程的試驗設計和優(yōu)化、化學測量數據的多元校正和多元分辯的定性定量解析、化學采樣理論與方法等,內容涉及的研究和技術十分廣泛,應用的領域范圍也較大。
2.1 化學定量構效關系的應用
化學定量構效關系是化學科目中一個基本問題,主要是指從物質的化學成分與構成對其化學特性進行分析,是理論化學中一個十分重要的學習內容和研究目標。在化學定量構效關系的研究,主要通過圖論和數值方法對化合物分子進行分析,將其結果與實際測量化合物的特性有效結合,對其化學特性進行明確的特性定義。在目前的研究發(fā)展中,化學定量構效關系在分子力學的尋優(yōu)中引入了最優(yōu)算法,對最佳先導化合物的尋找進行了有效的指導,得到了廣泛的應用。
2.2 模式識別法的應用
模式識別法主要是通過對化學量測數據矩陣的分析,結合某種性質對樣本進行有效的分類和選取。模式識別法主要包括了線性判別分析法、SMCA法以及K-最鄰近法。模式識別法的應用和研究,為化學研究的決策和優(yōu)化提供了價值性信息,為一些較為困難的實驗研究提供了新的思路方向。
2.3波譜化學的應用
如何通過現(xiàn)有的波譜數據庫,對定性定量進行迅速分析,這一直是一個很大的難題。智能數據庫和化學計量學的應用,使定性定量分析工作有了新的發(fā)展。濾波、平滑、變換、卷積等技術的不斷推廣和應用,為化學分析工作提供了新的解析途徑,同時也提供了無需分離即可對存在互向干擾關系的共存物種進行測定。波譜數據庫和專家系統(tǒng)也在一些大學和研究單位得到了廣泛的應用。
2.4 多元校正分析法的應用
多元分析法的不斷發(fā)展和完善,其研究對象也日益復雜,因此需要分析工作者要準確和迅速的提供定性定量,并提供結構分析的結果。多元校正法主要是針對了現(xiàn)代的分析儀器的一些量測數據,通過這些數據的提供從而進行解析,是一種數學統(tǒng)計方法。在目前,多元分析法的靈敏度、檢測限、緊密度、準確性等指標被不斷研究和分析,指標也經過了不斷的優(yōu)化和完善,分析儀器的功能也因此得到了更大的擴展空間,其分析方法的有效性和實用性也得到了更多人的認可。在對正交設計、因子設計、析因設計以及均勻設計等方法的基礎上,能夠有效研究在多種因素條件下的影響和協(xié)同作用,進一步提高了分析選擇性,將其應用范圍進行了擴展。
2.4.1 無機離子的測定
分析化學中主成分分析、聚類分析等數學多元分析方法的應用,能夠將分析對象的測量數據結構進行簡化,有效減少了測量數據的復雜程度,通過將分析對象和變量進行分類和分組,對變量之間的關系進行分析。在化學計量學中,中線性回歸分析、曲線擬合、信號轉換等多種分析方法不斷得到應用,對無機離子的測定和分析起到了巨大的作用。例如,我國已經通過正交回歸極譜法,對錮和錫同時進行了分析,另外通過回歸正交極譜法,還對鋅、鈷、鎳的組成成分進行了測定。
2.4.2 有機電分析化學中的應用
生物學、藥物學、環(huán)境學以及生命學不斷發(fā)展,化學分析工作者對于復雜的有機混合物需要迅速做出定性定量的分析。多元校正法在目前已經廣泛應用在對農藥殘留量、抗氧化劑等的分析中。
3、如何規(guī)范管理化學計量器具
新型的化學計量器具在購買引入后,需要經過相關的校準和檢定階段,合格之后才可以驗收入庫。計量人員還需要對儀器進行編號、履歷卡的建立以及臺賬登記等。相關人員在領取儀器時,需要填寫相關的申請單,經過計量主管批準后才可領取使用,最后需要在臺賬上進行簽字。另外,計量器在存放過程中,需要進行定期的檢定,確保儀器的使用狀態(tài)良好。對于一些長期不需要使用的計量儀器,則需要進行封存,辦理相關的封存手續(xù)。當儀器需要重新使用時,則需要辦理啟封手續(xù),并進行相關的檢定程序,確認合格才可進行使用。
參考文獻:
[1]倪永年,等. 化學計量學在分析化學中的應用[M]. 北京: 科學出版社, 2004: 1-120.
篇10
【摘要】 為了實現(xiàn)人體器官的三維重建,如何準確、有效地提取二維醫(yī)學圖像的邊緣成了首要解決的問題。我們提出一種新的圖像邊緣提取方法,該方法先將原始CT圖像二值化,然后利用數學形態(tài)運算對二值化圖像進行預處理,最后利用Canny算子提取圖像邊緣。通過腎臟CT圖像邊緣提取結果表明,該方法簡單、高效、性能優(yōu)越。
【關鍵詞】 CT圖像;邊緣提??;數學形態(tài)學;Canny算子
Research on the Edge Extraction of CT ImageZHANG Xiaoping,ZHU Zhisong,WANG Junze
(Nantong Univirsity, Nantong 226019, China)
Abstract:To reconstruct the body organs in 3-D, how to extract the edges from 2-D medical images accurately and effectively has benen the primarily problem. Therefore, a new method of edge extraction was introduced in this paper. The original CT image was binarized firstly and then preprocessed by mathematical morphology operating. Finally, the image edge was extracted by the Canny algorithm. The results of kidney CT image edge extraction show that the method is simple, efficient and superior performance.
Key words:CT image;Edge extraction;Mathematical morphology;Canny algorithm
1 引 言
隨著計算機技術、CT(計算機斷層掃描)、MRI(核磁共振)等醫(yī)學影像技術的不斷發(fā)展,虛擬現(xiàn)實技術也越來越多地應用到現(xiàn)代醫(yī)療領域。利用計算機圖像處理和數據可視化技術,根據醫(yī)學影像設備提供的二維斷層圖像,進行人體器官的三維重建已是現(xiàn)代醫(yī)學重要發(fā)展方向之一。腎臟疾病的外科手術是泌尿外科中的一個重點和難點,因此,根據CT二維圖像重構腎臟及其周圍結構的三維模型,有助于醫(yī)生選擇最佳手術路線、減少手術損傷、提高手術成功率[1]。CT二維圖像的邊緣提取作為器官三維重構的第一步,一直受到國內外學者的關注,提出了眾多的邊緣檢測算法,如小波變換法、神經網絡法、模糊技術法等[2]。近幾年,隨著數學形態(tài)學理論的不斷完善與發(fā)展,數學形態(tài)學在圖像邊緣檢測中得到了廣泛的應用[3-5]。本研究正是在數學形態(tài)學的基礎上,結合Canny算子,以腎臟為例,進行了CT圖像的邊緣提取。
2 數學形態(tài)學在圖像預處理中的運用
數學形態(tài)學是一門新興的、以形態(tài)為基礎對圖像進行分析的學科。它利用具有一定結構和特征的結構元素對圖像進行匹配,以實現(xiàn)對圖像的分析和識別,在去除噪聲、邊緣檢測等圖像預處理問題中有著明顯的優(yōu)勢[6]。數學形態(tài)學定義了兩種基本變換,即膨脹(Dilation)和腐蝕(Erision)。首先介紹其定義[7]:設F是原始圖像,B是結構元素,膨脹運算定義為:
D(F)=FB={(x,y)/Bxy∩F≠Φ}(1)
即B對F膨脹產生的二值圖像D(F)是由這樣的點(x,y)組成的集合,若圖B的原點位移至(x,y),那么它與F的交集非空。
腐蝕運算定義為:
E(F)=FΘB={(x,y)/BxyF}(2)
即B對F腐蝕產生的二值圖像E(F)是由這樣的點(x,y)組成的集合,若圖B的原點位移至(x,y),那么B將完全包含于F。
由上述兩種基本運算可以復合得到開啟、閉合變換。
開啟是對圖像先腐蝕后膨脹的過程,F(xiàn)用B來開啟,其數學表達式可記為:
F·B=(FΘB)B(3)
閉合是對圖像先膨脹后腐蝕的過程,F(xiàn)用B來閉合,其數學表達式可記為:
F·B=(FB)ΘB(4)
上述4種運算中,膨脹可以填充圖像中的小孔及圖像邊緣上小的凹陷部分;腐蝕可以消除圖像中細小的成分;開啟則具有消除細小物體、在纖細處分離物體和平滑較大物體邊界的作用;閉合則具有填充物體內細小孔洞、連接臨近物體和平滑邊界的作用。
利用數學形態(tài)學進行圖像預處理時,選擇簡單、表現(xiàn)力強的結構元素是關鍵,是形態(tài)變換中最重要的參數;其次,還要綜合考慮目標體的清晰度和噪聲的大小來選取結構元素的大?。?]。一般目標體輪廓不清晰時,選擇較小的結構元素;噪聲顆粒較大時,選擇較大的結構元素。
3 Canny算子的邊緣檢測原理
經過數學形態(tài)變換之后,圖像的邊緣將變得清晰、突出,此時,圖像的邊界信息可以被方便地提取出來。傳統(tǒng)的算法有Sobel、 Prowitt 、Robert、Canny算子等[9]。在眾多的算子中,Canny算子因其具有高信噪比、高定位精度及單邊緣響應等優(yōu)良性能[10],在許多圖像處理領域得到應用。本研究也正是采用該算法提取腎臟CT圖像邊緣。
Canny算子的基本思想是采用二維高斯函數的任意方向上的一階方向導數為噪聲濾波器,通過與圖像卷積進行濾波,然后對濾波后的圖像尋找局部梯度最大值,以此來確定圖像邊緣[11]。其數學描述如下:
3.1 用高斯濾波器平滑圖像
二維高斯濾波函數為:
G(x,y)=12πσ2exp(-x2+y2〖〗2σ2)(5)
在某一方向n上G(x, y)的一階導數為:
Gn=Gn=nG(6)
式6中n是方向矢量,n=cosθ
sinθ,
G是梯度矢量,G=Gx
Gy。
將圖像{F|f(x,y)}與Gn 作卷積,改變n的方向,Gn×f(x,y)取得最大值時的n,就是正交于檢測邊緣的方向。
3.2 梯度的幅值和方向計算
用一階偏導的有限差分來計算梯度的幅值和方向。
Ex=Gx×f(x,y) Ey=Gy×f(x,y)
A(x,y)=Ex2+Ey2 Φ=Arctan(ExEy)(7)
A(x,y)反映了圖像(x,y)點處的邊緣強度,Φ是圖像(x,y)點處的法向矢量。
3.3 對梯度幅值進行非極大值抑制
為確定圖像邊緣,必須保留局部梯度最大的點,而抑制非極大值。若圖像F上(x,y)點處的梯度幅值A(x,y)小于沿著梯度線方向上的相鄰像素點的邊緣強度,則認為該點為非邊緣點,將A(x,y)置為0。
3.4 用雙閾值法檢測和連接邊緣
設定兩個閾值t1和t2(t2>t1)。凡邊緣強度>t2者,則一定是邊緣點;凡邊緣強度t2的點,若有,則補為邊緣點,若沒有,則不是邊緣點。用t1、t2兩個閾值對非極大值抑制圖像進行雙閾值化,可得兩個檢測結果,分別記為T1和T2。圖像T2閾值較高,所以噪聲較少,但會造成邊緣信息的損失;圖像T1閾值較低,則保留了較多信息。于是以圖像T2為基礎,以圖像T1為補充,連接圖像的邊緣。
由此可見,Canny算子是既能去除噪聲又能保留邊緣特性的邊緣檢測一階微分算法的最佳方法。
4 應用實例
本研究在Matlab6.5軟件平臺上,以某醫(yī)院一患者的腎臟CT斷層圖像為例,提取了其中右腎的邊緣輪廓,具體實施步驟如下:
4.1 圖像二值化
CT圖像是灰度圖像,為了更好的形態(tài)運算和邊緣檢測,首先進行二值化處理,即把灰度圖像轉變成由0、1 組成的矩陣所表示的圖像。圖1為原始CT圖像,圖2是二值化圖像。在本次實驗中,二值化閾值為0.8。實驗過程中發(fā)現(xiàn),該方法簡單、高效,且丟失的信息也很少。
4.2 數學形態(tài)學處理
由圖2可見,圖像存在著一些空腔、毛刺、邊緣凹陷等現(xiàn)象,要進行邊緣檢測,還需經過進一步處理,通過本研究介紹的數學形態(tài)運算即可完成。
所求邊緣是腎臟外圍輪廓,首先需要填充圖像中的空腔和邊緣凹陷。對此,可采用imclose函數進行閉合運算,即進行先膨脹后腐蝕,其中結構元素為5×5圓形結構元素,結果見圖3。由圖3可見,經過閉合運算后,圖像中還存在一些小短枝和孤立斑點,這些也必須剔除,否則,將影響邊緣提取效果。對此,可采用imopen函數進行開啟變換實現(xiàn),即先腐蝕后膨脹。針對小短枝和孤立斑點,無法用同一種結構元素去剔除,所以必須分兩步:首先選用3×3矩形結構元素執(zhí)行開啟變換,去除小短枝像素,結果見圖4;然后用3×3菱形結構元素再次執(zhí)行開啟變換,去除孤立斑點,結果見圖5。
4.3 Canny算子提取邊緣
經過上述處理,腎臟圖像邊緣已經逐漸清晰、突出,此時利用Canny算子即可提取其邊界信息,如圖6所示,本次實驗中,邊緣強度閾值t1為0.0063,t2為0.0156 。圖6基本無失真地描述了邊界信息。提取圖6中各邊界點的坐標,即可獲得重構的邊界圖形,見圖7。對腎臟各層CT圖像進行上述運算后,經過插值處理,即可進行該器官的三維重構。
5 結束語
本研究從實用性的角度出發(fā),闡述了利用數學形態(tài)學和Canny算子進行腎臟CT斷層圖像邊緣提取的方法和步驟。實驗證明該方法簡單、快速、精度高、適用性強,為醫(yī)學圖像的三維重建和虛擬手術技術的研究奠定了良好的基礎。
參考文獻
[1]王洛夫, 張紹祥,江軍,等.腎臟及其周圍結構的三維可視化研究[J].第三軍醫(yī)大學學報,2004,26 ( 6 ): 537-539.
[2]張小琳.圖像邊緣檢測技術綜述[J].高能量密度物理,2007,(1):37-40.
[3]Bai X Z, Zhou F. Edge detection based on mathematicalmorphology and iterative thresholding[A].International conference on computational intelligence and Security[C]. NY: IEEE, 2006.1849-1852.
[4]Serra J. Image analysis and mathematical morphology[M].New York: Academic Press,1982.
[5]Huang C-P,Wang R-Z.An intergrated edge detection method using mathematical morphology[J].Pattern Recgnition and Image Analysis,2006,16(3):406-412.
[6]陳虎,王守尊,周朝輝.基于數學形態(tài)學的圖像邊緣檢測方法研究[J].工程圖學學報,2004,(2):112-115.
[7]崔屹.圖像處理與分析-數學形態(tài)學方法及應用 [M].北京:科學出版社,2000.
[8]Li Z H,Yang Y P,Jiang W.Multi-scale morphologictracking approach for edge detection[A].The 4th International conference on image and graphics[C]. NY: IEEE,2007.358-362.
[9]馬艷, 張治輝.幾種邊緣檢測算子的比較[J].工礦自動化,2004(2): 54-56.