計算機視覺的展望范文
時間:2024-01-04 17:47:19
導語:如何才能寫好一篇計算機視覺的展望,這就需要搜集整理更多的資料和文獻,歡迎閱讀由公務員之家整理的十篇范文,供你借鑒。
篇1
關鍵詞:計算機視覺技術;食品工業(yè);分級;圖像處理
中圖分類號: TS207 文獻標識碼:A
隨著微型個人計算機應用的越來越廣泛,以及計算機在綜合學科中應用的深入研究,現(xiàn)如今在工農(nóng)業(yè)、軍事國防、醫(yī)學衛(wèi)生等眾多領域的使用和研究方面計算機視覺技術都起到了至關重要的作用,為了節(jié)省人力、降低成本、減少誤差,該項技術在食品企業(yè)、科研院所、檢測機構中的應用更加普遍。如今,在農(nóng)產(chǎn)品藥物殘留檢測、水果重量分級、等級篩選、質量監(jiān)管等方面計算機視覺技術有眾多應用。
1 計算機視覺技術概述
計算機視覺技術是利用計算機、攝像機、圖像卡以及相關處理技術來模擬人的視覺,用以識別、感知和認識我們生活的世界[1]。該技術是模擬識別人工智能、心理物理學、圖像處理、計算機科學及神經(jīng)生物學等多領域的綜合學科。計算機視覺技術用攝像機模擬人眼,用計算機模擬大腦,用計算機程序和算法來模擬人對事物的認識和思考,替代人類完成程序為其設定的工作。該技術由多個相關的圖像處理系統(tǒng)組成,主要包括光源提供系統(tǒng)、圖像提取系統(tǒng)、計算機數(shù)據(jù)運算系統(tǒng)等。原理是:首先通過攝像機獲得所需要的圖像信息,然后利用信號轉換將獲得的圖像信息轉變?yōu)閿?shù)字圖像以便計算機正確識別[2]。隨著科學技術的發(fā)展,計算機技術在各個領域得到廣泛應用,計算機視覺技術不僅在代替人類視覺上取得了重大成就,而且在很多具體工作方便超越了人的視覺功能。計算機視覺計算有如此快速的發(fā)展,是因為與人類的視覺相比該技術具有以下顯著優(yōu)勢[3]。
1.1 自動化程度高
計算機視覺可以實現(xiàn)對農(nóng)產(chǎn)品的多個外形和內在品質指標進行同時檢測分析,可以進行整體識別、增強對目標識別的準確性。
1.2 實現(xiàn)無損檢測
由于計算機視覺技術對農(nóng)產(chǎn)品的識別是通過掃描、攝像,而不需要直接接觸,可以減少對所檢測食品的傷害。
1.3 穩(wěn)定的檢測精度
設計的運行程序確定后,計算機視覺技術的識別功能就會具有統(tǒng)一的識別標準,具有穩(wěn)定的檢測精度,避免了人工識別和檢測時主觀因素所造成的差異。
2 計算機視覺技術在食品檢測中的應用
20世紀70年代初,學者開始研究計算機視覺技術在食品工業(yè)中的應用,近幾十年電子技術得到快速發(fā)展,計算機視覺技術也越來越成熟。國內外學者在研究計算機視覺技術在食品工業(yè)中的應用方面主要集中在該技術對果蔬的外部形態(tài)(如形狀、重量、外觀損傷、色澤等)的識別、內部無損檢測等方面。國內有關計算機視覺技術在食品業(yè)中的應用研究起始于90年代,比國外發(fā)達國家晚多達20a,但是發(fā)展很快。
2.1 計算機視覺技術在果蔬分級中的應用研究
計算機視覺技術在食品檢測中的應用研究相當廣泛,從外部直徑、成熟度的檢測到內部腐爛程度的檢測都有研究。韓偉等[4]采用分割水果的拍攝圖像和新的計算機算法計算水果的半徑,進而得出果蔬的最大直徑。研究表明,該算法不僅降低了計算量而且提高了計算精度,此方法用于水果分級的誤差不超過2mm,高于國際水果分級標準所規(guī)定的5mm分類標準差,可在工業(yè)生產(chǎn)中很好應用。李慶中[5]也利用圖像的缺陷分割算法研究了計算機視覺技術在蘋果檢測與分級中的應用,結果表明此算法能快速、有效地分割出蘋果的表面缺陷。孫洪勝等[6]以蘋果色澤特征比率的變化規(guī)律為理論基礎,結合模糊聚類知識利用計算機視覺技術來檢測蘋果缺陷域,檢測不僅快速而且結果精確。劉禾等[7]通過研究認為蘋果的表面缺陷可以利用計算機視覺技術進行檢測,計算機視覺技術還可以將蘋果按照檢測結果進行分級,把檢測過的蘋果分成裂果、刺傷果、碰傷果和蟲傷果等類別。梨的果梗是否存在是梨類分級的重要特征之一,應義斌等[8]通過計算機視覺技術、圖像處理技術、傅立葉描述子的方法來描述和識別果形以及有無果柄,其識別率達到90%。楊秀坤等[9]綜合運用計算機視覺技術、遺傳算法、多層前饋神經(jīng)網(wǎng)絡系統(tǒng),實現(xiàn)了具有精確度高、靈活性強和速度快等優(yōu)點的蘋果成熟度自動判別。陳育彥等[10]采用半導體激光技術、計算機視覺技術和圖像分析技術相結合的方法檢測蘋果表面的機械損傷和果實內部的腐爛情況,初步驗證了計算機視覺技術檢測蘋果表面的損傷和內部腐爛是可行的。馮斌等[11]通過計算機視覺技術對水果圖像的邊緣進行檢測,然后確定水果的大小用以水果分級。試驗表明,該方法比傳統(tǒng)的檢測方法速度快、準確率高,適用于計算機視覺的實時檢測。朱偉[12]在模糊顏色的基礎上,分析西紅柿損傷部分和完好部分模糊顏色的差別,用分割方法對西紅柿的缺陷進行分割,結果顯示準確率高達96%。曹樂平等[13]人研究了溫州蜜柑的果皮顏色與果實可滴定酸含量以及糖分含量之間的相關性,然而根據(jù)相關性,樣品檢測的正確識別率分別只有約74%和67%。劉剛等[14]從垂直和水平兩個方向獲取蘋果的圖像,并通過計算機自動分析圖像數(shù)據(jù),對蘋果的外徑、體積、以及圓形度等參數(shù)進行處理,與人工檢測相比,計算機視覺技術具有檢測效率高,檢測標準統(tǒng)一性好等優(yōu)點。Blasco. J [15]通過計算機視覺技術分析柑橘果皮的缺陷,進而對其在線分級,正確率約為95%。趙廣華等[16]人綜合計算機視覺識別系統(tǒng)、輸送轉換系統(tǒng)、輸送翻轉系統(tǒng)、差速勻果系統(tǒng)和分選系統(tǒng),研制出一款適于實時監(jiān)測、品質動態(tài)的智能分級系統(tǒng),能夠很好地實現(xiàn)蘋果分級。王江楓等[17]建立了芒果重量與攝影圖像的相互關系,應用計算機視覺技術檢測桂香芒果和紫花芒果的重量和果面損傷,按重量分級其準確率均為92%,按果面損傷分級的準確率分別為76%和80%。
2.2 計算機視覺技術在禽蛋檢測中的應用研究
禽蛋企業(yè)在生產(chǎn)過程中,產(chǎn)品的分級、品質檢測主要采用人工方法,不僅需要大量的物力人力,而且存在勞動強度大、人為誤差大、工作效率低等缺點,計算機視覺技術可以很好的解決這類產(chǎn)品工業(yè)生產(chǎn)中存在的困擾。歐陽靜怡等[18]利用計算機視覺技術來檢測雞蛋蛋殼裂紋,利用攝像機獲取雞蛋圖像后,采用fisher、同態(tài)濾波和BET算法等優(yōu)化后的圖像處理技術,獲得裂紋形狀并判斷,試驗結果表明,計算機視覺技術對雞蛋蛋殼裂紋的檢測準確率高達98%。汪俊德等[19]以計算機視覺技術為基礎,設計出一套雙黃雞蛋檢測系統(tǒng)。該系統(tǒng)獲取蛋黃指數(shù)、蛋黃特征和蛋形尺寸等特征,和設計的數(shù)學模型對比來實現(xiàn)雙黃雞蛋的檢測和識別,檢測準確率高達95%。鄭麗敏等[20]人通過高分辨率的數(shù)字攝像頭獲取雞蛋圖像,根據(jù)圖像特征建立數(shù)學模型來預測雞蛋的新鮮度和貯藏期,結果表明,計算機視覺技術對雞蛋的新鮮度、貯藏期進行預測的結果準確率為94%。潘磊慶等[21]通過計算機視覺技術和聲學響應信息技術相結合的方法檢測裂紋雞蛋,其檢測準確率達到98%。Mertens K等[22]人基于計算機視覺技術研發(fā)了雞蛋的分級檢測系統(tǒng),該系統(tǒng)識別帶污漬雞蛋的正確率高達99%。
2.3 計算機視覺技術在檢測食品中微生物含量中的應用研究
計算機技術和圖像處理技術在綜合學科中的應用得到快速發(fā)展,在微生物快速檢測中的應用也越來越多,主要是針對微生物微菌落的處理。食品工業(yè)中計算機視覺技術在微生物檢測方面的研究和應用以研究單個細胞為主,并在個體細胞的研究上取得了一定的進展。殷涌光等[23]以顏色特征分辨技術為基礎,設計了一套應用計算機視覺技術快速定量檢測食品中大腸桿菌的系統(tǒng),該系統(tǒng)檢測結果與傳統(tǒng)方法的檢測結果具有很好的相關性,但與傳統(tǒng)方法相比,可以節(jié)省5d時間,檢測時間在18h以內,并且能夠有效提高產(chǎn)品品質。Lawless等[24]人等時間段測定培養(yǎng)基上的細胞密度,然后通過計算機技術建立時間和細胞密度之間的動態(tài)關聯(lián),利用該關聯(lián)可以預測和自動檢測微生物的生長情況,如通過計算機控制自動定量采集檢測對象,然后分析菌落的邊緣形態(tài),根據(jù)菌落的邊緣形態(tài)計算機可以顯示被檢測菌落的具置,并且根據(jù)動態(tài)關聯(lián)計算機視覺系統(tǒng)可以同時處理多個不同的樣品。郭培源等[25]人對計算機視覺技術用于豬肉的分級進行了研究,結果顯示計算機視覺技術在識別豬肉表面微生物數(shù)量上與國標方法檢測的結果顯著相關,該技術可以有效地計算微生物的數(shù)量。Bayraktar. B等[26]人采用計算機視覺技術、光散射技術(BARDOT)和模式識別技術相結合的方法來快速檢測李斯特菌,在獲取該菌菌落中的形態(tài)特征有對圖像進行分析處理達到對該菌的分類識別。殷涌光等[27]人綜合利用計算機視覺、活體染色、人工神經(jīng)網(wǎng)絡、圖像處理等技術,用分辨率為520萬像素的數(shù)字攝像機拍攝細菌內部的染色效果,并結合新的圖像處理算法,對細菌形態(tài)學的8個特征參數(shù)進行檢測,檢測結果與傳統(tǒng)檢測結果顯著相關(相關系數(shù)R=0.9987),和傳統(tǒng)檢測方法相比該方法具有操作簡單、快速、結果準確、適合現(xiàn)場快速檢測等特點。魯靜[28]和劉侃[29]利用顯微鏡和圖像采集儀器,獲取乳制品的掃描圖像,然后微生物的圖像特征,識別出微生物數(shù)量,并以此作為衡量乳制品質量是否達標的依據(jù),并對產(chǎn)品進行分級。
2.4計算機視覺技術在其他食品產(chǎn)業(yè)中的應用研究
里紅杰等[30]通過提取貝類和蝦類等海產(chǎn)品的形狀、尺寸、紋理、顏色等外形特征,對照數(shù)學模型,采用數(shù)字圖像處理技術、計算機識別技術實現(xiàn)了對貝類和蝦類等海產(chǎn)品的無損檢測和自動化分類、分級和質量評估,并通過實例詳細闡述了該技術的實現(xiàn)方法,證實了此項技術的有效性。計算機視覺技術還可以檢驗玉米粒形和玉米種子質量、識別玉米品種和玉米田間雜草[31]。晁德起等[32]通過x射線照射獲取毛葉棗的透視圖像后,運用計算機視覺技術對圖像進行分析評估,毛葉棗可食率的評估結果與運用物理方法測得的結果平均誤差僅為1.47%,因此得出結論:計算機視覺技術可以應用于毛葉棗的自動分級。Gokmen,V等通用對薯片制作過程中圖像像素的變化來研究薯片的褐變率,通過分析特色參數(shù)來研究薯片中丙烯酰胺的含量和褐變率也關系,結果顯示兩項參數(shù)相關性為0.989,從而可以應用計算機視覺技術來預測加熱食品中丙烯酰胺的含量,該方法可以在加熱食品行業(yè)中得到廣泛應用。韓仲志等人拍攝和掃描11類花生籽粒,每類100顆不同等級的花生籽粒的正反面圖像,利用計算機視覺技術對花生內部和外部采集圖像,并通過圖像對其外在品質和內在品質進行分析,并建立相應的數(shù)學模型,該技術在對待檢樣品進行分級檢測時的正確率高達92%。另外,郭培源等人以國家標準為依據(jù),通過數(shù)字攝像技術獲取豬肉的細菌菌斑面積、脂肪細胞數(shù)、顏色特征值以及氨氣等品質指標來實現(xiàn)豬肉新鮮程度的分級辨認。
3 展望
新技術的研究與應用必然伴隨著坎坷,從70年代初計算機視覺技術在食品工業(yè)中進行應用開始,就遇到了很多問題。計算機視覺技術在食品工業(yè)中的研究及應用主要存在以下幾方面的問題。
3.1 檢測指標有限
計算機視覺技術在檢測食品單一指標或者以一個指標作為分級標準進行分級時具有理想效果,但以同一食品的多個指標共同作為分級標準進行檢測分級,則分級結果誤差較大。例如,Davenel等通過計算機視覺對蘋果的大小、重量、外觀損傷進行分析,但研究結果顯示,系統(tǒng)會把花粵和果梗標記為缺陷,還由于蘋果表面碰壓傷等缺陷情況復雜,造成分級誤差很大,分級正確率只有69%。Nozer等以計算機視覺為主要技術手段,獲取水果的圖像,進而通過分析圖像來確定水果的形狀、大小、顏色和重量,并進行分級,其正確率僅為85.1%。
3.2 兼容性差
計算機視覺技術針對單一種類的果蔬分級檢測效果顯著,但是同一套系統(tǒng)和設備很難用于其他種類的果蔬,甚至同一種類不同品種的農(nóng)產(chǎn)品也很難公用一套計算機視覺設備。Reyerzwiggelaar等利用計算機視覺檢查杏和桃的損傷程度,發(fā)現(xiàn)其檢測桃子的準確率顯著高于杏的。Majumdar.S等利用計算機視覺技術區(qū)分不同種類的麥粒,小麥、燕麥、大麥的識別正確率有明顯差異。
3.3 檢測性能受環(huán)境制約
現(xiàn)階段的計算機視覺技術和配套的數(shù)學模型適用于簡單的環(huán)境,在復雜環(huán)境下工作時會產(chǎn)生較大的誤差。Plebe等利用計算機視覺技術對果樹上的水果進行識別定位,但研究發(fā)現(xiàn)由于光照條件以及周邊環(huán)境的影響,水果的識別和定位精度不高,不能滿足實際生產(chǎn)的需要。
綜上所述,可看出國內外學者對計算機視覺技術在食品工業(yè)中的應用進行了大量的研究,有些研究從單一方面入手,有些研究綜合了多個學科,在研究和應用的過程中,取得了較大的經(jīng)濟效益,也遇到了很多問題,在新的形勢下,計算機視覺技術和數(shù)碼拍攝、圖像處理、人工神經(jīng)網(wǎng)絡,數(shù)學模型建設、微生物快速計量等高新技術相融合的綜合技術逐漸成為了各個領域學者的研究熱點,以計算機視覺為基礎的綜合技術也將在食品工業(yè)中發(fā)揮更加重要的作用。
參考文獻
[1] 寧紀鋒,龍滿生,何東健.農(nóng)業(yè)領域中的計算機視覺研究[J].計算機與農(nóng)業(yè),2001(01):1-3.
[2] 李崢.基于計算機視覺的蔬菜顏色檢測系統(tǒng)研究[D].吉林:吉林大學,2004.
[3] 曾愛群.基于計算機視覺與神經(jīng)網(wǎng)絡的芒果等級分類研究[D].桂林:桂林工學院,2008.
[4] 韓偉,曾慶山.基于計算機視覺的水果直徑檢測方法的研究[J].中國農(nóng)機化,2011(05):25-29.
[5] 李慶中.蘋果自動分級中計算機視覺信息快速獲取與處理技術的研究[D].北京:中國農(nóng)業(yè)大學,2000.
[6] 孫洪勝,李宇鵬,王成,等.基于計算機視覺的蘋果在線高效檢測與分級系統(tǒng)[J].儀表技術與傳感器,2011(06):62-65.
[7] 劉禾,汀慰華.水果果形判別人工神經(jīng)網(wǎng)絡專家系統(tǒng)的研究[J].農(nóng)業(yè)工程學報,1996,12(0l):171-176.
[8] 應義斌,景寒松,馬俊福.用計算機視覺進行黃花梨果梗識別的新方法[J].農(nóng)業(yè)工程學報,1998,14(02):221-225.
[9] 楊秀坤,陳曉光,馬成林,等.用遺傳神經(jīng)網(wǎng)絡方法進行蘋果顏色白動檢測的研究[J].農(nóng)業(yè)工程學報,1997,13(02):193-176.
[10] 陳育彥,屠康,柴麗月,等.基于激光圖像分析的蘋果表面損傷和內部腐爛檢測[J].農(nóng)業(yè)機械學報,2009,40(07):133-137.
[11] 馮斌,汪憋華.基于計算機視覺的水果大小檢測方法[J].農(nóng)業(yè)機械學報,2003,34(01):73-75.
[12] 朱偉,曹其新.基于模糊彩色聚類方法的西紅柿缺陷分割[J].農(nóng)業(yè)工程學報,2003,19(03):133-136.
[13] 曹樂平,溫芝元,沈陸明.基于色調分形維數(shù)的柑橘糖度和有效酸度檢測[J].農(nóng)業(yè)機械學報,2009,41(03):143-148.
[14] 劉剛,王立香,柳兆君.基于計算機視覺的蘋果質量檢測[J].安徽農(nóng)業(yè)科學,2012,40(08):5014-5016.
[15] Blasco J,Aleixos N,Molto puter vision detection of peel defects in citrus by means of a region oriented segmentation algorithm[J].Journal of Food Engineering,2007,81(03):535-543.
[16] 趙廣華,飛,陸奎榮,等.智能化蘋果品質實時分選系統(tǒng)[J].中國科技信息.
[17] 王江楓,羅錫文,洪添勝,等.計算機視覺技術在芒果重量及果面壞損檢測中的應用[J].農(nóng)業(yè)工程學報,1998(12):186-189.
[18] 歐陽靜怡,劉木華.基于計算機視覺的雞蛋裂紋檢測方法研究[J].農(nóng)機化研究,2012(03):91-93.
[19] 汪俊德,鄭麗敏,徐桂云,等.基于計算機視覺技術的雙黃雞蛋檢測系統(tǒng)研究[J].農(nóng)機化研究,2012(09):195-199.
[20] 鄭麗敏,楊旭,徐桂云,等.基于計算機視覺的雞蛋新鮮度無損檢測[J].農(nóng)業(yè)工程學報,2009,25(03):335-339.
[21] 潘磊慶,屠康,詹歌,等.基于計算機視覺和聲學響應信息融合的雞蛋裂紋檢測[J].農(nóng)業(yè)工程學報,2010,26(11):332-337.
[22] Mertens K,De Ketelaere B,Kamers B,et al.Dirt detection on brown eggs by means of colorcomputer vision[J]. Poultry Science,2005,84(10):1653-1659.
[23] 殷涌光,丁筠.基于計算機視覺的食品中大腸桿菌快速定量檢測[J].吉林大學學報(工學版),2009,39(02):344-348.
[24] Lawless C,Wilkinson DJ,Young A,et al.Colonyzer: automated quantification of micro-organism growth characteristics on solid agar[J].BMC Bioinformatics,2010(08):38-44.
[25] 郭培源,畢松,袁芳.豬肉新鮮度智能檢測分級系統(tǒng)研究[J].食品科學,2010,31(15):68-72.
[26] Bayraktar B,Banada PP,Hirleman ED,et al.Feature extraction from light-scatter patterns of Listeria colonies for identification and classification [J].Journal of Biomedical Optics,2006,11(03):34- 36.
[27] 殷涌光,丁筠.基于計算機視覺的蔬菜中活菌總數(shù)的快速檢測[J].農(nóng)業(yè)工程學報,2009,25(07):249-254.
[28] 魯靜.乳品微生物自動檢測系統(tǒng)的設計[J].湖北第二師范學院學報,2010,27(08):115-117.
[29] 劉侃.鮮奶含菌量快速檢測系統(tǒng)[D].華中科技大學,2008.
[30] 里紅杰,陶學恒,于曉強.計算機視覺技術在海產(chǎn)品質量評估中的應用[J].食品與機械,2012,28(04):154-156.
篇2
關鍵詞:數(shù)據(jù)融合傳感器無損檢測精確林業(yè)應用
多傳感器融合系統(tǒng)由于具有較高的可靠性和魯棒性,較寬的時間和空間的觀測范圍,較強的數(shù)據(jù)可信度和分辨能力,已廣泛應用于軍事、工業(yè)、農(nóng)業(yè)、航天、交通管制、機器人、海洋監(jiān)視和管理、目標跟蹤和慣性導航等領域[1,2]。筆者在分析數(shù)據(jù)融合技術概念和內容的基礎上,對該技術在林業(yè)工程中的應用及前景進行了綜述。
1數(shù)據(jù)融合
1.1概念的提出
1973年,數(shù)據(jù)融合技術在美國國防部資助開發(fā)的聲納信號理解系統(tǒng)中得到了最早的體現(xiàn)。70年代末,在公開的技術文獻中開始出現(xiàn)基于多系統(tǒng)的信息整合意義的融合技術。1984年美國國防部數(shù)據(jù)融合小組(DFS)定義數(shù)據(jù)融合為:“對多源的數(shù)據(jù)和信息進行多方的關聯(lián)、相關和綜合處理,以更好地進行定位與估計,并完全能對態(tài)勢及帶來的威脅進行實時評估”。
1998年1月,Buchroithner和Wald重新定義了數(shù)據(jù)融合:“數(shù)據(jù)融合是一種規(guī)范框架,這個框架里人們闡明如何使用特定的手段和工具來整合來自不同渠道的數(shù)據(jù),以獲得實際需要的信息”。
Wald定義的數(shù)據(jù)融合的概念原理中,強調以質量作為數(shù)據(jù)融合的明確目標,這正是很多關于數(shù)據(jù)融合的文獻中忽略但又是非常重要的方面。這里的“質量”指經(jīng)過數(shù)據(jù)融合后獲得的信息對用戶而言較融合前具有更高的滿意度,如可改善分類精度,獲得更有效、更相關的信息,甚至可更好地用于開發(fā)項目的資金、人力資源等[3]。
1.2基本內容
信息融合是生物系統(tǒng)所具備的一個基本功能,人類本能地將各感官獲得的信息與先驗知識進行綜合,對周圍環(huán)境和發(fā)生的事件做出估計和判斷。當運用各種現(xiàn)代信息處理方法,通過計算機實現(xiàn)這一功能時,就形成了數(shù)據(jù)融合技術。
數(shù)據(jù)融合就是充分利用多傳感器資源,通過對這些多傳感器及觀測信息的合理支配和使用,把多傳感器在空間或時間上的冗余或互補信息依據(jù)某些準則進行組合,以獲得被測對象的一致性解釋或描述。數(shù)據(jù)融合的內容主要包括:
(1)數(shù)據(jù)關聯(lián)。確定來自多傳感器的數(shù)據(jù)反映的是否是同源目標。
(2)多傳感器ID/軌跡估計。假設多傳感器的報告反映的是同源目標,對這些數(shù)據(jù)進行綜合,改進對該目標的估計,或對整個當前或未來情況的估計。
(3)采集管理。給定傳感器環(huán)境的一種認識狀態(tài),通過分配多個信息捕獲和處理源,最大限度地發(fā)揮其性能,從而使其操作成本降到最低。傳感器的數(shù)據(jù)融合功能主要包括多傳感器的目標探測、數(shù)據(jù)關聯(lián)、跟蹤與識別、情況評估和預測[4]。
根據(jù)融合系統(tǒng)所處理的信息層次,目前常將信息融合系統(tǒng)劃分為3個層次:
(l)數(shù)據(jù)層融合。直接將各傳感器的原始數(shù)據(jù)進行關聯(lián)后,送入融合中心,完成對被測對象的綜合評價。其優(yōu)點是保持了盡可能多的原始信號信息,但是該種融合處理的信息量大、速度慢、實時性差,通常只用于數(shù)據(jù)之間配準精度較高的圖像處理。
(2)特征層融合。從原始數(shù)據(jù)中提取特征,進行數(shù)據(jù)關聯(lián)和歸一化等處理后,送入融合中心進行分析與綜合,完成對被測對象的綜合評價。這種融合既保留了足夠數(shù)量的原始信息,又實現(xiàn)了一定的數(shù)據(jù)壓縮,有利于實時處理,而且由于在特征提取方面有許多成果可以借鑒,所以特征層融合是目前應用較多的一種技術。但是該技術在復雜環(huán)境中的穩(wěn)健性和系統(tǒng)的容錯性與可靠性有待進一步改善。
(3)決策層融合。首先每一傳感器分別獨立地完成特征提取和決策等任務,然后進行關聯(lián),再送入融合中心處理。這種方法的實質是根據(jù)一定的準則和每個決策的可信度做出最優(yōu)的決策。其優(yōu)點是數(shù)據(jù)通訊量小、實時性好,可以處理非同步信息,能有效地融合不同類型的信息。而且在一個或幾個傳感器失效時,系統(tǒng)仍能繼續(xù)工作,具有良好的容錯性,系統(tǒng)可靠性高,因此是目前信息融合研究的一個熱點。但是這種技術也有不足,如原始信息的損失、被測對象的時變特征、先驗知識的獲取困難,以及知識庫的巨量特性等[5,6]。
1.3處理模型
美國數(shù)據(jù)融合工作小組提出的數(shù)據(jù)融合處理模型[7],當時僅應用于軍事方面,但該模型對人們理解數(shù)據(jù)融合的基本概念有重要意義。模型每個模塊的基本功能如下:
數(shù)據(jù)源。包括傳感器及其相關數(shù)據(jù)(數(shù)據(jù)庫和人的先驗知識等)。
源數(shù)據(jù)預處理。進行數(shù)據(jù)的預篩選和數(shù)據(jù)分配,以減輕融合中心的計算負擔,有時需要為融合中心提供最重要的數(shù)據(jù)。目標評估。融合目標的位置、速度、身份等參數(shù),以達到對這些參數(shù)的精確表達。主要包括數(shù)據(jù)配準、跟蹤和數(shù)據(jù)關聯(lián)、辨識。
態(tài)勢評估。根據(jù)當前的環(huán)境推斷出檢測目標與事件之間的關系,以判斷檢測目標的意圖。威脅評估。結合當前的態(tài)勢判斷對方的威脅程度和敵我雙方的攻擊能力等,這一過程應同時考慮當前的政治環(huán)境和對敵策略等因素,所以較為困難。
處理過程評估。監(jiān)視系統(tǒng)的性能,辨識改善性能所需的數(shù)據(jù),進行傳感器資源的合理配置。人機接口。提供人與計算機間的交互功能,如人工操作員的指導和評價、多媒體功能等。
2多傳感器在林業(yè)中的應用
2.1在森林防火中的應用
在用MODIS(ModerateResolutionImagingSpectroradiometer)數(shù)據(jù)測定森林火點時的20、22、23波段的傳感器輻射值已達飽和狀態(tài),用一般圖像增強處理方法探測燃燒區(qū)火點的結果不理想。余啟剛運用數(shù)據(jù)融合技術,在空間分辨率為1000m的熱輻射通道的數(shù)據(jù)外加入空間分辨率為250m的可見光通道的數(shù)據(jù),較好地進行了不同空間分辨率信息的數(shù)據(jù)融合,大大提高了對火點位置的判斷準確度[8]。為進一步提高衛(wèi)星光譜圖像數(shù)據(jù)分析的準確性與可靠性,利用原有森林防火用的林區(qū)紅外探測器網(wǎng),將其與衛(wèi)星光譜圖像數(shù)據(jù)融合,可以使計算機獲得GPS接收機輸出的有關信息通過與RS實現(xiàn)高效互補性融合,從而彌補衛(wèi)星圖譜不理想的缺失區(qū)數(shù)據(jù)信息,大大提高燃燒區(qū)火點信息準確度和敏感性。
2.2森林蓄積特征的估計
HampusHolmstrom等在瑞典南部的試驗區(qū)將SPOT-4×S衛(wèi)星數(shù)據(jù)和CARABAS-IIVHFSAR傳感器的雷達數(shù)據(jù)進行了融合,采用KNN(knearestneighbor)方法對森林的蓄積特征(林分蓄積、樹種組成與年齡)進行了估計[9]。
KNN方法就是采用目標樣地鄰近k個(k=10)最近樣地的加權來估計目標樣地的森林特征。研究者應用衛(wèi)星光譜數(shù)據(jù)、雷達數(shù)據(jù)融合技術對試驗區(qū)的不同林分的蓄積特征進行估計,并對三種不同的數(shù)據(jù)方法進行誤差分析。試驗表明,融合后的數(shù)據(jù)作出的估計比單一的衛(wèi)星數(shù)據(jù)或雷達數(shù)據(jù)的精度高且穩(wěn)定性好。
2.3用非垂直航空攝像數(shù)據(jù)融合GIS信息更新調查數(shù)據(jù)
森林資源調查是掌握森林資源現(xiàn)狀與變化的調查方法,一般以地面調查的方法為主,我國5年復查一次。由于森林資源調查的工作量巨大,且要花費大量的人力、物力和資金。國內外許多學者都在探索航空、航天的遙感調查與估計方法。
TrevorJDavis等2002年提出采用非垂直的航空攝影數(shù)據(jù)融合對應的GIS數(shù)據(jù)信息實現(xiàn)森林調查數(shù)據(jù)的快速更新,認為對森林資源整體而言,僅某些特殊地區(qū)的資源數(shù)據(jù)需要更新。在直升飛機側面裝上可視的數(shù)字攝像裝置,利用GPS對測點進行定位,對特殊地區(qū)的攝像進行拍攝,同時與對應的GIS數(shù)據(jù)進行融合,做出資源變化的估計或影像的修正[10]。
試驗表明,融合后的數(shù)據(jù)可以同高分辨率矯正圖像相比,該方法花費少,精度高,能充分利用影像的可視性,應用于偏遠、地形復雜、不易操作、成本高的區(qū)域,同時可避免遙感圖像受云層遮蓋。
3數(shù)據(jù)融合在林業(yè)中的應用展望
3.1在木材檢測中的應用
3.1.1木材缺陷及其影響
木材是天然生長的有機體,生長過程中不可避免地有尖削度、彎曲度、節(jié)子等生長缺陷,這些缺陷極大地影響了木材及其制品的優(yōu)良特性,以及木材的使用率、強度、外觀質量,并限制了其應用領域。在傳統(tǒng)木制品生產(chǎn)過程中,主要依靠人的肉眼來識別木材缺陷,而木材板材表面缺陷在大小、形狀和色澤上都有較大的差異,且受木材紋理的影響,識別起來非常困難,勞動強度大,效率低,同時由于熟練程度、標準掌握等人為因素,可能造成較大的誤差。另外在集成材加工中,板材缺陷的非雙面識別嚴重影響了生產(chǎn)線的生產(chǎn)節(jié)拍。因此必須開發(fā)一種能夠對板材雙面缺陷進行在線識別和自動剔除技術,以解決集成材加工中節(jié)子人工識別誤差大、難以實現(xiàn)雙面識別、剔除機械調整時間長等問題。
3.1.2單一傳感器在木材檢測中的應用
對木材及人造板進行無損檢測的方法很多,如超聲波、微波、射線、機械應力、震動、沖擊應力波、快速傅立葉變換分析等檢測方法[11,12]。超聲技術在木材工業(yè)中的應用研究主要集中在研究聲波與木材種類、木材結構和性能之間的關系、木材結構及缺陷分析、膠的固化過程分析等[13]。
隨著計算機視覺技術的發(fā)展,人們也將視覺傳感器應用于木材檢測中。新西蘭科學家用視頻傳感器研究和測量了紙漿中的纖維橫切面的寬度、厚度、壁面積、壁厚度、腔比率、壁比率等,同時準確地測量單個纖維和全部纖維的幾何尺寸及其變化趨勢,能夠區(qū)分不同紙漿類型,測定木材纖維材料加固結合力,并動態(tài)地觀察木材纖維在材料中的結合機理。
新西蘭的基于視覺傳感器的板材缺陷識別的軟件已經(jīng)產(chǎn)業(yè)化,該軟件利用數(shù)碼相機或激光掃描儀采集板材的圖像,自動識別板材節(jié)子和缺陷的位置,控制板材的加工。該軟件還具有進行原木三維模型真實再現(xiàn)的計算機視覺識別功能,利用激光掃描儀自動采集原木的三維幾何數(shù)據(jù)。
美國林產(chǎn)品實驗室利用計算機視覺技術對木材刨花的尺寸大小進行分級,確定各種刨花在板中的比例和刨花的排列方向;日本京都大學基于視覺傳感器進行了定向刨花板內刨花定向程度的檢測,從而可以通過調整定向鋪裝設備優(yōu)化刨花的排列方向來提高定向刨花板的強度。
在制材加工過程中,利用計算機視覺技術在線實時檢測原木的形狀及尺寸,選擇最佳下鋸方法,提高原木的出材率。同時可對鋸材的質量進行分級,實現(xiàn)木材的優(yōu)化使用;在膠合板的生產(chǎn)過程中,利用計算機視覺技術在線實時檢測單板上的各種缺陷,實現(xiàn)單板的智能和自動剪切,并可測量在剪切過程中的單板破損率,對單板進行分等分級,實現(xiàn)自動化生產(chǎn)過程。Wengert等在綜合了大量的板材分類經(jīng)驗的基礎上,建立了板材分級分類的計算機視覺專家系統(tǒng)。在國內這方面的研究較少,王金滿等用計算機視覺技術對刨花板施膠效果進行了定量分析[14]。
X射線對木材及木質復合材料的性能檢測已得到了廣泛的應用,目前該技術主要應用于對木材密度、含水率、纖維素相對結晶度和結晶區(qū)大小、纖維的化學結構和性質等進行檢測,并對木材內部的各種缺陷進行檢測。
3.1.3數(shù)據(jù)融合在木材檢測中的應用展望
單一傳感器在木材工業(yè)中已得到了一定程度的應用,但各種單項技術在應用上存在一定的局限性。如視覺傳感器不能檢測到有些與木材具有相同顏色的節(jié)子,有時會把木板上的臟物或油脂當成節(jié)子,造成誤判,有時也會受到木材的種類或粗糙度和濕度的影響,此外,這種技術只能檢測部分表面缺陷,而無法檢測到內部缺陷;超聲、微波、核磁共振和X射線技術均能測量密度及內部特征,但是它們不能測定木材的顏色和瑕疵,因為這些缺陷的密度往往同木板相同。因此,一個理想的檢測系統(tǒng)應該集成各種傳感技術,才能準確、可靠地檢測到木材的缺陷[15,16]。
基于多傳感器(機器視覺及X射線等)數(shù)據(jù)融合技術的木材及木制品表面缺陷檢測,可以集成多個傳統(tǒng)單項技術,更可靠、準確地實時檢測出木材表面的各種缺陷,為實現(xiàn)木材分級自動化、智能化奠定基礎,同時為集裁除鋸、自動調整、自動裁除節(jié)子等為一身的新型視頻識別集成材雙面節(jié)子數(shù)控自動剔除成套設備提供技術支持。
3.2在精確林業(yè)中的應用
美國華盛頓大學研究人員開展了樹形自動分析、林業(yè)作業(yè)規(guī)劃等研究工作;Auburn大學的生物系統(tǒng)工程系和USDA南方林業(yè)實驗站與有關公司合作開展用GPS和其他傳感器研究林業(yè)機器系統(tǒng)的性能和生產(chǎn)效率。
目前單項的GPS、RS、GIS正從“自動化孤島”形式應用于林業(yè)生產(chǎn)向集成技術轉變。林業(yè)生產(chǎn)系統(tǒng)作為一個多組分的復雜系統(tǒng),是由能量流動、物質循環(huán)、信息流動所推動的具有一定的結構和功能的復合體,各組分間的關系和結合方式影響系統(tǒng)整體的結構和功能。因此應該在計算機集成系統(tǒng)框架下,有效地融合GPS、GIS、RS等數(shù)據(jù),解決這些信息在空間和時間上的質的差異及空間數(shù)據(jù)類型的多樣性,如地理統(tǒng)計數(shù)據(jù)、柵格數(shù)據(jù)、點數(shù)據(jù)等。利用智能DSS(決策支持系統(tǒng))以及VRT(可變量技術)等,使林業(yè)生產(chǎn)成為一個高效、柔性和開放的體系,從而實現(xiàn)林業(yè)生產(chǎn)的標準化、規(guī)范化、開放性,建立基于信息流融合的精確林業(yè)系統(tǒng)。
南京林業(yè)大學提出了“精確林業(yè)工程系統(tǒng)”[17]。研究包括精確林業(yè)工程系統(tǒng)的領域體系結構、隨時空變化的數(shù)據(jù)采集處理與融合技術、精確控制林業(yè)生產(chǎn)的智能決策支持系統(tǒng)、可變量控制技術等,實現(xiàn)基于自然界生物及其所賴以生存的環(huán)境資源的時空變異性的客觀現(xiàn)實,以最小資源投入、最小環(huán)境危害和最大產(chǎn)出效益為目標,建立關于林業(yè)管理系統(tǒng)戰(zhàn)略思想的精確林業(yè)微觀管理系統(tǒng)。
[參考文獻]
[1]高翔,王勇.數(shù)據(jù)融合技術綜述[J].計算機控制與測量,2002,10(11):706-709.
[2]龔元明,蕭德云,王俊杰.多傳感器數(shù)據(jù)融合技術(上)[J].冶金自動化,2002(4):4-7.
[3]錢永蘭,楊邦杰,雷廷武.數(shù)據(jù)融合及其在農(nóng)情遙感監(jiān)測中的應用與展望[J].農(nóng)業(yè)工程學報,2004,20(4):286-290.
[4]高德平,黃雪梅.多傳感器和數(shù)據(jù)融合(一)[J].紅外與激光工程,1999,28(1):1-4.
[5]王耀南,李樹濤.多傳感器信息融合及其應用綜述[J].控制與決策,2001,16(5):518-52.
[6]許軍,羅飛路,張耀輝.多傳感器信息融合技術在無損檢測中的應用研究[J].無損檢測,2000,22(8):342-344.
[7]WhiteFE.Datafusionlexicon:DatafusionsubpanelofthejointdirectorsoflaboratoriestechnicalpanelforC3[R].SanDiego,1991.
[8]余啟剛.數(shù)據(jù)融合技術在“3S”森林防火中的應用[J].森林工程,2003,19(4):5-6.
[9]HampusHolmstrom,biningremotelysensedopticalandradardatainKNN-estimationofforest[J].ForestScience,2003,49(3):409-418.
[10]TrevorJDavis,BrianKlinkenberg,PeterKellerC.Updatinginventory:Usingobliquevideogrammetry&datafusion[J].JournalofForestry,2002,100(2):45-50.
[11]楊春梅,胡萬義,白帆,等.木材缺陷檢測理論及方法的發(fā)展[J].林業(yè)機械與木工設備,2004,32(3):8-10.
[12]胡英成,顧繼友,王逢瑚.木材及人造板物理力學性能無損檢測技術研究的發(fā)展與展望[J].世界林業(yè)研究,2002,15(4):39-46.
[13]肖忠平,盧曉寧,陸繼圣.木質材料X射線與超聲檢測技術研究的發(fā)展與展望[J].木材加工機械,2004,15(1):25-27.
[14]王金滿,周秀榮.刨花板施膠效果計算機視覺分析方法[J].東北林業(yè)大學學報,1994,22(3):25-26.
[15]KlinkhachornP.Prototypinganautomatedlumberprocessingsystem[J].ForestProductsJournal,1993(2):11-18.
篇3
一、數(shù)據(jù)融合
1.1概念的提出
1973年,數(shù)據(jù)融合技術在美國國防部資助開發(fā)的聲納信號理解系統(tǒng)中得到了最早的體現(xiàn)。
7年代末,在公開的技術文獻中開始出現(xiàn)基于多系統(tǒng)的整合意義的融合技術。1984年美國國防部數(shù)據(jù)融合小組(dfs)定義數(shù)據(jù)融合為:“對多源的數(shù)據(jù)和信息進行多方的關聯(lián)、相關和綜合處理,以更好地進行定位與估計,并完全能對態(tài)勢及帶來的威脅進行實時評估”。
1998年1月,buchroithner和wald重新定義了數(shù)據(jù)融合:“數(shù)據(jù)融合是一種規(guī)范框架,這個框架里人們闡明如何使用特定的手段和工具來整合來自不同渠道的數(shù)據(jù),以獲得實際需要的信息”。
wald定義的數(shù)據(jù)融合的概念原理中,強調以質量作為數(shù)據(jù)融合的明確目標,這正是很多關于數(shù)據(jù)融合的文獻中忽略但又是非常重要的方面。這里的“質量”指經(jīng)過數(shù)據(jù)融合后獲得的信息對用戶而言較融合前具有更高的滿意度,如可改善分類精度,獲得更有效、更相關的信息,甚至可更好地用于開發(fā)項目的資金、人力資源等。
1.2基本內容
信息融合是系統(tǒng)所具備的一個基本功能,人類本能地將各感官獲得的信息與先驗知識進行綜合,對周圍環(huán)境和發(fā)生的事件做出估計和判斷。當運用各種現(xiàn)代信息處理方法,通過計算機實現(xiàn)這一功能時,就形成了數(shù)據(jù)融合技術。
數(shù)據(jù)融合就是充分利用多傳感器資源,通過對這些多傳感器及觀測信息的合理支配和使用,把多傳感器在空間或時間上的冗余或互補信息依據(jù)某些準則進行組合,以獲得被測對象的一致性解釋或描述。數(shù)據(jù)融合的內容主要包括:
(1)數(shù)據(jù)關聯(lián)。確定來自多傳感器的數(shù)據(jù)反映的是否是同源目標。
(2)多傳感器id/軌跡估計。假設多傳感器的報告反映的是同源目標,對這些數(shù)據(jù)進行綜合,改進對該目標的估計,或對整個當前或未來情況的估計。
(3)采集管理。給定傳感器環(huán)境的一種認識狀態(tài),通過分配多個信息捕獲和處理源,最大限度地發(fā)揮其性能,從而使其操作成本降到最低。傳感器的數(shù)據(jù)融合功能主要包括多傳感器的目標探測、數(shù)據(jù)關聯(lián)、跟蹤與識別、情況評估和預測。
根據(jù)融合系統(tǒng)所處理的信息層次,目前常將信息融合系統(tǒng)劃分為3個層次:
(l)數(shù)據(jù)層融合。直接將各傳感器的原始數(shù)據(jù)進行關聯(lián)后,送入融合中心,完成對被測對象的綜合評價。其優(yōu)點是保持了盡可能多的原始信號信息,但是該種融合處理的信息量大、速度慢、實時性差,通常只用于數(shù)據(jù)之間配準精度較高的圖像處理。
(2)特征層融合。從原始數(shù)據(jù)中提取特征,進行數(shù)據(jù)關聯(lián)和歸一化等處理后,送入融合中心進行分析與綜合,完成對被測對象的綜合評價。這種融合既保留了足夠數(shù)量的原始信息,又實現(xiàn)了一定的數(shù)據(jù)壓縮,有利于實時處理,而且由于在特征提取方面有許多成果可以借鑒,所以特征層融合是目前應用較多的一種技術。但是該技術在復雜環(huán)境中的穩(wěn)健性和系統(tǒng)的容錯性與可靠性有待進一步改善。
(3)決策層融合。首先
每一傳感器分別獨立地完成特征提取和決策等任務,然后進行關聯(lián),再送入融合中心處理。這種方法的實質是根據(jù)一定的準則和每個決策的可信度做出最優(yōu)的決策。其優(yōu)點是數(shù)據(jù)通訊量小、實時性好,可以處理非同步信息,能有效地融合不同類型的信息。而且在一個或幾個傳感器失效時,系統(tǒng)仍能繼續(xù)工作,具有良好的容錯性,系統(tǒng)可靠性高,因此是目前信息融合研究的一個熱點。但是這種技術也有不足,如原始信息的損失、被測對象的時變特征、先驗知識的獲取困難,以及知識庫的巨量特性等。
1.3處理模型
美國數(shù)據(jù)融合工作小組提出的數(shù)據(jù)融合處理模型,當時僅應用于軍事方面,但該模型對人們理解數(shù)據(jù)融合的基本概念有重要意義。模型每個模塊的基本功能如下:
數(shù)據(jù)源。包括傳感器及其相關數(shù)據(jù)(數(shù)據(jù)庫和人的先驗知識等)。
源數(shù)據(jù)預處理。進行數(shù)據(jù)的預篩選和數(shù)據(jù)分配,以減輕融合中心的計算負擔,有時需要為融合中心提供最重要的數(shù)據(jù)。目標評估。融合目標的位置、速度、身份等參數(shù),以達到對這些參數(shù)的精確表達。主要包括數(shù)據(jù)配準、跟蹤和數(shù)據(jù)關聯(lián)、辨識。
態(tài)勢評估。根據(jù)當前的環(huán)境推斷出檢測目標與事件之間的關系,以判斷檢測目標的意圖。威脅評估。結合當前的態(tài)勢判斷對方的威脅程度和敵我雙方的攻擊能力等,這一過程應同時考慮當前的環(huán)境和對敵策略等因素,所以較為困難。
處理過程評估。監(jiān)視系統(tǒng)的性能,辨識改善性能所需的數(shù)據(jù),進行傳感器資源的合理配置。人機接口。提供人與計算機間的交互功能,如人工操作員的指導和評價、多媒體功能等。
二、多傳感器在林業(yè)中的應用
2.1在森林防火中的應用
在用modis(moderateresolutionimagingspectroradiometer)數(shù)據(jù)測定森林火點時的2、22、23波段的傳感器輻射值已達飽和狀態(tài),用一般圖像增強處理方法探測燃燒區(qū)火點的結果不理想。余啟剛運用數(shù)據(jù)融合技術,在空間分辨率為1m的熱輻射通道的數(shù)據(jù)外加入空間分辨率為25m的可見光通道的數(shù)據(jù),較好地進行了不同空間分辨率信息的數(shù)據(jù)融合,大大提高了對火點位置的判斷準確度。為進一步提高衛(wèi)星光譜圖像數(shù)據(jù)分析的準確性與可靠性,利用原有森林防火用的林區(qū)紅外探測器網(wǎng),將其與衛(wèi)星光譜圖像數(shù)據(jù)融合,可以使計算機獲得gps接收機輸出的有關信息通過與rs實現(xiàn)高效互補性融合,從而彌補衛(wèi)星圖譜不理想的缺失區(qū)數(shù)據(jù)信息,大大提高燃燒區(qū)火點信息準確度和敏感性。
2.2森林蓄積特征的估計
hampusholmstrom等在瑞典南部的試驗區(qū)將spot-4×s衛(wèi)星數(shù)據(jù)和carabas-iivhfsar傳感器的雷達數(shù)據(jù)進行了融合,采用knn(knearestneighbor)方法對森林的蓄積特征(林分蓄積、樹種組成與年齡)進行了估計。
knn方法就是采用目標樣地鄰近k個(k=1)最近樣地的加權來估計目標樣地的森林特征。研究者應用衛(wèi)星光譜數(shù)據(jù)、雷達數(shù)據(jù)融合技術對試驗區(qū)的不同林分的蓄積特征進行估計,并對三種不同的數(shù)據(jù)方法進行誤差分析。試驗表明,融合后的數(shù)據(jù)作出的估計比單一的衛(wèi)星數(shù)據(jù)或雷達數(shù)據(jù)的精度高且穩(wěn)定性好。
2.3用非垂直航空攝像數(shù)據(jù)融合gis信息更新調查數(shù)據(jù)
森林資源調查是掌握森林資源現(xiàn)狀與變化的調查方法,一般以地面調查的方法為主,我國5年復查一次。由于森
林資源調查的工作量巨大,且要花費大量的人力、物力和資金。國內外許多學者都在探索航空、航天的遙感調查與估計方法。 trevorjdavis等22年提出采用非垂直的航空攝影數(shù)據(jù)融合對應的gis數(shù)據(jù)信息實現(xiàn)森林調查數(shù)據(jù)
的快速更新,認為對森林資源整體而言,僅某些特殊地區(qū)的資源數(shù)據(jù)需要更新。在直升飛機側面裝上可視的數(shù)字攝像裝置,利用gps對測點進行定位,對特殊地區(qū)的攝像進行拍攝,同時與對應的gis數(shù)據(jù)進行融合,做出資源變化的估計或影像的修正。
試驗表明,融合后的數(shù)據(jù)可以同高分辨率矯正圖像相比,該方法花費少,精度高,能充分利用影像的可視性,應用于偏遠、地形復雜、不易操作、成本高的區(qū)域,同時可避免遙感圖像受云層遮蓋。
三、數(shù)據(jù)融合在林業(yè)中的應用展望
3.1在木材檢測中的應用
3.1.1木材缺陷及其影響
木材是天然生長的有機體,生長過程中不可避免地有尖削度、彎曲度、節(jié)子等生長缺陷,這些缺陷極大地影響了木材及其制品的優(yōu)良特性,以及木材的使用率、強度、外觀質量,并限制了其應用領域。在傳統(tǒng)木制品生產(chǎn)過程中,主要依靠人的肉眼來識別木材缺陷,而木材板材表面缺陷在大小、形狀和色澤上都有較大的差異,且受木材紋理的影響,識別起來非常困難,勞動強度大,效率低,同時由于熟練程度、標準掌握等人為因素,可能造成較大的誤差。另外在集成材加工中,板材缺陷的非雙面識別嚴重影響了生產(chǎn)線的生產(chǎn)節(jié)拍。因此必須開發(fā)一種能夠對板材雙面缺陷進行在線識別和自動剔除技術,以解決集成材加工中節(jié)子人工識別誤差大、難以實現(xiàn)雙面識別、剔除機械調整時間長等問題。
3.1.2單一傳感器在木材檢測中的應用
對木材及人造板進行無損檢測的方法很多,如超聲波、微波、射線、機械應力、震動、沖擊應力波、快速傅立葉變換分析等檢測方法。超聲技術在木材工業(yè)中的應用研究主要集中在研究聲波與木材種類、木材結構和性能之間的關系、木材結構及缺陷分析、膠的固化過程分析等。
隨著計算機視覺技術的發(fā)展,人們也將視覺傳感器應用于木材檢測中。新西蘭科學家用視頻傳感器研究和測量了紙漿中的纖維橫切面的寬度、厚度、壁面積、壁厚度、腔比率、壁比率等,同時準確地測量單個纖維和全部纖維的幾何尺寸及其變化趨勢,能夠區(qū)分不同紙漿類型,測定木材纖維材料加固結合力,并動態(tài)地觀察木材纖維在材料中的結合機理。
新西蘭的基于視覺傳感器的板材缺陷識別的軟件已經(jīng)產(chǎn)業(yè)化,該軟件利用數(shù)碼相機或激光掃描儀采集板材的圖像,自動識別板材節(jié)子和缺陷的位置,控制板材的加工。該軟件還具有進行原木三維模型真實再現(xiàn)的計算機視覺識別功能,利用激光掃描儀自動采集原木的三維幾何數(shù)據(jù)。
美國林產(chǎn)品實驗室利用計算機視覺技術對木材刨花的尺寸大小進行分級,確定各種刨花在板中的比例和刨花的排列方向;日本京都大學基于視覺傳感器進行了定向刨花板內刨花定向程度的檢測,從而可以通過調整定向鋪裝設備優(yōu)化刨花的排列方向來提高定向刨花板的強度。
在制材加工過程中,利用計算機視覺技術在線實時檢測原木的形狀及尺寸,選擇最佳下鋸方法,提高原木的出材率。同時可對鋸材的質量進行分級,實現(xiàn)木材的優(yōu)化使用;在膠合板的生產(chǎn)過程中,利用計算機視覺技術在線實時檢測單板上的各種缺陷,實現(xiàn)單板的智能和自動剪切,并可測量在剪切過程中的單板破損率,對單板進行分等分級,實現(xiàn)自動化生產(chǎn)過程。wengert等在綜合了大量的板材分類經(jīng)驗的基礎上,建立了板材分級分類的計算機視覺專家系統(tǒng)。在國內這方面的研究較少,王金滿等用計算機視覺技術對刨花板施膠效果進行了定量分析。
x射線對木材及木質復合材料的性能檢測已得到了廣泛的應用,目前該技術主要應用于對木材密度、含水率、纖維素相對結晶度和結晶區(qū)大小、纖維的結構和性質等進行檢測,并對木材內部的各種缺陷進行檢測。
3.1.3數(shù)據(jù)融合在木材檢測中的應用展望
單一傳感器在木材工業(yè)中已得到了一定程度的應用,但各種單項技術在應用上存在一定的局限性。如視覺傳感器不能檢測到有些與木材具有相同顏色的節(jié)子,有時會把木板上的臟物或油脂當成節(jié)子,
造成誤判,有時也會受到木材的種類或粗糙度和濕度的影響,此外,這種技術只能檢測部分表面缺陷,而無法檢測到內部缺陷;超聲、微波、核磁共振和x射線技術均能測量密度及內部特征,但是它們不能測定木材的顏色和瑕疵,因為這些缺陷的密度往往同木板相同。因此,一個理想的檢測系統(tǒng)應該集成各種傳感技術,才能準確、可靠地檢測到木材的缺陷。
基于多傳感器(機器視覺及x射線等)數(shù)據(jù)融合技術的木材及木制品表面缺陷檢測,可以集成多個傳統(tǒng)單項技術,更可靠、準確地實時檢測出木材表面的各種缺陷,為實現(xiàn)木材分級自動化、智能化奠定基礎,同時為集裁除鋸、自動調整、自動裁除節(jié)子等為一身的新型視頻識別集成材雙面節(jié)子數(shù)控自動剔除成套設備提供技術支持。
3.2在精確林業(yè)中的應用
美國華盛頓大學研究人員開展了樹形自動分析、林業(yè)作業(yè)規(guī)劃等研究工作;auburn大學的生物系統(tǒng)工程系和usda南方林業(yè)實驗站與有關公司合作開展用gps和其他傳感器研究林業(yè)機器系統(tǒng)的性能和生產(chǎn)效率。
篇4
【關鍵詞】:電力系統(tǒng);新技術應用;未來展望
1、新技術在電力系統(tǒng)自動化中的應用
通過上文對電力系統(tǒng)的解讀可知,該系統(tǒng)是一個規(guī)模比較龐大的系統(tǒng),其中涵蓋了諸多的電力設備設施,想要實現(xiàn)對這些設備的自動化控制,就必須對相關的技術加以運用。下面本文重點分析幾種新技術在電力系統(tǒng)自動化中的應用。
1.1智能控制技術的應用
自電力系統(tǒng)自動化這一概念被提出之后,電力系統(tǒng)自動化與新技術應用文/周觀春柴宇馮浩銘文章首先對電力系統(tǒng)自動化進行了解讀,在此基礎上對幾種新技術在電力系統(tǒng)自動化中的應用進行論述。期望通過本文的研究能夠對確保電力系統(tǒng)的安全、穩(wěn)定、可靠、經(jīng)濟運行有所幫助。摘要智能控制技術便成為其研究的一個重要領域,相對于傳統(tǒng)的人工控制方式而言,智能控制更具優(yōu)越性,將之應用于復雜程度高、非線性較強的電力系統(tǒng)當中,可以_保系統(tǒng)的安全、穩(wěn)定、可靠、經(jīng)濟運行。智能控制技術的核心是計算機,所有的控制功能都是憑借相關的軟件程序來實現(xiàn)的,借助這些控制功能可對電力系統(tǒng)運行過程中產(chǎn)生的狀態(tài)數(shù)據(jù)進行實時監(jiān)測和自動分析與處理,并從中找出電力系統(tǒng)運行時存在的問題,然后參考數(shù)據(jù)庫中的故障處理指令,自動對故障問題進行解決處理,再利用通信網(wǎng)絡將處理指令下發(fā)至電力系統(tǒng)的設備當中,從而實現(xiàn)對系統(tǒng)的調整,由此便可確保系統(tǒng)始終處于相對穩(wěn)定的運行狀態(tài)。
1.2計算機視覺技術的應用
該技術是一門綜合性較強的學科,主要包括計算機、信號處理、物理學等等,它是各種智能系統(tǒng)不可或缺的重要組成部分之一,應用該技術可對電力系統(tǒng)進行有效的監(jiān)測。隨著業(yè)內專家學者對該技術的研究不斷深入,出現(xiàn)了諸多新的技術,其中較具代表性的有以下幾類:在線監(jiān)測技術、環(huán)境監(jiān)測技術、無人機監(jiān)測技術等等,這些技術能夠通過各種不同的方式獲取電力系統(tǒng)的狀態(tài)信息。
1.3動態(tài)安全監(jiān)控系統(tǒng)的應用
隨著社會生產(chǎn)生活對供電穩(wěn)定性的要求不斷提高,電力系統(tǒng)有必要應用動態(tài)安全監(jiān)控系統(tǒng),減少供電故障,保障電力系統(tǒng)可靠運行,滿足供電需求。在動態(tài)安全監(jiān)控系統(tǒng)中,要引入GPS和EMS技術,通過全面檢測電氣設備,實時掌握電氣設備的運行情況,可及時發(fā)現(xiàn)并處理故障隱患,做到防患于未然,從而大幅度降低事故發(fā)生的可能性?;贕PS定位技術的動態(tài)安全監(jiān)控系統(tǒng),可通過衛(wèi)星提供所需數(shù)據(jù),加之EMS系統(tǒng)可對整個電力系統(tǒng)進行實時監(jiān)控,從而實現(xiàn)了動態(tài)監(jiān)控與靜態(tài)監(jiān)控相結合,從多個方向入手對電力系統(tǒng)運行進行綜合分析,若發(fā)現(xiàn)電力系統(tǒng)存在不穩(wěn)定運行的因素,則可及時提出補救措施。
1.4 DFACTS技術
FACTS技術和DFACTS技術是應用于電力系統(tǒng)的新技術,其中FACTS技術即柔流輸電,能夠對電力系統(tǒng)的相關參數(shù)進行及時調控,保證電壓維持在穩(wěn)定狀況,從而提高電力系統(tǒng)的可靠性。DFACTS技術則可有效解決電力系統(tǒng)的各類質量問題,有效管控電力系統(tǒng)運行質量,保障電氣設備始終處于良好運行狀態(tài),減少不利因素對電氣設備的干擾和損害,從而促使電力系統(tǒng)運行的自動化水平大幅度提升。
1.5微機保護技術
電力系統(tǒng)應用微機保護技術,能夠在發(fā)生故障時自動啟動保護措施,減少電力系統(tǒng)受到的損害。隨著電力系統(tǒng)對微機保護技術的應用要求不斷提高,微機保護技術必須及時更新。當前,在電力系統(tǒng)中常用基于C/C++語言的微機設備,該微機設備具備良好的可移植性和靈活性,能夠滿足電力系統(tǒng)保護的多種需求。
2、電力系統(tǒng)新技術發(fā)展的未來展望
2.1電力系統(tǒng)將向著自動化和智能化的方向邁進
目前,電力系統(tǒng)的整體發(fā)展趨勢是向著自動化和智能化的方向發(fā)展,其智能控制手段將由研究逐漸走向實用,通過對計算機技術的不斷學習,將能夠幫助電力工作者找到新的發(fā)展電力的道路和方向,也能夠使得一些系統(tǒng)達到新的發(fā)展高度。計算機技術、控制技術和現(xiàn)代通信技術將會對電能的產(chǎn)生、控制、傳輸?shù)雀鱾€環(huán)節(jié)產(chǎn)生影響,使得電力系統(tǒng)實現(xiàn)智能化和自動化的新高度。當前電力系統(tǒng)正處在大數(shù)據(jù)的時代,各種高科技的技術頻發(fā),電力系統(tǒng)的安全運行程度高。同時,電力系統(tǒng)還有高效率運行、降低成本和對環(huán)境負面影響小的優(yōu)點,將不斷的提升系統(tǒng)的可靠性和自愈性,達到更高的發(fā)展高度。
2.2太陽能等可再生資源發(fā)電比例和對儲能設備要求增高
隨著全國經(jīng)濟和文化的發(fā)展,電力系統(tǒng)領域也迎來了新的發(fā)展方向,太陽能和風能成為可再生資源的發(fā)展重點。根據(jù)研究資料表明,地球上接受的太陽能如果有效的利用和供給是足夠地球上的人類實現(xiàn)總需求的。在能源評價、技術服務和創(chuàng)新等方面,光伏發(fā)電也成為了新的發(fā)展趨勢,現(xiàn)階段需要重點光電池、多晶硅提煉等技術,不斷推廣新的發(fā)展渠道,解決更多的技術問題和障礙,實現(xiàn)包括太陽能在內的可再生資源的合理利用,為電力能源的生產(chǎn)提供充足的保障。另一方面,隨著電力系統(tǒng)信息化和新技術的發(fā)展,電力儲能系統(tǒng)就像計算機網(wǎng)絡中的信息存儲系統(tǒng)一樣,有著重要的影響力。隨著儲能裝置的不斷改進,新型高性能的電極材料和電介質材料將不斷被應用在各個領域,推動電力系統(tǒng)的全方位發(fā)展。此外,電力電氣設備的性能還需要不斷的研究其材料,提高電氣設備的極限容量,確保電力系統(tǒng)的安全穩(wěn)定,滿足電網(wǎng)的運行需求。新型高性能電極材料、儲能材料和新技術的應用,推動了大容量電池儲能等技術的發(fā)展和大容量儲能設備興起和實踐運用。
結論
電力系統(tǒng)的運行穩(wěn)定與否,直接關系到供電可靠性,為了確保系統(tǒng)運行的穩(wěn)定性,可將智能控制技術、計算機視覺技術、動態(tài)安全監(jiān)控技術等,合理運用到電力系統(tǒng)自動化當中,由此不但能夠對電力系統(tǒng)進行全面的監(jiān)視和控制,而且還能使系統(tǒng)的重要設備始終處于受控狀態(tài)。
篇5
關鍵詞:機器視覺;三維重建;圖像處理
中圖分類號:TP301
文獻標識碼:A 文章編號:1672-7800(2014)003-0013-02
作者簡介:羅尤春(1989-),男,華中科技大學機械科學與工程學院碩士研究生,研究方向為機器視覺。
1 Marr機器視覺框架
在漫漫進化歷程中,人類和大部分動物通過視覺、聽覺、觸覺等來獲取周圍世界的信息,并通過大腦處理這些信息。而根據(jù)調查,人類大腦處理的信息有80%是來自視覺,我們通過雙目感受深度信息,通過對不同頻率光信號進行判別來獲取顏色信息[1]。通過運用攝像機來達到模擬人眼的識別和測量功能,機器視覺成為人工智能研究的重要環(huán)節(jié)。機器視覺區(qū)別于計算機視覺,更偏向于應用,一個機器視覺系統(tǒng)一般通過攝像機之類的光學儀器以圖像的形式獲取周圍世界的信息,通過計算機進行圖像處理和圖像理解,再根據(jù)相應的控制程序和機械驅動設備對智能輸出設備發(fā)出操作指令,實現(xiàn)智能控制和操作功能。
早期的機器視覺局限于對二維圖像的分析、識別和理解上[2]。20世紀80年代初,Marr第一次融合圖像處理、神經(jīng)科學的相關研究,提出了里程碑式的視覺系統(tǒng)框架。具體來說,Marr框架包括三個層次:計算理論層次、表達與算法層次、硬件實現(xiàn)層次。計算理論層次,可以理解為通過對二維圖像的理解來重建三維客觀世界的視覺三維重建理論研究。因為現(xiàn)實世界是復雜多變的,如何建立一種通過二維圖像來實現(xiàn)三維重建的普適性方法成為機器視覺系統(tǒng)中最重要也是終極的目的。Marr提出的這一層次是想通過建立某種普適性模型來獲取客觀世界任何物體的形狀、位置以及運動的信息;表達與算法層次低于計算理論層次,是要解決“軟件”的問題,即如何實現(xiàn)機器視覺系統(tǒng)各個模塊之間信息輸入、輸出和信息表達的問題,亦即各種算法的實現(xiàn);硬件實現(xiàn)層次可理解為如何組建機器視覺系統(tǒng)的硬件實體設備,與表達與算法層次一起為計算理論層次服務。
Marr提出的視覺框架中研究最多的是計算理論層次和表達與算法層次,分別對應下節(jié)要介紹的三維重建理論和圖像處理。
2 三維重建
視覺三維重建理論是整個視覺領域研究的重點和前沿??陀^世界的物體都是由基本的幾何要素組成的:點、直線、二次曲線等。因此,要實現(xiàn)對客觀世界的描繪,利用這些最基本的幾何要素來組建客觀世界是可以實現(xiàn)的。在很多研究中,通過大量的點對匹配得到三維世界中物體的三維點云模型,從而模擬出真實物體的形狀。在三維重建研究中,立體視覺或稱雙目(多目)視覺是最重要的手段。仿照人眼的原理,要獲得對周圍三維世界的認知,必須知道深度信息,最少需要兩個眼睛。與此同理,立體視覺一般都需要兩個或者多個攝像機同時工作,才能較好地得到周圍世界的三維信息。
2.1 攝像機針孔模型
攝像機的普適模型——針孔模型來源于小孔成像現(xiàn)象。簡單地說,針孔模型是指空間中一點P與攝像機中一特定點C(稱為光心)的連線交攝像機的圖像平面于點p,這個點p便是空間點P的成像點,蘊含了空間點P的幾何信息。從數(shù)學的觀點,攝像機的成像模型是一個從三維到二維的映射f:Pp,是一個降維映射,丟失掉了深度信息,即處于光心C—空間點P的直線上任意一點Q的投影也都是p。從數(shù)學上可以證明,至少需要兩幅或以上圖像才能重建出空間點P的深度信息zP。
2.2 空間點三維重建
采用兩個不同的攝像機位拍攝空間中同一點P的圖像,分別得到P在左右攝像機圖像平面上的投影點p\-L和p\-R,如果事先知道左右攝像機的相對位置關系——稱為雙目攝像機標定,那么就知道了左右攝像機的光心C\-L和C\-R的位置。簡而言之,雙目視覺系統(tǒng)能夠提供給我們一個坐標系(左或者右攝像機坐標系),在這個坐標系下通過攝像機標定知道兩個光心C\-L和C\-R的位置以及投影點p\-L和p\-R的位置,直線C\-Lp\-L和C\-Rp\-R的交點就是要重建的空間點P。
2.3 空間直線三維重建
空間直線的重建原理和空間點的重建類似,假如要重建空間直線L,得到L在左右攝像機圖像平面上的投影直線l\-L和l\-R,那么左攝像機光心C\-L和左投影l(fā)\-L形成一個平面S\-L,同理右攝像機光心C\-R和右投影l(fā)\-R形成一個平面S\-R,則空間直線L就是平面S\-L和S\-R的相交直線。
2.4 二次曲線三維重建
實二次曲線一般包括橢圓、雙曲線、拋物線和圓[3]。關于二次曲線的三維重建,司少華等[4]在1993年提出了一種特征值的方法,其開創(chuàng)性貢獻在于首先將二次曲線視為一個幾何元素來進行重建,而非利用二次曲線由其上的若干點(至少5個點)決定的原理,更不是利用點云的思想來重建二次曲線。將要重建的對象視作整體而非利用局部元素(點)去擬合逼近的思想是視覺理論更進一步的發(fā)展。圓作為最常見的二次曲線特征被廣泛應用在物體空間定位上[5]。
3 圖像處理
圖像處理是指利用計算機對圖像進行分析,得到需要的信息。所謂圖像,其數(shù)學模型即一個二元向量函數(shù)f(x,y),其坐標(x,y)表示圖像的橫縱坐標。對于灰度圖像,這個向量函數(shù)成為一個標量函數(shù),f(x,y)表示對應平面坐標(x,y)的灰度值。對于彩色圖像,一般使用RGB三原色來表征,即f=[R,G,B]\+T。圖像處理的內容非常豐富,包括了圖像濾波去噪、邊緣檢測、圖像復原、形態(tài)學處理、圖像分割等。其中,為了得到三維重建所必須知道的點、直線、二次曲線等圖像信息,邊緣檢測至關重要。所謂邊緣檢測,目的是要識別出圖像中灰度值變化明顯的圖像點。圖像中突變的位置一般代表了三維世界中的不同屬性?,F(xiàn)有的邊緣檢測算子包括Canny算子[6]、Sobel算子、Prewitt算子、Roberts Cross算子、羅盤算子、Marr-Hildreth算子等。
A=imread('Beach.jpg');
B=rgb2gray(A);
C=edge(B,'canny',0.1);
imshow(C)
4 機器視覺應用及前景
機器視覺技術廣泛應用于機器人、工業(yè)檢測等領域。由于機器視覺系統(tǒng)是一套光學系統(tǒng),因此具有非接觸式測量的優(yōu)點。由于計算機的運算速度不斷刷新紀錄,使得圖像處理效率也不斷提升,運用機器視覺系統(tǒng)能夠為工業(yè)中的不同應用提供實時數(shù)據(jù)。加載視覺系統(tǒng)的智能機器人不僅擁有靈活、快捷的操作手臂,而且配置了靈敏的攝像機充當“眼睛”,還有超強計算能力的計算機充當“大腦”,真正實現(xiàn)了手—眼—腦同體。在工業(yè)檢測以及測量領域,機器視覺利用自身的獨特優(yōu)勢在質量缺陷、生產(chǎn)監(jiān)控等方面占據(jù)了重要地位。機器視覺是一種人工智能技術,在未來的智能化時代,視覺技術必定能成為人機交互的最重要途徑之一。
參考文獻:
[1] 張廣軍.機器視覺[M].北京:科學出版社,2005.
[2] 馬頌德,張正友.計算機視覺:計算理論與算法基礎[M].北京:科學出版社,2003.
[3] 呂林根,許子道.解析幾何[M].北京:高等教育出版社,2006.
[4] 司少華,馬頌德.基于二次曲線的立體視覺[J].自動化學報,1993,19(4):420-427.
篇6
關鍵詞:ICA-HMAX模型;視覺相似度;卷積核;語義相似度
中圖分類號:TP317 文獻標識碼:A 文章編號:1009-3044(2016)08-0177-05
Abstract: This paper firstly introduces a multi-level convolutional ICA-HMAX model; then propose visualization methods of the convolution kernel convolution kernel to achieve different levels of understanding. Proposed using S3 layer feature of the ICA-HMAX model to achieve visual similarity calculation of different categories. By implementing different categories of visual similarity between calculated on Caltech 101 datasets, and compared with the semantic similarity between categories and further explore the relationship between semantic similarity and visual similarity between.
Key words: ICA-HMAX model ;visual similarity; kernel convolution kernel; semantic similarity
1 概述
21世紀以來,數(shù)字成像技術和存儲技術得到了空前的發(fā)展;使得每天有數(shù)量巨大的數(shù)字圖像進入人們的生活,成為人類生活、工作、娛樂中的組成部分。另一方面,互聯(lián)網(wǎng)技術的發(fā)展給圖像的迅速傳播提供了有利的條件。此外,圖像是視覺信息的重要來源之一,蘊含豐富的語義信息。圖像理解是人工智能領域中的一個新的方向,其核心問題是研究如何使計算機能夠像人腦一樣有效正確理解圖像中所表達的高層語義信息。
仿生多層模型在計算機視覺和人工智能鄰域取得了顯著的成果。20世紀末,Poggio和Riesenhuber根據(jù)IT皮層的生理學數(shù)據(jù)提出了標準HMAX模型[1],該模型模擬視皮層中腹側通路中簡單細胞(Simple Cell)和復雜細胞(Complex Cell)的交替處理的功能,實現(xiàn)多層次特征提取。在此基礎上,Serre等人提出一種具有隨著層次的增加復雜度和不變性逐漸增強的圖像特征表達[2],并將其應用到真實場景的目標識別中,其識別性能明顯優(yōu)于傳統(tǒng)的特征表達(如SIFT特征[3]);Hu等人根據(jù)大腦神經(jīng)元響應的稀疏特性進一步擴展HMAX模型,提出了Sparse-HMAX模型[4],在分類性能上遠遠優(yōu)于HMAX模型,同時較好模擬和解釋神經(jīng)元對視覺信號的稀疏響應。
本文內容章節(jié)安排如下:第2節(jié)首先簡要描述了本文的ICA-HMAX模型;然后介紹卷積核的可視化方法;第3節(jié)介紹基于WordNet的語義相似度計算和基于ICA-HMAX的視覺相似度計算方法。第4節(jié)實驗結果和分析。第5節(jié)總結與展望。
2 ICA-HMAX模型與卷積核可視化
2.1 ICA-HMAX模型簡介
前饋ICA-HMAX模型由五層構成如圖1所示。自底向上依次為S1C1S2C2S3五層,其中S1層卷積核(W1、V1)由獨立成分析(Independent Component Analysis,ICA)方法從彩色圖像的數(shù)據(jù)塊中學習獲得,為了使得C1層具有局部空間平移不變性,在S1層的每個二維平面響應圖上進行局部最大值匯聚(max pooling)操作;同理,S2層卷積核(W2、V2)也是采用ICA方法從C1層采樣塊中學習獲得;同樣,為了使得C2層也具有局部空間平移不變性,在S2層的每個二維平面響應圖上進行最大值匯聚(max pooling)操作;同理可以獲得S3層的卷積核(W3、V3)以及S3層的特征表達。值得注意的是該前饋模型的卷積核均為單尺度。
2.2 卷積核的可視化
若要實現(xiàn)對多層模型ICA-HMAX的深入的了解,需要知道不同層次的卷積核編碼的圖像信息。由于S1層特征卷積核是在彩色圖像的原始像素層上學習,可以在像素空間上直接觀察S1層卷積核編碼的圖像信息。而S2、S3層的卷積核是在圖像C1、C2層的響應圖上經(jīng)過ICA學習獲得高維數(shù)據(jù),因此不能直接觀察其卷積核編碼的圖像信息。為了觀察S2、S3層的卷積核所編碼的圖像信息,當給定一個某個類別的卷積核的條件下,本文提出在該類別的圖像上找出使得該卷積核的刺激最大的前50個感受野區(qū)域,并將這些區(qū)域與其刺激的響應值進行加權求和,然后取平均;所得結果具有表示S2、S3層卷積核所編碼的圖像信息從而作為S2、S3層的卷積核可視化。
3 相似度計算
3.1 基于WordNet的語義相似度計算
WordNet是由普林斯頓大學心理學家,語言學家和計算機工程師聯(lián)合設計的一種基于認知語言學的英語詞典。它不是光把單詞以字母順序排列,而且按照單詞的意義組成一個“單詞的網(wǎng)絡”。一般來講,國內外的研究學者將經(jīng)典的基于語義的相似度的計算方法分為三個類型[6,7]:基于距離的相似度計算(Path Counting Measures)、基于信息內容的相似度計算(Information Content Measures)和基于特性的相似度計算(Feature-based Measures)。本文主要介紹基于距離的相似度計算方法――Shortest Path算法和Leacock and Chodorow算法。
3.2 基于視覺的類別相似度
眾所周知,不同類別之間存在部分外觀相似性,比如山貓和豹、狼和哈士奇、浣熊和果子貍等等??梢姡謩e在兩個類別的訓練集上訓練ICA-HMAX模型,若兩個類別視覺相似度越高,則這兩個類別的S3層卷積核相似的基元個數(shù)越多;反之,兩類別的S3層卷積核中的相似的基元個數(shù)越多,兩個類別的視覺相似度越高。
我們知道兩個類別的相似度越高,則兩個類別的ICA-HMAX模型越能較好地實現(xiàn)對異類圖像的相互表達。因此采用配對字典的方法[10]實現(xiàn)對S3特征表達的重構。然后,將重構圖像與輸入圖的結構相似度[11](SSIM)作為衡量S3層特征對輸入圖像描述的好壞。若重構圖像與輸入圖的結構相似度越高,則兩個類別的視覺語義相似度越高,反之亦然?;谀繕祟悇e的視覺語義相似度算法流程如表1所示:
4 實驗結果與分析
實驗設置:實驗所使用的PC機配置為Intel(R) Core(TM) i7-4770、CPU 3.4GHz × 8 cores、RAM 16 GB、Windows 7操作系統(tǒng)。為了探索不同類別之間的語義相似度和基于ICA-HMAX模型S3層的特征描述子的視覺語義相似度之間的關系,本文選擇了Caltech 101數(shù)據(jù)集[12]進行實驗,該數(shù)據(jù)集以彩色自然場景圖像為主(包含一定數(shù)量的人造圖像)。包括動物、花、人臉等101個目標類別以及一個背景類別。除背景類別之外,每個類別中的每張圖片只包括一個類別中的一個實例,這有利于本實驗進行。在進行實驗之前,首先對數(shù)據(jù)集中每張圖像做如下預測處理:統(tǒng)一圖像高度為140個像素,保持圖像的長寬比不變,采用雙三次插值對其進行縮放。將每個類別中的圖片按照4:1的比例分成訓練集和測試集,在訓練上訓練各個類別的ICA-HMAX模型,采用3.2節(jié)介紹的視覺語義相似度方法在測試集上測試不同類別之間的視覺相似度。
4.1卷積核的可視化
圖3(b)、(c)、(d)分別給出了S1、S2和S3層卷積核的可視化結果。結果表明,不同層次的卷積核編碼了圖像不同類型的特征。圖3(b)中的S1層卷積核均編碼了圖像底層特征(如彩色邊緣、彩色表面、拐角等結構信息等),并且不同類別的底層特征具有相似的結構特征;值得注意的是,通過ICA在彩色圖像上的學習,獲得了重要的顏色信息如彩色邊緣、彩色表面等。S2層卷積核編碼了各類別的中層部件特征,例如face_easy類別的S2層編碼了人臉的眼睛、嘴巴、鼻子等信息,如圖3(c)所示。由圖3(d)可以看出,由于S3層卷積核的感受野比S2層大,編碼信息更趨于類別信息。研究表明:這符合圖像理解的層次特性[13]。
4.2 相似度
數(shù)據(jù)集Caltech101圖像部分類別之間的基于路徑的Shortest Path算法和Leacock and Chodorow的相似度矩陣分別如圖4和圖5所示。由圖4和圖5可以看出這兩個矩陣都是對稱矩陣。與一個類別最相似的類別有的不止一個,如與ant類別最相近的類別是butterfly、dragonfly、mayfly。值得注意的是圖5中基于路徑的Leacock and Chodorow算法的類別相似度數(shù)據(jù)是經(jīng)過歸一化處理后的數(shù)據(jù)。
本文采用基于ICA-HMAX模型的S3層的特征計算視覺相似,其視覺相似度矩陣的結果如圖6所示。在該相似度矩陣中,把同一類別之間的視覺相似度設置為1作參考,來衡量不同類別之間的視覺相對度。在圖6中橫軸表示ICA-HMAX模型的類別??v軸表示測試圖像的類別。由圖6可見,不同類別之間的視覺相似度矩陣不是對稱。比如用airplane的ICA-HMAX模型對helicopter類別的圖像進行表達,并計算其視覺相似度其值為0.506;而當用helicopter的ICA-HMAX模型對airplane類別的圖像進行表達,并計算其視覺相似度其值為0.253。且與一個類別最相似的類別只有一個。在Caltech101數(shù)據(jù)集中helicopter類別的直升機的實例圖片上都存在較為明顯的螺旋槳。在airplane類別的飛機圖像沒有明顯的螺旋槳。而在忽略helicopter類別的直升機螺旋槳后,直升機的機體形狀與airplane類別的機體在視覺上存在相似?;谡Z義和視覺的相似度統(tǒng)計如表2所示。
兩種相似度之間的差異性分析:由表2可知,基于語言的語義的相似度與基于視覺的相似度之間存在一致性和差異性。一致性:由表2可知,20個類別中基于語義和視覺的相似度一致有5對,分別sunflower和bonsai、rhino和llama、airplane和helicopter、ant和mayfly、hedgehog和llama。比如airplane和helicopter這兩個類別的實例如圖7所示。由圖可見,不同類別之間存在視覺相似,兩個類別實例在的某些局部形狀、顏色、紋理等方面具有視覺上的相似性。差異性:由表2可知:20個類別中基于語義和視覺的相似度不一致的較多。如圖8所示,ant、butterfly和dragonfly這三個類別的語義相對度很高但是它們的視覺相似度相差較大。原因在于:語義即語言意義,是人腦對客觀上事物的認識和理解,它具有高度的概括性和抽象性。類別之間的語義往往根據(jù)類別所屬范疇、關系、屬性、功能等綜合特性來進行劃分。而僅僅從事物的視覺外觀上無法體現(xiàn)出上述種種關系。
5 結論與展望
通過ICA-HMAX不同層次卷積核的可視化分析可知:自底層到高層不同層次的卷積編碼規(guī)律如下:不同層次的卷積核編碼了圖像不同類型的特征。模型的層次越高,卷積核編碼的信息越趨向于反映目標類別的特性,S1層卷積核編碼體現(xiàn)底層共享特征(如拐角、 彩色邊緣、彩色表面等)。S2層卷積核編碼中層部件特征,比如face_easy類別的S2層編碼了人臉的眼睛、嘴巴、鼻子等局部信息。S3層編碼信息更趨于類別的全局信息。研究表明:這符合圖像理解的層次特性。
通過視覺的相似和語義的相似度分析可知,基于ICA-HMAX模型的S3層特性的視覺相似度與語義相似之間存在一致性和差異性。這種一致性和差異性在計算機視覺和人工智能領域具有互補性。比如對于那些語義和視覺的相似度一致的類別,尤其是視覺相似度較高的類別之間可以進行遷移學習,使得計算機實現(xiàn)人類的類比學習能力。對于語義和視覺的相似度差異性在圖像的檢索和圖像理解等方面可以實現(xiàn)互補。通過語義的相似度我們可以檢索到較多的相似類別,如與ant語義相似的有ant、dragonfly、butterfly。這樣我們可以實現(xiàn)大范圍的查找。然后在通過視覺的相似度進一步篩選正確的類別圖片。反之,通過語義可以指導基于視覺的機器學習。
參考文獻:
[1] Riesenhuber M, Poggio T. Hierarchical models of object recognition in cortex [J]. Nature neuroscience, 1999, 2(11): 1019-1025.
[2] Serre T, Wolf L, Bileschi S, et al. Robust object recognition with cortex-like mechanisms [J]. IEEE Transactions on Pattern Analysis and Machine Intelligence,2007, 29(3): 411-426.
[3] Lowe D G. Distinctive image features from scale-invariant keypoints [J]. International journal of computer vision, 2004, 60(2): 91-110.
[4] Hu X, Zhang J, Li J, et al. Sparsity-regularized HMAX for visual recognition [J]. PloS one, 2013, 9(1): e81813-e81813
[5] Nair V, Hinton G E. Rectified linear units improve restricted boltzmann machines [C] //Proceedings of the 27th International Conference on Machine Learning (ICML-10). 2010: 807-814.
[6] Hliaoutakis A. Semantic Similarity Measures in MeSH Ontology and their application to Information Retrieval on Medline [J]. 2005.
[7] Raftopoulou P, Petrakis E. Semantic similarity measures: A comparison study [J]. Technical University of Crete, Department of Electronic and Computer Engineering, Tech. Rep. TR-TUC-ISL-04-2005, 2005.
[8] R. Rada, H. Mili, E. Bicknell and M. Blettner, “Development and Application of a Metric on Semantic Nets”, IEEE Transactions on Systems, Man and Cybernetics, vol. 19, Issue 1, (1989) January-February, pp. 17 - 30.
[9] H. Bulskov, R. Knappe and T. Andreasen, “On Measuring Similarity for Conceptual Querying”, Proceedings of the 5th International Conference on Flexible Query Answering Systems, (2002) October 27-29, Copenhagen, Denmark.
[10] Vondrick C, Khosla A, Malisiewicz T, et al. HOGgles: Visualizing Object Detection Features[C]//Proceedings of the IEEE International Conference on Computer Vision. 2013: 1-8.
[11] Wang Z, Bovik A C, Sheikh H R, et al. Image quality assessment: from error visibility to structural similarity [J]. IEEE Transactions on Image Processing, 2004, 13(4): 600-612.
篇7
關鍵詞:虛擬現(xiàn)實技術;校園環(huán)境設計;分析
DOI:10.16640/ki.37-1222/t.2016.23.108
0 前言
隨著社會和科學技術的發(fā)展,基于圖像繪制的虛擬現(xiàn)實技術已經(jīng)成為計算機視覺,圖像處理,計算機圖形學,人工智能研究的熱點。雖然虛擬現(xiàn)實技術目前在很多領域中的實際應用已有很大進展,例如虛擬現(xiàn)實技術己經(jīng)廣泛地應用于軍事、醫(yī)學、建筑、商業(yè)等領域。
伴隨著虛擬現(xiàn)實技術(VR技術)的日益成熟和飛速發(fā)展,在園林景觀設計中,對虛擬現(xiàn)實技術的應用也不斷加強。
1 虛擬現(xiàn)實技術的簡介
虛擬現(xiàn)實技術又稱VR技術,是20世紀90年代伴隨著計算機技術而興起的新興技術,主要特點是可沉浸式的與虛擬場景進行交流互動,它的基礎媒介和載體是計算機和互聯(lián)網(wǎng),利用計算機生成一種仿真系統(tǒng)來模擬真實環(huán)境,利用互聯(lián)網(wǎng)充分傳播虛擬現(xiàn)實技術,虛擬現(xiàn)實技術被應用在軍事、醫(yī)學、商業(yè)、建筑規(guī)劃等多個領域,具有廣泛的發(fā)展前景。
而近幾年隨著虛擬現(xiàn)實技術的不斷發(fā)展,人機交互技術成為了虛擬現(xiàn)實領域的一項重要研究方向,由此而引發(fā)了一系列的交互性硬件載體的出現(xiàn),如3D虛擬眼鏡、浮動鼠標器、頭盔式虛擬顯示器、數(shù)據(jù)手套、數(shù)據(jù)衣、語音識別器等,通過這些傳感設備,體驗者可以對虛擬世界中的物體進行觀察和操作,使體驗者擁有沉浸式的體驗感受,融入五感體驗(視覺、嗅覺、聽覺、味覺、觸覺)的虛擬現(xiàn)實技術與以前的單純通過視覺來刺激體驗者的模式發(fā)生了質的變化。
2 虛擬現(xiàn)實技術在校園環(huán)境設計領域的應用
2.1 虛擬現(xiàn)實軟件
虛擬現(xiàn)實技術所應用的軟件主要分為前期建模階段的軟件和后期渲染的軟件,前期建模階段的主流軟件有:MAYA、3Dsmax、犀牛、Google Sketchup,后期渲染的軟件主要有l(wèi)umion、unity3D、C4D、Vray、光輝城市、酷家樂。
2.2 應用特點介紹
(1)準確性:利用計算機輔助系統(tǒng)下的虛擬現(xiàn)實技術,在虛擬場景建立方面具有很強的精準度,根據(jù)實際設計中的真實尺寸可以創(chuàng)造出真實建立之后的效果感受,供使用者觀察。(2)實時渲染:利用虛擬現(xiàn)實軟件生成的實時渲染場景,具有良好的可視化效果,通過實時渲染技術,生成真實的陽光、風向、天氣、季節(jié),模擬大自然的真實光照,使體驗者沉浸于場景的游覽交互中,而且無需像傳統(tǒng)渲染那樣耗費大量時間。(3)想象力:除了虛擬現(xiàn)實校園環(huán)境具有模擬真實場景外,還可以進行模擬某些不可能發(fā)生的場景環(huán)境,使得游覽體驗過程中的趣味性得到極大的提高,超越體驗者的想象。
2.3 虛擬現(xiàn)實技術與3D動畫的區(qū)別
傳統(tǒng)的3D動畫與虛擬現(xiàn)實表現(xiàn)技術表面上看起來都具有動態(tài)效果,但實質卻完全不同。虛擬現(xiàn)實技術可以進行人機交互,由人控制虛擬場景的鏡頭,具有實時渲染的效果,而3D動畫雖然也是動態(tài)效果,卻是不可操控的,由設計師事先做好播放的,更不能進行場景切換和鏡頭操控等動作。在虛擬場景下操控者可以對設計方案進行創(chuàng)作、修改和優(yōu)化,而3D動畫無法進行二次修改,只能重新制作而耗費了大量人力物力和時間成本。
2.4 虛擬現(xiàn)實技術在景觀設計中的應用特色
傳統(tǒng)校園景觀設計的表現(xiàn)多側重于手繪圖和平面CAD圖和PS效果圖,在對外宣傳過程中,CAD圖和PS效果圖這些表現(xiàn)方法,無法提供給體驗者沉浸感和真實的3維感受,也無法根據(jù)意愿自由旋轉視角,通過平面圖推敲想象方案,無法以人的視角進行活動。而在虛擬現(xiàn)實系統(tǒng)中的校園景觀,我們利用計算機可以對不同人物的視線高度進行設置調整,體驗者可以隨意觀察場景內的任意角度,讓體驗者有親臨現(xiàn)場的真實感受。
3 交互性設備在校園環(huán)境設計中的應用發(fā)展
虛擬現(xiàn)實技術經(jīng)過十幾年的快速發(fā)展,在傳統(tǒng)的建模方法、效果表現(xiàn)等方面,已經(jīng)有了較大的突破和發(fā)展,隨著交互性設備在虛擬現(xiàn)實技術中的應用,校園環(huán)境設計領域的效果表現(xiàn)也迎來了新的改變。lumion6.3結合虛擬3D眼鏡,把lumion中的場景導出全景模式,將3D眼鏡與lumion連接,就可以進行3維全景觀看效果圖,伴隨著頭部的晃動,3D眼鏡內的的場景也會隨之變化。利用3D眼鏡觀察虛擬校園場景方案,相比傳統(tǒng)2維效果圖和平面圖,有了質的飛越,對于校園方案的效果感受將會更強烈。國內新晉軟件光輝城市也在虛擬現(xiàn)實表達領域有所發(fā)展,可以通過該軟件進行虛擬場景內的互動,漫游和修改場景,利用外接鼠標可以對場景內的鏡頭進行控制,利用鍵盤可以實現(xiàn)場景內的移動與行走,全方位觀察場景內的物體??峒覙纷鳛樾滦突ヂ?lián)網(wǎng)+的設計軟件,在室內設計領域的虛擬場景表現(xiàn)上技術很成熟,通過該軟件制作的虛擬校園室內實時渲染場景,體驗用戶可以通過鼠標進行3維角度旋轉進行瀏覽,比傳統(tǒng)3Dsmax渲染效果更直觀,最重要的是通過該軟件進行實時渲染效果好,速度快,節(jié)省了大量的渲染時間,從而節(jié)約了時間成本。
4 發(fā)展展望
伴隨著電腦和手機客戶端的日益強大、交互性硬件設施越來越完善,虛擬現(xiàn)實技術也將會越來越成熟,虛擬現(xiàn)實技術未來的兩大發(fā)展方向便是手機客戶端和交互性硬件的應用,伴隨著虛擬現(xiàn)實技術的發(fā)展,在校園景觀環(huán)境設計中,也將更多的被應用于方案設計階段、方案表達階段、以及后期虛擬校園運營服務階段,在21世紀,可視化的表達已經(jīng)不僅限于傳統(tǒng)二維平面的形式。
參考文獻:
[1]李國松.虛擬現(xiàn)實(VR)技術在風景園林規(guī)劃與設計中的應用研究[D].中南林業(yè)科技大學碩士學位論文,2007.
[2]蘆建國,蘇同向.虛擬現(xiàn)實技術與風景園林設計[A].南京林業(yè)大學,2007.
篇8
關鍵詞:目標跟蹤 視頻圖像 機器視覺
中圖分類號:TP3 文獻標識碼:A 文章編號:1672-3791(2012)06(a)-0007-01
隨著計算機技術的飛速發(fā)展,視頻圖像中的運動目標跟蹤作為計算機科學、人工智能、數(shù)學等多學科的結晶,逐漸成為圖像處理和計算機視覺領域的研究熱點,其應用范圍也逐漸拓展,目前,運動目標跟蹤已經(jīng)運用到了智能人機交互、醫(yī)療診斷、軍事制導、天文觀測、安全監(jiān)控等眾多領域。因此,在實際應用中,對運動目標跟蹤算法的研究具有重要的理論價值和現(xiàn)實意義。
1 基于區(qū)域的跟蹤
基于區(qū)域的跟蹤方法首先要得到包含目標的區(qū)域模板,模板的提取一般通過圖像分割獲得或者是預先人為確定,模板通常為略大于目標的矩形,也可以是不規(guī)則形狀,然后設定一個相似性度量,在序列圖像中搜索目標,把度量取極值時對應的區(qū)域作為對應幀中的目標區(qū)域。由于提取的目標模板是以目標整體作為對象,它包含了較完整的目標信息,因而具有較高的可信度。
由于該方法以目標的整體特征信息作為跟蹤依據(jù),所以在目標發(fā)生較小形變等情況下仍然可以準確的對目標進行跟蹤;在目標未被遮擋時,跟蹤的準確性和魯棒性也較好。其缺點首先是這種方法需要對整個圖像區(qū)域進行搜索,要求獲取的信息較多,因此比較耗時,不能滿足實際應用中視頻監(jiān)控實時性的要求,這種方法一般用于跟蹤較小的目標或者對比度較低的目標;而且跟蹤的目標變形不能太大,否則會導致跟蹤精度下降甚至目標丟失;而且,當目標出現(xiàn)太大遮擋時,也容易造成跟蹤目標的丟失。針對這些缺陷,近年來,對于基于區(qū)域跟蹤方法研究最多的是如何處理包含目標的模板更新,以保證跟蹤的連續(xù)性和穩(wěn)定性。
2 基于活動輪廓的跟蹤
基于活動輪廓跟蹤的基本思想是提取物體的邊界輪廓作為輪廓模板,利用封閉的曲線輪廓來表達運動目標,在后繼幀的二值邊緣圖像中跟蹤目標輪廓。由于這種方法所使用的模板是目標輪廓,并且匹配過程是在二值圖像中進行,所以相對基于區(qū)域的跟蹤算法來說,它的優(yōu)點是計算量較小,而且在目標被部分遮擋的情況下也能連續(xù)的進行跟蹤。近來發(fā)展很快的兩種基于輪廓匹配的跟蹤算法:一是主動輪廓線跟蹤算法(Snake模型),Kass[1]等人在1987 年提出了主動輪廓模型,也稱其為蛇模型,它是一條可變形曲線(Snake曲線),可任意調整曲線形狀使其與目標輪廓保持一致。另一種是基于Hausdorff距離的輪廓跟蹤算法?;贖ausdorff距離的形狀匹配不同于其他的形狀匹配,一方面,Hausdorff距離不需要建立兩個點集中的點之間一一對應的關系,并且對圖像噪聲和晃動具有較好的魯棒性。其缺點是當所匹配的點的數(shù)目比較大時,匹配效率會迅速降低,通常計算量也較大。
在基于活動輪廓方法中,初始化輪廓是整個算法的核心和關鍵,如何準確的獲取運動目標的初始輪廓也是算法研究中的一個難題,而且運動物體輪廓的更新比較困難,這也決定了基于活動輪廓的方法無法在目標跟蹤中得到普遍應用。
3 基于特征的跟蹤算法
基于特征的跟蹤方法基本思想是,在跟蹤過程中首先提取目標的某個或某些具有不變性的特征,然后利用相關算法實現(xiàn)對運動目標的跟蹤。該方法包括特征提取和特征匹配兩個過程。目前常見的特征選擇有角點、紋理、色彩等,但在序列圖像中,單一的特征選取往往無法實現(xiàn)跟蹤的準確性。因此,基于多特征融合的目標跟蹤成為當前研究的趨勢。基于特征的方法其優(yōu)點是能夠在部分遮擋的情況下,仍舊實現(xiàn)目標跟蹤,在準確選取特征點的前提下,還可以克服關照改變以及目標發(fā)生幾何形變時帶來的跟蹤障礙。同時,該方法還可以將與粒子濾波器[2]、mean-shift算法[3]等結合使用,提高跟蹤的實時性和魯棒性。
4 基于模型的跟蹤
基于模型的跟蹤方法首先是對目標物體的外形特征進行建模,然后通過一定的匹配方法跟蹤目標,并進行模型的實時更新。常用的表征物體模型的形式一般分為三類:線圖模型、2D模型和3D模型。目前應用較多的是利用物體的三維立體模型?;谀P偷母櫡椒词乖谀繕俗藨B(tài)變化和部分遮擋的情況下,仍舊可以精確分析目標的運動軌跡,實現(xiàn)可靠的跟蹤,因而它有較強的魯棒性。但是由于在現(xiàn)實生活中獲得所有運動目標的精確模型是非常困難的,因此限制了基于模型的跟蹤算法的使用。其次,該跟蹤方法需要大量的時間來計算復雜的模型,比較耗時,不能滿足跟蹤過程中的實時性和迅速性要求。
5 結語
視頻圖像跟蹤作為機器視覺領域研究的一個重要內容,融合了多個學科的知識,具有很大的理論和應用價值,盡管目前對視頻圖像中運動目標跟蹤的研究取得了較多的成果,但仍有很多亟待解決的問題,比如怎樣解決算法實時性和準確度之間的矛盾,同時,算法研究的通用性也始終未能取得全面性的突破和進展,因而研究進程中將會面臨許多的挑戰(zhàn)。伴隨著多媒體技術、生物學技術以及神經(jīng)理論知識的不斷進步,同時基于社會各行各業(yè)對于目標跟蹤技術的不斷增長的需求,相信不久之后,運動目標的跟蹤技術將會得到飛速的發(fā)展。
參考文獻
[1] KASS M,WITKIN A.Snakes:active contour models[J].International J of Computer Vision,1988,1:321~331.
篇9
關鍵字:多投影面;教學系統(tǒng);沉浸式環(huán)境
中圖分類號:G434 文獻標志碼:B 文章編號:1673-8454(2014)02-0070-03
虛擬現(xiàn)實技術的發(fā)展使得計算機技術不再是完成某一項工作的重要工具,而是朝著更人性化的一面發(fā)展,它可以使用戶足不出戶就享受到計算機虛擬世界給我們帶來的真實感覺。顯示技術是最終形成虛擬環(huán)境的關鍵步驟。目前沉浸式顯示技術正處于蓬勃發(fā)展的階段。
多投影面沉浸式虛擬環(huán)境是由多臺投影儀拼接而組成的大規(guī)模顯示設備,加上各種人機交互設備,能夠更加清晰地模擬現(xiàn)實世界場景以及對歷史的逼真反映,給用戶帶來更佳的視野范圍和更強的沉浸感,[1]它可以是對高性能計算結果或數(shù)據(jù)庫的可視化,也可以是純粹的虛擬空間。多投影面沉浸式虛擬環(huán)境為學校教學中創(chuàng)設鮮活的情境提供了技術支持,可以成為一種全新的教學平臺,學習者可以以各種自然的交互手段與虛擬世界進行交互獲取知識,改變了傳統(tǒng)學習環(huán)境下學習者被動接受的學習方式,讓學習者有一種主動學習的環(huán)境。
一、多投影面沉浸式虛擬環(huán)境的實現(xiàn)
1.系統(tǒng)總體設計
多投影面沉浸式虛擬環(huán)境按系統(tǒng)結構主要分為:投影系統(tǒng)、用戶交互系統(tǒng)、圖形與計算系統(tǒng)。投影系統(tǒng)主要包括投影儀陣列以及投影屏幕,用來顯示大范圍畫面,實現(xiàn)沉浸式體驗;用戶交互系統(tǒng)是讓用戶通過各種虛擬現(xiàn)實交互設備與系統(tǒng)應用程序之間進行自然的交互;圖形與計算系統(tǒng)是負責生成虛擬環(huán)境并對用戶的交互信息進行處理。
在投影系統(tǒng)搭建的過程中,圖1所示的多投影面沉浸式虛擬環(huán)境的系統(tǒng)設計方案如下:使用多臺PC機、多臺投影儀、一個攝像機,將其中一臺PC機作為圖像校正服務器(Client PC),負責捕獲投影儀的反饋信息,計算校準數(shù)據(jù);另外幾臺PC機(Server PC)作為客戶端,分別連接一臺投影儀,用于負責讀取、處理并根據(jù)相應位置分布繪制各顯示區(qū)域的數(shù)據(jù);最后分別通過相應的投影儀輸出到投影屏幕,構成一個完整的無縫的顯示畫面,各計算機通過局域網(wǎng)進行連接和通信,采用鼠標或鍵盤等方式與系統(tǒng)進行交互。
2.關鍵技術
在多投影面沉浸式虛擬環(huán)境的構建過程中,為了保證高清晰、實時流暢、邏輯上完整的顯示效果,幾何校正和顏色校正是最為關鍵的問題。技術流程如圖2所示。
幾何校正是為了解決單個投影在投影屏幕上產(chǎn)生畸變問題以及多個投影儀之間的畫面對齊問題,使得整個投影畫面看起來具有連續(xù)性。[2]
在本系統(tǒng)中,我們在前人研究的基礎之上,采用一臺反饋照相機來獲取投影圖像的幾何位置信息,根據(jù)圖像處理技術對原始圖像進行幾何畸變校正,使得各投影儀投出的圖像能形成一幅完整的畫面,使使用者完全沉浸在由多個投影儀創(chuàng)建的虛擬環(huán)境中。在實驗過程中考慮到由照相機鏡頭自身畸變而造成的扭曲,所以在幾何校正之前,我們采用張正友[3]提出的攝像機標定的方法對數(shù)碼相機進行標定,從而對拍攝出的圖像進行預校正。
幾何校正方案如下:
第一步,特征點采集與處理。對每臺投影儀以此投影一組特征圖案,利用數(shù)碼相機進行特征圖案采集。再利用圖像處理技術對拍攝圖像進行處理,對投影儀依次編號記為Hi,與Hi對應的幀緩存中的特征點記為Fi;
第二步,求出所有投影儀顯示區(qū)域的最大有效顯示區(qū)域,并按等距離原則細分最大有效區(qū)域,記為Pi;
第三步,利用最小二乘法計算相機圖像到投影儀幀緩存圖像的映射關系,記為M。并求出映射矩陣M的逆矩陣M-1,再利用投影儀的有效顯示區(qū)域預校正緩存區(qū)的圖像。
為了真正地實現(xiàn)畫面的完整性,還有一個必須解決的問題就是顏色校正問題。顏色校正主要用來解決不同投影儀表現(xiàn)在顏色上的差異而導致畫面整體上的顏色不一致問題。所以要采用有效的方法盡可能地消除或縮小這種顏色差異,給人更好的視覺效果,具體算法本文不做詳細介紹。
二、多投影面沉浸式虛擬環(huán)境的特點及應用實例
1.多投影面沉浸式虛擬環(huán)境的特點
①逼真性
在多投影面沉浸式虛擬環(huán)境中,逼真性主要表現(xiàn)在環(huán)境的真實性、視野范圍的無限擴充和對象動作的流暢展示。通過增加投影儀的數(shù)量,使用超大的物理尺寸屏幕,可以體現(xiàn)出真實的圖像質量,實現(xiàn)單個投影所不能獲得的視覺效果,給用戶帶來身臨其境的感覺。
②沉浸感
理想的虛擬環(huán)境是使用戶達到難以分辨真假的程度。在多投影面沉浸式虛擬環(huán)境中,沉浸感主要是用戶對由計算機創(chuàng)造和顯示出來的虛擬環(huán)境的感知和認識。當用戶置身在多投影面沉浸式虛擬環(huán)境中時,其感覺系統(tǒng)在處理來自虛擬環(huán)境中的視覺和其他感知數(shù)據(jù)時的方式如同在真實環(huán)境下一樣。
③交互性
在多投影面沉浸式虛擬環(huán)境中,用戶可以與計算機生成的虛擬環(huán)境進行自然交互,能夠用人類自然的感知能力與虛擬環(huán)境中的對象進行實時交互,讓我們很容易地進入角色,大大增強了參與其中的趣味性。
2.應用實例
根據(jù)多投影面沉浸式虛擬環(huán)境的特點以及其他領域的廣泛應用,在教學系統(tǒng)中的應用可以分為兩大類別的學科:①結構演示和位置信息展示等學科的學習。包括工程中的結構圖、地理學習中的信息圖示、模型演示等。如化學學習過程中,通過多投影面沉浸式虛擬環(huán)境真實地展示出物質分子結構模型。②動作演示類的科目。主要包括具體的操作以及與操作相關的位置信息等。其在醫(yī)療手術、化學實驗的具體操作當中有很好的應用價值。
三、多投影面沉浸式虛擬環(huán)境對教學的促進作用
1.創(chuàng)建逼真的實習場,為情境學習提供更真實的學習環(huán)境
根據(jù)情境學習理論的觀點,實踐不是獨立于學習的,意義也不是與實踐和情境脈絡相分離的,真正的意義是在實踐和情境脈絡中加以協(xié)商的。[4]情境學習的關鍵是創(chuàng)設學習環(huán)境,在教學場所與空間內必須有真實的情境作為學習活動的目標,即實習場的創(chuàng)建。然而學校的學習環(huán)境與現(xiàn)實生活中的環(huán)境是完全不一樣的。如何創(chuàng)建這樣的實習場就成為我們要考慮的問題。傳統(tǒng)的拋錨式教學是通過真實化的錄像境脈來呈現(xiàn)與解決問題相關的信息。然而,這樣只能使學習者被動地觀看,不能導致學習的發(fā)生。多投影面沉浸式虛擬環(huán)境通過無限擴充學習者的視角視野,為學習者營造出身臨其境的感覺,將整個學習活動都拋錨在真實的情境之中。它構建出的實習場,不僅高度接近真實情境,將抽象化的知識具體化為可視化信息,而且其學習過程也與現(xiàn)實生活中的問題解決過程類似。學習者可以直接參與到“真實”的情境中,從而接觸許多平時不易接觸的場景。學生受到多感官強烈的刺激,增加了學習者體驗的真實性,改變了學習者僅僅面對靜態(tài)文字的傳統(tǒng)學習方式。
2.沉浸式的學習體驗,提高了學習者的參與性
人類學學家Lave在他的代表著作 《情境學習:合法的邊緣性參與》中指出:學習應該從參與實際活動的過程中學習知識。[5]也就是學習者不是被動的觀察者,而是主動參與其中的過程,那么如何使學習者主動參與其中而不偏離主題,這也是我們需要考慮的問題。另外,還有一些學者擔心學習者參與到真實情境中可能會帶來一些危險。多投影面沉浸式虛擬環(huán)境具有高仿真、寬屏幕、大視角、宏大震撼的效果,不再是傳統(tǒng)的書本教育和普通的多媒體教學,能極大地提高學習者的學習熱情和參與度,將學習者完全吸引并投入到當前情境中去,而忘卻了計算機設備的存在,過濾掉很多不相關的知覺,使注意力完全集中到學習任務中去。為學習者提供了豐富的情感虛擬體驗,使整個學習過程充滿樂趣,親身體驗更加強化了學習者的記憶和知識的建構。
3.交互式學習環(huán)境,豐富了情境學習的趣味性
特洛伊?威廉姆斯(Troy Williams)在回顧了教育信息化發(fā)展的歷程之后,提出為了給予學生力量,讓我們把交互式學習技術帶進教室吧。[6]其中就講到了如何實現(xiàn)課堂教學中的交互活動最大化。多投影面沉浸式虛擬環(huán)境應用于教學的過程中,為學習者提供了更加直接的交互環(huán)境,學習者在與虛擬信息的交互中獲得知識和經(jīng)驗,超越了傳統(tǒng)的以知識接受為主的間接獲取學習經(jīng)驗的方式,有助于培養(yǎng)學習者的動手實踐能力和自主探索問題的能力。學習者通過與系統(tǒng)進行交互,置身于“超越現(xiàn)實、身臨其境”的學習環(huán)境中。同時,多投影面沉浸式虛擬環(huán)境還是一個支持合作的協(xié)同環(huán)境,合作學習也是情境學習的重要方面,學習者可以以小組的形式參與到真實境脈中來,大大地改善了傳統(tǒng)的課堂學習氛圍,提高了學習者的學習積極性。在多投影面沉浸式虛擬環(huán)境中,學習者之間、學習者與教師之間進行協(xié)作,提出問題、討論結果、分享發(fā)現(xiàn)、探索未知的領域。
四、總結
本文探討了多投影面沉浸式虛擬環(huán)境對教學的重要作用,它所創(chuàng)造的逼真情境使學習者可以在課堂的實習場中體驗到現(xiàn)實生活的經(jīng)驗,并且支持交互操作、學習的交流合作等,學習者沉浸在虛擬環(huán)境中,實現(xiàn)知識的建構和遷移,并還原到實際生活中去。多投影面沉浸式虛擬環(huán)境由于其高度沉浸感和交互性,在遙感技術、展覽、工業(yè)設計、計算機可視化中具有非常好的應用前景。隨著虛擬現(xiàn)實技術的發(fā)展以及在教學中的應用,多投影面沉浸式虛擬環(huán)境的教育意義也備受關注,其在教育領域仍有很大的發(fā)展空間,有待于我們積極開發(fā)和應用。
參考文獻:
[1]林柏偉.PC架構的多投影面沉浸式虛擬環(huán)境及其應用[D].杭州:浙江大學,2003.
[2]黃淼,周志光,陶煜波,林海.基于數(shù)碼相機參數(shù)還原的多屏拼接幾何校正技術[J].計算機輔助設計與圖形學學報,2010(10).
[3]馬頌德,張正友.計算機視覺[M].北京:科學出版社,1998.
[4]俞貞.情境學習和學校環(huán)境中實習場的建構[J].全球教育展望,2006(5):35.
[5]王文靜.人類學視野中的情境學習[J].外國中小學教育,2004(4).
篇10
關鍵詞:顯著區(qū)域檢測; 視覺顯著性檢測; 評測
中圖分類號:TP301 文獻標識碼:A文章編號:2095-2163(2014)01-0038-03
0引言
人類可以快速準確地識別視覺場中的顯著區(qū)域。在機器上模擬人類的這種能力對于使機器能夠像人類一樣處理視覺內容是至關重要的。在過去的幾十年內,已有大量的顯著性檢測方法進入了公開發(fā)表。這些方法中的大部分[1-4]都趨向于預測人眼視覺注視點。然而這些人眼視覺注視點只是一些空間中的離散點,并不能準確地標識整個顯著區(qū)域[5-6]。
近些年來,一些科研單位和研究人員已經(jīng)開始密切關注于顯著區(qū)域檢測方法的構建工作,如洛桑聯(lián)邦理工學院的Sabine Süsstrunk研究員,以色列理工學院的Ayellet Tal教授,微軟亞洲研究院的研究人員,清華大學的胡世民教授等。顯著區(qū)域檢測方法對以下領域發(fā)揮著重大的助益作用:圖像分割[7]、物體檢測[8]、內容保持的圖像縮放[9]等。本文將對顯著區(qū)域檢測算法的研究現(xiàn)狀進行介紹,同時對典型的顯著區(qū)域檢測算法進行分析。
文章內容組織結構為:第2節(jié)對現(xiàn)有的顯著區(qū)域檢測算法進行了分類和分析;第3節(jié)對典型的顯著區(qū)域檢測算法進行了評測;最后在第4節(jié)給出了總結,并展望了下一步的研究工作。
1顯著區(qū)域檢測算法分類及分析
感知方面的研究成果表明[10]:在低層視覺顯著性中,對比度是最重要的影響因素?,F(xiàn)有的顯著區(qū)域檢測算法通過計算每個圖像子區(qū)域同其一定范圍內的相鄰區(qū)域的對比度來度量該圖像子區(qū)域的顯著性。而依據(jù)用于計算對比度的相鄰區(qū)域空間范圍的不同,現(xiàn)有的顯著區(qū)域檢測算法可分為兩類:基于局部對比的算法[6,11-12]和基于全局對比的算法[13-18]。下面分別對其探討如下。
1.1基于局部對比的顯著區(qū)域檢測算法
基于局部對比的顯著區(qū)域檢測算法通過計算每個圖像子區(qū)域或像素同其周圍一個小的局部領域的對比度來度量該圖像子區(qū)域或像素的顯著性。Ma等人[11]提出了一種基于局部對比和模糊生長的顯著區(qū)域檢測算法。該方法首先對輸入圖像進行均值濾波和降采樣。然后,該方法對新產(chǎn)生的低分辨率圖像中的每個像素計算其與周圍N個像素的LUV顏色向量的歐幾里得距離之和, 并將此值作為該像素的顯著值。為了從產(chǎn)生的顯著圖中提取顯著區(qū)域,Ma等人[11]運用模糊生長(fuzzy growing)的方法提取顯著區(qū)域。Liu等人[6]為了更加準確地檢測顯著區(qū)域,提出了一系列新的局部區(qū)域和全局特征用于計算顯著性。這些特征包括:多尺度對比,中心-周圍直方圖和顏色空間分布。該方法通過學習一個條件隨機場來高效地結合上述這些特征用于檢測顯著區(qū)域。由上可知,因為只是通過局部對比來檢測顯著區(qū)域,所以基于局部對比的方法趨向于關注邊緣周圍的區(qū)域,而不會突出整個顯著區(qū)域(在生成的顯著圖中即表現(xiàn)為邊緣周圍的區(qū)域具有高的顯著值,而顯著區(qū)域內部的顯著值則較低)。這個問題可以稱其為“不一致突出顯著區(qū)域”問題。
1.2基于全局對比的顯著區(qū)域檢測算法
基于全局對比的顯著區(qū)域檢測算法將整幅圖像作為對比區(qū)域來計算每個圖像子區(qū)域或像素的顯著值。Achanta 等人[13]從頻率域角度出發(fā),首次提出了一種基于全局對比的顯著區(qū)域檢測的方法。該方法將經(jīng)過高斯低通濾波圖像中的每個像素值和整幅圖像的平均像素值之間的歐幾里得距離作為該點的顯著值。該方法非常簡單,時間消耗非常低,且實驗結果在查準率-差全率方面的效果也堪稱優(yōu)良。該方法使得顯著區(qū)域檢測向實用化的方向更前進了一步。然而Achanta 等人提出的方法[13]在以下兩種情況下會失效:
(1)顯著區(qū)域的顏色占圖像中的大部分,通過方法[11]計算后,背景會具有更高的顯著值;
(2)背景中含有少量突出的顏色,這樣背景中的這部分顏色的顯著值也會非常高。第1期景慧昀,等:顯著區(qū)域檢測算法綜述智能計算機與應用第4卷
針對以上缺陷,作者又在文章[18]中將此方法完成了進一步的改進。作者發(fā)現(xiàn)檢測顯著區(qū)域邊緣和檢測顯著區(qū)域中心所需要的圖像頻段是不同的,由此而依據(jù)像素點越在圖像中心越可能接近區(qū)域中心這樣一個假設,來調整均值濾波的帶寬,使得位于顯著區(qū)域不同位置的像素點則有不同的均值濾波帶寬。而且,即將經(jīng)過濾波后的圖像中每個像素值和該像素所在的對稱子窗口內的像素平均值的歐幾里得空間距離作為該點的顯著值。經(jīng)過這樣的調整,算法的時間復雜度有所提高,但是實驗結果性能卻有較大提升。
Cheng等人在文章[15]中提出了兩種簡單快速且更為準確的顯著區(qū)域檢測方法。第一種方法只采用顏色的全局對比,作者將每個像素點和圖像中其它所有像素的Lab顏色向量的歐幾里得距離之和的1 / N(N為該圖的像素點個數(shù))作為該點的顯著值。為了更快速地開展計算,作者對圖像中的顏色進行了量化,以顏色為單位計算每種顏色和圖像中其它所有顏色的歐幾里得距離。第一種方法中只考慮了顏色的全局對比,并未考慮空間位置關系,使得和顯著區(qū)域顏色接近的背景區(qū)域的顯著值也較高。作者在加入空間位置關系后又一次提出了方法二:首先對圖像進行分割,獲得一定數(shù)量的子區(qū)域?;谧訁^(qū)域,將子區(qū)域之間的空間位置關系作為權值計算該子區(qū)域與圖像其它所有子區(qū)域之間的相似度之和。方法2比方法1的時間復雜度略高(主要是由于引入了圖像分割操作,該操作比較耗時),但是實驗結果得到了較大提高。通過仿真驗證,Cheng等人[15]提出的方法簡單高效。
He等人[17]在Cheng的研究基礎上,提出了結合全局對比和顏色空間分布的顯著區(qū)域檢測方法。作者指出顏色的空間分布越緊湊,該類顏色就應具有更高的顯著性,反之亦然。該方法將每類顏色所屬像素空間位置的方差作為衡量顏色空間分布的指標,生成顏色空間顯著圖。其后將顏色空間顯著圖和直方圖對比度顯著圖或區(qū)域對比度顯著圖進行疊加得到最終的顯著圖。Perazzi等人[16]也提出了一個基于對比度和空間分布的顯著區(qū)域檢測方法。
上述這些基于全局對比的顯著區(qū)域檢測方法可以在一定程度上消減“不一致突出顯著區(qū)域”問題。但是當顯著區(qū)域非常大或者圖像背景非常復雜時,這些基于全局對比的方法就趨向于突出背景區(qū)域而不是顯著區(qū)域了。因而該問題可以稱之為“突出圖像背景”問題。
2顯著區(qū)域檢測算法測試
本節(jié)使用Achanta等人[13]提出的公開可用的測試圖像庫來評價現(xiàn)有典型的顯著區(qū)域檢測算法的性能。該測試圖像庫包含了1 000幅自然圖像以及與其相對應標識顯著區(qū)域的二值基準圖像,并將查準率-查全率曲線作為衡量顯著區(qū)域檢測算法性能的評價指標。
圖1顯示了近期6個性能最先進的顯著區(qū)域檢測方法(MZ[11]、 LC[14]、 FT[13]、 HC[15]、 RC[15]、 SF[16])在Achanta數(shù)據(jù)集上的評測結果。這些方法中,對于FT、HC、RC和SF,本節(jié)使用作者的原始的實現(xiàn)程序來生成對應的顯著圖。而對于MZ和LC方法,本節(jié)直接使用Ma等人[11]和Cheng等人[15]所提供的顯著圖。由圖1可以看出SF在Achanta等人[13]提供的測試集上取得了最好的檢測性能。
3結論與展望
本文對現(xiàn)有的顯著區(qū)域檢測方法進行概述?,F(xiàn)有的顯著區(qū)域檢測方法是利用局部鄰域或者整幅圖像作為對比區(qū)域來計算顯著性的。從本質上而言,現(xiàn)有方法使用的并不恰當?shù)膶Ρ葏^(qū)域導致了其相應具有的“不一致突出顯著區(qū)域”和“突出圖像背景”兩個問題。在進行對比度計算之前,首先實現(xiàn)對比區(qū)域預估計的顯著區(qū)域檢測方法將成為下一步的發(fā)展趨勢。
參考文獻:
[1]ITTI L, KOCH C, NIEBUR E. A model of saliency-based visual attention for rapid scene analysis[J]. IEEE Transactions on Pattern Analysis and Machine Intelligence, 1998, 20(11):1254–1259.
[2]MURRAY N, VANRELL M, OTAZU X, et al. Saliency estimation using a non-parametric low-level vision model[C] // IEEE Conference on Computer Vision and Pattern Recognition. 2011:433–440.
[3]HOU X, ZHANG L. Saliency detection: A spectral residual approach[C] // IEEE Conference on Computer Vision and Pattern Recognition. 2007:1–8.
[4]BAN S, JANG Y, LEE M. A?ective saliency map considering psychological distance[J]. Neurocomputing, 2011, 74(11):1916–1925.
[5]LIU T, SUN J, ZHENG N, et al. Learning to detect a salient object[C] // IEEE Conference on Computer Vision and Pattern Recognition. 2007:1–8.
[6]LIU T, YUAN Z, SUN J, et al. Learning to detect a salient object[J]. IEEE Transactions on Pattern Analysis and Machine Intelligence 33 (2) (2011) 353–367. , 2011, 33(2):353–367.
[7]KO B C, NAM J Y. Object-of-interest image segmentation based on human attention and semantic region clustering[J]. Journal of Optical Society of America A, 2006, 23(10):2462–2470.
[8]RUTISHAUSER U, WALTHER D, KOCH C, et al. Is bottom-up attention useful for object recognition?[C] // IEEE Conference on Computer Vision and Pattern Recognition, 2004:30–37.
[9]ZHANG G X, CHENG M M, HU S M, et al. A shape-preserving approach to image resizing[C] // Computer Graphics Forum, 2009:1897–1906.
[10]EINHAS?ER W, KO^ENIG P. Does luminance-contrast contribute to a saliency map for overt visual attention?[J]. European Journal of Neuroscience, 2003, 17 (5):1089–1097.
[11]Y. Ma, H. Zhang, Contrast-based image attention analysis by using fuzzy growing[C] // ACM International Conference on Multimedia, 2003:374–381.
[12]KLEIN D, FRINTROP S. Center-surround divergence of feature statistics for salient object detection[C] // IEEE International Conference on Computer Vision, 2011:2214–2219.
[13]ACHANTA R, HEMAMI S, ESTRADA F, et al. Frequency-tuned salient region detection[C] // IEEE Conference on Computer Vision and Pattern Recognition, 2009:1597–1604.
[14]ZHAI Y, SHAH M. Visual attention detection in video sequences using spatiotemporal cues[C] // ACM International Conference on Multimedia, 2006:815–824.
[15]CHENG M, ZHANG G, MITRA N, et al. Global contrast based salient region detection[C] // IEEE Conference on Computer Vision and Pattern Recognition, 2011:409–416.
[16]PERAZZI F, KRAHENBUHL P, PRITCH Y, et al. Saliency ?lters: Contrast based ?ltering for salient region detection [C] // IEEE Conference on Computer Vision and Pattern Recognition, 2012:733–740.
熱門標簽
計算機畢業(yè)論文 計算機論文 計算機技術論文 計算機教育論文 計算機專業(yè)論文 計算機專業(yè)畢業(yè)論文 計算機教學論文 計算機基礎論文 計算機應用論文 計算化學論文 心理培訓 人文科學概論