計(jì)算機(jī)視覺(jué)教程范文

時(shí)間:2023-12-18 17:57:40

導(dǎo)語(yǔ):如何才能寫(xiě)好一篇計(jì)算機(jī)視覺(jué)教程,這就需要搜集整理更多的資料和文獻(xiàn),歡迎閱讀由公務(wù)員之家整理的十篇范文,供你借鑒。

篇1

關(guān)鍵詞:計(jì)算機(jī)視覺(jué);教學(xué)應(yīng)用;教學(xué)改革

計(jì)算機(jī)視覺(jué)是人工智能學(xué)科中的一門(mén)重要課程。隨著相關(guān)應(yīng)用在多個(gè)領(lǐng)域中的出現(xiàn),越來(lái)越多的學(xué)生開(kāi)始對(duì)這門(mén)課產(chǎn)生了濃厚的興趣。如何讓學(xué)生能夠在整個(gè)課程中保持盎然的興趣,并為有志于深入研究計(jì)算機(jī)視覺(jué)的學(xué)生指明方向,成為我們教師首先應(yīng)注重的問(wèn)題。

在實(shí)際的教學(xué)工作中,通過(guò)不斷摸索總結(jié),我們認(rèn)為,以實(shí)際應(yīng)用引導(dǎo)學(xué)生的學(xué)習(xí)興趣,既滿足了學(xué)生想了解計(jì)算機(jī)視覺(jué)實(shí)際應(yīng)用的需求,又加深了學(xué)生對(duì)于算法的理解,把算法放在一個(gè)實(shí)際應(yīng)用中,學(xué)生可以理解怎么用,為什么這么用。在這樣的目標(biāo)導(dǎo)引下,我們從選擇教材開(kāi)始,準(zhǔn)備教學(xué)內(nèi)容(包括合理的應(yīng)用實(shí)例的選擇)、制作PPT、探索教學(xué)方法,形成了目前以實(shí)際應(yīng)用為主導(dǎo)的創(chuàng)新教學(xué)體系,非常受學(xué)生歡迎。在此,我們對(duì)這期間遇到的問(wèn)題,解決方法、心得體會(huì)做一個(gè)總結(jié)和思考,希望能對(duì)同行有些許參考作用。

1選擇教材

在我們這個(gè)專業(yè),每年的上研率基本都保持在50%左右。在本專業(yè)的研究生階段,也開(kāi)設(shè)了雙語(yǔ)教學(xué)的計(jì)算機(jī)視覺(jué)課程。另外,畢業(yè)后選擇參加工作的同學(xué)也基本都進(jìn)入和本專業(yè)非常相關(guān)的一些單位,所從事的工作,都是和在學(xué)校學(xué)習(xí)的知識(shí)密切相關(guān)。

因此,如何讓這門(mén)課程的教學(xué)既兼顧本科畢業(yè)就參加工作的那部分同學(xué),又兼顧繼續(xù)深造的學(xué)生的需求,也是在這門(mén)課程講授的過(guò)程中,需要特別注意的一個(gè)問(wèn)題。對(duì)于本科畢業(yè)就要參加工作的同學(xué)而言,需要“廣度”,需要了解計(jì)算機(jī)視覺(jué)這門(mén)課在各個(gè)領(lǐng)域中的應(yīng)用,在實(shí)際中接觸到相關(guān)的項(xiàng)目或工作時(shí),能夠知道去哪里可以找到自己需要的參考資料;而對(duì)于要進(jìn)一步深造的同學(xué)而言,則需要一定的“深度”,為研究生階段的研究打下基礎(chǔ)。

全盤(pán)考慮到這些學(xué)生畢業(yè)之后的去向,我們選擇了兩本教材。一本是賈云得教授編著,科學(xué)出版社于 2000年出版的《機(jī)器學(xué)習(xí)》[2],這是一部順應(yīng)了時(shí)代與教學(xué)發(fā)展要求的教材,對(duì)計(jì)算機(jī)視覺(jué)中的基本概念、基本算法、基本算法的應(yīng)用、經(jīng)典應(yīng)用進(jìn)行了由淺入深的介紹。內(nèi)容涵蓋了所有經(jīng)典的數(shù)字圖像處理與機(jī)器視覺(jué)方法,也對(duì)一些已經(jīng)得到非常好實(shí)際應(yīng)用的方法,如光流法等作了簡(jiǎn)要介紹。另外還選擇了一本英文原版的計(jì)算機(jī)視覺(jué)的經(jīng)典著作,Ramesh Jain 教授等所著的《Machine Vision》[3],機(jī)械工業(yè)出版社于2003年出版。這是國(guó)內(nèi)外非常推崇的一本計(jì)算機(jī)視覺(jué)著作,該教材條理清晰,深入淺出,對(duì)計(jì)算機(jī)視覺(jué)的基本原理、算法、應(yīng)用的介紹非常詳盡。

在教學(xué)中,我們采用了英文的PPT,但主要用的教材是賈云得教授的《機(jī)器視覺(jué)》,這樣中英文對(duì)照講解,一方面加深學(xué)生對(duì)教學(xué)內(nèi)容的理解,另一方面也為學(xué)生今后閱讀專業(yè)的英文論了相應(yīng)準(zhǔn)備。

2教學(xué)內(nèi)容和工程實(shí)例的選取

2.1選取教學(xué)內(nèi)容

本課程之前,大學(xué)二年級(jí)的本科生已開(kāi)設(shè)數(shù)字圖像處理課程,但所講的基本原理和算法都非常淺顯,所以在教學(xué)內(nèi)容的安排上,分為兩大部分:數(shù)字圖像處理部分和視覺(jué)部分。數(shù)字信號(hào)處理部分主要講解在視覺(jué)部分會(huì)用到的一些基本算法,為后面進(jìn)入計(jì)算機(jī)視覺(jué)部分打基礎(chǔ)。這部分約占總課時(shí)的1/3。視覺(jué)部分的課時(shí)也分為兩部分:算法講解與實(shí)例講解。在算法講解部分,對(duì)計(jì)算機(jī)視覺(jué)的基本算法、經(jīng)典算法都做了深入淺出的講解。實(shí)例部分則選擇了經(jīng)典的工業(yè)應(yīng)用,讓學(xué)生能夠?qū)λ鶎W(xué)算法進(jìn)一步加以理解。

2.2選取適當(dāng)?shù)墓こ虒?shí)例

就計(jì)算機(jī)視覺(jué)的教學(xué)內(nèi)容而言,各個(gè)孤立的算法和方法對(duì)本科生來(lái)講,有些抽象不好理解。如果在教學(xué)上僅僅通過(guò)老師在課堂上的講解,很難讓學(xué)生深入地理解相關(guān)的教學(xué)內(nèi)容,而選擇一個(gè)觸手可及且簡(jiǎn)單好理解的工程實(shí)例往往就會(huì)達(dá)到意想不到的教學(xué)結(jié)果,學(xué)生可以把課堂上所學(xué)的枯燥理論與現(xiàn)實(shí)中活生生的事物聯(lián)系起來(lái),從而加深對(duì)教學(xué)內(nèi)容的理解。

通過(guò)反復(fù)比對(duì)、反復(fù)論證,我們選擇了在講解基本原理和算法之后,在課程結(jié)束前,專門(mén)留出課時(shí)講解手機(jī)制造這個(gè)例子。手機(jī)現(xiàn)在是人手一部,是這些年青學(xué)子再熟悉不過(guò)的事物了,通過(guò)對(duì)手機(jī)主板、手機(jī)鍵盤(pán)的制造過(guò)程的講解,把所學(xué)的算法都融合進(jìn)來(lái),學(xué)生在覺(jué)得有趣的同時(shí),不知不覺(jué)就加深了對(duì)所學(xué)算法的理解。

另外,在教學(xué)的過(guò)程中,我們還不斷穿插其他學(xué)生耳熟能詳?shù)膶?shí)例,如數(shù)碼相機(jī)原理中的一些算法的講解,我們和學(xué)生一起探討應(yīng)該怎么選擇數(shù)碼相機(jī)。再有,濾波器算法、在課堂上對(duì)Photoshop功能的演示,與所學(xué)算法關(guān)聯(lián)起來(lái),學(xué)生都很容易理解接受。

3教學(xué)點(diǎn)滴

3.1點(diǎn)睛之筆

在第一節(jié)課的講述中,我們的重點(diǎn)不在于Marr理論,而是告訴學(xué)生:

人工智能就是要讓計(jì)算機(jī)像人一樣,能夠會(huì)聽(tīng)、會(huì)看……

我們這門(mén)課程就是要讓計(jì)算機(jī)“會(huì)看”,要像人一樣會(huì)看。進(jìn)而展示給學(xué)生一些我們精心挑選的圖片,讓學(xué)生自己判斷,是不是自己的眼睛“騙了”自己,人眼和計(jì)算機(jī)看到的到底有什么不一樣。

每次講到這里,學(xué)生都會(huì)進(jìn)行熱烈的討論,每個(gè)人都有不同的看法,每個(gè)人都有自己的堅(jiān)持,不知不覺(jué)中,對(duì)這門(mén)課就產(chǎn)生了濃厚的興趣,有了繼續(xù)深入學(xué)習(xí)下去的愿望。在課堂討論的最后,比較人眼對(duì)圖片的判斷以及計(jì)算機(jī)的判斷后,讓學(xué)生自己總結(jié)歸納,我們這門(mén)課到底要研究些什么,都有可能應(yīng)用在哪些方面,然后對(duì)爭(zhēng)議比較大的提議一一探討。每到這個(gè)時(shí)候,大家的積極性就都被激發(fā)出來(lái),在不斷的爭(zhēng)論與思想碰撞中找出正確的結(jié)論。

3.2拿身邊的事物說(shuō)“事”

計(jì)算機(jī)視覺(jué)課程的前半部分,多涉及到圖像處理的一些常見(jiàn)算法。在講授各種各樣的濾波器和算子時(shí),并沒(méi)有針對(duì)各個(gè)濾波器和算子擺出一堆示例圖片,讓學(xué)生比較濾波前后的差異,從而很生硬地理解濾波器與算子的功能。取而代之的,我們首先以現(xiàn)在人手一臺(tái)的數(shù)碼相機(jī)為例提出問(wèn)題,你為什么要選擇你手里的這臺(tái)數(shù)碼相機(jī)?當(dāng)初選這個(gè)品牌和型號(hào)時(shí),你的考慮是什么?歷年學(xué)生的回答幾乎都是看網(wǎng)上測(cè)評(píng),或者在網(wǎng)上看別人怎么說(shuō)。這時(shí)列出我們收集到的各個(gè)品牌相機(jī)的測(cè)評(píng)報(bào)告,列出它們的優(yōu)缺點(diǎn),然后引導(dǎo)學(xué)生去思考,例如這個(gè)品牌的相機(jī)的缺點(diǎn)是照片發(fā)灰,不是很鮮亮,而另一個(gè)品牌的相機(jī)則綠的特別綠,紅的特別紅,為什么?那么有可能是哪部分的算法不夠完善,為什么?

通過(guò)如此簡(jiǎn)單的對(duì)比,學(xué)生的積極性被完全激發(fā)。原來(lái),數(shù)碼相機(jī)這個(gè)幾乎人人都有,大家都熟悉的“玩具”竟然和自己在課堂上學(xué)到的知識(shí)這么密切相關(guān)。

再有,就是利用學(xué)生們都熟悉的PS(Photoshop),演示現(xiàn)在所謂的“完美證件照”是怎么來(lái)的。為什么可以把疙疙瘩瘩的臉部皮膚變得光滑?在PS中,你就是點(diǎn)了一下鼠標(biāo),其實(shí)在后臺(tái),是加入了一個(gè)濾波器進(jìn)行了濾波。各種這樣的演示,學(xué)生都非常喜聞樂(lè)見(jiàn)。因?yàn)樗麄兺蝗话l(fā)現(xiàn),原來(lái)那些事物,和我自己接觸到這些看似枯燥的理論之間,還有這么深刻的聯(lián)系。

還有一個(gè)很受學(xué)生歡迎的例子就是對(duì)于“鼓形失真”的講解。我們的老師每次講到這里,都不會(huì)簡(jiǎn)單告訴學(xué)生“鼓形失真”發(fā)生的原因是什么,應(yīng)該怎么解決?老師都會(huì)問(wèn)學(xué)生,明星為什么都一窩蜂去減肥?現(xiàn)在的女明星為什么都要去弄個(gè)“錐子臉”?課堂上就會(huì)出現(xiàn)一個(gè)小,男同學(xué)和女同學(xué)的看法各異,彼此之間開(kāi)始爭(zhēng)論不休。此時(shí)再趁熱打鐵地問(wèn)學(xué)生,如果拿著相機(jī),離自己的鼻子一公分,會(huì)拍出什么樣的效果?有學(xué)生開(kāi)始拿出手機(jī)對(duì)著自己和別人開(kāi)拍,有的學(xué)生開(kāi)始頭頭是道地分析。每到這種學(xué)生都開(kāi)始熱烈討論的時(shí)候,就可以適時(shí)引導(dǎo)學(xué)生往正確的方向去,讓他們自己找到正確的分析解決方法,往往這個(gè)時(shí)候,學(xué)生都會(huì)頗有成就感,對(duì)于問(wèn)題的理解也會(huì)特別的深刻。

3.3選擇合適的實(shí)際應(yīng)用

在所有理論講解結(jié)束后,我們會(huì)留出2~4次課講述計(jì)算機(jī)視覺(jué)在工業(yè)上的應(yīng)用。這些年來(lái),對(duì)于手機(jī)制造這樣一個(gè)工業(yè)應(yīng)用,非常受學(xué)生歡迎。正如“數(shù)碼相機(jī)”這個(gè)例子一樣,現(xiàn)在學(xué)生都是人手一部手機(jī),是大家再熟悉不過(guò)的東西。這個(gè)例子涉及到了在前面理論講述中的大部分算法,如二值圖像的處理、模板匹配、高斯濾波器等。學(xué)生通過(guò)對(duì)這個(gè)工業(yè)應(yīng)用的理解,更進(jìn)一步加深了對(duì)算法的理解。

以講解手機(jī)鍵盤(pán)的制造過(guò)程為例,向?qū)W生提出和前面所講內(nèi)容相關(guān)的問(wèn)題,引導(dǎo)學(xué)生自發(fā)思考,如為什么選擇模板匹配法,而不是采用其他更復(fù)雜更精確的方法等等。每到這個(gè)時(shí)候,課堂氣氛總是分外熱烈,學(xué)生各抒己見(jiàn),在不斷爭(zhēng)論中,更進(jìn)一步加深對(duì)課本上枯燥理論的認(rèn)識(shí)。

在這里需要注意的問(wèn)題是一定要一步一步提出問(wèn)題,循循善誘,引導(dǎo)學(xué)生一層一層地深入思考。如果問(wèn)題的答案過(guò)于“深藏不露”,則有可能觸發(fā)學(xué)生的抵觸情緒,無(wú)法繼續(xù)深入地思考。

4結(jié)語(yǔ)

通過(guò)多年的教學(xué)摸索,我們認(rèn)為,在計(jì)算機(jī)視覺(jué)課程的講述中,以實(shí)際應(yīng)用引導(dǎo)學(xué)生這樣的教學(xué)方法非常可取,而且也收到了很好的效果。另外,除了制定好的教學(xué)大綱,并選擇合適的教材外,根據(jù)學(xué)?,F(xiàn)在的時(shí)間情況,我們選擇了多媒體手段輔助教學(xué),充分利用Matlab和大屏幕投影等方方面面的優(yōu)勢(shì),結(jié)合多種方法進(jìn)行教學(xué),對(duì)講好計(jì)算機(jī)視覺(jué)這門(mén)課,非常有益。

參考文獻(xiàn):

[1] 林堯瑞,馬少萍. 人工智能導(dǎo)論[M]. 北京:清華大學(xué)出版社,1989.

[2] 賈云得. 機(jī)器視覺(jué)[M]. 北京:科學(xué)出版社,2000.

[3] Ramesh Jain. Machine Vision[M]. 北京:機(jī)械工業(yè)出版社,2003.

[4] 蔡自興. 智能控制原理與應(yīng)用[M]. 北京:清華大學(xué)出版社,2007.

Innovation in the Course of Computer Vision

HAN Hong, JIAO Li-cheng

(School of Electronic Engineering, Xidian University, Xi’an 710071, China)

篇2

關(guān)鍵詞:知識(shí)規(guī)則挖掘;城市公共交通;服務(wù)質(zhì)量評(píng)價(jià);遺傳算法

中圖分類號(hào):TP301.6 文獻(xiàn)標(biāo)識(shí)碼:A

1引言

知識(shí)規(guī)則挖掘就是從大量的、不完全的、有噪聲的知識(shí)規(guī)則中,提取隱含在其中的、人們事先不知道的有用的知識(shí)規(guī)則的過(guò)程。知識(shí)規(guī)則挖掘方法[1,2,3]有多種,如機(jī)器學(xué)習(xí)、決策樹(shù)、神經(jīng)網(wǎng)絡(luò)、粗糙集方法、遺傳算法等。在這些方法中,遺傳算法由于具有高度的魯棒性和極佳的全局搜索能力而倍受眾多學(xué)者的青睞。在城市公共交通服務(wù)質(zhì)量評(píng)價(jià)知識(shí)規(guī)則體系中,由于評(píng)價(jià)指標(biāo)較多,在進(jìn)行知識(shí)規(guī)則挖掘時(shí),使用遺傳算法尤為有效。利用遺傳算法進(jìn)行城市公共交通服務(wù)質(zhì)量評(píng)價(jià)知識(shí)規(guī)則挖掘,就是在已有的知識(shí)規(guī)則的基礎(chǔ)上進(jìn)一步進(jìn)行優(yōu)化,得到隱含在知識(shí)規(guī)則庫(kù)中的、更為滿意的、新的知識(shí)規(guī)則。

2城市公共交通服務(wù)質(zhì)量評(píng)價(jià)指標(biāo)體系構(gòu)建

城市公共交通服務(wù)質(zhì)量可以從硬件和軟件兩個(gè)大的方面進(jìn)行評(píng)價(jià)。硬件方面包括道路公共交通網(wǎng)絡(luò)和公交企業(yè)本身的設(shè)施投入;軟件方面則主要指道路交通通行的實(shí)際水平與公交企業(yè)的軟。上述方面還可以進(jìn)一步細(xì)分,直至一些基礎(chǔ)性的指標(biāo)。結(jié)合綜合評(píng)價(jià)加指標(biāo)體系建立的方法,建立城市公共交通服務(wù)質(zhì)量評(píng)價(jià)指標(biāo)體系[4-6]。評(píng)價(jià)指標(biāo)體系包括四個(gè)方面:公共交通網(wǎng)絡(luò)、公交企業(yè)硬性投入、公共交通通行服務(wù)水平、公交企業(yè)軟,具體評(píng)價(jià)指標(biāo)有15個(gè),如圖1所示。

遺傳算法是模擬生物界自然選擇和自然遺傳機(jī)制進(jìn)化過(guò)程來(lái)求解復(fù)雜問(wèn)題的全局隨機(jī)搜索算法[7,8],它以編碼空間代替問(wèn)題空間,以適應(yīng)度函數(shù)為評(píng)價(jià)依據(jù),以編碼群體為進(jìn)化基礎(chǔ),以對(duì)群體中個(gè)串的遺傳操作實(shí)現(xiàn)選擇和遺傳機(jī)制,建立起一個(gè)迭代過(guò)程。在這一過(guò)程中,通過(guò)隨機(jī)重組編碼位串中重要的基因,使新一代的位串集合優(yōu)于老一代的位串集合,群體的個(gè)體不斷進(jìn)化,逐漸接近最優(yōu)解,最終達(dá)到求解問(wèn)題的目的。

由于傳統(tǒng)遺傳算法存在收斂速度慢、容易出現(xiàn)早熟收斂等缺點(diǎn)[9],本文采用文獻(xiàn)[10]中的改進(jìn)遺傳算法(IGA),這種改進(jìn)遺傳算法的工作流程如圖2所示。

4.3遺傳算子

在本文使用的改進(jìn)遺傳算法中,遺傳算子包括選擇算子、助長(zhǎng)算子、交叉算子和變異算子。選擇算子采用兩代競(jìng)爭(zhēng)排序的選擇方法來(lái)對(duì)遺傳個(gè)體進(jìn)行優(yōu)選,遺傳個(gè)體被區(qū)分為雄性和雌性兩種不同的性別,把父代與子代的所有雄性個(gè)體與雌性個(gè)體分別進(jìn)行重新排序,再按群體規(guī)模N分別從排序后的雄性個(gè)體集與雌性個(gè)體集中截取前N/2個(gè)優(yōu)秀的個(gè)體進(jìn)入匹配池,作為交叉操作的對(duì)象。助長(zhǎng)算子用來(lái)對(duì)種群中的個(gè)體進(jìn)行一定概率下的助長(zhǎng),助長(zhǎng)操作在選擇操作之后及配對(duì)操作之前進(jìn)行,本文是采用基于個(gè)體適應(yīng)度的助長(zhǎng)。在交叉操作中,同性別個(gè)體之間是不能進(jìn)行配對(duì)的,雄性個(gè)體只能同雌性個(gè)體進(jìn)行配對(duì),配對(duì)是按個(gè)體優(yōu)劣順序進(jìn)行的,個(gè)體配對(duì)之后還要進(jìn)行親緣關(guān)系的檢測(cè),以保證個(gè)體之間的繁殖屬于嚴(yán)格的遠(yuǎn)緣繁殖。在二進(jìn)制編碼方式下,變異操作就是以很小的變異概率從群體中隨機(jī)選取若干個(gè)體,對(duì)于選中的個(gè)體又隨機(jī)選取表現(xiàn)型編碼中的某一位或多位進(jìn)行數(shù)碼翻轉(zhuǎn),即將1變?yōu)?或0變?yōu)?。

4.4新知識(shí)規(guī)則的檢驗(yàn)

遺傳算法運(yùn)行結(jié)束后,要對(duì)挖掘出的新知識(shí)規(guī)則的有效性進(jìn)行檢驗(yàn)。一方面要檢驗(yàn)新知識(shí)規(guī)則是否被知識(shí)規(guī)則庫(kù)中已有的規(guī)則所包含,如果被已有的規(guī)則所包含,則新知識(shí)規(guī)則無(wú)效;另一方面是檢驗(yàn)新知識(shí)規(guī)則是否與知識(shí)規(guī)則庫(kù)中已有的規(guī)則相矛盾,如果與已有的規(guī)則相矛盾,則新知識(shí)規(guī)則同樣無(wú)效。無(wú)效的新知識(shí)規(guī)則將被剔除,有效地新知識(shí)規(guī)則將被加入知識(shí)規(guī)則庫(kù)中。

5實(shí)例

一城市公共交通服務(wù)質(zhì)量評(píng)價(jià)知識(shí)規(guī)則庫(kù)(部分知識(shí)規(guī)則)如表1所示,這個(gè)知識(shí)規(guī)則庫(kù)即為測(cè)試數(shù)據(jù)集。表1的知識(shí)規(guī)則編碼及適應(yīng)度值如表2所示。

這二條新的有效的知識(shí)規(guī)則將被加入到城市公共交通服務(wù)質(zhì)量評(píng)價(jià)知識(shí)規(guī)則庫(kù)中,使知識(shí)規(guī)則庫(kù)得以更新。

6結(jié)論

本文將一種改進(jìn)的遺傳算法用于城市公共交通服務(wù)質(zhì)量評(píng)價(jià)的知識(shí)規(guī)則挖掘,提出了一種基于遺傳算法的城市公共交通服務(wù)質(zhì)量評(píng)價(jià)知識(shí)規(guī)則挖掘方法。實(shí)例表明,遺傳算法在進(jìn)行知識(shí)規(guī)則挖掘時(shí)是完全有效的,能夠得到比知識(shí)規(guī)則庫(kù)中已有的一些知識(shí)規(guī)則更優(yōu)的知識(shí)規(guī)則。這為知識(shí)規(guī)則挖掘提供了一種重要途徑。

參考文獻(xiàn)

[1]刁力力. 數(shù)據(jù)挖掘與組合學(xué)習(xí)[J].計(jì)算機(jī)科學(xué),2001, 28(7):73-78.

[2]Dasarathy, B.V Nearest Neighbor(NN)Norms. NN Pattern Classification Techniques[M]. Washington, D.C.: IEEE Computer Society, 1991.

[3]ZIARKO W. Rough sets, Fuzzy Sets and Knowledge Discovery[J]. New York: Springer-Verlag, 1994.

[4]邵祖峰. 基于神經(jīng)網(wǎng)絡(luò)的城市公共交通服務(wù)質(zhì)量評(píng)價(jià)[J]. 城市交通,2005,7(4):178-180.

[5]張麗花, 張好智, 楊小寶. 基于乘客出行鏈的公共交通服務(wù)質(zhì)量評(píng)價(jià)研究[J]. 公路與汽車(chē),2011,7(4):48-51.

[6]邵祖峰. 城市公共交通服務(wù)質(zhì)量評(píng)價(jià)神經(jīng)網(wǎng)絡(luò)模型[J]. 城市交通,2006,4(6):38-41.

[7]雷英杰,張善文,李續(xù)武,等. MATLAB遺傳算法工具箱及應(yīng)用[M].西安:西安電子科技大學(xué)出版社,2005.

[8]王小平,曹立明. 遺傳算法——理論、應(yīng)用與軟件實(shí)現(xiàn)[M].西安:西安交通大學(xué)出版社,2002.

篇3

關(guān)鍵詞:ARM OPENCV AdaBoost

近年來(lái),功能各異的視頻監(jiān)控設(shè)備越來(lái)越多,但是,大多只能簡(jiǎn)單記錄視頻畫(huà)面,將監(jiān)控到的視頻信息存儲(chǔ)起來(lái),而不能對(duì)所監(jiān)控到的視頻做一定的處理分析和預(yù)測(cè)。基于ARM的人臉檢測(cè)系統(tǒng),為我們的視頻監(jiān)控設(shè)備提供了一個(gè)視頻處理的參考解決方案,在一定基礎(chǔ)上加以擴(kuò)充,可以完成人物識(shí)別,危險(xiǎn)行為檢測(cè)與報(bào)警等,使視頻監(jiān)控設(shè)備更加智能化。

1、視頻監(jiān)控的幾項(xiàng)關(guān)鍵技術(shù)及發(fā)展方向

視頻監(jiān)控的關(guān)鍵技術(shù)主要有視頻采集壓縮算法、視頻信號(hào)可靠地傳輸、信息存儲(chǔ)調(diào)用的智能化與系統(tǒng)的集中管理等。視頻監(jiān)控技術(shù)發(fā)展方向?yàn)榉植疾杉泄芾?、高品質(zhì)圖象壓縮處理、開(kāi)放標(biāo)準(zhǔn)統(tǒng)一接口、統(tǒng)一認(rèn)證以確保安全、操作人性化以及功能集成化、結(jié)構(gòu)模塊化和傳輸多樣化。隨著不斷發(fā)展的網(wǎng)絡(luò)技術(shù),基于嵌入式技術(shù)的網(wǎng)絡(luò)數(shù)字監(jiān)控系統(tǒng)不再是處理模擬視頻信號(hào),而是把攝像機(jī)輸出的模擬視頻信號(hào)通過(guò)視頻編碼器直接轉(zhuǎn)換為IP數(shù)字信號(hào)。

2、平臺(tái)的搭建

ARM之所以應(yīng)用廣泛,是因?yàn)橛休^快得運(yùn)算速度,較低的價(jià)格,開(kāi)發(fā)人員也比較容易接觸,程序較易移植過(guò)來(lái)等特點(diǎn)。EmbeddedLinux也是Linux家族的成員,支持廣泛的硬件平臺(tái),如PPC、ARM、MIPS等,也繼承了Linux的優(yōu)點(diǎn)——開(kāi)源、免費(fèi),同時(shí)也有廣泛的應(yīng)用軟件支持,能夠比較方便的移植操作系統(tǒng)與應(yīng)用軟件。

3、OPENCV簡(jiǎn)介

OpenCV是一個(gè)開(kāi)源的計(jì)算機(jī)視覺(jué)庫(kù),采用C/C++語(yǔ)言進(jìn)行編寫(xiě),可以運(yùn)行在Linux/Windows/Mac等操作系統(tǒng)上,同時(shí)還提供了Python、Ruby以及其他語(yǔ)言的接口。其設(shè)計(jì)目標(biāo)就是執(zhí)行速度盡量快,它采用優(yōu)化的C語(yǔ)言編寫(xiě),能夠充分利用多核處理器的優(yōu)勢(shì)。除此之外,另外一個(gè)目標(biāo)就是構(gòu)建一個(gè)簡(jiǎn)單易用的計(jì)算機(jī)視覺(jué)框架,開(kāi)發(fā)人員可以利用它更便捷地設(shè)計(jì)復(fù)雜的計(jì)算機(jī)視覺(jué)相關(guān)應(yīng)用程序。其中包含的函數(shù)有500多個(gè),覆蓋了計(jì)算機(jī)視覺(jué)的許多應(yīng)用領(lǐng)域,如工廠產(chǎn)品檢測(cè)、醫(yī)學(xué)成像、信息安全、攝像機(jī)標(biāo)定、立體視覺(jué)和機(jī)器人等。

4、人臉檢測(cè)的原理

人臉檢測(cè)技術(shù)的研究要追溯到20世紀(jì)70年代,早期的研究主要致力于模板匹配、子空間方法、變形模板匹配等,近幾年,集中研究基于數(shù)據(jù)驅(qū)動(dòng)的學(xué)習(xí)方法,如統(tǒng)計(jì)模型方法,神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)方法,統(tǒng)計(jì)知識(shí)理論和支持向量計(jì)算方法,基于馬爾可夫[1]隨機(jī)域的方法,以及基于膚色的人臉檢測(cè)等。目前在實(shí)際中應(yīng)用的人臉檢測(cè)方法多為基于Adaboost[2]學(xué)習(xí)算法的方法。

Viola是AdaBoost算法的一種,主要基于積分圖和級(jí)聯(lián)檢測(cè)器,其方法框架可大至分為以下三大部分:第一部分,使用Harr-like特征來(lái)表示人臉,并且使用“積分圖”實(shí)現(xiàn)特征數(shù)值的快速計(jì)算;第二部分,使用Adaboost算法挑選出一些最能代表人臉的矩形特征,用弱分類器按照加權(quán)投票的方式,構(gòu)造為一個(gè)強(qiáng)分類器;第三部分,為有效的提高檢測(cè)速度,將訓(xùn)練得到的若干強(qiáng)分類器串聯(lián)組成一個(gè)級(jí)聯(lián)結(jié)構(gòu)的層疊分類器。

人臉檢測(cè)的目的就是從圖片之中找出所有包含人臉的子窗口,對(duì)人臉的子窗口與非人臉的子窗口進(jìn)行區(qū)分。第一步,在一個(gè)20*20的圖片中提取出一些簡(jiǎn)單的特征(Harr特征),將白色區(qū)域內(nèi)的像素減去黑色區(qū)域,因此在人臉與非人臉圖片的相同位置上,有著大小不一樣的數(shù)值,這些特征就是區(qū)分人臉和非人臉的依據(jù)。第二步,使用上萬(wàn)張切割好的人臉圖片和上萬(wàn)張背景圖片作為訓(xùn)練樣本。訓(xùn)練圖片一般都調(diào)到到20*20的大小。在這樣大小的圖片中,可供haar使用的特征數(shù)大概有1萬(wàn)個(gè)左右,然后通過(guò)機(jī)器學(xué)習(xí)算法也就是Adaboost算法挑選數(shù)千個(gè)有效的haar特征,用來(lái)組成人臉檢測(cè)器。第三步,學(xué)習(xí)算法訓(xùn)練出一個(gè)人臉檢測(cè)器后,便可以在各種各樣的場(chǎng)合使用了。使用時(shí),依次縮放圖像比例,最后在縮放后的圖片20*20的子窗口中依次判別是否是人臉。

人臉檢測(cè)技術(shù)在門(mén)禁系統(tǒng)、智能監(jiān)控系統(tǒng)中已經(jīng)得到了很好的應(yīng)用。另外,目前的筆記本電腦登錄時(shí),也陸續(xù)使用人臉識(shí)別技術(shù)作為憑證。同時(shí),人臉檢測(cè)算法也在數(shù)碼相機(jī)和手機(jī)中起作用,作為一個(gè)新新的功能提供用戶使用。

5、結(jié)語(yǔ)

ARM上進(jìn)行圖像處理以及人臉檢測(cè)與識(shí)別等是可行的方案,可以減少硬件成本。 采用Linux+Qt4+OpenCv+Arm是一個(gè)方案合理、技術(shù)成熟、成本低廉、應(yīng)用廣泛的人臉檢測(cè)與圖像處理的解決方案。

參考文獻(xiàn)

篇4

關(guān)鍵詞:模板匹配 特征值 細(xì)化 二值化

中圖分類號(hào):TP391.41 文獻(xiàn)標(biāo)識(shí)碼:A 文章編號(hào):1007-9416(2013)06-0134-02

1 模板匹配算法的描述

在機(jī)器識(shí)別事物的過(guò)程中,常需把不同傳感器或同一傳感器在不同時(shí)間、不同成像條件下對(duì)同一景物獲取的兩幅或多幅圖像在空間上對(duì)準(zhǔn),或根據(jù)己知模式到另一幅圖中尋找相應(yīng)的模式,這就叫做匹配。因?yàn)橹挥挟?dāng)同一場(chǎng)景的兩幅圖像在同一坐標(biāo)系下時(shí),才能進(jìn)行相似性比較,所以模板匹配的過(guò)程實(shí)際上也就是把一幅圖像變換到另一幅圖像的坐標(biāo)系過(guò)程。圖像的模板匹配就是先給定一幅圖像,然后到另一幅圖像中去查找這幅圖像,如果找到了,則匹配成功。這看起來(lái)好像很簡(jiǎn)單,因?yàn)槲覀円谎劬湍芸闯鲆环鶊D中是否包含另一幅圖像,遺憾的是電腦并不具有人眼的強(qiáng)大的視覺(jué)的功能,因而需要電腦去判定一幅圖片中是否包含另一幅圖片是件不容易的事情。對(duì)于機(jī)器視覺(jué)系統(tǒng)而言,實(shí)現(xiàn)匹配首先要對(duì)圖像進(jìn)行預(yù)處理。先計(jì)算模板圖片的特征值,并存儲(chǔ)到計(jì)算機(jī)中。然后計(jì)算待測(cè)試樣板圖片的特征值,與計(jì)算機(jī)中模板進(jìn)行比較,運(yùn)用匹配算法實(shí)現(xiàn)匹配。整個(gè)過(guò)程如圖1所示。

在基于圖像處理的應(yīng)用領(lǐng)域中,對(duì)于圖像匹配的研究可以說(shuō)一直都是數(shù)字圖像處理技術(shù)和計(jì)算機(jī)視覺(jué)理解的重要研究?jī)?nèi)容。圖像匹配在機(jī)器視覺(jué)、工業(yè)自動(dòng)模式識(shí)別、醫(yī)學(xué)圖像的定位等方面都有著重要意義。

2 圖像匹配的數(shù)學(xué)描述

3 算法的改進(jìn)及圖示

根據(jù)以上對(duì)模板匹配的介紹,可以對(duì)字符圖像進(jìn)行識(shí)別。但是求相似性度量函數(shù),求待匹配圖像和模板之間的相似性映射關(guān)系均比較復(fù)雜。上一節(jié)知識(shí)的介紹中,也看到了其過(guò)程比較麻煩。本系統(tǒng)中識(shí)別的圖像均為20×36大小的。即模板圖像和待測(cè)圖像大小相同。即會(huì)從圖像的左下角一直順著搜索一直至全圖結(jié)束。而且映射關(guān)系及相似性函數(shù)均比較復(fù)雜,不是數(shù)量級(jí)上的關(guān)系。此時(shí)識(shí)別效率就不明顯。顯得木訥不靈巧。并非像前面介紹的在待測(cè)圖片中搜索,并返回得到匹配點(diǎn)。因此需要基于此模板匹配算法原理的基礎(chǔ)上,對(duì)算法進(jìn)行改進(jìn),才能更有效的去完成識(shí)別的功能及簡(jiǎn)化其識(shí)別的過(guò)程。提高識(shí)別速度。即將圖片區(qū)域化。算法改進(jìn)的思想:將圖片(3×4)分為12塊區(qū)域,具體區(qū)域的劃分如圖3所示。再加上5條交線。共記有17個(gè)特征值。

模板訓(xùn)練時(shí),將數(shù)字模板圖片17個(gè)特征值的信息記下并存儲(chǔ)在數(shù)組中。當(dāng)進(jìn)行樣本訓(xùn)練的時(shí)候,用同樣的算法計(jì)算圖片中數(shù)字的17個(gè)特征值,并到計(jì)算機(jī)存儲(chǔ)區(qū)中去匹配,直接利用象素灰度值的差異,找到特征值最接近的一個(gè)圖片數(shù)字,便完成匹配識(shí)別的過(guò)程,到匹配的結(jié)果。這樣便簡(jiǎn)單多。

4 結(jié)語(yǔ)

本系統(tǒng)通過(guò)對(duì)圖片進(jìn)行區(qū)域化處理基本能完成對(duì)數(shù)字圖像的識(shí)別功能。雖然有一定的誤識(shí)率。將圖片區(qū)域化后再進(jìn)行模板匹配可以很輕松的實(shí)現(xiàn)數(shù)字的識(shí)別,這是一次對(duì)模板匹配算法的新的嘗試。通過(guò)對(duì)數(shù)字圖片的研究,可以推廣到英文字符的識(shí)別,甚至可以識(shí)別手寫(xiě)或打印的漢字字符。研究識(shí)別率達(dá)到100%是我們的理想,通過(guò)我們的研究可以不斷地將字符識(shí)別技術(shù)推向前進(jìn)。

參考文獻(xiàn)

[1]鐘志光,盧君,劉偉榮編著.《Visual C++.NET 數(shù)字圖象處理實(shí)例與解析》[M].北京:清華大學(xué)出版社,2003年6月.

[2]何斌,馬天予,王運(yùn)堅(jiān),朱紅蓮編著.《Visual C++ 數(shù)字圖象處理》第二版[M].北京:人民郵電出版社,2002.

[3]夏良正編著.《數(shù)字圖象處理》[M].南京:東南大學(xué)出版社,1999年9月.

[4]葛亮.Visual C++從入門(mén)到實(shí)踐[M].北京:清華大學(xué)出版社,2009.

篇5

關(guān)鍵詞:OpenCV;視覺(jué)模塊;圖像處理

中圖分類號(hào):TP23 文獻(xiàn)標(biāo)識(shí)碼:A

1 引 言

對(duì)于世界葡萄種植來(lái)說(shuō),切根蟲(chóng)(一種夜蛾的幼蟲(chóng))是危害葡萄樹(shù)生長(zhǎng)的主要害蟲(chóng)之一。精準(zhǔn)對(duì)靶施藥系統(tǒng)可在葡萄樹(shù)干上施加一個(gè)均勻的、寬度大于等于20cm的“障礙藥帶”,可有效的阻止切根蟲(chóng)夜晚從樹(shù)根爬到樹(shù)冠啃食新芽。由于在實(shí)際葡萄園中,每隔幾棵葡萄樹(shù)就會(huì)立一根樹(shù)樁拉著鐵絲牽引葡萄藤,所以在施藥時(shí)需要區(qū)分筆直的樹(shù)樁和彎曲的葡萄樹(shù)干,避免不必要的施藥。因此本文基于OpenCV的圖像處理方法進(jìn)行精準(zhǔn)對(duì)靶施藥系統(tǒng)視覺(jué)模塊設(shè)計(jì)。

2 基于OpenCV的圖像處理

OpenCV軟件由C函數(shù)以及C++函數(shù)組成,可以進(jìn)行例如特征檢測(cè)、目標(biāo)分割、三維重建等圖像分析。在圖像處理、計(jì)算機(jī)視覺(jué)等方面,OpenCV起到了無(wú)可取代的重要作用。在不遠(yuǎn)的將來(lái),OpenCV對(duì)工業(yè)、航天、軍事、人機(jī)對(duì)話等領(lǐng)域都起到了及其關(guān)鍵的作用。隨著圖像分析、視覺(jué)技術(shù)的發(fā)展,OpenCV將逐漸適用于更多的場(chǎng)合[1]。本文研究中采用計(jì)算機(jī)視覺(jué)技術(shù),通過(guò)CCD攝像頭采集圖片,使用OpenCV來(lái)檢測(cè)采集到的葡萄樹(shù)干和木樁圖片的外輪廓線,從而判斷噴藥設(shè)備前方的物體是彎曲的葡萄樹(shù)干還是筆直的木樁,若判定為彎曲的葡萄樹(shù)干則噴藥,若判定為筆直的木樁,則發(fā)出信號(hào),讓拖車(chē)?yán)^續(xù)前行。

2.1 圖像預(yù)處理

在進(jìn)行輪廓檢測(cè)前,首先要對(duì)采集到的葡萄樹(shù)干和木樁的圖片進(jìn)行預(yù)處理,主要是進(jìn)行形態(tài)學(xué)去噪以及圖像平滑處理[2]。

2.1.1 形態(tài)學(xué)去噪

數(shù)學(xué)形態(tài)學(xué),其本質(zhì)是通過(guò)一些方法實(shí)現(xiàn)圖像處理,比如:利用結(jié)構(gòu)元素提取圖像形狀等。數(shù)學(xué)形態(tài)學(xué)的基本操作有兩種:膨脹和腐蝕。膨脹使圖像區(qū)域變大,可以實(shí)現(xiàn)小空間和縫隙的填充。腐蝕使圖像區(qū)域變小,可以用來(lái)去掉圖像菱角。膨脹和腐蝕兩者沒(méi)有互為逆運(yùn)算,可以結(jié)合使用,對(duì)圖像先膨脹再腐蝕,或者先腐蝕再膨脹。前一種運(yùn)算稱為閉運(yùn)算,后一種稱為開(kāi)運(yùn)算。兩種運(yùn)算在數(shù)學(xué)形態(tài)學(xué)中都很重要。閉運(yùn)算可以彌補(bǔ)裂縫、填補(bǔ)孔洞,開(kāi)運(yùn)算可以去除毛刺和孤立小點(diǎn),兩種運(yùn)算對(duì)物體的形狀和位置不造成改變。本文中先用CCD相機(jī)拍攝照片,然后對(duì)照片進(jìn)行閉運(yùn)算和開(kāi)運(yùn)算,使輪廓平滑,沒(méi)有毛刺和缺口。

2.1.2 利用中值濾波進(jìn)行圖像平滑處理

圖像平滑處理多用于減少圖像噪聲,是數(shù)字圖像處理技術(shù)的一種。對(duì)于在葡萄種植園中采集到的葡萄樹(shù)干或者木樁的圖片,由于場(chǎng)地等的原因,不可避免的存在許多噪聲,進(jìn)行平滑處理時(shí)最重要的是要保持葡萄樹(shù)干或者木樁輪廓的清晰,還可以去除高頻噪聲,綜合考慮,我們選擇中值濾波。

中值濾波屬于非線性濾波,它可以抑制圖像噪聲和脈沖干擾,保護(hù)圖像,使圖像的邊緣不變模糊。也可以將圖像的灰度信息保留的更多,提高對(duì)圖像輪廓檢測(cè)的質(zhì)量[3]。

2.2 基于mean shift 的圖像分割

mean shift 是通過(guò)迭代,運(yùn)用非參數(shù)進(jìn)行概率密度估算的方法?;谠砗?jiǎn)單、參數(shù)少、不需要預(yù)處理等特點(diǎn),mean shift 主要被運(yùn)用在追蹤目標(biāo)、分割圖像等方向[4]。使用mean shift 進(jìn)行圖像分割可以被當(dāng)作特征空間聚類問(wèn)題處理,因?yàn)楸贿x取的空間的色彩、灰度、梯度不同,概率密度函數(shù)將會(huì)梯度上升,mean shift 沿著該方向找到局部最大值,可是將具特征類似的向量分割開(kāi)來(lái),歸為一類。

2.3 邊緣檢測(cè)

邊緣檢測(cè)多是指檢測(cè)圖像中灰度或者亮度變化最大的部位,一般是指前景、背景的交界處,這些部位會(huì)導(dǎo)致數(shù)學(xué)算法模型中的一階導(dǎo)數(shù)不連續(xù),所以需要利用圖像的階梯函數(shù),以此來(lái)求圖像的邊緣[5]。用的最多的方法有:Roberts 算子、Sobel 算子、Prewitt 算子和Canny 算子。

由于Canny 算子既用到了一階導(dǎo)數(shù),也用到了二階導(dǎo)數(shù),所以它的結(jié)果更加精確,因此本文運(yùn)用Canny 算子對(duì)圖像邊緣進(jìn)行檢測(cè)。對(duì)于圖像處理,先對(duì)原圖進(jìn)行灰度處理,然后通過(guò)Canny 算子就可以將圖片中的物體輪廓較為精準(zhǔn)的找出。

運(yùn)用Canny 算子進(jìn)行邊緣檢測(cè),需要符合2個(gè)要求:①信噪比;②單位邊緣響應(yīng)。計(jì)算算子的零交叉點(diǎn)的平均距離,若該距離滿足式①,則單位邊緣只存在一個(gè)響應(yīng)[6]。

3 圖像處理試驗(yàn)及結(jié)果

本文利用OpenCV 提供的圖像處理函數(shù)來(lái)對(duì)獲得的靶標(biāo)圖像進(jìn)行處理,先基于mean shift 進(jìn)行圖像分割,然后通過(guò)Canny 算子進(jìn)行邊緣檢測(cè),得到靶標(biāo)外輪廓線,最后運(yùn)用直線檢測(cè)的方式來(lái)分析靶標(biāo)的曲直,其工作流程如圖1所示。

圖1 工作流程圖

計(jì)算技術(shù)與自動(dòng)化2016年6月

第35卷第2期李梅竹等:基于OpenCV精準(zhǔn)對(duì)靶施藥系統(tǒng)視覺(jué)模塊設(shè)計(jì)

3.1 基于mean shift 的圖像結(jié)果

一般而言一副圖像的特征點(diǎn)至少可以提取出5 維,即(x,y,r,g,b),眾所周知,mean shift 經(jīng)常用來(lái)尋找模態(tài)點(diǎn),即密度最大的點(diǎn)。所以這里同樣可以用它來(lái)尋找這5 維空間的模態(tài)點(diǎn),由于不同的點(diǎn)最終會(huì)收斂到不同的峰值,所以這些點(diǎn)就形成了一類,這樣就完成了圖像分割的目的,有點(diǎn)聚類的意思在里面。

需要注意的是圖像像素的變化范圍和坐標(biāo)的變化范圍是不同的,所以在使用窗口對(duì)這些數(shù)據(jù)點(diǎn)進(jìn)行模態(tài)檢測(cè)時(shí),需要使用不同的窗口半徑。因此在OpenCV自帶的mean shift分割函數(shù)pyrMeanShiftFiltering( )函數(shù)中,就專門(mén)有2個(gè)參數(shù)供選擇空間搜索窗口半徑和顏色窗口搜索半徑的。 由函數(shù)名pyrMeanShiftFiltering可知,這里是將mean shift算法和圖像金字塔相結(jié)合用來(lái)分割的,所以其參數(shù)列表中就有一個(gè)專門(mén)定義所需金字塔層數(shù)的變量。本次試驗(yàn)的主要過(guò)程是,首先設(shè)置好參數(shù),然后用函數(shù)pyrMeanShiftFiltering( )對(duì)輸入的圖像進(jìn)行分割。分割后的結(jié)果保存在該函數(shù)的第二個(gè)參數(shù)即輸出圖像中,最后根據(jù)該分割圖像的特點(diǎn)用floodFill( )函數(shù)對(duì)其分割的結(jié)果用不同的顏色進(jìn)行填充。試驗(yàn)中選取的樹(shù)干原圖如圖2(a)、1(b)所示,圖像分割后的結(jié)果如圖3(a)、2(b)所示。

3.2 邊緣檢測(cè)結(jié)果

對(duì)圖像基于mean shift的圖像分割后,采用Canny算子進(jìn)行邊緣檢測(cè)。Canny算法的步驟是①降噪,任何邊緣檢測(cè)算法不可能在未經(jīng)處理的原始數(shù)據(jù)上工作,第一步是對(duì)原始數(shù)據(jù)與高斯mask作卷積,得到的圖像與原始圖像相比有些輕微的模糊。②尋找圖像中的亮度梯度。圖像中的邊緣可能會(huì)指向不同的方向,所以Canny算法使用了4個(gè)mask檢測(cè)水平、數(shù)值以及對(duì)角線方向的邊緣。③在圖像中跟蹤邊緣。較高的亮度梯度比較有可能是邊緣,但是沒(méi)有一個(gè)確定的值來(lái)限定多大的亮度梯度是邊緣,所以Canny使用了滯后閾值。上述過(guò)程完成可得到一個(gè)二值圖像。通過(guò)Canny算子就可以將圖片中樹(shù)干的輪廓找出,其試驗(yàn)結(jié)果如圖4所示。從圖中可以看出采用OpenCV的Canny算子進(jìn)行邊緣檢測(cè)可以較為完整的將前景區(qū)從背景區(qū)域中分離出來(lái),得到比較理想的樹(shù)干輪廓線,為進(jìn)一步判斷輪廓線的曲直打下基礎(chǔ)。3.3 直線檢測(cè)結(jié)果

OpenCV使用霍夫變換函數(shù)來(lái)進(jìn)行直線檢測(cè)。該變換利用點(diǎn)與線的對(duì)偶性,通過(guò)曲線表達(dá)形式,將空間中的曲線轉(zhuǎn)變?yōu)橐粋€(gè)點(diǎn),于是,對(duì)于原圖的曲線檢測(cè)問(wèn)題變?yōu)樵趨?shù)空間內(nèi)尋找峰值的問(wèn)題。 具體的說(shuō),利用直線的參數(shù)方程ρ=xcosθ+ysinθ將(x,y)空間中的一個(gè)點(diǎn)變成了一條正弦曲線,如果若干個(gè)點(diǎn)在一條直線上,那么它們對(duì)應(yīng)的正弦曲線也會(huì)交于同一個(gè)點(diǎn)。所以檢測(cè)直線的問(wèn)題,就轉(zhuǎn)化為了判斷交點(diǎn)峰值的問(wèn)題。設(shè)置一個(gè)峰值,大于這個(gè)值,就判為直線。

需要注意以下幾點(diǎn):首先,HoughLines檢測(cè)出來(lái)的不是線段,而是(ρ,θ)對(duì),使用std vectorlines來(lái)存放。其次,由于上面的原因,畫(huà)線的時(shí)候是選一個(gè)y(最小為0),求一個(gè)x,得到一個(gè)點(diǎn);再選一個(gè)y(選為圖像的高度)再求一個(gè)x得到另一個(gè)點(diǎn),水平方向的線采用同樣的方法。這樣畫(huà)出的線貫穿整個(gè)圖像。

4 結(jié)束語(yǔ)

由于在實(shí)際葡萄園中,每隔幾棵葡萄樹(shù)就會(huì)立一根樹(shù)樁拉著鐵絲牽引葡萄藤,所以在施藥時(shí)需要區(qū)分筆直的樹(shù)樁和彎曲的葡萄樹(shù)干。本文主要介紹了基于OpenCV的圖像處理方法,并給出了對(duì)一棵彎曲的樹(shù)和一棵筆直的樹(shù)的基于mean shift的圖像分割結(jié)果、邊緣檢測(cè)結(jié)果以及直線檢測(cè)結(jié)果。實(shí)驗(yàn)結(jié)果證明該模塊設(shè)計(jì)可有效的區(qū)別出葡萄園中彎曲的葡萄樹(shù)干和筆直的樹(shù)樁。

參考文獻(xiàn)

[1] 于仕琪,劉瑞禎.OpenCV教程(基礎(chǔ)篇)[M].北京:北京航空航天出版社,2007.

[2] 景曉軍.圖像處理技術(shù)及其應(yīng)用[M].北京:國(guó)防工業(yè)出版社,2005.

[3] 劉慧英,王小波.基于OpenCV的車(chē)輛輪廓檢測(cè)[J].科學(xué)技術(shù)與工程,2010(12): 2987-2991.

[4] SONG N, GU I Y H, CAO Z, et al. Enhanced spatial-range mean shift color image segmentation by using convergence frequency and position[C]//Prof. of 14th European Signal Processing Conference (EUSIPCO 2006), Florence, Italy. 2006.

篇6

關(guān)鍵詞:嵌入式Linux;OpenCV;教室人數(shù)統(tǒng)計(jì);橢圓擬合

中圖分類號(hào):TP18 文獻(xiàn)標(biāo)識(shí)碼:A 文章編號(hào):1009-3044(2016)28-0187-02

Abstract: in order to let the students understand the remote study room number, starting from the student head characteristics, analysing the characteristics of classroom identification number of technology and shortcomings, based on embedded Linux and OpenCV as soft hardware system. The system adopts the vertical view shooting mode, take the contour extraction and recognition method of ellipse fitting and the number of personnel arrangement of the seating area, seating area. The experiment shows that the system can effectively identify the number of the classroom and analyze the behavior of the students. It has the characteristics of high speed and high accuracy.

Key words: embedded Linux; OpenCV; classroom population statistics; ellipse fitting

隨著我國(guó)高水平大學(xué)的招生人數(shù)進(jìn)一步增加,學(xué)生對(duì)自習(xí)室是否有空位及其排布情況無(wú)法便捷獲取。隨著計(jì)算機(jī)技術(shù)的發(fā)展,圖像處理技術(shù)在解決這個(gè)問(wèn)題越來(lái)越顯示出它的優(yōu)點(diǎn)。

文獻(xiàn)[1]提取了一種基于網(wǎng)格的模板匹配方法,使用背景減除算法得到運(yùn)動(dòng)區(qū)域,提取幀圖像進(jìn)行預(yù)處理,然后提取特征統(tǒng)計(jì)人數(shù)。但人體間的相互遮擋而降低了檢測(cè)精度。文獻(xiàn)[2]利用人頭和非人頭統(tǒng)計(jì)特征提出了結(jié)合擴(kuò)展的Haar特征和SVM分類器來(lái)檢測(cè)行人,此方法需花費(fèi)大量時(shí)間收集人頭圖像樣本和訓(xùn)練分類器;

分析總結(jié)現(xiàn)有技術(shù)的不足,系統(tǒng)采用垂直俯視拍攝方式,使用OpenCV作為函數(shù)庫(kù),可方便移植于Linux系統(tǒng),算法簡(jiǎn)單、魯棒性強(qiáng)。

1 系統(tǒng)整體架構(gòu)設(shè)計(jì)

嵌入式Linux是以Linux內(nèi)核為基礎(chǔ),根據(jù)需要對(duì)軟、硬件進(jìn)行裁剪的專用嵌入式系統(tǒng) [3]。

OpenCV是一個(gè)開(kāi)放源代碼的計(jì)算機(jī)視覺(jué)庫(kù),使非專業(yè)圖像處理的工程技術(shù)人員應(yīng)用于圖像分割、運(yùn)動(dòng)檢測(cè)等方面[4]。

系統(tǒng)框架分為應(yīng)用層、庫(kù)層、Linux內(nèi)核、硬件層。應(yīng)用層為教室人數(shù)檢測(cè)應(yīng)用程序,為C/C++語(yǔ)言編寫(xiě),包含文中所提的算法。庫(kù)層上下分別為OpenCV視覺(jué)庫(kù)、OpenCV依賴庫(kù)、基本c庫(kù)三層。Linux內(nèi)核以官網(wǎng)下載的Linux3.4.2內(nèi)核基礎(chǔ)上經(jīng)過(guò)裁剪,加載攝像頭、觸摸屏、無(wú)線網(wǎng)絡(luò)等模塊。系統(tǒng)使用三星四核Cortex-A9構(gòu)架處理器Exynos 4412,主頻為1.5GHZ,內(nèi)存為1GB DDR3、閃存4GB eMMC,圖像處理能力強(qiáng)大。I2C接口連接CMOS攝像頭OV7740。

2 人員特征的分析及檢測(cè)

系統(tǒng)以教室為應(yīng)用背景,在教室正中心架設(shè)攝像頭,將整個(gè)教室攝入。系統(tǒng)的整體工作流程如圖2所示。教室中心正上方的攝像頭攝入當(dāng)前教室圖像,從視頻中提取視頻幀,對(duì)視頻幀圖像經(jīng)過(guò)灰度化、二值化處理、提取輪廓,由于俯視情況下人頭部輪廓圖可近視為一圓形,通過(guò)橢圓擬合,可找到圖像中的疑似人頭部,再根據(jù)擬合橢圓的面積等條件判斷是不是頭部。由于學(xué)生坐在相鄰位置時(shí),在進(jìn)行交談時(shí)頭部圖像可能發(fā)生一部分重疊,當(dāng)兩個(gè)人頭部圖像重疊,提取的頭部輪廓將存在拐點(diǎn)。如果橢圓面積大于一個(gè)人頭部面積的閾值,再進(jìn)行輪廓有無(wú)拐點(diǎn)判斷。以拐點(diǎn)為分界點(diǎn),隨機(jī)選取疑似頭部輪廓起始點(diǎn)到拐點(diǎn)、拐點(diǎn)到疑似頭部輪廓終止點(diǎn)至少6個(gè)點(diǎn)做橢圓擬合,再根據(jù)擬合橢圓面積閾值進(jìn)行判斷是否為人頭部。

(1) 圖像獲取并預(yù)處理

系統(tǒng)通過(guò)CMOS攝像頭模塊OV7740攝取當(dāng)前教室圖像。OpenCV通過(guò)cvCaptureFromCAM 函數(shù)初始化攝像頭并從中捕獲視頻,再調(diào)用cvQueyrFrame函數(shù)從攝像頭捕獲的視頻中獲取并返回一幀圖像。系統(tǒng)充分利用教室為應(yīng)用背景的優(yōu)勢(shì),將教室圖像根據(jù)桌椅分布進(jìn)行分塊處理,使用cvGetSubRect函數(shù)分塊圖像,保證每一塊圖像中保留完整的座位。

(2) 圖像二值化處理

圖像的二值化有利于圖像的進(jìn)一步處理,使圖像簡(jiǎn)單化,而且數(shù)據(jù)量減小,能凸顯出感興趣的目標(biāo)的輪廓。其中cvThreshold參數(shù)使用最大熵值法求得的最佳閾值。該分割閾值使得圖像目標(biāo)和背景兩類的信息熵之和最大[5]。

(3) 橢圓擬合

在進(jìn)行橢圓擬合時(shí),最常用的方法是最小二乘法。最小二乘法只需6個(gè)輪廓點(diǎn)即可擬合橢圓。以下是橢圓方程式:

A+C=1為沒(méi)有零解的約束條件,用上述方程對(duì)邊緣檢測(cè)后的點(diǎn)進(jìn)行最小二乘法處理

得到一個(gè)線性方程組,使用高斯消元法,得到方程式的解[6]。通過(guò)OpenCV 中cvFitEllipse函數(shù),對(duì)cvFindContours函數(shù)提取出storage存儲(chǔ)輪廓數(shù)據(jù)矩陣作橢圓的最佳擬合。圖2為橢圓擬合的結(jié)果圖,在程序中設(shè)定橢圓的長(zhǎng)軸、短軸及面積的范圍,去除不滿足條件的橢圓,結(jié)果為圖b。

圖3 (a)為兩學(xué)生在座位上交談的情景。針對(duì)這種情況,擬合橢圓設(shè)定面積為單頭像擬合橢圓面積的1.7~2.0倍。當(dāng)滿足此條件時(shí)遍歷此輪廓數(shù)據(jù)矩陣(如圖3(c)),找到x軸坐標(biāo)相差不大,y軸坐標(biāo)相差最小的A、B,這兩點(diǎn)為此輪廓的拐點(diǎn),再分別于輪廓起點(diǎn)、終點(diǎn)二次橢圓擬合。則可確定為兩人頭像遮蓋的情況。

3 實(shí)驗(yàn)結(jié)果及分析

系統(tǒng)以某一實(shí)驗(yàn)樓大廳為實(shí)驗(yàn)對(duì)象進(jìn)行試驗(yàn),在二樓用攝像頭垂直錄制行人在大廳行走的場(chǎng)景,與安裝在教室中心拍攝學(xué)生圖像情況基本一致。圖4為檢測(cè)圖。

座位區(qū)實(shí)驗(yàn)結(jié)果如表1所示,通過(guò)大量實(shí)驗(yàn)表明,對(duì)比其他方法,垂直俯視拍攝減小了人頭部相互遮擋的情況,具有較高的準(zhǔn)確性。程序檢測(cè)及統(tǒng)計(jì)響應(yīng)時(shí)間迅速,完全符合實(shí)時(shí)應(yīng)用的要求。

4 結(jié)束語(yǔ)

論文在OpenCV圖像處理函數(shù)庫(kù)的基礎(chǔ)上運(yùn)用圖像二值化、輪廓提取和橢圓擬合等圖像處理技術(shù),結(jié)合嵌入式Linux技術(shù)和視頻采集技術(shù),以自習(xí)室為應(yīng)用背景,識(shí)別自習(xí)室學(xué)生人數(shù)、坐標(biāo)和活動(dòng)情況??偨Y(jié)系統(tǒng)特點(diǎn),主要有以下3個(gè)方面:基于嵌入式Linux,具有較強(qiáng)的實(shí)用性、實(shí)時(shí)性;以自習(xí)室為應(yīng)用背景且采用垂直俯視方式采集圖像,最大限度地減小了學(xué)生之間相互遮擋的情況,能準(zhǔn)確獲取學(xué)生信息;使用OpenCV中函數(shù)對(duì)圖像進(jìn)行預(yù)處理、二值化和橢圓擬合,大大減小程序的復(fù)雜度和工作量。

參考文獻(xiàn) :

[1]Jun Wei Hsieh, Cheng Shuang Peng,Kao Chin Fan.Grid-based Template Matching for People Counting[C].Multimedia Signal Processing,2007. MMSP 2007. IEEE 9th Workshop,1-3 Oct. 2007: 316-319.

[2]Celik T,Seyin O H,Demirel H.Fire pixel classification using fuzzy logic and statistical color model[C]//IC2007.New York:IEEE,2007:1207-1208.

[3]毛德操,胡希明.嵌入式系統(tǒng)[M].浙江大學(xué)出版社,2003.

[4]劉瑞禎,于仕琪.OpenCV教程一基礎(chǔ)篇[M].北京航空航天大學(xué)出版社,2007.

[5]楊召君.基于視頻人數(shù)統(tǒng)計(jì)與跟蹤改進(jìn)算法的研究與實(shí)現(xiàn)[D].南京郵電大學(xué),2013.

[6]蘇娟. 基于視頻監(jiān)控的教室人數(shù)統(tǒng)計(jì)[D].安徽大學(xué),2014.

篇7

關(guān)鍵詞:三維重構(gòu);鉆孔數(shù)據(jù);輪廓線;三維礦體模型;礦體體積

中圖分類號(hào):TP274文獻(xiàn)標(biāo)識(shí)碼:A文章編號(hào):1009-3044(2011)14-3352-05

Design and Implementation on the 3D Orebody Reconstruction System Based on the Drilling Data

LIU Gang, YUAN Ji-wu, LI Lei

(SINOPEC Research Institute of Safety Engineering, Qingdao 266071, China)

Abstract: Through studying the technical characteristics of the 3D orebody reconstruction, the thesis puts forward the design methods for constructing the system of 3D orebody reconstruction based on the drilling data. The paper emphatically discussed several questions, including the methods disposing 2D drilling data, data structure of the 3D orebody model and the calculational methods for orebody volume, etc. It also presents the algorithm flow of the 3D orebody reconstruction. Finally, the program on the 3D orebody reconstruction is completed.

Key words: 3D reconstruction; drilling data; contour lines; 3D orebody model; orebody volume

隨著計(jì)算機(jī)技術(shù)在采礦業(yè)的不斷應(yīng)用,采礦業(yè)正由經(jīng)驗(yàn)型、傳統(tǒng)型向科學(xué)型、定量分析與處理、自動(dòng)化方向發(fā)展。礦業(yè)圖件的生成與處理是礦山設(shè)計(jì)工作的重要內(nèi)容,傳統(tǒng)手工繪制的以及國(guó)內(nèi)應(yīng)用CAD系統(tǒng)繪制的圖形大部分是二維平面圖,用二維的圖件來(lái)描述三維空間的礦體,可視性差且缺乏立體感,容易產(chǎn)生誤解,并且難于向非專業(yè)技術(shù)人員展示自己的設(shè)計(jì)結(jié)果[1]。因此,以二維化的剖面采樣數(shù)據(jù)為基礎(chǔ),通過(guò)三維重構(gòu)技術(shù)來(lái)構(gòu)建礦體的三維可視化模型并對(duì)其進(jìn)行可視化的定量分析與處理,已經(jīng)成為礦業(yè)數(shù)字化的一個(gè)重要發(fā)展方向。重構(gòu)后的礦體三維可視化模型不但能夠很好地模擬礦體形態(tài),用于計(jì)算體積、品味等重要數(shù)據(jù),而且可視化模型一旦形成,便可以對(duì)其進(jìn)行任意剖切、投影以及瀏覽,并可隨時(shí)根據(jù)需要制作相應(yīng)的三維工程圖,從而極大地提高礦山設(shè)計(jì)的速度與質(zhì)量[2]。

1 基本問(wèn)題描述

1.1 三維重構(gòu)的意義

許多學(xué)科領(lǐng)域都需要收集和使用各種海量數(shù)據(jù)信息,如衛(wèi)星發(fā)回的地球資源數(shù)據(jù)、氣象數(shù)據(jù)、海洋和地殼板塊及地震監(jiān)測(cè)數(shù)據(jù)、醫(yī)學(xué)掃描圖象數(shù)據(jù)等。在通過(guò)各種測(cè)量方法獲得這些海量數(shù)據(jù)之后,人們更期望能將這些數(shù)據(jù)以三維圖形或圖象的方式表示出來(lái),以使那些原本抽象、難以理解的原理和規(guī)律變得更加直觀。三維重構(gòu)技術(shù)就是一種能將原始的海量數(shù)據(jù)以三維圖形的方式表示出來(lái)的技術(shù)。

通過(guò)使用各種測(cè)量設(shè)備(如傳感器),計(jì)算機(jī)能夠獲得外部世界中物體的各種信息,這些信息被稱之為采樣數(shù)據(jù),三維重構(gòu)的任務(wù)就是從獲取的采樣數(shù)據(jù)中恢復(fù)物體的三維結(jié)構(gòu),即物體的原型。不同領(lǐng)域中所用的測(cè)量設(shè)備不同,所得的數(shù)據(jù)種類也不同并且重構(gòu)的目標(biāo)也不一樣,因此重構(gòu)的方法也多種多樣。在立體視覺(jué)中通過(guò)攝像機(jī)可以獲得周?chē)h(huán)境的光強(qiáng)信號(hào),重構(gòu)的含義是從不同角度拍攝的圖像重構(gòu)三維物體[3],重構(gòu)的關(guān)鍵在于解決好圖像匹配問(wèn)題。從激光掃描測(cè)距儀獲取的是景物的深度信息[4],從距離圖像重構(gòu)三維物體關(guān)鍵在于確定三維點(diǎn)之間的拓?fù)潢P(guān)系,然后選擇適當(dāng)?shù)臄?shù)學(xué)描述工具如參數(shù)曲面、三角面片、多面體等擬和這組點(diǎn)。在醫(yī)學(xué)領(lǐng)域,通過(guò)各種醫(yī)學(xué)設(shè)備可以得到人體內(nèi)部的一組斷層圖像,其灰度代表生物組織的某種物理屬性,不同的生物組織或器官具有不同的物理屬性,所以在圖像中表現(xiàn)為灰度,因此要從圖像重構(gòu)器官或者生物組織的三維結(jié)構(gòu)首先要確定它們的邊界,即對(duì)原始圖像進(jìn)行分割[5],然后用三角形或者多邊形來(lái)擬和生物組織或者器官的表面[6]。盡管上述方法各有不同,但是都是試圖從有限離散采樣點(diǎn)中恢復(fù)完整連續(xù)的物體模型。只有通過(guò)重構(gòu)物體的三維模型,才能夠?qū)λ鼈冞M(jìn)行定性或者定量的分析,才能夠區(qū)別離散數(shù)據(jù)中的各個(gè)物體。因此,三維重構(gòu)在可視化、計(jì)算機(jī)視覺(jué)、模式識(shí)別中占有重要的地位,也是模擬仿真和決策系統(tǒng)中必不可少的組成部分。

1.2 三維重構(gòu)技術(shù)概述

在實(shí)際應(yīng)用中,人們面對(duì)的往往并不是直接的體數(shù)據(jù)信息,而是一序列的二維輪廓線數(shù)據(jù)。由序列二維輪廓數(shù)據(jù)重構(gòu)三維形體是當(dāng)前三維重構(gòu)技術(shù)研究的一個(gè)大的方向。在這里,輪廓線代表著一個(gè)物體對(duì)象表面與一系列切平面的交線,該方法首先獲取輪廓線數(shù)據(jù),然后再進(jìn)行3D曲面重構(gòu),如圖1所示。

一個(gè)斷層上的輪廓組可以來(lái)自一個(gè)物體對(duì)象或多個(gè)物體對(duì)象,一個(gè)非凸的物體對(duì)象在某個(gè)斷層截面上可以有多個(gè)輪廓。在此情況下,相鄰兩個(gè)斷層之間的輪廓線便會(huì)出現(xiàn)一對(duì)一、一對(duì)多、多對(duì)多、末端以及連通分叉五種連接方式[7]。其中,一對(duì)一連接僅需解決相鄰兩層輪廓線之間的拼接問(wèn)題;一對(duì)多連接首先需要解決輪廓線之間的分支問(wèn)題,將一對(duì)多連接簡(jiǎn)化為多個(gè)一對(duì)一連接,然后再進(jìn)行一對(duì)一輪廓線之間的拼接;多對(duì)多連接則首先需要解決輪廓線之間的對(duì)應(yīng)問(wèn)題,將多對(duì)多連接簡(jiǎn)化為多個(gè)一對(duì)一與多個(gè)一對(duì)多連接的組合,然后再進(jìn)行相應(yīng)的分支處理,最后進(jìn)行輪廓線之間的拼接。

綜上所述,基于輪廓的三維形體重構(gòu)過(guò)程可以分解為四個(gè)子問(wèn)題,即輪廓拼接問(wèn)題、輪廓分支問(wèn)題、輪廓對(duì)應(yīng)問(wèn)題和曲面擬合問(wèn)題[8],如圖2所示[9]。

1.3 礦體三維重構(gòu)的技術(shù)特點(diǎn)

與目前三維重構(gòu)技術(shù)應(yīng)用較完善的醫(yī)學(xué)圖形等應(yīng)用領(lǐng)域不同,礦體三維重構(gòu)具有許多自身特點(diǎn)。首先,真實(shí)礦體的地質(zhì)形態(tài)往往復(fù)雜多變且隨意性較大,無(wú)明顯規(guī)律可尋;其次,礦體重構(gòu)以剖面圖、中段平面圖、鉆孔及坑道等測(cè)量數(shù)據(jù)為采樣數(shù)據(jù),這些數(shù)據(jù)在不經(jīng)過(guò)特殊處理的情況下將無(wú)法直接用于礦體重構(gòu);再次,真實(shí)礦體地質(zhì)形態(tài)的復(fù)雜性,決定了由此產(chǎn)生的平行輪廓線之間的重合度往往非常小;最后,由于地質(zhì)測(cè)量的特殊性,由鉆孔剖面數(shù)據(jù)得出的平行輪廓線之間的距離往往非常大,導(dǎo)致兩條輪廓線之間的礦體形態(tài)難以準(zhǔn)確表達(dá)。

2 礦體二維剖面數(shù)據(jù)的處理

用于三維礦體重構(gòu)的原始數(shù)據(jù)主要來(lái)自礦山提供的各類剖面圖、中段平面圖、鉆孔及坑道測(cè)量編錄資料,在對(duì)這些勘測(cè)線以及各類剖面圖進(jìn)行單層的二維圈礦處理后便可以得到人們所需要的斷層輪廓數(shù)據(jù)。然而,由此得出的數(shù)據(jù)仍然與真正意義上的斷層輪廓數(shù)據(jù)有很大的出入。首先,礦體的鉆孔剖面具有很大的空間隨意性,它可能不平行于X-Y平面、X-Z平面與Y-Z平面中的任何一個(gè),也就是說(shuō),這些剖面的法向量可能指向空間的任何位置,且各個(gè)剖面的法向量所指方向也可能各不相同。其次,同一個(gè)輪廓線上的各個(gè)頂點(diǎn)往往并不在同一個(gè)平面上。再次,礦體剖面數(shù)據(jù)中的X、Y值通常代表大地物理坐標(biāo)值,其數(shù)值往往很大,而Z值則代表深度值,與X、Y值相比可能要小得多。由于礦體剖面數(shù)據(jù)的上述特點(diǎn),決定了在進(jìn)行礦體三維重構(gòu)之前必須對(duì)這些不規(guī)范的數(shù)據(jù)進(jìn)行嚴(yán)格處理,將其轉(zhuǎn)化為真正意義上的斷層輪廓數(shù)據(jù)。

處理不規(guī)范的礦體剖面數(shù)據(jù)的過(guò)程包括平移、旋轉(zhuǎn)等[10-11],圖3所示,具體過(guò)程如下:

1) 平移坐標(biāo)軸:求出礦體中心點(diǎn)的坐標(biāo)值,平移三維坐標(biāo)軸使原點(diǎn)與礦體中心點(diǎn)重合,將礦體中心點(diǎn)定義為新的坐標(biāo)原點(diǎn);

2) 旋轉(zhuǎn)坐標(biāo)軸:求出礦體各個(gè)剖面的法向量并由此計(jì)算礦體的平均法向量,求出該法向量與X、Y、Z軸的夾角大小,繞X軸將該法向量旋轉(zhuǎn)至X-Z平面上,再繞Y軸將該法向量旋轉(zhuǎn)至Z-Y平面上,最終使其與Z軸重合。

3 系統(tǒng)設(shè)計(jì)與實(shí)現(xiàn)

3.1 模型數(shù)據(jù)結(jié)構(gòu)的設(shè)計(jì)

構(gòu)建礦體的三維可視化模型,首先應(yīng)建立礦體的表面模型,再在表面模型的基礎(chǔ)上建立礦體的體塊模型和品位模型。針對(duì)上述模型構(gòu)建過(guò)程,礦體三維重構(gòu)系統(tǒng)的數(shù)據(jù)結(jié)構(gòu)應(yīng)包括如下內(nèi)容:

1) 在建立礦體表面模型之前,需要對(duì)斷層數(shù)據(jù)、輪廓數(shù)據(jù)以及輪廓線頂點(diǎn)數(shù)據(jù)進(jìn)行相應(yīng)處理。其中,斷層數(shù)據(jù)包括斷層總數(shù)、斷層內(nèi)的輪廓線索引值以及斷層Z坐標(biāo)值等內(nèi)容;輪廓數(shù)據(jù)包括輪廓總數(shù)、輪廓頂點(diǎn)總數(shù)、頂點(diǎn)索引值以及其他與處理輪廓密切相關(guān)的數(shù)據(jù);輪廓線頂點(diǎn)數(shù)據(jù)則包括頂點(diǎn)的X、Y、Z坐標(biāo)值等信息。

2) 在表面模型的構(gòu)建過(guò)程中,則需要對(duì)三角面片數(shù)據(jù)、連接邊數(shù)據(jù)進(jìn)行處理。其中,三角面片數(shù)據(jù)包括三角面三個(gè)頂點(diǎn)的索引值等內(nèi)容;連接邊數(shù)據(jù)則包括邊的兩個(gè)頂點(diǎn)的索引值、共享該邊的兩個(gè)三角面的索引值等,邊數(shù)據(jù)主要應(yīng)用于表面模型構(gòu)建完成后的局部信息的人工修改。

3) 在體塊模型的構(gòu)建過(guò)程中,需要對(duì)體數(shù)據(jù)進(jìn)行處理,體數(shù)據(jù)包括組成該體塊的三角面片數(shù)據(jù)等。

3.2 礦體三維重構(gòu)的算法流程

通過(guò)對(duì)礦體三維重構(gòu)處理過(guò)程進(jìn)行分析,可將其劃分為5個(gè)處理階段,分別是:二維礦體數(shù)據(jù)讀取階段、三維礦體表面重構(gòu)階段、礦體體數(shù)據(jù)生成階段、數(shù)據(jù)處理階段與礦體三維數(shù)據(jù)保存階段,其具體的算法流程如圖4所示。

3.3 礦體體積計(jì)算

礦體經(jīng)過(guò)三維重構(gòu)首先生成以三角面為基礎(chǔ)的表面模型,然后再在表面模型的基礎(chǔ)上生成體數(shù)據(jù),體數(shù)據(jù)生成后,便可以對(duì)礦體體積進(jìn)行計(jì)算。本文參考三角區(qū)域累加計(jì)算的方法求取體積[12-13]。

首先,將不規(guī)則的形體分解為若干個(gè)較小的規(guī)則體元;然后,分別計(jì)算各個(gè)小體元的體積;最后,將所有體元的體積累加起來(lái)便得到整個(gè)形體的體積。這里所指的規(guī)則體元如圖5所示。三種規(guī)則體元的體積計(jì)算公式分別為:1) V=s×h;2) V=(s×h)/3;3) V= 2×(s×h)/3。其中,s為底面三角形的面積,h為體元的高。

規(guī)則體元的生成原則是:

1) 上斷層平面上的表面三角形向下斷層投影,在下斷層上生成一個(gè)投影三角形,兩個(gè)三角形對(duì)應(yīng)頂點(diǎn)連線即生成圖5中的(a)體元;

2) 上、下斷層之間的表面三角形由位于上斷層上的頂點(diǎn)向下斷層投影,在下斷層上生成一個(gè)投影三角形。如果上斷層含有1個(gè)頂點(diǎn),連接該頂點(diǎn)及其投影頂點(diǎn)便可生成圖5中的(b)體元;如果上斷層含有2個(gè)頂點(diǎn),分別連接這兩個(gè)頂點(diǎn)及其投影頂點(diǎn)則生成圖5中的(c)體元。

求取規(guī)則體元的體積也應(yīng)遵循一定的規(guī)則,即如果三角形的法線方向與投影方向相反,則由該三角形生成的規(guī)則體元的體積為正,否則,相應(yīng)的規(guī)則體元的體積為負(fù)。如圖6所示,三角形P3P4A是上輪廓多邊形進(jìn)行平面三角剖分后得出的一個(gè)三角形,它的平面法向量為S1,其在下輪廓平面上的投影三角形為P’3P’4A’,兩個(gè)三角形之間的部分為規(guī)則體元T1;三角形Q6Q7B是下輪廓多邊形進(jìn)行平面三角剖分后得出的一個(gè)三角形,它的平面法向量為S2,投影高度為0;三角形P2Q2Q3是連接上、下兩條輪廓線的一個(gè)三角面片,它的平面法向量為S3,其在下輪廓平面上的投影三角形為P’2Q2Q3,兩個(gè)三角形之間的部分為規(guī)則體元T2;三角形P6Q8Q9也是連接上、下輪廓線的一個(gè)三角面片,它的平面法向量為S4,其在下輪廓平面上的投影三角形為P6 Q’8Q’9,兩個(gè)三角形之間的部分為規(guī)則體元T3。由于S1方向向上(與投影方向相反),故規(guī)則體元T1的體積為正;因三角形Q6Q7B的投影高度為0,故體積為0;因S3方向向上(與投影方向相反),故規(guī)則體元T2的體積為正;S4方向向下(與投影方向相同),故規(guī)則體元T4的體積為負(fù)。綜上所述,四個(gè)規(guī)則體元的體積之和為V=VT1+VT2-VT3。

經(jīng)過(guò)上述各步處理,最終可求得各個(gè)規(guī)則體元的體積,將這些規(guī)則體元的體積加在一起,其和即為所求形體(礦體)的體積。

4 實(shí)驗(yàn)結(jié)果

本文以Visual Basic 6.0、OpenGL等作為開(kāi)發(fā)工具,完成了礦體三維重構(gòu)系統(tǒng)的設(shè)計(jì)工作,圖7給出了系統(tǒng)設(shè)計(jì)界面,并以兩層剖面圖為例生成礦體表面模型。圖8給出了某鐵礦的應(yīng)用實(shí)例,該鐵礦屬鞍山式貧磁鐵礦(沉積變質(zhì)類型),礦體比較復(fù)雜。圖9給出了某金礦的應(yīng)用實(shí)例,該金礦為蝕變巖型大型金礦床,主要工業(yè)礦體隱伏于地下,埋藏深、品位低、水平厚度大,一般水平厚度達(dá)20m以上,最厚達(dá)100m以上,但礦體連續(xù)性好,局部有分枝復(fù)合現(xiàn)象,礦體呈緩傾斜產(chǎn)出,傾角18°~51°。通過(guò)與已知的實(shí)際礦體結(jié)構(gòu)比較,圖8、圖9中生成的三維礦體模型基本反映了上述區(qū)域內(nèi)礦體的分布情況。

5 結(jié)束語(yǔ)

從一組采樣數(shù)據(jù)中重建物體的三維實(shí)體是人類觀察和分析客觀事物的重要手段。以三維重構(gòu)技術(shù)為載體,通過(guò)二維化的剖面采樣數(shù)據(jù)來(lái)構(gòu)建礦體的三維可視化模型并對(duì)其進(jìn)行可視化的定量分析與處理,早已成為礦業(yè)數(shù)字化的一個(gè)重要發(fā)展方向。在不遠(yuǎn)的將來(lái),隨著鉆孔采樣、中間插值、拼接算法等相關(guān)技術(shù)的不斷發(fā)展,礦體三維重構(gòu)也必將在礦業(yè)數(shù)字化的道路上愈行愈遠(yuǎn)。

參考文獻(xiàn):

[1] 吳立新.論21世紀(jì)的礦山――數(shù)字礦山[J].煤炭學(xué)報(bào),2000(4).

[2] 南格利.礦體線框模型及其建立方法[J].有色礦山,2001(5).

[3] Ballard D H,Brown C puter Vision[M].Prentice-Hall,1982.

[4] Schmitt F,Chen X,Du W H.Geometric modeling from range image data[J].EROGRAPHICS,1991:57-62.

[5] Liang Z.Tissue classification and segmentation of MR images[J].IEEE Engineer in Medicine and Biology,1993,12(1):81-85.

[6] Fuchs H,Kedem Z M,Uselton S P.Optimal Surface Reconstruction from Planar Contour[J].Communication of the ACM,1977,20(10):693-702.

[7] Oliva J M,Perrin M,Coquillart S.3D reconstruction of complex polyhedral shapes from contours using a simplified generalized Voronoi diagram[J].EUROGRAPHICS,1996,15(3):397-408.

[8] Meyers D,Skinner S,Sloan K.Surface from contours[J].ACM Transaction on Graphics,1992,2(3):228-258.

[9] Meyers D.Reconstruction of Surfaces from Planar Contours[D].PhD.Thesis,University of Washington,1994.

[10] 孫家廣.計(jì)算機(jī)圖形學(xué)[M].3版.北京:清華大學(xué)出版社,1998.

[11] 唐榮錫,汪嘉業(yè),彭群生,等.計(jì)算機(jī)圖形學(xué)教程[M].北京:科學(xué)出版社,2000.

[12] 王賢文,王秀美,洪源,等.計(jì)算機(jī)輔助測(cè)量料堆體積的三角區(qū)域法[J].北京科技大學(xué)學(xué)報(bào),2002,24(3):369-371.

篇8

信息化是形成注冊(cè)會(huì)計(jì)師行業(yè)發(fā)展新動(dòng)能的重要力量,是實(shí)現(xiàn)行業(yè)跨越式發(fā)展的重要引領(lǐng)。自“十二五”期間將信息化確定為行業(yè)發(fā)展戰(zhàn)略以來(lái),在《中國(guó)注冊(cè)會(huì)計(jì)師行業(yè)信息化建設(shè)總體方案》《注冊(cè)會(huì)計(jì)師行業(yè)信息化建設(shè)規(guī)劃(2016-2020年)》《注冊(cè)會(huì)計(jì)師行業(yè)信息化建設(shè)規(guī)劃(2021-2025年)》等宏觀政策的引領(lǐng)下,注冊(cè)會(huì)計(jì)師行業(yè)信息化建設(shè)取得了顯著成效。隨著行業(yè)信息化建設(shè)的不斷深入,大數(shù)據(jù)、人工智能、移動(dòng)互聯(lián)、云計(jì)算、物聯(lián)網(wǎng)和區(qū)塊鏈等新興技術(shù)不斷應(yīng)用到審計(jì)實(shí)務(wù)中(舒惠好等,2021),注冊(cè)會(huì)計(jì)師的信息化專業(yè)能力短板卻日益突顯(張敏,2020;應(yīng)里孟和陽(yáng)杰,2020;舒惠好等,2021),這顯著降低了行業(yè)信息化建設(shè)的成效。雖然中國(guó)注冊(cè)會(huì)計(jì)師協(xié)會(huì)于2007年印發(fā)的《中國(guó)注冊(cè)會(huì)計(jì)師勝任能力指南》明確了信息技術(shù)在注冊(cè)會(huì)計(jì)師勝任能力框架中的重要地位,但《中國(guó)注冊(cè)會(huì)計(jì)師勝任能力指南》僅僅是導(dǎo)向性的,在信息化層面缺乏可操作性?;诖?本文重點(diǎn)探討在行業(yè)信息化背景下注冊(cè)會(huì)計(jì)師需要具備的各種素質(zhì)和能力,揭示當(dāng)前注冊(cè)會(huì)計(jì)師信息化專業(yè)能力存在的主要短板,探討如何提高注冊(cè)會(huì)計(jì)師信息化執(zhí)業(yè)能力,以期彌合期望差距,提高審計(jì)質(zhì)量,促進(jìn)行業(yè)高質(zhì)量發(fā)展。深入研究注冊(cè)會(huì)計(jì)師信息化專業(yè)能力具有重大意義。(1)深入研究注冊(cè)會(huì)計(jì)師信息化專業(yè)能力是貫徹落實(shí)〔2021〕30號(hào)文件的重要舉措。2021年7月30日,國(guó)務(wù)院辦公廳印發(fā)《關(guān)于進(jìn)一步規(guī)范財(cái)務(wù)審計(jì)秩序促進(jìn)注冊(cè)會(huì)計(jì)師行業(yè)健康發(fā)展的意見(jiàn)》(〔2021〕30號(hào)),明確提出“加強(qiáng)注冊(cè)會(huì)計(jì)師專業(yè)培訓(xùn)教育。創(chuàng)新繼續(xù)教育方式,圍繞專業(yè)勝任能力、職業(yè)技能、職業(yè)價(jià)值、職業(yè)道德等重點(diǎn),豐富完善教育內(nèi)容。”深入研究注冊(cè)會(huì)計(jì)師信息化專業(yè)能力建設(shè)相關(guān)問(wèn)題,有助于豐富完善專業(yè)勝任能力、職業(yè)技能、職業(yè)價(jià)值、職業(yè)道德等重點(diǎn)的教育內(nèi)容,可以為加強(qiáng)注冊(cè)會(huì)計(jì)師專業(yè)培訓(xùn)教育指明方向和明確路徑。(2)深入研究注冊(cè)會(huì)計(jì)師信息化專業(yè)能力是提高審計(jì)質(zhì)量的必由之路。根據(jù)DeAngelo(1980)對(duì)審計(jì)質(zhì)量的經(jīng)典定義,即審計(jì)質(zhì)量是市場(chǎng)評(píng)估的注冊(cè)會(huì)計(jì)師發(fā)現(xiàn)并報(bào)告財(cái)務(wù)報(bào)告存在錯(cuò)報(bào)或漏報(bào)的聯(lián)合概率,審計(jì)質(zhì)量取決于注冊(cè)會(huì)計(jì)師的專業(yè)勝任能力和獨(dú)立性,在信息化環(huán)境下,注冊(cè)會(huì)計(jì)師的信息化專業(yè)能力是影響審計(jì)質(zhì)量的關(guān)鍵因素,深入研究注冊(cè)會(huì)計(jì)師信息化專業(yè)能力有助于提高信息化環(huán)境下的審計(jì)質(zhì)量。(3)深入研究注冊(cè)會(huì)計(jì)師信息化專業(yè)能力是塑造會(huì)計(jì)師事務(wù)所品牌的重要基礎(chǔ)?!蹲?cè)會(huì)計(jì)師行業(yè)發(fā)展規(guī)劃(2021—2025年)》明確提出將“行業(yè)品牌化建設(shè)取得新成效”作為今后五年行業(yè)發(fā)展要努力實(shí)現(xiàn)的主要目標(biāo)之一。眾所周知,審計(jì)質(zhì)量塑造事務(wù)所品牌,行業(yè)品牌化建設(shè)的關(guān)鍵是提高審計(jì)質(zhì)量,提高審計(jì)質(zhì)量的基礎(chǔ)是提高注冊(cè)會(huì)計(jì)師的專業(yè)勝任能力和獨(dú)立性,深入研究探討注冊(cè)會(huì)計(jì)師信息化專業(yè)能力的框架、短板、提升路徑和策略有助于提高注冊(cè)會(huì)計(jì)師的專業(yè)勝任能力,為實(shí)現(xiàn)“行業(yè)品牌化建設(shè)取得新成效”的奮斗目標(biāo)打下堅(jiān)實(shí)的基礎(chǔ)。

二、當(dāng)前注冊(cè)會(huì)計(jì)師信息化專業(yè)能力的現(xiàn)狀分析

(一)注冊(cè)會(huì)計(jì)師信息技術(shù)專業(yè)知識(shí)比較薄弱

根據(jù)作者對(duì)所在單位注冊(cè)會(huì)計(jì)師信息技術(shù)專業(yè)知識(shí)情況的調(diào)查研究,目前的注冊(cè)會(huì)計(jì)師普遍存在信息技術(shù)專業(yè)知識(shí)比較薄弱的問(wèn)題,具體表現(xiàn)為注冊(cè)會(huì)計(jì)師所掌握的專業(yè)知識(shí)主要局限于Office辦公軟件等傳統(tǒng)信息技術(shù)知識(shí),而對(duì)“大智移云物區(qū)”等新興信息技術(shù)專業(yè)知識(shí)“知其然,而不知其所以然”,缺乏必要的理論知識(shí)儲(chǔ)備。目前注冊(cè)會(huì)計(jì)師獲取信息技術(shù)專業(yè)知識(shí)的渠道主要來(lái)自職業(yè)繼續(xù)教育。雖然行業(yè)協(xié)會(huì)和大部分會(huì)計(jì)師事務(wù)所的繼續(xù)教育培訓(xùn)對(duì)新興信息技術(shù)專業(yè)知識(shí)有所涉及,但仍主要停留在電子表格使用培訓(xùn),面對(duì)高度信息化環(huán)境下的海量數(shù)據(jù)采集,注冊(cè)會(huì)計(jì)師普遍缺乏必要的知識(shí)儲(chǔ)備。

(二)注冊(cè)會(huì)計(jì)師信息技術(shù)職業(yè)技能有待提升

注冊(cè)會(huì)計(jì)師普遍存在信息技術(shù)職業(yè)技能有待提升的問(wèn)題,具體表現(xiàn)為注冊(cè)會(huì)計(jì)師的新興信息技術(shù)職業(yè)技能不熟練,對(duì)新興信息技術(shù)應(yīng)用的參與度較低。一方面,作為一個(gè)人員流動(dòng)性比較高的行業(yè),會(huì)計(jì)師事務(wù)所除了每年通過(guò)校園招聘大批量的畢業(yè)生外,還會(huì)通過(guò)社會(huì)招聘從其他相關(guān)機(jī)構(gòu)招聘一批專業(yè)人員。這些新入職的員工沒(méi)有使用本所審計(jì)系統(tǒng)的經(jīng)驗(yàn)。新員工學(xué)習(xí)軟件過(guò)程除了觀看視頻培訓(xùn)教程,主要依靠項(xiàng)目實(shí)戰(zhàn)摸索,這大大降低了員工使用軟件的效率。同時(shí)較高的員工流動(dòng)率導(dǎo)致審計(jì)作業(yè)系統(tǒng)用戶一直都有一定比例的新用戶,降低了審計(jì)軟件使用效率。另一方面,每年審計(jì)作業(yè)系統(tǒng)改造需求主要來(lái)自于信息化部門(mén)運(yùn)維收集到的用戶問(wèn)題修復(fù)、專業(yè)標(biāo)準(zhǔn)部分和質(zhì)量控制部門(mén)每年修訂質(zhì)量控制制度的管理需要,以及業(yè)務(wù)部門(mén)的員工訪談。但每次訪談業(yè)務(wù)部員工使用需求,收到建設(shè)性建議較少。審計(jì)人員或者對(duì)信息化建設(shè)缺乏參與熱情,或者是缺乏足夠的信息化能力,提不出建設(shè)性意見(jiàn),這使得軟件改進(jìn)成效存在一定的折扣。

(三)注冊(cè)會(huì)計(jì)師信息技術(shù)職業(yè)道德意識(shí)不強(qiáng)

注冊(cè)會(huì)計(jì)師普遍存在信息技術(shù)職業(yè)道德意識(shí)不強(qiáng)的問(wèn)題,具體表現(xiàn)為對(duì)信息系統(tǒng)相關(guān)道德困境、數(shù)據(jù)管理相關(guān)道德困境和職業(yè)道德物化困境了解不足、重視不夠。其中,信息系統(tǒng)相關(guān)道德困境是指注冊(cè)會(huì)計(jì)師在信息系統(tǒng)設(shè)計(jì)和運(yùn)行中的違規(guī)違法操作行為或其他不道德行為,導(dǎo)致數(shù)據(jù)保密和數(shù)據(jù)安全責(zé)任不能履行以及其他不道德行為的發(fā)生。數(shù)據(jù)管理相關(guān)道德困境是指注冊(cè)會(huì)計(jì)師的數(shù)據(jù)采集、存儲(chǔ)、分析以及輸出行為危機(jī)客戶的數(shù)據(jù)保密和數(shù)據(jù)安全,或?qū)е缕渌坏赖滦袨榈陌l(fā)生。職業(yè)道德物化困境是指擁有自由意志或自主能力的信息化系統(tǒng)違反審計(jì)職業(yè)道德規(guī)范的行為,或?qū)е缕渌坏赖滦袨榈陌l(fā)生。新興信息技術(shù)在審計(jì)領(lǐng)域的廣泛應(yīng)用,使得注冊(cè)會(huì)計(jì)師從基礎(chǔ)工作中解放出來(lái),也讓注冊(cè)會(huì)計(jì)師面臨更加復(fù)雜的道德困境。然而,大部分會(huì)計(jì)師事務(wù)所在聚焦新興信息技術(shù)的應(yīng)用問(wèn)題時(shí),忽視了相關(guān)的職業(yè)道德教育,使得注冊(cè)會(huì)計(jì)師普遍表現(xiàn)出信息技術(shù)職業(yè)道德意識(shí)不強(qiáng)。

三、提升注冊(cè)會(huì)計(jì)師信息化專業(yè)能力的對(duì)策建議

(一)構(gòu)建注冊(cè)會(huì)計(jì)師信息化專業(yè)能力框架

根據(jù)中國(guó)注冊(cè)會(huì)計(jì)師協(xié)會(huì)2019年6-12月對(duì)注冊(cè)會(huì)計(jì)師行業(yè)信息化建設(shè)的最新調(diào)研結(jié)果,會(huì)計(jì)師事務(wù)所認(rèn)為將對(duì)行業(yè)發(fā)展產(chǎn)生重大影響的信息技術(shù)依次是大數(shù)據(jù)(41.6%)、人工智能(39.3%)、云計(jì)算(18.1%)、物聯(lián)網(wǎng)(4.9%)、區(qū)塊鏈(3.5%)和其他(0.4%)。其中,大數(shù)據(jù)和人工智能在注冊(cè)會(huì)計(jì)師審計(jì)領(lǐng)域的應(yīng)用最為廣泛?;趯?duì)審計(jì)實(shí)務(wù)的調(diào)研和相關(guān)學(xué)術(shù)研究,大數(shù)據(jù)審計(jì)技術(shù)大體上可以分為大數(shù)據(jù)智能分析技術(shù)、大數(shù)據(jù)可視化分析技術(shù)和大數(shù)據(jù)多數(shù)據(jù)源綜合分析技術(shù)三類。其中,大數(shù)據(jù)智能分析技術(shù)包括自然語(yǔ)言處理技術(shù)、社會(huì)網(wǎng)絡(luò)分析技術(shù)和圖形數(shù)據(jù)庫(kù)技術(shù)等。大數(shù)據(jù)可視化分析技術(shù)包括標(biāo)簽云分析、散點(diǎn)圖分析、條形圖分析、折線圖分析、直方圖分析、氣泡圖分析、小提琴圖分析和熱力圖分析等。大數(shù)據(jù)多數(shù)據(jù)源綜合分析技術(shù)是通過(guò)采集各種可獲取的數(shù)據(jù),采用大數(shù)據(jù)技術(shù)方法進(jìn)行數(shù)據(jù)分析,從而發(fā)現(xiàn)審計(jì)線索的技術(shù)。常用的大數(shù)據(jù)審計(jì)工具有R語(yǔ)言、Python和Tableau?;趯?duì)審計(jì)實(shí)務(wù)的調(diào)研和相關(guān)學(xué)術(shù)研究,人工智能審計(jì)技術(shù)大體上可以分為機(jī)器學(xué)習(xí)、計(jì)算機(jī)視覺(jué)、虛擬、自然語(yǔ)言處理和認(rèn)知計(jì)算等(吳勇等,2021)。在率先應(yīng)用人工智能審計(jì)的領(lǐng)域,四大會(huì)計(jì)師事務(wù)所都是與專業(yè)機(jī)構(gòu)合作推出可供注冊(cè)會(huì)計(jì)師應(yīng)用的審計(jì)產(chǎn)品,注冊(cè)會(huì)計(jì)師通常無(wú)需參與審計(jì)產(chǎn)品的開(kāi)發(fā)設(shè)計(jì)。因此,人工智能審計(jì)對(duì)注冊(cè)會(huì)計(jì)師信息化專業(yè)能力要求相對(duì)較低。相比而言,注冊(cè)會(huì)計(jì)師在大數(shù)據(jù)審計(jì)中不僅需要具備大數(shù)據(jù)審計(jì)思維,還需要掌握一定的大數(shù)據(jù)審計(jì)技術(shù)。因此,大數(shù)據(jù)審計(jì)對(duì)注冊(cè)會(huì)計(jì)師信息化專業(yè)能力要求更高。基于此,本文主要基于大數(shù)據(jù)審計(jì)技術(shù)探討注冊(cè)會(huì)計(jì)師信息化專業(yè)能力框架?;凇吨袊?guó)注冊(cè)會(huì)計(jì)師勝任能力指南》構(gòu)建的中國(guó)注冊(cè)會(huì)計(jì)師勝任能力框架,本文將從信息技術(shù)專業(yè)知識(shí)、信息技術(shù)職業(yè)技能和信息技術(shù)職業(yè)道德三個(gè)方面構(gòu)建注冊(cè)會(huì)計(jì)師的信息化專業(yè)能力框架,如圖1所示。其中,信息技術(shù)專業(yè)知識(shí)應(yīng)當(dāng)在原有學(xué)科領(lǐng)域的基礎(chǔ)上增加新興技術(shù)學(xué)科領(lǐng)域,比如大數(shù)據(jù)、人工智能、移圖1注冊(cè)會(huì)計(jì)師信息化專業(yè)能力框架圖動(dòng)互聯(lián)網(wǎng)、云計(jì)算、物聯(lián)網(wǎng)和區(qū)塊鏈等相關(guān)的知識(shí)。信息技術(shù)職業(yè)技能應(yīng)當(dāng)在原有技術(shù)和應(yīng)用技能的基礎(chǔ)上增加新興技術(shù)學(xué)科領(lǐng)域的應(yīng)用技術(shù)和應(yīng)用技能,比如注冊(cè)會(huì)計(jì)師應(yīng)當(dāng)掌握大數(shù)據(jù)審計(jì)常用的R語(yǔ)言、Python和Tableau等信息化工具。信息技術(shù)職業(yè)道德應(yīng)當(dāng)在原有職業(yè)價(jià)值觀、道德和態(tài)度的基礎(chǔ)上增加信息系統(tǒng)、數(shù)據(jù)管理和職業(yè)道德物化等方面的職業(yè)道德教育。

(二)改革創(chuàng)新學(xué)歷教育

1.改革創(chuàng)新學(xué)歷教育的課程體系。目前的學(xué)歷教育課程體系難以培養(yǎng)出行業(yè)信息化建設(shè)所需的人才。目前會(huì)計(jì)專業(yè)開(kāi)設(shè)的相關(guān)信息技術(shù)知識(shí)、技術(shù)和道德已經(jīng)無(wú)法滿足新時(shí)代審計(jì)工作的需要。具體表現(xiàn)為:一是信息技術(shù)專業(yè)知識(shí)較為陳舊,并未新增大數(shù)據(jù)審計(jì)、人工智能審計(jì)等新興技術(shù);二是課程所涉及的信息技術(shù)職業(yè)技能較為落后,仍局限于Office辦公軟件等傳統(tǒng)信息技術(shù);三是新興信息技術(shù)職業(yè)道德教育缺失,并不涉及新興技術(shù)相關(guān)的職業(yè)道德教育,仍局限于傳統(tǒng)的審計(jì)職業(yè)道德教育。學(xué)歷教育階段應(yīng)當(dāng)遵循科學(xué)的課程體系設(shè)計(jì)邏輯,可以從以下三個(gè)方面改革創(chuàng)新學(xué)歷教育的課程體系:首先要更新信息技術(shù)專業(yè)知識(shí),新增大數(shù)據(jù)審計(jì)、人工智能審計(jì)等新興技術(shù)專業(yè)知識(shí);其次要開(kāi)設(shè)信息技術(shù)職業(yè)技能課程,比如R語(yǔ)言、Python和Tableau等信息化工具應(yīng)用課程;最后要加強(qiáng)新興信息技術(shù)職業(yè)道德教育,在審計(jì)職業(yè)道德相關(guān)的課程中新增新興技術(shù)相關(guān)的職業(yè)道德教育內(nèi)容。2.改革創(chuàng)新學(xué)歷教育的培養(yǎng)模式。目前的學(xué)歷教育培養(yǎng)模式幾乎全部依賴自有師資力量、自編課堂教材,普遍存在理論與實(shí)務(wù)脫鉤的現(xiàn)象,人才培養(yǎng)不能滿足行業(yè)信息化建設(shè)的需求。建議采用產(chǎn)學(xué)研相結(jié)合的培養(yǎng)模式,遵循“理論源于實(shí)務(wù),理論指導(dǎo)實(shí)務(wù),理論高于實(shí)務(wù)”的科學(xué)理念,將理論與實(shí)務(wù)融合在一起。具體而言,高等院??梢栽趯W(xué)歷教育的人才培養(yǎng)過(guò)程中引入信息化實(shí)務(wù)導(dǎo)師,可以與會(huì)計(jì)師事務(wù)所開(kāi)展聯(lián)合培養(yǎng),根據(jù)學(xué)生的擇業(yè)選擇以及會(huì)計(jì)師事務(wù)所的用人需求開(kāi)展有針對(duì)性的學(xué)歷教育。

(三)完善職業(yè)繼續(xù)教育

1.完善會(huì)計(jì)師事務(wù)所內(nèi)部職業(yè)繼續(xù)教育。會(huì)計(jì)師事務(wù)所是高智力的學(xué)習(xí)型組織,每年均會(huì)對(duì)員工開(kāi)展財(cái)務(wù)會(huì)計(jì)審計(jì)等各種專業(yè)知識(shí)的培訓(xùn),為提升審計(jì)人員的信息化水平和使用能力,應(yīng)加強(qiáng)和改進(jìn)培訓(xùn)工作,如:在內(nèi)部培訓(xùn)中增加有關(guān)信息化方面的培訓(xùn)內(nèi)容;從外部聘請(qǐng)信息化方面的專家開(kāi)展培訓(xùn)工作;從現(xiàn)有員工中選拔更多優(yōu)秀的、具有培養(yǎng)前途的員工參加外部各種信息化培訓(xùn)、學(xué)歷教育和信息化審計(jì)項(xiàng)目實(shí)務(wù)鍛煉等。同時(shí),對(duì)現(xiàn)有的信息化審計(jì)人員也要開(kāi)展財(cái)務(wù)會(huì)計(jì)審計(jì)相關(guān)知識(shí)的培訓(xùn),使目前的信息化審計(jì)人員理解和掌握更多財(cái)務(wù)審計(jì)知識(shí),成為精通財(cái)務(wù)的信息化審計(jì)人才。2.完善注冊(cè)會(huì)計(jì)師行業(yè)的職業(yè)繼續(xù)教育。行業(yè)協(xié)會(huì)要?jiǎng)?chuàng)新職業(yè)繼續(xù)教育的方式和方法,圍繞信息化專業(yè)能力的專業(yè)知識(shí)、職業(yè)技能和職業(yè)道德等重點(diǎn),豐富完善相關(guān)教育內(nèi)容。充分利用信息技術(shù)手段,上線職業(yè)繼續(xù)教育相關(guān)應(yīng)用,切實(shí)提高職業(yè)繼續(xù)教育的培訓(xùn)效果,持續(xù)保持和強(qiáng)化注冊(cè)會(huì)計(jì)師信息化專業(yè)能力和職業(yè)道德操守。

(四)深化行業(yè)監(jiān)管改革