卷積神經(jīng)網(wǎng)絡(luò)的歷史范文
時(shí)間:2024-04-02 18:04:09
導(dǎo)語(yǔ):如何才能寫好一篇卷積神經(jīng)網(wǎng)絡(luò)的歷史,這就需要搜集整理更多的資料和文獻(xiàn),歡迎閱讀由公務(wù)員之家整理的十篇范文,供你借鑒。
篇1
關(guān)鍵詞:深度學(xué)習(xí);機(jī)器學(xué)習(xí);卷積神經(jīng)網(wǎng)絡(luò)
1概述
深度學(xué)習(xí)(Deep Learning)是人工智能、圖像建模、模式識(shí)別、神經(jīng)網(wǎng)絡(luò)、最優(yōu)化理論和信號(hào)處理等領(lǐng)域的交叉學(xué)科,主要構(gòu)建和模擬人腦進(jìn)行分析學(xué)習(xí),它屬于機(jī)器學(xué)習(xí)的新興領(lǐng)域。
2大數(shù)據(jù)與深度學(xué)習(xí)
目前,光學(xué)檢測(cè)、互聯(lián)網(wǎng)、用戶數(shù)據(jù)、互聯(lián)網(wǎng)、金融公司等許多領(lǐng)域都出現(xiàn)了海量數(shù)據(jù),采用BP算法對(duì)于訓(xùn)練神經(jīng)網(wǎng)絡(luò)出現(xiàn)了梯度越來(lái)越稀疏、收斂到局部最小值只能用有標(biāo)簽的數(shù)據(jù)來(lái)訓(xùn)練等缺點(diǎn)。Hinton于2006年提出了深度學(xué)習(xí)的概念,Lecun等人提出了卷積神經(jīng)網(wǎng)絡(luò),卷積神經(jīng)網(wǎng)絡(luò)利用空間關(guān)系減少參數(shù)數(shù)目以提高訓(xùn)練性能。
CPU和GPU計(jì)算能力大幅提升,為深度學(xué)習(xí)提供了硬件平臺(tái)和技術(shù)手段,在海量大數(shù)據(jù)處理技術(shù)上解決了早期神經(jīng)網(wǎng)絡(luò)訓(xùn)練不足出現(xiàn)的過(guò)擬合、泛化能力差等問題。
大數(shù)據(jù)和深度學(xué)習(xí)必將互相支撐,推動(dòng)科技發(fā)展。
3深度學(xué)習(xí)模型
深度學(xué)習(xí)模型實(shí)際上是一個(gè)包含多個(gè)隱藏層的神經(jīng)網(wǎng)絡(luò),目前主要有卷積神經(jīng)網(wǎng)絡(luò),深深度置信神經(jīng)網(wǎng)絡(luò),循環(huán)神經(jīng)網(wǎng)絡(luò)。
1)卷積神經(jīng)網(wǎng)絡(luò)
在機(jī)器學(xué)習(xí)領(lǐng)域,卷積神經(jīng)網(wǎng)絡(luò)屬于前饋神經(jīng)網(wǎng)絡(luò)的一種,神經(jīng)元不再是全連接的模式,而是應(yīng)用了局部感受區(qū)域的策略。然而傳統(tǒng)的神經(jīng)網(wǎng)絡(luò)使用神經(jīng)元間全連接的網(wǎng)絡(luò)結(jié)構(gòu)來(lái)處理圖像任務(wù),因此,出現(xiàn)了很多缺陷,導(dǎo)致模型⑹急劇增加,及其容易過(guò)擬合。
在卷積神經(jīng)網(wǎng)絡(luò)中,網(wǎng)絡(luò)中的神經(jīng)元只與前一層的部分神經(jīng)元連接,利用圖像數(shù)據(jù)的空間結(jié)構(gòu),鄰近像素間具有更強(qiáng)的相關(guān)性,單個(gè)神經(jīng)元僅對(duì)局部信息進(jìn)行響應(yīng),相鄰神經(jīng)元感受區(qū)域存在重疊,因此,綜合所有神經(jīng)元可以得到全局信息的感知。
另外,一個(gè)卷積層中的所有神經(jīng)元均由同一個(gè)卷積核對(duì)不同區(qū)域數(shù)據(jù)響應(yīng)而得到,即共享同一個(gè)卷積核,使得卷積層訓(xùn)練參數(shù)的數(shù)量急劇減少,提高了網(wǎng)絡(luò)的泛化能力。
一般在卷積層后面會(huì)進(jìn)行降采樣操作,對(duì)卷積層提取的特征進(jìn)行聚合統(tǒng)計(jì)。降采樣區(qū)域一般不存在重疊現(xiàn)象。降采樣簡(jiǎn)化了卷積層的輸出信息,進(jìn)一步減少了訓(xùn)練參數(shù)的數(shù)量,增強(qiáng)了網(wǎng)絡(luò)的泛化能力。
卷積神經(jīng)網(wǎng)絡(luò)實(shí)現(xiàn)了局部特征的自動(dòng)提取,使得特征提取與模式分類同步進(jìn)行,適用于處理高分辨率的圖像數(shù)據(jù)。目前,卷積神經(jīng)網(wǎng)絡(luò)在圖像分類、自然語(yǔ)言處理等領(lǐng)域得到廣泛應(yīng)用。
2)深度置信網(wǎng)絡(luò)
深度置信網(wǎng)絡(luò)是一種生成模型,網(wǎng)絡(luò)中有若干隱藏層,同一隱藏層內(nèi)的神經(jīng)元沒有連接,隱藏層間的神經(jīng)元全連接。神經(jīng)網(wǎng)絡(luò)經(jīng)過(guò)“反向運(yùn)行”得到輸入數(shù)據(jù)。
深度置信網(wǎng)絡(luò)可以用做生成模型,通過(guò)前期的逐層無(wú)監(jiān)督學(xué)習(xí),神經(jīng)網(wǎng)絡(luò)可以較好的對(duì)輸入數(shù)據(jù)進(jìn)行描述,然后把訓(xùn)練好的神經(jīng)網(wǎng)絡(luò)看作深度神經(jīng)網(wǎng)絡(luò),最后得到分類任務(wù)的深度神經(jīng)網(wǎng)絡(luò)。
深度置信網(wǎng)絡(luò)可以用于圖像識(shí)別、圖像生成等領(lǐng)域,深度置信網(wǎng)絡(luò)可以進(jìn)行無(wú)監(jiān)督或半監(jiān)督的學(xué)習(xí),利用無(wú)標(biāo)記數(shù)據(jù)進(jìn)行預(yù)訓(xùn)練,提高神經(jīng)網(wǎng)絡(luò)性能。但近幾年由于卷積神經(jīng)網(wǎng)絡(luò)的飛速發(fā)展,深度置信網(wǎng)絡(luò)已經(jīng)很少被提及。
3)循環(huán)神經(jīng)網(wǎng)絡(luò)
循環(huán)神經(jīng)網(wǎng)絡(luò)是一種專門用于處理時(shí)序數(shù)據(jù)的神經(jīng)網(wǎng)絡(luò),它與典型的前饋型神經(jīng)網(wǎng)絡(luò)最大區(qū)別在于網(wǎng)絡(luò)中存在環(huán)形結(jié)構(gòu),隱藏層內(nèi)部的神經(jīng)元是互相連接的,可以存儲(chǔ)網(wǎng)絡(luò)的內(nèi)部狀態(tài),其中包含序列輸入的歷史信息,實(shí)現(xiàn)了對(duì)時(shí)序動(dòng)態(tài)行為的描述。這里的時(shí)序并非僅僅指代時(shí)間概念上的順序,也可以理解為序列化數(shù)據(jù)間的相對(duì)位置。如語(yǔ)音中的發(fā)音順序,某個(gè)英語(yǔ)單詞的拼寫順序等。序列化輸入的任務(wù)都可以用循環(huán)神經(jīng)網(wǎng)絡(luò)來(lái)處理。如語(yǔ)音、視頻、文本等。對(duì)于序列化數(shù)據(jù),每次處理時(shí)輸入為序列中的一個(gè)元素,比如單個(gè)字符、單詞、音節(jié),期望輸出為該輸入在序列數(shù)據(jù)中的后續(xù)元素。循環(huán)神經(jīng)網(wǎng)絡(luò)可以處理任意長(zhǎng)度的序列化數(shù)據(jù)。
循環(huán)神經(jīng)網(wǎng)絡(luò)可以用于機(jī)器翻譯、連寫字識(shí)別、語(yǔ)音識(shí)別等。循環(huán)神經(jīng)網(wǎng)絡(luò)和卷積網(wǎng)絡(luò)結(jié)合,將卷積神經(jīng)網(wǎng)絡(luò)用于檢測(cè)并識(shí)別圖像中的物體,循環(huán)神經(jīng)網(wǎng)絡(luò)用于識(shí)別出物體的名稱為輸入,生成合理的語(yǔ)句,從而實(shí)現(xiàn)對(duì)圖像內(nèi)容的描述。
4深度學(xué)習(xí)應(yīng)用
1)語(yǔ)音識(shí)別
語(yǔ)音識(shí)別技術(shù)主要包括特征提取技術(shù)、模式匹配準(zhǔn)則及模型訓(xùn)練技術(shù)三個(gè)方面。其應(yīng)用領(lǐng)域主要有語(yǔ)音輸入系統(tǒng)、語(yǔ)音控制系統(tǒng)和智能對(duì)話查詢系統(tǒng),語(yǔ)音識(shí)別極大地推動(dòng)了人工智能的快速發(fā)展。1952年Davis等人研究了世界上第一個(gè)能識(shí)別10個(gè)英文數(shù)字發(fā)音的實(shí)驗(yàn)系統(tǒng)。大規(guī)模的語(yǔ)音識(shí)別研究是在20世紀(jì)70年代以后,在小詞匯量、孤立詞的識(shí)別方面取得了實(shí)質(zhì)性的進(jìn)展。2012年,微軟研究院使用深度神經(jīng)網(wǎng)絡(luò)應(yīng)用在語(yǔ)音識(shí)別上將識(shí)別錯(cuò)誤率降低了20%,取得了突破性的進(jìn)展。2015年11月17日,浪潮集團(tuán)聯(lián)合全球可編程芯片巨頭Altera,以及中國(guó)最大的智能語(yǔ)音技術(shù)提供商科大訊飛,共同了一套DNN語(yǔ)音識(shí)別方案。
2)圖像分析
圖像是深度學(xué)習(xí)最早嘗試的應(yīng)用領(lǐng)域。1989年,LeCun和他的同事們就發(fā)表了卷積神經(jīng)網(wǎng)絡(luò)的工作。2012年10月,Hinton和他的兩個(gè)學(xué)生用更深的CNN在ImageNet挑戰(zhàn)上獲得了第一名,使圖像識(shí)別向前躍進(jìn)了一大步。
自2012年以來(lái),深度學(xué)習(xí)應(yīng)用于圖像識(shí)別使得準(zhǔn)確率大大上升,避免了消耗人工特征抽取的時(shí)間,極大地提升了效率,目前逐漸成為主流的圖像識(shí)別與檢測(cè)方法。
篇2
關(guān)鍵詞:人臉識(shí)別技術(shù);病毒管控;人工智能;神經(jīng)網(wǎng)絡(luò)
互聯(lián)網(wǎng)在今天的社會(huì)中發(fā)揮著舉足輕重的作用。如今社會(huì),隨著許多人工智能技術(shù)、網(wǎng)絡(luò)技術(shù)、云計(jì)算等互聯(lián)網(wǎng)技術(shù)不斷發(fā)展,像人臉識(shí)別等技術(shù)的應(yīng)用越來(lái)越廣泛,在控制病毒傳播途徑等場(chǎng)合發(fā)揮了巨大作用,不斷地提高著社會(huì)的安全性和便利性,不僅提高了防控中病毒檢測(cè)效率,也為病毒的控制提供了可靠的技術(shù)方法,能夠及時(shí)發(fā)現(xiàn)和控制公共場(chǎng)所的安全隱患因素,避免對(duì)社會(huì)經(jīng)濟(jì)、居民生活造成破壞,。但目前的人臉識(shí)別等技術(shù)還存在許多缺陷,需要完善和革新,充滿著巨大的潛力和進(jìn)步空間。
1人臉識(shí)別技術(shù)研究意義
人臉識(shí)別技術(shù)是一種生物特征識(shí)別技術(shù),最早產(chǎn)生于上世紀(jì)60年代,基于生理學(xué)、圖像處理、人機(jī)交互及認(rèn)知學(xué)等方面的一種識(shí)別技術(shù)。相比于其他人類特征像指紋識(shí)別、聲紋識(shí)別、虹膜識(shí)別等技術(shù),人臉識(shí)別雖然存在人臉識(shí)別單一性低,且區(qū)分度難度高、易受環(huán)境影響等不足。但是人臉識(shí)別技術(shù)擁有速度快、大范圍群體識(shí)別及非接觸、遠(yuǎn)距離可識(shí)別等優(yōu)勢(shì),都是其他生物識(shí)別識(shí)別技術(shù)所不具備的,而在傳播性強(qiáng)、感染風(fēng)險(xiǎn)大的病毒傳播過(guò)程中,這些顯然是必須要考慮的重要影響因素。通過(guò)將人臉識(shí)別等人工智能技術(shù)引入信息管理系統(tǒng),綜合集成視頻監(jiān)控、圖像處理、深度學(xué)習(xí)和大數(shù)據(jù)等技術(shù),結(jié)合非接觸測(cè)溫、定位等技術(shù),助力病情防控,在一定程度上推動(dòng)病毒病情防控信息化、智能化發(fā)展進(jìn)程??勺鳛榧訌?qiáng)公共場(chǎng)所的人員的體溫實(shí)時(shí)監(jiān)測(cè)、地址信息定位的監(jiān)控管理,規(guī)范公共場(chǎng)所針對(duì)病毒傳播的預(yù)防行為。
2人臉識(shí)別技術(shù)
2.1人臉檢測(cè)技術(shù)
人臉檢測(cè)是自動(dòng)人臉識(shí)別系統(tǒng)中的一個(gè)關(guān)鍵環(huán)節(jié)。早期的人臉識(shí)別研究主要針對(duì)具有較強(qiáng)約束條件的人臉圖象(如無(wú)背景的圖象),往往假設(shè)人臉位置靜止或者容易獲取。人臉檢測(cè)分為前深度學(xué)習(xí)時(shí)期,AdaBoost框架時(shí)期以及深度學(xué)習(xí)時(shí)期。前深度學(xué)習(xí)時(shí)期,人們將傳統(tǒng)的計(jì)算機(jī)視覺算法運(yùn)用于人臉檢測(cè),使用了模板匹配技術(shù),依賴于人工提取特征,然后用這些人工特征訓(xùn)練一個(gè)檢測(cè)器;后來(lái)技術(shù)發(fā)展,在2001年Viola和Jones設(shè)計(jì)了一種人臉檢測(cè)算法,它使用簡(jiǎn)單的Haar-like特征和級(jí)聯(lián)的AdaBoost分類器構(gòu)造檢測(cè)器,檢測(cè)速度較之前的方法有2個(gè)數(shù)量級(jí)的提高,并且保持了很好的精度,稱這種方法為VJ框架。VJ框架是人臉檢測(cè)歷史上第一個(gè)最具有里程碑意義的一個(gè)成果,奠定了基于AdaBoost目標(biāo)檢測(cè)框架的基礎(chǔ),使用級(jí)聯(lián)AdaBoost分類器進(jìn)行目標(biāo)檢測(cè)的思想是:用多個(gè)AdaBoost分類器合作實(shí)現(xiàn)對(duì)候選框的分類,這些分類器組成一個(gè)流水線,對(duì)滑動(dòng)窗口中的候選框圖像進(jìn)行判定,確定檢測(cè)目標(biāo)是人臉還是非人臉。Adaboost框架技術(shù)的精髓在于用簡(jiǎn)單的強(qiáng)分類器在初期快速排除掉大量的非人臉窗口,同時(shí)保證高的召回率,使得最終能通過(guò)所有級(jí)強(qiáng)分類器的樣本數(shù)數(shù)量較少。在深度學(xué)習(xí)時(shí)期,開始將卷積神經(jīng)網(wǎng)絡(luò)應(yīng)用于人臉檢測(cè)領(lǐng)域。研究方向有兩種:一是將適用于多任務(wù)的目標(biāo)檢測(cè)網(wǎng)絡(luò)應(yīng)用于人臉檢測(cè)中;另一種是研究特定的的人臉檢測(cè)網(wǎng)絡(luò)。人臉檢測(cè)技術(shù)具有特殊唯一性和穩(wěn)定性,在現(xiàn)今社會(huì)對(duì)于構(gòu)建居民身份識(shí)別系統(tǒng),病毒傳播防控系統(tǒng),以及計(jì)算機(jī)視覺交互模型的構(gòu)建具有廣泛的應(yīng)用。人臉檢測(cè)技術(shù)不僅作為人臉識(shí)別的首要步驟,也在許多其他領(lǐng)域發(fā)揮巨大影響,如人臉關(guān)鍵點(diǎn)提取、人臉追蹤、基于內(nèi)容的檢索、數(shù)字視頻處理、視頻檢測(cè)、安防監(jiān)控、人證比對(duì)、社交等領(lǐng)域都有重要的應(yīng)用價(jià)值。數(shù)碼相機(jī)、手機(jī)等移動(dòng)端上的設(shè)備已經(jīng)大量使用人臉檢測(cè)技術(shù)實(shí)現(xiàn)成像時(shí)對(duì)人臉的對(duì)焦、圖集整理分類等功能,各種虛擬美顏相機(jī)也需要人臉檢測(cè)技術(shù)定位人臉。評(píng)價(jià)一個(gè)人臉檢測(cè)算法好壞的指標(biāo)是檢測(cè)率和誤報(bào)率,我們定義檢測(cè)率為:算法要求在檢測(cè)率和誤報(bào)率之間盡量平衡,理想的情況是達(dá)到高檢測(cè)率,低誤報(bào)率。
2.2人臉識(shí)別技術(shù)
目前主要流行的人臉識(shí)別技術(shù)包括幾何特征識(shí)別,模型識(shí)別,特征臉識(shí)別和基于深度學(xué)習(xí)/神經(jīng)網(wǎng)絡(luò)的的人臉識(shí)別技術(shù)等。人臉特征識(shí)別主要通過(guò)對(duì)人臉面部結(jié)構(gòu)特征如眼睛、鼻子等五官幾何特點(diǎn)及其相對(duì)位置分布等,生成圖像,并計(jì)算各個(gè)面部特征之間的歐式距離、分布、大小等關(guān)系該方法比較簡(jiǎn)單,反應(yīng)速度快,并且具有魯棒性強(qiáng)等優(yōu)點(diǎn),但是在實(shí)際環(huán)境下使用容易受檢測(cè)的環(huán)境的變化、人臉部表情變化等影響,精度通常不高,細(xì)節(jié)處理上不夠完善。模型識(shí)別技術(shù)主要包括隱馬爾可夫模型、主動(dòng)表象模型、主動(dòng)形狀模型等,識(shí)別率較高,并且對(duì)表情等變化影響較小。特征臉識(shí)別來(lái)源于主成分描述人臉照片技術(shù)(PCA技術(shù)),從數(shù)學(xué)上來(lái)講,特征臉就是人臉的圖像集協(xié)方差矩陣的特征向量。該技術(shù)能有效的顯示人臉信息,效率較高。基于深度學(xué)習(xí)的人臉識(shí)別是獲取人臉圖像特征,并將包含人臉信息的特征進(jìn)行線性組合等,提取人臉圖像的特征,學(xué)習(xí)人臉樣本數(shù)據(jù)的內(nèi)在規(guī)律和表示層次??梢圆捎萌缛龑忧梆丅P神經(jīng)網(wǎng)絡(luò)。BP神經(jīng)網(wǎng)絡(luò)是1986年由Rumelhart和McClelland為首的科學(xué)家提出的概念,是一種按照誤差逆向傳播算法訓(xùn)練的多層前饋神經(jīng)網(wǎng)絡(luò),是應(yīng)用最廣泛的神經(jīng)網(wǎng)絡(luò)模型之一。BP網(wǎng)絡(luò)本質(zhì)上是一種能夠?qū)W量的輸入與輸出之間的映射關(guān)系的輸入到輸出的映射,從結(jié)構(gòu)上講,BP網(wǎng)絡(luò)具有輸入層、隱藏層和輸出層;從本質(zhì)上講,BP算法就是以網(wǎng)絡(luò)誤差平方為目標(biāo)函數(shù)、采用梯度下降法來(lái)計(jì)算目標(biāo)函數(shù)的最小值。BP神經(jīng)網(wǎng)路輸入層有n個(gè)神經(jīng)元節(jié)點(diǎn),輸出層具有m個(gè)神經(jīng)元,隱含層具有k個(gè)神經(jīng)元,采用BP學(xué)習(xí)算法訓(xùn)練神經(jīng)網(wǎng)絡(luò)。BP算法主要包括兩個(gè)階段:向前傳播階段和向后傳播階段。在向前傳播階段,信息從輸入層經(jīng)過(guò)逐級(jí)的變換,傳送到輸出層。這個(gè)過(guò)程也是在網(wǎng)絡(luò)完成訓(xùn)練后正常運(yùn)行時(shí)執(zhí)行。將Xp作為輸入向量,Yp為期望輸出向量則BP神經(jīng)網(wǎng)絡(luò)向前傳播階段的運(yùn)算,得到實(shí)際輸出表達(dá)式為向后傳播階段主要包括兩大步驟:①計(jì)算實(shí)際輸出Op與對(duì)應(yīng)理想輸出Yp之差;②按極小化誤差方法調(diào)整帶權(quán)矩陣。之所以將此階段稱為向后傳播階段,是對(duì)應(yīng)于輸入信號(hào)的正常傳播而言的,因?yàn)樵撾A段都需要收到精度要求進(jìn)行誤差處理,所以也可以稱之為誤差傳播階段。(1)確定訓(xùn)練集。由訓(xùn)練策略選擇樣本圖像作為訓(xùn)練集。(2)規(guī)定各權(quán)值Vij,Wjk和閾值Φj,θk參數(shù),并初始化學(xué)習(xí)率α及精度控制參數(shù)ε。(3)從訓(xùn)練集中取輸入向量X到神經(jīng)網(wǎng)絡(luò),并確定其目標(biāo)輸出向量D。(4)利用上式計(jì)算出一個(gè)中間層輸出H,再用本式計(jì)算出網(wǎng)絡(luò)的實(shí)際輸出Y。(5)將輸出矢量中yk與目標(biāo)矢量中dk進(jìn)行比較,計(jì)算輸出誤差項(xiàng),對(duì)中間層的隱單元計(jì)算出L個(gè)誤差項(xiàng)。(6)最后計(jì)算出各權(quán)值和閾值的調(diào)整量。所以,卷積神經(jīng)網(wǎng)絡(luò)算法是通過(guò)訓(xùn)練人臉特征庫(kù)的方式進(jìn)行學(xué)習(xí)生成,對(duì)不同環(huán)境下不同表現(xiàn)情況的人臉圖像識(shí)別有更高的精確性。
2.3人臉識(shí)別軟件實(shí)現(xiàn)方式
(1)采集人臉數(shù)據(jù)集,然后對(duì)數(shù)據(jù)集進(jìn)行標(biāo)注,對(duì)數(shù)據(jù)進(jìn)行預(yù)處理變成訓(xùn)練格式。(2)部署訓(xùn)練模型,根據(jù)訓(xùn)練算法所需依賴部署電腦環(huán)境。(3)訓(xùn)練過(guò)程,下載預(yù)訓(xùn)練模型,將人臉數(shù)據(jù)集分批次作為輸入開始訓(xùn)練,最終輸出為訓(xùn)練好的模型。(4)部署訓(xùn)練好的模型,捕獲畫面即可對(duì)畫面中的人臉進(jìn)行實(shí)時(shí)檢測(cè)。
3人臉識(shí)別在病毒傳播防控中的應(yīng)用
通過(guò)人臉識(shí)別技術(shù),可以實(shí)現(xiàn)無(wú)接觸、高效率的對(duì)流動(dòng)人員進(jìn)行信息的收集、身份識(shí)別、定位地址信息等操作,大大減少了傳染的可能性,切斷了病毒傳播途徑,大大提高了工作效率。通過(guò)提前收錄人臉信息,采用深度學(xué)習(xí)對(duì)人臉特征模型的訓(xùn)練學(xué)習(xí),即可獲取人臉識(shí)別特征模型,再次驗(yàn)證時(shí)即可實(shí)現(xiàn)人臉識(shí)別和個(gè)人信息快速匹配。AI人工智能幫助人們更好的解放雙手,為人們的生活和工作提供了重要的幫助。本文還提出了在人臉識(shí)別的系統(tǒng)基礎(chǔ)上,可以加入定位系統(tǒng)、測(cè)溫系統(tǒng)等,依托物聯(lián)網(wǎng)技術(shù)和云計(jì)算大數(shù)據(jù),更加優(yōu)化管控系統(tǒng)的效率。病毒傳播防控中人臉識(shí)別系統(tǒng)流程可以概括為圖2。
4結(jié)語(yǔ)
本文研究了一種人臉識(shí)別技術(shù)在病毒傳播管控系統(tǒng)中的應(yīng)用,并分析設(shè)計(jì)了人臉識(shí)別實(shí)時(shí)監(jiān)測(cè)及病毒管控系統(tǒng)的流程,大大提高了信息管理的效率,減弱了傳播風(fēng)險(xiǎn)。作為一門新興技術(shù),目前的人臉識(shí)別技術(shù)還存在著諸多不足之處,像存在環(huán)境光的影響、人臉表情變化、妝容變化、佩戴口罩等都會(huì)影響到系統(tǒng)識(shí)別精度;另外安全問題也引人深思:現(xiàn)今人臉支付方式迅猛發(fā)展,錄入的人臉模型信息數(shù)據(jù)庫(kù)存在有一定的安全風(fēng)險(xiǎn),一旦被不法分子盜取信息后果不堪設(shè)想,所以模型數(shù)據(jù)庫(kù)安全、網(wǎng)絡(luò)安全,也是系統(tǒng)開發(fā)中必須重視的問題。人臉識(shí)別為代表的人工智能技術(shù)的研究,在病毒傳播管控作出重大貢獻(xiàn),依托我國(guó)領(lǐng)先的計(jì)算機(jī)網(wǎng)絡(luò)技術(shù)和5G等技術(shù),加強(qiáng)人工智能技術(shù)與5G通信技術(shù)的結(jié)合,優(yōu)勢(shì)互補(bǔ),以此來(lái)加快大數(shù)據(jù)、人工智能和物聯(lián)網(wǎng)技術(shù)發(fā)展進(jìn)程,對(duì)我國(guó)社會(huì)進(jìn)步,促進(jìn)城市建設(shè)和管理朝著高效、秩序、和諧穩(wěn)定的方向不斷發(fā)展,增強(qiáng)我國(guó)的經(jīng)濟(jì)實(shí)力有著重大價(jià)值和研究意義。
參考文獻(xiàn)
[1]王彥秋,馮英偉.基于大數(shù)據(jù)的人臉識(shí)別方法[J].現(xiàn)代電子技術(shù),2021,44(7):87-90.
[2]李剛,高政.人臉自動(dòng)識(shí)別方法綜述[J].計(jì)算機(jī)應(yīng)用研究,2003,20(8):4-9,40.
[3]馬玉琨,徐姚文.ReviewofPresentationAttackDetectioninFaceRecognitionSystem[J].計(jì)算機(jī)科學(xué)與探索,2021,7(15):1195-1206.
[4]余璀璨,李慧斌.基于深度學(xué)習(xí)的人臉識(shí)別方法綜述[J].工程數(shù)學(xué)學(xué)報(bào),2021,38.
[5]王紅星,胡永陽(yáng),鄧超.基于LBP和ELM的人臉識(shí)別算法研究與實(shí)現(xiàn)[J].河南理工大學(xué)學(xué)報(bào)(自然科學(xué)版),2005.
[6]鐘陳,王思翔,王文峰.面向疫情防控的人臉識(shí)別系統(tǒng)與標(biāo)準(zhǔn)研究[J].信息技術(shù)與標(biāo)準(zhǔn)化,2020,6,11-13,1671-539X.
[6]彭駿,吉綱,張艷紅,占濤.精準(zhǔn)人臉識(shí)別及測(cè)溫技術(shù)在疫情防控中的應(yīng)用[J].軟件導(dǎo)刊,2020,10,1672-7800.
篇3
AI從誕生到現(xiàn)在已經(jīng)有60年的時(shí)間,期間經(jīng)歷兩輪起落,呈階梯式進(jìn)化,走到今天進(jìn)入第三個(gè)黃金期。如果按照其智能科技水平劃分,今天的人工智能尚處在狹義智能向廣義智能進(jìn)階的階段,還是一名不折不扣的“少年”,未來(lái)?yè)碛袩o(wú)限的可能和巨大的上升空間。
AI是一門交叉的學(xué)科:人工智能由不同的技術(shù)領(lǐng)域組成,如機(jī)器學(xué)習(xí)、語(yǔ)言識(shí)別、圖像識(shí)別、自然語(yǔ)言處理等。而同時(shí),它也是一門交叉學(xué)科,屬于自然科學(xué)和社會(huì)科學(xué)的交叉,涉及到哲學(xué)和認(rèn)知科學(xué)、數(shù)學(xué)、神經(jīng)生理學(xué)、心理學(xué)、計(jì)算機(jī)科學(xué)、信息論、控制論、不定性論等學(xué)科。人工智能領(lǐng)域的技術(shù)壁壘是比較高的,并且會(huì)涉及到多學(xué)科協(xié)作的問題,對(duì)任何公司來(lái)說(shuō),想做好人工智能將是一門大工程。未來(lái)不大可能出現(xiàn)一個(gè)公司能包攬整個(gè)人工智能產(chǎn)業(yè)每一個(gè)部分的工作,更可能的模式將是一個(gè)公司專注于一個(gè)相對(duì)細(xì)分的領(lǐng)域,通過(guò)模塊化協(xié)作的形式實(shí)現(xiàn)人工智能領(lǐng)域的不同應(yīng)用。
進(jìn)化史呈階梯狀,以階段突破式為成長(zhǎng)模式:人工智能的發(fā)展經(jīng)歷了兩次黃金和低谷期,
現(xiàn)在正經(jīng)歷著第三個(gè)黃金期。1956年,麥卡賽、明斯基、羅切斯特和申農(nóng)等年輕科學(xué)家在達(dá)特茅斯一起聚會(huì),并首次提出了“人工智能”這一術(shù)語(yǔ),標(biāo)志著人工智能的誕生。第二年,由 Rosenblatt 提出 Perceptron 感知機(jī),標(biāo)志著第一款神經(jīng)網(wǎng)絡(luò)誕生。1970年,因?yàn)橛?jì)算能力沒能突破完成大規(guī)模數(shù)據(jù)訓(xùn)練,人工智能的第一個(gè)黃金期到此結(jié)束。
后直到1982年德普霍爾德神經(jīng)網(wǎng)絡(luò)的提出,人工智能進(jìn)入第二個(gè)黃金期,之后BP算法的出現(xiàn)使大規(guī)模神經(jīng)網(wǎng)絡(luò)訓(xùn)練成為可能,人工智能的發(fā)展又一次進(jìn)入。1990年,因?yàn)槿斯ぶ悄苡?jì)算機(jī)和DARPA沒能實(shí)現(xiàn),政府撤資,人工智能又一次進(jìn)入低估。2006年,隨著“深度學(xué)習(xí)”神經(jīng)網(wǎng)絡(luò)取得突破性進(jìn)展,人工智能又一次進(jìn)入黃金時(shí)期。
AI將由狹義智能向廣義智能進(jìn)化,雖然人工智能的誕生已經(jīng)有60年的時(shí)間但如果把它比喻成一個(gè)人的話,當(dāng)前的他應(yīng)該還未成年。按照人工智能的“智能”程度,可以將其分成狹義智能、廣義智能、超級(jí)智能三個(gè)大的發(fā)展階段,現(xiàn)階段的圖像與語(yǔ)音識(shí)別水平標(biāo)志著人類已經(jīng)基本實(shí)現(xiàn)狹義智能,正在向廣義智能的階段邁進(jìn)。
狹義智能:即當(dāng)前的技術(shù)已經(jīng)實(shí)現(xiàn)的智能水平,包括計(jì)算智能與感知智能兩個(gè)子階段,計(jì)算智能指的機(jī)器開始具備計(jì)算與傳遞信息的功能,感知智能指機(jī)器開始具備“眼睛”和“耳朵”,即具備圖像識(shí)別與語(yǔ)音識(shí)別的能力,并能以此為判斷采取一些行動(dòng)。
廣義智能:指的是機(jī)器開始具備認(rèn)知能力,能像人類一樣獲取信息后主動(dòng)思考并主動(dòng)采取行動(dòng)。在這個(gè)階段,機(jī)器可以全面輔助或代替人類工作。
超級(jí)智能:這個(gè)階段的機(jī)器幾乎在所有領(lǐng)域都比人類聰明,包括科學(xué)創(chuàng)新、通識(shí)和社交技能等。這個(gè)階段目前離我們還比較遙遠(yuǎn),到時(shí)候人類的文明進(jìn)步和跨越或許將有賴于機(jī)器,而機(jī)器人意識(shí)的倫理問題也許將在這個(gè)階段成為主要問題。
推薦引擎及協(xié)同過(guò)濾可以分析更多的數(shù)據(jù)
智能助手并不只局限于Siri等手機(jī)語(yǔ)音助手。微軟率先在win10 系統(tǒng)中加入個(gè)人智能助理Cortana,標(biāo)志著個(gè)人PC端智能助理的出現(xiàn);圖靈機(jī)器人以云服務(wù)的方式進(jìn)入海爾智能家居、博世m(xù)ySPIN車載系統(tǒng),預(yù)示著多場(chǎng)景人工智能解決方案的潮流。初步實(shí)現(xiàn)人機(jī)交互的智能助手系統(tǒng),已經(jīng)被應(yīng)用于智能客服、聊天機(jī)器人、家用機(jī)器人、微信管理平臺(tái)、車載系統(tǒng)、智能家居系統(tǒng)、智能手機(jī)助理等多個(gè)軟硬件領(lǐng)域。
垂直類網(wǎng)站及社交平臺(tái)可以借助智能助手系統(tǒng)打造高專業(yè)度的“在線專家”以提升平臺(tái)價(jià)值;企業(yè)可以借助以“語(yǔ)義識(shí)別”為基礎(chǔ)的智能助手系統(tǒng),打造智能客服,效率遠(yuǎn)高于傳統(tǒng)的以“關(guān)鍵詞對(duì)應(yīng)”為技術(shù)支持的客服系統(tǒng)。
推薦引擎,是主動(dòng)發(fā)現(xiàn)用戶當(dāng)前或潛在需求,并主動(dòng)推送信息給用戶的信息網(wǎng)絡(luò)。挖掘用戶的喜好和需求,主動(dòng)向用戶推薦其感興趣或者需要的對(duì)象。傳統(tǒng)推薦引擎通常利用用戶在平臺(tái)上的歷史記錄進(jìn)行推薦,效率低、匹配度不高。目前隨著大數(shù)據(jù)和深度學(xué)習(xí)技術(shù)的推進(jìn),推薦引擎及協(xié)同過(guò)濾可以分析更多的數(shù)據(jù),乃至全網(wǎng)數(shù)據(jù),并模擬用戶的需求,真正達(dá)到按需推薦。全球最大的正版流媒體音樂服務(wù)平臺(tái)Spotify也利用卷積神經(jīng)網(wǎng)絡(luò)參與建設(shè)其音樂推薦引擎;谷歌也提出利用深度學(xué)習(xí)方法來(lái)學(xué)習(xí)標(biāo)簽進(jìn)行推薦建設(shè)。出品紙牌屋的全球最大在線影片租賃公司Netflix 也利用深度學(xué)習(xí)網(wǎng)絡(luò)分析客戶消費(fèi)的大數(shù)據(jù),還計(jì)劃構(gòu)建一個(gè)在AWS云上的以GPU為基礎(chǔ)的神經(jīng)網(wǎng)絡(luò)。
“餐廳推薦引擎”Nara,便是一個(gè)利用AI技術(shù)的推薦引擎。在上線之初,Nara 就取得了400萬(wàn)美元的投資。Nara 的數(shù)據(jù)庫(kù)中有超過(guò)100000家餐廳的信息,并利用特有的“Nara神經(jīng)網(wǎng)絡(luò)”,學(xué)習(xí)使用者的偏好,最終達(dá)到“電腦幫你點(diǎn)餐”的目的。
而今年3月22日,國(guó)內(nèi)AI領(lǐng)軍企業(yè)阿里巴巴旗下的阿里云數(shù)加啟動(dòng)“個(gè)性化推薦”引擎對(duì)外公測(cè),該引擎用于幫助創(chuàng)業(yè)者可以快速獲得媲美淘寶天貓的個(gè)性化服務(wù)能力。阿里云數(shù)加上的推薦引擎能夠以更低的成本完成開發(fā),節(jié)省程序量達(dá)到90%,推薦引擎的搭建時(shí)間將由幾個(gè)月縮短到幾天。
對(duì)于不了解算法的人,只能實(shí)現(xiàn)標(biāo)簽規(guī)則類的推薦,但如果要做成機(jī)械化、類似協(xié)同過(guò)濾的算法,創(chuàng)業(yè)公司需要配置大量的算法工程師,人力成本很高。現(xiàn)在用了數(shù)加的推薦引擎,商家只需要做數(shù)據(jù)的ETL加工,推薦的結(jié)果集、訓(xùn)練集都不用處理,只需要調(diào)整參加即可得到推薦結(jié)果。
AI帶給人們新的視覺???
醫(yī)療:為健康診斷和藥品研發(fā)插上高飛的翅膀
健康診斷有望迎來(lái)新紀(jì)元,海量的病歷數(shù)據(jù)和醫(yī)學(xué)界的新研究成果,單靠人工很難及時(shí)篩選并利用,而引入人工智能技術(shù)將充分發(fā)揮這些信息的價(jià)值。例如著名的個(gè)人健康管理產(chǎn)品公司W(wǎng)elltok將 IBM的Watson功能融入旗下產(chǎn)品 CafeWell Concierge APP中,借助 Watson 的認(rèn)知計(jì)算能力理解人類語(yǔ)言,實(shí)現(xiàn)與用戶溝通的能力,從大量數(shù)據(jù)中進(jìn)行分析并為用戶提供健康管理相關(guān)的答案和建議,實(shí)現(xiàn)健康管理、慢病恢復(fù)訓(xùn)練、健康食譜等功能,這一領(lǐng)域的良好前景使 Wellltok公司近年的融資額連創(chuàng)新高。另外,2015年IBM斥資10億美元收購(gòu)醫(yī)療影像與臨床系統(tǒng)提供商Merge,將研究如何實(shí)現(xiàn) Watson的“辨讀”醫(yī)學(xué)影像功能。此外,AI 還可以從醫(yī)療中心獲得的健康數(shù)據(jù),通過(guò)大數(shù)據(jù)分析,實(shí)現(xiàn)根據(jù)分析患者行為來(lái)制定個(gè)性化治療方案的功能。
智能家居:天花板尚遠(yuǎn),AI有望成為核心
行業(yè)天花板尚遠(yuǎn),增速有望保持在 50%左右, 《鋼鐵俠》中的“Jarvis”作為智能管家,除了起到鋼鐵俠的小秘書的作用,還幫主人打理著日常生活,向我們展示了一個(gè)理想中的智能家居系統(tǒng)。雖然我們目前可能離那個(gè)無(wú)所不能的智能管家還很遙遠(yuǎn),但智能家居對(duì)我們生活的變革確實(shí)已經(jīng)開始了。根據(jù)《2012-2020 年中國(guó)智能家居市場(chǎng)發(fā)展趨勢(shì)及投資機(jī)會(huì)分析報(bào)告》的預(yù)測(cè),我國(guó)智能家居市場(chǎng)在 2016年將達(dá)到605.7億的規(guī)模,同比增長(zhǎng)50.15%,到2020年市場(chǎng)規(guī)模將達(dá)到3294億,年均增速將保持在50%左右,具備充足的向上延伸空間。而智能家居想達(dá)到“Jarvis”般的終極效果,必然需要引入AI技術(shù),實(shí)現(xiàn)家居的感應(yīng)式控制甚至自我學(xué)習(xí)能力。
AI有望成為智能家居的核心,實(shí)現(xiàn)家居自我學(xué)習(xí)與控制。按照智能家居的發(fā)展進(jìn)度,大致可以分為四個(gè)階段:手機(jī)控制、多控制結(jié)合、感應(yīng)式控制、系統(tǒng)自我學(xué)習(xí)。當(dāng)前的發(fā)展水平還處在手機(jī)控制向多控制結(jié)合的過(guò)度階段。而從多控制結(jié)合向感應(yīng)式控制甚至自我學(xué)習(xí)階段進(jìn)化時(shí),AI將發(fā)揮主要功能。到今天為止,家居的實(shí)體功能已經(jīng)較為全面,未來(lái)的發(fā)展重點(diǎn)可能在于如何使之升級(jí)改造,實(shí)現(xiàn)家居的自我行為及協(xié)作,因此未來(lái)AI在智能家居領(lǐng)域的應(yīng)用有望成為其核心價(jià)值。AI對(duì)智能家居的重構(gòu)可以深入到方方面面,包括:控制主機(jī)、照明系統(tǒng)、影音系統(tǒng)、環(huán)境監(jiān)控、防盜監(jiān)控、門窗控制、能源管理、空調(diào)系統(tǒng)、花草澆灌、寵物看管等等。
無(wú)人駕駛:政策漸萌芽,AI決定可靠性
優(yōu)點(diǎn)多、動(dòng)機(jī)足、政策漸萌芽。據(jù)麥肯錫的調(diào)查顯示,如果能解放駕駛員的雙手,一輛無(wú)人駕駛汽車內(nèi)的乘客通過(guò)移動(dòng)互聯(lián)網(wǎng)使用數(shù)字媒體服務(wù)的時(shí)間多一分鐘,每年全球數(shù)字媒體業(yè)務(wù)產(chǎn)生的利潤(rùn)將增加 50億歐元。此外,由于自動(dòng)泊車無(wú)須為乘客下車預(yù)留開門空間,使得停車位空間可縮減至少15%。
如果無(wú)人駕駛汽車以及ADAS系統(tǒng)能夠?qū)⑹鹿拾l(fā)生率降低90%,即可挽回全美每年的損失約1千900億美金??梢哉f(shuō)諸多的優(yōu)點(diǎn)使得無(wú)人駕駛技術(shù)的研發(fā)動(dòng)機(jī)還是相當(dāng)充分的,因此未來(lái)無(wú)人駕駛推行的力度應(yīng)該還會(huì)保持在一個(gè)比較高的水平。美國(guó)勒克斯研究公司曾預(yù)計(jì)無(wú)人駕駛汽車的市場(chǎng)規(guī)模在2030年將達(dá)到870億美元。
到目前為止,各國(guó)政府對(duì)于無(wú)人駕駛技術(shù)在政策上的支持正逐步放開,美國(guó)政府在年初剛剛宣布了40億美元的資助計(jì)劃;英國(guó)目前已經(jīng)不需要獲得額外批準(zhǔn)和履約保證即可進(jìn)行實(shí)際道路的無(wú)人駕駛汽車測(cè)試;而德國(guó)也在去年宣布將計(jì)劃設(shè)立無(wú)人駕駛汽車測(cè)試路段,供安裝有駕駛輔助系統(tǒng)或全自動(dòng)駕駛系統(tǒng)車輛行駛;歐盟總部正在就如何修改現(xiàn)行有關(guān)駕駛的法律法規(guī)從而支持自動(dòng)駕駛的發(fā)展展開討論和研究工作;日本也提出要在2020年之前實(shí)現(xiàn)自動(dòng)駕駛汽車方面的立法,并將自動(dòng)駕駛作為 2016年9月七國(guó)集團(tuán)交通部長(zhǎng)會(huì)議的議題。
“無(wú)人汽車大腦”AI的智能程度決定了無(wú)人駕駛的可靠性。由于無(wú)人駕駛完全交由汽車的內(nèi)置程序負(fù)責(zé),因此AI就是無(wú)人汽車的大腦,而測(cè)距儀、雷達(dá)、傳感器、GPS等。設(shè)備都是AI的“眼睛”。AI的智能程度直接決定了無(wú)人駕駛汽車在不同的路況、不同的天氣、甚至一些探測(cè)設(shè)備出現(xiàn)故障的突況下能否及時(shí)做出正確的判斷并靈活調(diào)整行駛策略,最終決定了無(wú)人駕駛汽車當(dāng)前最亟待突破的可靠性。
NVIDIA 在2016年的 CES大會(huì)上了“Drive PX 2”車載計(jì)算機(jī),以及一套與之搭配的具有學(xué)習(xí)功能的自動(dòng)駕駛系統(tǒng)。該系統(tǒng)的亮點(diǎn)在于“自我學(xué)習(xí)”,通過(guò)讓車輛自行分析路面狀況,而不是在數(shù)據(jù)庫(kù)中尋找預(yù)先儲(chǔ)存的策略實(shí)現(xiàn)自動(dòng)駕駛,系統(tǒng)背后連接著名為NVIDIA DIGITS的深度學(xué)習(xí)訓(xùn)練平臺(tái),最終連接到NVIDIA DRIVENET神經(jīng)網(wǎng)絡(luò),為車輛的自我學(xué)習(xí)和完善提供支持。并且由于它是通過(guò)判斷物體的行進(jìn)軌跡而不是物體本身去計(jì)算路徑,因此在駕駛時(shí)受天氣影響較小。
AI 成必爭(zhēng)之地
目前全球AI主戰(zhàn)場(chǎng)依舊在歐美。Venture Scanner的統(tǒng)計(jì)顯示,根據(jù)從事 AI相關(guān)業(yè)務(wù)的公司數(shù)量來(lái)看,目前全球 AI的主戰(zhàn)場(chǎng)還是集中在北美和西歐地區(qū)。美國(guó)數(shù)量最多,達(dá)到450家左右的水平。而中國(guó)從事相關(guān)業(yè)務(wù)的公司數(shù)量還比較少,和俄羅斯、澳洲、部分歐洲國(guó)家及非洲南部國(guó)家水平接近,相比起歐美國(guó)家的AI公司數(shù)量,還有很大的提高空間。
Google:投資未來(lái)的人工智能帝國(guó)
建立Alphabet帝國(guó),具備品牌背書效應(yīng)。2015年,谷歌成立母公司 Alphabet, 搜索、廣告、地圖、App、Youtube、安卓以及與之相關(guān)的技術(shù)基礎(chǔ)部門”仍屬于谷歌,而Calico、Nest、Google Fiber、Google Venture、Google Capital 及 Google X 都將獨(dú)立出來(lái),成為 Alphabet 旗下的獨(dú)立公司。通過(guò)建立 Alphabet集團(tuán),谷歌將不同業(yè)務(wù)的研發(fā)獨(dú)立出來(lái),以子公司的形式進(jìn)行業(yè)務(wù)開展,保留在Google這個(gè)品牌下的基本都是原有的傳統(tǒng)強(qiáng)勢(shì)業(yè)務(wù)。
而其它公司負(fù)責(zé)在各自的領(lǐng)域“打頭陣”,一旦業(yè)務(wù)研發(fā)成功,母公司連帶著google這個(gè)品牌都可以受益,而如果研發(fā)失敗,也不會(huì)公司的品牌造成多大的不良影響,建立了良好的品牌背書效應(yīng)。將機(jī)器學(xué)習(xí)技術(shù)應(yīng)用到所有產(chǎn)品之中,我們不難發(fā)現(xiàn),谷歌近年幾乎將人工智能滲透到了旗下的各類產(chǎn)品中,可謂是全線鋪開。正應(yīng)了谷歌 CEO的那句話:“我們將小心謹(jǐn)慎地將機(jī)器學(xué)習(xí)技術(shù)應(yīng)用到我們所有的產(chǎn)品之中?!备鶕?jù)當(dāng)前Alphabet 的集團(tuán)架構(gòu),我們將涉及到AI應(yīng)用的子公司情況以及相應(yīng)的業(yè)務(wù)開展情況羅列如下:
Nest:從事智能家居生態(tài)系統(tǒng)建設(shè)。2014 年谷歌以32億美元收購(gòu) Nest。Nest 生產(chǎn)智能恒溫器,它能夠?qū)W習(xí)用戶的行為習(xí)慣,并且根據(jù)他們的喜好去調(diào)節(jié)溫度。同時(shí),Nest 也提供火警探測(cè)器和家庭安全攝像頭等智能家居。
Google X:谷歌各類創(chuàng)新技術(shù)的“孵化池”。Google X開展的與AI有關(guān)的項(xiàng)目有:無(wú)人駕駛汽車、Project Wing 無(wú)人機(jī)送貨項(xiàng)目、對(duì)抗帕金森氏癥的 Liftware“反抖”湯匙、用于疾病預(yù)警和健康監(jiān)控的可穿戴設(shè)備、Project Titan 太陽(yáng)能無(wú)人機(jī)項(xiàng)目、以及 Replicant 團(tuán)隊(duì)負(fù)責(zé)的機(jī)器人項(xiàng)目等。
Verily:從事生命科學(xué)業(yè)務(wù),即原來(lái)的 Google Life Science。代表產(chǎn)品有可以收集佩戴者體溫和血液酒精含量等生物數(shù)據(jù)的智能隱形眼鏡,以及監(jiān)控血液中納米粒子的智能腕表。
DeepMind:深度學(xué)習(xí)算法公司。2014年谷歌以4億美元收購(gòu)了DeepMind。
DeepMind的算法源于兩種機(jī)器學(xué)習(xí)方法的結(jié)合:第一種是深度學(xué)習(xí),是受人腦啟發(fā)的一種結(jié)構(gòu)。深度學(xué)習(xí)系統(tǒng)能夠從大量的非結(jié)構(gòu)數(shù)據(jù)中獲取復(fù)雜信息。第二種是增強(qiáng)學(xué)習(xí),靈感源自動(dòng)物大腦中的神經(jīng)遞質(zhì)多巴胺獎(jiǎng)勵(lì)系統(tǒng),算法不斷通過(guò)試錯(cuò)來(lái)進(jìn)行學(xué)習(xí)。目前,DeepMind在深度學(xué)習(xí)上面的研究成果已經(jīng)開始用在谷歌的機(jī)器人項(xiàng)目中。
篇4
關(guān)鍵詞:內(nèi)部威脅;檢測(cè)模型;信息泄露;網(wǎng)絡(luò)安全;
作者:吳良秋
0、引言
隨著大數(shù)據(jù)、云計(jì)算蓬勃發(fā)展,計(jì)算機(jī)相關(guān)產(chǎn)品在我們生活中扮演著重要角色,我們?cè)谙硎艿耐瑫r(shí),信息安全成了不可忽視的安全隱患,數(shù)據(jù)的非法獲取成了互聯(lián)網(wǎng)環(huán)境下的巨大威脅,特別是內(nèi)部威脅,具有一定的透明性,發(fā)生在安全邊界之內(nèi),相對(duì)于外部攻擊更隱蔽,對(duì)整個(gè)網(wǎng)絡(luò)安全環(huán)境提出了嚴(yán)峻挑戰(zhàn)。
美國(guó)防部海量數(shù)據(jù)庫(kù)[1]監(jiān)測(cè)、分析和識(shí)別單位雇員的行為是否給國(guó)防部帶來(lái)危險(xiǎn);2013年斯諾登事件中內(nèi)部人員通過(guò)私人渠道公開內(nèi)部數(shù)據(jù)引起媒體廣泛關(guān)注;2017年3月,Dun&Bradstreet(鄧白氏)的52GB數(shù)據(jù)庫(kù)遭到泄露,這個(gè)數(shù)據(jù)庫(kù)中包括了美國(guó)一些大型企業(yè)和政府組織(包括AT&T,沃爾瑪、WellsFargo,美國(guó)郵政甚至美國(guó)國(guó)防部)的3300多萬(wàn)員工的信息和聯(lián)系方式等;2014年1月,韓國(guó)信用局內(nèi)部員工竊取了2000萬(wàn)銀行和信用卡用戶的個(gè)人數(shù)據(jù),造成韓國(guó)歷史上最嚴(yán)重的數(shù)據(jù)泄露事件,但這只是內(nèi)部威脅安全的冰山一角。SailPoint的調(diào)查顯示,被調(diào)查者中20%的人表示只要價(jià)錢合適會(huì)出賣自己的工作賬號(hào)和密碼。即時(shí)內(nèi)部威脅檢測(cè)系統(tǒng)(ITDS)是一項(xiàng)昂貴而復(fù)雜的工程,但是情報(bào)界,國(guó)防部,公司都在研究相關(guān)檢測(cè)模型。
截止2016年4月公安部部署打擊整治網(wǎng)絡(luò)侵犯公民個(gè)人信息犯罪專項(xiàng)行動(dòng)以來(lái),全國(guó)公安機(jī)關(guān)網(wǎng)絡(luò)安全保衛(wèi)部門已經(jīng)查破刑事案件1200余起,抓獲犯罪嫌疑人3300余人,其中銀行、教育、電信、快遞、證券、電商網(wǎng)站等行業(yè)內(nèi)部人員270余人[2]。
國(guó)內(nèi)外內(nèi)部威脅事件不斷發(fā)生,內(nèi)部威脅應(yīng)對(duì)形式嚴(yán)峻,需要社會(huì)各界的高度重視,首要工作是分析內(nèi)部威脅的特征,從而研究可能的應(yīng)對(duì)方案。
1、內(nèi)部威脅的產(chǎn)生
1.1、相關(guān)術(shù)語(yǔ)
內(nèi)部威脅,一般存在于某一個(gè)企業(yè)或組織的內(nèi)部,內(nèi)部的人員與外界共同完成對(duì)團(tuán)隊(duì)信息的盜竊和交易。
定義1內(nèi)部威脅攻擊者一般是指企業(yè)或組織的員工(在職或離職)、承包商以及商業(yè)伙伴等,其應(yīng)當(dāng)具有組織的系統(tǒng)、網(wǎng)絡(luò)以及數(shù)據(jù)的訪問權(quán)。
內(nèi)部人外延是指與企業(yè)或組織具有某種社會(huì)關(guān)系的個(gè)體,如在職員工,離職員工,值得注意的是承包商與商業(yè)伙伴擴(kuò)展了內(nèi)部人的范圍,即“合伙人”也是潛在的內(nèi)部攻擊者;內(nèi)涵則是具有系統(tǒng)訪問權(quán)。
定義2內(nèi)部威脅是指內(nèi)部威脅攻擊者利用合法獲得的訪問權(quán)對(duì)組織信息系統(tǒng)中信息的機(jī)密性、完整性以及可用性造成負(fù)面影響的行為。
內(nèi)部威脅的結(jié)果是對(duì)數(shù)據(jù)安全造成了破壞,如機(jī)密性(如數(shù)據(jù)竊取)、完整性(如數(shù)據(jù)篡改)以及可用性(如系統(tǒng)攻擊)等。
企業(yè)或者組織信息化程度已經(jīng)深入日常管理,盡管企業(yè)或組織努力保護(hù)自身數(shù)據(jù),但身份盜竊、數(shù)據(jù)庫(kù)泄露和被盜密碼問題仍然是企業(yè)組織面臨的主要挑戰(zhàn)。如今,組織面臨的最大挑戰(zhàn)之一是內(nèi)部人士的系統(tǒng)濫用,他們的行為深深植根于不遵守監(jiān)管標(biāo)準(zhǔn)。已經(jīng)確定,信息安全防御中最薄弱的環(huán)節(jié)是人,這意味著最嚴(yán)重的威脅來(lái)自內(nèi)部人員。
因此,內(nèi)部威脅產(chǎn)生,主要有兩方面原因:(1)主體原因,即攻擊者有攻擊的能力,行為完成一次攻擊;(2)客體原因,一次攻擊能成功都是因?yàn)楸还魧?duì)象存在漏洞或者缺乏監(jiān)管。
1.2、內(nèi)部威脅的分類
內(nèi)部威脅[3]有三種主要的分類:偶然的、惡意的和非惡意的。
偶然的威脅通常是由錯(cuò)誤引起的。例如,由于粗心大意、對(duì)政策的漠視、缺乏培訓(xùn)和對(duì)正確的事情的認(rèn)識(shí),員工可能不會(huì)遵循操作流程。惡意的威脅是指故意破壞組織或使攻擊者受益。例如,信息技術(shù)(IT)管理員因心懷不滿而破壞IT系統(tǒng),使組織陷入停頓。在許多事件中,當(dāng)前和以前的管理員都是因各種動(dòng)機(jī)故意造成系統(tǒng)問題。非惡意的威脅是人們故意采取的行動(dòng),而不打算破壞組織。在非惡意威脅中,其動(dòng)機(jī)是提高生產(chǎn)力,而錯(cuò)誤的發(fā)生是由于缺乏培訓(xùn)或?qū)φ?、程序和風(fēng)險(xiǎn)的認(rèn)識(shí)。
1.3、內(nèi)部威脅特征
⑴高危性內(nèi)部威脅危害較外部威脅更大,因?yàn)楣粽呔哂薪M織知識(shí),可以接觸核心資產(chǎn)(如知識(shí)產(chǎn)權(quán)等),從而對(duì)組織經(jīng)濟(jì)資產(chǎn)、業(yè)務(wù)運(yùn)行及組織信譽(yù)進(jìn)行破壞以造成巨大損失。如2014年的美國(guó)CERT的網(wǎng)絡(luò)安全調(diào)查顯示僅占28%的內(nèi)部攻擊卻造成了46%的損失。
⑵隱蔽性由于攻擊者來(lái)自安全邊界內(nèi)部,所以內(nèi)部威脅具有極強(qiáng)的偽裝性,可以逃避現(xiàn)有安全機(jī)制的檢測(cè)。
⑶透明性攻擊者來(lái)自安全邊界內(nèi)部,因此攻擊者可以躲避防火墻等外部安全設(shè)備的檢測(cè),導(dǎo)致多數(shù)內(nèi)部攻擊對(duì)于外部安全設(shè)備具有透明性.
⑷復(fù)雜性(1)內(nèi)外勾結(jié):越來(lái)越多的內(nèi)部威脅動(dòng)機(jī)與外部對(duì)手關(guān)聯(lián),并且得到外部的資金等幫助;(3)合伙人:商業(yè)合作伙伴引發(fā)的內(nèi)部威脅事件日益增多,監(jiān)控對(duì)象群體擴(kuò)大;(3)企業(yè)兼并:當(dāng)企業(yè)發(fā)生兼并、重組時(shí)最容易發(fā)生內(nèi)部威脅,而此時(shí)內(nèi)部檢測(cè)難度較大;(4)文化差異:不同行為人的文化背景會(huì)影響其同類威脅時(shí)的行為特征。
2、內(nèi)部威脅模型
學(xué)界曾經(jīng)對(duì)內(nèi)部威脅提出過(guò)諸多的行為模型,希望可以從中提取出行為模式,這部分主要的工作開始于早期提出的SKRAM模型與CMO模型,兩個(gè)模型都從內(nèi)部攻擊者的角度入手,分析攻擊者成功實(shí)施一次攻擊所需要具備的要素,其中的主觀要素包括動(dòng)機(jī)、職業(yè)角色具備的資源訪問權(quán)限以及技能素養(yǎng),客觀要素則包括目標(biāo)的內(nèi)部缺陷的訪問控制策略以及缺乏有效的安全監(jiān)管等。
根據(jù)內(nèi)部威脅產(chǎn)生的原因,內(nèi)部威脅的模型也可分為兩類:基于主體和基于客體。其中基于主體模型主要代表有CMO模型和SKRAM模型,這也是最早的內(nèi)部威脅模型。
2.1、基于主體的模型
CMO模型[4]是最早用于內(nèi)部攻擊的通用模型,這都是單純從攻擊者的主觀方面建立的模型,沒有考慮到客觀因素,如由于資源所有者內(nèi)部缺陷的訪問控制策略及其缺乏切實(shí)有效的安全監(jiān)管。攻擊者成功實(shí)施一次攻擊主觀方面所需要具備的要素即:(1)能力(Capability),進(jìn)行內(nèi)部攻擊的能力,包括文化層次,技術(shù)水平等能力;(2)動(dòng)機(jī)(Motive),內(nèi)部攻擊的動(dòng)機(jī),有因?yàn)楣ぷ鞑粷M,換取利益等;(2)機(jī)會(huì)(Opportunity),不是每個(gè)人都有機(jī)會(huì)攻擊,有攻擊的能力,也有動(dòng)機(jī),但是還得有合適的機(jī)會(huì)把動(dòng)機(jī)轉(zhuǎn)化人實(shí)際行動(dòng)。
SKRAM模型[5]是Parker等人在早期的CMO模型基礎(chǔ)上進(jìn)行的改進(jìn),即需要具備的要素有:(1)技能(Skills),也即是內(nèi)部攻擊者的能力;(2)知識(shí)(Knowledge),包括內(nèi)部攻擊者的知識(shí)水平,文化素養(yǎng);(3)資源(Resources),職業(yè)角色具備的資源訪問權(quán)限;(4)Authority;(5)動(dòng)機(jī)(Motives)。
Jason等人[6]提出內(nèi)部人員成為了具有攻擊動(dòng)機(jī)的內(nèi)部攻擊者,主觀要素是用戶的自身屬性,主要影響、反映內(nèi)部人的當(dāng)前心理狀態(tài),這些要素主要包括三類:一類是包括內(nèi)部人的人格特征等內(nèi)在心理特征,另一類包括精神病史或違法犯罪史等檔案信息以及現(xiàn)實(shí)中可以表征心理狀態(tài)變化的諸多行為,最后一類則是內(nèi)部人在組織中的職位、能力等組織屬性。
2.2、基于客體的模型
CRBM模型[7](Role-BasedAccessControl)是基于角色訪問控制。通過(guò)擴(kuò)展基于角色的訪問控制模型來(lái)克服內(nèi)部威脅的局限性,引入了CRBM(復(fù)合基于角色的監(jiān)視)方法。CRBM繼承了RBAC的優(yōu)點(diǎn),將角色結(jié)構(gòu)映射為三個(gè):組織角色(OrganizationRole,OR)、應(yīng)用程序角色(ApplicationRole,AR)和操作系統(tǒng)角色(OperatingSystemRole,OSR)。
李殿偉等人[8]將訪問控制與數(shù)據(jù)挖掘相結(jié)合,設(shè)計(jì)了一種基于角色行為模式挖掘的內(nèi)部威脅檢測(cè)模型,提出了一種基于用戶角色行為準(zhǔn)則、行為習(xí)慣與實(shí)際操作行為匹配的內(nèi)部威脅預(yù)警方法。文雨等人[9]提出一種新的用戶跨域行為模式分析方法。該方法能夠分析用戶行為的多元模式,不需要依賴相關(guān)領(lǐng)域知識(shí)和用戶背景屬性,針對(duì)用戶行為模式分析方法設(shè)計(jì)了一種面向內(nèi)部攻擊的檢測(cè)方法,并在真實(shí)場(chǎng)景中的5種用戶審計(jì)日志,實(shí)驗(yàn)結(jié)果驗(yàn)證了其分析方法在多檢測(cè)域場(chǎng)景中分析用戶行為多元模式的有效性,同時(shí)檢測(cè)方法優(yōu)于兩種已有方法:?jiǎn)斡驒z測(cè)方法和基于單一行為模式的檢測(cè)方法。
2.3、基于人工智能的模型
傳統(tǒng)的內(nèi)部威脅檢測(cè)模型主要是基于異常檢測(cè)、基于角色等相關(guān)技術(shù),隨著人工智能的興起,利用機(jī)器學(xué)習(xí)等相關(guān)算法來(lái)建立內(nèi)部威脅模型占據(jù)主要地位。這種模型,建立網(wǎng)絡(luò)用戶的正常行為輪廓,并利用不同的機(jī)器學(xué)習(xí)算法進(jìn)行訓(xùn)練,實(shí)現(xiàn)了檢測(cè)準(zhǔn)確率高的優(yōu)點(diǎn),但是效率較低。
Szymanski[10]等人使用遞歸數(shù)據(jù)挖掘來(lái)描述用戶簽名和監(jiān)視會(huì)話中的結(jié)構(gòu)和高級(jí)符號(hào),使用一個(gè)類SVM來(lái)測(cè)量這兩種特征的相似性。郭曉明[11]等提出一種基于樸素貝葉斯理論的內(nèi)部威脅檢測(cè)模型。通過(guò)分析多用戶對(duì)系統(tǒng)的命令操作行為特征,對(duì)多用戶命令樣本進(jìn)行訓(xùn)練,構(gòu)建樸素貝葉斯分類器。Yaseen等人[12]研究了關(guān)系數(shù)據(jù)庫(kù)系統(tǒng)中的內(nèi)部威脅。介紹知識(shí)圖譜(KG),展示內(nèi)部人員知識(shí)庫(kù)和內(nèi)部人員對(duì)數(shù)據(jù)項(xiàng)的信息量;引入約束和依賴圖(CDG),顯示內(nèi)部人員獲取未經(jīng)授權(quán)知識(shí)的路徑;使用威脅預(yù)測(cè)圖(TPG),顯示內(nèi)部人員每個(gè)數(shù)據(jù)項(xiàng)的威脅預(yù)測(cè)價(jià)值(TPV),當(dāng)內(nèi)部威脅發(fā)生時(shí),TPV被用來(lái)提高警報(bào)級(jí)別。梁禮[13]等人提出基于實(shí)時(shí)告警的層次化網(wǎng)絡(luò)安全風(fēng)險(xiǎn)評(píng)估方法,包含服務(wù)、主機(jī)和網(wǎng)絡(luò)三級(jí)的網(wǎng)絡(luò)分層風(fēng)險(xiǎn)評(píng)估模型,通過(guò)加權(quán)的方式計(jì)算網(wǎng)絡(luò)各層的安全風(fēng)險(xiǎn)值。分別以實(shí)驗(yàn)室網(wǎng)絡(luò)環(huán)境及校園網(wǎng)環(huán)境為實(shí)例驗(yàn)證了方法的準(zhǔn)確性和有效性。
2.4、基于交叉學(xué)科的模型
隨著內(nèi)部威脅的不斷發(fā)展,內(nèi)部威脅的研究領(lǐng)域不斷擴(kuò)展,基于心理學(xué)、社會(huì)學(xué)等方面也出現(xiàn)新的研究思路。
TesleemFagade等人[14]提出了信息安全如何嵌入到組織安全文化中。組織文化被描述為在人、過(guò)程和政策之間保持聯(lián)系的共同價(jià)值觀、行為、態(tài)度和實(shí)踐。建議將安全管理與治理結(jié)合到組織行為和行動(dòng)文化中,這是最有效的。習(xí)慣性行為傳播,通常需要共同努力打破常規(guī)。如果組織想要養(yǎng)成安全行為的習(xí)慣,那么也許一個(gè)與組織安全文化的方向一致的長(zhǎng)期目標(biāo)是一種更好的方法,而不是專注于快速認(rèn)證狀態(tài),然后假設(shè)所有的技術(shù)和人工過(guò)程都是安全的。組織安全文化被定義為被接受和鼓勵(lì)的假設(shè)、態(tài)度和感知,目的是保護(hù)信息資產(chǎn),從而使信息安全的屬性和習(xí)慣得以實(shí)現(xiàn)。
匡蕾[15]采用了基于蜜罐技術(shù)的檢測(cè)模型;B.A.Alahmadi[16]等人對(duì)用戶的網(wǎng)絡(luò)行為建立關(guān)聯(lián),從而檢測(cè)出潛在的內(nèi)部威脅。首先從用戶瀏覽的網(wǎng)頁(yè)中提取出文本信息,建立向量;其次建立詞向量與語(yǔ)言獲得和詞匯計(jì)數(shù),然后通過(guò)建立的Word-LIWC關(guān)系矩陣與已有的LIWC-OCEAN關(guān)系矩陣結(jié)合得到詞向量的關(guān)系矩陣。OCEAN代表大五人格:開放性(Openness)、盡責(zé)性(Conscientiousness)、外傾性(Extraversion)、宜人性(Agreeableness)、情緒穩(wěn)定性(Neuroticism);計(jì)算用戶瀏覽的新網(wǎng)頁(yè)中的詞向量OCEAN值與日常值的歐氏距離,根據(jù)距離的大小判定行為的異常。
3、內(nèi)部威脅常用數(shù)據(jù)集
目前有很多公開的數(shù)據(jù)集,如:KDD99數(shù)據(jù)集,SEA數(shù)據(jù)集、WUIL數(shù)據(jù)集和CERT-IT數(shù)據(jù)集,表1對(duì)主要數(shù)據(jù)集進(jìn)行了對(duì)比。
⑴KDD99數(shù)據(jù)集:KDD99[17](DataMiningandKnowledgeDiscovery),記錄4,898,431條數(shù)據(jù),每條數(shù)據(jù)記錄包含41個(gè)特征,22種攻擊,主要分為以下四類攻擊:拒絕服務(wù)攻擊(denialofservice,DoS)、遠(yuǎn)程到本地的攻擊(remotetolocal,R2L)用戶到遠(yuǎn)程的攻擊(usertoremote,U2R)和探測(cè)攻擊(probing)。
Putchala[18]將GRU應(yīng)用于物聯(lián)網(wǎng)領(lǐng)域的入侵檢測(cè),在KDD99數(shù)據(jù)集上進(jìn)行實(shí)驗(yàn),得到的準(zhǔn)確率高于99%?;诰矸e神經(jīng)網(wǎng)絡(luò)的入侵檢測(cè)算法在KDD99的實(shí)驗(yàn)下,比經(jīng)典BP神經(jīng)網(wǎng)絡(luò)和SVM算法有提高。
⑵SEA數(shù)據(jù)集:SEA數(shù)據(jù)集涵蓋70多個(gè)UNIX系統(tǒng)用戶的行為日志,這些數(shù)據(jù)來(lái)自于UNIX系統(tǒng)acct機(jī)制記錄的用戶使用的命令。SEA數(shù)據(jù)集中每個(gè)用戶都采集了15000條命令,從用戶集合中隨機(jī)抽取50個(gè)用戶作為正常用戶,剩余用戶的命令塊中隨機(jī)插入模擬命令作為內(nèi)部偽裝者攻擊數(shù)據(jù)。
⑶WUIL數(shù)據(jù)集:WUIL數(shù)據(jù)集通過(guò)借助Windows的審計(jì)工具,他們實(shí)驗(yàn)記錄20個(gè)用戶的打開文件/目錄的行為,每條記錄包含事件ID、事件時(shí)間以及事件對(duì)象及其路徑信息(如文件名與文件路徑)。
⑷CERT-IT數(shù)據(jù)集:CERT-IT(InsiderThreat)數(shù)據(jù)集[19]來(lái)源于卡耐基梅隆大學(xué)(CarnegieMellonUniversity)的內(nèi)部威脅中心,該中心由美國(guó)國(guó)防部高級(jí)研究計(jì)劃局(DARPA)贊助,與ExactData公司合作從真實(shí)企業(yè)環(huán)境中采集數(shù)據(jù)構(gòu)造了一個(gè)內(nèi)部威脅測(cè)試集。該中心迄今為止最富有成效的內(nèi)部威脅研究中心,其不僅建立了2001年至今的700多例內(nèi)部威脅數(shù)據(jù)庫(kù),還基于豐富的案例分析不同內(nèi)部威脅的特征,提出了系統(tǒng)破壞、知識(shí)產(chǎn)權(quán)竊取與電子欺詐三類基本的攻擊類型,由此組合形成復(fù)合攻擊以及商業(yè)間諜攻擊;此外CERT還建立了內(nèi)部威脅評(píng)估與管理系統(tǒng)MERIT用于培訓(xùn)安全人員識(shí)別、處理內(nèi)部威脅。CERT完整數(shù)據(jù)集有80G,全部以csv格式記錄用戶行為,包括文件訪問權(quán)限、文件各種屬性以及用戶對(duì)文件的增刪改查、Email收發(fā)、移動(dòng)存儲(chǔ)設(shè)備、打印機(jī)等硬件設(shè)備使用記錄、HTTP訪問及系統(tǒng)登錄、工作崗位及工作部門等信息。CERT數(shù)據(jù)集提供了用戶全面的行為觀測(cè)數(shù)據(jù)以刻畫用戶行為模型。
⑸MasqueradingUserData數(shù)據(jù)集:MasqueradingUserData[20],模擬真是用戶入侵系統(tǒng)。整個(gè)數(shù)據(jù)集由50個(gè)文件組成,每個(gè)文件對(duì)應(yīng)一個(gè)用戶。該文件包含100行和50列,每一列對(duì)應(yīng)于50個(gè)用戶中的一個(gè)。每一行對(duì)應(yīng)一組100個(gè)命令,從命令5001開始,以命令15000結(jié)束。文件中的條目是0或1。0代表相應(yīng)的100個(gè)命令沒有受到感染。狀態(tài)1代表它們被感染了。
⑹其他數(shù)據(jù)集:Mldata[21]數(shù)據(jù)集包含了869個(gè)公開的數(shù)據(jù)集,主要是基于機(jī)器學(xué)習(xí)的數(shù)據(jù),包含視頻流和鍵值集群和服務(wù)度量的Linux內(nèi)核統(tǒng)計(jì)數(shù)據(jù)、HDF5等。
表1常用數(shù)據(jù)集比較
表1常用數(shù)據(jù)集比較
4、展望
隨著網(wǎng)絡(luò)系統(tǒng)不斷龐大,互聯(lián)網(wǎng)技術(shù)不斷更新,防范網(wǎng)絡(luò)攻擊需要綜合網(wǎng)絡(luò)測(cè)量、網(wǎng)絡(luò)行為分析、網(wǎng)絡(luò)流量異常檢測(cè)及相關(guān)檢測(cè)模型在處理數(shù)據(jù)時(shí)的最新研究成果,并且還需要有能力分析國(guó)內(nèi)外各種最新網(wǎng)絡(luò)態(tài)勢(shì)。內(nèi)部威脅的傳統(tǒng)檢測(cè)方法在模型的特征抽取和模版匹配有一定的局限性,隨著人工智能、云計(jì)算、大數(shù)據(jù)等新技術(shù)的成熟,這些前沿技術(shù)在特征抽取和模式匹配時(shí),檢測(cè)效率和準(zhǔn)確率有較大提升,目前內(nèi)部威脅熱門研究方向包括:
4.1、人工智能方向
人工智能已經(jīng)日趨成熟,各行各業(yè)都在融合人工智能、機(jī)器學(xué)習(xí)等相關(guān)算法技術(shù),在內(nèi)部威脅檢測(cè)領(lǐng)域也是一個(gè)熱點(diǎn)。
利用當(dāng)前互聯(lián)網(wǎng)領(lǐng)域前沿的數(shù)據(jù)分析技術(shù)、克隆技術(shù)、神經(jīng)網(wǎng)絡(luò)算法、人工智能算法等,在數(shù)據(jù)采集、身份認(rèn)證、日志管理、漏洞檢測(cè)、操作審計(jì)環(huán)節(jié)上改進(jìn),從而大力提高檢測(cè)的質(zhì)量和效率。
4.2、云平臺(tái)方向
篇5
關(guān)鍵詞:消費(fèi)意圖識(shí)別;查詢商業(yè)意圖識(shí)別;消費(fèi)意圖模板;社會(huì)媒體
中圖分類號(hào):TP391.41 文獻(xiàn)標(biāo)識(shí)號(hào):A 文章編號(hào):2095-2163(2015)04-
Consumption Intent Recognition for Social Media: Task, Challenge and Opportunity
FU Bo, LIU Ting
(Research Center for Social Computing and Information Retrieval, Harbin Institute of Technology, Harbin 150001,China)
Abstract: Social media is the platform where people freely share with each other information such as comments, experiences, and an opinion. Among the large amount of posts, some may reveal the users' underlying commercial intention (CI). The consumption intent is a desire or hope for something to purchase. For instance, a post like “Please recommend for me a Nokia mobile phone about 2,000 RMB” may indicate an immediate or future purchase. Such information is valuable for better advertisement services. The paper introduces the problems this task try to resolve, the main challenges of this task, representative emerging work related to this task. After that, the paper proposes several directions that are worth exploring in future.
Keywords: Consumption Intent; Query Commercial Intent; Consumption Intent Pattern; Social Media
0 研究背景
近年來(lái),網(wǎng)絡(luò)數(shù)據(jù)資源呈現(xiàn)幾何式、爆炸式增長(zhǎng),巨量的網(wǎng)絡(luò)數(shù)據(jù)中蘊(yùn)含著大量的用戶的,對(duì)諸如產(chǎn)品購(gòu)買等有價(jià)值的行為信息及個(gè)性化需求信息,這些關(guān)于產(chǎn)品類的信息需求表達(dá)了人們的各種消費(fèi)意愿和消費(fèi)需求。例如,Google、Baidu等搜索引擎查詢?nèi)罩居涗浟巳藗儚幕ヂ?lián)網(wǎng)搜索所需產(chǎn)品的信息;Twitter、新浪微博等社會(huì)化媒體平臺(tái)的時(shí)尚性、廣泛性和互動(dòng)性能幫助人們即時(shí)所需產(chǎn)品的信息;京東商城、淘寶網(wǎng)等電商網(wǎng)站記錄了用戶瀏覽和購(gòu)買行為。只有充分了解利用用戶的信息和需求,才能做到有的放矢。互聯(lián)網(wǎng)各種不同的媒體上存儲(chǔ)了大量用戶資料、用戶之間的社交關(guān)系以及用戶的行為數(shù)據(jù),如表1所示。
可以看出,各種不同媒體中所積累的海量用戶信息為構(gòu)建新的社會(huì)化應(yīng)用,以及理解人們當(dāng)前和潛在的消費(fèi)需求帶來(lái)了前所未有的新機(jī)遇。在如此龐大用戶基數(shù)的支撐下,互聯(lián)網(wǎng)的巨大潛力正日益體現(xiàn),與現(xiàn)實(shí)社會(huì)的互動(dòng)滲透更加緊密深入。互聯(lián)網(wǎng)上出現(xiàn)的不同媒體在商業(yè)、生活、政治等各方面,也正發(fā)揮著源自其強(qiáng)大信息傳播的重要作用。截至2014年12月底,我國(guó)網(wǎng)絡(luò)購(gòu)物用戶規(guī)模達(dá)到3.61億,較2013年底增加5 953萬(wàn)人,增長(zhǎng)率為19.7%;我國(guó)網(wǎng)民使用網(wǎng)絡(luò)購(gòu)物的比例從48.9%提升至55.7%。根據(jù)艾瑞咨詢預(yù)測(cè),2017年的網(wǎng)絡(luò)購(gòu)物交易規(guī)模將達(dá)到56 340億元,占社會(huì)消費(fèi)品零售總額的比例為15.7%,較2010年提升12.8個(gè)百分點(diǎn)。特別是在商業(yè)營(yíng)銷上,約有51%的消費(fèi)者在成為企業(yè)品牌的粉絲后,購(gòu)買該品牌商品的意愿也會(huì)相應(yīng)提高5個(gè)百分點(diǎn)??梢哉f(shuō),互聯(lián)網(wǎng)上用戶對(duì)產(chǎn)品的需求與日俱增,并且形式多種多樣。在經(jīng)濟(jì)全球化和信息網(wǎng)絡(luò)化的今天,主動(dòng)掌握個(gè)體興趣偏好和群體消費(fèi)趨勢(shì)等用戶消費(fèi)需求信息,就可以在市場(chǎng)營(yíng)銷、產(chǎn)品計(jì)劃等實(shí)現(xiàn)智能精準(zhǔn)決策,在此背景下,消費(fèi)意圖(Consumption Intent)識(shí)別的相關(guān)技術(shù)應(yīng)運(yùn)而生。
表1 互聯(lián)網(wǎng)不同媒體數(shù)據(jù)和對(duì)應(yīng)的國(guó)內(nèi)外流行站點(diǎn)
Tab.1 Examples of different media and the corresponding domestic and foreign websites
1 任務(wù)
消費(fèi)意圖,是指用戶表達(dá)出的對(duì)購(gòu)買產(chǎn)品服務(wù)等一些商業(yè)消費(fèi)需求的意愿[1]。消費(fèi)意圖識(shí)別技術(shù)是對(duì)帶有消費(fèi)需求色彩的互聯(lián)網(wǎng)用戶生成的文本或用戶本身行為數(shù)據(jù)進(jìn)行的分析和整理,通過(guò)網(wǎng)絡(luò)的方式挖掘出用戶當(dāng)前或潛在的消費(fèi)需求。
面向社會(huì)媒體的消費(fèi)意圖識(shí)別的任務(wù)可以分為基于內(nèi)容的消費(fèi)意圖識(shí)別和基于用戶的消費(fèi)意圖識(shí)別。其中,基于內(nèi)容的消費(fèi)意圖研究包括消費(fèi)模板的抽取、消費(fèi)意圖識(shí)別以及消費(fèi)意圖中的消費(fèi)對(duì)象抽取等。具體地,基于內(nèi)容的消費(fèi)意圖是指導(dǎo)用戶通過(guò)互聯(lián)網(wǎng)與購(gòu)買需求相關(guān)的信息,如:“我想買一部手機(jī),誰(shuí)能給推薦一下嗎”,即是一個(gè)顯式消費(fèi)意圖內(nèi)容,這里的“手機(jī)”即為消費(fèi)對(duì)象;而基于用戶的消費(fèi)意圖則是指一條信息沒有明確的表達(dá)購(gòu)買產(chǎn)品或服務(wù)的意圖,但通過(guò)推理可發(fā)現(xiàn)用戶潛在的商業(yè)需求,間接地表明用戶將來(lái)會(huì)購(gòu)買與母嬰用品相關(guān)的產(chǎn)品或服務(wù)。然而到目前為止,關(guān)于消費(fèi)意圖并沒一個(gè)標(biāo)準(zhǔn)的定義及分類體系。通過(guò)大量的調(diào)研,即可發(fā)現(xiàn)基于內(nèi)容的消費(fèi)意圖文本中有意義的信息主要有觸發(fā)詞語(yǔ)(如“想買”)、消費(fèi)對(duì)象等,而基于用戶的消費(fèi)意圖也會(huì)包含有一些用戶歷史行為。下面本文將逐一介紹目前顯式消費(fèi)意圖識(shí)別研究中的主要任務(wù)和主要實(shí)現(xiàn)技術(shù)。
最初的消費(fèi)意圖識(shí)別任務(wù)源自前人對(duì)帶有消費(fèi)意圖的詞語(yǔ)或模板的分析,如“想買”即是帶有消費(fèi)意圖的模板。隨著互聯(lián)網(wǎng)上大量的帶有消費(fèi)意圖的文本出現(xiàn),研究者們逐漸從簡(jiǎn)單的消費(fèi)意愿的模板的分析研究過(guò)渡到更為復(fù)雜的用戶當(dāng)前需求以及潛在需求的研究?;诖耍凑仗幚斫嵌鹊牟煌?,可分為基于文本內(nèi)容的消費(fèi)意圖識(shí)別和基于用戶的消費(fèi)意圖識(shí)別。其中,前者處理的文本內(nèi)容包括互聯(lián)網(wǎng)上用戶在搜索引擎輸入的單個(gè)查詢、單條微博文本等用戶的內(nèi)容,如微博消費(fèi)意圖文本“想給兒子買個(gè)電動(dòng)挖掘機(jī)”,表明了用戶的消費(fèi)意愿是想為受眾目標(biāo)“兒子”購(gòu)買一臺(tái)“電動(dòng)挖掘機(jī)”的消費(fèi)對(duì)象;后者處理的對(duì)象主要是以用戶為中心,如一個(gè)用戶一直對(duì)母嬰用品有消費(fèi)意圖。按時(shí)消費(fèi)意圖的時(shí)效不同,可分為現(xiàn)實(shí)需求和潛在需求?,F(xiàn)實(shí)需求是指已經(jīng)存在用戶當(dāng)前的需求。潛在需求是指消費(fèi)者雖然有明確意識(shí)的欲望,但由于種種原因還沒有明確的顯示出來(lái)的需求。
2 挑戰(zhàn)
互聯(lián)網(wǎng)用戶的消費(fèi)意圖識(shí)別存在著各種各樣的挑戰(zhàn)。具體地,可將其劃分為三種?,F(xiàn)給出如下論述:
2.1 網(wǎng)絡(luò)數(shù)據(jù)采集的挑戰(zhàn)
互聯(lián)網(wǎng)數(shù)據(jù)形式多樣化,不同媒體平臺(tái)的用戶和內(nèi)容具有異構(gòu)性,因而針對(duì)網(wǎng)絡(luò)數(shù)據(jù)的采集需要就不同類型的內(nèi)容分別進(jìn)行處理,提取有價(jià)值的內(nèi)容信息和用戶行為信息。例如,在線社區(qū)中的用戶信息大部分以超文本標(biāo)記語(yǔ)言(HTML)的網(wǎng)頁(yè)方式展現(xiàn),挖掘基于社區(qū)中的用戶消費(fèi)意圖文本,需要針對(duì)HTML這種非結(jié)構(gòu)化的數(shù)據(jù)精準(zhǔn)地抽取出用戶名、用戶發(fā)貼內(nèi)容等元數(shù)據(jù)信息。而社交媒體網(wǎng)站的數(shù)據(jù)挖掘則需要通過(guò)采集記錄內(nèi)部系統(tǒng)日志來(lái)實(shí)現(xiàn),如Facebook的Scribe。因而,在進(jìn)行消費(fèi)意圖研究的相關(guān)工作中,都首先需要挖掘出不同媒體中的含有消費(fèi)意圖的內(nèi)容或具體行為。
2.2 數(shù)據(jù)稀疏的挑戰(zhàn)
互聯(lián)網(wǎng)上存在著大量的垃圾信息。例如社會(huì)媒體用戶中有33%左右的用戶微博的是自己的狀態(tài)信息,諸如“好無(wú)聊怎么辦”,而僅有8.7%的微博內(nèi)容傳達(dá)了有價(jià)值的信息。由于微博上用戶可以借助個(gè)人習(xí)慣的方式表達(dá)自己的感受,因而在這些有價(jià)值的信息中,微博內(nèi)容信息通常是隨意、零散和有噪聲的。
2.3 跨社區(qū)的挑戰(zhàn)
互聯(lián)網(wǎng)上社會(huì)媒體、論壇、電商網(wǎng)站等迅速發(fā)展,積累了大量的用戶信息,為社會(huì)計(jì)算的相關(guān)研究提供了前所未有的海量數(shù)據(jù)。例如,Ding等人[2]基于微博用戶的消費(fèi)意圖研究電影票房預(yù)測(cè)問題。也有學(xué)者分別研究了用戶評(píng)價(jià)[3]和在線論壇中的用戶[4]消費(fèi)意圖識(shí)別問題。但是這些相關(guān)工作都只關(guān)注面向單個(gè)社區(qū)或社交媒體的消費(fèi)意圖識(shí)別問題,這是因?yàn)椴煌襟w的用戶之間往往沒有顯式的鏈接,就使得一個(gè)媒體中的用戶與其他媒體的用戶之間是無(wú)法進(jìn)行關(guān)聯(lián)的。此外,雖然每個(gè)用戶在不同媒體平臺(tái)上擁有不同的用戶信息,但是這些用戶信息在不同的平臺(tái)之間是非共享的??梢杂^察到,由于不同媒體平臺(tái)在主題以及功能上的不同,用戶的信息碎片化地分布在不同類型的媒體平臺(tái)中。
3 相關(guān)工作
3.1 消費(fèi)意圖模板的抽取
模板(pattern)是自然語(yǔ)言領(lǐng)域中的常見概念,是指從自然語(yǔ)言實(shí)例(如短語(yǔ)、句子等)中泛化而來(lái)的抽象表達(dá)。正因?yàn)槟0遢^之實(shí)例有著更好的概括和泛化能力,因此被廣泛使用于信息抽取、機(jī)器翻譯、自然語(yǔ)言生成等研究中。一個(gè)模板通常包含兩部分,即模板詞(patternwords)和模板槽(pattern slots),其中前者可看作模板的常量部分,后者則是模板的變量部分。例如,對(duì)于模板“想給[x]買個(gè)[y]”,“想給”和“買個(gè)”是模板詞,而“[x]”是模板槽。在模板匹配過(guò)程中,模板詞必須嚴(yán)格匹配,而模板槽可匹配任意內(nèi)容。這里,通過(guò)在模板槽中填充具體內(nèi)容從而生成模板實(shí)例的過(guò)程稱作模板的實(shí)例化(instantiation)。例如,在模板“想買[x]買個(gè)[y]”的前后兩個(gè)槽中分別填充“兒子”和“iPhone6”,便將上述模板實(shí)例化為“想給兒子買個(gè)iPhone6”。顯然,一個(gè)模板可以實(shí)例化為多種不同的實(shí)例。
模板在信息抽取以及自動(dòng)問答中已然獲得十分廣泛的應(yīng)用,因此這兩個(gè)研究方向的許多學(xué)者都曾提出過(guò)模板的抽取方法。與這些方向的研究類似,在消費(fèi)意圖類模板抽取的研究中,一部分學(xué)者使用基于規(guī)則的方法抽取模板。規(guī)則的制定通常要基于一系列的語(yǔ)言分析與預(yù)處理,如詞性標(biāo)注、命名實(shí)體識(shí)別和句法分析等。相應(yīng)地,制定的復(fù)述規(guī)則也包括詞序列規(guī)則、詞性規(guī)則以及句法規(guī)則等形式。有學(xué)者[3,5]基于規(guī)則和基于圖的方法分別獲取意圖模板。在基于圖的方法中,通過(guò)將意圖模板抽取看作為圖上隨機(jī)游走過(guò)程,而且定義的圖節(jié)點(diǎn)將分別為模板節(jié)點(diǎn)和原始內(nèi)容節(jié)點(diǎn),其基本想法是,若模板節(jié)點(diǎn)+原始內(nèi)容節(jié)點(diǎn)仍能出現(xiàn)在原始語(yǔ)料中,則該模板為候選模板,進(jìn)而通過(guò)圖迭代的方法獲取最終模板。依據(jù)這一方法抽取得到的愿望模板可如下所示:
可以看到,基于規(guī)則的方法其缺點(diǎn)在于規(guī)則的可擴(kuò)展性差,人工編寫規(guī)則的工作量大,成本較高。具體來(lái)講,由于人們?cè)谡Z(yǔ)言表述上具有復(fù)雜性和靈活性,規(guī)則的制定過(guò)程費(fèi)時(shí)費(fèi)力且難以覆蓋所有的語(yǔ)言現(xiàn)象。規(guī)則往往依賴于具體語(yǔ)言、領(lǐng)域和文本風(fēng)格,可移植性不好。同時(shí)基于規(guī)則的方法代價(jià)昂貴,且遷移性差,因此越來(lái)越多的研究者開始利用基于統(tǒng)計(jì)的方法來(lái)識(shí)別消費(fèi)意圖。
有研究者基于種子實(shí)例從產(chǎn)品評(píng)價(jià)中抽取產(chǎn)品受眾者,即上述模板中的“[x]”。例如,Wang等人[6]將抽取產(chǎn)品受眾者的模板用于產(chǎn)品推薦系統(tǒng)的目標(biāo)人物抽取環(huán)節(jié)。研究中首先為其產(chǎn)品推薦系統(tǒng)設(shè)計(jì)了一個(gè)受眾人分類體系,然后針對(duì)該體系人工編寫少量“種子”實(shí)例。比如,對(duì)于“I bought my son this phone.”類型的產(chǎn)品評(píng)論,其編寫的種子實(shí)例為“buy somebody something”。該方法利用種子實(shí)例作為輸入,并使用基于boostrapping的方法從產(chǎn)品評(píng)論中匹配該種子實(shí)例的字符串,進(jìn)而生成模板。依據(jù)此方法抽取得到的受眾者模板如下所示:
3.2基于內(nèi)容的消費(fèi)意圖識(shí)別
Goldberg等[3]首次提出了“buy wish”的概念(即本文定義的顯式消費(fèi)意圖,如:想買一部手機(jī))。研究是從用戶在互聯(lián)網(wǎng)上的愿望清單和產(chǎn)品評(píng)論中的內(nèi)容來(lái)識(shí)別其中的消費(fèi)意圖。過(guò)程中,即事先人工給定了一些通用的消費(fèi)意圖規(guī)則模板,比如“I wish for”,而后再利用規(guī)則模板去匹配具有消費(fèi)意圖的句子。這種方法較為簡(jiǎn)單,但基于人工制定模板的匹配方法效果不甚理想,特別是系統(tǒng)的召回率很低。進(jìn)而,作者提出了基于二元圖方法自動(dòng)抽取消費(fèi)意圖模板,如此生成的消費(fèi)意圖模板表達(dá)能力更強(qiáng),使得系統(tǒng)識(shí)別的效果的性能也相對(duì)提高,特別是召回率有了顯著的提升。在此基礎(chǔ)上,作者加入了文本中詞匯作為消費(fèi)意圖識(shí)別的特征。盡管采用詞特征比較簡(jiǎn)單,但是通過(guò)實(shí)驗(yàn)結(jié)果發(fā)現(xiàn)文本中的詞特征對(duì)于消費(fèi)意圖識(shí)別是非常有效的。
Chen和Hsu[4]也提出過(guò)相似的概念“Intention Posts”。研究者基于不同領(lǐng)域間消費(fèi)意圖表達(dá)方式相近的假設(shè),即用于學(xué)習(xí)的訓(xùn)練樣本與新的測(cè)試樣本近似地滿足獨(dú)立同分布的條件。利用這種遷移學(xué)習(xí)(Transfer learning)的思想只需要在一個(gè)領(lǐng)域標(biāo)注數(shù)據(jù),并將其應(yīng)用于一個(gè)新的沒有任何標(biāo)注的目標(biāo)域數(shù)據(jù)。面對(duì)著消費(fèi)意圖文本中表達(dá)意圖的內(nèi)容通常只有一個(gè)或幾個(gè)關(guān)鍵字,同時(shí)數(shù)據(jù)不平衡的問題,作者提出了Co-Class算法 。 首先,利用已有領(lǐng)域的標(biāo)注數(shù)據(jù)構(gòu)建一個(gè)分類器,然后將分類器應(yīng)用到目標(biāo)域的無(wú)標(biāo)注數(shù)據(jù)中。這樣,在目標(biāo)數(shù)據(jù)中便可以重新形成特征選擇,進(jìn)而構(gòu)建新的分類器。這兩個(gè)分類器將共同對(duì)目標(biāo)實(shí)施數(shù)據(jù)分類。這一迭代過(guò)程運(yùn)行即直至類別標(biāo)簽對(duì)目標(biāo)數(shù)據(jù)標(biāo)注不再改變?yōu)橹?。作者分別在四個(gè)領(lǐng)域的語(yǔ)料上進(jìn)行了遷移學(xué)習(xí)的實(shí)驗(yàn),而通過(guò)實(shí)驗(yàn)則證明了提出的Co-class算法對(duì)跨領(lǐng)域遷移學(xué)習(xí)的消費(fèi)意圖識(shí)別任務(wù)是有效的。
Wang等[7]在不同領(lǐng)域的消費(fèi)意圖識(shí)別任務(wù)上展開了相關(guān)研究。研究提出了基于圖的方法來(lái)識(shí)別Twitter中表達(dá)用戶意圖的內(nèi)容。具體來(lái)說(shuō),該方法將要分類的Twitter內(nèi)容和意圖關(guān)鍵詞(如:對(duì)句子“I want to buy an xbox”中“buy an xbox”即為文中定義的意圖關(guān)鍵詞)作為圖上的節(jié)點(diǎn),利用意圖關(guān)鍵詞和Twitter句子之間的關(guān)系形成邊和邊權(quán)重來(lái)構(gòu)建圖,繼而使用圖傳播算法來(lái)完成在不同領(lǐng)域類別上的消費(fèi)意圖分類。此外,Ding等人[2]提出了基于領(lǐng)域自適應(yīng)卷積神經(jīng)網(wǎng)絡(luò)的微博文本消費(fèi)意圖識(shí)別方法,并將此方法應(yīng)用到了電影票房預(yù)測(cè)的任務(wù)上,研究證明,消費(fèi)意圖特征有助于預(yù)測(cè)電影票房,其原因在于用戶對(duì)電影的消費(fèi)意愿能直接反映出用戶購(gòu)票的活躍度。
3.3基于內(nèi)容的消費(fèi)對(duì)象識(shí)別
相比而言,已有研究主要針對(duì)基于內(nèi)容的消費(fèi)意圖進(jìn)行識(shí)別,很少研究消費(fèi)意圖句中的消費(fèi)對(duì)象識(shí)別。本文定義消費(fèi)對(duì)象是指消費(fèi)者提出所需要購(gòu)買的對(duì)象,即某段文本內(nèi)容中所論述的對(duì)象。由于廣告商所關(guān)注的正是用戶針對(duì)某一消費(fèi)對(duì)象的消費(fèi)意圖,而也就是這一存在使得消費(fèi)意圖研究更加突顯其現(xiàn)實(shí)重要意義。但目前針對(duì)消費(fèi)意圖對(duì)象的相關(guān)研究較少。Wang等人[6]提出了從微博中挖掘趨勢(shì)相關(guān)產(chǎn)品的問題。相應(yīng)地即將“趨勢(shì)”定義為在微博上被用戶熱烈討論的話題。例如,如果有人在微博上說(shuō)“最近北京空氣很差”,那么就希望從空氣很差這一趨勢(shì)中,挖掘出空氣凈化器,口罩等與之相關(guān)的產(chǎn)品。
一般而言,現(xiàn)有的研究是從文本內(nèi)容中挖掘產(chǎn)品命名實(shí)體[8-10]或是評(píng)價(jià)對(duì)象[11-14]。這里期望能從產(chǎn)品命名實(shí)體和評(píng)價(jià)對(duì)象抽取的研究中借鑒一些有價(jià)值的和方法,從而對(duì)消費(fèi)對(duì)象抽取研究有所啟發(fā)和促進(jìn)。一方面,事實(shí)上產(chǎn)品命名實(shí)體抽取的研究屬于命名實(shí)體識(shí)別的研究范疇。命名實(shí)體(Named Entity:NE)挖掘,主要是指從文本中挖掘出人名、地名、機(jī)構(gòu)名等。早期命名實(shí)體的研究方法是基于人工規(guī)則的算法。近年來(lái),一些機(jī)器學(xué)習(xí)的方法被應(yīng)用到命名實(shí)體的研究之中。一部分學(xué)者采用基于分布假設(shè)計(jì)算詞義相似度,其基本思想是那些傾向于出現(xiàn)在相似的上下文中的詞意思相近,通過(guò)人工給定一組實(shí)體作為種子,其上下文作為模板并使用迭代的方法獲取了給定目標(biāo)類別下的新實(shí)體。以往的產(chǎn)品命名實(shí)體識(shí)別的研究主要是基于有指導(dǎo)的方法,然而這類方法需要標(biāo)注大規(guī)模的訓(xùn)練語(yǔ)料,由于產(chǎn)品命名實(shí)體中詞匯量比較大,新詞頻繁出現(xiàn),經(jīng)常出現(xiàn)縮略語(yǔ),構(gòu)建足夠訓(xùn)練規(guī)模的產(chǎn)品命名實(shí)體訓(xùn)練集是比較困難的。這個(gè)問題對(duì)于消費(fèi)對(duì)象識(shí)別來(lái)說(shuō)同樣存在,由于社會(huì)媒體中用戶的內(nèi)容隨意,導(dǎo)致消費(fèi)對(duì)象的成分多不完整,通常由縮略語(yǔ)等代替,故而諸如產(chǎn)品型號(hào)類:5s(指iPhone手機(jī)的型號(hào)5s)這種產(chǎn)品型號(hào)邊界未必能夠被識(shí)別出來(lái)。
在情感分析中有研究從評(píng)論中挖掘用戶的評(píng)價(jià)對(duì)象。一般而言,現(xiàn)有的方法將評(píng)價(jià)對(duì)象的范圍限定在名詞或名詞短語(yǔ)的范疇內(nèi),當(dāng)然并非所有的名詞或名詞短語(yǔ)都是評(píng)價(jià)對(duì)象,因而需要對(duì)其進(jìn)行識(shí)別。有研究者基于經(jīng)驗(yàn)性的規(guī)則[12]或關(guān)聯(lián)規(guī)則的方法找出頻繁出現(xiàn)的評(píng)價(jià)對(duì)象[13-14],然后基于經(jīng)驗(yàn)性的剪枝方法從中過(guò)濾錯(cuò)誤的評(píng)價(jià)對(duì)象實(shí)例。還有學(xué)者將評(píng)價(jià)對(duì)象與產(chǎn)品屬性之間關(guān)聯(lián)起來(lái),即認(rèn)為產(chǎn)品屬性可以作為評(píng)價(jià)對(duì)象的一種表達(dá)方式,如對(duì)一個(gè)手機(jī)來(lái)講,“手機(jī)的像素”是手機(jī)的一個(gè)屬性,而“觸屏手機(jī)”是手機(jī)的部件之一。首先,該方法獲取大量的名詞短語(yǔ)作為候選評(píng)價(jià)對(duì)象;繼而采用了某些關(guān)系指示短語(yǔ)(比如“屬性-從性”關(guān)系指示詞:attribute-of)來(lái)獲取評(píng)價(jià)對(duì)象,最后利用候選評(píng)價(jià)對(duì)象和關(guān)系指示短語(yǔ)之間的共現(xiàn)關(guān)系,得出該候選評(píng)價(jià)對(duì)象是否是真正的評(píng)價(jià)對(duì)象。
4 未來(lái)的研究方向
消費(fèi)意圖識(shí)別作為產(chǎn)品推薦和自然語(yǔ)言處理領(lǐng)域的一個(gè)重要方向,還有許多有意義的問題值得研究,其中熱點(diǎn)的研究方向和問題主要包括:
(1)雖然研究者們已經(jīng)提出了多種方法用于消費(fèi)意圖句的識(shí)別、消費(fèi)意圖模板和消費(fèi)對(duì)象識(shí)別等方法。然而總的來(lái)看識(shí)別出的準(zhǔn)確率較低,仍有許多噪聲數(shù)據(jù)無(wú)法過(guò)濾,特別是隱性消費(fèi)意圖識(shí)別鮮有研究。因此接下來(lái)的一個(gè)主要目標(biāo)就是如何找到一種有效的方法對(duì)不同平臺(tái)中的消費(fèi)意圖句進(jìn)行準(zhǔn)確識(shí)別。同時(shí),迫切需要其后的研究者把消費(fèi)意圖識(shí)別的各項(xiàng)任務(wù)做細(xì)、做深。尤其是希望能找到一種對(duì)于各個(gè)平臺(tái)或各個(gè)不同領(lǐng)域都適用的識(shí)別方法。
(2)目前來(lái)看,消費(fèi)意圖識(shí)別的大部分工作都集中在顯式消費(fèi)意圖識(shí)別的研究任務(wù)中。然而與顯式消費(fèi)意圖識(shí)別任務(wù)不同,隱式消費(fèi)意圖識(shí)別的研究任務(wù)也是比較有意義的問題。即在一個(gè)用戶表達(dá)的文本中,挖掘出潛在的購(gòu)買目標(biāo)。這方面的研究工作還比較少且仍未臻深入。此外,相對(duì)于消費(fèi)意圖句的識(shí)別而言,基于用戶消費(fèi)意圖的研究也還未展開,尤其是在跨平臺(tái)上的研究遠(yuǎn)達(dá)到充分和全面。然而總的看來(lái),基于隱式消費(fèi)意圖的研究和基于用戶的消費(fèi)意圖研究方面還有許多的問題有待解決。
(3)消費(fèi)意圖研究中的評(píng)測(cè)問題一直是困擾研究者的一個(gè)主要問題。因此希望廣大研究者們能夠共同努力,推出一套大家都能認(rèn)可和接受的評(píng)測(cè)體系和數(shù)據(jù),這樣定會(huì)極大的促進(jìn)本研究的發(fā)展。本文基于內(nèi)容的消費(fèi)意圖識(shí)別中各類實(shí)驗(yàn)大都采用人工評(píng)測(cè)的方法,基于用戶的消費(fèi)意圖識(shí)別評(píng)價(jià)中采用了自動(dòng)評(píng)價(jià)的方法。由于人工評(píng)測(cè)主觀性強(qiáng)且費(fèi)時(shí)費(fèi)力,因此找到一種消費(fèi)意圖研究的自動(dòng)評(píng)測(cè)方法還是非常有必要的。
(4)消費(fèi)意圖識(shí)別研究在眾多相關(guān)研究中都有很大的應(yīng)用潛力,如有研究是基于消費(fèi)意圖的電影票房預(yù)測(cè)取得了不錯(cuò)的性能。但這方面具體應(yīng)用的例子仍不多。所以在今后的研究中,應(yīng)該積極探索消費(fèi)意圖識(shí)別在各種實(shí)際任務(wù)中的作用,這樣才能更好地推動(dòng)此項(xiàng)研究深入開展。
6 結(jié)束語(yǔ)
社會(huì)媒體是一個(gè)基于用戶關(guān)系的信息分享、傳播以及獲取平臺(tái),并實(shí)現(xiàn)即時(shí)分享。這即使得微博成為一個(gè)嶄新的信息傳播和用戶交互的方式:一方面,人們通過(guò)微博各種消費(fèi)需求信息,向家人、朋友、同事等尋求幫助,期望從朋友中獲得產(chǎn)品的信息;另一方面,越來(lái)越多的用戶也樂于在微博上分享各種感興趣的話題和愛好進(jìn)行即時(shí)分享。因而,迫切需要了解用戶的消費(fèi)意圖或興趣。消費(fèi)意圖識(shí)別作為產(chǎn)品推薦和自然語(yǔ)言處理領(lǐng)域的一個(gè)重要方向,目前的研究還遠(yuǎn)未足夠。因此就需要在已有工作的基礎(chǔ)上進(jìn)一步鉆研,針對(duì)尚且存在的問題展開攻關(guān)。另外,隨著消費(fèi)意圖識(shí)別方法和技術(shù)的逐漸成熟,相應(yīng)研究成果也將更為廣泛地投入到實(shí)際應(yīng)用中去,以促進(jìn)諸如產(chǎn)品推薦、信息抽取、在線廣告以及市場(chǎng)營(yíng)銷等相關(guān)研究的發(fā)展。
參考文獻(xiàn):
[1] B. Fu, T. LIU. Weakly-supervised Consumption Intent Detection in Microblogs [J]. Journal of Computational Information Systems, 2013, 6(9):2423C2431.
[2] X. Ding, T. Liu, J. Duan, et al. Mining User Consumption Intention from Social Media Using Domain Adaptive Convolutional Neural Network [C]// Proceedings of AAAI 2015, Austin, Texas,USA:AAAI,2015: 2389-2395.
[3] J. Ramanand, K. Bhavsar, N. Pedanekar. Wishful Thinking: Finding Suggestions and ‘buy’ Wishes from Product Reviews. [C]// Proceedings of NAACL HLT 2010 Workshop on Computational Approaches to Analysis and Generation of Emotion in Text, Los Angeles, California:ACL, 2010:54C61.
[4] A. Goldberg, N. Fillmore, D. Andrzejewski, et al. May all Your Wishes Come True: A Study of Wishes and How to Recognize Them. [C]// Proceedings of NAACL HLT 2009, Boulder, Colorado:ACL, 2009:263C271.
[5] J. Wang, W. X. Zhao, H. Wei, et al. Mining New Business Opportunities: Identifying Trend Related Products by Leveraging Commercial Intents from Microblogs [C]// Proceedings of EMNLP 2013, Seattle, USA:ACL, 2013:1337C1347.
[6] Z. Chen, B. Liu, M. Hsu, et al. Identifying Intention Posts in Discussion Forums [C]// Proceedings of HLT- NAACL2013, Atlanda, GA, USA:ACL, 2013:1041C1050.
[7] J. Wang, G. Cong, X. W. Zhao, et al. Mining User Intents in Twitter: A Semi-supervised Approach to Inferring Intent Categories for Tweets [C]// Proceedings of AAAI 2015, Austin, Texas, USA:AAAI, 2015: 318-324.
[8] 劉非凡, 趙軍, 呂碧波等. 面向商務(wù)信息抽取的產(chǎn)品命名實(shí)體識(shí)別研究[J].中文信息學(xué)報(bào), 2006, 20(1):7C13.
[9] F. Luo, Q. Qiu, Q. Xiong. Introduction to the Product-entity Recognition Task [C]// Proceedings of Web Society (SWS), 2011 3rd Symposium on, Port Elizabeth, South Africa: Web Society,2011:122C126.
[10] F. Luo, H. Xiao, W. Chang. Product Named Entity Recognition Using Conditional Random Fields [C]// Proceedings of Business Intelligence and Financial Engineering (BIFE) 2011, Wuhan,China:[s.n.],2011:86C89.
[11] Y. Zhao, B. Qin, S. Hu, et al. Generalizing Syntactic Structures for Product Attribute Candidate Extraction [C]// Proceedings of NAACL 2010, Los Angeles, CA:ACL, 2010:377C380.
[12] J. Yi, T. Nasukawa, R. Bunescu, et al. Sentiment Analyzer: Extracting Sentiments about a Given Topic Using Natural Language Processing Techniques [C]// Proceedings of ICDM 2003, Melbourne, Florida, USA:ICDM, 2003:427C434.