孤立點(diǎn)檢測(cè)移動(dòng)通信論文
時(shí)間:2022-01-30 10:18:58
導(dǎo)語(yǔ):孤立點(diǎn)檢測(cè)移動(dòng)通信論文一文來(lái)源于網(wǎng)友上傳,不代表本站觀點(diǎn),若需要原創(chuàng)文章可咨詢客服老師,歡迎參考。
Hawkins給孤立點(diǎn)的定義是:基于數(shù)據(jù)集中及大部分正常數(shù)據(jù)當(dāng)中,孤立點(diǎn)是非常特殊的一部分?jǐn)?shù)據(jù),因?yàn)樗c正常數(shù)據(jù)存在很大的差異性,同時(shí)這些數(shù)據(jù)常表現(xiàn)為不屬于隨機(jī)偏差,而是在不相同的機(jī)制作用下而形成的,存在尤為深遠(yuǎn)的意義?;诰垲愃惴ó?dāng)中,也對(duì)孤立點(diǎn)下了定義,即為:孤立點(diǎn)是數(shù)據(jù)對(duì)象當(dāng)中的噪聲數(shù)據(jù)。通過(guò)孤立點(diǎn)檢測(cè)算法,可以發(fā)現(xiàn)孤立點(diǎn)的行為和正常行為之間存在很大的差異。比如:人的身高數(shù)據(jù)呈現(xiàn)負(fù)數(shù),這極有可能是在記錄數(shù)據(jù)的情況下發(fā)生錯(cuò)誤而形成的孤立點(diǎn);對(duì)于職業(yè)籃球運(yùn)動(dòng)員來(lái)說(shuō),其身高數(shù)據(jù)通常比普通人高,因此被視為孤立點(diǎn),這是因?yàn)閿?shù)據(jù)自身存在的因素所呈現(xiàn)的結(jié)果。孤立點(diǎn)的研究工作極具挑戰(zhàn)性,主要是因?yàn)椋浩湟?,在?shù)據(jù)分析層面,由于孤立點(diǎn)的存在,導(dǎo)致分析結(jié)果會(huì)產(chǎn)生極大的影響。其二,在實(shí)際生產(chǎn)過(guò)程中,孤立點(diǎn)分析能夠?qū)ζ淙〉弥陵P(guān)重要的作用。對(duì)于孤立點(diǎn)的檢測(cè)方法,主要分為兩大類:其一是,基于距離的孤立點(diǎn)檢測(cè)方法,包括基于索引的算法、嵌套循環(huán)算法等;其二是,基于密度的孤立點(diǎn)檢測(cè)方法。其中,對(duì)于基于密度的孤立點(diǎn)檢測(cè)方法來(lái)說(shuō),均是以局部孤立因素的計(jì)算為依據(jù),并且將一些擁有非常高LOF值的數(shù)據(jù)對(duì)象視為孤立點(diǎn)。換而言之,便是此方法是以LOF數(shù)據(jù)為依據(jù),進(jìn)一步對(duì)一個(gè)數(shù)據(jù)是否為孤立點(diǎn)進(jìn)行判斷。
二、孤立點(diǎn)檢測(cè)在移動(dòng)通信數(shù)據(jù)分析上的應(yīng)用探究
2.1實(shí)驗(yàn)數(shù)據(jù)選取。以某無(wú)線通信網(wǎng)絡(luò)公司的實(shí)際通信數(shù)據(jù)作為實(shí)驗(yàn)數(shù)據(jù),通過(guò)孤立點(diǎn)檢測(cè)方法對(duì)這些數(shù)據(jù)集進(jìn)行分析,同時(shí)利用數(shù)據(jù)預(yù)處理功能對(duì)數(shù)據(jù)集進(jìn)行選取,進(jìn)一步從中選擇一部分?jǐn)?shù)據(jù)進(jìn)行實(shí)驗(yàn)。在數(shù)據(jù)預(yù)處理之后,提取路測(cè)數(shù)據(jù),并在路測(cè)數(shù)據(jù)當(dāng)中選取和平均接受電平存在聯(lián)系的屬性,在數(shù)據(jù)的選取上使用的方面為隨機(jī)取樣方法。對(duì)于平均接受電平,主要包括了兩個(gè)屬性,其一為上行鏈路;其二為下行鏈路。它們可當(dāng)作是功率控制及切換過(guò)程的參考依據(jù),參數(shù)取值范圍為(-110dBm,-48dBm),將通信信號(hào)電平數(shù)值向0至63之間的某一個(gè)RXLEV值進(jìn)行映射?;诜沁B續(xù)性發(fā)射的情況下,RXLEV上行鏈路電平屬性為full,下行鏈路電平屬性為SUB。對(duì)于SUB指標(biāo)來(lái)說(shuō),主要的目的是對(duì)特定通話時(shí)隙的均值進(jìn)行測(cè)量;對(duì)于FULL指標(biāo)來(lái)說(shuō),主要測(cè)量的是所用載頻當(dāng)中全部時(shí)隙的均值。因?yàn)橐苿?dòng)用戶提交的測(cè)試報(bào)告當(dāng)中,F(xiàn)ULL指標(biāo)值存在不準(zhǔn)確的缺陷,因此本次研究使用SUB指標(biāo)中的數(shù)據(jù)集作為實(shí)驗(yàn)標(biāo)本。
2.2實(shí)驗(yàn)結(jié)果分析。對(duì)于孤立點(diǎn)檢測(cè)的性能指標(biāo),主要體現(xiàn)在兩個(gè)方面:一方面,準(zhǔn)確性。指的是能夠?qū)嶋H檢測(cè)得出的孤立點(diǎn)所占的比重,度量標(biāo)準(zhǔn)為準(zhǔn)確率。另一方面,處理性能。指的是孤立點(diǎn)檢測(cè)方法進(jìn)行數(shù)據(jù)分析時(shí)的速度。本組試驗(yàn)將孤立點(diǎn)檢測(cè)時(shí)間作為度量標(biāo)準(zhǔn)。對(duì)于實(shí)驗(yàn)結(jié)果,主要通過(guò)檢測(cè)時(shí)間比較與檢測(cè)準(zhǔn)確性進(jìn)行描述。在實(shí)驗(yàn)數(shù)據(jù)方面,分別從數(shù)據(jù)集當(dāng)中以隨機(jī)的方式抽取6組數(shù)據(jù)對(duì)象,且這些數(shù)據(jù)對(duì)象在規(guī)模上呈現(xiàn)逐漸遞增的趨勢(shì),進(jìn)一步采取實(shí)驗(yàn)??芍旱?列說(shuō)明,每組數(shù)據(jù)對(duì)應(yīng)的孤立點(diǎn)檢測(cè)時(shí)間,第3列說(shuō)明被剪枝數(shù)據(jù)所占的比重。利用本次研究孤立點(diǎn)檢測(cè)方法與傳統(tǒng)的以嵌套循環(huán)為基礎(chǔ)的孤立點(diǎn)檢測(cè)方法進(jìn)行比較,兩組檢測(cè)時(shí)間的差異表明,本次研究所使用的檢測(cè)方法,在檢測(cè)性能方面明顯由于傳統(tǒng)檢測(cè)方法;鑒于此,本次實(shí)驗(yàn)有效。
三、結(jié)語(yǔ)
現(xiàn)狀下,大多數(shù)孤立點(diǎn)檢測(cè)技術(shù)還存在一些問(wèn)題較為明顯,比如基于實(shí)時(shí)性方面便存在缺陷,就專業(yè)領(lǐng)域而言,決策者對(duì)該缺陷是無(wú)法接受的,他們希望能夠得到更為新型且精準(zhǔn)度高的決策理論依據(jù)。通過(guò)本課題的探究,認(rèn)識(shí)到有關(guān)孤立點(diǎn)檢測(cè)的一些方法以及孤立點(diǎn)檢測(cè)在移動(dòng)通信數(shù)據(jù)分析上的具體應(yīng)用。筆者認(rèn)為,在未來(lái)研究領(lǐng)域中,需要重點(diǎn)對(duì)孤立點(diǎn)檢測(cè)方法的性能指標(biāo)的提高進(jìn)行研究,同時(shí)也要為決策者提供由檢測(cè)挖掘出來(lái)的有效知識(shí),這樣才能使孤立點(diǎn)檢測(cè)更具實(shí)用價(jià)值,以此為移動(dòng)通信數(shù)據(jù)分析的完善提供幫助。
作者:張凱書(shū)李志剛吳慧芳呂夏蘭單位:湖北郵電規(guī)劃設(shè)計(jì)有限公司