基于數(shù)據(jù)挖掘交通流預(yù)測分析

時間:2022-06-17 05:43:25

導(dǎo)語:基于數(shù)據(jù)挖掘交通流預(yù)測分析一文來源于網(wǎng)友上傳,不代表本站觀點,若需要原創(chuàng)文章可咨詢客服老師,歡迎參考。

基于數(shù)據(jù)挖掘交通流預(yù)測分析

摘要:隨著社會的進步道路交通狀況越來越擁擠,交通擁堵幾乎成為了所有發(fā)達城市所面臨的問題。因此改善交通狀況變得尤為重要。文章旨在從數(shù)據(jù)的角度建立模型,來進行交通流預(yù)測。在閱讀了大量文獻的基礎(chǔ)上,首先對數(shù)據(jù)挖掘技術(shù)的國內(nèi)外研究情況進行基本了解,對所有數(shù)據(jù)進行預(yù)處理。然后通過線性回歸分析,分別研究了單一因素和多因素對交通流預(yù)測的影響,得到各因素的影響因子,建立了模型。并進行了實例分析,結(jié)果擬合良好,驗證了模型的準(zhǔn)確性。最后,對本次模擬進行了總結(jié),為今后的改進方向提供了思路。

關(guān)鍵詞:交通流預(yù)測;線性回歸分析;單一因素分析;多因素分析

基于數(shù)據(jù)挖掘交通流預(yù)測系統(tǒng)研究就是將大量的數(shù)據(jù)運用到交通流預(yù)測模型中,為決策者提供幫助來引導(dǎo)交通系統(tǒng)的暢通。從近幾年國內(nèi)交通治理的情況來看,單純增加交通道路及路面硬化的方法已經(jīng)不可能從根源上解決交通壓力[1]。交通流數(shù)據(jù)采集系統(tǒng)在很長一段時間內(nèi)通過人工和自動數(shù)據(jù)收集、積累了大量數(shù)據(jù),使用數(shù)據(jù)挖掘技術(shù)人們不僅可以存儲歷史數(shù)據(jù),還可以為決策系統(tǒng)和導(dǎo)航系統(tǒng)提供數(shù)據(jù)等等?,F(xiàn)在已經(jīng)有模型應(yīng)用于交通流預(yù)測中。為了提高預(yù)測的精度和可靠性,應(yīng)結(jié)合其他可靠的方法和模型來研究適合我國的交通流預(yù)測模型。智能交通系統(tǒng)研究的目的是使人、車、路與環(huán)境和諧共處[2]。將數(shù)據(jù)挖掘技術(shù)運用到交通流預(yù)測對交通系統(tǒng)的擁堵、交通事故都會有很大的改善。

1方案設(shè)計

1.1數(shù)據(jù)預(yù)處理。數(shù)據(jù)預(yù)處理是數(shù)據(jù)挖掘中一個非常重要的步驟。這個過程可以剔除異常數(shù)據(jù),使得數(shù)據(jù)挖掘的結(jié)果更加準(zhǔn)確。預(yù)處理方法一般包含有數(shù)據(jù)清洗、數(shù)據(jù)變換和數(shù)據(jù)規(guī)約等。它們各自有優(yōu)點和缺點[3]。1.2程序設(shè)計及計算。交通是一個大工程,影響它的因素有許多種。因此,需要從單一因素及多因素分別研究對交通流的影響。1.2.1單一因素對交通流的影響。一個地區(qū)如果要進行土地開發(fā)利用,交通必將是先導(dǎo);反過來一個地區(qū)的交通便捷程度也決定著這個地區(qū)的土地利用率的大小[4]。土地利用是對交通影響最重要的因素之一。因此,本文首先選擇土地利用率作為單一因素,對交通流的影響進行研究。先做散點圖以確定回歸函數(shù)的類型:用Matlab編程得出散點圖,如圖1所示:由圖1知其模擬結(jié)果符合線性回歸,運用回歸分析在Matlab中實現(xiàn)。其殘差圖中存在數(shù)據(jù)對應(yīng)的殘差圖不過0線,因此去掉第16個數(shù)據(jù)后繼續(xù)做回歸。直至所有殘差圖過零線。如圖2。從圖2可知,數(shù)據(jù)可以使用。以此為數(shù)據(jù)庫進行模擬,得到仿真結(jié)果為y=13.8986+78.1208X。其中X為土地利用率。1.2.2其它多因素對交通流的影響。眾所周知交通系統(tǒng)是一個復(fù)雜的系統(tǒng),影響交通流的因素非常之多,道路的寬敞程度、周圍商圈的繁華程度等等。它都影響著交通流,并對經(jīng)濟也有一定的促進作用。交通是一個城市的基本骨架,它伴隨著城市的發(fā)展不斷地演化、擴大;也是社會活動的一個載體,影響著經(jīng)濟的發(fā)展。居民收入也是影響交通流的一個主要因素,經(jīng)濟情況的好轉(zhuǎn),對車輛的購買欲增強,也就是增加了交通流。交通流的影響因素如下表2所示:由圖3知所有的殘差圖均過0線,且顯著性概率為0,因此,回歸效果顯著。仿真結(jié)果為:y=22.4680+5.3205X1+3.9334X2-0.0092X3其中,X1為車道數(shù),X2為當(dāng)?shù)鼐用袷杖?,X3為交通流量。

2實例分析

2.1單一因素驗證。下表是臨泉縣濱河大道近幾年土地利用與交通流之間的關(guān)系,通過上一章所得出的方程來進行數(shù)據(jù)驗證,以此來驗證方程的準(zhǔn)確性。如表3所示:將該表中的數(shù)據(jù)帶入上一章的一元線性回歸模型y=13.8986+78.1208X中進行驗證,得到驗證結(jié)果。并且對于單一因素對交通流影響的預(yù)測值要進行偏移率的計算來測定該方程的合理性及預(yù)測的準(zhǔn)確性,所以驗證結(jié)果和偏移率如下表4所示:在此實驗中,是一元線性回歸模型通過模擬出的散點圖可知道土地利用率與交通流呈線性關(guān)系,通過編程模擬出其殘差圖,根據(jù)結(jié)果繼續(xù)模擬,直到其數(shù)據(jù)都過0線為止,最后得到其回歸方程。通過數(shù)據(jù)驗證及偏移率數(shù)值分析,其符合結(jié)果。2.2多因素驗證。下表是濱河大道多種因素與交通流之間的關(guān)系,如表5所示:將該表中的數(shù)據(jù)代入上一章的多元線性回歸模型y=22.4680+5.3205X1+3.9334X2-0.0092X3驗證結(jié)果。并且對于多因素對交通流影響的預(yù)測值要進行偏移率的計算來測定該方程的合理性及預(yù)測的準(zhǔn)確性,所以驗證結(jié)果和偏移率如下表6所示。在此實驗中,是驗證以上三種影響因素對交通流的影響,通過上一章的統(tǒng)計分析及編程得到模擬結(jié)果,并得到其多元線性回歸方程。通過數(shù)據(jù)驗證和偏移率的數(shù)值分析,其符合結(jié)果。

3總結(jié)展望

數(shù)據(jù)挖掘已經(jīng)成為決策支持、道路交通、金融等行業(yè)的主要研究方向。在這個到處都是大數(shù)據(jù)的現(xiàn)代社會中,每年都會產(chǎn)生新的技術(shù)及方法,也由于人們對它的廣泛應(yīng)用和深入研究,算短了技術(shù)換代的時間,促進了挖掘技術(shù)的快速發(fā)展。但是數(shù)據(jù)挖掘技術(shù)仍存在許多問題,如數(shù)據(jù)挖掘方法的效率有待提高,尤其是超大規(guī)模數(shù)據(jù)挖掘的效率。本文從數(shù)據(jù)挖掘的角度出發(fā),深入研究了數(shù)據(jù)挖掘中數(shù)據(jù)預(yù)處理技術(shù)及一元和多元線性回歸模型在交通流預(yù)測系統(tǒng)中的應(yīng)用,并對它們進行了分析對比。

本文是基于數(shù)據(jù)挖掘的交通流預(yù)測并且得到一定的研究成果,但是由于時間及各種原因造成不能更進一步的深入研究,況且交通系統(tǒng)本身就是一個巨大且復(fù)雜的系統(tǒng),所以還有很多地方需要完善和改進。(1)交通流數(shù)據(jù)本身有其內(nèi)在的關(guān)系,速度、流量和占有率是最重要的三個屬性,它們之間是相互聯(lián)系、相互作用的,本文僅對流量的影響因素進行分析,今后可以對三者之間的影響關(guān)系進行分析預(yù)測,并通過交通流預(yù)測模型為交通系統(tǒng)提供決策支持,同時它將更加的合理和準(zhǔn)確。(2)本文僅使用了線性回歸模型,可以考慮將多種模型混合使用,提高預(yù)測結(jié)果的準(zhǔn)確性。(3)今后還應(yīng)對不同路段、路面的種類因素等進行分析研究。同時惡劣天氣、交通事故等因素也是未來需要進一步研究的方向。

參考文獻

[1]高雅.短時交通流預(yù)測模型及預(yù)測方法的研究[D].上海:華東師范大學(xué),2011.4.

[2]許兆霞.基于數(shù)據(jù)挖掘技術(shù)的交通流數(shù)據(jù)分析研究[J].淮海:淮海工學(xué)院,2009.3.

[3]郭敏.道路交通流短時預(yù)測方法綜述[A].北京:北京科技大學(xué),2009.2.

[4]李明江.數(shù)據(jù)挖掘技術(shù)及應(yīng)用[A].都勻:黔南民族師范學(xué)院,2010.

[5]國家統(tǒng)計局.中國統(tǒng)計年鑒[J].北京:中國統(tǒng)計出版社,2010.

[6]國家統(tǒng)計局.中國統(tǒng)計年鑒[J].北京:中國統(tǒng)計出版社,2007.

作者:楊凱茜 劉瑋蔚 單位:1.西安航空學(xué)院車輛工程學(xué)院 2.中交第一公路勘察設(shè)計研究院有限公司