中國大數(shù)據(jù)產(chǎn)業(yè)起步晚,發(fā)展速度快。物聯(lián)網(wǎng)、移動互聯(lián)網(wǎng)的迅速發(fā)展,使數(shù)據(jù)產(chǎn)生速度加快、規(guī)模加大,迫切需要運用大數(shù)據(jù)手段進行分析處理,提煉其中的有效信息。
大數(shù)據(jù)行業(yè)發(fā)展規(guī)模分析
中國大數(shù)據(jù)產(chǎn)業(yè)起步晚,發(fā)展速度快。物聯(lián)網(wǎng)、移動互聯(lián)網(wǎng)的迅速發(fā)展,使數(shù)據(jù)產(chǎn)生速度加快、規(guī)模加大,迫切需要運用大數(shù)據(jù)手段進行分析處理,提煉其中的有效信息。2014年,中國大數(shù)據(jù)市場規(guī)模達到767億元,同比增長27.8%。預(yù)計到2020年,中國大數(shù)據(jù)產(chǎn)業(yè)規(guī)模將達到8228.81億元。2015-2017年復(fù)合增長率為51.5%。2014年,中國大數(shù)據(jù)應(yīng)用市場規(guī)模為80.54億元,同比增長3.2%,2015年市場規(guī)模約增長37.3%,至110.56億元,預(yù)計到2020年,中國大數(shù)據(jù)應(yīng)用市場規(guī)模將增長至5019.58億元。2015-2017年復(fù)合增速為87.8%。
大數(shù)據(jù)應(yīng)用于智能交通產(chǎn)業(yè)
當智能交通遇到大數(shù)據(jù),如同二氧化錳在制取氧氣的實驗中作為催化劑一樣,一場劇烈的化學(xué)反應(yīng)加劇了兩方的共同發(fā)展。
隨著城市的迅速發(fā)展,交通擁堵、交通污染日益嚴重,交通事故頻繁發(fā)生,這些都是各大城市亟待解決的問題。智能交通成為改善城市交通的關(guān)鍵所在。為此,及時、準確獲取交通數(shù)據(jù)并構(gòu)建交通數(shù)據(jù)處理模型是建設(shè)智能交通的前提,而這一難題可以通過大數(shù)據(jù)技術(shù)得到解決。
1、智能交通需求與大數(shù)據(jù)契合
智能交通整體框架主要包括物理感知層、軟件應(yīng)用平臺及分析預(yù)測及優(yōu)化管理的應(yīng)用。其中物理感知層主要是對交通狀況和交通數(shù)據(jù)的感知采集;軟件應(yīng)用平臺是將各感知終端的信息進行整合、轉(zhuǎn)換處理,以支撐分析預(yù)警與優(yōu)化管理的應(yīng)用系統(tǒng)建設(shè);分析預(yù)測及優(yōu)化管理應(yīng)用主要包括交通規(guī)劃、交通監(jiān)控、智能誘導(dǎo)、智能停車等應(yīng)用系統(tǒng)。
系統(tǒng)利用先進的視頻監(jiān)控、智能識別和信息技術(shù)手段,增加可管理空間、時間和范圍,不斷提升管理廣度、深度和精細度。整個系統(tǒng)由信息綜合應(yīng)用平臺、信號控制系統(tǒng)、視頻監(jiān)控系統(tǒng)、智能卡口系統(tǒng)、電子警察系統(tǒng)、信息采集系統(tǒng)、信息發(fā)布系統(tǒng)等組成。以達到四方面的目標:提高通行能力、減少交通事故、打擊違章事件、出行信息服務(wù)。
整個系統(tǒng)建設(shè)的核心是數(shù)據(jù)的采集、存儲與計算,而其中最重要的核心思想就是“數(shù)據(jù)是價值”。問題就是如何把數(shù)據(jù)轉(zhuǎn)換成價值。這就成為一個技術(shù)問題。
從統(tǒng)計學(xué)的角度,任何領(lǐng)域任何動態(tài)發(fā)展的事物,只要有足夠多的樣本數(shù)據(jù),就一定能從樣本數(shù)據(jù)中找到動態(tài)發(fā)展的規(guī)律。數(shù)據(jù)越多,準確率越高。這個“規(guī)律”就是數(shù)據(jù)的價值所在。對于商業(yè)機構(gòu),可以分析用戶行為規(guī)律從而提高銷售量;分析目標市場規(guī)律,定點投放廣告從而降低成本等等;對于公安行業(yè),可以分析區(qū)域性犯罪趨勢,提前預(yù)防從而降低犯罪率;還可以分析交通行為規(guī)律,提前做交通疏導(dǎo),提高交通通暢率,這就能真正挖掘數(shù)據(jù)的潛在價值,提高其社會價值。
從20世紀初的網(wǎng)絡(luò)發(fā)展以來,進入一個高度聯(lián)網(wǎng)的階段。聯(lián)網(wǎng)的同時,數(shù)據(jù)高度集中,數(shù)據(jù)量急劇增加。據(jù)IDC報告現(xiàn)在互聯(lián)網(wǎng)的數(shù)據(jù),每兩年就翻一番。這個增長率在智能交通行業(yè)同樣有效,隨著卡口、電警、攝像機數(shù)量的增加,高清化、智能化的發(fā)展,如果再算上物聯(lián)網(wǎng)的各種傳感器,未來幾年的數(shù)據(jù)量增加可能大大高于這個增長率。這就為智能交通行業(yè)實現(xiàn)大數(shù)據(jù)提供了數(shù)據(jù)基礎(chǔ)。
從各種各樣類型的數(shù)據(jù)中,快速獲得有價值信息的能力,就是大數(shù)據(jù)技術(shù)。由此我們再看IBM歸納的4個V(量Volume,多樣Variety,價值Value,速Velocity):
(1)Volume數(shù)據(jù)體量巨大。從TB級別,躍升到PB級別;
(2)Variety數(shù)據(jù)類型繁多。包括視頻、圖片、地理位置信息、傳感器數(shù)據(jù)等等。
(3)Value價值密度低,應(yīng)用價值高。以視頻為例,連續(xù)不間斷監(jiān)控過程中,可能有用的數(shù)據(jù)僅僅有一兩秒。
(4)Velocity處理速度快,1秒定律。
最后這一點也是和傳統(tǒng)的數(shù)據(jù)挖掘技術(shù)有著本質(zhì)的不同。在交通領(lǐng)域,海量的數(shù)據(jù)主要包括4個類型的數(shù)據(jù):傳感器數(shù)據(jù)(位置、溫度、壓力、圖像、速度、RFID等信息);系統(tǒng)數(shù)據(jù)(日志、設(shè)備記錄、MIBs等);服務(wù)數(shù)據(jù)(收費信息、上網(wǎng)服務(wù)及其他信息);應(yīng)用數(shù)據(jù)(生成廠家、能源、交通、性能、兼容性等信息)。交通數(shù)據(jù)的類型繁多,而且體積巨大。量Volume和多樣Variety是因,數(shù)據(jù)類型的復(fù)雜和數(shù)據(jù)量的急劇增加,決定了原有簡單因果關(guān)系的應(yīng)用模式對數(shù)據(jù)使用率極低,完全無法發(fā)揮數(shù)據(jù)的作用;速Velocity是過程,巨大的運算量決定了速度必須快;價值Value是最終的果。
2、大數(shù)據(jù)采集
在各城市建設(shè)智慧交通的過程中,將產(chǎn)生越來越多的視頻監(jiān)控、卡口電警、路況信息、管控信息、營運信息、GPS定位信息、RFID識別信息等數(shù)據(jù),每天產(chǎn)生的數(shù)據(jù)量可以達到PB級別,并且呈現(xiàn)指數(shù)級增長。
3、大數(shù)據(jù)增值應(yīng)用
深入挖掘數(shù)據(jù)價值,在智能交通、公安實戰(zhàn)等行業(yè)上推出車輛軌跡、道路流量、案件聚類等大數(shù)據(jù)模型。基于大數(shù)據(jù)模型,推出智能套牌、智能跟車分析、軌跡碰撞、人臉比對、輿情分析等數(shù)據(jù)增值應(yīng)用,逐步解決行業(yè)的深層次問題。
4、海量數(shù)據(jù)計算
通過云計算集群,實現(xiàn)對海量數(shù)據(jù)的分布式高速計算,支撐對海量數(shù)據(jù)的高效分析挖掘。云計算集群是一種M/S架構(gòu)的分布式計算系統(tǒng),Master作為調(diào)度管理服務(wù)器,負責計算任務(wù)分解與調(diào)度、計算資源統(tǒng)一管理。Slave則由大量的計算服務(wù)器組成,負責完成Master下發(fā)的計算任務(wù)。
5、海量數(shù)據(jù)檢索
基于行業(yè)數(shù)據(jù)查詢特點,對搜索引擎進行優(yōu)化定制,支持百億記錄的秒級高速查詢。通過集群機制,實現(xiàn)搜索服務(wù)的高可靠性、高容錯性、高擴展性。
6、海量數(shù)據(jù)存儲
對于海量數(shù)據(jù)存儲,采用HBase分布式存儲系統(tǒng)。相比傳統(tǒng)關(guān)系型數(shù)據(jù)庫,有四個特點:數(shù)據(jù)格式靈活、高可用、橫向擴展能力強和訪問高效。
同時能夠做到無縫集成,快速從關(guān)系型數(shù)據(jù)庫導(dǎo)入已經(jīng)存在的歷史數(shù)據(jù)。提供高可靠性、高容錯性、高性能的海量數(shù)據(jù)存儲解決方案,支持無縫容量擴展。
7、大數(shù)據(jù)分析與應(yīng)用
高效的云計算能力,帶來千億數(shù)據(jù)的秒級返回的檢索能力,為大數(shù)據(jù)分析應(yīng)用,提供了快速的保障?;谏疃葘W(xué)習(xí)的智能分析算法,為大數(shù)據(jù)分析應(yīng)用提供有力的工具。交通大數(shù)據(jù)的分析,為交通管理、決策、規(guī)劃、服務(wù)以及主動安全防范帶來更加有效的支持。
利用大數(shù)據(jù)技術(shù),結(jié)合高清監(jiān)控視頻、卡口數(shù)據(jù)、線圈微采集波數(shù)據(jù)等,再輔以智能研判,基本可以實現(xiàn)路口的自適應(yīng)以及信號配時的優(yōu)化。通過大數(shù)據(jù)分析,得出區(qū)域內(nèi)多路口綜合通行能力,用于區(qū)域內(nèi)多路口紅綠燈配時優(yōu)化,達到提升單一路口或區(qū)域內(nèi)的通行效率。如根據(jù)平日/節(jié)假日,早、晚高峰/其他時段,主要干道關(guān)鍵路口/次關(guān)鍵路口/普通路口,白天/夜間等不同情況,人工或系統(tǒng)自動設(shè)置不同的配時,達到大幅提高區(qū)域內(nèi)交通通行能力。
大數(shù)據(jù)分析研判功能,還可以支持對卡口數(shù)據(jù)、視頻監(jiān)控數(shù)據(jù)進行二次識別,提高車輛信息的準確性,進而利用大數(shù)據(jù)實現(xiàn)軌跡分析、落腳點分析、隱匿車輛分析等功能。對車輛大數(shù)據(jù)進行深入挖掘,實現(xiàn)事前全面監(jiān)控、事中及時追蹤、事后準確回溯的不同場景需求。常州市建設(shè)的車輛大數(shù)據(jù)平臺,協(xié)助有關(guān)部門每天自動發(fā)現(xiàn)套牌車輛10余起,再根據(jù)車輛的軌跡分析和落腳點分析,快速找到套牌車輛進行處罰管理。
結(jié)合智能算法,二次識別等功能,可以更準確的識別車牌、車身顏色、車型、車標、年款等特征,并且對遮陽板檢測、安全帶檢測、接打電話檢測、司機人臉識別等進行分析。
更多資訊請關(guān)注軌道交通頻道