管理數(shù)據(jù)生命周期是自動駕駛汽車開發(fā)的關(guān)鍵部分……
毫無疑問,自動駕駛汽車開發(fā)成為熱門話題。完全無人駕駛的想法標志著機器人時代最激進的概念之一。不僅需要正確的技術(shù)來實施,而且所有使用道路以及參與道路和交通管理的人的思維方式都將發(fā)生重大變化。當然,安全是主要的考慮因素,這就是為什么一旦發(fā)生事故便成為頭條新聞。
然而,在大家爭論和不斷涌現(xiàn)的頭條新聞的背后,是另一個經(jīng)常被忽視的故事:自動駕駛汽車成功地融入城市和社會很大程度上依賴于數(shù)據(jù)。實際上,從自動測試車輛收集的數(shù)據(jù),為“訓練”車輛通過諸如機器學習(ML)之類的技術(shù)自動執(zhí)行提供了基礎(chǔ)。
具有挑戰(zhàn)性的用例
鑒于操作車輛要面對的大量真實世界變量以及針對錯誤安全要求的相關(guān)零容忍度,自動駕駛是可想象的最具挑戰(zhàn)性的機器學習用例之一。該應用的成功將直接推動更多要求不高的用例,這就是為什么自動駕駛汽車的發(fā)展在許多不同領(lǐng)域(尤其是智慧城市)具有影響的原因。
從自動駕駛汽車的角度來看,關(guān)鍵的機器學習需求涉及訓練“感知層”,這意味著使用傳感器(無線電、攝像機、激光雷達、慣性測量單元等)來準確“查看”車輛遇到的狀況。這是至關(guān)重要的,因為采取的任何措施(例如指示車輛進行路徑調(diào)整)都將取決于準確的感知層視覺。
自動駕駛開發(fā)可能會驅(qū)動未來用例的原因之一是,訓練該重要感知層的機器學習模型和神經(jīng)網(wǎng)絡(luò)在種類繁多的大型數(shù)據(jù)集上表現(xiàn)最佳。而自動駕駛汽車則依賴于龐大的數(shù)據(jù)集。此外,它還依賴于傳統(tǒng)的汽車工程專業(yè)知識,但是制造自動駕駛汽車所需的平均數(shù)據(jù)量估計約為150 PB。簡而言之,這既是數(shù)據(jù)分析又是機器學習的挑戰(zhàn),而不僅僅是機械工程方面的挑戰(zhàn)。
需要收集和處理的數(shù)據(jù)量需要高級的數(shù)據(jù)管理功能,包括數(shù)據(jù)湖和對數(shù)據(jù)生命周期的清晰理解。未來的用例不僅取決于對數(shù)據(jù)管理和處理的理解,還取決于數(shù)據(jù)可以帶來的機會。
從歷史上看,由于與管理生命周期本身相關(guān)的工作量、成本和時間,分散的數(shù)據(jù)管理生命周期限制了擴展新用例的能力。通過優(yōu)化生命周期,可以更快、更頻繁地重復它,從而提供對機器學習模型的持續(xù)改進。
共同努力
為此,汽車制造商、城市和其他利益相關(guān)者必須共同努力,并在瞬息萬變的環(huán)境中利用最新的硬件和軟件技術(shù)。掌握物聯(lián)網(wǎng)和機器學習數(shù)據(jù)分析生命周期所需的功能超出了任何一家公司的范圍。因此,基于標準和合作伙伴基于生態(tài)系統(tǒng)的方法對于鞏固真正轉(zhuǎn)變智慧城市和互聯(lián)社區(qū)的能力至關(guān)重要。
這種合作水平對于建立解決方案至關(guān)重要,因為聯(lián)合項目會同時產(chǎn)生標準和可重復使用的模式。作為最近的一個例子,Cloudera參與了一項名為Project Fusion的計劃,該計劃是一個多方汽車行業(yè)技術(shù)合作,旨在定義一個數(shù)據(jù)生命周期平臺,以啟用和優(yōu)化未來的互聯(lián)和自動駕駛汽車系統(tǒng)。合作伙伴的目標是構(gòu)建一種提供數(shù)據(jù)管理技術(shù)的車輛到云解決方案。
共同努力還將確保在自動駕駛汽車開發(fā)中最大程度地利用大數(shù)據(jù)和機器學習的其他一些障礙,并且可以解決其他用例。需要從系統(tǒng)中消除浪費和低效率,以減少管理生命周期的成本和時間。
至關(guān)重要的是,必須面對潛在的數(shù)據(jù)隱私問題。如前所述,對自動駕駛汽車進行駕駛訓練取決于現(xiàn)實世界中記錄的訓練數(shù)據(jù)。因此,解決方案提供商必須注意不要收集和存儲私人信息,例如駕駛員的臉孔和車牌號。
在收集和存儲此信息之前,必須提供編輯這些信息的功能。這需要強大的數(shù)據(jù)處理能力來識別和過濾隱私數(shù)據(jù)。此外,收集的任何信息都必須遵守諸如歐盟的《通用數(shù)據(jù)保護條例》和美國的《加州消費者隱私法》之類的規(guī)定。
實時決策
機器學習對于幫助城市、技術(shù)供應商和其他利益相關(guān)者超越簡單的監(jiān)視和報告來自傳感器和其他設(shè)備的數(shù)據(jù),進而基于其做出優(yōu)化的實時決策至關(guān)重要。以運輸為例。
監(jiān)視交通狀況并報告擁堵正在發(fā)生這一事實是一回事,但利用機器學習通過建議主動地引導市民(例如建議替代路線或主動建議出行者在不同時間出行)是一種更具吸引力的價值主張。使用機器學習,這些可以既基于實時條件又可以基于過去的經(jīng)驗。
我們所知道的是,自動駕駛可以教會我們很多有關(guān)機器學習的潛力,并引導我們開發(fā)許多新應用。主動、優(yōu)化和實時的決策是機器學習優(yōu)勢的標志,而我們才剛剛開始。關(guān)于機器學習的潛力,我們還有很多要學習的東西,并且它的許多未來用例超出了我們當前的想象。我們需要確保的基礎(chǔ)和生態(tài)系統(tǒng)已經(jīng)到位,以了解高級數(shù)據(jù)管理和數(shù)據(jù)生命周期的重要性,從而不會錯過任何機會。