在我們的日常生活中隨處都有計算機視覺技術,手機、游戲機可以識別您的手勢,相機可以自動將焦點放在人身上等等。計算機視覺正在影響我們生活的許多領域。
事實上,計算機視覺在商業(yè)和國防使用方面有悠久的歷史:如制造中的質量檢測,環(huán)境管理的遙感或在戰(zhàn)場上收集智能的高分辨率相機。這些傳感器中的一些是靜止的,而其它傳感器連接到諸如衛(wèi)星,無人機和車輛等在移動物體上。
在過去,許多計算機視覺應用程序僅限于某些封閉平臺。當與IP連接技術相結合時,他們創(chuàng)建了一組新的應用程序計算機視覺,加上IP連接,高級數(shù)據(jù)分析和人工智能,將成為彼此的催化劑,從而在物聯(lián)網(wǎng)(IoT)創(chuàng)新和應用方面帶來革命性的飛躍。
計算機視覺的多領域的進步
視覺環(huán)境設計
視覺或視力是五種人類感覺中最發(fā)達的。我們每天都用它來識別我們的朋友,在我們的路上發(fā)現(xiàn)障礙,完成任務和學習新事物。我們通過我們的視覺來識別我們周圍的環(huán)境。有路牌和信號燈幫助我們從一個地方到另一個地方。通過識別環(huán)境標識找到我們所要到達的地方。鑒于視覺的重要性,將其擴展到計算機和自動化系統(tǒng),實現(xiàn)了視覺應用大飛躍。
計算機視覺
計算機視覺從捕獲和存儲圖像或一組圖像的技術開始,然后將這些圖像轉換成可以進一步執(zhí)行的信息。它由多種技術組合組成。計算機視覺工程是一個跨學科領域,需要在許多這些技術中跨職能和系統(tǒng)專長。
由多個領域的進步驅動的計算機視覺
例如,MicrosoftKinect使用3D計算機圖形算法來實現(xiàn)計算機視覺來分析和理解三維場景。它允許游戲開發(fā)人員將實時全身運動捕捉與人造3D環(huán)境進行合并。除了游戲,這在機器人,虛擬現(xiàn)實(VR)和增強現(xiàn)實(AR)應用等領域開辟了新的可能性。
傳感器技術的進步也在傳統(tǒng)攝像機傳感器以外的許多層面迅速發(fā)展。最近的一些例子包括:
?紅外傳感器和激光器結合起來感測深度和距離,這是自駕車和3D地圖應用的關鍵推動因素之一
?非侵入式傳感器,可跟蹤醫(yī)療患者的生命體征,無需身體接觸
?高頻攝像機可以捕捉人眼不能察覺的微妙動作,以幫助運動員分析其步態(tài)
?超低功耗和低成本的視覺傳感器,可長期部署在任何地方
計算機視覺獲得智能
早期應用
監(jiān)控行業(yè)是圖像處理技術和視頻分析的早期采用者之一。視頻分析是計算機視覺的一個特殊用例,重點是從小時的視頻中找到模式。在現(xiàn)實情況下自動檢測和識別預定義模式的能力代表了數(shù)百種用例的巨大市場機會。
第一個視頻分析工具使用手工算法來識別圖像和視頻中的特定功能。它們在實驗室設置和模擬環(huán)境中都是準確的。然而,當輸入數(shù)據(jù)(如照明條件和攝像機視圖)偏離設計假設時,性能迅速下降。
研究人員和工程師花費了多年的開發(fā)和調優(yōu)算法,或者用新的方法來處理不同的條件。然而,使用這些算法的相機或錄像機仍然不夠穩(wěn)健。盡管多年來取得了一些進步,但現(xiàn)實世界的糟糕表現(xiàn)限制了技術的有用性和應用。
深度學習突破
近年來,深度學習算法的出現(xiàn)激發(fā)了計算機視覺。深入學習使用人造神經(jīng)網(wǎng)絡(ANN)算法,模擬人腦神經(jīng)元。
從2010年初開始,由圖形處理單元(GPU)加速的計算機性能已經(jīng)越來越強大,足以使研究人員實現(xiàn)復雜ANN的功能。此外,部分由視頻站點和普遍的IoT設備驅動,研究人員擁有大量不同的視頻和圖像數(shù)據(jù)庫來訓練其神經(jīng)網(wǎng)絡。
在2012年,稱為卷積神經(jīng)網(wǎng)絡(CNN)的深層神經(jīng)網(wǎng)絡(DNN)的版本顯示了精確度的巨大飛躍。這一發(fā)展推動了計算機視覺工程領域的興趣和興奮。現(xiàn)在,在需要圖像分類和面部識別的應用中,深度學習算法甚至超過了人類對應物。更重要的是,就像人類一樣,這些算法具有學習和適應不同條件的能力。
計算機視覺應用案例:
?監(jiān)測作物健康的農業(yè)無人機
?交通基礎設施管理
?無人機無人機檢查
?下一代家庭安全攝像機
?無人機收集圖像的植被指數(shù)
這些只是計算機視覺如何大大提高許多領域的生產(chǎn)力的一些小例子。我們正在進入物聯(lián)網(wǎng)進化的下一個階段。在第一階段,我們專注于連接設備,聚合數(shù)據(jù)和建立大型數(shù)據(jù)平臺。在第二階段,重點將轉移到通過計算機視覺和深度學習等技術使“事物”更加智能,從而產(chǎn)生更多可操作的數(shù)據(jù)。
計算機視覺即將迎來爆發(fā)式增長,我們將探索新的框架,最佳實踐和設計方法,以克服其在實際應用中會遇到的一挑戰(zhàn)。