時間:2018-10-09 10:34:26來源:網(wǎng)絡(luò)轉(zhuǎn)載
從計算機到機器人再到人工智能,復制或模仿人類智慧、感知能力和行為的需求激發(fā)了多項關(guān)鍵技術(shù)進步。聲音、視覺和壓力等各種傳感器都是從人類的聽覺、視覺和壓力感知能力中獲取靈感。視覺無疑是人類最重要的感知能力之一。視覺讓人類看到周圍環(huán)境,并解釋、分析和采取行動。
人類視覺是一個非常復雜、智能的“機器”,占據(jù)了大腦的重要組成部分。大腦中專門用于視覺處理的神經(jīng)元占皮層面積近30%。
多年來,讓設(shè)備、物體和事物直觀“看到”周圍環(huán)境,并進行分析和解讀一直是一個重要的研究課題。
以前,技術(shù)的復雜性、巨大計算能力要求和高昂成本限制了使用監(jiān)視攝像頭對安全監(jiān)視應用的視覺感知能力。然而,今天已經(jīng)發(fā)生了巨大的變化,視覺傳感器的市場已經(jīng)爆發(fā),攝像頭正被嵌入到任何地方和任何設(shè)備、物體和事物中,包括移動的和靜止的。此外,邊緣和云中可用的計算能力也急劇增加,這引發(fā)了嵌入式視覺革命。
價格便宜的傳感器/攝像頭,以及視覺傳感器分辨率技術(shù)的各種進步,再加上處理動態(tài)范圍成像和計算能力,促使了嵌入式視覺令人難以置信的增長和多樣化應用。下面隨賢集網(wǎng)小編一起來了解下嵌入式視覺傳感器的應用及發(fā)展前景。
通過傳統(tǒng)圖像處理和深度學習相結(jié)合而實現(xiàn)的視覺智能,在當今互聯(lián)嵌入式系統(tǒng)、設(shè)備和對象的世界中已經(jīng)成為可能,它既利用了設(shè)備本身的邊緣計算能力,也利用了云計算能力。
這引發(fā)了自動駕駛汽車、無人機、機器人、工業(yè)應用、零售、交通運輸、安全和監(jiān)控、家用電器、醫(yī)療/保健、體育和娛樂、消費者增強和虛擬現(xiàn)實、當然還有無處不在智能手機的快速增長。視覺智能是物聯(lián)網(wǎng)世界中的一場風暴,而且應用也會越來越多。
事實上,沒有其他傳感器能夠產(chǎn)生如此巨大影響。視頻在日常生活中如此普遍,以至于大多數(shù)人認為這是理所當然。從視頻直播到視頻點播再到視頻通話,人們很容易忘記視覺傳感器在互聯(lián)網(wǎng)環(huán)境和設(shè)備世界中所產(chǎn)生的巨大影響,它確實是物聯(lián)網(wǎng)真正的無名英雄。傳感器與視覺智能結(jié)合起來,整個市場將進入了一個全新的發(fā)展空間。
嵌入式視覺的普及,其根源在于內(nèi)置攝像頭手機的爆炸式增長。在手機革命之前,視頻/攝像頭只與安全和監(jiān)視相關(guān)。但隨后,內(nèi)置攝像頭手機出現(xiàn)了,這與邊緣和云上視頻分析以及智能計算能力的同時大幅增長是一致的。這種結(jié)合導致了爆炸式增長,視覺傳感器開始被嵌入到從機器人、無人機到汽車、工業(yè)機器、電器等等各個地方。
視覺傳感器有多種類型,但互補金屬氧化物半導體(CMOS)傳感器迄今影響最大,并導致視覺傳感器在各種嵌入式系統(tǒng)和智能手機中的爆炸式增長。
傳感器無處不在,而且數(shù)量眾多。今天的自動駕駛汽車有10多個攝像頭、無人機有3到4臺攝像頭、到處都有的安全監(jiān)控攝像頭、手機正在進行的視頻直播等等。來自這些視頻源的視頻數(shù)據(jù)在云中流動以獲得進一步智能分析,而實時的邊緣處理則在設(shè)備和物體本身進行。
視覺傳感器分辨率、動態(tài)范圍和視覺傳感器數(shù)量不斷擴大,以及隨著這些傳感器產(chǎn)生大量視頻數(shù)據(jù),再加上其傳輸和存儲要求,必然需要強大計算能力。
以前,人們急于將視頻流送到云中進行實時存儲或視覺分析,云提供了巨大的計算能力,但即使在壓縮后傳輸所需的帶寬需求也很高。巨大存儲空間、延遲時間以及安全和隱私問題正在讓客戶重新思考云計算,并開始考慮在設(shè)備/對象層考慮視覺分析,然后在云中進行離線視頻處理。
隨著低延遲、高速5G連接的保證,有一種想法是在邊緣和云之間分配實時視頻處理。然而,這還有多少可能?如果有的話,從占用傳輸帶寬的數(shù)百萬個端點向云傳輸實時壓縮視頻數(shù)據(jù)是否還有意義?
邊緣分析的重要性使得市場出現(xiàn)各種片上系統(tǒng)(SoC)、圖形處理單元(GPU)和視覺加速器。具有GPU加速功能的云越來越多地用于非實時視頻分析,或者用于在大量測試數(shù)據(jù)上訓練神經(jīng)網(wǎng)絡(luò),同時利用加速器在邊緣進行實時推理。
隨著現(xiàn)有深度學習和優(yōu)化后的各種片上系統(tǒng)芯片以及用于傳統(tǒng)圖像處理的視覺加速器應用,邊緣分析的趨勢可能會繼續(xù)持續(xù)下去。更多的事件、參數(shù)和信息將被推到云端進行進一步的分析和關(guān)聯(lián),云對于離線存儲視頻分析仍然很重要,某些系統(tǒng)仍然可以在那里進行實時分析。
在現(xiàn)實世界中的視覺應用
視覺和視覺智能市場繼續(xù)快速發(fā)展,有一些引人注目的技術(shù)趨勢正在發(fā)生,預計它們將推動多年以來的下一個大規(guī)模增長。這里有幾個例子:
3D相機和3D感測:3D相機或更一般的3D感測技術(shù)允許場景中深度計算和場景3D地圖的構(gòu)建。這項技術(shù)已經(jīng)存在一段時間了,在微軟的Kinect等游戲設(shè)備中已經(jīng)普遍應用,最近在iPhoneX生物特征識別中也有應用。此外,機器人、無人機和帶有3D攝像頭的自動駕駛汽車可以識別物體的形狀和大小,用于導航,繪圖和障礙物探測。同樣,3D相機和立體相機是增強、虛擬和混合現(xiàn)實的支柱。
邊緣和云中的深度學習:基于神經(jīng)網(wǎng)絡(luò)的人工智能已經(jīng)風靡全球,而今天可用的計算能力又使得深度學習成為可能。還有其他因素促成了神經(jīng)網(wǎng)絡(luò)在實際應用中的增長,包括大學和大型公司用于培訓和尖端研發(fā)的大量數(shù)據(jù)(視頻、照片、文本),以及它們對開放源代碼的貢獻。這反過來又引發(fā)了神經(jīng)網(wǎng)絡(luò)的很多實際應用。事實上,對于機器人、自動駕駛汽車和無人機,在邊緣的GPU/SoCs上運行深度學習推理已經(jīng)成為常態(tài)。云將繼續(xù)用于訓練深度學習以及離線存儲數(shù)據(jù)的視頻處理,只要網(wǎng)絡(luò)延遲和視頻管道延遲被認為是可接受,邊緣和云之間的分離架構(gòu)處理也是可能的。
同步定位和測繪(SLAM)在汽車、機器人、無人機中的應用:同步定位和測繪(SLAM)是自動駕駛車輛、機器人和無人機的關(guān)鍵部件,這些車輛、機器人和無人機配備有各種類型的攝像頭和傳感器,例如雷達、激光雷達、超聲波等。
AR/VR與感知計算:想想微軟全息透鏡HaloLink,后面是什么?六個帶有深度傳感器組合的攝像頭。微軟甚至宣布在英國劍橋開設(shè)全息透鏡計算視覺研究中心。
安全/監(jiān)視:本文并不關(guān)注這個傳統(tǒng)視頻和視頻分析占主導地位的領(lǐng)域。這本身就是一個很大的市場。
基于手機和嵌入式設(shè)備的生物認證:生物認證可以觸發(fā)下一代移動應用程序,再次是攝像頭傳感器,結(jié)合邊緣和云上的視頻分析,觸發(fā)這一趨勢。隨著技術(shù)的成熟,它將擴展到各種嵌入式設(shè)備。
零售:AmazonGo是一個使用攝像頭和高端視頻分析的例子。很快,我們將在超市里安裝機器人來幫助人類,所有機器人都配備了多個攝像頭和視覺智能以及其他傳感器。
媒體:視頻智能已經(jīng)在媒體行業(yè)中大量使用。視頻分析可讓您在大型視頻文件中搜索特定主題、場景、對象或面部。
體育:實時3D視頻、視頻分析和虛擬現(xiàn)實將使下一代個性化體育和娛樂系統(tǒng)成為可能。
未來、挑戰(zhàn)、動力
對于不斷增長的高分辨率視頻、高動態(tài)范圍、高幀率和視頻智能的需求,使得對高計算能力、傳輸帶寬和高存儲容量的需求日益增長,而且很難持續(xù)趕上。
一些公司正在采取不同的方式來解決這個問題。比如,生物啟發(fā)式視覺傳感器的研究和商業(yè)化已經(jīng)開始出現(xiàn),這些傳感器響應場景變化并輸出一小串事件而不是一系列圖像,這可能導致視頻數(shù)據(jù)采集和處理需求大幅降低。
這種方法可以從根本上改變我們獲取和處理視頻的方式,由于處理能力大大降低,它有很大的潛力來降低功耗。
視覺仍將是推動物聯(lián)網(wǎng)革命的關(guān)鍵傳感器。同樣,邊緣視頻智能將繼續(xù)推動SoC和半導體行業(yè)繼續(xù)使用GPU、專用集成電路(ASIC)、可編程SoC、現(xiàn)場可編程門陣列(FPGA)和數(shù)字信號處理(DSP)的視頻加速器路徑。加速分類圖像處理和深度學習,并為開發(fā)人員提供可編程空間。
這是現(xiàn)在的競爭要地,各種各樣的大型企業(yè)和初創(chuàng)公司都在積極地追逐這個機會。
低功耗嵌入式視覺
隨著視覺傳感器和嵌入式智能技術(shù)在數(shù)百萬個電池供電裝置中的應用,低功耗嵌入式視覺將是下一個時代整個行業(yè)增長的主要因素之一,也是需要解決的關(guān)鍵問題之一。
構(gòu)建具有嵌入式視覺和智能的產(chǎn)品和系統(tǒng)將引發(fā)隱私和安全問題,需要從設(shè)計階段妥善處理這些問題。
盡管面臨挑戰(zhàn),物聯(lián)網(wǎng)嵌入式視覺的前景依然光明,市場機遇依然巨大,解決這些挑戰(zhàn)的公司將獲得巨大回報。
標簽:
中國傳動網(wǎng)版權(quán)與免責聲明:凡本網(wǎng)注明[來源:中國傳動網(wǎng)]的所有文字、圖片、音視和視頻文件,版權(quán)均為中國傳動網(wǎng)(m.u63ivq3.com)獨家所有。如需轉(zhuǎn)載請與0755-82949061聯(lián)系。任何媒體、網(wǎng)站或個人轉(zhuǎn)載使用時須注明來源“中國傳動網(wǎng)”,違反者本網(wǎng)將追究其法律責任。
本網(wǎng)轉(zhuǎn)載并注明其他來源的稿件,均來自互聯(lián)網(wǎng)或業(yè)內(nèi)投稿人士,版權(quán)屬于原版權(quán)人。轉(zhuǎn)載請保留稿件來源及作者,禁止擅自篡改,違者自負版權(quán)法律責任。