【中國傳動網(wǎng) 技術(shù)前沿】 近年來,人工智能(AI)已經(jīng)成為了一種非常流行的表達方式。上個世紀(jì)是一個富有創(chuàng)新的世紀(jì),特別是在數(shù)學(xué)方面,為實現(xiàn)人工智能帶來了希望,可是很多技術(shù)上和概念上的差距讓各種各樣的方案都胎死腹中。然而,得益于過去20年來在計算能力、數(shù)據(jù)累積、數(shù)學(xué)工具等方面取得的巨大進步,而且所有這些都能以更低的成本實現(xiàn),今天,人工智能已經(jīng)開始融入各個行業(yè)。
為了使機器能夠理解周圍的世界,科技的發(fā)展從生物學(xué)方面獲得了啟發(fā)。通過眼睛可以獲得80%的信息,使得人類可以自我定位、并且和在他們視力范圍內(nèi)的世界進行互動。
因此,大多數(shù)人工智能方面的研究都是集中在分析來自于視覺系統(tǒng)圖像的能力上。來自于生物學(xué)方面的另一個啟發(fā)是允許機器分析這些圖像的數(shù)學(xué)結(jié)構(gòu):人工神經(jīng)網(wǎng)絡(luò)、人類大腦的微型結(jié)構(gòu)復(fù)制品。
存在多種不同的神經(jīng)網(wǎng)絡(luò),主要取決于神經(jīng)元之間的連接的拓撲,所使用的聚合函數(shù)、閾值函數(shù)和反向傳播方法。這些數(shù)學(xué)方法都是人工智能領(lǐng)域的一部分,稱為“深度學(xué)習(xí)”,通常被分為兩部分:訓(xùn)練和推理。
根據(jù)要實現(xiàn)的目標(biāo)不同,絕大多數(shù)的神經(jīng)網(wǎng)絡(luò)都有著種類非常多的“訓(xùn)練”算法(有監(jiān)督的或無監(jiān)督的)。算法可根據(jù)在網(wǎng)絡(luò)輸入處呈現(xiàn)的數(shù)據(jù)集修改突觸權(quán)重。訓(xùn)練的目標(biāo)是使神經(jīng)網(wǎng)絡(luò)可以從示例中“學(xué)習(xí)”。
如果正確執(zhí)行訓(xùn)練,則網(wǎng)絡(luò)將提供與訓(xùn)練數(shù)據(jù)集的輸入值非常相似的輸出響應(yīng)。推理引擎是對應(yīng)于演繹推理的模擬的軟件算法,在深度學(xué)習(xí)的情況下是神經(jīng)網(wǎng)絡(luò)。該軟件通常嵌入在設(shè)備中。
在過去10年中,深度學(xué)習(xí)在許多領(lǐng)域都取得了進展?;趫D像的技術(shù)包括面部識別、虹膜和手勢監(jiān)控、對象和自由空間檢測,以及最新的行為識別。
從市場角度來看,從汽車上可以注意到最驚人的進展,因為這些用于高級駕駛輔助系統(tǒng)(ADAS)的技術(shù)被用在了檢測障礙物、識別指示牌、信號燈、汽車、行人以及其他類似的目標(biāo)上。圖像來自于布置在車身及其周圍的一系列攝像頭,而訓(xùn)練是在位于數(shù)據(jù)中心的特定的計算機上進行的。對于半自動駕駛的車輛,推理算法是內(nèi)嵌在引擎控制單元(ECU)內(nèi)的,對于機器人駕駛或全自動駕駛的車輛,推理算法是完全內(nèi)嵌在計算機內(nèi)的。
生物識別技術(shù)是深度學(xué)習(xí)被廣泛使用的另一個主要部分。我們發(fā)現(xiàn)它的算法用于個人身份驗證,例如最新的智能手機很多都采用3D面部識別。在國土安全領(lǐng)域,通過專用攝像機的使用,面部識別被用于邊境控制以及身份證明文件的制作。
基于深度學(xué)習(xí)的虹膜識別也越來越多地用于移動設(shè)備的個人身份認證。未來,我們可以在這一部分中添加行為識別,雖然目前仍處于研發(fā)階段,不過所取得的初步成果已經(jīng)令人鼓舞了。深度學(xué)習(xí)已經(jīng)可以集成在手勢識別中,但目前主要集中在娛樂、車載計算機、游戲和商用無人機控制領(lǐng)域。在過去10年中,很多公司在人工智能領(lǐng)域的投資持續(xù)增加。市場研究機構(gòu)Yole預(yù)計到2025年復(fù)合年增長率將達到50%,收入主要集中在使用深度學(xué)習(xí)的技術(shù)上。
不可否認,人工智能的發(fā)展也離不開專門的硬件開發(fā)。值得注意的是,視覺處理器的設(shè)計者和研發(fā)人員還通過嵌入式操作系統(tǒng)和軟件開發(fā)工具包(SDK)提供了軟件層。
這使得實施軟件解決方案變得非常容易,而且可以讓硬件的性能發(fā)揮到最大。市場上已經(jīng)有很多專屬于平臺的開發(fā)工具包可選,例如:ARM公司的embedOS、NVIDIA公司的Jetson、Xilinx公司的XSDK以及CEVA公司的CDNN工具包。
為嵌入式系統(tǒng)開發(fā)人工智能的企業(yè),必須在開發(fā)其解決方案時考慮這個后加的軟件層,并將其設(shè)計為與不同類型的硬件兼容。隨著其發(fā)展勢頭的繼續(xù),人工智能視覺系統(tǒng)將迎來一個光明的未來,無論是硬件層面、專用處理器市場,還是軟件層面,都將有越來越強大的算法,以期在物體、面部和手勢識別方面實現(xiàn)更高的精度。