【中國(guó)傳動(dòng)網(wǎng) 技術(shù)前沿】 近年來(lái),人工智能(AI)已經(jīng)成為了一種非常流行的表達(dá)方式。上個(gè)世紀(jì)是一個(gè)富有創(chuàng)新的世紀(jì),特別是在數(shù)學(xué)方面,為實(shí)現(xiàn)人工智能帶來(lái)了希望,可是很多技術(shù)上和概念上的差距讓各種各樣的方案都胎死腹中。然而,得益于過(guò)去20年來(lái)在計(jì)算能力、數(shù)據(jù)累積、數(shù)學(xué)工具等方面取得的巨大進(jìn)步,而且所有這些都能以更低的成本實(shí)現(xiàn),今天,人工智能已經(jīng)開(kāi)始融入各個(gè)行業(yè)。
為了使機(jī)器能夠理解周圍的世界,科技的發(fā)展從生物學(xué)方面獲得了啟發(fā)。通過(guò)眼睛可以獲得80%的信息,使得人類可以自我定位、并且和在他們視力范圍內(nèi)的世界進(jìn)行互動(dòng)。
因此,大多數(shù)人工智能方面的研究都是集中在分析來(lái)自于視覺(jué)系統(tǒng)圖像的能力上。來(lái)自于生物學(xué)方面的另一個(gè)啟發(fā)是允許機(jī)器分析這些圖像的數(shù)學(xué)結(jié)構(gòu):人工神經(jīng)網(wǎng)絡(luò)、人類大腦的微型結(jié)構(gòu)復(fù)制品。
存在多種不同的神經(jīng)網(wǎng)絡(luò),主要取決于神經(jīng)元之間的連接的拓?fù)洌褂玫木酆虾瘮?shù)、閾值函數(shù)和反向傳播方法。這些數(shù)學(xué)方法都是人工智能領(lǐng)域的一部分,稱為“深度學(xué)習(xí)”,通常被分為兩部分:訓(xùn)練和推理。
根據(jù)要實(shí)現(xiàn)的目標(biāo)不同,絕大多數(shù)的神經(jīng)網(wǎng)絡(luò)都有著種類非常多的“訓(xùn)練”算法(有監(jiān)督的或無(wú)監(jiān)督的)。算法可根據(jù)在網(wǎng)絡(luò)輸入處呈現(xiàn)的數(shù)據(jù)集修改突觸權(quán)重。訓(xùn)練的目標(biāo)是使神經(jīng)網(wǎng)絡(luò)可以從示例中“學(xué)習(xí)”。
如果正確執(zhí)行訓(xùn)練,則網(wǎng)絡(luò)將提供與訓(xùn)練數(shù)據(jù)集的輸入值非常相似的輸出響應(yīng)。推理引擎是對(duì)應(yīng)于演繹推理的模擬的軟件算法,在深度學(xué)習(xí)的情況下是神經(jīng)網(wǎng)絡(luò)。該軟件通常嵌入在設(shè)備中。
在過(guò)去10年中,深度學(xué)習(xí)在許多領(lǐng)域都取得了進(jìn)展?;趫D像的技術(shù)包括面部識(shí)別、虹膜和手勢(shì)監(jiān)控、對(duì)象和自由空間檢測(cè),以及最新的行為識(shí)別。
從市場(chǎng)角度來(lái)看,從汽車上可以注意到最驚人的進(jìn)展,因?yàn)檫@些用于高級(jí)駕駛輔助系統(tǒng)(ADAS)的技術(shù)被用在了檢測(cè)障礙物、識(shí)別指示牌、信號(hào)燈、汽車、行人以及其他類似的目標(biāo)上。圖像來(lái)自于布置在車身及其周圍的一系列攝像頭,而訓(xùn)練是在位于數(shù)據(jù)中心的特定的計(jì)算機(jī)上進(jìn)行的。對(duì)于半自動(dòng)駕駛的車輛,推理算法是內(nèi)嵌在引擎控制單元(ECU)內(nèi)的,對(duì)于機(jī)器人駕駛或全自動(dòng)駕駛的車輛,推理算法是完全內(nèi)嵌在計(jì)算機(jī)內(nèi)的。
生物識(shí)別技術(shù)是深度學(xué)習(xí)被廣泛使用的另一個(gè)主要部分。我們發(fā)現(xiàn)它的算法用于個(gè)人身份驗(yàn)證,例如最新的智能手機(jī)很多都采用3D面部識(shí)別。在國(guó)土安全領(lǐng)域,通過(guò)專用攝像機(jī)的使用,面部識(shí)別被用于邊境控制以及身份證明文件的制作。
基于深度學(xué)習(xí)的虹膜識(shí)別也越來(lái)越多地用于移動(dòng)設(shè)備的個(gè)人身份認(rèn)證。未來(lái),我們可以在這一部分中添加行為識(shí)別,雖然目前仍處于研發(fā)階段,不過(guò)所取得的初步成果已經(jīng)令人鼓舞了。深度學(xué)習(xí)已經(jīng)可以集成在手勢(shì)識(shí)別中,但目前主要集中在娛樂(lè)、車載計(jì)算機(jī)、游戲和商用無(wú)人機(jī)控制領(lǐng)域。在過(guò)去10年中,很多公司在人工智能領(lǐng)域的投資持續(xù)增加。市場(chǎng)研究機(jī)構(gòu)Yole預(yù)計(jì)到2025年復(fù)合年增長(zhǎng)率將達(dá)到50%,收入主要集中在使用深度學(xué)習(xí)的技術(shù)上。
不可否認(rèn),人工智能的發(fā)展也離不開(kāi)專門的硬件開(kāi)發(fā)。值得注意的是,視覺(jué)處理器的設(shè)計(jì)者和研發(fā)人員還通過(guò)嵌入式操作系統(tǒng)和軟件開(kāi)發(fā)工具包(SDK)提供了軟件層。
這使得實(shí)施軟件解決方案變得非常容易,而且可以讓硬件的性能發(fā)揮到最大。市場(chǎng)上已經(jīng)有很多專屬于平臺(tái)的開(kāi)發(fā)工具包可選,例如:ARM公司的embedOS、NVIDIA公司的Jetson、Xilinx公司的XSDK以及CEVA公司的CDNN工具包。
為嵌入式系統(tǒng)開(kāi)發(fā)人工智能的企業(yè),必須在開(kāi)發(fā)其解決方案時(shí)考慮這個(gè)后加的軟件層,并將其設(shè)計(jì)為與不同類型的硬件兼容。隨著其發(fā)展勢(shì)頭的繼續(xù),人工智能視覺(jué)系統(tǒng)將迎來(lái)一個(gè)光明的未來(lái),無(wú)論是硬件層面、專用處理器市場(chǎng),還是軟件層面,都將有越來(lái)越強(qiáng)大的算法,以期在物體、面部和手勢(shì)識(shí)別方面實(shí)現(xiàn)更高的精度。