国产在线丝袜美腿在线影视 ,欧美h版手机在线播放

【中國(guó)傳動(dòng)網(wǎng) 行業(yè)動(dòng)態(tài)】圖像識(shí)別技術(shù)是指利用計(jì)算機(jī)對(duì)圖像進(jìn)行處理、分析和理解，以識(shí)別各種不同模式的目標(biāo)和對(duì)像的技術(shù)。簡(jiǎn)單來(lái)說(shuō)，就是讓機(jī)器能夠通過(guò)對(duì)感知信息的處理像人類一樣讀懂圖片的內(nèi)容，而不是只看到像素?，F(xiàn)代社交網(wǎng)絡(luò)的發(fā)展帶來(lái)了海量圖片視頻信息，目前人類現(xiàn)有信息中百分之七十的信息為視頻圖片信息。伴隨著圖片成為人類社會(huì)中的主要信息載體，難題隨之出現(xiàn)。圖片給我們帶來(lái)了快捷的信息記錄和分享方式，卻無(wú)法高效的進(jìn)行檢索。在這樣的環(huán)境下，人工智能中的圖像識(shí)別技術(shù)就顯得尤為重要。本文將從圖像識(shí)別技術(shù)原理出發(fā)，介紹這一技術(shù)的前世今生，以前在各行業(yè)的具體應(yīng)用前景。

1、圖像識(shí)別技術(shù)原理

圖像識(shí)別技術(shù)其主要的作用就是按照所觀測(cè)到的圖像，對(duì)圖像中的物體進(jìn)行分辨，以此來(lái)做好相應(yīng)的具有意義的判斷，具體實(shí)現(xiàn)則是應(yīng)用現(xiàn)代信息處理技術(shù)，以及計(jì)算機(jī)技術(shù)對(duì)人類認(rèn)知過(guò)程進(jìn)行模擬。通常情況下，一個(gè)圖像識(shí)別系統(tǒng)由圖像分割、圖像特征提取、分類器的識(shí)別這三個(gè)部分所組成，其中，圖像分割主要的作用就是將圖像劃分成為多個(gè)區(qū)域；圖像特征提取則是對(duì)多個(gè)區(qū)域的圖像進(jìn)行相應(yīng)的特征提??；分類器的識(shí)別則是按照?qǐng)D像特征所提取的結(jié)果進(jìn)行適當(dāng)?shù)姆诸?。從某種程度來(lái)說(shuō)，圖像分割其本身就能將其稱之為圖像識(shí)別的過(guò)程。

借助圖像識(shí)別技術(shù)，我們不僅可以通過(guò)圖片搜索更快的獲取信息，還可以產(chǎn)生一種新的與外部世界交互的方式，甚至?xí)屚獠渴澜绺又悄艿倪\(yùn)行。隨著圖形識(shí)別技術(shù)的不斷進(jìn)步，越來(lái)越多的科技公司開(kāi)始涉及圖形識(shí)別領(lǐng)域，這標(biāo)志著讀圖時(shí)代正式到來(lái)，并且將引領(lǐng)我們進(jìn)入更加智能的未來(lái)。

2、圖像識(shí)別技術(shù)的前世今生

圖像識(shí)別的初級(jí)階段——娛樂(lè)化、工具化

在這個(gè)階段，用戶主要是借助圖像識(shí)別技術(shù)來(lái)滿足某些娛樂(lè)化需求。例如，百度魔圖的“大咖配”功能可以幫助用戶找到與其長(zhǎng)相最匹配的明星，百度的圖片搜索可以找到相似的圖片；Facebook研發(fā)了根據(jù)相片進(jìn)行人臉匹配的DeepFace；雅虎收購(gòu)的圖像識(shí)別公司IQEngine開(kāi)發(fā)的Glow可以通過(guò)圖像識(shí)別自動(dòng)生成照片的標(biāo)簽以幫助用戶管理手機(jī)上的照片；國(guó)內(nèi)專注于圖像識(shí)別的創(chuàng)業(yè)公司曠視科技成立了VisionHacker游戲工作室，借助圖形識(shí)別技術(shù)研發(fā)移動(dòng)端的體感游戲。

這個(gè)階段還有一個(gè)非常重要的細(xì)分領(lǐng)域——OCR（OpticalCharacterRecognition，光學(xué)字符識(shí)別），是指光學(xué)設(shè)備檢查紙上打印的字符，通過(guò)檢測(cè)暗、亮的模式確定其形狀，然后用字符識(shí)別方法將形狀翻譯成計(jì)算機(jī)文字的過(guò)程，就是計(jì)算機(jī)對(duì)文字的閱讀。語(yǔ)言和文字是我們獲取信息最基本、最重要的途徑。在比特世界，我們可以借助互聯(lián)網(wǎng)和計(jì)算機(jī)輕松的獲取和處理文字。但一旦文字以圖片的形式表現(xiàn)出來(lái)，就對(duì)我們獲取和處理文字平添了很多麻煩。這一方面表現(xiàn)為數(shù)字世界中由于特定原因被存儲(chǔ)稱圖片格式的文字；另一方面是我們?cè)诂F(xiàn)實(shí)生活中看到的所有物理形態(tài)的文字。所以我們需要借助OCR技術(shù)將這些文字和信息提取出來(lái)。在這方面，國(guó)內(nèi)產(chǎn)品包括百度的涂書(shū)筆記和百度翻譯等；而谷歌借助經(jīng)過(guò)DistBelief訓(xùn)練的大型分布式神經(jīng)網(wǎng)絡(luò)，對(duì)于Google街景圖庫(kù)的上千萬(wàn)門(mén)牌號(hào)的識(shí)別率超過(guò)90%，每天可識(shí)別百萬(wàn)門(mén)牌號(hào)。

在這個(gè)階段，圖像識(shí)別技術(shù)僅作為我們的輔助工具存在，為我們自身的人類視覺(jué)提供了強(qiáng)有力的輔助和增強(qiáng)，帶給了我們一種全新的與外部世界進(jìn)行交互的方式。我們可以通過(guò)搜索找到圖片中的關(guān)鍵信息；可以隨手拍下一件陌生物體而迅速找到與之相關(guān)的各類信息；可以將潛在搭訕對(duì)象拍下提前去她的社交網(wǎng)絡(luò)了解一番；也可以將人臉識(shí)別作為主要的身份認(rèn)證方式……這些應(yīng)用雖然看起來(lái)很普通，但當(dāng)圖像識(shí)別技術(shù)滲透到我們行為習(xí)慣的方方面面時(shí)，我們就相當(dāng)于把一部分視力外包給了機(jī)器，就像我們已經(jīng)把部分記憶外包給了搜索引擎一樣。

這將極大改善我們與外部世界的交互方式，此前我們利用科技工具探尋外部世界的流程是這樣：人眼捕捉目標(biāo)信息、大腦將信息進(jìn)行分析、轉(zhuǎn)化成機(jī)器可以理解的關(guān)鍵詞、與機(jī)器交互獲得結(jié)果。而當(dāng)圖像識(shí)別技術(shù)賦予了機(jī)器“眼睛”之后，這個(gè)過(guò)程就可以簡(jiǎn)化為：人眼借助機(jī)器捕捉目標(biāo)信息、機(jī)器和互聯(lián)網(wǎng)直接對(duì)信息進(jìn)行分析并返回結(jié)果。圖像識(shí)別使攝像頭成為解密信息的鑰匙，我們僅需把攝像頭對(duì)準(zhǔn)某一未知事物，就能得到預(yù)想的答案。就像百度科學(xué)家余凱所說(shuō)，攝像頭成為連接人和世界信息的重要入口之一。

圖像識(shí)別的高級(jí)階段——擁有視覺(jué)的機(jī)器

目前的圖像識(shí)別技術(shù)是作為一個(gè)工具來(lái)幫助我們與外部世界進(jìn)行交互，只為我們自身的視覺(jué)提供了一個(gè)輔助作用，所有的行動(dòng)還需我們自己完成。而當(dāng)機(jī)器真正具有了視覺(jué)之后，它們完全有可能代替我們?nèi)ネ瓿蛇@些行動(dòng)。目前的圖像識(shí)別應(yīng)用就像是盲人的導(dǎo)盲犬，在盲人行動(dòng)時(shí)為其指引方向；而未來(lái)的圖像識(shí)別技術(shù)將會(huì)同其他人工智能技術(shù)融合在一起成為盲人的全職管家，不需要盲人進(jìn)行任何行動(dòng)，而是由這個(gè)管家?guī)椭渫瓿伤惺虑?。舉個(gè)例子，如果圖像識(shí)別是一個(gè)工具，就如同我們?cè)隈{駛汽車時(shí)佩戴谷歌眼鏡，它將外部信息進(jìn)行分析后傳遞給我們，我們?cè)僖罁?jù)這些信息做出行駛決策；而如果將圖像識(shí)別利用在機(jī)器視覺(jué)和人工智能上，這就如同谷歌的無(wú)人駕駛汽車，機(jī)器不僅可以對(duì)外部信息進(jìn)行獲取和分析，還全權(quán)負(fù)責(zé)所有的行駛活動(dòng)，讓我們得到完全解放。

《人工智能：一種現(xiàn)代方法》中提到，在人工智能中，感知是通過(guò)解釋傳感器的響應(yīng)而為機(jī)器提供它們所處的世界的信息，其中它們與人類共有的感知形態(tài)包括視覺(jué)、聽(tīng)覺(jué)和觸覺(jué)，而視覺(jué)最為重要，因?yàn)橐曈X(jué)是一切行動(dòng)的基礎(chǔ)。在一次論壇上百度IDL的余凱院長(zhǎng)問(wèn)大家，你覺(jué)得哪種感覺(jué)最重要？沒(méi)有人能很快作答，后來(lái)余凱院長(zhǎng)換了個(gè)提問(wèn)方式，如果要放棄一種感覺(jué)，你最不愿意放棄的是那一種？這時(shí)大家都回答是視覺(jué)。ChrisFrith在《心智的構(gòu)建》中提到，我們對(duì)世界的感知不是直接的，而是依賴于“無(wú)意識(shí)推理”，也就是說(shuō)在我們能感知物體之前，大腦必須依據(jù)到達(dá)感官的信息來(lái)推斷這個(gè)物體可能是什么，這構(gòu)成了人類最重要的預(yù)判和處理突發(fā)時(shí)間的能力。而視覺(jué)是這個(gè)過(guò)程中最及時(shí)和準(zhǔn)確的信息獲取渠道，人類感覺(jué)信息中的80%都是視覺(jué)信息。機(jī)器視覺(jué)之于人工智能的意義就是視覺(jué)之于人類的意義，而決定著機(jī)器視覺(jué)的就是圖像識(shí)別技術(shù)。

更重要的是，在某些應(yīng)用場(chǎng)景，機(jī)器視覺(jué)比人類的生理視覺(jué)更具優(yōu)勢(shì)，它更加準(zhǔn)確、客觀和穩(wěn)定。人類視覺(jué)有著天然的局限，我們看起來(lái)能立刻且毫無(wú)費(fèi)力的感知世界，而且似乎也能詳細(xì)生動(dòng)的感知整個(gè)視覺(jué)場(chǎng)景，但這只是一個(gè)錯(cuò)覺(jué)，只有投射到眼球中心的視覺(jué)場(chǎng)景的中間部分，我們才能詳細(xì)而色彩鮮明的看清楚。偏離中間大約10度的位置，神經(jīng)細(xì)胞更加分散并且智能探知光和陰影。也就是說(shuō)，在我們視覺(jué)世界的邊緣是無(wú)色、模糊的。因此，我們才會(huì)存在“變化盲視”，才會(huì)在經(jīng)歷著多樣事物發(fā)生時(shí)，僅僅關(guān)注其中一樣，而忽視了其他樣事物的發(fā)生，而且不知道它們的發(fā)生。而機(jī)器在這方面就有著更多的優(yōu)勢(shì)，它們能夠發(fā)現(xiàn)和記錄視力所及范圍內(nèi)發(fā)生的所有事情。拿應(yīng)用最廣的視頻監(jiān)控來(lái)說(shuō)，傳統(tǒng)監(jiān)控需要有人在電視墻前時(shí)刻保持高度警惕，然后再通過(guò)自己對(duì)視頻的判斷來(lái)得出結(jié)論，但這往往會(huì)因?yàn)槿说钠?、視覺(jué)局限和注意力分散等原因影響監(jiān)控效果。但有了成熟的圖像識(shí)別技術(shù)之后，再加以人工智能的支持，計(jì)算機(jī)就可以自行對(duì)視頻進(jìn)行分析和判斷，發(fā)現(xiàn)異常情況直接報(bào)警，帶來(lái)了更高的效率和準(zhǔn)確度；在反恐領(lǐng)域，借助機(jī)器的人臉識(shí)別技術(shù)也要遠(yuǎn)遠(yuǎn)優(yōu)于人的主觀判斷。

許多科技巨頭也開(kāi)始了在圖像識(shí)別和人工智能領(lǐng)域的布局，F(xiàn)acebook簽下的人工智能專家YannLeCun最重大的成就就是在圖像識(shí)別領(lǐng)域，其提出的LeNet為代表的卷積神經(jīng)網(wǎng)絡(luò)，在應(yīng)用到各種不同的圖像識(shí)別任務(wù)時(shí)都取得了不錯(cuò)效果，被認(rèn)為是通用圖像識(shí)別系統(tǒng)的代表之一；Google借助模擬神經(jīng)網(wǎng)絡(luò)“DistBelief”通過(guò)對(duì)數(shù)百萬(wàn)份YouTube視頻的學(xué)習(xí)自行掌握了貓的關(guān)鍵特征，這是機(jī)器在沒(méi)有人幫助的情況下自己讀懂了貓的概念。值得一提的是，負(fù)責(zé)這個(gè)項(xiàng)目的AndrewNG已經(jīng)轉(zhuǎn)投百度領(lǐng)導(dǎo)百度研究院，其一個(gè)重要的研究方向就是人工智能和圖像識(shí)別。這也能看出國(guó)內(nèi)科技公司對(duì)圖像識(shí)別技術(shù)以及人工智能技術(shù)的重視程度。

3、圖像識(shí)別技術(shù)的行業(yè)應(yīng)用

盡管還未達(dá)到真正的人工智能，但日漸成熟的圖像識(shí)別技術(shù)已開(kāi)始探索各類行業(yè)的應(yīng)用。當(dāng)前，圖像識(shí)別技術(shù)已成功應(yīng)用到工業(yè)機(jī)器人、自動(dòng)駕駛、醫(yī)療診斷、安防監(jiān)控和工業(yè)檢測(cè)等多個(gè)領(lǐng)域。其中，圖像識(shí)別在工業(yè)中的應(yīng)用最為廣泛，而工業(yè)中又以電子制造占比最大，約占40%至50%。隨著科技業(yè)新技術(shù)迭出，圖像識(shí)別的應(yīng)用領(lǐng)域窗口將被打開(kāi)，未來(lái)這一應(yīng)用技術(shù)將擴(kuò)展至消費(fèi)電子、可穿戴式裝置、汽車先進(jìn)駕駛輔助系統(tǒng)、智能化監(jiān)控等更貼近大眾生活的領(lǐng)域以及當(dāng)前各炙手可熱的新興行業(yè)。

（1）圖像識(shí)別技術(shù)在安防行業(yè)大顯身手

在AI的賦能下，圖像識(shí)別技術(shù)在安防領(lǐng)域可謂是如虎添翼，大顯身手。對(duì)于掌握了許多視頻圖像資源的安防行業(yè)來(lái)說(shuō)，深度學(xué)習(xí)和安防的結(jié)合擁有比較高的契合度。公安行業(yè)借助智能視頻分析主要用于實(shí)現(xiàn)城市道路、廣場(chǎng)及各類重點(diǎn)場(chǎng)所的人、車、物等目標(biāo)的識(shí)別，提取包括人的性別、人臉、全身等信息，車的車標(biāo)、車牌、車身顏色等信息，這些信息均可提煉為計(jì)算機(jī)能識(shí)別的結(jié)構(gòu)化數(shù)據(jù)，送入后端進(jìn)行專業(yè)的安全管理應(yīng)用，主要包括實(shí)時(shí)布控、高危人員比對(duì)、以圖搜圖、多點(diǎn)碰撞、語(yǔ)義搜索等方面。

（2）圖像識(shí)別技術(shù)助力農(nóng)林業(yè)

在農(nóng)林行業(yè)，圖像識(shí)別技術(shù)已經(jīng)得到應(yīng)用。例如，木材的生產(chǎn)包含多個(gè)環(huán)節(jié)，過(guò)去這些環(huán)節(jié)往往牽涉到大量的人力投入。如今，圖像識(shí)別已在多個(gè)環(huán)節(jié)中得到應(yīng)用，例如森林調(diào)查，通過(guò)無(wú)人機(jī)對(duì)圖像進(jìn)行采集，再通過(guò)圖像分析系統(tǒng)對(duì)森林樹(shù)種的覆蓋比例、林木的健康狀況進(jìn)行分析，從而可以做出更科學(xué)的開(kāi)采方案。而原木檢驗(yàn)方面，圖像識(shí)別可以快速對(duì)木材的樹(shù)種、優(yōu)劣、規(guī)格進(jìn)行判斷，省去了大量人工參與的環(huán)節(jié)。

（3）圖像識(shí)別技術(shù)應(yīng)用于金融領(lǐng)域

在金融領(lǐng)域，身份識(shí)別和智能支付將提高身份安全性與支付的效率和質(zhì)量。比如，在傳統(tǒng)金融中，用戶在申請(qǐng)銀行貸款或證券開(kāi)戶時(shí)，均必須到實(shí)體門(mén)店上做身份信息核實(shí)，完成面簽。如今，通過(guò)人臉識(shí)別技術(shù)，用戶只需要打開(kāi)手機(jī)攝像頭，自拍一張照片，系統(tǒng)將會(huì)做一個(gè)活體檢測(cè)，并進(jìn)行一系列的驗(yàn)證、匹配和判定，最終會(huì)判斷這個(gè)照片是否是用戶本人操作，完成身份核實(shí)。

（4）圖像識(shí)別技術(shù)應(yīng)用于智能家居

在智能家居領(lǐng)域，通過(guò)攝像頭獲取到圖像，然后通過(guò)圖像識(shí)別技術(shù)識(shí)別出圖像的內(nèi)容，從而做出不同的響應(yīng)。舉個(gè)例子，我們?cè)陂T(mén)口安裝了攝像頭，當(dāng)有物體出現(xiàn)在攝像頭范圍內(nèi)的時(shí)候，攝像頭自動(dòng)拍攝下圖像進(jìn)行識(shí)別，如果發(fā)現(xiàn)是可疑的人或物體，就可以及時(shí)報(bào)警給戶主。如果圖像和主人的面部匹配，則會(huì)主動(dòng)為主人開(kāi)門(mén)。

還有家庭用的智能機(jī)器人，通過(guò)圖像識(shí)別技術(shù)可以對(duì)物體進(jìn)行識(shí)別，并且實(shí)現(xiàn)對(duì)人的跟隨，搭配上人工智能系統(tǒng)，它能分辨出你是它的哪個(gè)主人，并且能你進(jìn)行一些簡(jiǎn)單的互動(dòng)，比如檢測(cè)到是家里的老人，它可能會(huì)為你測(cè)一測(cè)血壓，如果是小孩子，它可能給你講個(gè)故事。

（5）圖像識(shí)別技術(shù)促進(jìn)電商發(fā)展，幫你尋找喜歡的衣服鞋子

網(wǎng)購(gòu)時(shí)消費(fèi)者使用的“相似款（拍照識(shí)別/掃描識(shí)別）”搜索功能，就是基于圖像識(shí)別技術(shù)，當(dāng)消費(fèi)者將鼠標(biāo)停留在感興趣的商品上后，就可以選擇查看相似的款式；同時(shí)通過(guò)調(diào)整算法，還能夠更好的猜測(cè)消費(fèi)者的意圖，搜素結(jié)果即使不能提供完全匹配的商品，也會(huì)為消費(fèi)者推薦最為相關(guān)的商品，盡量滿足消費(fèi)者的購(gòu)物需求。這對(duì)于商家來(lái)說(shuō)，也是一種從外界導(dǎo)流和提高移動(dòng)端用戶黏度的方式之一。

（6）圖像識(shí)別技術(shù)助力醫(yī)學(xué)影像智能識(shí)別

醫(yī)生資源短缺將促進(jìn)AI智能影像識(shí)別的應(yīng)用落地。將圖像識(shí)別技術(shù)應(yīng)用到醫(yī)療領(lǐng)域，可以更精準(zhǔn)更快速地分辨X光片、MRI和CT掃描圖片，上至診斷預(yù)防癌癥，下至加速發(fā)現(xiàn)治病救命的新藥。一個(gè)放射科醫(yī)生一生可能會(huì)看上萬(wàn)張掃描圖像，但是，一臺(tái)計(jì)算機(jī)可能會(huì)看上千萬(wàn)張。智能影像識(shí)別市場(chǎng)分類多空間大，人工智能方法在醫(yī)學(xué)圖像處理中的應(yīng)用十分廣泛，涉及醫(yī)學(xué)圖像分割、圖像配準(zhǔn)、圖像融合、圖像壓縮、圖像重建等多個(gè)領(lǐng)域。

（7）圖像識(shí)別技術(shù)助力智慧交通

具有分析、感知能力的智能攝像機(jī)通過(guò)視頻識(shí)別分析技術(shù)，可對(duì)每輛車進(jìn)行完整的違法行為分析、識(shí)別、抓拍和錄像，記錄車輛違法的整個(gè)過(guò)程，再將每條記錄生成非結(jié)構(gòu)化的視頻、照片數(shù)據(jù)和結(jié)構(gòu)化的文本數(shù)據(jù)提交給后端智能管理與分析系統(tǒng)，由系統(tǒng)進(jìn)行高度智能的交通違法行為處理?；谥悄芤曨l分析技術(shù)，智能交通管理系統(tǒng)還能得出不同品牌的車型擁有量、過(guò)車高峰期、車輛進(jìn)出城高峰期及行駛方向等豐富的交通數(shù)據(jù)，為城市交通流量管控、交通道路規(guī)劃等提供詳實(shí)的數(shù)據(jù)支撐。

總之，圖像識(shí)別技術(shù)，連接著機(jī)器和這個(gè)一無(wú)所知的世界，幫助它越發(fā)了解這個(gè)世界，并最終代替我們完成更多的任務(wù)。