【智能視覺影響人工智能的五大形式】智能視覺是人工智能的大門,如果不打開這扇大門,就沒有辦法深入研究人工智能。人的大腦皮層70%的活動都在處理視覺信息,視覺信息與聽覺信息、觸覺信息相比要重要得多。同理,如果沒有視覺信息的話,人工智能只是一個(gè)做符號推理的空架子。
智能視覺涉及心理物理學(xué)、計(jì)算機(jī)科學(xué)、圖像處理、模式識別、神經(jīng)生物學(xué)等諸多領(lǐng)域,主要指利用計(jì)算機(jī)來模擬人或再現(xiàn)與人類有關(guān)的某些智能行為的技術(shù),客觀的來說,這是從事物的圖像中提取信息進(jìn)行處理并加以理解,從而最終用于實(shí)際的生產(chǎn)生活中去的過程。
由此可見,圖像分析是智能視覺中最為重要的一環(huán)。圖像分析與圖像處理關(guān)系密切,兩者有一定程度的交叉,但是又有所不同。
圖像分析更側(cè)重點(diǎn)在于研究圖像的內(nèi)容,包括但不局限于使用圖像處理的各種技術(shù),它更傾向于對圖像內(nèi)容的分析、解釋、和識別;而圖像處理側(cè)重于信號處理方面的研究,如圖像對比度的調(diào)節(jié)、圖像編碼、去噪以及濾波的研究。
那么,智能視覺將通過哪些形式影響人工智能呢?
01 智能設(shè)備在視覺上開戰(zhàn)
隨著智能設(shè)備的系統(tǒng)越來越接近“人性化”即人工智能,它將更需要通過視覺途徑來學(xué)習(xí)和處理其他數(shù)據(jù),也因此,智能視覺技術(shù)爭奪戰(zhàn)即將打響。例如,亞馬遜最近為其以Alexa作為語音助手的智能設(shè)備Echo,添加了一臺攝像頭,而Google(Lens)和Facebook最近又發(fā)布了新的增強(qiáng)現(xiàn)實(shí)研究的聲明。
02 智能視覺引領(lǐng)無人駕駛
我們經(jīng)常會看到這樣的爭論:無人駕駛汽車是否需要激光雷達(dá)?僅依賴智能視覺的解決方案足夠嗎?對此,業(yè)界普遍認(rèn)為,汽車不僅僅需要智能視覺傳感器平臺——相機(jī),也需要比GPS更精確的LiDAR和高精度無線電導(dǎo)航,因?yàn)長iDAR和雷達(dá)通過范圍和角度來精確定位周圍環(huán)境中的實(shí)際物體,而智能視覺解決方案則應(yīng)用深度學(xué)習(xí)算法運(yùn)行圖像,取得預(yù)測的結(jié)果。然而,光學(xué)解決方案能在實(shí)際生活中識別某個(gè)地方的效果更好。
03 智能視覺是優(yōu)秀的“學(xué)習(xí)途徑”
機(jī)器不僅僅通過神經(jīng)網(wǎng)絡(luò)和機(jī)器學(xué)習(xí)來學(xué)習(xí),他們還通過其它方法來學(xué)會識別和分析他們周圍的世界。Google的科學(xué)家展示過一種技術(shù):通過將屋頂上的直線或紫色水果中所存在的偏差放大來判斷判定舊房子的結(jié)構(gòu)是否存在問題或者是某個(gè)西紅柿是否比其他的成熟的更好、更飽滿。這看似很簡單,卻是智能視覺的優(yōu)秀“教學(xué)”案例。
04 智能視覺優(yōu)化醫(yī)療診斷
病理學(xué)家平均每天有500張幻燈片要處理,而每張幻燈片又包含數(shù)十萬個(gè)需要分析的單個(gè)細(xì)胞,人類無法像計(jì)算機(jī)一樣高效的工作,醫(yī)生很容易遺漏癌細(xì)胞,造成誤判。智能視覺技術(shù)可以恰當(dāng)?shù)慕鉀Q這個(gè)問題:病理學(xué)家查看他們所熟悉的數(shù)據(jù),與那些由智能視覺系統(tǒng)處理過的圖像結(jié)合,基本上就可以確定癌癥的區(qū)域,然后醫(yī)生通過專門研究這些區(qū)域作出診斷。以乳腺癌研究為例,如果沒有智能視覺技術(shù),活檢只有85%的準(zhǔn)確率,而使用智能視覺作為輔助,錯(cuò)誤率將下降到只有5%。
05 智能視覺降低人工智能門檻
優(yōu)質(zhì)相機(jī)、傳感器和深度學(xué)習(xí)軟件庫等的商品化大大擴(kuò)展了智能視覺的使用范圍,我們看到許多新的初創(chuàng)公司的出現(xiàn)。不論是由街景視圖圖像生成人口分析報(bào)告的技術(shù),還是能夠?qū)κ鹿拾l(fā)生后汽車的損壞程度進(jìn)行評估并且計(jì)算出維修成本的應(yīng)用程序,我們可以看到智能視覺在多個(gè)方面已經(jīng)出現(xiàn)了讓人難以置信的商業(yè)化,這極大地推動了人工智能的發(fā)展。