近日,專注于計(jì)算機(jī)視覺和深度學(xué)習(xí)的AI企業(yè)商湯科技宣布完成4.1億美元B輪融資,創(chuàng)下全球人工智能領(lǐng)域單輪融資最高紀(jì)錄,這條新聞引爆了行業(yè)熱點(diǎn)。商湯科技憑借著“計(jì)算機(jī)視覺”這一黑科技獲得巨額融資,那么什么是計(jì)算機(jī)視覺呢?
近年來,為了讓機(jī)器更像人,能夠認(rèn)知事物,從而進(jìn)行判定和深度學(xué)習(xí),計(jì)算機(jī)視覺技術(shù)方法與應(yīng)用發(fā)展迅速。計(jì)算機(jī)視覺研究如何讓計(jì)算機(jī)可以像人類一樣去理解圖片、視頻等多媒體資源內(nèi)容。例如用攝影機(jī)和計(jì)算機(jī)代替人眼對(duì)目標(biāo)進(jìn)行識(shí)別、跟蹤和測量等,并進(jìn)一步處理成更適合人眼觀察或進(jìn)行儀器檢測的圖像。近些年在海量的圖像數(shù)據(jù)集、機(jī)器學(xué)習(xí)(深度學(xué)習(xí))方法以及性能日益提升的計(jì)算機(jī)支持下,計(jì)算機(jī)視覺領(lǐng)域的技術(shù)與應(yīng)用均得到迅速發(fā)展。
當(dāng)下機(jī)器視覺技術(shù)已經(jīng)滲入到我們的日常生活中,從手機(jī)里的美顏APP面目識(shí)別功能、人臉相冊分類,到支付寶面部識(shí)別身份驗(yàn)證、儲(chǔ)物柜人臉識(shí)別,以及工業(yè)機(jī)器人對(duì)物體準(zhǔn)確抓取、物流機(jī)器人障礙避讓等等都是運(yùn)用了計(jì)算機(jī)視覺技術(shù)。
國內(nèi)外眾多知名機(jī)構(gòu)在計(jì)算機(jī)視覺不同方向均有涉及,國內(nèi)更是涌現(xiàn)出一批相關(guān)的明星創(chuàng)業(yè)團(tuán)隊(duì)。除了耳熟能詳?shù)腉oogle、微軟、Facebook等工業(yè)界科技巨頭有所涉及之外,一些著名高校也設(shè)有專門的實(shí)驗(yàn)室,如斯坦福、麻省理工以及伯克利等。國內(nèi)則涌現(xiàn)出一批以依圖、商湯、曠視、云從以及格靈深瞳等為首的創(chuàng)業(yè)公司,技術(shù)團(tuán)隊(duì)核心成員大多擁有前述工業(yè)界及學(xué)術(shù)界知名機(jī)構(gòu)的研究經(jīng)驗(yàn)。
下面小編就詳細(xì)梳理一下計(jì)算機(jī)視覺的應(yīng)用領(lǐng)域:
人臉識(shí)別
“人臉識(shí)別”是人工智能“計(jì)算機(jī)視覺”領(lǐng)域中最熱門的應(yīng)用,今年2月,《麻省理工科技評(píng)論》發(fā)布“2017全球十大突破性技術(shù)”榜單,來自中國的技術(shù)“刷臉支付”位列其中,今后靠臉吃飯完全不是問題。這是該榜單創(chuàng)建16年來首個(gè)來自中國的技術(shù)突破。人臉識(shí)別技術(shù)目前已經(jīng)廣泛應(yīng)用于金融、司法、軍隊(duì)、公安、邊檢、政府、航天、電力、工廠、教育、醫(yī)療等行業(yè)。據(jù)業(yè)內(nèi)人士分析,我國的人臉識(shí)別產(chǎn)業(yè)的需求旺盛,需求推動(dòng)導(dǎo)致企業(yè)敢于投入資金。目前,該技術(shù)已具備大規(guī)模商用的條件,未來三到五年將高速增長。而今年,這一技術(shù)有望在金融與安防領(lǐng)域迎來大爆發(fā)。
視頻監(jiān)控分析
人工智能技術(shù)可以對(duì)結(jié)構(gòu)化的人、車、物等視頻內(nèi)容信息進(jìn)行快速檢索、查詢。這項(xiàng)應(yīng)用使得讓公安系統(tǒng)在繁雜的監(jiān)控視頻中搜尋到罪犯的有了可能。在大量人群流動(dòng)的交通樞紐,該技術(shù)也被廣泛用于人群分析、防控預(yù)警等。
視頻監(jiān)控領(lǐng)域盈利空間廣闊,商業(yè)模式多種多樣,既可以提供行業(yè)整體解決方案,也可以銷售集成硬件設(shè)備。將技術(shù)應(yīng)用于視頻及監(jiān)控領(lǐng)域在人工智能公司中正在形成一種趨勢,這項(xiàng)技術(shù)應(yīng)用將率先在安防、交通甚至零售等行業(yè)掀起應(yīng)用熱潮。
工業(yè)視覺檢測
機(jī)器視覺可以快速獲取大量信息,并進(jìn)行自動(dòng)處理。在自動(dòng)化生產(chǎn)過程中,人們將機(jī)器視覺系統(tǒng)廣泛地用于工況監(jiān)視、成品檢驗(yàn)和質(zhì)量控制等領(lǐng)域。
機(jī)器視覺系統(tǒng)的特點(diǎn)是提高生產(chǎn)的柔性和自動(dòng)化程度。運(yùn)用在一些危險(xiǎn)工作環(huán)境或人工視覺難以滿足要求的場合;此外,在大批量工業(yè)生產(chǎn)過程中,機(jī)器視覺檢測可以大大提高生產(chǎn)效率和生產(chǎn)的自動(dòng)化程度。
醫(yī)療影像診斷
醫(yī)療數(shù)據(jù)中有超過90%的數(shù)據(jù)來自醫(yī)療影像。醫(yī)療影像領(lǐng)域擁有孕育深度學(xué)習(xí)的海量數(shù)據(jù),醫(yī)療影像診斷可以輔助醫(yī)生,提升醫(yī)生的診斷的效率。
2015年4月,IBM成立了WatsonHealth部門,開始進(jìn)軍醫(yī)療行業(yè)。2015年8月6日,IBM宣布以10億美元的價(jià)格收購醫(yī)療影像公司MergeHealthcare,并將其與新成立的WatsonHealth合并。2016年2月,IBM又斥資26億美元收購醫(yī)療數(shù)據(jù)公司TruvenHealthAnalytics。今年2月份,在HIMSS17大會(huì)上WatsonHealth公布了IBM的第一個(gè)認(rèn)知影像產(chǎn)品WatsonCliNIcalImagingReview,該產(chǎn)品可檢查包括圖像在內(nèi)的醫(yī)療數(shù)據(jù),幫助醫(yī)療服務(wù)提供商識(shí)別需要關(guān)注的最危急情況。
文字識(shí)別
計(jì)算機(jī)文字識(shí)別,俗稱光學(xué)字符識(shí)別,它是利用光學(xué)技術(shù)和計(jì)算機(jī)技術(shù)把印在或?qū)懺诩埳系奈淖肿x取出來,并轉(zhuǎn)換成一種計(jì)算機(jī)能夠接受、人又可以理解的格式。這是實(shí)現(xiàn)文字高速錄入的一項(xiàng)關(guān)鍵技術(shù)。
今年三月份,??低曆芯吭侯A(yù)研團(tuán)隊(duì)基于深度學(xué)習(xí)技術(shù)的OCR(OpticalCharacterRecognition,圖像中文字識(shí)別)技術(shù),刷新了ICDARRobustReading競賽數(shù)據(jù)集的全球最好成績,并在「互聯(lián)網(wǎng)圖像文字」、「對(duì)焦自然場景文字」和「隨拍自然場景文字」三項(xiàng)挑戰(zhàn)的文字識(shí)別(WordRecognition)任務(wù)中取得第一。同期參賽的有來自82個(gè)國家的2367支隊(duì)伍參加,其中包括Google、微軟、百度、三星、曠視等團(tuán)隊(duì)。
如今“計(jì)算機(jī)視覺”成為了小風(fēng)口,大量資本涌入,而2017年可能將是人臉識(shí)別產(chǎn)業(yè)應(yīng)用產(chǎn)生突破性進(jìn)展的一年。人臉識(shí)別和視頻監(jiān)控兩大方向最受資本青睞,同時(shí)技術(shù)也在尋找其他方向的突破。
更多資訊請(qǐng)關(guān)注工業(yè)機(jī)器人頻道