你可能每天都在使用計算機視覺系統(tǒng),甚至感受不到它的存在。你有沒有使用過Snapchat上提供的最新濾鏡?這就是計算機視覺的產物。你有沒有使用iPhone上的人臉解鎖功能?這也是計算機視覺的體現。你有沒有使用手機將自己的工資轉到指定的銀行卡當中,并直接從銀行賬戶內提取現金?沒錯,這還是計算機視覺的應用。
我們所知的計算機視覺技術正處于發(fā)展的臨界點。由于行業(yè)范圍內的開發(fā)工作以及深度學習算法與圖形處理器的快速進步,我們正迎來一系列十年前難以想象的成果。
這項技術的一部分成果早在幾年之前就已經存在,但過去一年的幾項重大發(fā)展令計算機視覺達到了新的高度。更強大的傳感器、大量標記圖像、易于使用的深度學習軟件再加上不斷改進的處理器,共同將此前只能由少數幾家巨頭級科技企業(yè)掌握的計算機視覺交付給普羅大眾。
亞馬遜公司發(fā)布的Rekognition服務將計算機視覺功能推廣至每一位開發(fā)人員手中。微軟為其OneDrive以及SharePoint提供新的AI服務。谷歌照片也借此讓我們的回憶變得可供搜索。
看起來,未來似乎就在當下。
充滿無限可能的世界
在2018年,我們看到一系列雄心勃勃的計算機視覺項目先后涌現,這意味著該項技術的應用效果終于趕上了開發(fā)人員長久以來的期望。這同時也意味著開發(fā)定制化計算機視覺應用將很快變得成本低廉、極具可行性。
舉例來說,ModiFace允許用戶利用智能手機進行化妝。Topology公司則讓用戶能夠通過手機試戴各款眼鏡。MTailor使用類似的技術為您定制牛仔褲與襯衫。除了時尚行業(yè)之外,PotteryBarin允許用戶查看新家具擺在家中的樣子,Hover則允許用戶將家居照片轉換為尺寸準確的3D模型。
這些項目雖然不像自動駕駛汽車或者無人雜貨店那么復雜,但同樣預示著現有計算機視覺產品有望在未來幾年中得到大規(guī)模普及:一旦小型企業(yè)有能力開發(fā)出針對大眾群體的計算機視覺產品,此項技術則將快速滲透至我們生活中的幾乎每個角落。
計算機視覺為何值得關注?
計算機視覺與其它人工智能技術有所不同。首先,對于大多數組織而言,計算機視覺是一項全新的功能,而非像預測分析那樣只是對原有解決方案的一種漸進式改善。
此外,計算機視覺還能夠以無障礙方式改善人類的感知能力。當這些算法從圖像當中推斷出信息時,其并不像其它人工智能方案那樣是在對本質上充滿不確定性的未來做出預測;相反,它們只是在判斷關于圖像或圖像集中當前內容的分類真相。這意味著計算機視覺將隨著時間推移而變得愈發(fā)準確,直到其達到甚至超越人類的圖像識別能力。
最后,計算機視覺能夠以遠超其它AI工具的速度收集訓練數據。大數據集的主要成本體現在訓練數據的收集層面,但計算機視覺只需要由人類對圖片及視頻內容進行準確標記——這項工作的難度明顯很低。正因為如此,近年來計算機視覺技術的采用率才得到迅猛提升。
2019年之后的計算機視覺前景
雖然我們已經開始在消費級產品當中看到計算機視覺技術,但其中大部分方案將繼續(xù)面向特定行業(yè)中的特定用途。舉例來說,CCCInformationServices正在幫助汽車保險公司利用熱圖識別車輛損壞情況——該熱圖能夠高亮顯示出損壞程度最高的位置。
這類計算機視覺產品可能不夠驚艷,但最重要的是這些新的應用方式意味著開發(fā)人員能夠更輕松地判斷信息是有效還是無效——如此一來,我們才能一步步邁向智慧城市這類規(guī)模極為龐大的項目。
亞馬遜、微軟以及谷歌在2018年展示的最新突破性進展也成為推動計算機視覺迎來發(fā)展轉折點的催化劑。產品設計師與人工智能工程師已經開始研究利用計算機視覺與增強現實技術建立新型解決方案。硬件制造商正在改進組件性能并提高成本效益,從而確保該項技術在實際表現與使用門檻方面皆有所改善。
在不久的未來,計算機視覺領域最重要的創(chuàng)新成果應該體現在訓練數據層面。目前,人類仍需要以手動方式標記圖像內容以訓練計算機視覺AI。(大家可能填寫過網頁表單,其中要求您從網格當中選擇一些圖像來指示像店面或者汽車這類常見的對象。在執(zhí)行這些操作時,您實際上已經在為計算機視覺項目創(chuàng)建標記數據。)
不過隨著技術的進步,人工智能將最終實現自我訓練,這將進一步簡化流程并加快模型的改進速度。
計算機視覺市場規(guī)模的增長速度幾乎與能力提升保持同步:預計到2025年,市場總量將達到262億美元,即年均復合增長率超過30%。人工智能代表著未來,而計算機視覺則是人工智能最為有力的表現形式。很快,計算機視覺應用將隨處可見——以至于大家甚至不會注意到它的存在。
聲明:本文為轉載類文章,如涉及版權問題,請及時聯系我們刪除(QQ:2737591964),不便之處,敬請諒解!