當你工作累了一天回家休息,你說“放一首歌吧”,然后智能音箱就自動放出你最喜歡的歌曲。當你在超市里堆滿購物車后,只需對著攝像頭進行人臉識別從而完成支付,甚至可以不用掏出手機。
這就是人工智能在生活中的應用。隨著人工智能在語音識別與合成、圖像識別、自然語義理解等方向取得突破,越來越多的生活場景開始出現(xiàn)人工智能的應用。
當復雜的垃圾需要分類處理時,人們也想到了人工智能,并期望它能夠幫助他們做出判斷。2019年7月,上海率先開始實行區(qū)域性的生活垃圾管理條例,隨后北京傳出也將出臺相關制度。
互聯(lián)網(wǎng)巨頭如阿里巴巴、騰訊開始推出垃圾識別的應用程序,其背后通過物品的視覺識別做出垃圾分類的判斷。一些此前并不涉及垃圾行業(yè)的企業(yè)如平安、中國電信也開始利用人工智能的技術推出不同的解決方案。打開應用商店,更是出現(xiàn)了近百個垃圾分類的應用,記者通過下載測試發(fā)現(xiàn),其大多數(shù)為個人開發(fā)者制作,由于技術能力的限制,他們更多選擇語音對話的形式完成,也有部分具備了圖片識別的能力。
然而,當人們使用這些應用后會有這樣的疑問,這些應用真的提高效率了嗎?有人工智能公司的技術專家告訴記者,這些匆忙發(fā)布的產(chǎn)品,很多數(shù)據(jù)訓練的樣本并不足以支持其滿足日常使用的準確率,“他們的識別率只有20%~30%”。
讓機器理解干垃圾和濕垃圾是個難題
微軟亞洲研究院主管研究員傅建龍告訴記者,目前來看,視覺識別技術落地在垃圾分類領域主要有三個難題,分別是核心技術算法,產(chǎn)品的設計以及使用習慣難以被改變。在這背后,當商品成為垃圾后,其發(fā)生的變化使其定義復雜化,也就是“非標準化”。
然而,計算機的優(yōu)勢就是處理定義好的問題,并且問題中有大量數(shù)據(jù)可以學習。通常情況,無論是語音,還是圖像,機器想要認識它,就必須經(jīng)過兩個過程,也就是人工智能技術成為產(chǎn)品的兩個階段,分別被稱之為“訓練”算法和利用算法“推理”結(jié)論。
無論是在訓練階段,還是在推理階段,投入大量的樣本數(shù)據(jù)是提高識別率的必要條件。傅建龍表示,在此前的嘗試中,他們也曾投入過小樣本數(shù)據(jù)進行模擬訓練,也就是讓計算機對一個類別通過對幾百個樣本學習,達到可以做出判斷的程度。但在這個過程中,他們發(fā)現(xiàn)了一個問題,就是垃圾本身不僅類別廣,而且總有新的類別產(chǎn)生,影響判斷。
在推理階段,如何讓機器理解干垃圾和濕垃圾本身也是一個難題。這就像計算機很容易識別出一把雨傘,但很難理解人將使用雨傘去遮陽,還是去擋雨。在學會這個問題的階段,計算機需要專業(yè)知識的輸入來學習和理解真正的意圖,或者說是為垃圾引入“上下文”。
因此,對于前端用戶用手機拍攝識別的過程,多數(shù)受訪人工智能專家并不認為技術目前可以取代人眼的效率。
金融壹賬通智能風控總經(jīng)理、人工智能研究院首席科學家施奕明表示,針對部分用戶來說,拍照識別是一個比較高效的輔助方式。因為其看到在已經(jīng)實施垃圾分類的上海,需要大批志愿者幫助用戶進行垃圾分類和檢查是否正確,這需要大量的人工,而且工作也非常艱巨。作為平安旗下的業(yè)務部門,其在2-3周的時間內(nèi)發(fā)布了一款垃圾分類的小程序。
混合垃圾識別困難,機器需要更多樣本學習
從垃圾箱到處理廠后,垃圾的數(shù)量急劇上升,這為人工智能提供了大量的樣本可以學習。曠視研究院研發(fā)總監(jiān)、檢測組組長俞剛告訴記者,在垃圾回收站做批量分揀,這時AI視覺應用將極大利于效率的提升。
在這個環(huán)節(jié),目前視覺識別技術也只是萌芽。拍攝圖像分類的問題解決后,更重要的是還需要解決識別物體是什么,以及從混合在一起的垃圾中識別更加的困難,因為要避免遮擋以及物體變形對識別的影響。一位人工智能獨角獸公司的專家告訴記者,“人可以推理,但機器需要更多的樣本學習,目前算法和人的肉眼識別還有一定的差距。”
不過,傅建龍告訴記者,目前計算機視覺識別新的研究方法就是計算機對物體抽取一個部分進行識別,從而確定物體本身。如果被遮擋的物體露出了相應的識別點,就可以被機器捕捉。此外,新的研究方向?qū)⒖梢詮?D到3D進行轉(zhuǎn)化,并進行多視角建模,未來也將一定程度上解決遮擋問題。
在實際應用中,上述人工智能專家表示,海外企業(yè)使用了多個傳感器和機械臂結(jié)合,垃圾在傳送過程中就被自動分類抓取。這種商業(yè)模式的產(chǎn)生,是人力成本的增長。但隨著人工智能技術成熟,會給工廠帶來更大的成本節(jié)省。
在這種模式下,視覺識別的算法需要與機械臂聯(lián)動,而這其中需要一整套的系統(tǒng)解決方案。目前比較大的問題是,需要針對需求進行定制,不同區(qū)域不同的分類標準都需要做精準的調(diào)整,因為必須要達到人工的水平,甚至要超過人工,這樣的投入才有意義。