打開(kāi)谷歌(微博)翻譯APP,將手機(jī)鏡頭對(duì)準(zhǔn)你看不懂的外語(yǔ),然后屏幕上便自動(dòng)顯示翻譯結(jié)果。
谷歌翻譯實(shí)時(shí)顯示
收到朋友發(fā)來(lái)的email,在查看郵件的時(shí)候,Gmail已經(jīng)為你準(zhǔn)備好了可能需要回復(fù)的內(nèi)容。
無(wú)論是谷歌翻譯還是Gmail,它們已被推出多時(shí),均非新鮮產(chǎn)品,但在用戶(hù)看不見(jiàn)的地方,谷歌已經(jīng)并正在繼續(xù)對(duì)它們進(jìn)行“升級(jí)”。上述翻譯及Gmail提供的改進(jìn),便得益于此。
“升級(jí)”源于谷歌AIfirst戰(zhàn)略的執(zhí)行和落地,2016年,谷歌CEOSundarPichai宣布谷歌戰(zhàn)略從MobileFirst(移動(dòng)先行)轉(zhuǎn)向AIFirst(人工智能先行),在對(duì)人工智能技術(shù)進(jìn)行多年投入后,現(xiàn)在,谷歌正在通過(guò)深度學(xué)習(xí)、機(jī)器學(xué)習(xí)等技術(shù),讓旗下的產(chǎn)品變得更加智能。
升級(jí)旗下產(chǎn)品只是谷歌期望通過(guò)AI實(shí)現(xiàn)的目標(biāo)之一。11月28日,在日本東京舉行的Google亞太地區(qū)媒體開(kāi)放日上,Google資深研究員、GoogleBrain負(fù)責(zé)人JeffDean表示,谷歌在人工智能領(lǐng)域的愿景,是通過(guò)三種途徑讓每個(gè)人都從中受益:使得Google產(chǎn)品更加實(shí)用、幫助企業(yè)和開(kāi)發(fā)者創(chuàng)新,以及為研究人員提供工具,從而解決人類(lèi)面對(duì)的各項(xiàng)重大挑戰(zhàn)。
從谷歌展示的一系列產(chǎn)品及案例可以看出,谷歌正在為了實(shí)現(xiàn)上述目標(biāo)而努力。
谷歌的新魔法
AI究竟讓產(chǎn)品變得怎樣實(shí)用?實(shí)際體驗(yàn)是回答這個(gè)問(wèn)題的最好方式。
在今年Google亞太地區(qū)媒體開(kāi)放日現(xiàn)場(chǎng),谷歌準(zhǔn)備了不同產(chǎn)品的展示,包括各類(lèi)圖像產(chǎn)品、Googleassistant、Googletranslate以及一系列運(yùn)用了機(jī)器學(xué)習(xí)等AI技術(shù)的小應(yīng)用。
以圖像應(yīng)用為例,現(xiàn)實(shí)生活中,人們經(jīng)常會(huì)遇到需要將紙質(zhì)版圖片或文件轉(zhuǎn)為電子版的場(chǎng)景,通常情況下用戶(hù)需要借助專(zhuān)業(yè)掃描設(shè)備才能得到理想的電子版,因?yàn)槿绻褂檬謾C(jī)拍照,會(huì)出現(xiàn)反光、畸變等問(wèn)題。
針對(duì)這一需求,谷歌推出一個(gè)名為“照片掃描儀”的APP,用戶(hù)按照指引對(duì)紙質(zhì)版物品拍攝五張不同角度的照片,該APP會(huì)對(duì)拍攝的圖片進(jìn)行計(jì)算和合成,最終輸出一個(gè)與用專(zhuān)業(yè)設(shè)備掃描效果類(lèi)同的電子版。
照片掃描儀只是谷歌在借助AI技術(shù)改進(jìn)應(yīng)用體驗(yàn)方面的一個(gè)案例,除了圖像應(yīng)用外,語(yǔ)音、文字等相關(guān)產(chǎn)品也有不同程度的體驗(yàn)改進(jìn)。
不止是軟件方面,在讓AI技術(shù)落地上,谷歌還在嘗試將AI、軟件、硬件結(jié)合起來(lái)。
作為谷歌落地語(yǔ)音交互產(chǎn)品的重要硬件,GoogleHome如今可以提供非常多樣的服務(wù),比如它能夠識(shí)別不同用戶(hù)的聲音,并給予不同的反饋。例如,A與B都養(yǎng)了寵物狗,當(dāng)A對(duì)GoogleHome說(shuō)想看寵物照片的時(shí)候,GoogleHome可以識(shí)別出A的聲音,并將A的寵物照片調(diào)出;而當(dāng)B提出同樣要求的時(shí)候,GoogleHome調(diào)出的是B的寵物照片。
這一功能為GoogleHome的語(yǔ)音配對(duì)功能(VoiceMatch),它之所以能夠?qū)崿F(xiàn),源于在機(jī)器學(xué)習(xí)的幫助下,語(yǔ)音助手能夠識(shí)別不同的語(yǔ)音。據(jù)介紹,語(yǔ)音配對(duì)目前支持最多六個(gè)用戶(hù)連接到同一臺(tái)GoogleHome,GoogleHome是目前市場(chǎng)上首個(gè)具備此功能的智能音箱。
機(jī)器學(xué)習(xí)還被運(yùn)用到醫(yī)療領(lǐng)域,通過(guò)與印度和美國(guó)的醫(yī)生合作,谷歌創(chuàng)建了一個(gè)包含12.8萬(wàn)張眼底掃描圖片的數(shù)據(jù)集,來(lái)用于訓(xùn)練一個(gè)檢測(cè)糖尿病性視網(wǎng)膜病變的深度神經(jīng)網(wǎng)絡(luò)。
經(jīng)過(guò)訓(xùn)練,模型識(shí)別眼底掃描圖的專(zhuān)業(yè)準(zhǔn)確度甚至超過(guò)了專(zhuān)業(yè)醫(yī)生的平均水平,而這可以幫助醫(yī)生提高診斷效率,使患者盡早得到治療。
同時(shí),通過(guò)TensorFlow、云機(jī)器學(xué)習(xí)API(CloudMachineLearningAPIs)以及張量處理器(TensorProcessingUnit,TPU)電腦芯片,谷歌將AI能力向更多開(kāi)發(fā)者開(kāi)放出來(lái)。食品企業(yè)得以借此提高食物檢查效率,生物學(xué)家得以更加高效的了解鳥(niǎo)類(lèi)的習(xí)性并提升保護(hù)的效果。
而無(wú)論是優(yōu)化現(xiàn)有產(chǎn)品、開(kāi)放AI能力以及解決人類(lèi)的共同問(wèn)題,實(shí)現(xiàn)上述目標(biāo)的基本前提是持之以恒的投入AI方面的研究,并取得進(jìn)展。在谷歌的AI戰(zhàn)略中,機(jī)器學(xué)習(xí)是重中之重。
改變這樣發(fā)生
機(jī)器學(xué)習(xí)是計(jì)算機(jī)科學(xué)的一種形式,認(rèn)為編寫(xiě)能使計(jì)算機(jī)自主學(xué)習(xí)如何變得智能的程序,要比直接編寫(xiě)智能程序要更為簡(jiǎn)單。通俗的來(lái)講,機(jī)器學(xué)習(xí)的目的是讓機(jī)器自身變得智能。
JeffDean介紹,機(jī)器學(xué)習(xí)是谷歌在人工智能領(lǐng)域的工作重心,谷歌開(kāi)展機(jī)器學(xué)習(xí)的研究已經(jīng)很長(zhǎng)時(shí)間,但目前機(jī)器學(xué)習(xí)仍處于發(fā)展初期。如今,機(jī)器學(xué)習(xí)對(duì)分類(lèi)、預(yù)測(cè)、理解和生成這四個(gè)關(guān)鍵方面很有幫助。而這些功能幾乎已經(jīng)被應(yīng)用于谷歌所有的產(chǎn)品中。
無(wú)論是GoolgePhotos、GoogleTranslate、GoogleLens,還是Gmail、Inbox、GoogleMaps,亦或者GoogleAssistant、YouTube,機(jī)器學(xué)習(xí)技術(shù)的加入,讓它們可以提供更好的體驗(yàn)。
新款Pixel手機(jī)具備了人像模式,這一模式拍攝人像時(shí)可以柔和虛化背景,傳統(tǒng)技術(shù)條件下,這需要一個(gè)多鏡頭的專(zhuān)業(yè)相機(jī)才能實(shí)現(xiàn),但機(jī)器學(xué)習(xí)和計(jì)算攝影技術(shù)的結(jié)合,使得Pixel手機(jī)依靠每側(cè)各有一個(gè)鏡頭便實(shí)現(xiàn)了同樣的效果。
未使用人像模式(Portraitmode)的照片(左)和使用人像模式(Portraitmode)的照片(右)
根據(jù)谷歌搜索項(xiàng)目總監(jiān)LinneHa的介紹,深度神經(jīng)網(wǎng)絡(luò)技術(shù)大大提高了語(yǔ)音搜索中語(yǔ)音識(shí)別的準(zhǔn)確性,這使得用戶(hù)在嘈雜的環(huán)境中也可以與手機(jī)自由對(duì)話。在機(jī)器學(xué)習(xí)的幫助下,自然語(yǔ)言處理系統(tǒng)能夠更好地理解你想說(shuō)的話。在利用機(jī)器學(xué)習(xí)實(shí)現(xiàn)文本向語(yǔ)音轉(zhuǎn)換的實(shí)驗(yàn)項(xiàng)目ProjectUnison的幫助下,通過(guò)轉(zhuǎn)換引擎,手機(jī)可以用語(yǔ)料并不豐富的語(yǔ)種,如孟加拉語(yǔ),高棉語(yǔ)和爪哇語(yǔ)。
實(shí)際成果已經(jīng)證明,機(jī)器學(xué)習(xí)與具體應(yīng)用結(jié)合可以取得非常好的效果,但JeffDean仍舊提示目前機(jī)器學(xué)習(xí)存在的兩大挑戰(zhàn),首先是機(jī)器學(xué)習(xí)模型的觸達(dá)性;二是機(jī)器學(xué)習(xí)模型的包容性。
為了解決第一個(gè)問(wèn)題,谷歌將在明年在互聯(lián)網(wǎng)上提供免費(fèi)的機(jī)器學(xué)習(xí)課程,為了解決第二個(gè)問(wèn)題,谷歌啟動(dòng)了People+AIResearch(PAIR)計(jì)劃,并與與GeenaDavis研究所合作建立了GD-IQ(一種利用機(jī)器學(xué)習(xí)檢測(cè)電影中性別偏見(jiàn)的工具)。
上述措施對(duì)解決機(jī)器學(xué)習(xí)面臨的挑戰(zhàn)提供了幫助,但于谷歌而言,在AIfrist的戰(zhàn)略指引下,其面臨的挑戰(zhàn)不止于此。
從行業(yè)競(jìng)爭(zhēng)的角度而言,越來(lái)越多公司推出了機(jī)器學(xué)習(xí)開(kāi)源平臺(tái),谷歌要如何應(yīng)對(duì)競(jìng)爭(zhēng),保持對(duì)開(kāi)發(fā)者的吸引力?而從國(guó)家間的競(jìng)爭(zhēng)來(lái)看,谷歌還面臨著美國(guó)政府是否愿意投入和支持AI產(chǎn)業(yè)發(fā)展的影響。
面對(duì)行業(yè)競(jìng)爭(zhēng),JeffDean表示,“TensorFlow在不斷的發(fā)展,不斷地增加新的功能。它們可能針對(duì)不同的人群,有的針對(duì)研究者,有的更多傾向于移動(dòng)平臺(tái)。所以這樣的競(jìng)爭(zhēng)是好的。TensorFLOW的開(kāi)源軟件是有很靈活的Apache2.0許可機(jī)制?!?/p>
而面對(duì)國(guó)家間的競(jìng)爭(zhēng),谷歌選擇了建立本土團(tuán)隊(duì)提升AI發(fā)展速度的做法。JeffDean表示,谷歌正在中國(guó)組建AI團(tuán)隊(duì),團(tuán)隊(duì)主要分布于北京和上海兩個(gè)城市。
這一做法顯然是從新人才的角度出發(fā)——“我們想關(guān)注下一代有更好計(jì)算能力的人,解決實(shí)際的問(wèn)題,有意思的問(wèn)題。我們并不擔(dān)心競(jìng)爭(zhēng)對(duì)手,我們關(guān)心的是我們自己的研究?!?/p>
從研究到應(yīng)用,再到開(kāi)放,Google在AIfirst戰(zhàn)略的指引下,已經(jīng)形成了比較完成的拼圖,盡管人工智能的發(fā)展讓部分公眾對(duì)其安全性產(chǎn)生擔(dān)憂(yōu),但在一直投身于這個(gè)行業(yè)的JeffDean看來(lái),機(jī)器學(xué)習(xí)可以幫助人類(lèi)解決更復(fù)雜的問(wèn)題,“我們現(xiàn)在應(yīng)該著眼于解決眼前的問(wèn)題”,而這也將影響著谷歌未來(lái)發(fā)展AI的路。