據(jù)國(guó)外媒體8月27日消息,搜索引擎巨頭谷歌正建立一個(gè)自動(dòng)化的知識(shí)庫(kù)(KnowledgeVault),通過演算法自動(dòng)爬梳網(wǎng)絡(luò)上的資訊,并利用機(jī)器學(xué)習(xí)將資訊整合成知識(shí),兼具廣度與精度,讓電腦與智能手機(jī)了解人類的提問,未來有望改進(jìn)谷歌回答問題的方式,從原本列出一連串的搜索結(jié)果,進(jìn)化到一目了然的答案。
資料圖
KnowledgeVault的前身是2012年谷歌所發(fā)布的“知識(shí)圖表”(KnowledgeGraph),一個(gè)將資訊結(jié)構(gòu)化的數(shù)據(jù)庫(kù),透過群眾外包的力量擴(kuò)大訊息量,內(nèi)容取自維基百科、CIA的世界概觀(WorldFactboo)與協(xié)作知識(shí)庫(kù)Freebase,內(nèi)容包羅萬象,有名人、事件等,總共匯整了5億個(gè)條目及35億種事實(shí)描述。但最終Google發(fā)現(xiàn)人的力量還是有限,知識(shí)量的擴(kuò)增出現(xiàn)停滯,于是谷歌改弦易轍,決定以自動(dòng)搜集的過程取代人力。
到目前為止,KnowledgeVault已建置了16億種事實(shí)描述,其中2.71億被評(píng)比為可信賴的事實(shí),谷歌將新事實(shí)與已掌握的知識(shí)進(jìn)行交叉比對(duì),發(fā)現(xiàn)準(zhǔn)確性達(dá)90%。雖然目前KnowledgeVault的知識(shí)量還未達(dá)到知識(shí)圖表的水準(zhǔn),但它能自動(dòng)擴(kuò)充增加知識(shí),超越的時(shí)間指日可待,很快的將成為全球最豐富的知識(shí)數(shù)據(jù)庫(kù)。
谷歌除了能從網(wǎng)頁上分析文本找尋事實(shí),來喂養(yǎng)它的數(shù)據(jù)庫(kù),也能抓到一般臺(tái)面上看不到的資料,例如Amazon的產(chǎn)品銷售數(shù)據(jù),或?yàn)g覽某項(xiàng)產(chǎn)品的人數(shù)等。Garntner的技術(shù)分析師奧斯丁(TomAustin)表示,幾家世界上最大的科技公司如谷歌、微軟、Facebook、Amazon和IBM等,都在打造類似的知識(shí)庫(kù),并處理極為龐大復(fù)雜的問題。
更多資訊請(qǐng)關(guān)注自動(dòng)化軟件頻道