人工智能已經(jīng)滲透到我們的日常生活中。最初,它在一些機(jī)器人和大熱的ChatGPT中為人所知,而現(xiàn)在它在比薩餅和啤酒廣告中都不難發(fā)現(xiàn)。雖然人工智能可能不完全可靠,但似乎有時(shí)我們自己對人工智能的處理也不完全值得信賴。
冷泉港實(shí)驗(yàn)室(CSHL)助理教授Peter Koo發(fā)現(xiàn),使用流行的計(jì)算工具來解釋人工智能預(yù)測的科學(xué)家在分析DNA時(shí)發(fā)現(xiàn)了太多的"噪音",在這種情況下是一種額外的信息干擾。他找到了一種方法來解決這個(gè)問題?,F(xiàn)在,只需幾行新代碼,科學(xué)家就可以從被稱為深度神經(jīng)網(wǎng)絡(luò)的強(qiáng)大人工智能中獲得更可靠的解釋,這意味著他們可以繼續(xù)追尋更準(zhǔn)確的計(jì)算后的DNA特征。這些特征可能只是健康和醫(yī)學(xué)的下一個(gè)突破的信號,但是,如果信號被太多的噪音所淹沒,科學(xué)家就不會(huì)看到這些信號。
那么,是什么導(dǎo)致了這些意外亂入的噪音?這是一個(gè)神秘的、不可見的來源,如數(shù)字"暗物質(zhì)"。物理學(xué)家和天文學(xué)家認(rèn)為,宇宙中的大部分都充滿了暗物質(zhì),一種施加引力效應(yīng)的物質(zhì),但還沒有人看到。同樣地,Koo和他的團(tuán)隊(duì)發(fā)現(xiàn),人工智能被訓(xùn)練的數(shù)據(jù)缺乏關(guān)鍵信息,導(dǎo)致了重大盲點(diǎn)。更糟糕的是,在解釋人工智能對DNA功能的預(yù)測時(shí),這些盲點(diǎn)會(huì)被考慮進(jìn)去。
Koo說:"深度神經(jīng)網(wǎng)絡(luò)正在納入這種隨機(jī)行為,因?yàn)樗教帉W(xué)習(xí)功能。但DNA只在其中的一個(gè)小子空間。而且它引入了很多噪音。因此我們表明,這個(gè)問題實(shí)際上確實(shí)在各種突出的人工智能模型中引入了大量的噪音。"
數(shù)字暗物質(zhì)是科學(xué)家們借用計(jì)算機(jī)視覺人工智能的計(jì)算技術(shù)的結(jié)果。DNA數(shù)據(jù)與圖像不同,被限制在四個(gè)核苷酸字母的組合中:但像素形式的圖像數(shù)據(jù)可以是長而連續(xù)的。換句話說,我們正在給人工智能提供一個(gè)它不知道如何正確處理的輸入。
通過應(yīng)用Koo的計(jì)算校正,科學(xué)家可以更準(zhǔn)確地解釋AI的DNA分析。他說:"我們最終看到的結(jié)果變得更加清晰和干凈,而且其他區(qū)域的虛假噪音也更少。"
Koo認(rèn)為噪音干擾影響的不僅僅是基于AI的DNA分析儀。他認(rèn)為這是在涉及類似類型數(shù)據(jù)的計(jì)算過程中普遍存在的一種困擾。值得慶幸的是,新發(fā)明的工具可以幫助科學(xué)家走出黑暗,走向光明。