據(jù)了解,傳統(tǒng)測(cè)謊手段,例如測(cè)謊儀,因其準(zhǔn)確性問(wèn)題而飽受詬病。一些人認(rèn)為,人工智能 (AI) 可以幫助我們提高識(shí)別謊言的準(zhǔn)確率。未來(lái)的某一天,基于人工智能的測(cè)謊系統(tǒng)或許能幫助我們識(shí)別社交媒體上的虛假信息、評(píng)估網(wǎng)絡(luò)上的各種言論,甚至還能甄別求職者的簡(jiǎn)歷和面試回答中的夸大之處。然而,問(wèn)題在于我們是否會(huì)信任這些系統(tǒng),以及它們是否值得信賴。
德國(guó)維爾茨堡大學(xué)經(jīng)濟(jì)學(xué)家 Alicia von Schenk 及其團(tuán)隊(duì)最近研發(fā)了一款人工智能測(cè)謊工具,該工具的準(zhǔn)確率明顯高于人類水平。他們進(jìn)行了相關(guān)實(shí)驗(yàn)以探究人們?nèi)绾问褂眠@一工具,實(shí)驗(yàn)結(jié)果顯示,使用該工具的人在識(shí)別謊言方面確實(shí)有所提升,但同時(shí)也會(huì)導(dǎo)致更多的人被懷疑說(shuō)謊。
研究人員在發(fā)表于 iScience 期刊的論文中提到,他們讓參與者書(shū)寫(xiě)周末計(jì)劃。其中一半的參與者被要求撒謊,并會(huì)因?yàn)檎f(shuō)服人相信謊言而獲得少量金錢獎(jiǎng)勵(lì)。研究共收集了來(lái)自 768 人的 1536 份陳述。
隨后,研究人員利用谷歌的人工智能語(yǔ)言模型 BERT,對(duì)其中 80% 的陳述進(jìn)行訓(xùn)練,以幫助算法區(qū)分真假話。測(cè)試結(jié)果表明,該工具能以 67% 的準(zhǔn)確率識(shí)別出剩余 20% 陳述的真?zhèn)巍O啾戎?,人類的平均?zhǔn)確率僅為 50% 左右。
為了解人們?nèi)绾谓柚斯ぶ悄芄ぞ咦R(shí)別謊言,von Schenk 團(tuán)隊(duì)又將另外 2040 名志愿者分成小組進(jìn)行了一系列測(cè)試。
其中一項(xiàng)測(cè)試顯示,當(dāng)人們可以選擇支付少量費(fèi)用使用人工智能測(cè)謊工具并獲得獎(jiǎng)勵(lì)時(shí),只有三分之一的人會(huì)選擇使用該工具。von Schenk 推測(cè),這可能是因?yàn)槿藗儗?duì)這項(xiàng)技術(shù)持懷疑態(tài)度,或者高估了自己的識(shí)謊能力。
然而,選擇信任該工具的那三分之一人對(duì)其表現(xiàn)出了極大的依賴?!爱?dāng)人們主動(dòng)選擇依賴這項(xiàng)技術(shù)時(shí),他們幾乎都會(huì)遵循人工智能的預(yù)測(cè)…… 他們非常信任其判斷?!眝on Schenk 說(shuō)。
這種依賴會(huì)影響我們的行為。通常情況下,人們傾向于相信他人說(shuō)的是實(shí)話。這項(xiàng)研究也印證了這一點(diǎn) —— 盡管參與者知道一半的陳述是謊言,但他們只標(biāo)記出其中的 19%。然而,當(dāng)人們選擇使用人工智能工具后,標(biāo)記為謊言的比例上升到了 58%。
在某種程度上,這或許是一件好事。此類工具可以幫助我們?cè)谌粘I钪凶R(shí)別更多的謊言,例如社交媒體上的虛假信息。
但另一方面,這也會(huì)破壞信任,而信任是人類行為的基礎(chǔ),有助于我們建立良好的人際關(guān)系。如果準(zhǔn)確的判斷建立在社會(huì)關(guān)系的惡化之上,那么這樣的準(zhǔn)確性還有價(jià)值嗎?
其次,準(zhǔn)確率問(wèn)題也不容忽視。研究人員承認(rèn),他們的目標(biāo)僅僅是讓 AI 比人類表現(xiàn)更好,但對(duì)于社交媒體內(nèi)容的真實(shí)性判定或求職者的簡(jiǎn)歷審核等場(chǎng)景來(lái)說(shuō),僅僅“比人類強(qiáng)”可能還不夠,因?yàn)檫@會(huì)帶來(lái)更多的誤判和指控。
值得一提的是,傳統(tǒng)測(cè)謊手段也存在著缺陷。測(cè)謊儀旨在測(cè)量心率和其他生理喚醒指標(biāo),因?yàn)槿藗冊(cè)J(rèn)為壓力是說(shuō)謊者的特有生理反應(yīng)。但事實(shí)并非如此,這也是為什么測(cè)謊儀結(jié)果在美國(guó)法庭上通常不被采信的原因。
von Schenk 指出,由于人工智能測(cè)謊工具易于大規(guī)模應(yīng)用,其帶來(lái)的影響可能會(huì)更大。測(cè)謊儀每天只能檢測(cè)少數(shù)人,而人工智能測(cè)謊工具的應(yīng)用范圍幾乎是無(wú)限的。
“鑒于當(dāng)下充斥著大量虛假新聞和錯(cuò)誤信息,此類技術(shù)的確有一定的益處,”von Schenk 說(shuō),“然而,我們確實(shí)需要對(duì)其進(jìn)行嚴(yán)格測(cè)試,以確保其遠(yuǎn)超人類的準(zhǔn)確率。如果人工智能測(cè)謊工具只會(huì)帶來(lái)大量的誤判,那么或許放棄使用才是更好的選擇?!?/p>