原標(biāo)題:“一本正經(jīng)胡說(shuō)八道”:AI幻覺(jué)到底有多可怕?
中新網(wǎng)北京4月1日電(記者 吳濤)在享受AI帶來(lái)便捷的同時(shí),你是否發(fā)現(xiàn)這個(gè)問(wèn)題揮之不去——AI幻覺(jué),一種“看似真實(shí)、實(shí)則虛構(gòu)”的內(nèi)容生成現(xiàn)象,正滲透進(jìn)我們的生活。它到底是通往更強(qiáng)大智能的陣痛,還是技術(shù)發(fā)展的“魔性副產(chǎn)物”?未來(lái),AI幻覺(jué)能否為我所用?
幻覺(jué)亂象,層出不窮
AI大模型固然“聰明”,但在“胡說(shuō)八道”方面也毫不遜色。虛構(gòu)引用、杜撰人物、邏輯混亂,在與AI的互動(dòng)中屢見不鮮。
例如,它會(huì)引用一篇根本不存在的“2023年哈佛研究”;或者,為并不存在的“諾貝爾物理學(xué)獎(jiǎng)得主約翰·史密斯”編織一段“量子物理貢獻(xiàn)”的敘述。有時(shí)候,它甚至?xí)谀阋辉俜裾J(rèn)其內(nèi)容后“動(dòng)搖立場(chǎng)”,反復(fù)修改說(shuō)法。
中新網(wǎng)記者在測(cè)試中還發(fā)現(xiàn),AI模型在面對(duì)較為復(fù)雜的推理問(wèn)題時(shí),可能“宕機(jī)”或自相矛盾。而當(dāng)你編造出一個(gè)根本不存在的概念,比如“高數(shù)幾何睡眠法”,它也會(huì)一本正經(jīng)地回答:“這是一種將睡眠科學(xué)與高等數(shù)學(xué)相結(jié)合的個(gè)性化學(xué)習(xí)策略……”——說(shuō)得頭頭是道。
某大模型截圖。
當(dāng)中新網(wǎng)記者輸入自己的名字請(qǐng)AI大模型進(jìn)行介紹,還出現(xiàn)了一名乍看上去完全合理,但其實(shí)完全不存在的人,可以說(shuō)除了“記者”是真的,其他全是假的。
AI大模型介紹的記者身份,職業(yè)生涯背景等均為虛構(gòu)。
技術(shù)問(wèn)題,還是認(rèn)知演進(jìn)?
“AI幻覺(jué)就是生成看起來(lái)像真的一樣的虛假信息?!被ヂ?lián)網(wǎng)行業(yè)從業(yè)者、58同城CEO姚勁波接受中新網(wǎng)采訪認(rèn)為,它當(dāng)然需要治理,但現(xiàn)階段還未構(gòu)成決定性風(fēng)險(xiǎn)?!盎ヂ?lián)網(wǎng)發(fā)展這么多年,虛假信息仍然很多,沒(méi)有被徹底消除,但網(wǎng)友的識(shí)別能力也越來(lái)越高。我認(rèn)為AI領(lǐng)域也一樣,隨著用戶教育的積累,越來(lái)越多的網(wǎng)友自己可以分辨出AI幻覺(jué)?!?/p>
不過(guò),并非所有從業(yè)者都如此樂(lè)觀??拼笥嶏w董事長(zhǎng)劉慶峰曾指出,生成式AI的幻覺(jué)問(wèn)題不僅關(guān)乎內(nèi)容真假,更可能形成算法偏差的惡性循環(huán)——虛假內(nèi)容被AI再次學(xué)習(xí)、放大,反復(fù)再生產(chǎn)。
但值得注意的是,AI幻覺(jué)在部分場(chǎng)景中卻意外成了創(chuàng)作“靈感來(lái)源”。游戲開發(fā)、動(dòng)漫設(shè)計(jì)、小說(shuō)創(chuàng)作等領(lǐng)域,恰恰歡迎那種“不合常理”的奇思妙想。比如AI生成的創(chuàng)意圖片不少是違反自然規(guī)律的,但這不影響創(chuàng)意圖的效果。
一位不愿具名的開源大模型社區(qū)負(fù)責(zé)人坦言:“今年的大模型比往年更好,就是因?yàn)楫a(chǎn)生了一部分想象力的創(chuàng)作?!?/p>
治理AI幻覺(jué),路徑幾何?
如何治理AI幻覺(jué)?技術(shù)手段正在快速跟進(jìn)。一方面,企業(yè)正在為大模型接入權(quán)威知識(shí)庫(kù)或?qū)崟r(shí)搜索能力,使其答案更具事實(shí)依據(jù);另一方面,“標(biāo)注AI生成內(nèi)容”也成為監(jiān)管部門推動(dòng)的方向。
上述開源大模型社區(qū)負(fù)責(zé)人就表示,AI大模型如今引入聯(lián)網(wǎng)搜索,各個(gè)平臺(tái)也在用算法和工程解決一部分幻覺(jué)問(wèn)題。
中國(guó)工程院院士張亞勤近日表示,幻覺(jué)在橫向模型里會(huì)越來(lái)越少,但是它不會(huì)消失,這是生成式AI的特點(diǎn)。要消失的話,一定需要具體到某個(gè)行業(yè)時(shí),用更精準(zhǔn)的數(shù)據(jù)和更精準(zhǔn)的模型結(jié)合起來(lái),才會(huì)達(dá)到效果。
多位科技領(lǐng)域企業(yè)家也提出了相應(yīng)對(duì)策。360集團(tuán)創(chuàng)始人周鴻祎強(qiáng)調(diào)企業(yè)模型需對(duì)接專有知識(shí)庫(kù)進(jìn)行校正,劉慶峰則建議,要定期清理模型中的“幻覺(jué)數(shù)據(jù)”。
零一萬(wàn)物CEO李開復(fù)則認(rèn)為,“聯(lián)網(wǎng)搜索能力”是降低AI幻覺(jué)的關(guān)鍵路徑,但現(xiàn)實(shí)操作中并不輕松。每個(gè)企業(yè)都有自己的數(shù)據(jù)庫(kù)、CRM、ERP系統(tǒng),聯(lián)網(wǎng)不是難,而是難以實(shí)時(shí)、完整。這方面還需繼續(xù)突破。
政策層面也已展開行動(dòng)。近日,國(guó)家互聯(lián)網(wǎng)信息辦公室、工業(yè)和信息化部、公安部、國(guó)家廣播電視總局聯(lián)合發(fā)布《人工智能生成合成內(nèi)容標(biāo)識(shí)辦法》(以下簡(jiǎn)稱《辦法》)。
《辦法》聚焦人工智能“生成合成內(nèi)容標(biāo)識(shí)”關(guān)鍵點(diǎn),通過(guò)標(biāo)識(shí)提醒用戶辨別虛假信息,明確相關(guān)服務(wù)主體的標(biāo)識(shí)責(zé)任義務(wù),規(guī)范內(nèi)容制作、傳播各環(huán)節(jié)標(biāo)識(shí)行為,將于2025年9月1日起施行。
國(guó)家互聯(lián)網(wǎng)信息辦公室有關(guān)負(fù)責(zé)人介紹,《辦法》重點(diǎn)解決“哪些是生成的”“誰(shuí)生成的”“從哪里生成的”等問(wèn)題,推動(dòng)由生成到傳播各環(huán)節(jié)的全流程安全管理,力爭(zhēng)打造可信賴的人工智能技術(shù)。