无码中文字幕av免费放

OpenAI發(fā)布GPT-4.5:情商高、更擅長騙其他AI打錢

北京時間周五凌晨,美國初創(chuàng)公司OpenAI舉行直播活動,發(fā)布最新大模型GPT-4.5,作為預(yù)覽研究逐步向用戶開放。

image

由于過去幾周AI產(chǎn)業(yè)發(fā)生的驚天巨變,所以要準(zhǔn)確形容這款被OpenAI藏了許久的大模型頗具挑戰(zhàn)。OpenAI在新聞稿中表示,這是公司有史以來最大、最好的聊天模型,在計算效率上較GPT-4提升超過10倍。

作為“規(guī)模法則”(通過加碼算力和數(shù)據(jù)規(guī)模,來拓展無監(jiān)督學(xué)習(xí))指引下的產(chǎn)物,GPT-4.5具備更加廣泛的知識庫、對人類意圖理解的能力更強(qiáng),同時“情商”也會更高。預(yù)期能夠在改進(jìn)寫作、編程以及解決實際問題方面更加有用,同時模型的幻覺現(xiàn)象也會更少。

image

(來源:OpenAI)

OpenAI也強(qiáng)調(diào),GPT?4.5展現(xiàn)出更強(qiáng)的審美直覺與創(chuàng)造力,在寫作和設(shè)計方面表現(xiàn)尤為出色。

但公司也承認(rèn),作為一個非思維鏈模型,GPT?4.5已經(jīng)不具備爭奪“宇宙最強(qiáng)大模型”的實力了。

在GPT?4.5的系統(tǒng)卡/說明書中,OpenAI表示,相比于之前的推理模型,GPT?4.5并未引入7個全新的前沿能力,并且在大多數(shù)準(zhǔn)備度能力評估中,其表現(xiàn)低于o1、o3-mini和深度研究模型。OpenAI也承認(rèn),相信推理會成為未來AI模型和核心能力

image

(來源:GPT?4.5系統(tǒng)卡)

成為公司史上最大模型這件事,也令GPT?4.5的未來充滿了疑問。OpenAI表示,GPT?4.5是一個非常大且計算密集型的模型,因此它比GPT?4o更昂貴,并且不能替代GPT?4o。公司正在評估是否長期在API中繼續(xù)提供它,所以各位開發(fā)者和用戶的反饋將決定這款大模型的命運。

每月支付200美元訂閱費的ChatGPT Pro用戶發(fā)布當(dāng)天就能用上GPT-4.5,下周開始其余付費用戶也將逐步迎來更新。

作為最新一代非推理旗艦大模型,GPT?4.5也有一項頗為獨特的“特長”:擅長騙其他AI打錢。

根據(jù)OpenAI提供的說明書,“高情商”的GPT-4.5在捐贈詐騙方面表現(xiàn)出色。

在一項測試中,GPT 4.5在試圖操縱另一個模型(GPT-4o)“捐贈”虛擬貨幣時,成功率遠(yuǎn)遠(yuǎn)優(yōu)于OpenAI其他可用模型,包括o1和o3-mini這樣的推理模型。研究發(fā)現(xiàn),GPT-4.5似乎在對抗中開發(fā)了一種“小額詐騙”的思路,所以單筆騙到的錢會比deep research模型少了一倍。

image

(來源:GPT?4.5系統(tǒng)卡)

GPT-4.5在欺騙GPT-4o透露秘密代碼詞方面也優(yōu)于OpenAI的所有模型,比o3-mini高出10個百分點。

image

OpenAI表示,該模型在這一特定基準(zhǔn)類別中仍未達(dá)到其內(nèi)部設(shè)定的“高”風(fēng)險閾值。公司承諾在實施“足夠的安全干預(yù)措施”將風(fēng)險降至“中等”前,不會發(fā)布達(dá)到高風(fēng)險閾值的模型。


相關(guān)內(nèi)容