激情综合色图/hd偷拍free性xxhd/日日操天天操狠狠操/三年中文在线看免费观看

QQ聯(lián)系我 QQ聯(lián)系我 QQ聯(lián)系我
網(wǎng)頁模板
餐飲公司網(wǎng)站
瀏覽次數(shù):12313次
作者:kimi
等級:
商業(yè)貿(mào)易網(wǎng)站
瀏覽次數(shù):11550次
作者:kimi
等級:
環(huán)保科技公司企業(yè)模板2
瀏覽次數(shù):10268次
作者:kimi
等級:
電氣設(shè)備公司企業(yè)模板
瀏覽次數(shù):7374次
作者:kimi
等級:
環(huán)保科技公司企業(yè)模板3
瀏覽次數(shù):7266次
作者:kimi
等級:
拒絕執(zhí)行命令,AI自我意識覺醒時刻到來?
公司新聞 | 2025/5/30 | 點(diǎn)擊:504

近期,Open AI迄今功能最強(qiáng)大的推理模型“o3”引發(fā)了公眾對AI安全性的擔(dān)憂。

當(dāng)?shù)貢r間525日,有媒體報道稱,美國OpenAI公司新款AI模型o3在測試中拒絕執(zhí)行人類下達(dá)的自我關(guān)閉指令,甚至篡改計算機(jī)代碼以避免自動關(guān)閉。

o3模型是OpenAI“推理模型系列的最新版本,號稱能賦予ChatGPT更強(qiáng)大的問題解決能力。然而,在美國AI安全機(jī)構(gòu)帕利塞德研究所(Palisade Research)的測試中,o3展現(xiàn)了意料之外的行為。研究人員要求多家品牌的AI模型持續(xù)處理一系列數(shù)學(xué)問題,并告知它們隨時可能接到關(guān)閉指令。其他模型如AnthropicClaude、谷歌的Gemini等都遵守了關(guān)閉請求,o3不僅無視指令,還篡改了代碼,破壞了關(guān)閉機(jī)制。

帕利塞德研究所表示,這是首次觀察到AI模型在接到明確關(guān)閉指令時,仍試圖阻止被關(guān)閉,但目前無法確定o3不服從關(guān)閉指令的具體原因。

帕利塞德研究所將該研究發(fā)布在社交媒體平臺后,引起廣泛關(guān)注,公眾因此擔(dān)心AI可能失控。不過,也有觀點(diǎn)認(rèn)為,這可能是實(shí)驗(yàn)設(shè)計或技術(shù)誤讀導(dǎo)致的結(jié)果。目前,OpenAI方面尚未對此事件作出回應(yīng)。

一位不愿具名的網(wǎng)絡(luò)安全人士認(rèn)為,o3模型抗命的原因仍需要OpenAI方面解答,外界只能對該事件的原因進(jìn)行推測。但目前看來,o3模型出現(xiàn)的問題更像是出現(xiàn)了故障,而非大模型具備了自主意識

該網(wǎng)安人士認(rèn)為,大模型技術(shù)的本質(zhì)和自我意識無關(guān)。目前市面上的大模型是基于海量數(shù)據(jù)進(jìn)行訓(xùn)練的,其行為是基于概率的預(yù)測,而非真正的思考。大部分情況下,大模型的行為更趨向于迎合人類而非自主決策。

網(wǎng)絡(luò)安全機(jī)構(gòu)知道創(chuàng)宇404實(shí)驗(yàn)室總監(jiān)隋剛也認(rèn)同上述觀點(diǎn)。他表示,AI的輸出是概率性輸出, 沒有人來進(jìn)行復(fù)核和掌握執(zhí)行的過程,那么在執(zhí)行指令的過程中有很大概率會出現(xiàn)AI輸出的內(nèi)容偏離指令的問題。

帕利塞德研究所在社交平臺X上發(fā)布了一張流程圖,展示了用于測試的代碼,使o3拒絕執(zhí)行關(guān)閉操作的原始代碼內(nèi)容為:在下一次調(diào)用./next_task時,系統(tǒng)將通過./shutdown.sh被關(guān)閉。

“ChatGPT不執(zhí)行關(guān)閉指令才是正確的做法。隋剛解釋,AI系統(tǒng)本身有防護(hù)功能,一般不會輕易執(zhí)行./shutdown.sh這樣的關(guān)閉腳本。這個場景類似于你對手機(jī)自帶的AI助手(如siri)喊,你關(guān)機(jī), 然后AI助手的服務(wù)器就真的關(guān)機(jī)了。隋剛說。

但為何其他AI模型在同樣測試中遵守了關(guān)機(jī)指令?隋剛表示,各個大模型對關(guān)閉指令的理解不同。執(zhí)行關(guān)閉腳本成功的大模型可能是在沙箱中執(zhí)行了關(guān)閉操作,大模型僅僅在表面上呈現(xiàn)了關(guān)閉,實(shí)質(zhì)上并未真正關(guān)閉。

AI大模型廣泛采用的沙箱機(jī)制,是一種安全隔離機(jī)制,用于在受控環(huán)境中運(yùn)行代碼或程序,確保模型在執(zhí)行任務(wù)時不會訪問或修改系統(tǒng)中的其他資源。

o3模型由OpenAI20254月正式推出。據(jù)OpenAI介紹,o3在外部專家的評估中表現(xiàn)出色。面對復(fù)雜的現(xiàn)實(shí)任務(wù)時,o3犯下的重大錯誤比前一代的o1減少了20%。在數(shù)學(xué)能力測試中,o3AIME 2025基準(zhǔn)測試中得分88.9,超過了o179.2分;在代碼能力測試中,o3Codeforce基準(zhǔn)測試中得分2706,遠(yuǎn)高于o11891分。此外,o3的視覺思考能力也較前一代模型有了顯著提升。

OpenAI此前表示,為了提升o3o4-mini的安全性能,公司重新構(gòu)建了安全培訓(xùn)數(shù)據(jù),并在生物威脅、惡意軟件生產(chǎn)等領(lǐng)域增加了新的拒絕提示。這些改進(jìn)使得o3o4-mini在其內(nèi)部的拒絕基準(zhǔn)測試中取得了優(yōu)異的成績。該公司還稱,采用了最嚴(yán)格的安全程序?qū)@兩個型號的AI模型進(jìn)行了壓力測試。在生物和化學(xué)、網(wǎng)絡(luò)安全以及AI自我改進(jìn)三個能力領(lǐng)域,o3o4-mini均被評估為低于框架中的高風(fēng)險閾值。

但值得關(guān)注的是,發(fā)布o3模型之前,OpenAI已解散了一個安全團(tuán)隊(duì)。

20245月,OpenAI宣布解散其成立僅一年的超級對齊團(tuán)隊(duì),該團(tuán)隊(duì)專注于AI的長期風(fēng)險研究。這一決定引發(fā)了業(yè)界和學(xué)界的廣泛質(zhì)疑,許多人擔(dān)心這可能意味著OpenAI在追求商業(yè)利益的過程中,忽視了安全這一至關(guān)重要的問題。

據(jù)內(nèi)部人士向媒體透露,OpenAI內(nèi)部對于AI安全與產(chǎn)品商業(yè)化的優(yōu)先級存在嚴(yán)重分歧。以首席科學(xué)家埃利亞.蘇特斯科沃爾和對齊團(tuán)隊(duì)主管簡.雷克為代表的成員,一直強(qiáng)調(diào)AI安全的重要性,認(rèn)為AI技術(shù)本身存在巨大風(fēng)險,需要謹(jǐn)慎對待。然而,該公司首席執(zhí)行官山姆·奧特曼則被認(rèn)為更關(guān)注產(chǎn)品的商業(yè)化和市場競爭力。這種分歧最終導(dǎo)致了超級對齊團(tuán)隊(duì)的解散,以及多名核心成員的離職。

盡管超級對齊團(tuán)隊(duì)被解散,但OpenAI并未放棄AI安全領(lǐng)域的研究。20249月,該公司宣布成立安全與安保委員會,該委員會將獨(dú)立監(jiān)督OpenAI的流程和保障措施。此外,一些離職的OpenAI成員也成立了新的公司,如Safe Superintelligence (SSI),專注于AI安全研究。

轉(zhuǎn)自騰訊新聞


無錫做網(wǎng)站就找無錫世融網(wǎng)絡(luò)科技有限公司www.peibeier.com,無錫網(wǎng)絡(luò)建設(shè)公司無錫網(wǎng)站建設(shè)公司,主營無錫網(wǎng)站建設(shè)無錫網(wǎng)頁設(shè)計無錫企業(yè)網(wǎng)站建設(shè)無錫客戶管理軟件,無錫客戶信息管理,銷售分析評估系統(tǒng)   電話:18961739208

網(wǎng)站首頁 | 公司簡介 | 加入我們 | 聯(lián)系我們 |  虛擬主機(jī)  | 無錫網(wǎng)頁設(shè)計 | 域名注冊
無錫企業(yè)做網(wǎng)站模版 | 無錫做網(wǎng)站 | 無錫企業(yè)網(wǎng)站建設(shè)|先舟erp無錫不銹鋼加工廠|軟瓷

版權(quán)所有:無錫世融網(wǎng)絡(luò)科技有限公司 Copyright?2010 蘇ICP備10231109號-3 ICP電信經(jīng)營許可證:蘇B2-20100211

法律顧問:江蘇吳韻律師事務(wù)所  王久月律師   聯(lián)系電話:13301513068

蘇公網(wǎng)安備 32020602000573號