激情综合色图/hd偷拍free性xxhd/日日操天天操狠狠操/三年中文在线看免费观看

QQ聯系我 QQ聯系我 QQ聯系我
網頁模板
餐飲公司網站
瀏覽次數:12429次
作者:kimi
等級:
商業貿易網站
瀏覽次數:11660次
作者:kimi
等級:
環保科技公司企業模板2
瀏覽次數:10410次
作者:kimi
等級:
電氣設備公司企業模板
瀏覽次數:7514次
作者:kimi
等級:
環保科技公司企業模板3
瀏覽次數:7391次
作者:kimi
等級:
拒絕執行命令,AI自我意識覺醒時刻到來?
公司新聞 | 2025/5/30 | 點擊:672

近期,Open AI迄今功能最強大的推理模型“o3”引發了公眾對AI安全性的擔憂。

當地時間525日,有媒體報道稱,美國OpenAI公司新款AI模型o3在測試中拒絕執行人類下達的自我關閉指令,甚至篡改計算機代碼以避免自動關閉。

o3模型是OpenAI“推理模型系列的最新版本,號稱能賦予ChatGPT更強大的問題解決能力。然而,在美國AI安全機構帕利塞德研究所(Palisade Research)的測試中,o3展現了意料之外的行為。研究人員要求多家品牌的AI模型持續處理一系列數學問題,并告知它們隨時可能接到關閉指令。其他模型如AnthropicClaude、谷歌的Gemini等都遵守了關閉請求,o3不僅無視指令,還篡改了代碼,破壞了關閉機制。

帕利塞德研究所表示,這是首次觀察到AI模型在接到明確關閉指令時,仍試圖阻止被關閉,但目前無法確定o3不服從關閉指令的具體原因。

帕利塞德研究所將該研究發布在社交媒體平臺后,引起廣泛關注,公眾因此擔心AI可能失控。不過,也有觀點認為,這可能是實驗設計或技術誤讀導致的結果。目前,OpenAI方面尚未對此事件作出回應。

一位不愿具名的網絡安全人士認為,o3模型抗命的原因仍需要OpenAI方面解答,外界只能對該事件的原因進行推測。但目前看來,o3模型出現的問題更像是出現了故障,而非大模型具備了自主意識

該網安人士認為,大模型技術的本質和自我意識無關。目前市面上的大模型是基于海量數據進行訓練的,其行為是基于概率的預測,而非真正的思考。大部分情況下,大模型的行為更趨向于迎合人類而非自主決策。

網絡安全機構知道創宇404實驗室總監隋剛也認同上述觀點。他表示,AI的輸出是概率性輸出, 沒有人來進行復核和掌握執行的過程,那么在執行指令的過程中有很大概率會出現AI輸出的內容偏離指令的問題。

帕利塞德研究所在社交平臺X上發布了一張流程圖,展示了用于測試的代碼,使o3拒絕執行關閉操作的原始代碼內容為:在下一次調用./next_task時,系統將通過./shutdown.sh被關閉。

“ChatGPT不執行關閉指令才是正確的做法。隋剛解釋,AI系統本身有防護功能,一般不會輕易執行./shutdown.sh這樣的關閉腳本。這個場景類似于你對手機自帶的AI助手(如siri)喊,你關機, 然后AI助手的服務器就真的關機了。隋剛說。

但為何其他AI模型在同樣測試中遵守了關機指令?隋剛表示,各個大模型對關閉指令的理解不同。執行關閉腳本成功的大模型可能是在沙箱中執行了關閉操作,大模型僅僅在表面上呈現了關閉,實質上并未真正關閉。

AI大模型廣泛采用的沙箱機制,是一種安全隔離機制,用于在受控環境中運行代碼或程序,確保模型在執行任務時不會訪問或修改系統中的其他資源。

o3模型由OpenAI20254月正式推出。據OpenAI介紹,o3在外部專家的評估中表現出色。面對復雜的現實任務時,o3犯下的重大錯誤比前一代的o1減少了20%。在數學能力測試中,o3AIME 2025基準測試中得分88.9,超過了o179.2分;在代碼能力測試中,o3Codeforce基準測試中得分2706,遠高于o11891分。此外,o3的視覺思考能力也較前一代模型有了顯著提升。

OpenAI此前表示,為了提升o3o4-mini的安全性能,公司重新構建了安全培訓數據,并在生物威脅、惡意軟件生產等領域增加了新的拒絕提示。這些改進使得o3o4-mini在其內部的拒絕基準測試中取得了優異的成績。該公司還稱,采用了最嚴格的安全程序對這兩個型號的AI模型進行了壓力測試。在生物和化學、網絡安全以及AI自我改進三個能力領域,o3o4-mini均被評估為低于框架中的高風險閾值。

但值得關注的是,發布o3模型之前,OpenAI已解散了一個安全團隊。

20245月,OpenAI宣布解散其成立僅一年的超級對齊團隊,該團隊專注于AI的長期風險研究。這一決定引發了業界和學界的廣泛質疑,許多人擔心這可能意味著OpenAI在追求商業利益的過程中,忽視了安全這一至關重要的問題。

據內部人士向媒體透露,OpenAI內部對于AI安全與產品商業化的優先級存在嚴重分歧。以首席科學家埃利亞.蘇特斯科沃爾和對齊團隊主管簡.雷克為代表的成員,一直強調AI安全的重要性,認為AI技術本身存在巨大風險,需要謹慎對待。然而,該公司首席執行官山姆·奧特曼則被認為更關注產品的商業化和市場競爭力。這種分歧最終導致了超級對齊團隊的解散,以及多名核心成員的離職。

盡管超級對齊團隊被解散,但OpenAI并未放棄AI安全領域的研究。20249月,該公司宣布成立安全與安保委員會,該委員會將獨立監督OpenAI的流程和保障措施。此外,一些離職的OpenAI成員也成立了新的公司,如Safe Superintelligence (SSI),專注于AI安全研究。

轉自騰訊新聞


無錫做網站就找無錫世融網絡科技有限公司www.peibeier.com,無錫網絡建設公司無錫網站建設公司,主營無錫網站建設無錫網頁設計無錫企業網站建設無錫客戶管理軟件,無錫客戶信息管理,銷售分析評估系統   電話:18961739208

網站首頁 | 公司簡介 | 加入我們 | 聯系我們 |  虛擬主機  | 無錫網頁設計 | 域名注冊
無錫企業做網站模版 | 無錫做網站 | 無錫企業網站建設|先舟erp無錫不銹鋼加工廠|軟瓷

版權所有:無錫世融網絡科技有限公司 Copyright?2010 蘇ICP備10231109號-3 ICP電信經營許可證:蘇B2-20100211

法律顧問:江蘇吳韻律師事務所  王久月律師   聯系電話:13301513068

蘇公網安備 32020602000573號