Anthropic 兩款 AI 模型遭管制逾百專家憂資安防禦力受損

2026 年 6 月 30 日

圖／本報資料庫

商傳媒｜葉安庭／綜合外電報導

美國人工智慧（AI）公司 Anthropic 近期在聯邦出口管制的壓力下，被迫緊急終止旗下兩款大型語言模型 Fable 與 Mythos 的存取權限。這項決定僅給予約 90 分鐘的通知，且透明度不足，引發了業界廣泛爭議，超過百位資安專家、研究人員及政府前官員共同簽署了一封公開信，表達對此舉可能削弱網路防禦能力的擔憂。

Anthropic 被迫移除 Fable 和 Mythos 模型，是基於一份研究報告聲稱這些模型可能遭到「越獄」（jailbreaks）攻擊，意即被惡意人士繞過模型的安全限制。然而，這項研究中所謂的漏洞，實際上是要求模型找出並修正程式碼中的缺陷，這正是 AI 模型在資安防禦上的核心應用之一，例如用於漏洞偵測、安全程式碼審查、惡意軟體分析及事件回應等。

這封致美國商務部長霍華德·盧特尼克（Howard Lutnick）與美國國家網路總監肖恩·凱恩克洛斯（Sean Cairncross）的公開信中指出，限制防禦者使用這些先進的 AI 工具，反而會讓他們在對抗網路威脅時處於不利地位。資安顧問 Chris Eng 也表達類似看法，他向《BnkInfoSecurity》表示：「這讓我想起過去在網路安全領域見過的出口限制案例，總有人過度強調某種危險，卻沒仔細思考可能產生的副作用。」

專家們認為，類似的「越獄」行為也存在於其他主流模型中，例如 GPT-5.5、Sonnet 以及許多開源模型。因此，單獨限制 Anthropic 的工具不僅無法有效解決整體 AI 安全問題，更可能使其在商業競爭上陷入劣勢。他們呼籲應建立一套結構化、公開的基準測試，用以明確衡量各模型抵抗「越獄」攻擊的能力，並訂定清晰可測量的標準。

隨著 AI 技術的快速發展，從漏洞被披露到遭到實際利用的時間正大幅縮短。然而，傳統程式碼修復仍嚴重依賴人工開發者作為最後防線。此外，大型語言模型在運作時所需消耗的「Token」（理解和生成文字的計算單位）成本不斷攀升，這也對企業的資訊安全長（CISO，負責企業資訊安全策略與執行的主管）在威脅模型建立及韌性規劃上帶來新的挑戰。