商傳媒|葉安庭/綜合外電報導
美國人工智慧(AI)公司 Anthropic 近期在聯邦出口管制的壓力下,被迫緊急終止旗下兩款大型語言模型 Fable 與 Mythos 的存取權限。這項決定僅給予約 90 分鐘的通知,且透明度不足,引發了業界廣泛爭議,超過百位資安專家、研究人員及政府前官員共同簽署了一封公開信,表達對此舉可能削弱網路防禦能力的擔憂。
Anthropic 被迫移除 Fable 和 Mythos 模型,是基於一份研究報告聲稱這些模型可能遭到「越獄」(jailbreaks)攻擊,意即被惡意人士繞過模型的安全限制。然而,這項研究中所謂的漏洞,實際上是要求模型找出並修正程式碼中的缺陷,這正是 AI 模型在資安防禦上的核心應用之一,例如用於漏洞偵測、安全程式碼審查、惡意軟體分析及事件回應等。
這封致美國商務部長霍華德·盧特尼克(Howard Lutnick)與美國國家網路總監肖恩·凱恩克洛斯(Sean Cairncross)的公開信中指出,限制防禦者使用這些先進的 AI 工具,反而會讓他們在對抗網路威脅時處於不利地位。資安顧問 Chris Eng 也表達類似看法,他向《BnkInfoSecurity》表示:「這讓我想起過去在網路安全領域見過的出口限制案例,總有人過度強調某種危險,卻沒仔細思考可能產生的副作用。」
專家們認為,類似的「越獄」行為也存在於其他主流模型中,例如 GPT-5.5、Sonnet 以及許多開源模型。因此,單獨限制 Anthropic 的工具不僅無法有效解決整體 AI 安全問題,更可能使其在商業競爭上陷入劣勢。他們呼籲應建立一套結構化、公開的基準測試,用以明確衡量各模型抵抗「越獄」攻擊的能力,並訂定清晰可測量的標準。
隨著 AI 技術的快速發展,從漏洞被披露到遭到實際利用的時間正大幅縮短。然而,傳統程式碼修復仍嚴重依賴人工開發者作為最後防線。此外,大型語言模型在運作時所需消耗的「Token」(理解和生成文字的計算單位)成本不斷攀升,這也對企業的資訊安全長(CISO,負責企業資訊安全策略與執行的主管)在威脅模型建立及韌性規劃上帶來新的挑戰。






安格斯老師、溫蒂老師、詹惟中、孫協志、何依霈、徐小可,一同暢聊維持婚姻的酸苦談。(資料來源:東森超視提供).jpg)