小型 AI 模型資安潛力浮現專家探討大型模型局限

2026 年 6 月 11 日

商傳媒｜何映辰／台北報導

隨著 Anthropic 推出 Fable 5 模型，資安領域正重新掀起關於小型人工智慧（AI）模型能否追趕上大型尖端 AI 工具的討論。過去，Anthropic 的 Project Glasswing 與 OpenAI 的 Daybreak 等大型「邊界模型」（frontier models）因其深度推理能力而受矚目，這些模型能夠分析龐大的程式碼庫、將個別漏洞串聯成可用的攻擊鏈，甚至找出數十年來未被發現的程式碼缺陷。

然而，這些邊界模型通常採受限存取方式，僅供經過審查的合作夥伴使用，因為它們需要大量運算資源。相較之下，小型語言模型（Small Language Models, SLM）過去被認為不適合進行複雜的推理工作，因為它們運行所需的資料和 Token 數量較少。但產業專家現正探討小型模型是否能縮小與大型模型之間的差距，以及在何種條件下可行。

對於高頻率、重複性的資安任務，例如將發現結果與已知漏洞類別進行匹配，或跨系統關聯警報等，經過領域訓練的小型模型在準確性上已超越邊界模型。IBM 研究院開發的資安專用模型系列 CyberPal 2.0，在核心威脅調查任務上，便超越了 GPT-4o 和 o1。在包含 1,507 項真實漏洞重現任務的 CyberGym 基準測試中，MDash 模型甚至優於 Mythos 和 GPT-5.5。

黑鴨子軟體技術長 Dipto Chakravarty 指出，當基準測試為模型提供大量資源和多次嘗試時，大部分的效能提升來自這些測試條件，而非模型本身的智慧。Aikido Security 的 AI 滲透測試負責人 Philippe Dourassou 也表示，任務越困難、耗時越長，越智慧的模型表現越好。 Bedrock Data 資安長 George Gerchow 則強調，真正的自主掃描必須從整個程式碼庫開始尋找，這種需要跨越數千行上下文來發現前所未知互動的推理問題，是小型模型的挑戰。

儘管小型模型在日常資安工作中展現高效，但 AI 生成的漏洞報告正以驚人的速度湧入，甚至超越了人工審核的處理能力。例如，今年 HackerOne 和 cURL project 都因 AI 提交的漏洞報告數量過大，而暫停了漏洞獎勵計畫。這顯示 AI 雖然能提高發現效率，但也帶來了新的挑戰。

Forescout 創新副總裁 Howie Koh 預期，未來資安防護將會整合多種模型。小型模型可負責持續、具成本效益的掃描工作，而邊界 AI 則在需要深度推理的週期性深度分析時發揮作用。George Gerchow 強調，只要邊界模型能找出一個小型模型遺漏的零時差漏洞（zero-day finding），就足以證明其投資的價值。因此，Fable 5 的推出為資安團隊提供了更多選擇，端視其要解決的問題及能承受的風險程度。