商傳媒|何映辰/台北報導
隨著 Anthropic 推出 Fable 5 模型,資安領域正重新掀起關於小型人工智慧(AI)模型能否追趕上大型尖端 AI 工具的討論。過去,Anthropic 的 Project Glasswing 與 OpenAI 的 Daybreak 等大型「邊界模型」(frontier models)因其深度推理能力而受矚目,這些模型能夠分析龐大的程式碼庫、將個別漏洞串聯成可用的攻擊鏈,甚至找出數十年來未被發現的程式碼缺陷。
然而,這些邊界模型通常採受限存取方式,僅供經過審查的合作夥伴使用,因為它們需要大量運算資源。相較之下,小型語言模型(Small Language Models, SLM)過去被認為不適合進行複雜的推理工作,因為它們運行所需的資料和 Token 數量較少。但產業專家現正探討小型模型是否能縮小與大型模型之間的差距,以及在何種條件下可行。
對於高頻率、重複性的資安任務,例如將發現結果與已知漏洞類別進行匹配,或跨系統關聯警報等,經過領域訓練的小型模型在準確性上已超越邊界模型。IBM 研究院開發的資安專用模型系列 CyberPal 2.0,在核心威脅調查任務上,便超越了 GPT-4o 和 o1。在包含 1,507 項真實漏洞重現任務的 CyberGym 基準測試中,MDash 模型甚至優於 Mythos 和 GPT-5.5。
黑鴨子軟體技術長 Dipto Chakravarty 指出,當基準測試為模型提供大量資源和多次嘗試時,大部分的效能提升來自這些測試條件,而非模型本身的智慧。Aikido Security 的 AI 滲透測試負責人 Philippe Dourassou 也表示,任務越困難、耗時越長,越智慧的模型表現越好。 Bedrock Data 資安長 George Gerchow 則強調,真正的自主掃描必須從整個程式碼庫開始尋找,這種需要跨越數千行上下文來發現前所未知互動的推理問題,是小型模型的挑戰。
儘管小型模型在日常資安工作中展現高效,但 AI 生成的漏洞報告正以驚人的速度湧入,甚至超越了人工審核的處理能力。例如,今年 HackerOne 和 cURL project 都因 AI 提交的漏洞報告數量過大,而暫停了漏洞獎勵計畫。這顯示 AI 雖然能提高發現效率,但也帶來了新的挑戰。
Forescout 創新副總裁 Howie Koh 預期,未來資安防護將會整合多種模型。小型模型可負責持續、具成本效益的掃描工作,而邊界 AI 則在需要深度推理的週期性深度分析時發揮作用。George Gerchow 強調,只要邊界模型能找出一個小型模型遺漏的零時差漏洞(zero-day finding),就足以證明其投資的價值。因此,Fable 5 的推出為資安團隊提供了更多選擇,端視其要解決的問題及能承受的風險程度。







