商傳媒|林昭衡/綜合外電報導
蘋果的WebKit團隊於週三(7月1日)發布Safari Technology Preview 247,其中包含首個由主要瀏覽器廠商提供的原生模型上下文協議(Model Context Protocol, MCP)伺服器。這項創新讓AI代理(AI Agents,意指能夠自主執行任務的人工智慧程式)能夠直接與活躍中的Safari視窗互動,讀取即時網頁結構(DOM,文件物件模型,代表網頁的結構)、擷取主控台日誌與網路請求數據,甚至在不切換視窗或手動描述問題的情況下,執行JavaScript。
這項Safari MCP伺服器讓AI代理能夠自行了解程式碼在瀏覽器中實際的呈現方式,而非僅依賴開發者對問題的描述。它終結了傳統的偵錯循環,能讓AI代理直接發現錯誤並修正。伺服器向連接的AI代理公開了17個文件化工具,涵蓋導覽、頁面檢查、DOM互動、執行時存取、網路可見性和版面測試。這些工具滿足了開發者最常手動使用的四個開發者工具類別需求,例如捕捉JavaScript錯誤、檢查計算樣式、確認網路呼叫,以及驗證結帳流程或表單提交等互動狀態是否如預期運作。AI代理甚至可以在無需開發者編寫單獨測試程式的情況下,執行自動化輔助功能檢查。
Safari MCP伺服器建立在safaridriver的基礎之上,safaridriver是自2016年macOS Sierra版本的Safari 10以來,蘋果瀏覽器便隨附的W3C WebDriver實作。將MCP伺服器連接到Safari視窗只需一道終端機指令。該伺服器會創建一個獨立於使用者正常Safari視窗的專用自動化視窗,透過蘋果的XPC跨程序通訊層在作業系統層級強制執行。這確保了AI代理無法讀取自動填寫資料、儲存密碼、瀏覽歷史或其他任何個人Safari資訊。當伺服器擷取頁面內容、截圖或主控台日誌時,這些數據會直接傳送給連接的AI代理,而非傳送給蘋果。WebKit團隊也提出明確指南,建議開發者「僅連接您信任的AI代理」,以降低來自惡意網頁的注入攻擊風險。
模型上下文協議(MCP)的歷史始於2024年11月,由Anthropic推出一項開放標準,並於2025年12月捐贈給Linux基金會旗下的Agentic AI Foundation。此協議的目標是將AI代理與外部工具整合時的複雜度,從傳統的N×M(N個AI代理對M個外部工具)降低至N+M,即每個代理和每個工具只需實作一次該協議。OpenAI於2025年3月採用了MCP,Google DeepMind則在同年4月跟進。與競爭對手相比,谷歌的Chrome DevTools MCP(於2025年9月發布)連接到現有的Chrome分頁,即便沒有積極偵錯,在蘋果晶片上仍會消耗40%到60%的CPU資源。微軟透過Copilot在Edge瀏覽器中實現的瀏覽器與AI整合,則將會話分析路由經過微軟的基礎設施。蘋果的實現方式則強調隔離與隱私保護,例如自動化視窗無法存取儲存的密碼或現有Cookie。
Safari Technology Preview中的功能通常會逐步整合到穩定版Safari。如果Safari MCP伺服器遵循與WebDriver相同的發展軌跡,它將為全球20億Safari用戶帶來原生的AI代理瀏覽器偵錯支援,特別對網路開發者將帶來效率上的巨大提升。







