訊息平台

AI模型競賽白熱化:Anthropic、OpenAI發布中階新模型

圖/本報資料庫

商傳媒|責任編輯/綜合外電報導

人工智慧(AI)領域的兩大巨擘 Anthropic 與 OpenAI 近期競相發布中階AI模型,預示著這場技術競賽正進入白熱化階段。據《Crypto Briefing》報導,市場盛傳 Anthropic 的 Claude Sonnet 5 模型與 OpenAI 的 GPT-5.6 模型即將登場,兩者都將對 AI 發展帶來新變革。

Anthropic 的 Claude Sonnet 5 模型的傳聞最早在今年 1 月底浮出水面,內部代號為「Fennec」。早期市場預測其 SWE-Bench(衡量 AI 程式撰寫能力的基準測試)分數約在 82% 至 92% 之間。今年 2 月的跡象顯示,該模型已接近測試或有限度推出階段。另一方面,《Crypto Briefing》指出,OpenAI 的 GPT-5.6 預計將於本週(2026 年 6 月 23 日當週)發布,並可能同步推出 Pro 及 Mini 兩種版本。

隨著 AI 模型的演進,AI 開發的重心也從傳統的「提示工程」(Prompt Engineering)轉向更自動化的「循環工程」(Loop Engineering)或「代理工程」(Agentic Engineering)。Anthropic 共同創辦人暨 Claude Code 開發者鮑里斯·切爾尼(Boris Cherny)曾指出,軟體工程已是夕陽產業,而整合開發環境(IDEs)也將面臨淘汰。他認為未來屬於循環工程,即 AI 代理能夠自行生成並改進提示,減少人為持續輸入。

循環工程的核心在於讓 AI 代理能夠像員工一樣運作,透過反覆運行的系統自動引導任務,而非依賴人類一步步的指示。例如,一個簡單的指令便能讓 AI 模型持續工作直到任務完成。OpenAI 的 OpenClaw 開發者彼得·斯坦伯格(Peter Steinberger)建議,應設計能提示代理的循環,而不是直接提示程式撰寫代理。Google Cloud 的 Addy Osmani 則將循環描述為涵蓋自動化、工作樹、技能、插件與連接器以及子代理等五大要素。

ChatPRD 創辦人 Claire Vo 將此比喻為「管理者」的角色,設計一個工作,就像是在為新員工進行培訓。實際應用中,一個 AI 代理可以負責撰寫程式碼,另一個則負責檢查,而 Codex 甚至能每隔五分鐘喚醒一次,將工作分配到不同執行緒以維護儲存庫。然而,Anthropic 內部自去年 11 月以來,已幾乎無人手動編寫程式碼,凸顯 AI 在程式開發中扮演日益重要的角色。

儘管循環工程具備高效潛力,同時運行多個代理與子代理會因 Token(AI 處理資訊的基本單位)預算而快速累積高昂成本。彼得·斯坦伯格建議,為降低成本,可採用較長的運行間隔(例如每小時或每天);Addy Osmani 則提醒,僅在第二意見確實值得付出額外成本時才使用子代理。

「vibe coding」(憑感覺寫程式)一詞由 OpenAI 共同創辦人安德烈·卡帕斯(Andrej Karpathy)於 2025 年初提出,並在去年 11 月被 Collins Online Dictionary 選為年度詞彙。鮑里斯·切爾尼認為此詞未能充分體現 AI 輔助程式設計的複雜性,而 Claude 則提出「agentic engineering」作為替代。Anthropic 的 Claude Code 與 OpenAI 的 Codex 模型目前已創造數十億美元營收,並產生數百萬行生產級別的程式碼,顯示 AI 程式開發工具的商業價值與技術成熟度。