訊息平台

Oracle 雲端平台引入 GLM-5.2 企業級 AI 部署選項更靈活

圖/示意圖

商傳媒|何映辰/台北報導

Oracle 雲端基礎架構(OCI)旗下的 OCI Enterprise AI 平台,現已透過「模型導入」(Model Import)功能,提供 Zhipu AI 的 GLM-5.2 模型。這項整合讓企業客戶在部署人工智慧(AI)應用時,擁有更多元的模型選擇與更高的靈活性。

現今企業正加速從 AI 實驗階段邁向實際生產應用,而沒有單一模型能完全適用所有工作負載。因此,能否為特定任務挑選最合適的模型,已成為提升 AI 效能與優化總持有成本(TCO)的關鍵。

GLM-5.2 是由 Zhipu AI 開發的旗艦級大型語言模型,專為長文本任務設計。該模型具備 1M-token 的上下文視窗(Context Window),特別擅長於處理大量資訊下的擴展上下文推理、高階程式開發及自主代理工作流程。其中「Token」(詞元)是指人工智慧模型處理文字或程式碼時的基本單元,而「上下文視窗」則代表模型能一次處理的資訊量。

OCI Enterprise AI 的「模型導入」功能,允許客戶將受支援的開源或第三方模型,帶入 OCI 平台。這些模型可以部署在專屬的 AI 叢集上,建立服務端點,並透過 OCI Generative AI API、軟體開發套件(SDK)或在開發介面(playground)中運用。GLM-5.2 的加入,為企業團隊在 OCI 環境中處理需要進階推理及長上下文能力的 AI 工作負載,增添另一項強大選擇,同時能有效管理部署、治理與基礎設施。

模型選擇的多樣性,也是企業優化成本的重要策略。OCI 透過提供更廣泛的模型組合,且無需修改應用程式碼,協助客戶根據延遲、品質、吞吐量、領域適用性及成本等需求,選擇最合適的模型。例如,小型專用模型可用於高流量任務以降低成本,而大型推理與程式開發模型則可保留給更複雜的工作流程。此外,語音、安全、醫療及其他領域專用模型也能在效能優先的場景中發揮最大效益。這種模型混合策略有助於企業最佳化商業成果,而非僅僅將單一模型套用於所有情境。

為方便企業客戶使用,導入 GLM-5.2 的流程包含開啟 OCI Console,從 Hugging Face 或 Object Storage 儲存桶導入模型,接著為此模型建立專用的 AI 叢集與服務端點,最後便能透過 OCI Generative AI API 等方式呼叫模型。OCI Enterprise AI 在今年六月已新增多款模型,持續擴大模型選擇,助力客戶最佳化 AI 應用的效能與總持有成本。