訊息平台

AI應用推升私有基礎設施挑戰 博通VCF 9.1強化治理與效益

圖/本報AI製圖(示意圖)

商傳媒|責任編輯/綜合外電報導

隨著人工智慧(AI)應用的快速發展,企業面臨前所未有的挑戰,AI工作負載對私有基礎設施的運算能力、治理、資安與成本紀律提出更高要求,其變動速度已超越傳統IT規劃週期。儘管公有雲適用於快速實驗與學習,但在資料主權、資料安全、模型效能及成本可預測性方面,許多企業認為其不足以滿足生產型AI的需求,因此正將生產型AI轉移至私有基礎設施。

博通(Broadcom)於昨日(5月12日)發布 VMware Cloud Foundation 9.1(VCF 9.1),旨在支援企業將生產型AI工作負載移轉至私有基礎設施的趨勢。VCF 9.1被定位為一個能在組織既有基礎設施上運行,並受其治理的最安全且最具成本效益的私有AI平台。該平台透過單一統一的雲端平台,提供企業級功能,以單一營運模式和資安態勢運行及管理AI工作負載和代理,無論團隊與應用程式結構如何,都能保持一致性。

現行AI計畫常導致跨團隊的叢集數量激增,工具使用雜亂無章,且缺乏一致的營運模式,模型甚至在非為生產營運設計的基礎設施上運行,大幅增加管理成本與風險。特別是代理式人工智慧(Agentic AI)在不同基礎設施、資安模型和儲存環境中運行數百個代理時,由於缺乏共同的營運層,進一步加劇了挑戰。任何超出統一治理框架運作的代理都可能成為法規遵循的漏洞和潛在的攻擊入口。

VCF 9.1針對企業在AI營運上面臨的三大問題進行創新:

強化生產型AI治理與控制

在AI投入生產之前,企業需釐清資料與智慧財產(IP)的控制權、代理的治理方式以及稽核軌跡的歸屬。VCF 9.1透過 VCF Private AI Services,讓組織能夠選擇部署開源和商業AI模型,同時保有對模型與訓練資料的隱私、合規性與控制權。此外,VCF 9.1使IT營運能夠集中管理和控制 Model Context Protocol(MCP)工具及其相關伺服器的存取,確保使用者群組只能存取經核准的工具,並緩解AI代理擴散和MCP伺服器缺乏中央控制的風險。VCF 9.1內建可自訂的儀表板,能即時追蹤AI模型和代理的效能,包括 Token 吞吐量和基礎設施利用率,提供優化與投資回報率計算所需的能見度。

優化AI規模化基礎設施經濟效益

AI工作負載專用的硬體若未能充分利用,將導致閒置的 GPU 消耗電力,並增加軟體授權、資安風險、能源與支援成本。VCF 9.1透過與 AMD、輝達(NVIDIA)和英特爾(Intel)等夥伴合作,支援多種AI加速器,讓組織可依工作負載需求自由選擇基礎設施。VCF 9.1透過儲存、運算與生命週期營運來改善經濟效益,例如其 Intelligent NVMe Memory Tiering 自動化資料在記憶體層級間的配置,減少對額外動態隨機存取記憶體(DRAM)的需求;內建的軟體鏡像(software mirroring)則消除了對硬體 RAID 的依賴。新一代全域重複資料刪除與壓縮功能,可降低可壓縮工作負載的 vSAN 容量需求。VCF 9.1的即時修補(live patching)將生命週期營運從週末維護時段移出,並將每個部署的主機容量從2,500增至5,000,同時將平行叢集升級的數量從64增至256,並將 Kubernetes 叢集佈建時間縮短70%。整體而言,VCF 9.1可將伺服器總體擁有成本(TCO)降低多達40%,儲存成本降低39%,維護停機時間減少80%。

專為AI工作負載設計的資安措施

專有AI模型代表著重大投資與競爭價值,而訓練資料則涉及法律保護與隱私義務。代理式AI工作流程與生產系統的互動方式異於傳統應用程式,產生了需要明確治理的存取路徑。AI環境中的資安事件可能帶來競爭與法規上的嚴重後果。VCF 9.1將資安功能整合到從虛擬機器管理程式(hypervisor)到AI代理的每一層,無需額外工具。它為各種工作負載類型提供零信任架構,涵蓋同一平台上的虛擬機器、容器和AI代理,具備隔離、存取控制與政策執行能力。此外,VCF 9.1提供從資料中心到應用程式的六層隔離,並在法規遵循要求下,於轄區內啟用主權恢復環境。VCF 9.1更整合了 CrowdStrike 以加速識別入侵,並在恢復環境前驗證其清潔性,防止重新感染。

AI已不再是未來規劃項目,現今運行生產型AI的企業,其基礎設施決策將直接決定未來數年的成本結構、資安態勢與營運能力。將傳統工作負載與AI工作負載整合至統一平台,將有助於企業以更低成本運行AI並減少治理漏洞。