全球第一個獲得 ISO/IEC 42001:2023 AI 管理系統認證的開源模型
專為處理代理型關鍵任務而生 可單獨部署或作為大型複雜推理系統的關鍵模組
台北2025年10月7日 /美通社/ — IBM 日前發表其最新一代企業級「小語言模型」 Granite 4.0,以創新的混合式架構,結合 Mamba-2 與 Transformer 技術,實現前所未有的效能與效率。Granite 4.0 不僅大幅降低記憶體與硬體成本,更提供企業部署 AI 的安全性、可控性與彈性,為台灣各類型企業的 AI 應用落地提供強力支援。
IBM 發表「中小企業友好」的小語言模型 Granite 4.0,處理AI 複雜任務時大幅降低記憶體的使用量達 70%,推理速度加快 2 倍,同時支援更平價的 GPU包括家用硬體;大幅降低企業部署AI成本,更提高應用AI 的安全性、可控性與彈性。
Granite 4.0已在 IBM watsonx.ai 平台正式上線,並同步支援 Dell Technologies (Dell Pro AI Studio 與 Enterprise Hub)、Docker Hub、Hugging Face、Kaggle、LM Studio、NVIDIA NIM、Ollama、OPAQUE 及Replicate 等平台;未來也將支援 Amazon SageMaker JumpStart 與 Microsoft Azure AI Foundry。
混合式架構,創造效能與成本的完美平衡
Granite 4.0 採用創新的 Mamba/Transformer 混合架構,突破傳統 Transformer 模型處理長文本的效能瓶頸。Mamba 架構可線性擴展上下文長度,讓 Granite 4.0 在處理複雜任務時,大幅降低記憶體的使用量達 70%,推理速度卻加快 2 倍,同時支援更平價的 GPU包括家用硬體。這項突破對台灣中小企業與開發者意味著高效能 AI 不再是高成本的同義詞,而是人人可及的技術資源。
多元模型版本,滿足各種企業需求
Granite 4.0 提供多種模型規格,靈活應對不同場景:
- Granite-4.0-H-Small:總參數量32B的混合式專家模型,活躍參數9B,適合客服自動化、多工具代理任務;
- Granite-4.0-H-Tiny:總參數量7B的混合式專家模型,活躍參數1B,適合邊緣運算與地端部署;
- Granite-4.0-H-Micro:總參數量3B 的混合式模型,快速執行關鍵任務;
- Granite-4.0-Micro:傳統 Transformer 架構,適用於尚未支援混合架構的平台。
Granite 4.0 所有模型皆提供 Base 與 Instruct 版本;並預計於2025年底推出強化邏輯推理的Thinking 模型。
小模型,大效能
Granite 4.0模型雖然尺寸精簡,但在多項基準測試中的表現,超越同級與其他大型開源模型:
- 在 Stanford IFEval 指令遵循測試中,Granite-4.0-H-Small 表現優於所有開源模型(除 Llama 4 Maverick 外);
- 在 Berkeley Function Calling Leaderboard v3 中,Granite-4.0-H-Small 以更低成本達到與大型模型相同的工具調用準確率;
- 在 MTRAG 多輪檢索增強生成測試中亦有亮眼表現。
上述成果歸功於 IBM 全面升級了模型架構、訓練方法與資料品質,包含使用一個精心編製、聚焦於企業應用的 22 兆字元規模的語料庫。Granite 4.0 的預訓練資料涵蓋多元來源,包括 DataComp-LM (DCLM)、GneissWeb、TxT360 子集、Wikipedia 以及其他與企業場景高度相關的資料來源。為了增強模型處理企業任務的表現,這些模型經過後訓練(post-training),涵蓋語言理解、程式碼生成、數學推理、多語言處理、安全性、工具調用 (tool calling)、檢索增強生成(RAG)與資安等多個領域,並結合合成資料與開放資料集進行優化。
安全、可信、可控,是企業部署的首選
Granite 4.0 是全球第一個獲得 ISO/IEC 42001:2023 AI 管理系統認證的開源模型家族,展現 IBM 對 AI 安全與負責任治理的高度承諾:
- 所有模型皆經過加密簽章,確保來源與完整性;
- 訓練資料皆經過倫理審查與企業授權;
- 若在 watsonx.ai 平台使用 Granite 模型,IBM 提供無上限第三方 IP 賠償保障。
此外,IBM 與 HackerOne 共同宣布「找尋Granite漏洞」獎勵計畫,最高獎金達美金十萬元,鼓勵開發社群共同提升 AI 安全。
企業部署AI更簡單、更靈活
Granite 4.0 支援多種硬體與推理框架,讓台灣企業與開發者可快速整合至現有系統:
- 支援 AMD Instinct™ MI-300X GPU 與 Qualcomm Hexagon™ NPU,適用於行動與邊緣設備;
- 相容於 vLLM、llama.cpp、MLX、NexaML 等主流推理框架;
- 可透過 Unsloth 進行微調,並整合至 Continue 等開發者工具。
開發者可在 Granite Playground試用 Granite 4.0,並參考 Granite Docs 中的 RAG、摘要、自動化教學資源。
IBM 將繼續擴展 Granite 4.0 模型家族,將推出:
- 更小型的 Medium 與 Nano 模型,強化邊緣AI部署能力;
- 強化邏輯推理的 Thinking 模型,支援複雜決策與分析任務;
- 持續優化架構與平台支援,推動 AI 普及化與在地化。
IBM推出Granite 4.0,持續倡議與實現開放、安全、高效的企業級AI,協助全球企業在數位轉型旅程中穩健前行。Granite 4.0 模型已在 IBM watsonx.ai 平台開放使用,並採用 Apache 2.0 開源授權。更多資訊請參閱IBM Granite 4.0網頁。
關於 IBM
IBM 是全球領先的混合雲、人工智慧及企業服務提供者,服務遍及全球 175 多個國家。IBM 協助企業從資料中獲得商業洞察、簡化流程、降低成本並增強競爭力。來自金融服務、電信和醫療等關鍵領域的機構,採用 IBM 混合雲平台及 Red Hat OpenShift 進行數位轉型。IBM 在人工智慧、量子運算和產業導向的雲端解決方案及企業服務領域持續創新,為客戶提供開放且靈活的選擇。公司秉持誠信、透明治理、社會責任、多元包容的企業文化,奠定了 IBM 的業務基石。
台灣 IBM 公司新聞室:https://taiwan.newsroom.ibm.com/
新聞聯絡
IBM 公司公關部 Kate Liu kateliu@cn.ibm.com