訊息平台

Google 發布平價版 AI 模型 影像生成每千張僅需 0.034 美元

圖/示意圖

商傳媒|葉安庭/綜合外電報導

Google 於週二推出兩款全新生成式人工智慧(AI)媒體模型,分別是 Nano Banana 2 Lite 與 Gemini Omni Flash,旨在提供更經濟實惠的影像與影片生成方案,並將其整合至 Gemini Enterprise Agent Platform。此舉預期將加速 AI 應用的普及,讓更多開發者與企業能以較低的成本運用生成式 AI 技術。

根據《mediapost》報導,Nano Banana 2 Lite (Gemini 3.1 Flash-Lite Image) 被 Google 形容為 Nano Banana 系列中最快速且最具成本效益的影像生成與編輯模型。這款模型僅需短短四秒就能生成一張影像,大幅提升廣告文案 A/B 測試、社群應用程式開發等高頻率影像工作流程的效率。另一媒體《TradingView》則指出,Nano Banana 2 Lite 的定價約為每生成一千張影像僅需 0.034 美元,進一步凸顯其低成本優勢。

同時推出的 Gemini Omni Flash 則專注於高品質影片生成與對話式編輯功能。它能讓創作者在影片編輯時考量上下文,進行高品質的影片生成與精細調整。例如,使用者可以精確控制影片素材的編輯和修改,包括替換角色或產品、動態風格轉換、添加物件以及重新打光等。Gemini Omni Flash 支援多重輸入,可整合文字、影像和影片,並透過自然語言進行對話式編輯,同時保留原始音訊與影片軌道。此模型的定價為每秒影片輸出 0.10 美元。

Google 表示,Gemini Omni Flash 具備「直觀理解」能力,能從 Gemini 模型中汲取真實世界的領域知識與文化背景,彌補擬真與故事敘述之間的差距,有效減少 AI 生成的錯誤。《mediapost》指出,這項技術能讓模型理解如自行車通常為前後各一輪、三輪車則為前一輪後兩輪的常識性設計,提升內容的合理性與品質。此外,此模型也能在影片中渲染清晰的文字與圖形,並與螢幕上的動作進行同步。

兩款新模型將內建 Coalition for Content Provenance and Authenticity(C2PA)的內容憑證與難以察覺的 SynthID 浮水印技術,協助驗證生成內容的真實性。大型廣告代理商 WPP集團 已提前使用 Gemini Omni Flash,並將其整合至其 AI 行銷平台 WPP Open 中。Adobe 也將 Gemini Omni Flash 和 Nano Banana 2 Lite 導入其創意 AI 工具 Adobe Firefly。為確保高併發應用程式介面(API)請求的穩定性,Gemini Enterprise Agent Platform 已開始為 Nano Banana 2 Lite 提供「預置吞吐量」(provisioned throughput),並預計很快為 Gemini Omni Flash 推出這項服務。