AI製品

Gemini APIに新料金プラン「Flex」と「Priority」が登場、コストと信頼性を柔軟に制御

2026/4/3 6:37:40
Google AI Blog
via New ways to balance cost and reliability in the Gemini API
Gemini APIに新料金プラン「Flex」と「Priority」が登場、コストと信頼性を柔軟に制御

当サイトではアフィリエイトプログラムを利用して商品を紹介しています。

GoogleがGemini APIに2つの新しいサービス階層「Flex」と「Priority」を追加しました。これにより、開発者は単一の統合インターフェースからコストと信頼性のバランスを細かく制御できるようになります。 「Flex推論」はコスト最適化された低価格プランで、多少の待ち時間が許容できる処理(バックグラウンド処理など)向けに設計されています。従来、こうした処理には非同期のバッチAPIを使う必要がありましたが、Flexでは通常の同期エンドポイントのまま低コストで利用できます。設定は `service_tier` パラメーターを変更するだけで、すべての有料プランユーザーが利用可能です。 一方「Priority推論」は最高水準の処理保証を提供するプレミアムプランです。プラットフォームの利用が集中するピーク時でも処理が割り込まれることなく、重要なトラフィックを優先的に処理します。利用にはTier 2/3の有料プロジェクトが必要です。 AIが単純なチャットから自律型エージェントへと進化するなか、バックグラウンド処理と対話型処理を同一インターフェースで使い分けられるこの仕組みは、システム設計の複雑さを大きく軽減するものとして開発者から注目を集めそうです。

関連記事