
OpenAIのCodex、チーム向けに従量課金制を導入・ChatGPT Businessも値下げ
2026/4/3

当サイトではアフィリエイトプログラムを利用して商品を紹介しています。
GoogleがGemini APIに2つの新しいサービス階層「Flex」と「Priority」を追加しました。これにより、開発者は単一の統合インターフェースからコストと信頼性のバランスを細かく制御できるようになります。 「Flex推論」はコスト最適化された低価格プランで、多少の待ち時間が許容できる処理(バックグラウンド処理など)向けに設計されています。従来、こうした処理には非同期のバッチAPIを使う必要がありましたが、Flexでは通常の同期エンドポイントのまま低コストで利用できます。設定は `service_tier` パラメーターを変更するだけで、すべての有料プランユーザーが利用可能です。 一方「Priority推論」は最高水準の処理保証を提供するプレミアムプランです。プラットフォームの利用が集中するピーク時でも処理が割り込まれることなく、重要なトラフィックを優先的に処理します。利用にはTier 2/3の有料プロジェクトが必要です。 AIが単純なチャットから自律型エージェントへと進化するなか、バックグラウンド処理と対話型処理を同一インターフェースで使い分けられるこの仕組みは、システム設計の複雑さを大きく軽減するものとして開発者から注目を集めそうです。