AI製品

AI「Gemini 3 Pro」登場：写真や文書を理解する能力が大幅進化

2025/12/6 6:12:06

•Google AI Blog

via Gemini 3 Pro: the frontier of vision AI

当サイトではアフィリエイトプログラムを利用して商品を紹介しています。

Googleは、最新のAIモデル「Gemini 3 Pro」を発表しました。このモデルは、画像や文書、空間、動画など、様々な情報を理解する能力が格段に向上しています。特に、写真に写った文字を正確に読み取るだけでなく、複雑な表や数式を理解し、それをコンピューターが扱える形（HTMLやLaTeXなど）に変換する「レンダー解除」という技術に優れています。また、長文の報告書から必要な情報を探し出し、複数ステップの複雑な推論を行うことも可能です。例えば、62ページにわたる報告書から、収入の変化とその原因、さらに低所得層の所得シェアの変動までを正確に分析しました。 Gemini 3 Proは、空間を認識する能力も強化されており、コンピューターの画面操作を自動化するような応用も期待されています。これにより、AIは単なる認識を超え、より高度な「理解」と「推論」ができるようになり、様々な分野での活用がさらに進むと考えられます。

この記事の関連商品

AI搭載Googleファイナンスが欧州で展開

2026/5/11

AIで中小企業を輝かせる広告プロジェクト始動

2026/5/9

Google検索で庭づくりをもっと楽しく！AIが植物ケアも手伝う

2026/5/7

AI「Gemini 3 Pro」登場：写真や文書を理解する能力が大幅進化

この記事の関連商品

Google AI Studio 超入門

Python 実践AIモデル構築 100本ノック

次世代AIモデルプログラミング入門

関連記事

AI搭載Googleファイナンスが欧州で展開

AIで中小企業を輝かせる広告プロジェクト始動

Google検索で庭づくりをもっと楽しく！AIが植物ケアも手伝う