AI製品
AI「Gemini 3 Pro」登場:写真や文書を理解する能力が大幅進化
2025/12/5 0:00:00
•Google AI Blog
当サイトではアフィリエイトプログラムを利用して商品を紹介しています。
Googleは、最新のAIモデル「Gemini 3 Pro」を発表しました。 このモデルは、画像や文書、空間、動画など、様々な情報を理解する能力が格段に向上しています。特に、写真に写った文字を正確に読み取るだけでなく、複雑な表や数式を理解し、それをコンピューターが扱える形(HTMLやLaTeXなど)に変換する「レンダー解除」という技術に優れています。また、長文の報告書から必要な情報を探し出し、複数ステップの複雑な推論を行うことも可能です。例えば、62ページにわたる報告書から、収入の変化とその原因、さらに低所得層の所得シェアの変動までを正確に分析しました。 Gemini 3 Proは、空間を認識する能力も強化されており、コンピューターの画面操作を自動化するような応用も期待されています。これにより、AIは単なる認識を超え、より高度な「理解」と「推論」ができるようになり、様々な分野での活用がさらに進むと考えられます。


