AI研究

OpenAIのAIが研究レベルの数学証明に挑戦、10問中5問以上を正解の可能性

2026/2/21 6:21:58
OpenAI News
via Our First Proof submissions | OpenAI
OpenAIのAIが研究レベルの数学証明に挑戦、10問中5問以上を正解の可能性

当サイトではアフィリエイトプログラムを利用して商品を紹介しています。

OpenAIが2026年2月、研究者向けの数学証明チャレンジ「First Proof」の全10問に社内開発モデルを挑戦させた結果を公開しました。10問中少なくとも5問(4・5・6・9・10番)で正解の可能性が高いと専門家から評価されており、残りの問題も審査が続いています。これらの問題は著名な研究者が出題した難問で、発見されるまで数年かかったものも含まれています。 このモデルは「思考の厳密さを高める」ことを目的に訓練されており、数時間にわたって連続して考え続けながら高い確信度を保てる能力を目標として設計されています。通常の競技数学とは異なり、専門家が検証できる形での完全な証明の構築が求められるため、短答式の評価よりはるかに難しい挑戦です。 この成果はOpenAIの研究の流れと一致しています。2025年7月には数学オリンピックで金メダル相当のスコアを達成、同年11月はGPT-5による科学加速実験を公開、2026年2月には物理学の理論的新結果も報告済みです。AIが未解決の数学・科学の問題に取り組む能力が急速に向上していることが改めて示されました。 今後はFirst Proof主催者と連携してより厳密な評価の枠組みが検討される予定で、これらの新たな推論能力が将来の公開モデルに搭載されることが明らかにされています。

関連記事