
シドニー:Google と OpenAI が開発した生成型 AI モデルが、国際的な数学コンテストで人間を打ち負かした。このコンテストでは、AI モデルが初めてゴールドレベルのスコアを達成した。
20 歳未満の参加者が競う権威ある年次コンテスト「国際数学オリンピック(IMO)」では、5 人の若者が満点を獲得したが、AI モデルはいずれも満点には至らなかった。
Googleは月曜日、同社のチャットボット「Gemini」の高度なバージョンが、今月オーストラリアのクイーンズランド州で開催されたIMOで出題された6つの数学問題のうち5つを解いたと発表した。
「Google DeepMindが、42点満点中35点を獲得し、待望の金メダルスコアを達成したことを確認できる」と、米テクノロジー大手はIMO会長のグレゴール・ドリーナール氏の言葉を引用した。
「彼らの解答は多くの点で驚くべきものでした。IMO の採点者は、その解答は明確で正確であり、そのほとんどは理解しやすいものと評価しました」
人間の参加者の約 10% が金メダルを獲得し、5 人が 42 点の満点を獲得した。
米国の ChatGPT メーカー OpenAI は、同社の実験的な推論モデルがテストで金メダルに相当する 35 点を獲得したと発表した。
OpenAI の研究者、アレクサンダー・ウェイ氏はソーシャルメディアに、「この結果は、『世界でも最も権威のある数学コンテスト』で『AI の長年の大きな課題』を達成したものだ」と記している。
「私たちは、人間の参加者とまったく同じルールで、2025 年の IMO 問題についてモデルを評価した」と彼は述べている。
「各問題について、3 人の元 IMO メダルリストが、提出されたモデルの証明を独立して採点した」と。
Google は、昨年イギリスのバースで開催された IMO で 6 問中 4 問を解き、銀メダルを獲得した。
その計算には 2~3 日を要したが、今年の Gemini モデルは 4.5 時間の制限時間内に問題を解いたと Google は述べている。
IMOは、テクノロジー企業が「今年の課題に対してクローズドソースのAIモデルを非公開でテストした」と述べた。これらの課題は、112カ国から参加した641人の学生が直面したのと同じものだった。
「AIモデルの数学的能力の進歩を目にするのは非常に興奮する」とIMO会長のドリーナール氏は述べた。
コンテストの主催者は、AI モデルがどれだけの計算能力を使用したか、また人間の関与があったかどうかを検証することはできなかったと警告している。
AFP