真の一般推論機能を備えた初の大規模モデルである o1 モデルの複雑な問題と推論タスクを処理する能力は、ai テクノロジーの歴史的な転換点を告げる可能性があります。
aiの歴史において、2024年9月12日は歴史的な転換点として記憶されるかもしれない。この日、OpenAI は最新の AI モデル シリーズ o1 を発表しました。関係者によると、o1は人間に近い思考プロセスを持つ史上最も賢いモデルで、人類が推論の時代への新たな道を進んでいることを示しているという。
o1 モデルの中核は、その推論能力にあります。予測ベースのモデルとは異なり、o1 は質問に答える前に深く考えて、最適な答えが見つかるまでさまざまなパスを探索します。
この機能により、o1 はチェスの国際試合で重要な瞬間に考えられる手を検討するのと同じように、より多くの「考える時間」があれば、より難しい質問に答えることができます。この推論能力は AI 開発における大きな一歩であり、プログラミング、数学、科学問題を含む (ただしこれらに限定されない) 幅広い分野で AI を応用できるようになります。
一般ユーザーが日常的に使用する場合、o1 モデルと GPT シリーズの微妙な違いを認識するのは難しいかもしれませんが、AI テクノロジーを深く研究する研究者にとって、この変更は革命的です。
「The Atlantic」の先週の記事によると、研究者らは、GPTなどの古いモデルと比較して、o1モデルは単なるアップグレードではなく、「まったく異なるゲームルール」と「真の進歩」を意味すると認識しているという。真に普遍的な推論能力を備えた最初の大型モデルとして、o1 モデルの複雑な問題と推論タスクの処理能力は、人工知能テクノロジーの歴史的な転換点を告げる可能性があります。
OpenAIの研究副社長マーク・チェン氏は今年初め、o1は人間の知性の特徴である「推論」ができるため、標準的なChatGPTとは根本的に異なると指摘した。その直後、OpenAIのCEOアルトマンは「インテリジェンスの時代が近づいている」と人工知能が人類の気候問題の解決と宇宙の植民地化に役立つと発表した。先週、このスタートアップは、完全な推論機能を備えた、完全に成熟した o1 の第 1 世代バージョンを一般公開しました。
真に普遍的な推論を備えた初の大型モデル OpenAI は、o1 モデルは、化学、物理学、生物学におけるベンチマーク GPQA ダイヤモンド テストの知識で完全に実証された、真の一般推論機能を備えた最初の大規模モデルであると主張しています。
OpenAI の評価によると、o1 はテストにおいて人間の博士専門家を総合的に上回り、78.3% の正解率を達成し、人間の専門家は 69.7% のスコアを獲得しました。 OpenAI は、「汎用人工知能 (AGI) への道に障害は残されていない」と述べています。
さらに、o1 は複数の困難な推論ベンチマーク テストで優れており、たとえば米国招待数学試験 (AIME) では、o1 は 83.3% の正答率を達成し、前世代の GPT-4o のパフォーマンスを大幅に上回りました。
また、o1 モデルの開始により、国内外の AI 企業が互いの動向を注意深く監視し、大規模 AI モデルの分野でブレークスルーを達成することを目指しています。 kimi の k0math、Deepseek の DeepSeek-R1-Lite、Kunlun Tech の「Tiangong Large Model 4.0」o1 バージョンなど、一連の新興大型モデルが市場に登場し、論理的思考と深い推論能力で o1 と競合しようとしています。