OpenAIはAIの新モデル「OpenAI o1」を発表した。13日、ChatGPT Plusサブスクリプションとして利用できるようにし、パフォーマンスと推論機能が大幅に上昇したと主張した。
OpenAIは公式ブログで「強化学習で訓練され、複雑な推論を実行できる新しい大規模言語モデルであるOpenAI o1を導入します」と述べた。
大きな特徴として、「o1は答える前に考えます」と主張した。AI業界の観測者は、トップAI開発者があたらしい「ストロベリー」モデルを展開することを数週間前から予想していたが、開発中のさまざまなモデルの違いは公表されていない。
OpenAIは、この新モデルを大きな飛躍と述べており、ChatGPT-3、ChatGPT-3.5、ChatGPT-4oシリーズから変更し、OpenAI o1とした。
「複雑な推論タスクにとって大きな進歩であり、AI能力の新たなレベルに達しました。これを踏まえ、私たちはカウントターをリセットし、OpenAI o1と名付けました」と述べた。
同社によると、これらの新モデルは行動する前に「時間をかけて」考えることであり、複雑なタスクを極めて効率的に実行するために「思考の連鎖」推論を使用するという。
OpenAIが共有したAIテストベンチマーク、特に博士レベルの複雑さがあると考えられる課題に関するOpenAIの比較によると、このあたらしいラインナップの最小モデルでさえ、いくつかの重要な領域で現在トップレベルにあるGPT-4oを上回っているという。
公開された新モデルは、OpenAIが「熟慮推論」と呼ぶものを重視しており、システムが応答を内部的に処理するために時間を掛ける。
このプロセスは特に推論を多用するタスクにおいて、より思慮深く一貫した回答を出すことを目的としている。
OpenAIはまた、コーディング、微積分、データ分析などのタスクでGPT-40よりも大幅に改善されたことを示すテスト結果も公開した。
同社はOpen o1はクリエイティブライティン部などのクリエイティブタスクにおいてはそれほど劇的な改善を示さなかったことも明らかにした。
同社のテストで、これらの分野でOpenAIの製品はClaude AIより劣っていたという。それでも新モデルのテスト結果は業界で大きな評価を得た。
新モデルの機能は、推論中に思考の連鎖AIプロセスを実装する。簡単にいえば、セグメント化されたアプローチを使用して、問題を段階的に推論し、ユーザーが最終的に目にする最終結果を提供することを意味する。
天才の推論アプローチ
つまり天才の推論アプローチと同じということだ。
「o1シリーズは、思考の連鎖を使って推論するために大規模な強化学習でトレーニングされています。回答前に思考の連鎖を組み込むようにモデルをトレーニングすると、大きなメリットが得られる可能性がありますが、同時に、高度な知能から生じる潜在的なリスクも高まります」と述べた。
技術専門家の間では、このモデルのアーキテクチャの真の新規性については議論の余地が残っているといわれている。
OpenAIはこのプロセスがトークンベースの生成とどう異なるのかは明らかにしていない。
推論に対する実際のリソースの割り当てなのか、それとも隠れた思考連鎖コマンドであるのか、あるいは両方の技術の組み合わせであるのかは明らかになっていない。
以前、Reflectionと呼ばれるオープンソースのAIモデルが同様の推論重視のアプローチを試みたことがあったが、透明性の欠如で批判を浴びたことがあった。
思考連鎖プロセスに多くのガイドラインを組み込むと、モデルの精度が向上するだけでなく、潜在的に有害な結果が生成されたときにそれを捕捉するための時間と手順が増えるため、ジェイルブレイク手法に陥りにくくなる。
この熟慮型推論アプローチが、高度な応答時間を必要とするリアルタイムアプリケーションに効果的に活用できるかはまだ不明だ。
OpenAIは、一方で、ウェブ検索機能やマルチモーダいるインタラクションの改善など、モデルの機能を拡張する予定であると述べた。
このモデルは安全性、脱獄防止、自律性に関するOpenAIの最低基準を満たすように、時間の経過とともに調整される予定だという。
参考:発表
画像:発表
関連記事
OpenAIが新型AI「GPT-4o」を発表 処理速度2倍に
Google出身研究者が設立の日本発「Sakana AI」が200億円調達へ 創業1年でユニコーンに