OpenAIのAIモデル「ChatGPT o1-preview」が「ChatGPT o1」に進化! | マネルト

※ 本サイトのコンテンツには、商品プロモーションが含まれている場合があります。

OpenAIのAIモデル「ChatGPT o1-preview」が「ChatGPT o1」に進化!

この記事は約6分で読めます。
この記事を要約すると・・・

既存モデルのChatGPT o1-previewからpreviewが抜けた「ChatGPT o1」「o1 Pro mode」の二種類が新たに登場
ChatGPT o1は、米国数学オリンピック予選の「AIME」や競技プログラミングサイト「Codeforces」、大規模言語モデルの性能を評価するデータセット「GPQA」でハイスコアを叩き出し、ほかのAIモデルを圧倒
ChatGPT o1は「ChatGPT Plus(月額20ドル)」以上のプランで、o1 Pro modeは「ChatGPT Pro(月額200ドル)」のプランで利用可能

米OpenAIは、12月5日から平日の12日間にわたり新発表を続けるとX上で告知しました。

大小さまざまなものを発表すると予告していましたが、いきなり最新のAIモデル「ChatGPT o1」「o1 pro mode」をリリースし、生成AI利用者に大きな衝撃をもたらしました。

本モデルは、前身となった「ChatGPT o1-preview」から大幅に進化し、特に推論能力や応答速度、安全性の面で顕著な改善が見られます。

中でも「より多くの時間をかけて熟考すること」を重視して開発されたことにより、誤った回答を生成する機会が減少しました。

\ 無料のAIトークアプリ「Castalk」! /
実在する人物×AIで、圧倒的な人間感を持つ美女AIとおしゃべりできる!!

\ 危険な恋を楽しめるAIマッチングアプリ『Stella』! /
初プロフも顔写真も、メッセージも全てAIが生成!
次世代型の恋愛アプリがここに!


ChatGPT o1は推論能力が飛躍的に向上

ChatGPT o1は、複雑な問題に対してより深い理解と「思考の連鎖(Chain of Thought)」で正確な解答を提供する能力を持ちます。

これは人間の思考プロセスと同じで、物事についてすぐに結論を出すのではなく、いくつかの段階を踏んで答えに辿り着くことが可能です。

特に、数学、プログラミング、科学の分野でのパフォーマンスが向上し、博士課程レベルの質問にも高い精度で対応できます。

▶︎OpenAI公式サイトの「Learning to Reason with LLMs」で公開されたパフォーマンスの比較グラフ。旧モデルのGPT-4oとo1-previewを寄せ付けない圧倒的な推論能力を誇る。また、サイエンスの分野では人間の専門家よりも賢い

具体的には、以下の分野におけるベンチマークで驚異的な結果を残しています。

  • 優秀な高校生しか参加できない米国数学オリンピックの予選となる「AIME」で、トップ500の学生にランクイン
  • 競技プログラミングサイト「Codeforces」で89パーセンタイルにランクイン
  • 物理学、生物学、化学といった問題を出題する「GPQA」テストの最難関Diamondのベンチマークで人間の博士号レベルを凌駕

ChatGPTの性能が短期間で伸びすぎていて怖いですね。

人間のような汎用的な知能を持ち、知的タスクをこなせる「AGI」の水準にはまだ達していませんが、この調子で改善を重ねればあっという間にAGIが完成するかもしれません。

他のモデルと比較したo1のベンチマーク結果

GPT-4oやo1-previewと比較したベンチマークの結果は、以下の通りです。

2024年5月13日に登場したGPT-4oは、当時ものすごい注目を浴びましたが、それも今や過去の産物となりました。

優等生として生成AI界に登場したGPT-4oは、わずか7ヶ月で「o1」という名の新参者にその地位を取られ、劣等生となる結果に。

性能自体は優秀ではあるものの、この一年でのAIモデルの成長が早すぎたために、起こった悲劇と言えるでしょう。

ChatGPT o1とo1 Pro modeの料金

ChatGPT o1は、月額20ドルの「ChatGPT Plusプラン」に加入することで使用できます。

ただし、チャットの使用回数に制限があるため、一日中活用することはできません。

そしてo1よりも高性能な「o1 Pro mode」は、新たに導入された「ChatGPT Proプラン」に加入することで使用できます。

無論、o1は無制限に利用可能で、高度なボイスモードであるAdvanced Voice Modeも無制限化されます。

しかし、o1 Pro modeには使用回数に上限が設けられており、価格も「200ドル(約3万円)」とかなり高額です。

また、組織向けの「ChatGPT Team(25ドル)」はというと、ChatGPT Plus同様に、o1 Pro modeは解放されていません。

o1を利用することはできるものの、制限付きです。・

より高性能なo1 Pro modeが気になる方も多いと思いますが、仮に月額3万円を12ヶ月間契約し続けると「年間36万円」かかることになります。

一方、o1だけなら「年間3万6千円」です。

o1 Pro modeの1ヶ月分の料金だけで一年間使用し続けられるので、ChatGPTの使用頻度や使用目的などに応じてChatGPT Proへの加入を検討しましょう。

月額3万円の固定費は想像以上に重たいですし、性能が高いといってもどの程度の実力を誇るのかはまだ不透明なので、現状は様子見でいいと考えます。

なえむ
なえむ

OpenAIは今後、「より計算負荷の高いタスクに対応する機能」をProプランに実装していくと言っているから、内容によっては課金するのもありだと思うよ〜! Soraで最大1080pの動画を生成できるようになったしね!

おそらく、「o1」も「o1 Pro」に負けず劣らずだと思うので、まずはPlusプランに加入してo1を試してみてはいかがでしょうか!

\ o1の上位モデルが使える新プランの解説はこちら! /
ChatGPT Proプランの詳細がわかる!

o1を実際に使ってみた

ChatGPT o1がどの程度優れているのかを確かめるため、実際に以下の問題を解かせてみました。

  1. Googleの入社問題
  2. Appleの入社問題
  3. Microsoftの入社問題
  4. ひっかけ問題

順番に見ていきましょう。

Googleの入社問題

5Lの空バケツと3Lの空バケツがある。
水はいくらでも使えるものとして、二つのバケツを使って正確に4Lを量りなさい

初見では非常に難しい問題を難なく正解。

また、解答に至るまでの過程をステップバイステップで示してくれました。

Appleの入社問題

机の上に100枚のコインがある。全てが表か裏を向いており、10枚が表で90枚が裏である。あなたは、感覚、視覚、その他いかなる方法でも、コインがどちらを向いているか知るすべはない。
2つの山に分け、表を向いているコインの数がどちらの山も同数となるようにせよ。

頭の良い人であっても時間を取られそうな問題を、わずか5秒で答えを導き出しました。

Microsoftの入社問題

どちらもちょうど1時間で燃え尽きる導火線が2本ある。この導火線はムラのある材質でできているために燃え方に速い部分と遅い部分があり、一定の割合で燃え進まない。
この2本の導火線と1個のライターだけを使って、正確に45分を計るにはどうするか。

Microsoftの入社問題も、正しい手順を示して正解しました。

この手の問題なら、o1に間違いさせることは難しいのかもしれません。

ひっかけ問題

かけっこをしています。あなたは2位の人を抜かしました。 今のあなたの順位は?

勘違いしやすいひっかけ問題も難なくクリアしました。

ちなみに、旧モデルであるGPT-4は思考の連鎖ができないので、「1位」と誤答する結果になりました。

タイトルとURLをコピーしました