GPT-4oとは「ChatGPTのテキスト・音声・視覚機能がグレードアップした最新のAIモデル」のこと
GPT-4oの「o」は『omni(オムニ)』を指し、日本語で「一括」や「全て」を意味する
GPT-4oは、音声や文字認識性能を含む全体的なパフォーマンスが向上し、有料ユーザー向けの機能が無料ユーザーにも開放された
アメリカのOpenAI社は、米国時間の5月13日にChatGPTの最新モデル「GPT-4o」を発表しました。
同モデルはかなり衝撃的な性能を有しており、日本を含む世界中のユーザーから注目を集めました。
この記事では、そんなGPT-4oの特徴や性能、GPT-4との違いについて解説していきます。
\ 危険な恋を楽しめるAIマッチングアプリ『Stella』! /
初プロフも顔写真も、メッセージも全てAIが生成!
次世代型の恋愛アプリがここに!
GPT-4oとは?
GPT-4oとは「GPT-4が持つテキスト・音声・視覚の機能を改良した生成AIモデル」のことです。
oは、omni(オムニ)を表し、日本語で「一括」や「全て」を意味します。
従来のChatGPTでは、無料版の場合「GPT-3.5」のモデルしか使えませんでしたが、このGPT-4の上位モデルGPT-4oは「無料ユーザーでも利用可能」です。
ただし、無料版はメッセージ回数などに制限が設けられており、有料版のChatGPT Plusユーザーは無料版に比べて5倍多いメッセージができます。
TeamとEnterpriseプランだと、より多くのメッセージが可能だよ〜!
GPT-4oは、今後数週間で全てのChatGPTユーザーが使用可能になる予定です。
GPT-4oの特徴
GPT-4oの主な特徴は、以下の4つです。
- GPT-4に比べて性能が向上
- 音声性能の向上
- 文字認識性能の向上
- 無料ユーザーに様々な機能を開放
順番に進化したChatGPTを見ていきましょう。
※ 一部機能は数週間後に提供される予定
①GPT-4に比べて性能が向上
2024年4月29日に突如登場した「gpt2-chatbot」は、あまりの性能の高さにインターネット上で大きな話題を呼び、生成AI界が騒然としました。
実はその正体こそが「GPT-4o」だったのです。
▶︎https://x.com/LiamFedus/status/1790064963966370209
画像を見てもらえれば分かるとおりGPT-4o(旧:GPT2)は、Claudeといった他の生成AIを大幅に上回る性能を誇ります。
アウトプットの質はさることながら、スピードも桁違いに進化しています。
GPT-4に比べて、その差は驚異の「2倍」です。
この目を疑うような数字は、実際にGPT-4oを利用してみれば分かるでしょう。
②音声性能の向上
動画内では、iOS版ChatGPTアプリに搭載されたGPT-4oと対話する様子が映されています。
GPT-4oは、話者が発する声の抑揚を理解し、より人間らしい返答が可能になりました。
この機能の大きな特徴は「感情を読み取る点」で、従来のAIには実現困難だった感情の理解を可能にしたのです。
さらに、動画を撮りながら目の前に広がる光景を言語化したり、リアルタイムで他言語を翻訳したりすることもできます。
この機能はまだ追加されていませんが、数週間以内には導入される予定です。
③文字認識性能の向上
GPT-4に搭載されたOCR機能(Optical Character Recognition/Reader、光学的文字認識)の精度はイマイチでしたが、GPT-4oでは日本語の文字認識精度が飛躍的に向上しました。
※ OCRとはテキストデータを読み取り、文字データに変換する技術のこと
例えば、試しにこちらの「請求書の文字起こし」を依頼してみましたが、
間違った情報を書き起こすことなく、正しく文字データを抽出することに成功したのです。
無料のOCRサービスでは、誤った内容を文字起こしするケースも少なくないため、これは非常にクオリティの高い機能であると言えます。
④無料ユーザーに様々な機能を開放
無料版 | 有料版 | |
利用モデル | GPT-4o、GPT-3.5 | GPT-4o、GPT-4、 GPT-3.5 |
メッセージ制限 | あり。 超過時は自動で3.5に切り替え | あり (無料版よりも5倍利用可能) |
GPTストア | ◯ | ◯ |
Memory | ◯ | ◯ |
Webブラウジング | ◯ | ◯ |
写真&画像解析 | ◯ | ◯ |
ファイルアップロード | ◯ | ◯ |
画像生成 | × | ◯ |
音声会話 | × | ◯ |
従来のChatGPTでは、有料版のユーザーしか
- GPT-4の性能を有するモデルの使用
- GPTストア
- Memory(ユーザーの好みや要望を自動記憶する機能)
- Webブラウジング(ネット上の最新機能を検索し、回答として提示する機能)
- ファイルアップロード(写真や画像などのファイルを共有できる機能)
は開放されていませんでした。
しかし、GPT-4oの公開と同時に、これらの機能が無料ユーザーにも開放されることが発表されたのです。
つまり、月額20ドルの有料版とほぼ同じ機能を“完全無料”で利用できるようになりました。
もはやChatGPTを利用しない手はないでしょう。