【特徴解説】ChatGPTのAdvanced Voice Modeにビデオ機能を追加! | マネルト

※ 本サイトのコンテンツには、商品プロモーションが含まれている場合があります。

【特徴解説】ChatGPTのAdvanced Voice Modeにビデオ機能を追加!

この記事は約8分で読めます。
この記事を要約すると・・・

Advanced Voice Modeに4つの新機能が追加
スマホカメラで現実世界を映す「映像の共有」、スクリーンショットや写真を見せる「写真の共有」、スクリーンレコーダーでスマホ画面を見せる「画面の共有」、これらのやり取りをスマホにDLできる「会話の保存」が新たに実装され、より素早く質問したり要約・翻訳を依頼したりできるように
Advanced Voice Modeの新機能は、2024年12月時点では「アプリ版のみ」利用可能

OpenAI社が提供するChatGPTには、高度なボイスモード「Advanced Voice Mode」と呼ばれるAIとの音声会話機能があります。

そして2024年12月13日、本機能に大幅なアップデートが施されました。

それが「ビデオ(視覚)機能」の搭載です。

今までは言葉だけでChatGPTに伝えなければならなかったのに対し、アプデ後のAdvanced Voice Modeでは、映像共有・写真共有・画面共有の3つでよりわかりやすく説明できるようになり、迅速に深い情報を聞き出せるようになりました。

そこで本記事では、進化したAdvanced Voice Modeについて徹底的に解説していきます。

なえむ
なえむ

Advanced Voice Modeの基本的な情報を知りたい方は、こちらの記事をチェックしてね〜! 活用方法はこちら

\ 無料のAIトークアプリ「Castalk」! /
実在する人物×AIで、圧倒的な人間感を持つ美女AIとおしゃべりできる!!

\ 危険な恋を楽しめるAIマッチングアプリ『Stella』! /
初プロフも顔写真も、メッセージも全てAIが生成!
次世代型の恋愛アプリがここに!


ChatGPTのAdvanced Voice Modeにビデオ機能が実装!

ChatGPT

ChatGPT

OpenAI無料posted withアプリーチ

Advanced Voice Modeは、「ChatGPT Plusプラン(月額20ドル)」や「Teamプラン(年契約で月額25ドル)」、「Proプラン(月額200ドル)」へ加入することで利用できます。

▶︎Advanced Voice Modeの実際の画面

今回新しく追加された機能は、以下の4つです。

  1. 映像の共有
  2. 写真の共有
  3. 画面の共有
  4. 会話の保存

これらは現状スマホアプリ版で利用することができ、Webブラウザ版では利用できません。

それぞれ順番に見ていきましょう。

①映像の共有

一つ目は「映像の共有」です。

iPhoneやAndroidといったスマホのカメラを起動させ、目の前の現実を視覚情報としてChatGPTに与えながら会話をすることができます。

例えば、「alpha onlineの『スペイン大規模洪水、200人以上が死亡』の記事」を実際にカメラで映してみました。

▶︎こちらのパソコン画面をスマホカメラで映して、日本語に訳してもらった

実際に読んでもらった音声データがこちらです。

ChatGPTとの実際の会話はこちら

このように、リアルタイムな音声と映像の二刀流でChatGPTと円滑にコミュニケーションをとることができます。

他にも、外の景色を映しながら「この建物は何?」と聞いたり、「目の前の文章を読み上げて」と指示したりすることも可能です。

上の画像のように、あなたとの会話履歴は全てチャット上にて文字起こしされるので、ビデオ会話を終了した後に話した内容を忘れてしまっても問題ありません。

②写真の共有

二つ目は「写真の共有」です。

スマホのカメラロール内にある写真を共有して、画像について質問することができます。

また、その場で写真を撮影して説明を求めることも可能です。

他にも、大学や塾でホワイトボードに書き写された情報を写真で残し、ChatGPTに文字起こしさせ、それをデジタルノートに貼り付ける。というような使い方もできるでしょう。

③画面の共有

三つ目は「画面の共有」です。

スマホ内に写る情報をChatGPTに提供し、文章を読み上げてもらったり外国語を翻訳してもらったり、はたまたアドバイスを受けたりできます。

難解な論文を要約し、理解できるレベルまで易しくしてもらうことだって可能です。

画面共有の具体的なやり方としては、「画面を共有する」からスマホのスクリーンレコーダーを起動し、ChatGPTに画面上の情報を認識してもらいます。

これにより、わざわざ質問する度にスクリーンショットを撮影・共有する必要がなく、日常的なスマホにおける作業や学習の効率を大幅に向上させられるでしょう。

稀にスクリーンショットが禁止されているWebサイトも存在するため、そのようなサイトにおいても個人的な学習を行うための有効的な手段になりうるはずです。

④会話の保存

四つ目は「会話の保存」です。

Advanced Voice Modeで会話した内容を動画ファイル(mov)として保存することができます。

やり方は簡単で、画面右上にある「DLアイコン(↑)」をタップします。

次に、録音したデータの長さ調節を行います。会話の始まりと終わりの両端であれば不要な部分をカット可能です。

簡易的な編集を終えたら、あとは「共有する」から動画ファイルを保存するだけとなります。

スマホの写真フォルダには音声ファイルを保存することはできませんが、Advanced Voice Modeで記録される音声データは、動画ファイルの形式であるため直接保存することが可能です。

そのため、いつでも写真フォルダから会話内容を振り返ることができます。

Advanced Voice Modeのビデオ機能の制限時間

ビデオ機能は、無制限に利用できるわけではありません(Proプランを除く)。

ただ、毎日使用制限が設けられている点については明言されていますが、詳細な時間については明かされていないのが現状です。

OpenAIの「Voice mode FAQ(音声モードに関するよくある質問)」には、以下のように記載されています。

【原文】

<For how long can I have voice chats?>
Your daily use of advanced voice for Plus , Team, Enterprise, and Edu users is subject to a limit each day, and daily limits may change. We provide a notice as you are approaching the daily limit. Plus, Team, Enterprise and EDU users will be notified when they have 15 minutes left of advanced voice for the day. Free users have access to a monthly preview to try advanced voice. Pro subscribers have unlimited access to advanced voice, subject to abuse guardrails. Learn more about our Pro plan and associated limits.

【日本語訳】

<ボイスチャットはどれくらいの時間利用できますか?>
Plus、Team、Enterprise、および Edu ユーザーの高度な音声の毎日の使用には毎日制限が適用され、1 日の制限は変更される場合があります。 1 日の制限に近づくと通知が送信されます。さらに、Team、Enterprise、EDU ユーザーは、その日の高度な音声が残り 15 分になると通知されます。無料ユーザーは毎月のプレビューにアクセスして、高度な音声を試すことができます。 Pro 加入者は高度な音声に無制限にアクセスできますが、不正行為のガードレールが適用されます。 Pro プランとそれに関連する制限について詳しくは、こちらをご覧ください。

どうやら、Plus以外の有料プランは、Advanced Voice Modeの残り時間が15分になるとChatGPTがお知らせしてくれるようです。

使用可能時間を過ぎると、自動的に下位互換にあたるStandard Voice Modeに切り替わります。

なお、最も高額な月額200ドルのProプラン加入者は、無制限にアクセスできますが、悪質なプロンプトに反応しないための対策(ガードレール)が適用されます。

ガードレールとは、生成AIの悪用を目論むサイバー犯罪者からのリスクを未然に防ぐための安全装置のことです。

Advanced Voice Modeの新機能で日常生活をより快適に!

Advanced Voice Modeの視覚機能は、これまで以上に私たちの利便性を高めてくれます。

例えば、今までは勉強中にわからない内容があったら、その都度Googleで検索したり、テキスト形式でChatGPTなどの生成AIに尋ねていたはずです。

解き方や答えを見つけるために、多大なる時間や労力をかけた日もあるでしょう。

しかし、画面共有が可能になった今、あなたが詳細に調べたいものの特徴を丁寧に書き記す必要がなくなりました。

なぜなら、あなたが見ている画面をChatGPTに共有し、ちょっと補足するだけで後はインテリジェンスに富んだChatGPTが勝手に理解・判断してくれるからです。

これからは、質問事項のみを口頭で伝えるだけで良くなります。

ビジネス書や論文を見せれば朗読・要約してくれますし、外出先で行き先に困ったら看板や周辺を映すだけでガイドしてもらえるようになります。

特に、慣れない外国での生活においても、苦になる機会が著しく減少するほど大いに活躍してくれるでしょう。

初めは活用方法に戸惑うこともあるかもしれませんが、使っていくうちに慣れてきますので、この機会にぜひアプリをDLしてみてください。

タイトルとURLをコピーしました