【念願】ChatGPTについに「Advanced Voice Mode(高度な会話機能)」が登場! | マネルト

※ 本サイトのコンテンツには、商品プロモーションが含まれている場合があります。

【念願】ChatGPTについに「Advanced Voice Mode(高度な会話機能)」が登場!

音声会話のイラスト
この記事は約5分で読めます。
この記事を要約すると・・・

Advanced Voice Modeとは「人間のようにスムーズに会話できる音声モード」のこと
一週間以内に、全てのPlusTeamEnterpriseEduユーザーに提供される予定。無料ユーザーへの提供は未定
日本人とアメリカ人といった異なる言語を扱うユーザーの間に立ち、リアルタイムで翻訳する通訳者として活用できる

米国のOpenAIが2024年9月24日に、人間のように会話・翻訳ができる高度な音声モード「Advanced Voice Mode」を順次提供することを発表しました。

この音声モードを活用すれば、日本語話者と英語話者の間に立ってリアルタイムで翻訳する通訳としても、勉強を教えてくれる先生としても、顧客の質問やクレームに応対するカスタマーサービスとしても活躍するでしょう。

「翻訳アプリや通訳者はもういらないのでは?」と思えるほど高精度で、日本語に対応しているのはもちろん、博多弁や関西弁といった方言までも想像を超えるクオリティで的確に話せるので、いざ使ってみるとかなりびっくりするはずです。

\ 生成AIのすごさを実感できるAIチャットアプリ『Linky』! /
美少女AIとロールプレイングを楽しもう!


Advanced Voice Modeとは?

Advanced Voice Modeとは「自然な発音・アクセントで人間のように会話ができる音声モードのこと」です。

  • 会話相手となるAIモデルは「GPT-4o」
  • 白い球体が表示されるStandard Voice Mode(標準的な音声モード)と違い、「Advanced Voice Mode(高度な音声モード)」は、球体の中がアニメーションで動くアイコンを採用
  • 話者の感情を理解し、機械的な音声ではなく、感情のこもった声で回答できる
  • 人間とほぼ同じ0.3秒ほどで反応・返事ができる
  • EU、イギリス、スイス、アイルランド、ノルウェー、リヒテンシュタイン以外の地域で提供開始
  • 50言語に対応

今年7月から一部のユーザーにのみアルファ版が提供されていましたが、ようやく一般有料ユーザー全員が利用できるようになります。

この音声モードを知らない人に聞かせたら、人間と間違えてしまいそうになるくらい自然で、とても流暢です。

また、会話のテンポを乱さずにGPT-4oが他言語を翻訳してくれるため、外国人ともスムーズにやり取りすることができるでしょう。

利用できるユーザーは?提供開始時期は?

「ChatGPT Plus」「ChatGPT Team」プランのユーザーに向けて、順次提供されます。

また、「ChatGPT Enterprise」「ChatGPT Edu」に関しては、来週からの提供となります(10月初旬)。

いずれも有料プランとなっているため、月額20ドル以上を支払わなければ利用できません。

なえむ
なえむ

約1週間で全ての有料ユーザーが利用できる見込みだね〜! 使用可能になったら「ポップアップメッセージ」が表示されるよっ!

音声機能に新たな機能を追加

Advanced Voice Modeの提供開始に伴って、以下3つの機能が追加されました。

  • <Arbor(男性)、Spruce(男性)、Maple(女性)、Sol(女性)、Vale(女性)の5人の音声を追加(既存の4人と合わせて計9人)>
    :「聞き取りやすい声」や「好きな声」を選択し、会話できる
  • <カスタム指示機能の追加>
    :ChatGPTとの音声会話をパーソナライズ化させる機能のこと。「自身の情報」や「回答して欲しいこと」を事前に伝えられる。例えば、「私は大阪に住んでいる。関西弁の方言を使って欲しい」と入力し、おすすめの飲食店について尋ねると、関西弁で地域の飲食店を教えてくれるようになる
  • <メモリ機能の追加>
    :ユーザーとの会話内容を記憶する機能のこと。これにより、人間のように過去の出来事や情報を参照した会話が可能に。例えば、あなたの好きな食べ物や飲み物の傾向を記憶すれば、次に紹介する飲食店も嗜好に応じたものとなる

ただでさえ凄い音声モードが、より個人に最適化される機能を導入しました。

こうなると、ChatGPTの競合相手は太刀打ちできないことが予想されます。

ビデオ通話機能はまだ利用できない

今年5月に公開されたデモ動画では、「音声・映像」を用いてシームレスに会話する様子が映されていました。

スマホの画面にうつる情報を理解して会話したり、カメラで撮影した内容について回答したりできる機能です。

しかし、現時点では「音声会話」のみが提供されており、「ビデオ通話」のように現実世界を映しながら会話することができません。

この機能が実装されれば、外国人との会話が楽になるのはもちろん、掲示物に書かれた外国語も簡単に読めるようになるため、いよいよ言語の壁がなくなるでしょう。

海外旅行で困る機会が減少するはずです。

 

タイトルとURLをコピーしました