【使い方まとめ】Gemini ProをBardで使う方法を解説!日本語で使ってみた感想やGPT-4との比較も! | マネルト

※ 本サイトのコンテンツには、商品プロモーションが含まれている場合があります。

【使い方まとめ】Gemini ProをBardで使う方法を解説!日本語で使ってみた感想やGPT-4との比較も!

この記事は約16分で読めます。
この記事を要約すると・・・

Geminiは、AIモデルの性能を測る『MMLU』でChatGPTや人間を超えて1位を獲得
Gemini Proは、GoogleChromeブラウザからアカウント言語を英語に変えることにより、生成AIチャットボットの「Bard(英語版)」で利用可能
Gemini Proは、ビジネスメールといった文章生成が得意で、数学の解答やプログラミングコードの生成が不得意

Googleが開発した超ハイスペックな生成AI「Gemini」

AIに詳しくない人でも一度は耳に入るくらい全世界で注目されていますが、一体どのぐらいの性能を誇るのでしょうか。

そこでこの記事では、「Geminiの性能・使い方からGPT-4との比較まで」をわかりやすくお伝えします。

実際にGemini Proを使ってみた感想やどの程度のレベルなのかをチェックできますので、ぜひ最後までご覧ください。

\ 高性能なAIが文字起こしするボイスレコーダーアプリ! /
英語を含む93種類の言語に対応しているからどんな場面でも使用できる優れもの!!
次世代型の録音アプリはこれ!


Google開発の新AI「Gemini」とは?

Geminiとは「文章・画像・音声・動画など多様なファイル形式に対応したマルチモーダル型AIのこと」です。

従来のマルチモーダルAIは、文章・画像・音声・動画の4モデルを別々にトレーニングさせて組み合わせたものになりますが、Geminiではそもそものモデルが文章・画像・音声・動画に対応している1モデル形式を採用しているため、1つのモデルに対してトレーニングを重ねています。

なえむ
なえむ

画像に特化したモデル、音声に特化したモデルなど個々のモデルを組み合わせるのではなく、最初から全てのデータ形式に対応したモデルを学習させているんだよー!

その結果、微妙なニュアンスの違いを読み取り、情報をシームレスにやりとりすることのできる抜け目のない生成AIが誕生しました。

\ 使い方の前にGeminiについて詳しく知りたい方は /
以下の記事をチェック!

Geminiの驚異的な性能

Geminiは合計で3モデル存在し、その最上位モデルにあたる『Gemini Ultra』は、「MMLU(Massive Multitask Language Understanding)」と呼ばれる、自然言語処理モデルの性能を総合的に測定するベンチマークにおいて、「90%」の圧倒的なスコアを残しました。

ChatGPTのGPT-4が「86.4%」、人間の専門家が「89.8%」なので、最先端のAIはもちろん人類すらも超えてしまうほどの境地にGeminiはたどり着いたのです。

なえむ
なえむ

MMLUは、科学、工学、数学、医学、法律を含む57の科目でテストが実施され、現状どのくらいの一般知識や専門知識を有しているのかを確認するよっ!

また、大学レベルのテストでマルチモーダル能力を試す「MMMU」では、GPT-4Vが56.8%のスコアに対し、Geminiは「59.4%」のスコアを叩き出したのもスペックの高さを窺わせる結果となりました。

さらに、MMLUを含む32のベンチマークでは、ChatGPT(GPT-4、GPT-3.5)を筆頭とした他の生成AIに圧勝です。

出典:Google DeepMind「Gemini: A Family of Highly Capable Multimodal Models

上記の画像はほんの一部の成績しか表示されていませんが、32種類のベンチマークのうち、なんと30種類のベンチマークで最も高い評価を得ました。

これらの結果から、Geminiは現存する生成AIの中でトップクラスの性能を誇ると言えるでしょう。

Geminiは3モデル存在

Googleが開発したGeminiには、以下3つのモデルが存在します。

  1. Gemini Ultra
  2. Gemini Pro
  3. Gemini Nano

Ultraが最も性能の高いモデルで、Proが中くらいのモデル、Nanoがモバイルデバイス向けに最適化されたモデルです。

Gemini Ultraは完成しているものの、安全性を再確認する目的で2024年に一般公開予定とされています。

その他のモデル、Gemini ProとGemini Nanoは既に公開されています。

なえむ
なえむ

今回は、この2番目の実力を誇る「Gemini Pro」をBardで利用する方法について解説するよー!

Geminiを使える環境は?

Gemini ProとGemini Nanoが使える環境は、2023年12月において以下の4つです。

  • 生成AIチャットボット:「Google Bard(英語版のみ)」
  • Androidスマートフォン:「Google Pixel 8 Pro」
  • 開発者向けのAIプラットフォーム:「Vertex AI」
  • 開発者向けツール:「Google AI Studio」

BardとPixel 8 Proは「Geminiを活用したい利用者向け」で、Vertex AIとAI Studioは「Geminiを組み込んだ自社サービスの展開を行う開発者向け」となります。

また、AndroidスマートフォンPixel 8 Proは「Gemini Nano」となり、それ以外は「Gemini Pro」です。

したがって、一般の利用者が無料でGemini Proを試すとなると、必然的にBardを利用する必要があります。

2023年12月時点では、英語版のBardのみ利用可能ですが、いずれは日本語版のBardにも対応するようです。

Gemini Proの使い方&GPT-4との比較

それでは、実際にGemini Pro利用するまでの流れを解説していきます。

Geminiを利用するための準備

Geminiを利用できるように設定するための流れは、以下の通りです。

  1. GoogleChromeブラウザを開く
  2. 「Googleアカウントを管理」をクリック
  3. 左側にあるメニュー欄から「個人情報」をクリック
  4. ウェブ向けの全般設定から「言語」をクリック
  5. 優先言語を「English(英語)」に変更
  6. 言語のオプションを「United States」に設定
  7. Bardを開くと英語版になっており、Gemini Proが回答を生成してくれる

それでは、順番に見ていきましょう。

①GoogleChromeブラウザを開く

まずは、GoogleChromeブラウザを開いて、右上のアカウントアイコンをクリックします。

②「Googleアカウントを管理」をクリック

アイコンの下にある「Googleアカウントを管理」をクリックします。

③左側にあるメニュー欄から「個人情報」をクリック

次に、画面左側にある「個人情報」をクリックします。

④ウェブ向けの全般設定から「言語」をクリック

個人情報を変更できるページに移行するので、下にスクロールしていきます。

すると、「その他の情報とGoogleサービスの設定」が出てくるので、ウェブ向けの全般設定の中にある「言語」を選択します。

⑤優先言語を「English(英語)」に変更

基本設定では、優先言語が日本語になっているので、これを「English(英語)」に変えます。

⑥言語のオプションを「United States」に設定

最後に、言語オプションを「United States」に変更します。

⑦Bardを開くと英語版になっており、Gemini Proが回答を生成してくれる

以上の設定を終えると、英語版BardでGemini Proが利用できるようになります。

ただし、優先言語を英語に変えたので、画面上に表示されるのは日本語ではなく英語です。

そのため、画面内に映る言語をすべて日本語にしたい場合は、Google Chromeの拡張機能であるGoogle翻訳を活用しましょう。

インストールすれば機能が追加されて使えるようになります。

これで英語版Bard(Gemini)を日本語で使う準備は完了です。

【実力チェック】GPT-4との性能比較

それでは、実際にGeminiがどのような生成をしてくれるのかチェックしていきましょう。

実力や性能がどの程度なのかを確かめるために、ChatGPT「GPT-4」の生成結果と比較してみます。

  1. 文章生成
  2. 文章の要約
  3. 数学(計算能力)
  4. ビジネスメールの生成
  5. プログラミングコード生成
  6. 画像認識
  7. 小説生成
  8. 生成コンテンツの最新性

ちなみにChatGPTの「GPT-4」や「DALL-E3(画像認識・生成)」を利用するためには、月額20ドルの有料版に課金する必要があるので注意してください。

①文章生成

「Googleの特徴を教えてください」とプロンプトを入力したら、次のような結果が生成されました。

<Gemini Proの回答>

▶︎3つの特徴+深掘りした内容を提示したGemini Pro

<GPT-4の回答>

▶︎基本情報+8つの特徴を簡潔に提示したGPT-4

Gemini Proは、3つの特徴を示した後に「AIや機械学習の活用」について具体例を挙げながら深掘りしています。

一方、GPT-4は、Googleの基本情報を文頭に持ってきた後に主な特徴を8つ提示しました。どれも簡潔にまとめられていますが、情報量が少なく感じる人もいるかもしれない程度の分量です。

ただ、これだけの文章量をたった10秒程度で生成してしまうのですから、ブログアフィリエイトで稼ぎたい方は活用しない手はないでしょう。

\ アフィリエイトで副業したい方はこちら! /

②文章の要約

画像の青文字の部分をチャット欄に入力し、「上記の文章を要約してください」と伝えたら次のような結果が生成されました。

<Gemini Proの回答>

▶︎読者が読みやすいように改行を挟みながら要点をまとめるGemini Pro

<GPT-4の回答>

▶︎Googleの基本情報を抑えてはいるが改行が0で可読性が低いGPT-4

両者ともに、「Googleの要点を掻い摘んで欲しい」という意図を推察してくれたので、大事な箇所だけを厳選してまとめてくれました。

ただ、Gemini Proはグループごとに改行している一方で、GPT-4は全く改行を挟んでいないので、どちらの文章が内容を理解しやすいのかは明白です。

③数学(計算能力)

「3枚の硬貨を同時に投げるとき、少なくとも1枚は表が出る確率を求めなさい」とプロンプトを入力したら、次のような結果が生成されました。

ちなみに、正解は「7/8」です。

<Gemini Proの回答>

▶︎文章と計算式を色で区分けして解説と答えを明確化しているGemini Pro

<GPT-4の回答>

▶︎結論を先に提示し、なぜその答えに至ったのかを言葉と計算式で示してくれるGPT-4

どちらも正解の「7/8(87.5%)」を解答しました。

ただ、検証をするにあたり、少しGemini Proに対して不信感が募ったので、他の実験結果も共有します。

「50円硬貨、100円硬貨、500円硬貨を同時に3枚投げるとき、表が出た硬貨の合計が100円以上となる確率を求めなさい」と指示したら、なんと次のような結果が生成されました。

ちなみに正解は「3/4(75%)」です。

<Gemini Proの回答>

▶︎誤答の「7/8」を提示したGemini Pro

<GPT-4の回答>

▶︎正答の「3/4(75%)」を提示したGPT-4

GPT-4では正しい答えを表示しましたが、Gemini Proは誤った回答を表示しました。

このような計算問題において複数回間違った答えを出力することが確認できたので、数学に関してはGemini ProよりもGPT-4を利用した方が良いのかもしれません。

こちらのベンチマークの通り、数学に関してはかなり不安定な回答が多いです。

ただ、Gemini UltraはProに比べて著しく性能が高いので、Proが解けなかった問題を解けるかという点にも、今後注目していきたいところです。

④ビジネスメールの生成

「あなたはWebサイト制作会社の営業マンです。取引先を新規開拓するために、サイトデザインや集客に困っている法人に対して訴求する『営業メール』を作成してください」とプロンプトを入力したら、次のような結果が生成されました。

<Gemini Proの回答>

▶︎潜在的&顕在的な悩みの気づきを相手に与え、無駄のない文章で自社の強みや具体的な施策を伝えるGemini Pro

▶︎営業メールを作成するにあたっての重要ポイントをユーザーに伝えるGemini Pro

<GPT-4の回答>

▶︎要件やWebサイトを再構築する必要性、サイト設計が容易ではないことの認識提供、具体的な解決策の提示、返信後の流れの説明など端的にまとめつつも必要不可欠な項目を押さえたGPT-4

どちらの営業メールも丁寧でビジネスに適している内容です。

少し自分の言葉に置き換えたり、不自然な言い回しを修正するだけで、会社の営業テンプレとして活用できるようになるでしょう。

Gemini Proに関しては、メールを作成する際に気をつけるべきポイントを詳細にまとめているので、オリジナルの営業メールを作成する際にも役立つはずです。

⑤プログラミングコード生成

「マルバツゲームを制作してください。なお、プログラミングコードは「HTML/CSS/JavaScript」で分けて記述してください。マルバツゲームとは、3×3のマス上にて「○と×」を交互に配置し、横、縦、または斜めに自分の記号を3つ並べることが目的のゲームです」とプロンプトを入力したら、次のような結果が生成されました。

なえむ
なえむ

ちなみに、生成されたコードは「Visual Studio Code(VS Code)」でチェックしたよっ♪
VS Codeはローカル環境で幅広い言語のプログラミングコードを試せるコードエディターのことだね〜!

<Gemini Proの回答>

▶︎マルバツゲームの基本的なコードの候補を、なんと合計3種類も生成してくれたGemini Pro

【完成したマルバツゲームがこちら】

▶︎3種類のコードを生成してくれたが、どれも「縦に9マスの四角形」が表示されるだけで、正常に機能しない(上記の画像は9マス中3マスのみを切り抜き)。クリックしても反応なし。

<GPT-4の回答>


▶︎マルバツゲームの基本的なコードをHTML、CSS、JS別に記述するGPT-4

【完成したマルバツゲームがこちら】


▶︎特定のマスをクリックすると、○と✖️が交互に表示される。正常に動作しており、ゲームとして成立。

▶︎✖️が斜めにそろった瞬間にダイアログボックスにて勝利報告が。最初のプロンプト入力のみの「修正0」でここまでの完成度は純粋にすごい。「CPUを追加して」と、コードの修正依頼をGPT-4に出したら、一発で対戦相手(CPU)が追加されたのも驚き。

結果は、Gemini Proが「不良品」を、GPT-4が「正常品」を提出してくれました。

Gemini Proは、縦に9マス表示されただけで、クリックしても反応しないので改善が必要です。

まずは、縦横3マスの盤面に整備し直したり、クリックを条件とした○✖️の表示が実行されるようにしなければなりません。

一方GPT-4は、正常に動作するため、あとはBGM・効果音・画像・CPUの追加、盤面の位置調整などをおこなえば完成度が上がるでしょう。

⑥画像認識

以下の画像を添付し、「この画像について詳しく説明して」とプロンプトを入力したら、次のような結果が生成されました。

<Gemini Proの回答>

▶︎状況を正しく説明できてはいるが、同じ内容を繰り返し伝えているGemini Pro

<GPT-4の回答>

▶︎画像の情景を的確に伝えており、ボキャブラリーが豊富なGPT-4。ただ、エキゾーストパイプ(自動車の排気管)など一般的ではない言葉を交えている点が気になるところ

どちらのAIも画像内の様子を正しく捉えています。

しかし、Gemini Proは「道路脇の木々」や「空や雲」に関して二度も言及しているので、文字数をかさまししているだけでなく、少し稚拙な印象を受けました。

もしかしたら小説の生成は、GPT-4の方が向いているのかもしれません。

⑦小説生成

Gemini Proの画像認識・文章生成に対して、少し怪しい雰囲気を感じたので、実際に小説を作成してもらうことにしました。

プロンプトは「母の難病、少年、先進医療、医者をキーワードに、短編小説を書いて」です。

<Gemini Proの回答>

▶︎題名やストーリー構成、エピローグなどは問題ないが、主人公の「太一」を多用していることから幼稚な印象を与えるGemini Pro

<GPT-4の回答>

▶︎第一章冒頭の「空は曇っていた。風もなく、ただ静かに世界が息を潜めているようだった」の表現技法が非常に素晴らしく、構想した短編小説を適確に提示するGPT-4

予想通り、Gemini Proは独自性や独創性を要する創作文の執筆が苦手なようです。

対して、GPT-4は比喩表現を始めとする表現の仕方が豊かで、要所に洗練された情景描写が加えられており、短編小説としての完成度がかなり高い気がします。

章ごとに区別されている点も、評価に値するでしょう。

⑧生成コンテンツの最新性

「2023年の流行語大賞を教えてください」とプロンプトを入力したら、次のような結果が生成されました。

<Geminiの回答>

▶︎年間大賞に選出された「アレ(A.R.E.)」の意味を説明してくれるだけでなく、新語・流行語大賞に選ばれたトップ10や選ばれた言葉たちが意味するものを解説。さらに引用元を掲載したGemini

<GPT-4の回答>

▶︎年間大賞の「アレ(A.R.E.)」はもちろん、引用元付きでトップ10にランクインしたワードが何を表すのかを丁寧に解説してくれたGPT-4

どちらも年間大賞に選ばれた「アレ」について詳しく解説してくれています。

しかし、「アレの意味」である『優勝というプレッシャーを回避するために、代わりに使い続けてきた言葉』の説明が両者ともに抜けているので、ユーザーが何を求めているのかを推論する力が足りない気もします。

まとめ

この記事では、Geminiの特徴やGemini Proの性能について解説してきました。

Gemini ProとGPT-4を比較した検証結果は、以下の通りです。

Gemini ProGPT-4
文章生成
文章要約
数学
ビジネスメール生成
コード生成✖️
画像認識
小説生成
最新性

GPT-4は有料なだけあって流石の精度でしたが、Gemini Proは未熟な点が多々ありました。

特に数学やプログラミングコードにおいては、間違えた内容を生成していますし、画像認識や小説生成では表現の仕方があまりにも稚拙すぎるが故に実用性は低いです。

とはいえ、入力したプロンプトが不適切、情報不足である可能性もあるため、実用性が必ずしも低いとは一概には言えません。

実際AIに対して、事前に参考情報法則(パターン)を伝えておくことで、生成結果が見違えるものに変化することもありますので、この検証結果だけで能力が低いと断定するのは早計です。

「この調子だとGemini Ultraも大したことないのでは…」と思うかもしれませんが、その点は安心してください。

そもそもの性能がUltraとProでは雲泥の差であり、GPT-4や人間の専門家を超える最強クラスなので、かなり品質は向上するでしょう。

この記事を読んだ皆さんも最高クラスのUltraが登場する前に、ぜひProで使用感を確かめてみてはいかがでしょうか。

タイトルとURLをコピーしました