【ChatGPT】DALL-E3の特徴や画像生成するプロンプトのコツ、作成例について解説! | マネルト

※ 本サイトのコンテンツには、商品プロモーションが含まれている場合があります。

【ChatGPT】DALL-E3の特徴や画像生成するプロンプトのコツ、作成例について解説!

この記事は約12分で読めます。
この記事を要約すると・・・

DALL-E3とは「簡単なプロンプト(指示文)を入力するだけで高品質なイラストを作成できる画像生成AI」のこと
DALL-E3の特徴は「①日本語のプロンプトに対応」「②英語のプロンプトの方が理想の画像を生成しやすい」「③画像生成に用いるプロンプトはDALL-E3に書き換えられる」「④特定の指示を入力すればプロンプトは書き換えられない」「⑤最大2枚の画像を生成」「3つの画像サイズに対応」の6つ
理想のイラストを生成できるプロンプト作成のコツは、「英語のプロンプトと原文を維持するための指示」を入力すること

現在、全世界で話題沸騰中の画像生成AI「DALL-E3」

イラストを描いたことのない初心者でも、プロンプト(指示文)作成のコツを掴むだけで、プロ品質の作品を制作することが可能です。

しかも、画像生成にかかる時間はわずか「10秒程度」なので、欲しい画像を短時間で大量生産できます。

しかし、DALL-E3の特徴やプロンプト作成のコツを知らなければ、DALL-E3の秘めた性能を最大限発揮することができません。

そこでこの記事では、「DALL-E3で画像生成する前に知っておくべきこと」について解説します。

記事の最後には、実際に使用したプロンプトや作品集を公開していますので、ぜひチェックしてみてください。

\ アニメ風AIを自作して会話できるLinky! /
新感覚のコミュニケーションに虜になる人続出!!

画像生成AI「DALL-E3」とは?

DALL-E3とは「簡単な指示文を入力するだけで様々なテイストの画像を生成できるAIのこと」です。

指示文は一般的にプロンプトと呼ばれ、このプロンプト次第で生成作品の特徴やクオリティが変動します。

DALL-E3の特徴6選

DALL-E3の特徴は、以下の6つです。

  1. 日本語のプロンプトに対応
  2. 英語プロンプトの方が理想の画像を生成しやすい
  3. 画像生成に用いるプロンプトはDALL-E3に書き換えられる
  4. 特定の指示を入力すればプロンプトは書き換えられない
  5. 最大2枚の画像を生成
  6. 3つの画像サイズに対応

DALL-E3の特性を理解することで、正しいプロンプト作成のコツを掴めるようになるので、ぜひチェックしてみてください。

①日本語のプロンプトに対応

DALL-E3は、日本語、英語、中国語、韓国語を含む50種類以上の言語を用いたプロンプトに対応しています。

日本語でプロンプトを入力することにより、日本固有の文化的なニュアンスや特定の概念を反映した画像を生成することが可能です。

②英語プロンプトの方が理想の画像を生成しやすい

日本語のプロンプトは使用できますが、英語プロンプトの方がより理想的な画像を得る上では有効的です。

なぜなら「英語はDALL-E3の開発言語であり、生成精度を高められるから」です。

日本語よりも正確で豊かな表現が可能となるため、より精密で創造的な画像を生成することができるでしょう。

また、DALL-E3が画像を生成すると、プロンプトに記載された一部の言葉が画像に反映されることがあります。

英単語や英文の場合は、基本的にスペルミスもなく綺麗に表示されますが、日本語プロンプトだと言葉や文字が崩れることもしばしばあるのです。

日本語としてなんとか視認できるものもあれば、日本語でも外国語でもない不明な文字が表示されることもあるため、できる限り英語プロンプトで指示を出すよう心がけましょう。

③画像生成に用いるプロンプトはDALL-E3に書き換えられる

DALL-E3は、入力されたプロンプトを内部的に解釈し、英語で最適化します。

これにより、ユーザーが意図していない表現や不明瞭な部分を補正し、より質の高い画像を生成することが可能です。

しかし、この「自動的なプロンプト変換」が、ユーザーの求める画像との乖離を生み出すこともあります。

いわゆる“ありがた迷惑”というやつで、不必要な要素を勝手に足されたり、イメージしたものが改悪されたりするのです。

そこで、次に紹介する書き換え対策が役に立ちます。

④特定の指示を入力すればプロンプトは書き換えられない

DALL-E3は他言語を解釈・翻訳してオリジナルの英語プロンプトを生成します。

しかし、ユーザーが特定の指示を明確に入力した場合、DALL-E3はその指示に忠実に従います。

例えば、「この色を使って」「この形で」といった具体的な要求がある場合、その要求に沿った画像を生成します。

プロンプトの全体をそのまま採用して欲しい場合は、「以下のプロンプトをそのまま使用して画像を生成してください」と前置きを入力すればOKです。

これにより、ユーザーの創造性を最大限に引き出すことができます。

⑤最大2枚の画像を生成

DALL-E3は、一度のリクエストで最大2枚の画像を生成することができます。

これにより、同一のプロンプトで作成した異なるアプローチやスタイルの画像を比較し、目的に最も近い画像を選択することが可能です。

⑥3つの画像サイズに対応

DALL-E3で生成できる画像サイズは、以下の3つです。

  • 1024×1024px(正方形)
  • 1792×1024px(横長)
  • 1024×1792px(縦長)

このサイズを指定しないと、DALL-E3が独断でサイズを選択することになります。

そのため、画像サイズを変更したい場合は、「○○px」とプロンプトに付け加えましょう。

なえむ
なえむ

ちなみに画像のファイル形式には、日本で一般的な「JPG」「PNG(透過素材)」のほか、「webp」があるよ!

理想のプロンプトを作成するコツ3選

DALL-E3は、日本語に対応しているものの、現状、英語プロンプトの方がユーザーの意図した細かなニュアンスを汲み取り、イメージに近い画像を生成してくれます。

しかし日本人の私たちにとって英文でプロンプトを構成することは容易ではありません。

そこでこの項目では、理想のプロンプトを英語で作成するコツについて解説します。

作成方法は、以下の3つです。

  1. 「英語にしてください」とプロンプトに書き加える
  2. Google翻訳で英語プロンプトに変換する
  3. 英語プロンプトをコピーして一部を書き換える

完成度の高い画像が生成されるように、いつものプロンプト入力を少しずつ変えながら取り組んでいきましょう。

①「英語にしてください」とプロンプトに書き加える

1つ目の理想的なプロンプトを作成するコツは「『英語にしてください』とプロンプトに書き加えること」です。

日本語プロンプトだと不安定な生成結果を招くため、通常の日本語プロンプトに「プロンプトは英語にしてください」と付け足しましょう。

あくまで一例になりますが、以下に両者の検証結果を載せておきます。

▶︎日本語プロンプトの生成結果

▶︎英語プロンプトの生成結果

どちらも高品質なイラストが生成されましたが、より手の込んだ作品はどちらかと聞かれれば、後者を選択するユーザーも多いのではないでしょうか。

②Google翻訳で英語プロンプトに変換する

2つ目の理想的なプロンプトを作成するコツは「Google翻訳で英語プロンプトに変換すること」です。

日本語で指示文を完成させた後に、WebやChromeなどのGoogle翻訳機能を使って、英語に変換していきます。

▶︎検索エンジンから「Google翻訳」と検索をかければOK

▶︎Google翻訳で日本語を変換し、自身で英語プロンプトを入力した場合の生成結果

上出来ですね。細部まで綺麗に作り込まれています。

ただし、Google翻訳は万能ではなく、以下のようなデメリットがあります。

  • 微妙な言葉のニュアンスを正確に解釈できず、誤った翻訳が実施される恐れがある
  • 日本の文化、慣習、専門用語、文法が異なるものに変換される恐れがある(例:地域特有の言葉を理解できない)

Google翻訳の精度自体は高いものの、翻訳時にミスが起きやすいので注意しておきましょう。

③英語プロンプトをコピーして一部を書き換える

3つ目の理想的なプロンプトを作成するコツは「英語プロンプトをコピーして一部を書き換えること」です。

DALL-E3では、画像生成に使用した英語プロンプトを確認することができます。

これを利用して、英語プロンプトの一部を手作業で変更することにより、目的の画像に近づけることが可能です。

▶︎生成された画像をクリックする

▶︎右上の「i」ボタンをクリックする

▶︎英語プロンプトをコピーする

あとは、Google翻訳といった翻訳ツールを利用して、プロンプトの一部を書き換えるだけです。

これにより、不要な要素を排除して、必要な要素を加えることができます。

▶︎薔薇とチューリップと除去し、アサガオを追加したイラスト

ただし、上の画像を見ていただければ分かる通り、この方法では大部分を占める要素が大きく変更されてしまいます(猫の姿勢)。

そのため、「特定の要素を追加・削除して、似たような別の画像を生成したい時」に、この方法は活用すべきでしょう。

キャラクターの一部だけを変更した同一の画像を生成したい場合は、以下の記事をご覧ください。

\ 日本語で同一画像を生成するコツや方法を解説! /

DALL-E3の画像生成例

この項目では、DALL-E3で画像生成する際のプロンプト例を5つ紹介します。

  1. 金閣寺
  2. 桜の木
  3. 日本人女性
  4. ひよこ(マスコットキャラクター)
  5. 桃(企業ロゴ)

もちろんプロンプトをそのまま使用しても問題ありませんし、改変しても大丈夫です。

紹介するプロンプトを参考に、ぜひオリジナルの高品質なプロンプトを作成してみてください。

金閣寺

A fantastical rendition of Kinkaku-ji, the famous Golden Pavilion in Japan, standing amidst a stunning sunset. The temple is depicted with its characteristic gold leaf-covered exterior, shimmering in the warm glow of the setting sun. The scene is serene and enchanting, with the temple reflected in a calm, mirror-like pond in the foreground, enhancing the magical atmosphere.

桜の木

Transform the landscape, originally with cherry blossom trees and a central lush green path in a watercolor style, by replacing all trees on both sides with cherry blossom trees in full bloom. The scene should feature soft pink cherry blossoms throughout, enhancing the serene, spring atmosphere. Maintain the distinctive watercolor characteristics: visible brush strokes, blended colors, and a dreamy quality. The sky remains a soft blue, and the warm spring light continues to create a tranquil and picturesque setting.

日本人女性

A glamorous and charming Japanese actress, with a youthful and adorable appearance. She has flowing, shiny black hair styled in a contemporary fashion, and her makeup is elegant yet playful. She’s wearing a dazzling, modern outfit that’s both fashionable and cute. Her facial features are classically beautiful with bright, expressive eyes and a warm, inviting smile. The background is a stylish, modern cityscape, filled with bright lights and a lively atmosphere, reminiscent of a scene from a trendy Japanese film.

ひよこ(マスコットキャラクター)

A character of a two-headed chick, drawn in Japanese anime style. This chick character is extremely cute, designed to evoke a sense of adoration. The scene shows the chick in a sleeping pose, highlighting its endearing qualities and emphasizing its cuteness.

桃(企業ロゴ)

A clean, modern logo with the word ‘fruit’ in a more visually distinct and readable bold, sans-serif font. The color scheme includes fresh peach pink and white, emphasizing a crisp, invigorating look. The design remains simple and vibrant, with high visibility, and no additional text or graphics. The logo is based on the design with image ID QPoi2tAy9u3Xwbja and seed value 3825636017.

\ DALL-E3の著作権や画像生成例をもっとみたい方はこちら! /

DALL-E3のまとめ

DALL-E3では、ちょっとしたプロンプト作成のコツを掴むだけで、自身が望む作品をいとも簡単に手に入れることができます。

書き方を覚えるだけで、美女、イケメン男性、動物、風景、マスコットキャラクター、ロゴといった種類の作品を、リアル調・アニメ調や油絵・水彩画などの様々なスタイルで生成可能です。

ぜひこの機会に、高性能な画像生成AI「DALL-E3」をマスターしてみてはいかがでしょうか。

タイトルとURLをコピーしました