2024年9月現在、過去に比べてDALL-E3の性能は著しく低下した
DALL-E3の性能が低下したと感じる理由は「①作画が崩壊している点」と「②イラストの線画がいびつな形になっている点」の2つ
DALL-E3からイラストを生成するのではなく、GPT-4oからイラストを生成した方がクオリティの高い作品が生まれるかもしれない
ChatGPTの有料プランに加入することで利用できる画像生成AI「DALL-E3(ダリスリー)」。
Stable DiffusionやMidjourneyに並ぶ高品質な画像生成ツールとして、多くのユーザーに愛されてきました。
ただ、最近になって感じ始めたことが一つありまして、それが「イラストのクオリティ低下」です。
「性能が落ちたのかな?」と思う機会が増えたので、この記事では徹底的に比較検証し、改善策を探ってみます。
\ 危険な恋を楽しめるAIマッチングアプリ『Stella』! /
初プロフも顔写真も、メッセージも全てAIが生成!
次世代型の恋愛アプリがここに!
【過去】DALL-E3の生成イラスト
まず、過去(2024年1月〜4月頃)にDALL-E3で生成した作品を見ていきましょう。
▶︎「ChatGPTの画像生成AI「DALL-E3」で同じキャラクターを作成する方法を解説!」:2024年1月28日
▶︎「【必見】GPT-4oやo1-previewで使える気付きにくいChatGPTの新機能5選」:2024年3月28日
▶︎「【激ヤバ】ChatGPTのDALL-E3で画像編集が可能に!使い方やコツについて徹底解説!」:2024年4月4日
正直、有名な絵師やイラストレーター、画家、Webデザイナーが描いた作品かと思うほどクオリティが高いです。
さらに、イラストや写真、水彩画、フラットアイコン、カートゥーン、リアル調、ゆるふわ系など幅広い種類の画像を「わずか20秒程度」で生成してくれるので、これを使わない手はありませんでした。
DALL-E3は、記事のサムネイル制作はもちろん、SNSアイコンやキャラクター制作にも大きく寄与してくれた欠かせない存在でした。

もちろん他者の著作物に類似しないよう、権利を侵害しないよう十分に注意していたよっ!
ただ、ある日、DALL-E3の性能がガタ落ちしたことに気がつきました。
【現在】DALL-E3の生成イラスト
そして、2024年9月26日現在のDALL-E3の性能が以下の通りです。
▶︎プロンプト:「桜舞い散る幻想的な空間をイラストにして」
このイラストのクオリティは文句なしですね。普通に良い作品です。
ぱっと見は欠点が見当たらないように思えます。
▶︎プロンプト:「以下の特徴を持つイラストを生成して。・日本人の美少女で、ショートカットの茶髪。・表情は「照れている」。・身長は150cmくらいの小柄な体型。・服装は、白系の長袖ニットとホワイト系のスカート、黒いロングブーツ。・小さめのバッグを手に持ち、遊園地でのデートのワンシーンを背景にしている。・遊園地の風景は観覧車やメリーゴーランドがぼんやり見えるロマンチックな雰囲気。
次にデート中の女の子を描いた一枚です。
一見、悪くないように見えますが、左側にある「白い模様の作画」が崩壊しています。
拡大してみるとわかりやすいかもしれません。
建物や物といったオブジェクトとは程遠い、“何か”が写っています。
これは人間がイラストを描いた場合に、まず起こり得ない事象です。
性能が低下したと感じる原因はこれになります。
昔から「手が変なところから生えている」「指が6本ある」など、生成AIが常識を理解しておらず、苦手とする部分は確かにありました。
これも作画崩壊と言えるのですが、今回感じた違和感は、それとは異なります。
「以前までできていたことが、できなくなったこと」や「名称の存在しない謎の模様・オブジェクトが描かれるようになったこと」が問題なのです。
また、次に紹介する「線画の歪み」も気になるポイントの一つになります。
▶︎プロンプト:「GPT-5をイメージしたイラストを生成して。シンプル、フラットアイコン、ワイドサイズ」
こちらの生成画像も、凝視してみれば違和感に気づくことができるはずです。
まずはイラストのメインとなるオブジェクトですね。
至る所がゆがんでいるのがわかるかと思います。
消しゴムで中途半端に消したような跡が残っている箇所もあれば、一本の線の太さが統一されておらず不自然な箇所もあります。
他にも、この部分。
「何これ」って感じじゃないですか。昔のDALL-E3なら絶対にあり得ない現象です。
ここで比較用として、過去にDALL-E3で生成したイラストを載せますが、クオリティは雲泥の差です。
どちらがクオリティの高い作品かを聞かれれば、100人中100人が後者のイラストを選択するでしょう。
このように、DALL-E3の性能や生成画像の品質は、以前とは比べ物にならないほどに低下しました。
やり方を変えてイラストを生成してみた結果
いつもとは異なる画像生成方法で、生成されるイラストが改善されないかを試してみました。
英語プロンプトで生成すると?
それでは、日本語プロンプトではなく、英語プロンプトでイラストの生成を指示するとどうなるでしょうか?
まずは、日本語プロンプトの生成結果です。
ChatGPTをイメージしたイラストを生成して。シンプル、フラットアイコン、ワイドサイズ
次に、英語プロンプトの生成結果です。
Generate an illustration inspired by ChatGPT. Simple, flat icons, wide size
同じく違和感満載のイラストが出力されました。
アプリから生成すると?
今までのイラストは、全てブラウザ版(PC)から生成したイラストです。
では、iPhoneアプリからプロンプトを入力するとどうなるのでしょうか?
GPT-4oから生成すると?
いつもは基本的に「DALL-E3」からイラストを生成しています。
ですが、実はDALL-E3を使わなくとも、「GPT-4o」や「GPT-4」のチャット画面からイラストを生成することができるため、違和感のない画像が生成されるかどうかを試してみます。
AIをイメージしたイラストを制作して。フラットアイコン、パステルカラー(青&赤)、シンプル、ワイドサイズ
ここにきて初めての好感触です。
右上の歯車マークに多少の歪みはあるものの、他の要素に不自然な点は見当たりません。
これなら及第点を大幅に上回っていると言えます。普通に採用レベルです。
アニメ風の日本美女を生成して。
・ロングヘア
・金髪
・キャミソールとスカートを着用
・日差しのある街中にて
一瞬良好かと思われましたが、背景がイマイチです。
子猫の写真を生成して。
・猫種は「マンチカン」
・毛色は「レッドタビーホワイト」
・家庭用マットでくつろぐ様子
結構、自然な写真が生成されました。
おかしな点が目立つ画像に比べると、だいぶ品質は向上したように思えます。
吹雪舞う夜景をイメージしたイラストを生成して。
こちらの一枚は、よくみると細部が崩れていますね。
特にビルの輪郭や窓あたりがいびつな形になっています。
結論、「DALL-E3でイラストを生成するよりかはマシ」な気がします。
少し不自然だと感じたイラストも、もしかするとプロンプト次第では改良できるかもしれません。
GPT-4から生成すると?
GPT-4oで使用したプロンプトを使って、イラストを生成していきます。
AIをイメージしたイラストを制作して。フラットアイコン、パステルカラー(青&赤)、シンプル、ワイドサイズ
アニメ風の日本美女を生成して。
・ロングヘア
・金髪
・キャミソールとスカートを着用
・日差しのある街中にて
子猫の写真を生成して。
・猫種は「マンチカン」
・毛色は「レッドタビーホワイト」
・家庭用マットでくつろぐ様子
吹雪舞う夜景をイメージしたイラストを生成して。
子猫の写真以外は、「線画の歪み」が生じていますね。
これならGPT-4をわざわざ選ぶ必要はなさそうです。
まとめ
結論、「DALL-E3から生成されるイラストの品質は低下」しており、「DALL-E3からではなく、GPT-4oからイラストを生成する方法がベスト」かもしれません。
とはいえ、プロンプトによって出力結果はまちまちで、両者に大きな差異はありません。
DALL-E3でもGPT-4oでも、オブジェクトの一部がいびつな形になっていることが確認できたので、結局は「どのプロンプトで何を作るのか」な気がします。
ただ一つだけ断定できることがあるとするならば、それは「DALL-E3の性能が落ちたということ」です。
過去の作品を見てもらえればわかる通り、これだけは間違いありません。
今後、この欠点は改善されるかもしれませんが、性能が低下した今、Stable DiffusionやMidjourneyの利用を検討した方が良いでしょう。