2023年9月21日に発表された「DALL-E3」。既に多くの方が使い、その性能の凄まじさが大きな話題を呼んでいます。
DALL-E3は、DALL-E2より大幅に機能がアップデートされた画像生成AIです。使いこなせば様々な場面で役立つでしょう。
今回はそんなDALL-E3について解説します。DALL-E3を使う上で知っておきたいことや、設定方法を紹介しています。
「ChatGPT」「Bing」に分けているので、使っている環境に合わせて参考にしてくださいね。
DALL-E3とは画像生成AIのこと
画像引用:DALL-3
DALL-E3は、2023年9月21日にOpenAI社が公開したばかりの画像生成AIです。テキストプロンプトから内容を反映した画像を生成できる「DALLシリーズ」の最新版となります。
これまでのシステムよりもニュアンスやディテールを理解し、ユーザーのアイデアを忠実に再現する画像を生成できるようになっています。使い方によっては、自分の頭の中をそのまま画像にできるでしょう。
そんなDALL-E3には、以下の特徴があります。
- DALL-E2と使い方が異なる
- ChatGPTと統合している
- プロンプトのニュアンスをより理解できるようににあった
- 画像の利用権はユーザーにある
- 著作権対策がなされている
DALL-E2と使い方が異なる
DALL-E3と旧バージョンのDALL-E2の大きな違いは、使い方にあります。
DALL-E2では、専用のWebサイト上で利用する形でした。利用する際は、専用ページにアクセスしなければいけません。
一方のDALL-E3は、「ChatGPT」や「Microsoft Bing Image Creator」「BingAI」から直接利用します。つまり、別サービス上で利用できるのです。
Webサイトを経由せずに使えるのが、DALL-E2との大きな違いとなっています。
ただし、DALL-E3も今後専用サイトが解禁される予定です。2023年10月現在において、利用するなら別サービス上で使うしかないとだけ覚えておきましょう。
ChatGPTと統合している
DALL-E3はChatGPTを基盤としています。そのため、ChatGPTを使ってアイデアのブレインストーミングをしたり、プロンプトを洗練させたりといった使い方が可能です。
AIに画像生成を依頼する場合、最も苦戦するのがプロンプトとなります。理想の画像を出力するために、プロンプトをいじって少しずつ近付けていかなければいけません。
しかしDALL-E3はChatGPTと統合しているので、ChatGPTに調整を依頼できます。これまで自力でやっていた部分をAIに任せられるのです。
画像生成において、大きな時間短縮となるでしょう。
プロンプトのニュアンスをより理解できるようになった
DALL-E3は、プロンプトのニュアンスをより理解できるようになっています。複雑なテキストであっても、意味やニュアンスをしっかり捉え、忠実な画像生成をしてくれます。
それを可能としているのが、DALL-E3に搭載されている高度な認識アルゴリズムによる影響です。例えば、「夜空に輝く満月と街頭を行き交う人々」といった複雑なテキストでも、対応する画像を生成してくれます。
日本語となると少し生成が難しくなりますが、ほとんどの場合において微調整で済むでしょう。英語を使えない方にとっても、使いやすくなっていると言えます。
画像の利用権はユーザーにある
DALL-E3で作った画像の利用権は、ユーザーにあります。私的に眺めるのはもちろん、以下の利用も可能です。
- 販売
- 商品化
プロンプトを駆使してイラストを生成し、販売することも可能となるでしょう。また、DALL-E3で作ったロゴを商用利用することもできます。
著作権対策がなされている
DALL-E3は、著作権対策もなされている点も特徴です。画像を生成する際、以下の生成が拒否されるようになっています。
- 公共の人物に対するリクエスト
- 生きているアーティストのスタイルでの画像生成
画像生成AIを使ったフェイク画像や、活動しているアーティストのスタイルを真似た画像に対し大きな反発がありましたが、しっかりと対応をしてくれています。
DALL-E3の設定方法
DALL-E3には2通りの使い方があります。ここからは、以下の3つの方法をそれぞれ解説します。自身の環境に合わせて、設定してみてください。
使用方法 | 有料/無料 | 商用利用 |
---|---|---|
ChatGPT | 有料(月額20ドル) | ○ |
Bing Image Creator | 無料 | × |
BingAI | 無料 | × |
ChatGPTで使う方法
DALL-E3は、ChatGPTで使用可能です。GPT-4が利用できる有料会員(月額20ドル)であれば、誰でも以下の手順で使えます。
- GPT-4を選択
- DALL-E3を選択
後はプロンプトを入力し、出力された画像に対して微調整を繰り返していくだけです。
微調整も細かい部分までできるため、例えば「制服を着た女の子」を生成した場合、「制服の色を紺色にして欲しい」と指定すれば制服だけ色を変えられます。
ChatGPTは有料会員になれば、GPT-4Vも使えます。こちらは画像や音声を使ってAIが業務効率化を手助けしてくれる機能です。以下の記事で詳しく解説しているので、参考にしてください。
https://envader.plus/article/236
Bing Image Creatorを使う方法
画像引用:Bing Image Creator
DALL-E3はBing Image Creatorを活用すれば、誰でも使えます。ChatGPTと違い、費用はかかりません。以下の手順で進めましょう。
- 「Bing Image Creator」へアクセス
- 指示文を入力する
- 「作成」をクリック
プロンプトを検索窓のような部分に入力して作成をクリックするだけです。非常に簡単に使えるため、「とりあえずDALL-E3を触ってみようかな」と考えている方は試してみることをオススメします。
BingAIで使う方法
DALL-E3は、BingAIのチャットでも利用できます。以下の手順で進めてください。
- Microsoft Bingを開く
- 画面上部にある「チャット」をクリック
- 画像生成のプロンプトを入力する
以上の手順で画像を生成できます。既にBingAIを愛用している方なら、同じ感覚で使えます。ただし、画像生成に特化しているわけではないため、「~な画像を生成してください」といった指定が必要です。
DALL-E3の評価
DALL-E3はリリースされて間がありません。今後、より進歩していく画像生成AIです。2023年10月現在、DALL-E3には以下の評価がくだされています。
- 日本語と英語で精度がほとんど変わらない
- DALL-E2より精度が大きく上がった
日本語と英語で精度がほとんど変わらない
DALL-E3は日本語にも対応してます。リリースされている多くの画像生成AIが英語のプロンプトに最適化されているのと比べると、大きな進化です。
特に日本語は、世界一難しい言語と言われています。細かなニュアンスを読み取るのが難しく、AIが正しく読み取れないためです。画像生成AIを利用する大きなネックと言っても良いでしょう。
ですが、DALL-E3は日本語のプロンプトを理解した上で、独自にカスタマイズして画像を生成してくれます。同じ意味を英語で入力した場合とほとんど差異がありません。
日本語でも手間無く画像生成できるようになった点は、多くの方が評価しています。
DALL-E2より精度が大きく上がった
画像引用:DALL-3
DALL-E3はDALL-E2より、大幅に精度が向上しています。プロンプトを正確に再現する能力が上がったためです。
そもそもDALL-E2自体、最高クラスの画像生成AIでした。「Midjourney」や「Stable Diffusion」に追い抜かれるまでは、画像生成AIの代表格だったと言って良いでしょう。
DALL-E3は、そんなDALL-E2から精度が大きく上がり、ユーザーの希望通りの画像を生成してくれるようになっています。精度の向上は、DALL-E3を評価する上で、誰しも実感している部分です。
DALL-E3は精度が非常に高い画像生成AI
DALL-E3は、OpenAI社がリリースしたDALL-Eの最新バージョンです。ChatGPTと統合され、Bingでも利用できます。
DALL-E2よりも画像生成の精度が大幅に向上し、よりユーザーのイメージに近い画像を出力できるようになっています。プロンプトも日本語で入力できるため、英語が苦手な方でも安心です。
興味のある方は、商用利用はできませんが、Bingを使って無料で試してみることをオススメします。この機会に、ぜひ画像生成AIを楽しんでくださいね。
【番外編】USBも知らなかった私が独学でプログラミングを勉強してGAFAに入社するまでの話
プログラミング塾に半年通えば、一人前になれると思っているあなた。それ、勘違いですよ。「なぜ間違いなの?」「正しい勉強法とは何なの?」ITを学び始める全ての人に知って欲しい。そう思って書きました。是非読んでみてください。
「フリーランスエンジニア」
近年やっと世間に浸透した言葉だ。ひと昔まえ、終身雇用は当たり前で、大企業に就職することは一種のステータスだった。しかし、そんな時代も終わり「優秀な人材は転職する」ことが当たり前の時代となる。フリーランスエンジニアに高価値が付く現在、ネットを見ると「未経験でも年収400万以上」などと書いてある。これに釣られて、多くの人がフリーランスになろうとITの世界に入ってきている。私もその中の1人だ。数年前、USBも知らない状態からITの世界に没入し、そこから約2年間、毎日勉学を行なった。他人の何十倍も努力した。そして、企業研修やIT塾で数多くの受講生の指導経験も得た。そこで私は、伸びるエンジニアとそうでないエンジニアをたくさん見てきた。そして、稼げるエンジニア、稼げないエンジニアを見てきた。
「成功する人とそうでない人の違いは何か?」
私が出した答えは、「量産型エンジニアか否か」である。今のエンジニア市場には、量産型エンジニアが溢れている!!ここでの量産型エンジニアの定義は以下の通りである。
比較的簡単に学習可能なWebフレームワーク(WordPress, Rails)やPython等の知識はあるが、ITの基本概念を理解していないため、単調な作業しかこなすことができないエンジニアのこと。
多くの人がフリーランスエンジニアを目指す時代に中途半端な知識や技術力でこの世界に飛び込むと返って過酷な労働条件で働くことになる。そこで、エンジニアを目指すあなたがどう学習していくべきかを私の経験を交えて書こうと思った。続きはこちらから、、、、
エンベーダー編集部
エンベーダーは、ITスクールRareTECHのインフラ学習教材として誕生しました。 「遊びながらインフラエンジニアへ」をコンセプトに、インフラへの学習ハードルを下げるツールとして運営されています。
関連記事
2020.02.25
完全未経験からエンジニアを目指す爆速勉強法
USBも知らなかった私が独学でプログラミングを勉強してGAFAに入社するまでの話
- キャリア・学習法
- エンジニア
2023.04.24
Notion AIとは?利用料金や導入方法について解説
今回はNotion AIとは何か?や 利用料金や導入方法について解説を行います。
- AI
2023.11.19
何から始めればいい?AIエンジニアについて
この記事では初学者の方に向けて「AIエンジニアについて」解説しています。AIエンジニアへのなり方や必要なスキルなども紹介しているので、ぜひ参考にしてくださいね。
- AI
2023.03.30
ドキュメント生産性爆増 Notion AI 活用法
Notion AIはNotionを更に強化した使い方ができるため、多くの場合で業務効率化ができます。Notion AIの使い方やユースケースを解説していくので、ぜひ参考にしてください。
- AI