mikimiki-WEBスクールで、2023年10月からOpenAIが新しい画像生成AI「DALL-E3」をリリースすることについて紹介しています。
DALL-E33は、チャットGPT上で高品質の画像を生成することができ、特に文字の生成やユーザーの指定に基づいた画像生成が可能だそうです。安全性や著作権の面でも配慮がされているとのことです。
chatGPT+の有料会員の方は、10月にDALL-E3が搭載されたらMidjourneyと同じ画像生成ができるようになります。
かなり大きなニュースですね。以下、動画をもとに解説します。
ソースはこちら→【速報OpenAI最新リリース】ChatGPTに画像生成AI DALL-E3(最新モデル)が搭載で最強に!
目次
DALL-E3は、チャットGPT上で高品質の画像生成が可能
詳細な再現性
DALL-E3は、ユーザーが指定したプロンプトに非常に忠実に画像を生成することができます。
例として、動画では「穴が開いたアボカドが中が空っぽ」というプロンプトに基づいて、そのシチュエーションを表現する画像が生成されていました。
文字の生成
画像生成AIの中で、文字の生成は特に難しいとされています。
しかし、DALL-E3は、画像の中に文字を含めることができます。
動画の中でアボカドのイラストに関連する文字がしっかりと生成されているのがその例です。
自然な表現
DALL-E3は、自然なポーズや表現を持つキャラクターや物体を生成することができます。
例えば、アボカドのキャラクターが自然な姿勢で描かれていたり、スプーンのキャラクターが自然に足を組んでいるなど、不自然さが感じられない高品質な画像が生成されます。
細かなニュアンスの理解
DALL-E3は、ユーザーが指定したプロンプトの細かなニュアンスや要求も理解し、それに基づいて画像を生成することができます。
例として、動画では「ライチをイメージした球体の写真」や「外側はライチ感のあるデコボコとした感じ、内側は豪華な感じ」といったプロンプトに基づいて、それを忠実に再現した画像が生成されていました。
Midjourneyとの比較
動画内では、DALL-E3と他の画像生成AI「Midjourney」との比較も行われており、DALL-E3がミッドジャーニーに匹敵する、あるいはそれ以上の品質を持っていることが示されています。
サンプル画像のクオリティ
動画内で示されたDALL-E3によるサンプル画像は、非常に高いクオリティを持っていました。
例えば、アボカドやスプーンのキャラクター、ライチをモチーフにした画像など、細かいディテールやニュアンスがしっかりと再現されていました。
直接の比較
動画内ではDALL-E3とMidjourneyで同じプロンプトを使用して生成された画像が比較されています。
その結果、DALL-E3による画像がMidjourneyに匹敵する、あるいはそれ以上のクオリティを持っていると言えます。
文字の生成能力
DALL-E3は、画像内に文字を生成する能力も持っています。
これは、画像生成AIにとっては難易度が高いタスクとされていますが、DALL-E3はこれを高品質で実現しています。
この点も、ダリ3の高品質さを示す要因の一つとなっています。
自然な表現
DALL-E3は、キャラクターや物体の自然なポーズや表現をしっかりと再現することができます。
これにより、生成された画像がリアルで自然に見えるため、高品質と評価されています。
細かなニュアンスの理解
DALL-E3は、ユーザーが指定したプロンプトの細かなニュアンスや要求もしっかりと理解し、それに基づいて画像を生成することができます。
DALL-E3の3つの主なポイント
高品質で文字も生成できる。
DALL-E3は、非常に高いクオリティの画像を生成する能力を持っています。これにより、ユーザーが指定したプロンプトに基づいて、細かいディテールやニュアンスを持った画像を生成することができます。
さらに、DALL-E3は文字の生成も可能です。画像生成AIにおいて、文字の生成は特に難易度が高いタスクとされています。
しかし、DALL-E3はこのタスクを高品質で実現しており、画像の中に文字を含めることができます。これにより、例えばイラストとその説明文を一緒に生成するといったことも可能となります。
チャットGPT上で手軽に使用できる
DALL-E3は、チャットGPTというテキストベースのAIと組み合わせて使用することができます。
ユーザーはテキストのプロンプトを入力するだけで、DALL-E3を活用して画像を生成することができます。
専門的な知識や技術を必要とせず、手軽に高品質な画像を生成することができるようになります。
画像生成AIの著作権や安全性の問題もカバーされている。
AI技術の進化に伴い、生成されるコンテンツの著作権や安全性に関する問題が増えてきました。
特に画像生成AIは、既存のアートワークや写真を模倣することが可能となるため、これらの問題が顕在化しています。
DALL-E3は、このような背景を踏まえて、以下のような配慮がされています:
現存するアーティストのスタイルの模倣防止
DALL-E3は、特定のアーティストのスタイルや既存のアートワークを模倣することができないように設計されています。これで著作権の侵害やアーティストの権利を守ることができます。
例えば、特定のアーティストの絵画スタイルや、特定の写真のスタイルを再現するようなリクエストに対して、DALL-E3はそのような画像を生成することはできません。
不適切な内容の生成を防止
安全性の面では、ダリ3は不適切な内容や有害な画像を生成することを防ぐための仕組みを持っています。
なので、ユーザーが不適切なプロンプトを入力しても、それに応じた不適切な画像は生成されないようになっています。
まとめ
以上、mikimiki-WEBスクールの動画
ソースはこちら→【速報OpenAI最新リリース】ChatGPTに画像生成AI DALL-E3(最新モデル)が搭載で最強に!
からの紹介でした。
DALL-E33、chatGPT上で高品質の画像を生成することができ、特に文字の生成やユーザーの指定に基づいた画像生成が可能。安全性や著作権の面でも配慮がされています。
chatGPT+の有料会員の方は、10月にDALL-E3が搭載されたらMidjourneyと同じ画像生成ができるようになります。
動画ではさまざまな 例で具体的に示してくれていますので、ぜひ御覧ください。