「デザイナー失職間近か」…GPT-4oが生み出すAIマンガの驚くべき水準

Photo of author

By Global Team

OpenAIは2025年3月25日、最新のAIモデルGPT-4oの画像生成機能をChatGPTに直接統合し、以前よりもはるかに自然で精巧な視覚的創作ツールを発表しました。従来のDALL・Eベースのシステムを置き換える今回のアップデートでは、AIがユーザーの文章を理解し、会話の文脈に応じて画像を生成できるように設計されています。

今ではChatGPTのユーザーは、別のツールを使用せずにチャット画面で直接画像を作成できます。Plus、Pro、Team、Freeの料金プランすべてで利用可能で、無料ユーザーは1日最大3枚まで画像を生成できます。有料ユーザーは回数制限なく画像を作成でき、企業・教育用ユーザーも近くこの機能を利用できるようになります。

OpenAIは、今後数週間以内に開発者向けのAPIも公開する予定であり、これにより外部のアプリやサービスでもGPT-4oの画像生成能力を活用できるとみられています。

OpenAIが2025年3月25日に発表したGPT-4oの画像生成機能を紹介するシーン
OpenAIが2025年3月25日に発表したGPT-4oの画像生成機能を紹介するシーン

GPT-4oは最大20個のオブジェクトを同時に認識し配置できる高度な処理能力を備えています。例えば、「ポップコーンを食べながら映画を鑑賞している犬」のような複雑なシーンも自然に構築できます。手、顔、テキストなど表現が難しい要素も精密にレンダリングされ、画像生成スピードは平均30秒から最大1分以内です。

リー記者が直接OpenAIのチャットGPT 4oモデルを使用して画像を生成するシーン
リー記者が直接OpenAIのチャットGPT 4oモデルを使用して画像を生成するシーン
生成された「ポップコーンを食べながら映画を鑑賞する犬」画像を利用して漫画を生成するシーン
生成された「ポップコーンを食べながら映画を鑑賞する犬」画像を利用して漫画を生成するシーン

記者のテストでもGPT-4oの画像生成能力は印象的でした。「ポップコーンを食べながら映画を鑑賞している犬の画像を作って」とChatGPTに入力すると、数十秒でそのシーンをそのまま実現した画像が生成されました。ソファに座りポップコーンを持ってスクリーンを見つめている犬の姿は構図と表情まで精巧に表現されており、手や顔のような難しい要素も自然にレンダリングされていました。

さらに、この画像を元に吹き出しと背景を追加して4コマ漫画を制作したところ、画像の品質とスタイルが乱れることなく自然につながりました。特別なグラフィックスツールを使用せず、テキスト入力だけで漫画の画像まで制作可能なレベルであることは、既存のコンテンツ制作方法に新鮮な衝撃を与えるのに十分でした。

また、ユーザーが絵を作成する前に色(hexコード)、背景(透明を含む)、比率などを精密に指定でき、希望するスタイルや細部要素も自然言語で自由に指示できるようになっています。生成された画像は会話の文脈を保持し、同じスタイルで繰り返し生成したり修正依頼も可能です。

OpenAIはこのような方法が単なるAI機能を超え、創作とコミュニケーションを組み合わせた「生成型インターフェース」へと進化していると強調しています。

OpenAIのSoraがGPT-4oモデルと結合されてより精巧な画像生成が可能になった。
OpenAIのSoraがGPT-4oモデルと結合されてより精巧な画像生成が可能になった。

Leave a Comment