【テック最新情報】グーグル、最新のAI画像生成技術「Imagen 4」を公開 – 開発者向けアクセスを拡大

Photo of author

By Global Team

グーグルが自社最高性能のテキスト-画像生成モデル「Imagen 4」を正式にリリースしました。今回のリリースは、テキストベースの画像生成技術の品質を一段階引き上げたと評価されています。特に、画像内でのテキストの表現力が目に見えて向上した点で注目されています。

グーグルは今回の発表を通じて、誰でも簡単に使用できるように、Imagen 4モデルをGemini APIとGoogle AI Studioで利用可能にしました。特に、処理速度が速く、コストが安いことを前面に出した「Imagen 4 Fast」モデルを併せて公開し、実用性をさらに強化しました。

Imagen4 (사진제공=Google 블로그)
Imagen4 (사진제공=Google 블로그)

Imagen 4シリーズは、用途と必要に応じて選択できるように3つのモデルに分かれています。最も注目される「Imagen 4 Fast」は、名前の通りに速い画像生成を目的としたモデルです。画像1つを生成するのにかかるコストは0.02ドル(約27円)で、高速処理や大量作業に適しています。

基本モデルである「Imagen 4」は、前作よりもテキストの表現力が大幅に向上しました。これは広告画像や情報伝達において重要なフレーズを正確に視覚化する必要のある状況に有利です。このモデルの使用価格は画像当たり0.04ドルと知られています。

구글, 차세대 이미지 생성 모델 ‘Imagen 4’ 공개 (사진=@Google AI Developers X계정)
구글, 차세대 이미지 생성 모델 ‘Imagen 4’ 공개 (사진=@Google AI Developers X계정)

最上位バージョンである「Imagen 4 Ultra」は、最高水準のディテールとテキスト反映の精度を提供します。主に専門的なデザイン、アートワーク、マーケティング分野で複雑な視覚的要求を持つユーザーを対象としています。

Imagen 4とImagen 4 Ultraは、最大2K解像度の画像生成をサポートします。一般的に「2K解像度」は横解像度が約2,000ピクセルに達し、ウェブコンテンツはもちろん印刷用資料にも活用可能な高品質イメージを意味します。グーグルは高解像度がマーケティング資料や芸術的構成に必要な繊細な表現を可能にすると説明しています。

以前のモデルと比較すると、テキストが画像に挿入される品質も大幅に向上しました。例えば「幸せな家族がピクニックに行く姿を描いて」といった文章を入力すると、その文章を反映した人物が含まれる画像がより正確に生成されます。以前は文章の意味が大まかに反映されるか、テキストが画像内で不自然に表現されることが多くありました。

グーグルは今回のImagen 4モデルシリーズに「SynthID」という透かし技術を適用しました。この技術は生成された画像に見えない方式で出所を表示する方法です。これはAIが作った画像であることを容易に確認できるようにしつつも、肉眼では痕跡が見えないように設計されています。最近AI画像の悪用が懸念される中、誰が作ったのか、どのように生成されたのかを確認することができる透明性が重要になっています。グーグルはこのSynthID技術を通じてAI倫理基準を強化していると述べています。

Leave a Comment