ページの本文へ

テクノロジー

画像生成aiとは? 仕組みや人気ツールなどを解説

「イラストは絵心のある人にしか描けない」という時代は終りを迎えたかもしれません。作成するイラストのイメージや雰囲気などを情報として与えるだけで、誰でも簡単にイラストを作成できるものが「画像生成AI」です。そんな画像生成AIに興味のある方は多いでしょう。
この記事では、画像生成AIの概要から手法・仕組みについて解説し、活用における注意点や人気のツール・サービスについて紹介します。

  1. 画像生成AIとは
  2. 画像生成AIの手法と仕組み
  3. 画像生成AI活用における注意点
  4. 画像生成AIの人気ツール・サービス

画像生成AIとは

画像生成AIとは、主に完成形のイメージや雰囲気をテキストで与えるだけで、自動的にAIが画像を生成できるサービス・ソフトウェアの総称です。例えば、「ネコ、昼寝」という情報を与えれば、昼寝をしているネコの写真を撮影したような画像やイラストが生成されます。サービスによって生成される画像の種類はさまざまであり、実写・アニメ・3Dモデルなどを選べるものも存在します。画像生成AIを用いることで、誰もが簡単に精度の高い画像を作成することが可能です。

画像生成AIの手法と仕組み

主に画像生成AIは、入力されたテキストから学習済みのデータを基に特徴を探し、一致する特徴から画像を生成する仕組みです。そのための手法はさまざまであり、次に挙げるような手法が用いられます。

VAE(変分オートエンコーダ)

深層学習(ディープラーニング)による生成モデルの一つで、教師データを利用せず学習データの特徴を捉えた「学習データに似たデータ」を生成します。つまり、元の学習用の画像データの特徴を学習することで、似たような画像を生成できる生成モデルです。

GAN(敵対的生成ネットワーク)

GANはGeneratorとDiscriminatorという2つのネットワーク構造から成り立っています。Generatorは偽物のデータを作り出し、DiscriminatorはGeneratorで生成された偽物のデータと本物のデータを比較し、本物・偽物を判定する役割です。これにより、実在しないデータの生成や実在するデータの特徴に沿った変換が可能になります。

DALL・E

DALL・E(ダリ)は、ChatGPTを開発したOpenAI社が2021年に発表した画像生成モデルです。ChatGPTでも利用される自然言語処理モデルのGPT-3と、画像の一部を与えると続きを生成するImage GPTによって、テキストから画像を生成できます。

StyleGAN/StyleGAN2

StyleGANはGANから派生した画像生成モデルであり、そのStyleGANを改良したものがStyleGAN2です。従来よりも高精度な画像を生成でき、StyleGAN2では画像品質も大きく向上しています。

Pix2Pix

Pix2Pixは2つのペア画像をもとに画像間の関係を学習し、2つの関係を反映したペア画像を生成する画像生成モデルです。GANをベースに開発されており、2017年に開催された「CVPR 2017」にて発表されました。

TransGAN

TransGANでは他の生成モデルと異なり、CNNと呼ばれる畳み込みを加えたニューラルネットワーク構造を利用しません。Transformerと呼ばれる自然言語処理タスクにおける強力なネットワークのみを利用して画像を生成する点が特徴です。

画像生成AI活用における注意点

画像生成AIに関する法律などがまだ整備されておらず、活用方法を誤ると著作権や知的財産権を侵害する可能性があります。例えば、既存のキャラクターやイラストに酷似した画像を生成して利用していた場合、著作権を侵害しているとしてトラブルに発展するかもしれません。
また、整合性のない画像が生成される可能性があり、その場合には手動で修正する必要があります。例えば、人物の写真画像を生成したときに腕が3本あるような画像が生成されることもあるため、精度が高いといってもそのまま利用できるとは限らない点は覚えておきましょう。

画像生成AIの人気ツール・サービス

画像生成AIとして、多くのツールやサービスが登場しています。そのなかでも、人気の高いツール・サービスを8つ紹介します。

Stable Diffusion

Stable Diffusionは画像生成AI人気の火付け役の一つです。オープンソース型のAIが利用されており、テキストを入力すると数十秒で画像を生成できます。無料で利用でき、複雑な指示にも対応できます。

Midjourney

Stable Diffusionと同様に画像生成AI人気の火付け役の一つであり、チャットツールやDiscord(コミュニケーションツール)と連携して利用できます。

Visual ChatGPT

Visual ChatGPTはChatGPTに画像生成機能を搭載したものであり、Mircrosoft社によってリリースされました。ChatGPTとさまざまな画像生成AIの手法を組み合わせることで、チャットしながら画像を送受信できるようになります。

にじジャーニー

にじジャーニーはアニメ風イラストの生成に特化した画像生成AIであり、Discordを通じて利用可能です。生成したイラストはライセンスフリーとなっているため、広告やポスター、グッズのイメージデザインとして活用できます。

cre8tiveAI

cre8tiveAIは画像の高画質化や写真の動画化、似顔絵やイラスト作成などのAIツールのプラットフォームです。用途に応じて、画像・動画の編集加工や素材の生成に特化した各種AIツールが利用できます。

お絵描きばりぐっどくん

Stable Diffusionを利用してLINEから簡単に画像生成が体験できるツールです。LINEで友だち登録し、作成したい絵のお題をメッセージで送信するだけで自動生成された画像が返ってきます。

AIピカソ

こちらもStable Diffusionを利用しており、スマートフォンアプリとして利用できます。テキストから画像を自動生成するだけでなく、イラストの下絵を入力素材として渡して続きを生成してもらうことも可能です。

Artbreeder

ArtbreederはGANを利用しており、画像をアップロードすることで異なる画像を自動生成するサービスです。例えば、イラストをアップロードして「実在しない人物」の写真を作成する、風景の写真をアップロードしてオリジナルの風景を生成する、といったことができます。

テキストや画像を素材として渡すことで、自動的にAIが画像を生成する画像生成AIは、誰でもクリエイティブなことができるものとして注目を集めています。画像生成AIの手法はさまざまで、サービスによって生成される画像も多種多様です。人気のツールやサービスも多く登場しており、ビジネスでも利用されているため、今後はさらに重要視されることになるでしょう。

画像生成AIに限らず、AIは人間の代わりにさまざまな作業を自動化できます。日立ソリューションズ・クリエイトでは、既存のシステムにAIをプラスすることでお客さまの課題解決を支援する「AIプラス」を提供しています。AIを活用した業務の自動化・効率化に興味がある場合には、ぜひ一度ご相談ください。

当社の関連ソリューション/サービス

関連記事はこちら