ページの本文へ

テクノロジー

生成系AI(ジェネレーティブAI)とは? ChatGPTやAI画像などまとめて解説

近年、ChatGPTをはじめとする「生成系AI(ジェネレーティブAI)」が注目されています。業務で利用する機会も増え始めており、気になっている方も多いのではないでしょうか。生成系AIはChatGPTだけでなくさまざまな種類が存在しますが、具体的なことはよく分からない、という方も多いでしょう。
そこでこの記事では、生成系AIの概要から注目される背景、生成系AIの種類や主な活用方法について解説します。

  1. 生成系AI(ジェネレーティブAI)とは?
  2. 生成系AIが注目される背景
  3. 生成系AIの種類
  4. 生成系AIの主な活用例

生成系AI(ジェネレーティブAI)とは?

生成系AI(ジェネレーティブAI)とは、機械学習のモデルの一つで、学習済みのデータを活用して新たなデータを生み出せるAIです。テキスト、画像、音声、動画など生成できるものは多岐にわたり、専門知識がなくても利用できることから近年注目を集めています。
生成系AIは主にディープラーニング(深層学習)によって構築された大規模な機械学習モデルです。事前に大量のデータを学習しておき、利用者は学習済みのAIから新たなデータを生み出して利用できます。

生成系AIが注目される背景

生成系AIが注目されるようになった要因としては、OpenAI社が開発したテキスト生成AIである「ChatGPT」の存在が大きいでしょう。また、同じ時期に注目された画像生成AIである「Stable Diffusion」や「Midjourney」の存在も大きいといえます。
これまでのAI活用は専門的な知識が必要であったり、特定の業務でしか利用できなかったりするものがほとんどでした。しかし、生成系AIは「誰もが簡単に利用できる」という点が特長であり、仕事や趣味などに幅広く活用できることから多くの注目を集めることとなりました。

生成系AIの種類

生成系AIは多種多様で、さまざまな種類が存在します。ここでは、主な生成系AIの種類について見ていきましょう。

テキスト生成系AI

ChatGPTやGoogle社のBard、Microsoft社のBing AIなどのテキスト生成系AIは、「プロンプト」と呼ばれる指示文章を入力することで自動的にテキストが生成されます。Web検索にも活用され、人間同士が会話をするように調べものをすることも可能です。

画像生成系AI

Stable DiffusionやMidjourney、DALL・E2などの画像生成系AIは、テキストから連想される画像を自動的に生成します。人物画・風景画・抽象画などのさまざまな画像の生成に対応しており、趣味として活用している方も多く存在します。

音声生成系AI

音声生成系AIもテキスト生成AI、画像生成AIと並んで利用される機会が多い生成系AIです。テキスト入力したものをAIが学習した音声で読み上げることができます。特定の人物の音声を学習することで、まるで本人が話しているかのように再現することも可能です。

3Dモデル生成系AI

3Dモデル生成系AIも画像生成系AIと同様に、テキストから連想される3Dモデルを生成できるAIです。Google社のDreamFusionやStable Diffusionを応用したStable-Dreamfusion、OpenAI社のPoint-Eなどの3Dモデル生成系AIが存在します。

動画生成系AI

こちらも同様に、テキストから連想される動画を生成するAIです。動画生成系AIは生成系AIのなかでも開発の難易度が高いとされています。しかし、現在ではRunway社のGen-2のようにクオリティの高い動画を生成できるようになっています。

生成系AIの主な活用例

生成系AIはさまざまな活用方法が考えられますが、そのなかでも主な6つの活用例について紹介します。

文章作成

テキスト生成系AIを活用することで、記事の作成や長文の要約などの文章を作成できます。その他にも、キャッチコピーのアイデア出しに利用したり、前述のようにWeb検索と併せて利用したりすることが可能です。

画像作成

画像生成系AIの活用では、指定した画像が生成できることからWebサイトのアイキャッチや背景画像の作成、SNSのアイコン作成などで活用できます。また、生成された画像からインスピレーションを得て、自身で新たなコンテンツを作成するための素材作成にも活用可能です。

動画作成

動画生成系AIで必要な動画を生成すれば、プロモーションなどの動画に活用できます。ただし、現時点では長尺の動画生成は難しく、活用は限定的となるでしょう。しかし、世界的な映画製作の現場であるハリウッドでもすでにAIは活用されており、例えば、吹き替え版における人物の口の動きをAIで生成して合成するツールも登場しています。

プログラムのコード生成

テキスト生成系AIの応用例として、プログラムのコードを生成することも可能です。例えば、ChatGPTでプログラミング言語を指定し、特定の動作をするコードを記載するように指示すると、プログラムのコードが生成されます。その他にも、エラーが表示されたコードを入力し、AIによって誤りを修正してもらう、という使い方も可能です。

翻訳

入力されたテキストに対して、翻訳を行うことも生成系AIが得意とする分野です。一昔前は翻訳後の精度が低く使いづらいものでしたが、近年の生成系AIが行う翻訳は非常に精度が高くなっています。翻訳に特化した生成系AIも多く登場しており、今後も利用される頻度の高い活用例の一つといえるでしょう。

文字起こし

音声を認識してテキストにして出力する「文字起こし」でも、生成系AIが活用されます。こちらも一昔前と比べて精度が向上しており、例えば、日本語であれば、前後の文脈から正しい言葉を選択してテキストに変換することが可能です。こちらも「AI文字起こしツール」として多くのサービスが登場し、Web会議システムなどに機能として付随していることもあります。

生成系AI(ジェネレーティブAI)は、学習済みのデータを活用して新たなデータを生み出せるAIです。テキストから画像・音声・動画などさまざまなデータの生成を実現します。今後、AIは人間をサポートする存在として、より重要視されると考えられます。
業務・趣味を問わず、AIの活用はますます増えていくことでしょう。今のうちからAIを賢く使えるように、少しずつでも触れてみてはいかがでしょうか。

当社の関連ソリューション/サービス

関連記事はこちら