目次
はじめに
こんにちはNUMです。
今回は技術紹介ではなく、個人的に気になっている画像生成AIについて書いていこうと思います。この記事を読めば、あなたが見た芸術作品がジェネラティブアート?
それとも画像生成AI?という疑問について少しでも違いが分かるようになります。
そもそもこの記事を書いたきっかけは、AIが出てきたことで、ジェネラティブアートをやっている僕が今感じている事をアウトプットしたいと思ったからです。
ジェネラティブアートとは
ジェネラティブアートとは、コンピュータサイエンスとアートが融合したような分野で 作品の実態はプログラムで実行すると芸術作品が生成されます。
アーティストはアルゴリズムを設計、プログラム化することが制作手法となります。
ジェネラティブアートの特徴として、作品はプログラムによる自律的なプロセスを経て生み出されます。そのため生成された結果には、アーティスト自身が予期しない美しさやパターンが現れることもあります。
例えば、色、モチーフの位置、形はランダムに決めるという処理を記述した場合、生成されるまで予測できません。

ジェネラティブアートの制作例:作品(左)エディタ(右)
一般的なツールは以下が挙げられます。
Processing
アーティストやデザイナー、プログラミング初心者向けに開発された、Javaベースのプログラミング環境および言語。ジェネラティブアートやインタラクティブアートを簡単に作成できます。
特徴:シンプルな記述、教育向け
p5.js
ProcessingのJavaScript版ともいえるライブラリで、ブラウザ上で動作するクリエイティブコーディングのためのツール。HTML5 Canvasを使ってジェネラティブアートを生成します。
特徴:ブラウザで実行可能
GLSL(OpenGL Shading Language)
GPUを使用して高速にリアルタイムグラフィックスを描画するためのシェーダー言語です。OpenGL環境で使用され、シェーダーを作成してジェネラティブアートを生成できます。
特徴:高速、会得難易度が高い
OpenFrameworks
C++をベースにしたオープンソースツールキットで、高度なジェネラティブアートやインタラクティブシステムの制作に適しています。C++のライブラリの一種のようなもの
特徴:高性能、多機能、ハードウェア寄り
画像生成AIとは
画像生成AIとは、人工知能(AI)を利用して生成される画像であり、機械学習やディープラーニングを活用して生成されます。
画像、動画生成AIには主に以下モデルが使用されています。
GAN (Generative Adversarial Network)
Generator(生成器)と Discriminator(識別器)という2つの機構から構成される生成モデルで、 生成器は乱数から偽物画像を生成し、識別器は生成された偽物画像と本物画像を入力し、 本物か偽物かを識別させるプロセスを繰り返します。
識別器が判別できなくなるまでお互いを交互に学習させることで、最終的には生成器が本物に近い画像を生成できるようになります。
要は、生成器が識別器を欺けるように学習しながら、見分けのつかないデータを生成するということです。
拡散モデル
拡散モデルはデータに対して徐々にノイズを付加する「拡散過程」と徐々にノイズを除去する「逆拡散過程」という2つのプロセスを使用します。
元データとノイズが加えられたデータを比較することで、ノイズを徐々に除去する方法を学習します。これを連続的に行うと完全なノイズからでも画像を生成できるようになります。
このモデルを使用した製品はStable Diffusion、DALL-E、Imagenなどがあります。

DALL-Eで生成したジェネラティブアート
具体的な違い
ジェネラティブアートと画像生成AIは根本から違います。
ジェネラティブアートの最も重要な特徴は、製作者がアルゴリズムを設計し、プログラム化するというプロセスです。これは画家が絵の構図を考え、筆で描くプロセスと同じようなものです。 そのためアルゴリズムの設計次第でオリジナルな作品ができるので、アーティストの感性が直接作品に反映されます。
一方、画像生成AIはデータセットの画像データの特徴を学習して、その特徴に類似した画像を生成します。その際、アーティストが思い描いているものをそのまま生成することはできないため、出力結果のコントロールが難しいです。しかしイメージの詳細を入力することで手軽に画像生成できるというメリットもあります。
画像生成AIが出てきて感じること
絵画が主流だった時代、写真が発明された時に絵画の終焉と言われていましたが、 現代でも絵画は残っています。画像生成AIが発表された時も、絵を描いている方は何かしら違和感を感じ取ったのではないかと思っています。

Piet Mondrianは写実的な絵画から抽象的、概念的な表現を模索するようになった。 新たな表現方法が発明されても既存の芸術は考え方を変えながら生き残っている。
僕がこの記事で特に重要としているのが制作プロセスです。 制作プロセスに人の手、感性が入る余地、これこそが作品が評価されるポイントになるのではないかと考えています。 (評価軸は様々で、美術史に影響を与えたか、見せ方、コネなどありますが。)
画像生成AIが発表されてから、作品がAI製か人間製かという議論がされていました。 人間は感情の生物なので、作品の見た目が良くてもAI製であれば批判してしまうのはなんとなく理解してしまいます、、笑
この考え方は非合理的だと思いますが、様々な作品が評価されるチャンスでもあると思います。僕は芸術は作品の良さだけでなく、コンセプト、見せ方、作家の人間性の総合点で評価されていくと思うので様々な武器を持って挑んでいけば良いのではないでしょうか。
僕が一番幸せなのは、制作自体が楽しくて、一定数のファンがいてくれて、みんなでワイワイ楽しくいられることです。すみません、頭の中がお花畑ですね笑
ただ、画像生成AIにも可能性があると思っています。 例えば、アイデアを紙に書き出しているのであれば、自分のイメージを伝えてあげることで画像を生成してくれますし、自身の作品だけを学習させたAIを作れば、自分の癖を特徴として認識させた、自分の分身のようなものが出来上がります。そこにコンセプトなども伝えてあげればなお良しです。
AIを否定するのではなく、活用しつつ制作プロセスを加速することで作品に磨きがかかっていくと思いますし、さらに展示機会を増やすことができれば素晴らしいですね。
制作におけるAI活用例
僕がジェネラティブアートを制作する際は以下プロセスになります。
(1、2は既存のアルゴリズムを作品に取り入れる場合のみ実施します。)
アルゴリズムの学習
ブログ記事
アイデア出し
スケッチ
アルゴリズムの設計
プログラム化
このプロセスの中でAIを活用しているのは1、3、5になります。
1:学習時の不明点をAIに聞いたりして理解を深めます。認識が合っているかを都度確認できるので躓かずに学習を進めることができます。例えば、複雑な数式や概念を噛み砕いて説明してもらえるため、理解が早まります。
3:まず自分自身でアイデアを考えます。そこから更に別角度の視点を広げる際に、関連するアイデアをAIに聞いたりしながらアイデアを深めます。
5:アルゴリズムの設計もまずは自分で検討します。設計、パフォーマンス、冗長性の改善点などの観点でAIにレビューしてもらいます。
2、6もAIにやって貰えば良いと思うかもしれませんが、文章やコードを書くのが好きなのであえて自分で書いています。自分で文章やコードを書くのは、アートの一部を手で描くような感覚に似ていて、思考と感性をダイレクトに作品に反映させることができるので。
正直、非効率ですよね笑。
僕が制作を始めて2年くらいはChatGPTのようなAIはなかったので、疑問点も自力で解消することが多く、制作時間がかなりかかっていました。活用するようになってからは、作品の幅やテーマ、クオリティも上がったような気がします。
しかし、AIに任せすぎることで失われるものがあるのも事実だと思います。
引き続き活用していきたいですが、自分の手を動かすところも大切にしていき二人三脚のような形でやっていきたいですね。
まとめ
今回はジェネラティブアートと画像生成AIの違いを解説しました。
僕はコードで絵を描いていますが、画像生成AIも制作の一部として取り入れることで、可能性を広げていきたいと考えています。制作において何を使うかよりも、「どのように感性を活かし、観る人に伝えるか」が重要かと考えています。
この記事を読んだ感想などコメントなどいただけると嬉しいです!
いつもは技術的な記事を書いていますが、自分の考えを書くのも楽しいですね。
最後まで読んでいただき、ありがとうございました。
参考
Comments