AIによる画像生成、私たちの想像力の汚染

アナログ写真、デジタル写真、そしてAI画像生成システムは、私たちの視覚表現との関係を変えてしまったのでしょうか？
AI生成画像の過剰生産とその性質が、すでに私たちの想像力を不可逆的に汚染してしまったのでしょうか？
画像はまだ私たちに夢を見させることができるのでしょうか？

要約すると、
● アナログ写真は、デジタル写真や生成画像システムの普及に比べ、私たちの画像との関係をわずかにしか変えていません。
● 生成画像システムのユーザーは、AI以前の時代のアーティストではなく、テキストとは異なり、彼らは元々持っていなかった技術を失うリスクを負っていません。
● 画像を生成することは創造の錯覚を与えますが、本質的には消費です。私たちは画像を依頼し、キーワードを提案して調整し、満足するまで繰り返します。
● 見かけ上独創的で驚くべきAI生成画像の過剰消費は、驚きの価値を平凡化させ、神秘への感覚を鈍化させ、私たちの想像力を弱めます。
● もし画像がもはや私たちに夢を見させないのであれば、楽観的な観点から見て、私たちは日常生活を再発見し、より注意深くなり、再び詩的に世界に住むことができるのでしょうか？

アナログ写真

その発明以来、多くの思想家が写真を理論化しようとしてきました。
写真とは何か？その独自の特徴は何か？他の視覚芸術とどう違うのか？

ロラン・バルト (明るい部屋, 1980) は、写真について「存在論的」欲望を抱いていたと述べています。つまり、それが「それ自体」として何であり、画像群の中でそれを際立たせる本質的な特徴を理解しようとする欲望です。

ウォルター・ベンヤミン (技術的複製可能性の時代における芸術作品, 1936) のような人々は、写真の技術的複製可能性が、以前は社会的および文化的エリートに限定されていた視覚表現を民主化し、より広い観衆にアクセス可能にした一方で、特定の場所で展示される際に鑑賞者と特別な関係を生み出す伝統的な芸術作品の一意性とオーラを破壊したと考えていました。
アンドレ・バザンやロラン・バルトのような人々は、写真の特徴—現実を機械的に再現する能力—が、ある意味で現実を不朽のものにすると考えていました。
ロラン・バルトは、写真を区別するために Studium（写真が引き起こす一般的または文化的な関心）と Punctum（写真の予期しないディテールが引き起こす個人的な感情）の概念を導入しました。
ヴィレム・フルッサー（Towards a Philosophy of Photography, 1983）は、写真装置がその技術的制約によって写真家に選択と創造的制限を課していると主張しました。

より最近では、フィリップ・デュボワ（From the Image-Trace to the Image-Fiction, 2016）は、特にトーマス・パヴェルが文学作品に関連して開発した可能世界(possible worlds)の概念を写真に適用しました。
文学では、可能世界は物語から想像できる無限の代替宇宙を指します。
写真はもはや単なる現実の表現ではなく、代替現実、仮説、またはフィクションを含む自律的な空間（物語的または概念的）となっています。

それでもなお、デジタル時代以前の写真の出現が、それ以前の表現ツール（版画、モザイク、タペストリー、絵画、リトグラフ...）の本当に異なる特徴を超えて、創作者と観衆の画像との関係を根本的に変えなかったと主張することも可能です。

展示空間での作品の一意性の前に鑑賞者が持つ親密な美的体験は、大量に再現され、大衆にアクセス可能な写真を鑑賞する際の美的体験と根本的に異なるのでしょうか？
写真は、絵画よりも「かつてそこにあった」ことの証明書なのでしょうか？それとも、写真は本質的に「かつてそこにあった」の主観的な構築であり、それが現実であったのは写真を撮るための演出が行われた瞬間だけなのでしょうか？
ロラン・バルトのStudiumとPunctumの概念は、すべての視覚表現に適用できるのではないでしょうか？
写真装置の技術的制約は、版画や絵画の技術的制約よりも創造的プロセスに影響を与えるのでしょうか？
可能世界の概念は彫刻にも適用できないでしょうか？あらゆる表現は代替現実の探求を可能にするのではないでしょうか？

デジタル写真

デジタル写真に伴い、存在論的な議論に加えて新たな疑問が生じます。
誰が写真を撮っているのか？

デジタル時代以前の写真が、創作者と鑑賞者の両方にとって、他の視覚表現のモードと比べてあまり違いがなかったと主張できる一方で、デジタル写真は重要な変化をもたらします。写真を撮ることが簡単になります。
ウォルター・ベンヤミンによれば、写真の技術的複製可能性により、視覚表現はより広い観衆にアクセス可能になりました。しかし、デジタル写真は、視覚表現の民主化に加え、画像制作そのものを誰でも行えるようにしました。写真はかつて、他の表現モードと同様に、専門家や経験豊富な愛好家に限られていましたが、デジタル写真によって写真撮影は誰にでもできるものとなりました。

デジタル時代以前の写真の鑑賞者は、現在では実際の画像の製作者になっています。
制作技術の習得や理解、財政的な制約、版画や絵画、アナログ写真を準備・制作するために必要な時間は、使いやすさ、目に見えない制作プロセス、見た目の無料性、瞬時性に取って代わられました。

カメラやメディアを通じて大量に制作され、消費される写真は、私たちの日常環境を飽和させています。写真はもはや単なる道具ではなく、無意識のうちに私たちの行動や選択に影響を与えるメカニズムでもあるのかもしれません。

写真の意図、実践、美的体験の性質も変化しています。
もともとは記録、芸術、科学、広告、教育目的で使用されていた写真は、今日では主に個人および社会的な目的で使用されています。たとえば、セルフィーは、伝統的な自画像の芸術的、美的、象徴的な意図から遠く離れ、個人が自分を舞台に立たせ、友人と瞬間、感情、体験を共有することを可能にします。

アナログ写真の化学現像が必要だった時代には、写真を撮影した瞬間とその写真を発見する瞬間の間に技術的な遅延、時間的な隔たりがありました。しかし、デジタル技術とカメラに内蔵された画面により、撮影された瞬間と体験した瞬間の同時性が可能となり、誰もがこれを利用できるようになりました。
場所や出会い、体験された出来事の経験が多様化します。写真記録による瞬間の即時確認は、人々が新しい体験をし、デジタル時代以前とは異なる形で現在に注意を向けることを促します。

AIによる画像生成

写真と同様に、AI生成画像の存在論を超えて、その制作メカニズムと新しい実践を問うことが重要です。
これらの画像は誰が、どのような文脈で、どのような目的で生成しているのか？

焦点を当てるべきは、AI生成画像の品質や独創性、視覚表現の美的評価を問うことではありません。これらは主観的なものであり、それぞれの鑑賞者に属するものです。むしろ、これらの画像が私たちの想像力に与える影響を問うべきです。
さらに、セルジュ・ティセロンが写真の下位学校のためのマニフェストで述べているように、「豊かな」または「貧しい」画像は存在しません。

AI画像生成ツールは、誰でも以前よりもはるかに大量に画像を生成できるようにし、学習やスキルを必要としません。母国語だけで十分であり、簡単なテキスト指示（プロンプト）で誰でも画像を作成できます。さらに、現実に触れることなく、自宅を出る必要もなくなり、写真を撮るためのボタンを押す必要すらありません。

テキスト生成 VS 画像生成

クリエイティブな分野におけるAIの普及が進む一方で、テキストと画像には重要な違いがあります。

ChatGPTのような言語モデルは、情報を見つける、テキストを作成するなど、これらのモデルが登場する前から存在していた活動を簡略化、加速、または自動化するためにユーザーに使用されています。
小説家、ジャーナリスト、管理者、弁護士、ソフトウェア開発者は、通常の活動を続けていますが、異なる方法で行っています。つまり、彼らは「最適化」の名の下に、専門知識の一部を言語モデルに外注し、委任しています。

しかし、画像生成システムの場合は異なるように見えます。
アーティスト、画家、イラストレーター、グラフィックデザイナー、写真家は、知らぬ間に、これらのシステムが動作するために必要なデータベースを構成するコンテンツの上流のクリエイターであり、ユーザーではありません。

画像生成システムのユーザーは、デジタルカメラのユーザーと同様に、もはや単なる愛好家や画像の専門家ではありません。興味、スキル、時間の不足などの理由から、画像生成ツールの登場以前には視覚的な世界やデザイン、オブジェクト、建築、風景の作成を考えたことがなかった多くの人々が利用しています。

例は数多くあります。
ロゴを探している企業経営者は、もはやグラフィックデザイナーの専門知識に頼るのではなく、画像生成システムによって生成された提案の中からロゴを選びます。
広告代理店のアートディレクターは、広告キャンペーン用のビジュアルを作成するためにアーティストを雇わず、自分でビジュアルを生成します。
さらに、多くの個人がアーティストやデザイナーとして新たに自己定義し、Porter Art Guildのような芸術作品や、Futuristic Decorsのような家具をAIによって完全に生成して販売しています。
Jonas PetersonやPolina Kostandaのようなアートディレクター志望者はこれまでになく多くなっています。
AIによって完全に書かれ、イラストが描かれたウェブページの増加は驚異的です。掃除会社のÉcolavageは架空の掃除機を比較するページを作成し、旅行代理店のX Holidaysは偽の理想的な家を特集するInstagramアカウントを作成しています。
個人がAI生成画像をインターネットに大量に投稿し、Tシャツ (Nordikido) やマグカップ (IllustNation) を販売しようとしています。

テキスト生成システムのユーザーは、認知スキルを外注しており、このスキルの喪失のリスクがあります。特に、これらのスキルをまだ完全に習得していない若い学習者の場合、この喪失はさらに深刻です。しかし、画像生成システムのユーザーの場合、このようなリスクはありません。なぜなら、彼らはそもそも創造的スキルを持たないため、それを失う危険がないからです。

画像生成システムのユーザーは、これらのシステムがテキスト要求に基づいて生成する画像に対して批判的な視点を持つことも少ないです。生成された画像は本当に独創的なのでしょうか？それはどのような意味や影響を持っているのでしょうか？既存の作品との特別な関係を維持していますか？それは美術史の特定の時代を参照していますか？生成画像の見た目のグラフィック品質は、これらの疑問をしばしば覆い隠します。

クリエイター vs. 消費者

AI支援による画像生成システムが2022年に一般公開されて以来、画像の生産は指数関数的に増加しています。
AI画像生成ツールやソーシャルメディアは、生成および共有される画像の量に関するデータを提供していませんが、それでもその量は数十億枚と推定されています。

なぜこれほど多くの画像が作られるのでしょうか？

AI生成画像を制作する容易さや、インターネット上で簡単に拡散されること、そして博物館やジャーナルのような制度的な認知を必要としないことが重要な要因であることは間違いありません。
デジタル写真と同様に、私たちは単に可能だからという理由で画像を生成します。

しかし、個人的または専門的な目的での使用の容易さや、これらの画像の見た目の芸術的品質への魅力を超えて、その生産方法そのものが主な動機のようです。
デジタル写真と異なり、もはや伝統的な意味で画像を作成するのではなく、アルゴリズムへのテキスト要求の形で画像を依頼するのです。
AI生成画像の生産モードは、消費の一形態として機能しているようです。

私たちはキーワードや視覚的参照をアルゴリズムに提供し、正確な結果がわからないまま、それが満足する結果になるまで繰り返しこれらのキーワードを修正します。
私たちの消費社会は、満足を得る喜びに慣れ親しんでいます。
消費者の喜びが、AI生成画像の制作の背後にある動機の1つである可能性はないでしょうか？

創造の感覚

AI画像のプロデューサーは、この消費行動を創造の行為として解釈する傾向があります。
使用される言語は、これらの画像を創造物として取り込むことを明示的に反映しています。
たとえば：「これが私が作ったものを見てください」、「これは私の作品です」、「私は自分の画像を作るために多くのテストとキーワードの組み合わせを試しました」など。
「このツールを使えば、私たちは自分たちのイラストを3倍速く描くことができます！」
また、スキルを習得したという感覚もあります：「自分が望むものを得るためのプロンプトの使い方を知っています」。
視聴者の言葉も同様に示唆的です：「あなたの作品が大好きです」、「あなたは私のお気に入りのアーティストです」など。

しかし、制作モードの違いから、AI生成表現は従来の視覚表現（デジタル写真を含む）とは異なり、すべての参加者—視聴者とプロデューサー—が単なる消費者になるだけではないかと主張することができます。AIサービスのサブスクリプションなどの金銭的対価と引き換えに、画像を消費することで私たちの欲望が満たされます。

AI生成画像に関する著作権法が不十分に定義されているため、クリエイターとしての地位の主張は問題を引き起こします。著者は誰でしょうか？テキストプロンプトを作成するユーザーでしょうか？システムやアルゴリズムの開発者でしょうか？AIシステムを訓練し画像を生成するために使用されたアーティストでしょうか？
アメリカのような多くの国では、人工知能によって作成された作品は、重大な人的貢献がない限り、著作権保護を受けることができないと明示しています。

例えば、アメリカ著作権局は2023年3月に発表した人工知能によって生成された素材を含む作品の登録に関するガイドラインの中で、「ランダムまたは自動的に動作する機械や単なる機械的プロセスによって生成された作品」は登録しないと規定しました。しかし、「伝統的な著作要素（構図、色や形の選択など）が人間によって実際に考案され、実行された場合」に限り、コンピュータが単なる助手として機能する作品を登録します。
したがって、画像を自動生成する際に使用されるテキストプロンプトの品質は、著作権の概念を定義する上で重要になります。画像生成システムはユーザーのテキストプロンプトを公開することで、「創造的貢献」を評価しやすくしています。
MidJourneyからのテキストプロンプトの例には、「光る翼を持つ魔法の昆虫の群れ」、「ぼやけた背景の川岸の小さな木」、および「ディスコ侍ロボット、公式王室肖像」などが存在します。これらのテキストに特別な創造性は感じられません。これらの画像はパブリックドメインに該当して然るべきでしょう。

第7のデジタル大陸への道？

物理的な商品の過剰消費が汚染を引き起こすように、画像の消費もまた汚染を引き起こします。

私たちの物理的な世界を劣化させる物質的汚染があります。AI生成システムの運用に必要なインフラの生産と運用には、コバルトやリチウムなどの希少金属を含む多大な資源が必要であり、サーバー冷却のための膨大な量の電力と水を消費します。

私たちの想像力を変化させる視覚的汚染があります。生成された架空の画像は、一見独創的で驚くべきものですが、私たちを圧倒し、精神を飽和させます。
生成的AIシステムは、独特の画像に対する興味をますます失わせるのでしょうか？
AIアルゴリズムに依頼されるテーマや主題の選択は、重要な役割を果たします。
壮大な自然環境の中にある孤立した住居のような、かつて驚きをもたらした非凡で詩的な画像が、毎日AIによって生成される何千もの類似画像に直面すると、平凡でありふれたものになります。
カメラによって不意を突かれた野生動物の鮮烈で感情的な表情は、もはや私たちを驚かせたり感動させたりしません。

リスが花の香りを嗅ぐ © 2019 Dick van Duijn

2019年にDick van Duijnが撮影したリスの写真。
目を閉じて喜びに満ちた表情でリスが花の香りを嗅ぎ、その後かじる瞬間を捉えています。

リスが花の香りを嗅ぐ 2024 パブリックドメイン

MidJourneyが2024年12月にChristopheとOlivier Defayeのプロンプトに基づいて生成したリスのAI画像。
MidJourneyは以下のプロンプトを使用してこの画像を生成しました：「リスが目を閉じ、黄色い花の香りを嗅ぐ」。

リスたちが花の香りを嗅ぐ 2024 パブリックドメイン

MidJourneyが2024年12月にChristopheとOlivier Defayeのプロンプトに基づいて生成した複数のリスのAI画像。
MidJourneyは以下のプロンプトを使って無限に画像を生成します：「リスが目を閉じ、黄色い花の香りを嗅ぐ」。

さらに、画像生成システムの確率的な機能により、非典型的な組み合わせが避けられ、最も一般的なものが優先されます。得られる結果は一見独創的に見えますが、平均的なものへと収束します。
独創性は予測可能で、均質でありふれたものとなります。

AI生成画像の過剰消費は、異常なものを平凡化し、私たちを神秘や唯一無二のものに対して鈍感にします。
私たちはもう驚くことはなくなるのでしょうか？

私たちが望まなかった画像

他の視覚表現とは異なり、AI画像生成のランダムなモードは、結果が私たちの期待に正確には一致しないことを意味します。生成された画像は、私たちが心に描いていたものとは異なるために驚きをもたらしますが、その見た目の独創性やグラフィック品質が、それを使用し共有する誘惑となります。
「私が望んでいたものではないけど、まあ、悪くないよね？」

浄化は可能か？

地球をきれいにすることは難しいように思えますが、希望は残されています：エネルギー転換、廃棄物管理、リサイクル、再植林、海洋や土壌の修復、環境意識、責任ある消費。
私たちの想像力を浄化することは可能でしょうか？
「偽のリアル写真」が私たちの想像力に侵入しています。画像の真実性に対する疑念は、習慣によって消え去ります。私たちの心は離れ、新しい現実をアルゴリズムによって生成されたものとして受け入れます。それは私たちを視覚表現の詩情から奪い去ります。その影響はすでに不可逆的なのでしょうか？
再び画像が私たちに夢を見させることはあるのでしょうか？

小さな希望の光

AI画像生成は、私たちの想像力を汚染し、驚嘆する能力を奪うまでに至るのでしょうか？
それとも、逆に、楽観的な視点から見て、架空の異世界の増殖と想像力の汚染の拡大が—現実の商品と地球の汚染の増加と同様に—普通のものの美しさをより敏感に、慎重に、注意深く見つめることを促すのでしょうか？

AI生成画像の飽和状態は、結果ではなく、実際の体験に焦点を当てるよう導くのでしょうか？バーチャルの世界から抜け出し、再びこの世界に物理的かつ詩的に生きることを可能にするのでしょうか？