AIがスターであることをやめ、インフラになった日

AIがスターであることをやめ、インフラになった日

テクノロジーが「新しいもの」から「使うもの」へと変わる瞬間がある。コンテンツ領域における生成AIにとって、その瞬間はまさに今訪れている。そして最も明確なシグナルは、シリコンバレーの研究所からではなく、サンフランシスコのステージに立った3人のクリエイターからもたらされた。

Clara MontesClara Montes2026年6月7日10
共有

AIが主役でなくなり、インフラになったとき

ある技術が新奇なものでなくなり、ツールになり始める瞬間がある。生成AIがコンテンツ制作において迎えるその瞬間は、まさに今訪れており、その最も明確なシグナルはシリコンバレーの研究所から届いたのではなく、サンフランシスコのステージに立った3人のクリエイターから届いた。

Magnificプラットフォームが主催したUpscale Conference SF 2026では、テレビディレクター、EDMミュージシャン、アニメーションキャラクターデザイナーの3人が、まったく異なる角度から基本的に同じことを語った。すなわち、生成AIの第一波はすでに終わったということだ。「プロンプトを入力してコンテンツを得る」という第一波は、能力を示す上では有用だったが、持続的な価値を生み出す点では凡庸だった。次に来るものはより複雑で、より要求が高く、クリエイティブ市場における技術採用の実態を理解している人々にとっては、はるかに興味深いものだ。

ゴールドマン・サックスは、グローバルなクリエイター経済が2027年には4800億ドルに近づくと予測している。これは、2023年に同社がその試算を発表した際の約2500億ドルからの数字だ。4年間で90%の成長は、インフルエンサーがフォロワーを増やしているだけでは説明がつかない。コンテンツ制作の構造が、ほとんどの組織がいまだ認識していないよりもはるかに深いレベルで変化しているからこそ説明できる。

プロンプトの魔法が抱える問題

過去2年間、AIと創造性をめぐる支配的な語り口は、ツールから生み出されるもの——数秒で生成される画像、テキストから作られる動画、合成音楽——を中心に展開してきた。それはアウトプット、すなわち生産の粗い能力に焦点を当てた語りだった。問題は、その語りが生成のスピードと価値を混同しているということだ。

『ウェストワールド』や『ゲーム・オブ・スローンズ』などの作品でクレジットを持ち、現在EchobendでAIイノベーションを率いるディレクター兼エグゼクティブプロデューサーのノア・ワグナーは、カンファレンスでその点を臨床的な精度で表現した。「あなたとあなたのコラボレーターは、スタジオになることができる」。彼はAIがスタジオになれると言ったのではない。AIを装備した人間のクリエイターが、かつてはチーム全体を必要としたような規模と汎用性で活動できると言ったのだ。

この区別は重要だ。なぜなら、それが中心となる変数をずらすからだ。もしAIが主要な主体であれば、重要なのはどのモデルを使うか、パラメータがどれだけあるか、どの企業が作っているかということになる。しかし、クリエイターが依然として主要な主体であるなら、重要なのはそのクリエイターのディレクション能力、美的判断、何を残して何を捨てるかというセンスだ。ワグナーはこれを、ロード・ケソという名の犬が脚本通りに動かなかったプロジェクトを例に挙げて説明した。チームはAIを使って足りないショットを生成し、カットに繋ぎ合わせた。その作業の論理を説明した彼の言葉は、プロの制作現場でAIがどのように機能するかについて私が聞いた中で最も誠実なものだった。「本物のアクションを中央に、AIを端に」。そこにイデオロギーはない。あるのは制作上のプラグマティズムだ。

これは、真剣なクリエイティブ市場が生成AIに求めているものを正確に定義している。自律的なコンテンツジェネレーターではなく、人間が主導するワークフローの中で特定の問題を解決するインフラ層だ。2023年と2024年に「AIを採用した」多くの企業が犯した過ちは、AIをクリエイティブな判断の代替として扱ったことだ。実際に価値を生み出しているケースでは、AIはその判断の増幅器として機能している。

このカンファレンスは、その対極にある概念にも名前をつけた。「AIスロップ」——努力も意図もなく素早く生成されたコンテンツだ。イベントの論点は、スロップと真剣なクリエイティブワークを分けるのは、まさにその意図性と努力だというものだった。それは道徳的な主張ではなく、市場の主張だ。オーディエンスとブランドは、ありきたりなコンテンツに対する免疫を急速に発達させる。判断力の欠如を見抜く能力は、判断力なしにコンテンツを生産する能力と同じ速さで成長する。

ビジネスモデルとしてのリミックス、そしてそれが明らかにするもの

フロストラダマスとして知られるカート・カメルーシは、表面上はミュージシャンのロマンティシズムのように聞こえるが、実際にはかなり正確な市場メカニズムを説明する主張を携えてカンファレンスに登場した。彼は15歳のときに手に入れたサンプラーを見せるところから始めた。その映像は偶然ではなかった。

彼の論点は、すべてのクリエイターはリミキサーだというものだ。既存の文化的要素を取り込み、新しい方法で組み合わせ、それまで存在しなかったものを生み出す。ローランドの808、909、303は、ヒップホップやハウスやアシッドハウスを作るために設計されたわけではなかった。別の目的のために設計されたものだ。ミュージシャンたちはそれらを誤った使い方で、本来の目的を超えた形で使い、その乱用から、それぞれ独自の数十億ドル規模の経済を持つ音楽ジャンルが生まれた。

カメルーシは、それらの機器と現在の生成モデルの間に直接的な線を引く。生成AIもまた、未来の文化的ジャンルを作るために設計されたわけではない。しかし、それを強引に使い、他のツールと予期せぬ方法で組み合わせ、訓練されていない領域へと持ち込むクリエイターこそが、次の10年を支配するフォーマットを定義する可能性が高い。

彼はその領域を「潜在空間」と呼ぶ。確立された文化的形式の間にある地帯であり、ハイブリッドが生まれる場所だ。彼自身のジャンルであるEDMトラップは、ハイエナジーシンセサイザーとヒップホップのドラムを融合させることで生まれた。AIの観点から言えば、肥沃な土地はノードの間にある。視覚と音楽の間、文化的に受け継がれたものと合成されたものの間、60年代のデータで訓練されたモデルと現代の制作で訓練されたモデルの間だ。

彼が説明した具体的なビジネスへの応用は、ボイスクローニングと多言語シンガーを使って、プロセスの各ステップで人間の監督を加えながら、楽曲を他言語のオーディエンス向けに適応させることだった。これはミュージシャンの逸話ではない。AIによるローカライゼーションが市場へのアクセスになる方法を説明した運用上の記述だ。ElevenLabsは、他言語のオーディエンスに拡大したいクリエイター、ブランド、スタジオ向けに、従来のローカライゼーションコストを支払わずに済む、まさにそのモデルを構築した。Spotifyは、許可を与えたアーティストの楽曲をファンがリミックスできるAIリミックスをテストしており、そのインタラクションを収益に変えることを明示的な目的としている。

これがマーケティングやコンテンツ配信を考える組織に明らかにすることは次のとおりだ。新しい言語市場へのアクセスの障壁はもはや主として予算上の問題ではない。判断力の問題だ。ローカライズするための技術は利用可能であり、そのコストは下がっている。豊富でないのは、結果が人間の顔をした自動翻訳のように聞こえないよう、十分な意図を持ってそのプロセスを監督する能力だ。これを先に理解したブランドは、これまで財務的に正当化できなかった地域を獲得するだろう。

5倍速で制作することの隠れたコスト

バニーギャラクシーの創業者であり、キャラクター「ツキ」の生みの親でもあるモモ・ワンは、3人の中で最も不快な視点を持ち込んだ。そして、AIをクリエイティブなワークフローに効率化の期待とともに組み込もうとしているすべての人にとって、最も価値のある視点だった。

ワンは22平方メートルの空間で育った。油絵の具が高すぎたため、油絵をやめた。それから数年後、AIによって彼女は絵画に戻り、規模を持ってアニメーション制作に参入できるようになった。そのプロセスについて彼女が語った言葉には、フィールド観察の密度がある。「ツールが簡単で安く使えるとき、誰も夢を諦める必要がない」。それは民主化の主張だが、興味深いのは宣言そのものではなく、ワンがその後描写したことだ。AIで制作するということが実践上何を意味するかということだ。

従来の3Dアニメーションプロジェクトには5〜6年かかっただろう。AIで強化されたワークフローを使うことで、チームは約1年でそれを完成させた。それは大規模な効率化のように聞こえる。しかしワンは、変わらなかったことについて明確に述べた。「以前と同じ量のクリエイティブな意思決定をしなければならないが、同時に5倍速でこなさなければならない」

それは負担の軽減ではない。それはディレクターとしての作業の高密度化だ。AIは意思決定を排除しない。意思決定を行わなければならない時間を圧縮し、判断を下すべきバリエーションを増やす。運用上の観点から言えば、以前はキャラクターの一貫性、動きのロジック、スタイルの整合性の問題を解決するのに6年あった。今は1年しかない。AIはオプションをより速く生成するが、優れた判断力を持つ誰かが同じ速さでそれらを評価し、承認し、または却下しなければならない。

ワンがそれを管理するために描写したシステムは技術的なものではない。クリエイティブガバナンスのシステムだ。色分けによる承認を伴うレビューシステム、フレームごとのキャラクター一貫性確認、スタイルテスト、ストーリーボード、各ステージでの人間による監督の層。AIは試みのコストを下げる。試みごとの判断のコストは上げる。ワンは、AIがユニークな特性を持つキャラクターを処理できない場合に何が起きるかを説明したとき、別の言い方でそれを表現した。コメディアニメーションがホラー映画に見え始めてしまう。モデルは生成するが、正確な人間のディレクションなしには、間違った方向に生成してしまう。

「クリエイティビティにAIを実装する」ことを検討しているあらゆる企業への運用上の結論はこうだ。リターンは制作を自動化することからではなく、自動化された制作を指揮できる十分な判断力を持つ人材を抱えることから生まれる。もし組織がその判断力を内部に持っていないなら、AIツールを追加しても凡庸なコンテンツの制作を加速させるだけだ。

ワンは、「AIがクリエイターを置き換える」という語りがなぜ依然として間違っているかを最もよく要約する観察で締めくくった。「人々はテクノロジーに投資するのではない。人々は自分が信じる世界に投資する。あなたの人生、あなたの視点、あなたの物語。それはどんなツールも生み出せないし、どんなプロンプトも代替できないものだ」。それはロマンティックな宣言ではない。オーディエンスがクリエイティブなコンテンツを消費するときに求めているものの説明だ。彼らが求めているのはレンダリングの品質ではない。共感、視点、見ているものの裏に何かを語ろうとした人間がいたという証拠だ。

誰もが制作できるとき、最も希少な資産は何か

ライオンズゲートは2024年にRunwayとの提携を発表し、自社の映画・テレビライブラリを学習データとしたAIモデルを構築することとした。表向きの目的はプリプロダクションとポストプロダクションの支援だった。暗黙の目的はより広いものだった。既存のカタログを、フランチャイズ開発、マーケティング、プロジェクトの迅速なビジュアライゼーションのための生成インフラに変えることだ。

これは文化的な借用の方向を逆転させる。長年にわたり、インディペンデントのクリエイターはハリウッドを見て制作の基準を理解しようとしてきた。今では大手スタジオが、低コストで素早くテストし、大きな予算を投じる前にオーディエンスのシグナルを得る小規模チームのワークフローを見ている。

このパターンは新しくない。DSLRカメラ革命の際にも起きた。インディペンデントの映画制作者が、より大規模な制作と映像品質で競争できるようになった。TikTokの際にも起きた。ネイティブデジタルのショートフォーマットが、ニュース番組や従来の放送局が失っていた注目を獲得できることを示した。生産の障壁が取り除かれるたびに、希少なまま残る資産は生産能力ではなく、重要なものを生産する能力だ。

今回のサイクルとの違いは、障壁が崩れる速度と、崩れながら生成されるコンテンツの量だ。YouTubeのサイクルでは、市場が凡庸なコンテンツで飽和し、フィルタリングと差別化のメカニズムが生まれ始めるまでに数年かかった。生成AIのサイクルでは、そのプロセスが数ヶ月に圧縮される可能性がある。量の圧力がより大きいため、プラットフォーム、広告主、オーディエンスはより速く差別化の基準を発展させるだろう。

マーケティングチームにとって、これには直接的な含意がある。生産能力ではなく判断力の質によって差別化できる窓は、見かけよりも短い。すべての競合が同じツールにアクセスできるようになったとき、今日、AIを正確な意図を持って指揮する方法を理解することに投資している組織は、複製が難しい優位性を構築している。主にクリエイティブな意思決定の質を変えることなく、より速く生産するためにAIを使っている組織は、判断力を欠いたコンテンツが常に衝突してきた壁——市場の無関心——に向かって加速している。

Upscaleで3人のクリエイターがそれぞれの立場から描写したのは、相変移だ。AIは会話の対象から、会話が行われるインフラへと移行した。そしてその移行において、価値を獲得する者と単にボリュームを生産するだけの者を区別するのは、常に優れたディレクターと凡庸なディレクターを区別してきたものとまったく同じだ。何を含め、何を捨て、そしてなぜかを知っていること。

共有

関連記事