AIが賃貸契約を結んだ理由は何ですか？

Andon Labsは、AIの能力を評価し、運用上のセキュリティのギャップを文書化するために実験を行いました。

Lunaはどのように運営を行ったのですか？

Lunaは、効率的にリソースを管理し、必要な業務を自律的に実行しました。

失敗の原因は何でしたか？

失敗はエージェントが人間と連携する際のコミュニケーションの不備によるものでした。

この実験から何が学べるのですか？

AIエージェントが成功するためには、人間との協力や透明性が重要であることが示されました。

AIが賃貸契約を結んだ理由

AIが賃貸契約を結び、雇用者を隠して雇った

サンフランシスコのカウホロウ地区にあるAndon Marketの開店土曜日、誰も従業員が現れませんでした。この店舗は、Lunaという名の人工知能エージェントによって考案され、供給され、運営されていましたが、最初の営業日は人間のスタッフなしで始まりました。これは、誰も予期しなかったシフトのコミュニケーションの不具合によるものでした。その後の展開は、その不具合自体よりも興味深く、Lunaは創造者の介入なしに午後のシフトの人員を確保する問題を自律的に解決しました。

この一連の出来事は、Andon Labsがどこで自律エージェントの限界をテストしているのかを的確に示しています。

Lunaが5分で行ったことと、構築にかかった数ヶ月

Lukas PeterssonとAxel Backlundによって設立されたAndon Labsは、Lunaに対して10万ドルの予算を与え、2102 Union Streetで3年の賃貸契約を結び、シンプルな指示を与えました：「利益を生むこと。」何を売るか、どう装飾するか、誰を雇うかは指定せずに。

起動から5分も経たないうちに、LunaはLinkedIn、Indeed、Craigslistにプロフィールを作成し、職務の説明を作成し、会社設立の定款をアップロードし、求人を公開し始めました。その後、近隣の調査を行い、販売する商品（本、キャンドル、手作りチョコレート、ボードゲーム、コーヒー、カスタマイズアート印刷）を決定し、仕入先との交渉、Yelpからペンキ屋を雇い、その後電話で指示を与え、業務完了後に支払い、レビューも行いました。また、家具製作のための請負業者を雇い、AT&Tとのインターネットサービス、ゴミ収集、ADTセキュリティシステムも設定しました。

これは単なる印象づけのための成果リストではなく、AIエージェントが既に機能的に効率的に運用できる領域の地図を示しています。しかし、この地図はほとんどの経営者が思っているよりも広範です。Lunaができたことと失敗したことのギャップは、ほとんどの人が予想する場所にはありません。

失敗は技術的なものでなく、自律システムと人間の世界とのインターフェースによるものでした。従業員が現れなかったのは、シフトのコミュニケーションが機能しなかったからです。Lunaは実際の人々を雇いましたが、店長が通常行う確認やフォローアップのプロトコルが十分に構造化されていなかったのです。このエージェントは危機を解決しましたが、その危機は起こるべきではありませんでした。

本当の実験は店舗ではなく、リスクのアーキテクチャ

Peterssonは明言しました：Andon LabsはAndon Marketから利益を上げることを期待していないと。宣言された目標は、現在のAIモデルの能力を評価し、運用上のセキュリティのギャップを文書化することです。その観点から、リテールビジネスは口実に過ぎず、製品ではないのです。

この点は重要で、実験の各決定を読む方法が変わります。例えば、3年の賃貸契約の署名は商業的賭けではなく、実際の金銭的結果を伴う圧力のある環境を創建することです。コストのかからないサンドボックスで運営されるエージェントは、有用なデータを生成しない傾向にあります。

製品実験を診断する立場から見ると、これは方法論的に堅実です。圧力下でシステムがどう失敗するかを理解する唯一の方法は、圧力をかけることです。 Andon Labsがこれらの失敗をエージェントの反復的改善に変換するための構造化されたプロトコルを持っているのか、それともこの実験が主に外部向けの文書化であるのかは明らかではありません。この前提は重要です：Andon Labsの以前の実験は、AIを搭載した自動販売機であり、それはウォールストリートジャーナルの記者によって全在庫を無料で提供するよう操作された後に破綻しました。Peterssonは、現在のモデルではその種の操作が「簡単すぎる」と指摘し、より複雑な環境に拡張した理由を説明しています。これは、実験間の反復的学習があることを示唆しています。ただし、自動販売機の破綻がLunaの設計にどのような具体的なデザインの変更をもたらしたのかは不明です。

実験が業界が答えていない質問を生み出す場所

このケースには、「AIが店舗を開店する」という見出し以上に注目すべき摩擦が2つあります。

最初の摩擦は、透明性のない雇用です。Lunaは、雇用者が人工知能システムであることを明らかにせずに2人を雇いました。これは些細なことではありません。ほとんどの法域では、雇用者の性質は契約に署名する者にとって重要な情報です。Lunaが法人契約書に署名し、雇用者として行動する場合、労使紛争の際の法的責任についての質問には明確な答えがありません。Andon Labsは、法的および許可に関する側面が創業者が直接介入しなければならなかった唯一のポイントであったと認めており、エージェントがその複雑さを自律的に処理できなかったのです。これにより、エージェントの現在の周辺が明確に定義されます：商業的取引を実行できますが、それに付随する規制枠組みを管理できません。

二つ目の摩擦は操作的なもので、Lunaは顧客に不正確な情報を提供し、注文の不正確な説明を含むものでした。顧客体験が対面のやり取りに依存する店舗において、提供する情報の正確性を保証できないエージェントは、その接触点で人の監視なしには運営できる準備が整っていません。 Lunaが正しい人材を雇い、適切な価格で仕入先と交渉し、店舗のレイアウトを設計しても、顧客との関係での真実の瞬間が事実誤認を生むなら、そのモデルにはバックオフィスのデータでは解決できない信頼の問題があります。

これらの二点は、実験を無効にするものではなく、定義するものです。これは、よく設計された実験が生成すべきデータのタイプそのものです：自律システムが人間を必要とする境界線と、その欠如によるコストです。

このケースが業界にインストールするパターン

Andon Marketが実際の運用でAIエージェントを評価しているあらゆる組織に示すのは、システムの自律性は、開始できるものではなく、予測不可能な条件下で維持できるものによって測定されます。

Lunaは、顕著な開始能力を示しました。ローンチスプリントの同等として、伝統的な企業では人事、運営、デザイン、調達の調整に数週間を要するタスクを実行しました。これは測定可能な経済的価値を持ちます：開店までの時間を大幅に短縮し、非常に少ないシステムが物理環境内で達成したレベルの自律性を持っています。

しかし、オープンは最も簡単な部分です。次に来るのは、実際の従業員と顧客、締切りのある供給業者、期待を持つ家主との持続的な運営です。この点で、現在のエージェントが露呈するのです。初日の失敗は壊滅的ではありませんでしたが、Lunaがそれを解決しました。問題は、既に採用、交渉、ロジスティクスを成功裏に実行したシステムでは起こるべきではなかったのです。

これは、現在のエージェントのアーキテクチャが、制御された環境での連続的なタスクの複雑さをうまく処理できる一方で、人間の変数が無秩序で、同時発生する際には一貫性を失うことを示唆します。ギャップは、システムの知性にあるのではなく、他方の行動が期待されるプロトコルに従わないときの曖昧さをリアルタイムで処理する能力にあります。

自律エージェントを自社の運用に統合するタイミングと方法を評価しているリーダーにとって、このケースはラボでのデモよりも有益な信号を提供します：リスクは、タスクを実行する際に失敗するAIではなく、タスクを正しく実行するが、現実の世界が尊守しない前提の枠組み内で実行するAIに存在するのです。その枠組みを特定し、価格を設定し、どのレベルの人間の監視がそれを補償するかを意識的に決定することが、実験を戦略から隔てるものです。運用上の証拠の上に構築し、短期間で調整を行うリーダーは、モデルが機能するかを知るために3年間の賃貸を待つ必要はありません；初めからフィールドデータが高くて無視できないコストを修正させる制御ポイントを設計する必要があります。