Robot Ventures パートナー:AI エージェント時代、チューリングテストは時代遅れになった
著者:Maddie P、Robot Ventures パートナー
編訳:胡韬、ChainCatcher
もう論文を読むのはやめましょう。最前線の分野は新しい段階に進化しているのに、あなたはまだ前の恋人の Instagram を更新するように arXiv を更新しています。
私も同じことをしていたので、わかります。6ヶ月間、私はさまざまなモデルのリリースに夢中でした。すべてのベンチマークをコレクションしました。GPT-4.5 プレビュー版など、すべて読みました。私が何を学んだか知っていますか?何も学びませんでした。私が得たものは何か?何もないよりも少ないものでした。私は間違いを犯した代償を払いました。
その間に、ある子供が3ヶ月前のモデルと Stripe API キーを使って得た収入は、私の「最前線の実装」よりも多く……私のすべての作品を合わせたよりも多かったのです。彼の AI がより賢いからではなく、彼の AI が直接お金にアクセスできるからです。
私が知っているすべての人工知能研究者は、今同じ悪夢に直面しています:彼らは5年間かけて神を作り上げたのに、神が存在するためにはクレジットカードと Apple の許可が必要だと気づいたのです。
モデルの戦争は終わりました。誰かが勝ったからではなく、勝ち負けがもはや重要ではなくなったからです。
情報の商業化の速度は、許可の商業化の速度よりも速い。
2023年、GPT-4 の価格は百万トークンあたり30ドルでした。しかし今、Gemini Flash Lite の価格はわずか0.08ドルです。わずか18ヶ月で、価格は贅沢品から朝のコーヒーよりも安いレベルにまで崩壊しました。
性能は収束しています。適当なベンチマークを選んでください:ARC、MMLU式試験、GPQA式ハードテスト、コード評価、結果は同じです。最前線の技術は進歩し続けていますが、トップモデル間の差は実際の生産環境に対して縮小しています。これは2015年のスマートフォン市場のように見えます。すべての製品が同じチップ、同じ画面、同じカメラを使用しています。唯一の本当の違いは、誰がキャリアの承認を得られるかです。
モデルはますます賢くなりますが、賢さの商業化の速度は、権限の開放の速度をはるかに上回っています。人工知能が何をできるかと、何を許可されているかのギャップはますます広がっており、その中には巨大な利益が潜んでいます。
死体
墓場には、完璧な人工知能を持ちながら何の許可も得られなかった会社が横たわっています。
私は、精度が人工速記者を上回る転写スタートアップが倒産するのを目の当たりにしました。倒産の理由は技術的な失敗ではなく、ユーザーを収益に変換できなかったからです。製品は素晴らしかったが、支払い手段が不足していたため、さようならとなりました。
別のチームは、本当にお金を稼げる AI トレーダーを開発しましたが、すべてのアプリストアに拒否されました。自主的な金融活動はコンプライアンスチームを不安にさせました。人の監視なしに資金を移動できる AI に対して、現在明確な承認オプションはありません。
これが本当にあなたを苦しめるジレンマです。顧客が支払う意志があっても、彼らはコストを厳しく見積もります。6ヶ月待てば、次世代製品が同じ機能を無料で提供できるのに、なぜスーパーコンピュータを買う必要があるのでしょうか?これはまるで1980年代のインテルの常套手段です。あなたの顧客は、単に権限の制約に阻まれているわけではありません;彼らはあなたが市場から撤退するのを待っています。商業化は底辺からあなたの価格権を侵食し、権限層は上から下へとあなたを圧迫しています。
この二つの圧力が重なり合っています。次の四半期のモデルはより安価になるため、あなたは生き残るために十分な料金を請求できません。コンプライアンスプロセスの進行速度は人の速度に依存しているため、支払いシステムを迅速に統合することもできません。あなたは二つの方向から圧迫されています。最終的な勝者は、鉄道を持っている者だけです。あなたが高い料金を請求しようが、今四半期に出荷しようが、彼らは通行料を徴収できます。彼らは常にお金を手に入れます。
企業は悪い人工知能で死ぬのではなく、優れた人工知能に閉じ込められて死ぬのです。一方では権限の制約、もう一方では商業化の圧力。この二重の挟撃こそが企業の成長を制約する戦略です。
権限スタック
現代の人工知能の価値創造は、権限の蓄積にあります。これはモデル自体が十分でないからではなく、自主権が制限されているからです。
自動運転車を考えてみてください。私たちは印象的なデモを持っていますが、ほとんどのシステムはまだ運転支援に過ぎません。人が関与しており、責任は外注され、現実世界はさまざまな極端な状況で満ちています。人工知能も同じ段階にあります。私たちは認知的には L2 レベルの自律性に達しましたが、経済的には L5 レベルの自律性には達していません。
レベル1 権限(アクセス): API を呼び出せますか?→ OpenAI = 思考権限;
レベル2 権限(コンプライアンス): ユーザーデータを保存できますか?→ AWS = 記憶権限;
レベル3 権限(収益): 支払いを処理できますか?→ Stripe = ユーザーに料金を請求する権限;
レベル4 権限(配布): ユーザーに届きますか?→ App Store = 発行権限;
レベル5 権限(資金): システムは信用、マージン、決済保証を得られますか?= 経済行動権限。
ほとんどの人工知能企業は、第三または第四レベルにとどまっています。彼らはサブスクリプションサービスを販売できますが、財務的に自給自足を実現できません。これがユーザーの転換率が急激に低下する理由です。権限が一つ増えるごとに、料金所が一つ増え、料金所は常に蓄積されます。たとえ卓越したモデルを持っていても、経済的な自律性を実現することはできません。
これが本当の鍵です:私たちに欠けているのは知性ではなく、経済的自律性です。主体が既定の制約条件の下で借入、決済、返済できない限り、人工知能の繁栄は、アプリ開発者からその生存権を与える権限層への富の移転に過ぎません。
なぜ代理人は囚人よりも高価なのか
ここに実験があります:あなたのエージェントは IQ 180 で、ブラウザとコマンドラインインターフェースにアクセスでき、任意の API を呼び出すことができます。しかし、彼にはお金がなく、借りることもできません。彼は何を構築できるでしょうか?
何もありません。
まるで才能ある従業員が、ドメイン名すら経費で落とせないかのようです;全体のビジネスプランを策定できるトレーダーが、12ドルのサーバーホスティング費用すら支払えないかのようです;完璧なアービトラージの機会を発見したトレーダーが、取引を実行できないかのようです;F1 レーシングカーが、道路のない世界にいるかのようです。
なぜ彼に会社のクレジットカードを直接渡さないのでしょうか?
クレジットカードの前提は、あなたがすでに存在していることです。あなたは社会保障番号、銀行口座、3年の信用履歴が必要です。あなたのエージェントには何もありません。彼には API キーしかありません。
たとえあなたが彼にカードを与えたとしても、それはまるで F1 レーサーに自転車を与えるようなものです。確かに動きますが、用途が間違っています。クレジットカードはリスクを負うことを制限します。彼らには日々の限度額、詐欺警報、人工的な審査があります。ブローカーは、30秒以内に完璧なアービトラージを実行するために100万ドルを必要とするかもしれません。Visa の詐欺部門に説明してみてください。そして、クレジットカードの設計は予測可能なリスクに基づいています。彼らはあなたの支出が一定のパターンに従うと仮定しています:食料品、ガソリン、時折の休暇。アンダーライターはこの分布モデルを構築できます。ブローカーの働き方は異なります。彼らは予測できないリスクを負う必要があります。スマートシステムの意義は、あなたが予想もしなかった機会を発見することにあります。まだ発見されていないビジネスチャンスのクレジットラインを事前に承認することは不可能です。
しかし、真の問題はそれだけではありません。クレジットカードは従業員がオフィス用品を購入するためのものであり、ブローカーは従業員ではありません。彼らは未来の収入を担保にして借入し、ロックされたポジションを利用し、市場の機会に応じて柔軟に信用規模を調整する必要があります。彼らが必要とするのは、彼らの思考速度に追いつくことができる資金です。
私たちはエージェントにさまざまなツールを提供しました:ブラウザ、ターミナル、API。勝利が近いと感じますか?しかし実際には、重要な経済活動には資金が必要です;そしてインフラは存在しません。なぜなら、金融システムは最初から人間のために設計されているからです。営業時間、さまざまな書類、誰かが責任を負わなければならず、コンプライアンス部門のブラッドは正午から午後2時まで昼食を取っています。
なぜ Crypto が答えなのか
エージェントは、機械の速度で運営でき、人工的な承認なしで予測不可能なリスクを負える資金を必要としています。このようなインフラは現在どこに存在しているのでしょうか?
それはチェーン上にあります。
これは Crypto のバズではなく、構造的な現実です。従来の金融は、設計の初めから人為的要素を含んでいます。これは欠陥ではなく、そのビジネスモデルの本質です。すべての承認、すべての審査、すべてのコンプライアンスチェックは、誰かの仕事、誰かの給与、誰かの昼休みを意味します。この摩擦自体が製品です。
Crypto は人為的要素を排除します。これは理念からではなく、技術的制約からです。スマートコントラクトは、実行されるか、実行されないかのいずれかです。監視者がチェックする必要も、詐欺防止部門に連絡する必要もありません。コードは午前3時と午後3時に実行される方法はまったく同じです。
さらに重要なのは、チェーン上の担保がアンダーライティングの問題を解決したことです。あなたは個人の信用履歴や雇用証明に依存して融資を行うのではなく、数学に依存します。担保は検証可能で流動性が高く、信頼を必要としません。担保として ETH を保有するエージェントは、ブラッドにその価値を証明する必要はありません。ETH はロックされており、プログラムを通じてアクセスできます。融資の発行、使用、返済は、単一の原子取引で完了できます。
これが重要な点です。Crypto がクールだからではなく(確かにクールですが)、暗号通貨は、トレーダーが事前に許可を得ることなく金融リスクを負うことを許可する唯一のインフラです。トレーダーはロックされたポジションを利用して借入し、ミリ秒で取引を完了し、仲介者なしで決済できます。インフラはすでに存在していますが、このアプリケーションシナリオに最適化されていないだけです……スプリンターの登場まで。
スプリンター(私たちが構築しているもの)
昨年、私はステーキングされたイーサリアム(ETH)を使用して借入を試み、このことをマイケル・シエリに伝えました。3週間後、私はトラディショナルファイナンス社のブラッドと4回目の電話会議を行いました。
ブラッドは私の投資目標を知りたがりました。ブラッドは私の雇用証明が必要でした。ブラッドは暗号通貨のボラティリティを心配していました。ブラッドは昼食に行きました。
私のイーサリアムはそこにありました。改ざん不可能。検証可能。継続的に利益を生み出しています。そして私は心地よいジャズを聴いている一方で、ブラッドは「彼の上司に確認している」状態でした。
その時、私は理解しました:全体の信用システムはブラッドが一手に計画したものでした。何百人ものブラッドが、互いに書類を渡し合い、ブラッドの時間料金を請求していました。
スプリンターはブラッドを排除しました。
スプリンターはプログラム可能な信用エンジンです。あなたはチェーン上で検証可能な担保を使用して消費可能なステーブルコインを借りることができ、担保を売却する必要はありません。信用限度は制限されています:資金は無料のウォレットに直接入ることはなく、承認されたルートを通じてのみ使用でき、返済は優先的に差し引かれます。私たちはまず消費者向けのクレジットカードを配布チャネルとして立ち上げ、その後 SDK をリリースして、アプリケーションやエージェントが厳しい制約の下で短期信用限度を申請できるようにします。信用限度は API の形式で提供されます。ルールに基づくアンダーライティングメカニズム。ブラッドの関与は不要です。
人間に限ったことではありません。人間は始まりに過ぎません。私たちは、午前3時に借入を行い、価格が急騰する前に計算リソースを借りる必要がある機械のためのシステムも構築しています。私たちは、ロックされたポジションを担保にして借入を行い、30秒のアービトラージを実行する必要があるエージェントのためのシステムも構築しています。私たちは、労働日ではなくミリ秒単位での融資を必要とするプロトコルのためのシステムも構築しています。
他の企業は、人間のために人工知能を開発しています。しかし私たちは、資金を使って人間と人工知能のために製品を開発しています。
この違いは微細に聞こえるかもしれませんが、その影響は経済の構造を再形成するでしょう。
真に破壊的なものは何か?
政策は終止符です。一通の規制文書が、すべてを台無しにすることができます。私は、完璧なチームが48時間以内に崩壊するのを目の当たりにしました。ワシントンの誰かが彼らの使用シーンを発見したからです。
決済プロセスは政治問題に変わります。あなたは二つの経済システムを見ることになるでしょう:一つは従順なドルが銀行でゆっくりと流通し、もう一つはプログラム可能なドルが光の速さで流れるものです。両者の間のギャップは偶然ではなく、完全な産業です。
ステーブルコインの償還は、ユーザー体験の良い銀行の取り付け騒ぎのようなものです。人工知能経済全体のバランスは、ステーブルコインが安定していることに基づいています。一度でも(もしではなく)ステーブルコインが変動すれば、全体の経済システムに影響を及ぼします。もちろん、リスクが「ブロックチェーンのスループット」であると仮定しておきましょう。
終局
誰かが3年前のモデルを使って10億ドルの価値のある会社を作るでしょう。これは、これらのモデル自体がどれほど優れているかではなく、彼らが未選別の資金を利用して深く考えられた賢明なリスク投資を行う方法を見つけたからです。
ステーブルコインは堕落性から切り離されています。取引量はデリバティブから実際の取引に移行しています。トレーダーは計算、データ、推論に対して支払っています。
ある大国がパニックに陥ります。「未承認の自主経済活動。」これが見出しになります。市場は暴落します。私はポップコーンを食べながら見物します。
企業の評価倍率は、人工知能の質ではなく、API アクセス権に基づいていることが多いです。銀行関係はモデルパラメータよりも価値があります。
「2ドル」の経済時代が到来しました。従来のドルは人間の速度で銀行を流通し、プログラム可能なドルはチェーン上で即時決済されます。両者の間のアービトラージが真のゲームとなります。
もしこれが起こらなければ、私の以前のすべての判断は間違っていたことになります。
しかし、私は間違っていませんでした。証拠はここにあります。推論コストは99%低下しました。すべてのモデルは同じベンチマークに向かっています。完璧な人工知能を持ちながら許可を必要としない企業はすべて倒産しました。ブラッドは今でも毎日正午から午後2時まで昼食を取っています。
もし私が間違っていたら?
もしかしたら GPT-7 は非常に賢く、権限の問題はまったく重要ではないかもしれません。もしかしたらブラッドは電子メールの使い方を学ぶかもしれません。
しかし、そうならないかもしれません。
情報の商業化の速度は、権限の普及速度をはるかに上回っています。配布チャネルは依然として制限されています。権限は依然として貴重です。
誰もが参加していた AI 投資ゲームは終わりました。ゲームが失敗したのではなく、あまりにも成功しすぎて無価値になったからです。最も賢いモデルに投資し、最良の RAG(赤黄緑青緑)モデルを構築し、推論を最適化することは、もはや重要ではありません。
新しいゲームのルールは、権限の蓄積、コントロール面、経済軌道です。
勝者は最良の人工知能を持つ者ではなく、既知の情報を活用して行動できる人工知能を持つ者です。
これは悲観的ではありません。インターネット、モバイル、クラウドコンピューティングの発展モデルはすべて同じです。技術が商業化され、鉄道システムが価値を生み出します。
真の試練
チューリングテストが提起する問題は:機械は私たちに人間であると信じさせることができるか?
私たちが問うべきは:機械はブラッドと取引を行い、彼のすべてのお金を勝ち取ることができるか?
最初の質問の答えは肯定的です。
二番目の質問の答えが、あなたの人工知能スタートアップが間もなく失敗する理由です。
ディーラーは常に勝者です。そしてディーラーはブラッドであり、彼はコンプライアンス部門に座り、退屈なデスクサラダを食べながら、あなたの API リクエストを拒否する準備をしています。
未来は誰もが平等ではありません。それはまだブラッドの受信トレイに留まっています。














