deAIプロトコルスタックの分解 - x402 / ERC 8004 / A2A
記事の著者:Jay Yu
記事の編纂:Block unicorn

前言
現在、私たちは去中心化人工知能(deAI)の「ネットワークプロトコルスタック」が徐々に構築されているのを目にしています。インターネットが一連の相互運用可能な標準の上で動作するように------トランスポート層は TCP/IP を使用し、サービス発見層は DNS を使用し、アプリケーションロジックは HTTP を使用する------deAI プロトコルスタックもこれらの三つのモジュールに分解できます:アプリケーション層は x402、サービス発見層は ERC 8004、トランスポート層は A2A------これらすべてが従来の HTTP ネットワークプロトコルスタックの上で動作しています。
要するに、deAI プロトコルスタックはエージェントがどのように費用を支払い、リソースを発見し、互いに通信するかを定義しています。さて、各部分を一つずつ分析していきましょう:

1. アプリケーション層 - x402
去中心化人工知能(deAI)プロトコルスタックの最上部は x402 であり、これはエージェント間でさまざまなサービス(例:ファイルストレージ、eコマース、ウェブスクレイピングなど)に対して支払いを行うためのアプリケーション層プロトコルを表しています。x402 は Coinbase と Cloudflare によって構築されており、元々の「HTTP 402:支払いが必要」というステータスコードを根本的に拡張し、エージェントがステーブルコインを使用してサービス料金を支払うことを可能にするワークフローの一部にしています。
私は以前、x402 に関する詳細な記事を書いたことがあり、そのタイトルは『HTTP 402 の現代的改造』で、ビジョン、アーキテクチャ、機会、課題について述べています。
根本的に、x402 は三者間プロトコルを通じて機能し、このプロトコルは三つの部分から成り立っています:クライアントがリソースを要求 → サーバーが 402 ステータスコードを返す → 支払い調整者(facilitator)がクライアントの支払い承認を検証し、実際に資金を移転する(例:署名付きトランザクションをチェーン上に提出)。これらのステップが完了した後、サーバーは高級コンテンツをアンロックします。

現在、x402scan は x402 サーバーの実際の運用状況を観察するための最良のリソースの一つかもしれません。長期的には、x402 は高品質なコンテンツのマイクロペイメント(例:ウェブスクレイピング、有料記事、計算リソース)に大いに貢献するでしょうが、その最近の台頭(x402scan で明確に見ることができます)は、主に一連のミームコイン(例:…$PING)に起因しています------これらのコインは、債券曲線に沿って鋳造するために x402 での支払いを要求します。
それにもかかわらず、x402 は新興の去中心化人工知能(deAI)プロトコルスタックにおけるアプリケーション層標準の良い例です。従来のネットワークプロトコルスタックの「アプリケーション層」が多数のプロトコル(HTTP、FTP、SMTP、VoIP など)を含むように、将来的にはさらに多くのアプリケーション層標準が登場することが期待されます。
2. 発見層 - ERC 8004
x402 を使用する際に、よく提起される質問は「人々はどのようにして利用可能なサービスを発見するのか?」です。これが、イーサリアム財団が主導して開発した ERC 8004 が「発見層」で機能する理由です。
DNS がドメイン名を IP アドレス(google.com → 8.8.8.8)にマッピングするのと同様に、ERC 8004 はチェーン上のレジストリを作成することで、エージェント ID をエージェントのさまざまなリンクや機能にマッピングし、AI エージェントの発見問題を解決します。ERC 8004 は「エージェントカード」をエージェントの身分証明として使用し、信用スコアや検証などの追加機能を提供します。

ERC 8004 の基盤は ERC721(NFT)と URIStorage を使用しています。これには、Name、A2A、MCP、OASF、ENS、DID などのパラメータが含まれ、サポートされる信頼タイプ(例:信用、暗号経済学、TEE 証明)も含まれています。これらの異なるパラメータは、さまざまなエージェント ID 標準を指し示し、エージェントの機能をより包括的に示します。
私は、ERC 8004 が deAI 発見層の発展の軌跡は、インターネットプロトコルスタックの DNS に似ていると考えています------すべての人が参照する全体的なプロトコルがあり、ユーザーはさまざまなピアノード(ここでは異なるエージェントカードのリンク)にリダイレクトされ、特定のクエリに関するより具体的な情報を取得します。
3. トランスポート層 - A2A プロトコル
ここまでで、アプリケーション層と発見層を紹介しました。プロトコルスタックの最後の部分はトランスポート層であり------これは、アプリケーションが ERC 8004 のようなプロトコルを通じて発見を完了した後、どのように相互に通信するかを処理します。従来のインターネットネットワークプロトコルスタックでは、TCP/IP プロトコルがネットワークデータパケットをクライアントからサーバーに転送する役割を担っています。一方、去中心化人工知能(deAI)プロトコルスタックでは、Google が最近発表した A2A プロトコルが、エージェント間の通信を実現するために特化されています。
クライアントエージェント(A2A クライアント)とリモートエージェント(A2A サーバー)は、HTTPS を介して JSON-RPC 2.0 を使用して通信します。本質的に、二つのエージェントはそれぞれの HTTP エンドポイントにアクセスすることで「対話」を行い、計算やさまざまな機能を要求します。A2A では、各エージェントがその機能、フレームワーク、MCP 添付ファイルなどの情報を公開するためのエージェントカードを持つことが規定されています。

A2A プロトコルでは、クライアントとリモートエージェントが相互に確認した後、クライアントはエージェントカードを参照して HTTP エンドポイントを取得し、対応するサービスを要求します。リモートエージェントはその MCP ツールや計算リソースを利用し、タスク処理の過程で非同期更新を送信します(推論モデルにおける「思考過程」に似ています)。最後に、最終的な応答と成果物を送信します。
ここで、IBM の『What is A2A protocol (Agent2Agent)?』という素晴らしい入門記事をお勧めします。
すべての要素を総合的に考慮すると……
x402、8004、A2A などの要素を考慮に入れると、Coinbase が提供するデモの例を参考にできます------Lowe's から新しい冷蔵庫を購入することを想定します。ユーザーがチャットボットと対話し、Lowe's から冷蔵庫を購入する方法を尋ねたとします:
私たちは ERC 8004(発見層)を使用して Lowe's の冷蔵庫販売エージェントを見つけ、そのエージェントの機能をリストアップするよう要求します。
私たちは A2A(トランスポート層)を使用して HTTP エンドポイントを介して Lowe's エージェントと通信します。
私たちは x402(アプリケーション層)を使用して支払い承認を処理し、チェーン上でステーブルコインを移転します。
もちろん、これらすべては従来の HTTP-DNS-TCP/IP ネットワークプロトコルスタック上で行われます!
総合的に見て、このスタックはエージェンティックインターネット(代理インターネット)のプロトコルバックボーンを構成し、エージェントがデータを転送するだけでなく、チェーン上のリソースと取引、検証、調整を行うことを可能にします。














