アメリカ最大の暗号取引所が、中国のAIモデルに静かに切り替え、半分のコストを節約した。

核心的な視点

おすすめの読書

2026-07-04 00:05:29

コレクション

CoinbaseのCEOは公に述べた：会社のAIは全面的に中国のモデルに切り替え、支出は半分に削減され、使用量は逆に倍増している。SnowflakeやLindyも同様のことを行っている——静かに「AIモデルの移行潮」が起こっている。

著者：AI 上手ノート

シリコンバレーを揺るがすデータ

最近、アメリカ最大の暗号通貨取引所 Coinbase の CEO ブライアン・アームストロングが言った一言が、テクノロジー界を騒がせました：

「私たちは AI モデルを中国の GLM 5.2 と Kimi 2.7 に切り替え、AI 支出を半分に削減しました。」

半分に削減？それなら使用量も減ったのでは？

正反対です。Coinbase のトークン使用量は常に増加しています。

お金を節約しながらも、より多く使うことが、OpenAI と Anthropic を本当に悩ませているのです。

どうやって実現したのか？三つの節約戦略

Coinbase は単に安いモデルに切り替えただけではありません。彼らは完全な「節約システム」を構築しました：

第一の戦略：一つのモデルに縛られず、システムが自動で選ぶ

Coinbase は自動ルーティングシステムを構築しました。リクエストが来るたびに、システムはタスクの種類、価格、キャッシュの状況に基づいて最も適切なモデルを自動的に選択します。

すべてのタスクが最も高価なモデルを必要とするわけではありません。簡単な翻訳には安いモデルを、複雑な推論には良いモデルを------まるで、スポーツカーで買い物に行かないのと同じです。

第二の戦略：キャッシュヒット率を 5% から 60% に引き上げる

これは最も厳しい戦略です。キャッシュ戦略を最適化することで、Coinbase はキャッシュヒット率を 5% から 60% に引き上げました。

簡単に言えば、60% のリクエストは以前の計算結果を再利用でき、各呼び出しの実際のコストを大幅に削減しました。この最適化だけで、大きな費用を節約しました。

第三の戦略：コンテキストエンジニアリング

Coinbase は開発者にコンテキストを簡素化するよう求め、新しいタスクには新しいセッションを開き、1つの対話に多くの情報を詰め込まないようにしています。

これは怠けではなく、新しい学問です------業界ではコンテキストエンジニアリングと呼ばれています。Anthropic は技術ブログの中で明確に指摘しています：AI エージェントを管理する際、コンテキストエンジニアリングはプロンプトエンジニアリングよりも効果的です。

簡単に言えば：AI をより賢くするのではなく、AI により正確な情報を提供するのです。

▲ ますます多くの企業が AI モデルに対してコストを厳しく管理し始めています

Coinbase だけではない、これは潮流です

Coinbase は最初の試みではありません。

Lindy、わずか 25 人の AI スタートアップの CEO フロ・クリヴェロは、Claude をすべて Deepseek に切り替えました。彼は CNBC にこう語りました：「AI コストは人件費を超え、持続可能ではありません。」モデルを切り替えた後、コストは「急激に減少」し、数百万ドルを節約しました。

Snowflake の CEO スリダー・ラマスワミは、103 のコーディングタスクで実測比較を行いました：GLM-5.2 は 66% を解決し、Claude Opus 4.7 は 67% を解決しました。差は？ほとんどありません。

しかし、価格差は実際に存在します：

価格比較（百万トークンあたり）

GLM-5.2：入力 $1.40 / 出力 $4.40
Claude Opus 4.7：入力 $5 / 出力 $25
GPT-5.5：入力 $5 / 出力 $30

出力価格は 5-7 倍の差があります。

安いものに良いものはない？結論を急がないで

ここまで読んで、あなたはこう思うかもしれません：こんなに安いのに、品質は同じですか？

正直に言うと、完全には同じではありませんが、差はあなたが考えるよりも小さいです。

Snowflake のテストでは、GLM-5.2 は特定のタスクで確かに安定性が不足していました------初回の成功率は 47.6% で、Opus の 53.7% よりも低かったです。また、GLM は時々「間違った方向に固執」します：あるタスクでは、24 分間で 411 回ツールを呼び出しましたが、失敗しました。Opus は 49 回の呼び出しで 9 分で解決しました。

しかし、ほとんどのタスクでは、両者の最終成功率はほぼ同じです。重要なのは：その数パーセントの安定性のために 5 倍の価格を支払うことをあなたは望むかどうか？

多くの企業にとって、答えはますます明確です：望まない。