アメリカ最大の暗号取引所が、中国のAIモデルに静かに切り替え、半分のコストを節約した。
著者:AI 上手ノート
シリコンバレーを揺るがすデータ
最近、アメリカ最大の暗号通貨取引所 Coinbase の CEO ブライアン・アームストロングが言った一言が、テクノロジー界を騒がせました:
「私たちは AI モデルを中国の GLM 5.2 と Kimi 2.7 に切り替え、AI 支出を半分に削減しました。」
半分に削減?それなら使用量も減ったのでは?
正反対です。Coinbase のトークン使用量は常に増加しています。
お金を節約しながらも、より多く使うことが、OpenAI と Anthropic を本当に悩ませているのです。
どうやって実現したのか?三つの節約戦略
Coinbase は単に安いモデルに切り替えただけではありません。彼らは完全な「節約システム」を構築しました:
第一の戦略:一つのモデルに縛られず、システムが自動で選ぶ
Coinbase は自動ルーティングシステムを構築しました。リクエストが来るたびに、システムはタスクの種類、価格、キャッシュの状況に基づいて最も適切なモデルを自動的に選択します。
すべてのタスクが最も高価なモデルを必要とするわけではありません。簡単な翻訳には安いモデルを、複雑な推論には良いモデルを------まるで、スポーツカーで買い物に行かないのと同じです。
第二の戦略:キャッシュヒット率を 5% から 60% に引き上げる
これは最も厳しい戦略です。キャッシュ戦略を最適化することで、Coinbase はキャッシュヒット率を 5% から 60% に引き上げました。
簡単に言えば、60% のリクエストは以前の計算結果を再利用でき、各呼び出しの実際のコストを大幅に削減しました。この最適化だけで、大きな費用を節約しました。
第三の戦略:コンテキストエンジニアリング
Coinbase は開発者にコンテキストを簡素化するよう求め、新しいタスクには新しいセッションを開き、1つの対話に多くの情報を詰め込まないようにしています。
これは怠けではなく、新しい学問です------業界ではコンテキストエンジニアリングと呼ばれています。Anthropic は技術ブログの中で明確に指摘しています:AI エージェントを管理する際、コンテキストエンジニアリングはプロンプトエンジニアリングよりも効果的です。
簡単に言えば:AI をより賢くするのではなく、AI により正確な情報を提供するのです。

▲ ますます多くの企業が AI モデルに対してコストを厳しく管理し始めています
Coinbase だけではない、これは潮流です
Coinbase は最初の試みではありません。
Lindy、わずか 25 人の AI スタートアップの CEO フロ・クリヴェロは、Claude をすべて Deepseek に切り替えました。彼は CNBC にこう語りました:「AI コストは人件費を超え、持続可能ではありません。」モデルを切り替えた後、コストは「急激に減少」し、数百万ドルを節約しました。
Snowflake の CEO スリダー・ラマスワミは、103 のコーディングタスクで実測比較を行いました:GLM-5.2 は 66% を解決し、Claude Opus 4.7 は 67% を解決しました。差は?ほとんどありません。
しかし、価格差は実際に存在します:
価格比較(百万トークンあたり)
- GLM-5.2:入力 $1.40 / 出力 $4.40
- Claude Opus 4.7:入力 $5 / 出力 $25
- GPT-5.5:入力 $5 / 出力 $30
出力価格は 5-7 倍の差があります。
安いものに良いものはない?結論を急がないで
ここまで読んで、あなたはこう思うかもしれません:こんなに安いのに、品質は同じですか?
正直に言うと、完全には同じではありませんが、差はあなたが考えるよりも小さいです。
Snowflake のテストでは、GLM-5.2 は特定のタスクで確かに安定性が不足していました------初回の成功率は 47.6% で、Opus の 53.7% よりも低かったです。また、GLM は時々「間違った方向に固執」します:あるタスクでは、24 分間で 411 回ツールを呼び出しましたが、失敗しました。Opus は 49 回の呼び出しで 9 分で解決しました。
しかし、ほとんどのタスクでは、両者の最終成功率はほぼ同じです。重要なのは:その数パーセントの安定性のために 5 倍の価格を支払うことをあなたは望むかどうか?
多くの企業にとって、答えはますます明確です:望まない。

▲ 中西部と西部の AI モデルの価格差が業界の構造を再構築しています
これは私たち一般人に何を意味するのか?
あなたはこう言うかもしれません:私は Coinbase ではないので、これらは私に何の関係があるのでしょうか?
実際、このトレンドはあなたが AI を使う方法に三つの直接的な示唆を与えます:
1. 一つのモデルだけを信じない
多くの人が AI を使う際、一つのモデルに固執します------ChatGPT か Claude のいずれか。しかし、プロのプレイヤーはもうそんなことはしません。異なるタスクには異なるモデルを使うことが、コストパフォーマンスの最も高い方法です。
日常の質問には安いモデルを、コーディングや分析には良いモデルを。食事の際、毎回ミシュランに行くことはないのと同じです。
2. キャッシュと再利用が節約の鍵
もしあなたが AI を使って似たようなことを頻繁に行うなら(例えば、毎週の週報を書く、毎日のノートを整理するなど)、キャッシュとテンプレートを活用することで消費を大幅に削減できます。
3. コンテキストを簡素化する = より良い結果
多くの人が AI と対話する際、すべての背景を詰め込みたがります。しかし、実際には、AI に少ないがより正確な情報を与える方が効果的です。新しいタスクには新しい対話を開き、AI に歴史的な記録の中から答えを見つけさせないでください。
より深い変化:AI の価格設定モデルが再構築されつつある
この「モデル移行の潮流」の背後には、AI 業界全体の価格設定ロジックの揺らぎがあります。
OpenAI と Anthropic の高評価は、「収入が持続的に急成長する」という仮定に基づいています。しかし、ますます多くの企業が Coinbase や Lindy のように、より安価な代替品に移行するなら、この仮定は成り立ちません。
報道によれば、OpenAI と Anthropic の間で価格戦争が始まっています。OpenAI が最近発表した GPT-5.6 シリーズでは、Terra モデルが GPT-5.5 の半分の価格で、Luna はさらに最低価格を打ち出しています。
ユーザーにとっては、これは良いニュースです。競争が激化するほど、価格は低下し、選択肢が増えます。
アメリカの大手企業が中国のモデルを使ってコストを削減し始めたことは、AI の競争がもはや実験室でのスコア競争ではなく、実際のコスト競争であることを示しています。同じことをより少ないお金で行えることが、本当の実力です。













