掃碼下載
BTC $60,698.05 +2.40%
ETH $1,561.13 +0.92%
BNB $574.28 +2.29%
XRP $1.08 +1.33%
SOL $62.07 -0.11%
TRX $0.3225 +0.83%
DOGE $0.0811 +2.05%
ADA $0.1574 +0.55%
BCH $214.25 +1.21%
LINK $7.34 +2.46%
HYPE $56.91 -1.08%
AAVE $60.60 +1.11%
SUI $0.7100 +4.59%
XLM $0.2063 +8.44%
ZEC $358.54 +13.23%
BTC $60,698.05 +2.40%
ETH $1,561.13 +0.92%
BNB $574.28 +2.29%
XRP $1.08 +1.33%
SOL $62.07 -0.11%
TRX $0.3225 +0.83%
DOGE $0.0811 +2.05%
ADA $0.1574 +0.55%
BCH $214.25 +1.21%
LINK $7.34 +2.46%
HYPE $56.91 -1.08%
AAVE $60.60 +1.11%
SUI $0.7100 +4.59%
XLM $0.2063 +8.44%
ZEC $358.54 +13.23%

Cyber、EigenLayer、Sentient、RootData 等聯合推出 Crypto AI Benchmark Alliance,樹立 Crypto AI 新標杆

Summary: 通過在真實任務中檢驗模型,CAIBA 為加密 AI 建立了統一、可復現的衡量標準,助力行業構建更可信的智能應用。
行業速遞
2025-06-04 10:47:27
收藏
通過在真實任務中檢驗模型,CAIBA 為加密 AI 建立了統一、可復現的衡量標準,助力行業構建更可信的智能應用。

Cyber、EigenLayer、Sentient 等 14 家區塊鏈與人工智慧項目方今日共同宣布成立 Crypto AI Benchmark Alliance(CAIBA)。這一開源、社區驅動的聯盟將致力於為加密行業的 AI 模型與智能體建立透明、可信的評測標準。

首批發起成員------Alchemy、Cyber、Dune、EigenLayer、Goldsky、IOSG、LazAI、Magic Newton、Metis、MyShell、OpenGradient、RootData、Sentient 與 Thirdweb------會一起合作貢獻數據集、工具與專業知識,共同搭建評測框架。每一套基準將包含任務、參考答案及評分腳本,並在 GitHub、Hugging Face 等平台以開放許可證(許可範圍允許時)發布。

隨著 AI 在加密領域的應用不斷擴張,從交易策略到研究助手無所不包,傳統 AI 基準已難以反映該行業的獨特需求。CAIBA 旨在彌補這一空白,推出面向加密場景的專業評測。

"透明而嚴格的測試至關重要,"Cyber 聯合創始人 Ryan Li 表示,"模型不僅要答對題,還必須可靠執行,讓用戶在決策時更有信心。"

聯盟首個成果 a Benchmark for Crypto AI Agents(CAIA) 現已上線,它從三大維度衡量 AI 能力:

  • 知識(Knowledge):精確回答協議、代幣等問題
  • 規劃(Planning):制定多步驟任務方案
  • 行動(Action):借助區塊瀏覽器和 API 完成操作

CAIA 覆蓋了代幣經濟學、鏈上分析、項目研究及交易流程等場景,評測對象包括 GPT-4o、Claude 4、Gemini 2.5、DeepSeek-R1 等通用大模型,以及多款加密原生模型。

通過在真實任務中檢驗模型,CAIBA 為加密 AI 建立了統一、可復現的衡量標準,助力行業構建更可信的智能應用。聯盟已在開發更多基準,並歡迎新成員加入。開發者、研究者和協議團隊可提交模型參與評測,或提出全新任務。


關於 Crypto AI Benchmark Alliance(CAIBA)

Crypto AI Benchmark Alliance 是一個社區治理的開放聯盟,專注於制定面向加密場景的 AI 評測標準。通過開放數據集、可復現任務與公共排行榜,CAIBA 為開發者、研究者和協議提供工具,衡量並改進區塊鏈應用中的 AI 系統。了解詳情,請訪問 caiba.ai

warnning 風險提示
app_icon
ChainCatcher 與創新者共建Web3世界