掃碼下載
BTC $69,050.21 +4.52%
ETH $2,061.06 +7.71%
BNB $616.19 +1.59%
XRP $1.42 +4.25%
SOL $84.42 +6.64%
TRX $0.2792 +0.83%
DOGE $0.0964 +5.42%
ADA $0.2728 +4.71%
BCH $546.58 +9.47%
LINK $8.86 +7.37%
HYPE $31.93 +6.36%
AAVE $118.50 +11.36%
SUI $0.9744 +7.78%
XLM $0.1654 +4.89%
ZEC $255.25 +10.47%
BTC $69,050.21 +4.52%
ETH $2,061.06 +7.71%
BNB $616.19 +1.59%
XRP $1.42 +4.25%
SOL $84.42 +6.64%
TRX $0.2792 +0.83%
DOGE $0.0964 +5.42%
ADA $0.2728 +4.71%
BCH $546.58 +9.47%
LINK $8.86 +7.37%
HYPE $31.93 +6.36%
AAVE $118.50 +11.36%
SUI $0.9744 +7.78%
XLM $0.1654 +4.89%
ZEC $255.25 +10.47%

Cyber、EigenLayer、Sentient、RootData 等聯合推出 Crypto AI Benchmark Alliance,樹立 Crypto AI 新標杆

Summary: 通過在真實任務中檢驗模型,CAIBA 為加密 AI 建立了統一、可復現的衡量標準,助力行業構建更可信的智能應用。
行業速遞
2025-06-04 10:47:27
收藏
通過在真實任務中檢驗模型,CAIBA 為加密 AI 建立了統一、可復現的衡量標準,助力行業構建更可信的智能應用。

Cyber、EigenLayer、Sentient 等 14 家區塊鏈與人工智慧項目方今日共同宣布成立 Crypto AI Benchmark Alliance(CAIBA)。這一開源、社區驅動的聯盟將致力於為加密行業的 AI 模型與智能體建立透明、可信的評測標準。

首批發起成員------Alchemy、Cyber、Dune、EigenLayer、Goldsky、IOSG、LazAI、Magic Newton、Metis、MyShell、OpenGradient、RootData、Sentient 與 Thirdweb------會一起合作貢獻數據集、工具與專業知識,共同搭建評測框架。每一套基準將包含任務、參考答案及評分腳本,並在 GitHub、Hugging Face 等平台以開放許可證(許可範圍允許時)發布。

隨著 AI 在加密領域的應用不斷擴張,從交易策略到研究助手無所不包,傳統 AI 基準已難以反映該行業的獨特需求。CAIBA 旨在彌補這一空白,推出面向加密場景的專業評測。

"透明而嚴格的測試至關重要,"Cyber 聯合創始人 Ryan Li 表示,"模型不僅要答對題,還必須可靠執行,讓用戶在決策時更有信心。"

聯盟首個成果 a Benchmark for Crypto AI Agents(CAIA) 現已上線,它從三大維度衡量 AI 能力:

  • 知識(Knowledge):精確回答協議、代幣等問題
  • 規劃(Planning):制定多步驟任務方案
  • 行動(Action):借助區塊瀏覽器和 API 完成操作

CAIA 覆蓋了代幣經濟學、鏈上分析、項目研究及交易流程等場景,評測對象包括 GPT-4o、Claude 4、Gemini 2.5、DeepSeek-R1 等通用大模型,以及多款加密原生模型。

通過在真實任務中檢驗模型,CAIBA 為加密 AI 建立了統一、可復現的衡量標準,助力行業構建更可信的智能應用。聯盟已在開發更多基準,並歡迎新成員加入。開發者、研究者和協議團隊可提交模型參與評測,或提出全新任務。


關於 Crypto AI Benchmark Alliance(CAIBA)

Crypto AI Benchmark Alliance 是一個社區治理的開放聯盟,專注於制定面向加密場景的 AI 評測標準。通過開放數據集、可復現任務與公共排行榜,CAIBA 為開發者、研究者和協議提供工具,衡量並改進區塊鏈應用中的 AI 系統。了解詳情,請訪問 caiba.ai

warnning 風險提示
app_icon
ChainCatcher 與創新者共建Web3世界