掃碼下載
BTC $66,992.60 +0.82%
ETH $1,941.74 -0.74%
BNB $605.46 -0.91%
XRP $1.42 -4.56%
SOL $81.67 -4.53%
TRX $0.2795 -0.47%
DOGE $0.0974 -3.83%
ADA $0.2735 -4.22%
BCH $560.14 +0.06%
LINK $8.64 -2.97%
HYPE $28.98 -1.81%
AAVE $122.61 -3.42%
SUI $0.9138 -6.63%
XLM $0.1605 -4.62%
ZEC $260.31 -8.86%
BTC $66,992.60 +0.82%
ETH $1,941.74 -0.74%
BNB $605.46 -0.91%
XRP $1.42 -4.56%
SOL $81.67 -4.53%
TRX $0.2795 -0.47%
DOGE $0.0974 -3.83%
ADA $0.2735 -4.22%
BCH $560.14 +0.06%
LINK $8.64 -2.97%
HYPE $28.98 -1.81%
AAVE $122.61 -3.42%
SUI $0.9138 -6.63%
XLM $0.1605 -4.62%
ZEC $260.31 -8.86%

Codatta 為何而生:構建 AI 的知識協議層

Summary: 針對傳統數據標註場景,Codatta 可作為 MTurk/Scale AI 等平台的高質量後端,通過支持法幣/穩定幣支付,使傳統服務能訪問其專家網絡獲取高階知識數據。
行業速遞
2025-06-24 21:00:00
收藏
針對傳統數據標註場景,Codatta 可作為 MTurk/Scale AI 等平台的高質量後端,通過支持法幣/穩定幣支付,使傳統服務能訪問其專家網絡獲取高階知識數據。

理解 AI 的數據基礎

Figure 1: Classical Software System (Human-driven) vs. AI System (Data-driven)

AI模型透過數據學習識別模式、進行推理並解決新問題。與依賴顯式規則的傳統軟體不同,生成式AI(大語言模型)透過海量數據集和輸入-輸出樣本驅動AI系統。

基於工業界的實踐經驗,約80%的AI工程投入集中於數據環節------包括管道構建、清洗和預處理------而非算法開發。高質量、高知識密度的數據至關重要。隨著大語言模型的發展,對專業化知識和推理數據的需求顯著增長,而基礎標註需求則隨著基礎模型能力的提升而降低。

生成式 AI 時代:數據角色的進化

Figure 2: AI Model Development Stages: From Foundational to Vertical AI

在生成式AI時代,數據的作用正在發生根本性轉變。傳統標註數據的重要性正在下降,而高質量、高知識密度的數據需求呈現爆發式增長。AI模型的訓練通常分為三個階段:首先是基於互聯網數據的預訓練,建立基礎認知能力;其次是使用人工標註的偏好數據進行精調,優化互動體驗;最後是通過強化學習生成合成數據,提升模型泛化能力。

然而,《自然》雜誌等研究表明,合成數據存在明顯局限。過度使用會導致"模型崩潰",嚴重影響輸出質量。這凸顯了真實數據的關鍵價值。隨著基礎AI能力的提升,專業領域應用越來越依賴人類專家提供的優質知識數據。這些由人工生成的高質量數據,在模型微調和效果評估等關鍵環節仍然不可或缺。

用版稅激勵重塑 AI 數據生態

AI開發者(尤其是初創公司)在獲取優質專業知識數據時面臨高昂的初期成本。傳統採購方式需要大量初始投資,導致關鍵的人類智能數據難以獲取,從而延緩AI創新進程。

領域專家為AI系統提供關鍵知識,其專業見解可能使AI取代專家自身的工作。然而,他們通常只能獲得一次性報酬,且金額往往不足。這種激勵錯配不僅打擊專家積極性,更引發了AI利益分配的公平性問題。

Figure-3 Comparing GenAI Business Models

Codatta透過基於區塊鏈的數據資產化版稅支付模式解決這一問題。該方案為開發者免除預付費門檻,使其通過收益分成獲取高質量數據。通過將報酬與長期收益掛鉤,Codatta既降低了創新壁壘,又為專家構建了可持續的激勵體系。

數據貢獻者將獲得共享所有權,並從使用其數據的AI應用中持續獲取版稅------這種模式類似於投資AI初創企業。基於這類資產的特殊屬性及其價值創造潛力,相關權益還可通過交易實現流動性,靈活滿足收益變現需求。這種收益機制與數據影響力同步增長的長期收益機制,既真正體現了專業知識的價值,又在公平性上遠超傳統的一次性買斷模式。

從數據到資產:鏈上版稅支付實踐

Figure-4: Codatta's Data Assetification Framework

該圖展示了 Codatta 數據資產化和版稅分配的核心機制。左側顯示的是數據貢獻(X、Y 以及知識點 KP0、KP1、KP2、KVO、KV1)與內容哈希值一起提交到鏈上,而加密的數據有效載荷則存儲在混合存儲解決方案中。右側描述了專門的人工智能模型如何利用這些數據,為客戶提供推論。重要的 "數據歸屬 "模塊可跟蹤價值貢獻,從而根據使用情況和影響公平分配版稅。

為實現數據資產化,Codatta構建了三大核心支柱:基礎設施、社區和激勵機制設計:

  • 隱私保護的透明性:

我們的系統通過區塊鏈記錄所有數據貢獻,創建關於來源、歸屬和所有權的永久可驗證記錄。所有數據資產均採用加密存儲(支持去中心化與中心化混合架構),在保障商業價值的同時確保公平的認可和版稅分配。Codatta通過智能合約將知識轉化為可追溯、可產生收益的數字資產。

  • 人類貢獻者與專業AI的協同網絡:

我們在透明、聲譽驅動的系統中同時利用人類專家和AI。AI處理初始任務(追求速度/規模),而人類則用專業洞察優化輸出。這種雙層方法正成為行業標準。Codatta進一步擴展這一模式,允許人類扮演多重角色:知識提供者、驗證者或資金支持者。每個角色都公開可見,並與動態聲譽系統關聯,從而鼓勵質量和責任感。

  • 可編程激勵模塊:

數據交互(採集、驗證、改進)與定制化獎勵掛鉤。智能合約自動分配版稅、聲譽或質押的激勵,確保基於數據價值的公平報酬。這些模塊採用估值和歸屬算法,在訓練和推理過程中分析知識影響力。它們能適配不同數據類型,優化長期公平補償,推動可持續知識經濟的發展。

這三大支柱------加密存儲的鏈上透明性、人機混合網絡及可編程獎勵機制---共同構成了Codatta的數據資產化框架。該系統將知識貢獻轉化為安全可追溯的數字資產,通過持續產生版稅收益,在人類智能與可擴展、可持續的AI發展之間架起橋樑。

開放設計:連接傳統 AI 與去中心化智能

Codatta是一個靈活的知識網絡,橋接去中心化AI(Decentralized AI or DeAI)與傳統Web2/Web3人類智能服務。針對傳統數據標註場景,Codatta可作為MTurk/Scale AI等平台的高質量後端,通過支持法幣/穩定幣支付,使傳統服務能訪問其專家網絡獲取高階知識數據。這讓傳統平台無需應對Web3複雜性即可享受區塊鏈級驗證與質量保障,實現即插即用。

在DeAI技術棧中,Codatta專注於數據策展------這一關鍵的首步環節。我們認為區塊鏈最適用於DeAI中的貢獻者身份認證、數據/模型驗證、溯源追蹤和使用監測。我們的設計將繁重的計算/存儲任務卸載到中心化基礎設施以提高效率,同時通過去中心化系統確保透明度、可追責性和公平的價值分配。這種混合方法在保證可擴展性的同時維護了完整性,構建起可信的AI數據供應鏈。

通過連接中心化和去中心化生態系統,Codatta致力於構建更公平、更高性能的AI系統------在這裡,人類貢獻者得到認可,數據完整性受到保護,激勵機制與長期價值創造保持一致。

附註:Codatta的旅程從Microscope開源項目的開啟(與Coinbase、Messari、GoPlus合作),現已發展為面向生成式AI的通用人類智能平台,並致力於成為AI開發者的基礎支撐。其旗艦產品加密賬戶標註系統(CAA)已實現:覆蓋35條區塊鏈網絡, 標註4,600萬個高風險地址, 完成5.6億次標註(涵蓋95個類別, 由10萬+貢獻者共同構建) 當前業務已拓展至評估、電商、醫療健康及健身等多個領域,並制定明確發展路線圖,2024年:覆蓋100+知識領域,匯聚30萬+貢獻者; 2025年:實現協議完全去中心化 2026年:完成全面數據資產化,使每個知識貢獻都成為可創收的資產。

warnning 風險提示
app_icon
ChainCatcher 與創新者共建Web3世界