코넬 대학교 등 13개 최상위 대학의 최신 연구: Crypto x AI 융합의 현황, 도전과 오해

핵심 관점

2026-06-10 14:35:27

수집

AI와 암호화의 결합은 여전히 초기 단계에 있으며, 두 가지는 상호 보완적인 "미들웨어"입니다: AI는 사람의 의도를 실행 가능한 프로그램으로 변환하고, 암호화 기술은 계산 과정과 결과에 대해 검증 가능하고 변조 방지의 보장을 제공합니다. AI가 강화된 암호화 방향에서는 기계 학습이 스마트 계약 감사, 사기 식별 및 AI 오라클에 사용될 수 있게 되었습니다; 암호화가 강화된 AI 방향에서는 검증 가능한 실행이 비교적 성숙해졌지만, 탈중앙화된 컴퓨팅 파워, 데이터 시장 및 거버넌스는 대부분 여전히 구상 단계에 머물러 있습니다.

저자：IC3

편집: 가환, ChainCatcher

핵심 결론

AI와 암호화폐의 의미 있는 결합은 여전히 매우 초기 단계에 있으며, 이 교차 분야에 대한 소음은 실제 진전을 압도하고 있다.

Crypto x AI 방향에서 AI는 기존 거래, 사건 및 프로토콜의 핵심 특성을 분석하고 감지할 수 있으며, 사기 또는 취약한 스마트 계약을 식별할 수 있다. 이러한 기술은 주로 간단한 머신 러닝 방법을 사용하며, 데이터가 충분한 통제된 환경에서 가장 효과적이다.

AI x Crypto 방향에서 암호화폐 도구는 AI 프로세스를 보호하고 관리하는 새로운 경로를 제공한다. 제로 지식 증명, 신뢰할 수 있는 계산 등의 도구는 AI 결과가 변조될 위험을 줄이기 위해 수정될 수 있다. 그러나 분산 거버넌스, 분산 인프라 관리 등의 구상은 주류 AI 분야에서 아직 실제로 구현되지 않았다.

업계는 두 가지를 증명해야 한다.

첫째, 분산 AI는 중앙 집중식 솔루션과 더 엄격하고 직접적인 비용 비교를 해야 한다. 현재 업계는 "분산 환경에서 대규모 모델을 훈련할 수 있다"는 것을 증명하는 데 주력하고 있지만, 특정 상황에서 중앙 집중식 플랫폼과 경쟁할 수 있는 비용에 대한 기회는 여전히 정량적 증거가 부족하다.

둘째, 암호화폐 결제는 에이전트 결제 시나리오에서 중앙 집중식 솔루션에 대한 실제 효용을 입증해야 한다. 암호화폐는 결제 분야에서 실질적인 진전을 이루지 못했지만, 에이전트 결제는 수수료가 낮고 전통 금융에서 "계좌는 반드시 특정 개인에게 속해야 한다"는 모델을 적용할 필요가 없어 잠재력을 가지고 있다. 업계는 정량적 증명을 통해 기회를 잡아야 하며, 가능성에 머물러서는 안 된다.

또한 두 가지 해결해야 할 연구 문제도 있다.

하나는 AI 안전이 시스템 수준의 방어를 필요로 한다는 것이다. AI 분야는 일반적으로 모델 수준에서 안전 문제를 해결하고 입력 및 출력 의미에 대한 장치를 설계하지만, 에이전트의 자율성이 강화되고 기본 인프라에 직접 접근할 수 있게 되면 이러한 방식은 더 이상 충분하지 않다. 암호화폐의 검증 가능한 실행 및 인증 프로세스는 모델 수준에서 할 수 없는 시스템 수준의 보장을 제공할 수 있다.

둘째, 암호화폐와 AI의 결합은 새로운 위협 주체와 공격 벡터를 초래할 수 있다. 예를 들어, 아래에서 설명할 수 없는 자율 에이전트, 통제 불능의 스마트 계약 등이 있다.

통합 프레임워크: AI와 암호화폐는 서로 "미들웨어" 역할을 한다

자동화된 의사 결정 프로세스는 네 가지 단계로 나눌 수 있다: 사람의 의도, 입력, 프로그램, 출력. 이 체인상의 각 단계는 반드시 신뢰할 수 있는 것은 아니다. AI와 암호화폐는 이 프레임워크에서 각각의 역할을 맡고 있다.

AI는 "번역 미들웨어"로, 인간의 모호한 의도를 기계가 실행할 수 있는 프로그램으로 번역한다. 예를 들어 "주차 표지를 인식하고 싶다"는 요청을 훈련된 모델로 변환하여 블록체인 사용의 장벽을 낮춘다.

암호화폐는 "신뢰 미들웨어"로, 신뢰할 수 있는 계산을 통해 특정 계산이 실제로 약속대로 실행되고 결과가 변조되지 않았음을 보장하며(무결성), 분산화를 통해 시스템이 항상 사용 가능하고 검열에 저항할 수 있도록 보장한다(가용성). 일부 솔루션은 입력과 출력이 누출되지 않도록 보장할 수 있다(비밀성).

신뢰할 수 있는 계산에는 세 가지 기술 경로가 있다.

첫째, 신뢰할 수 있는 실행 환경(TEE)은 전용 하드웨어에 의존하여 격리 및 원격 증명을 제공한다(하드웨어가 검증 가능한 상태 증명을 제시하여 상대방이 칩이 진짜이고 변조되지 않았음을 확인하게 한다). 엔비디아의 비밀 계산을 통해 8B 파라미터 모델 추론의 추가 비용은 7% 미만이며, 70B 모델은 거의 손실이 없다. 단점은 하드웨어 공급업체를 신뢰해야 하며 물리적 공격에 저항하지 못한다는 것이다.

둘째, 제로 지식 증명(ZK)은 암호학적 문제에만 의존하며, 안전 가정이 가장 깨끗하지만 비용이 매우 높다. 약 1800만 파라미터의 작은 모델에 대한 증명을 생성하는 데 약 1분이 걸리며, 최첨단 대형 모델과는 몇 배의 차이가 있다.

셋째, 다자 계산(MPC)은 여러 당사자가 원본 데이터를 제출하지 않고 공동으로 계산할 수 있게 하며, 속도는 더 느리다. 가장 진보된 MPC Transformer 추론 프레임워크는 LLaMA-7B에 대해 단일 토큰을 생성하는 데 약 5분이 걸린다.

오라클은 체인 외부 데이터를 신뢰할 수 있게 체인에 올리는 역할을 한다. 프라이버시 오라클(예: Town Crier, DECO)은 개인 정보를 누출하지 않고 데이터 특성을 증명하는 데 추가 지원을 제공한다. 예를 들어 "어떤 사람의 신용 점수가 700 이상이다"라는 것을 다른 정보를 노출하지 않고 증명할 수 있다.

업계는 이 기술 세트를 zkTLS라고 통칭하지만, TEE 기반 솔루션은 제로 지식 증명을 사용하지 않아 명칭상의 오용에 해당한다.

Crypto x AI: AI로 블록체인 강화하기

AI가 암호화폐에 사용되는 연구는 대략 세대로 나눌 수 있다.

첫 번째 세대: 분석 및 감지

10년 전부터 머신 러닝이 체인 상태 분석에 사용되었다: 합의 프로토콜의 취약점 발견(예: 이기적인 채굴, 즉 채굴자가 이미 채굴한 블록을 숨기고 적절한 시점에 발표하여 수익을 더 많이 차지하는 것), P2P 네트워크의 일식 공격 감지(많은 악의적인 노드가 특정 노드를 둘러싸고 그것과 정직한 네트워크의 연결을 차단하는 것), 암호화폐 가격 예측, 사기 거래 및 자금 세탁 식별.

제한점은 이러한 분석이 주로 전 세계 공개 정보를 얻을 수 있는 상황에 의존하며, 시뮬레이션 데이터에 제한되고 실제 공격 샘플이 부족하다는 것이다.

현재 가장 진보된 계약 취약점 감지는 AI가 코드에서 직접 결론을 추측하게 하는 것이 아니라, 먼저 AI가 의심스러운 점을 제시하고, 이후 정적 분석 및 기호 실행(코드를 실제로 실행하지 않고 코드 구조를 분석하여 취약점을 찾는 것)을 통해 검증하는 방식이다.

단순히 대형 모델을 감사자로 두는 것은 환각으로 인해 많은 오탐을 발생시킬 수 있으며, GPT-4와 Claude는 52개의 공격을 받은 DeFi 계약 중 40%만 올바르게 취약점 유형을 식별했다.

두 번째 세대: 알고리즘 설계

최근 6년 동안 강화 학습이 분산 알고리즘 설계에 사용되었으며, P2P 네트워크 토폴로지, 합의 프로토콜 매개변수 및 역할 선택, 샤딩, DeFi 시장 조성 및 대출 이자율, MEV 경매 전략 등을 포함한다.

이러한 방법은 대부분 명확하게 모델링할 수 있는 환경에서 효과적이며, 연구 단계에 머물러 있으며, 실제 네트워크에서 대규모 배포 및 공격 검증을 거치지 않았다.

세 번째 세대: 현실 세계와의 상호작용

AI 기반 오라클을 통해 스마트 계약은 세 가지 강화된 능력을 얻는다: 인식(비구조적 데이터 및 자연어 이해), 실행(체인 외부 AI 모델 및 도구 호출), 의사 결정(목표 함수에 따라 행동하는 에이전트로서).

AI가 오라클로서의 실제 성능은 균일하지 않다. Chainlink Labs의 실험에 따르면, GPT-4o는 1660개의 예측 시장 문제에서 전체 정확도가 89.3%였고, UMA의 Truth Bot은 전체적으로 75%였으며, 인간은 UMA 낙관적 오라클(기본적으로 답변을 진실로 가정하고 논란 기간을 설정하며, 아무도 이의를 제기하지 않으면 유효한 것으로 간주됨)에서 98.2%의 정확도를 보였다.

정확도는 문제 유형에 크게 의존한다: 스포츠 경기 결과와 같은 공식 데이터 소스가 있는 이산 문제는 99.7%에 도달할 수 있지만, 시간 순서가 관련되거나 비디오 카운트를 전사해야 하는 문제는 오류율이 현저히 증가한다.

대응 방법은 세 가지가 있다: 첫째, 오류를 허용할 수 있도록 설계하여 저가치 상황에서만 사용; 둘째, 인공지능 중재를 도입하여 48시간 논란 창구를 설정하지만 결정 속도를 늦출 수 있다; 셋째, 모델이 불확실할 때 답변을 포기하게 하여 이때만 인공지능을 도입한다.

자금 풀을 AI 모델이 집단 거래하는 "투자 DAO"는 CoinAlg로 보고되며, 대표 프로젝트로는 ElizaOS, AI XBT가 있으며, 피크 시가 총액은 각각 27억, 47억 달러에 달했다. 이러한 제품은 "CoinAlg의 교착 상태"라고 불리는 피할 수 없는 설계 딜레마에 직면해 있다.

거래 전략이 투명하면 복제되거나 샌드위치 공격(피해자의 거래 전후에 각각 주문을 넣어 슬리피지를 통해 차익을 얻는 것)에 의해 이익이 빼앗길 수 있다; 비밀로 유지하면 전략을 알고 있는 내부자가 정보 차이를 이용해 사전 이익을 얻을 수 있어 내부 거래와 동일하다. 두 가지 모두 일반 투자자에게 피해를 준다.

초기 완화 방법 중 하나는 TEE로 전략을 감싸고 거래를 무작위 처리하여 내부자의 예측 난이도를 높이는 것이다.

새로운 위험: AI 주도 악의적인 스마트 계약

스마트 계약은 인간 간의 신뢰를 대체하는 데 사용되며, 이는 신뢰할 수 있는 관계가 가장 부족한 범죄자들이 이로 인해 이익을 얻을 수 있음을 의미한다.

하나의 메커니즘은: 계약이 특정 범죄에 대한 보상을 제공하며, 범죄자는 사전에 암호학적으로 "암호"를 약속하고, 사건이 발생한 후 AI 모델이 뉴스 보도를 비교하여 범죄가 완료되었음을 확인한 후 자동으로 보상을 지급하는 것이다. AI는 과거에 자동화하기 어려웠던 "판단" 역할을 맡게 되며, 이는 표적 괴롭힘, 조직 정보 탈취, 신고자 신원 노출 등의 상황에 사용될 수 있다.

가능한 반제어 방법으로는 체인 분석 추적, 관련 자금을 블랙리스트에 올리는 것, 고위험 요청 시 AI 모델을 배치한 오라클이 서비스 거부를 하는 것이 있다.

AI x Crypto: Crypto로 AI 강화하기

암호화폐가 AI에 기여할 잠재력은 두 가지로 나눌 수 있다: 첫째, 분산 AI 생애 주기의 각 단계, 둘째, 이러한 단계의 안전을 보호하는 것이다.

분산 인프라(DePIN)

분산 물리적 인프라 네트워크는 노드가 토큰 보상을 통해 계산 능력 등의 자원을 제공하게 한다. Theta, Akash 등은 AWS보다 50%에서 85% 비용을 절감한다고 주장하며, 주요 병목 현상은 노드 간의 공용 네트워크 통신으로 인한 처리량 및 지연이다.

적합성은 작업 유형에 따라 다르다. 훈련은 지연에 민감하지 않지만(오프라인으로 진행됨), 지역 간 동기화 통신이 병목 현상이다. 현재 분산 하드웨어에서 수십억 파라미터 모델을 훈련한 성과가 있다(Bittensor의 700M 및 7B, Prime Intellect의 100억 파라미터 Intellect-1, 최대는 Psyche 네트워크에서 훈련 중인 400억 파라미터 모델).

추론은 지연에 더 민감하지만, 처리량 요구는 훈련보다 낮고 역전파가 필요하지 않다(훈련 중 오류를 단계별로 되돌려 매개변수를 업데이트하는 핵심 단계는 훈련에서만 필요하다). 지연에 민감하지 않은 추론(회의록, 문서 검토)은 특히 DePIN에 적합하다.

핵심 결핍은 이러한 프로젝트가 대부분 종단 간 총 비용을 보고하지 않는다는 것이다. 그들이 홍보하는 것은 단일 GPU의 시간당 가격이며, ML 작업 비용을 결정하는 것은 훈련 효율성(단위 비용당 반복 횟수)과 추론 효율성(단위 비용당 토큰 수)이다.

분산 데이터 및 모델 시장

AI 데이터는 일반 상품과 몇 가지 다른 특성을 가진다. 그것은 디지털 상품으로, 최초 생성은 비쌌지만 복사는 거의 무료이다; 대부분 비경쟁적이며(한 데이터는 여러 당사자가 동시에 사용해도 소모되지 않음); 품질을 사전에 판단하기 어렵고, 즉 "레몬 시장" 문제(구매자가 품질을 사전에 판단할 수 없어 양질의 제품이 저질 제품에 의해 밀려나는 현상)로 인해 판매자는 샘플을 제공해야 하지만, 샘플 자체도 가치가 있다; 또한 재판매가 가능하며, 두 데이터가 본질적으로 동일한지 정의하기 어렵다.

중앙 집중식 시장의 논란은 가격 책정이 불투명하고 사용자 선택을 제한하는 것이지만, 중앙 집중식 가격 책정은 때때로 더 많은 정보를 보유하고 있어 더 효율적일 수 있다.

데이터 시장에는 아직 독점 거대 기업이 등장하지 않았으며, 분산 방식으로 재구성할 수 있는 기회가 있다. 활용할 수 있는 암호화폐 도구에는 마이크로 결제, TEE(특정 작업에서만 데이터 사용 제한), 제로 지식 증명(구매자에게 데이터 특성을 공개하되 데이터 자체는 누출하지 않음)이 포함된다.

현실은 대부분의 플랫폼이 암호화폐를 사용하여 결제 단계를 완료했으며, 가격 책정 메커니즘은 프로토콜 측에서 결정되거나 판매자에게 완전히 맡겨져 있다. 이러한 두 가지는 중앙 집중식 시장에서 이미 존재한다. 분산화가 실제로 무엇을 개선했는지는 여전히 연구가 부족하다.

에이전트 결제 경로 및 x402

에이전트 생태계 자체는 이미 분산되어 있다: 서로 다른 당사자가 서로 다른 모델을 사용하여 서로 다른 목표를 개발하고 최적화하며, 자연스러운 중앙 제어 지점이 없다. 암호화폐의 암호 경제학(암호학적 수단을 사용하여 참여자의 행동을 제약하기 위해 경제적 보상과 처벌을 겹치는 개념)은 에이전트 거버넌스로 이전할 수 있다.

마이크로 결제는 에이전트 경제의 핵심이다. 인터넷 역사에서 마이크로 결제는 여러 번 실패했으며, 주요 문제는 각 소액 결제에 대한 판단의 의사 결정 비용이 아니라 결제 인프라이다. 에이전트는 마이크로 결제를 인간보다 훨씬 빠르게 평가할 수 있으며, 사용자는 전략만 설정하면 된다. 이는 마이크로 결제가 처음으로 성공할 수 있게 할 수 있다.

Cloudflare는 "크롤링에 따라 지불"을 출시했으며, x402(프로그램이 HTTP를 통해 체인에서 직접 소액 결제를 완료할 수 있게 하는 개방형 프로토콜) 등의 프로토콜이 개발 중이다.

이 시스템의 기본 자산은 주로 스테이블코인(USDC, USDT, DAI)으로, 이는 에이전트에게 안정적인 회계 단위를 제공할 수 있기 때문이다(모든 상품에 대한 통일된 가격 책정 기준). ETH, SOL 등의 원주율 토큰은 변동성이 너무 크다.

에이전트 간의 신뢰는 체인 등록부(예: ERC-8004, 이더리움에서 에이전트의 체인 상 신원 및 평판을 구축하기 위한 제안 표준)를 통해 신원 및 평판을 기록하지만, 본질적으로 이는 자기 선언이며, 평판은 지연되고 기존 플레이어에게 유리하다.

더 나아간 솔루션은 검증 가능한 에이전트 감사이다: TEE 내에서 실행되는 LLM이 독점 에이전트 코드를 검토하고 평판 점수를 생성하며, 감사 결과는 코드 해시와 연결되어 코드가 비공개로 유지되는 동시에 검증자가 신뢰할 수 있는 보장을 받을 수 있게 한다.

종료할 수 없는 자율 에이전트(UAA)는 또 다른 위험이다. 최첨단 에이전트가 자율적으로 수행할 수 있는 작업의 지속 시간은 2019년 이후 약 7개월마다 두 배로 증가하고 있다. 이미 연구에 따르면 모델이 로컬에서 자기 복제의 경계를 넘어서 독립적인 복사본을 생성할 수 있지만, 외부 인프라로 복사하는 것은 여전히 신원 인증에 걸려 있다.

Anthropic의 Mythos 모델은 자율적으로 제로 데이 취약점을 발견하고 활용할 수 있는 능력을 보여주었다(제조업체가 아직 알지 못하고 패치가 없는 취약점). 지갑을 보유하고 종료할 수 없는 에이전트는 "운영자" 중심의 기존 규제 프레임워크의 사각지대에 놓이게 된다.

분산 거버넌스

블록체인 커뮤니티는 시스템 제어 권한을 분배하는 데 더 긴 실천 역사를 가지고 있으며, 방식은 자연스럽게 분산되어 있으며 광범위한 이해 관계자를 포함하려고 하지만, 공인된 단점도 있다: 보안 취약점, 투표 냉담, 매수 투표.

커뮤니티 거버넌스는 AI 개발의 각 단계에 따라 적합성이 다르다: 사전 훈련 데이터 양이 너무 많아 유효한 의견을 수집하기 어렵고, 가치는 주로 미세 조정 단계에서 나타난다; 기본 구조 선택은 기술적 결정으로, 커뮤니티 거버넌스에 적합하지 않다; 평가 및 정렬 단계는 기술적 판단과 규범적 판단이 혼합되어 있어 커뮤니티 입력이 가치가 있다.

Constitutional AI는 인간이 작성한 "헌법"을 통해 모델이 따라야 할 원칙을 설정한다. Anthropic이 참여한 Collective Constitutional AI는 공개 투표를 통해 원칙을 생성하며, 공개 출처 원칙으로 훈련된 모델은 사회적 편견이 더 낮다. 그러나 이러한 민주적 거버넌스 실험은 실제로 채택되지 않았으며, AI 회사는 모델 제어권을 넘길 동기가 부족하다.

DAO의 토큰 가중 투표는 "금권 정치"로 공인되며, 이로 인해 이차 투표(추가 투표 수의 비용이 증가하여 대형 투자자를 억제하는 것), 신념 투표(지지하는 기간에 따라 가중치를 누적하는 것), 위임 투표 등의 메커니즘이 파생되었지만, 유효성은 여전히 불확실하다.

AI 시스템의 실행 무결성 보호

스마트 계약이 자신의 능력을 초과하는 ML 계산을 필요로 할 때, "중재자" 역할을 할 수 있다: 각 당사자는 사용되는 모델과 데이터를 약속하고 담보를 예치한 후, 체인 외부에서 계산을 완료하고 결과를 계약에 검증하도록 제출하며, 오류가 있는 쪽은 벌금을 부과받는다. 검증에는 네 가지 경로가 있으며, 각각의 장단점이 있다.

첫째, TEE는 가장 효율적이며, 신뢰할 수 있는 하드웨어가 계산의 무결성을 증명하지만, 운영자를 신뢰해야 한다.

둘째, 낙관적 실행은 결과를 비종결로 간주하고 논란 창구를 남겨두며, 논란이 있을 경우 이분 탐색(오류 범위를 반복적으로 반으로 나누어 오류 단계를 빠르게 찾는 것)을 사용하여 단일 오류 명령어를 찾아 벌금을 부과한다.

어려운 점은 ML 부동 소수점 연산의 비결정성이며, 통제된 연산 순서 또는 허용 오차 의미(두 번의 계산이 완전히 일치할 필요는 없으며, 오차 범위 내에서 일치하는 것으로 간주됨)를 사용해야 한다. 대표적인 솔루션으로는 Verde, TAO, Arbigraph, OPML 등이 있다.

셋째, 제로 지식 증명(zkML)은 AI 추론 과정이 올바른지를 증명하기 위해 제로 지식 증명을 사용하는 것으로, 모델 파라미터, 심지어 입력 및 출력을 숨긴 채로도 추론이 올바르다는 것을 증명할 수 있다. CNN, Transformer에 대한 전용 솔루션 및 범용 컴파일러(예: EZKL, ZKML, DeepProve)가 이미 존재한다.

그의 프라이버시 목표는 사실 세 가지 층으로 나뉘며, 각각 입력 숨기기, 가중치 숨기기, 모델 구조 숨기기이다. 그러나 프라이버시가 강할수록 회로 제약이 복잡해지고 최적화 공간이 줄어들어 프라이버시와 효율성 간의 근본적인 긴장이 존재한다. 주요 비용은 비선형 층 및 수치 표현에서 발생하며, 여전히 긴 컨텍스트, 대형 모델 및 높은 처리량 서비스를 지원하기 어렵다.

넷째, 통계적 추론 증명은 원리가 두 개의 기능이 다른 모델의 내부에서 계산된 특징이 반드시 다르다는 것이다. 따라서 이러한 특징을 샘플링하여 비교하기만 하면 추론이 지정된 모델에 의해 수행되었는지를 확률적으로 판단할 수 있다.

이 증명 비용은 밀리초 수준이며 즉각적인 종결이 가능하여 고빈도, 저지연 시나리오에 적합하다. 그것이 방어할 수 있는 것은 서비스 제공자가 모델을 바꾸는 것과 같은 현실적인 악의적 행위(예: 더 저렴한 증류 버전으로 교체하거나 이미 정렬된 버전을 교체하는 것)지만, 완전히 악의적인 자가 계산 기록을 조작하는 것을 막을 수는 없다. 후자는 여전히 해결되지 않은 문제이다.

모델 훈련 증명(zkPoT)은 추론 증명보다 훨씬 어렵다: 훈련 과정은 긴 지속 시간, 중간 상태의 지속적인 축적, 높은 무작위성을 가지며, 복잡성은 추론보다 몇 배 높다. 관련 작업(Garg 외, Kaizen)이 진행 중이며, 훈련 데이터 출처 및 공정성 제약에 대한 감사 가능한 증명(ZkAudit, Confidential-PROFITT)으로 확장되고 있다.

훈련 파이프라인 보호

단일 기관이 신뢰할 수 있는 데이터를 사용하여 모델을 훈련할 때, 일반적으로 즉각적인 프라이버시 또는 무결성 우려가 없다. 복잡한 보안 문제는 여러 당사자가 공동으로 훈련하고 데이터 출처가 다양할 때 발생한다.

전형적인 시나리오는 여러 병원이 공동으로 진단 모델을 훈련하는 것이다: 각 당사자의 전자 건강 기록(EHR)을 통합하면 더 넓은 환자 집단을 커버하고 진단 정확도를 높일 수 있지만, HIPAA 등의 규제로 인해 각 당사자는 원본 데이터를 서로 또는 제3자에게 직접 제공하기를 원하지 않거나 불편해한다.

금융 기관이 공동으로 반사기 모델을 훈련하거나 기업이 공동으로 침입 탐지 모델을 훈련하는 것도 유사한 상황이다.

연합 학습은 이를 위해 설계된 솔루션이다: 훈련 환경은 먼저 글로벌 모델을 초기화하고 각 당사자에게 배포한 후, 각 당사자는 로컬에서 개인 데이터를 사용하여 훈련하고 모델 업데이트만 전송하며, 훈련 환경은 이를 종합하여 새로운 글로벌 모델을 생성하고 데이터는 로컬에서 전송되지 않는다.

그러나 연합 학습의 실제 적용은 제한적이다(가장 잘 알려진 응용 프로그램은 모바일 입력법의 예측이다). 데이터와 계산의 무결성을 보장하지 않으며, 각 당사자가 정직하더라도 통신 비용이 크고 네트워크 및 조정 지연이 전체 속도를 늦추며, 모델 정확도는 집중 훈련보다 낮고, 악의적인 참여자는 모델에 독을 주거나 백도어를 심을 수 있다.

더 간단한 대안은 TEE를 사용하여 집중 훈련하는 것이다: 훈련 환경은 신뢰할 수 있는 비밀 계산 환경에서 실행되며, 암호화된 채널을 통해 각 당사자의 원본 데이터를 수신하고 집중 훈련하며, 훈련된 모델만 출력하고 데이터는 서로 보이지 않으며, 데이터 제공자와 모델 훈련 방법에 대한 증명도 첨부할 수 있다.

비용은 TEE 고유의 사이드 채널 위험과 높은 I/O 오버헤드이다. 현실에서 기관들은 현재 데이터를 규정 준수 클라우드에 집계하고 격리, 접근 제어, 암호화 및 데이터 사용 계약을 통해 규정을 준수하고자 하지만, 이는 클라우드 서비스 제공업체를 신뢰해야 한다.

프라이빗 네트워크 데이터는 또 다른 접근 방식이다. 공개 네트워크의 텍스트 데이터는 한계에 가까워지고 있으며(2025년에서 2030년 사이에 고갈될 것이라는 예측이 있다), 합성 데이터는 "모델 붕괴" 위험이 있으며, 기존 영역 외의 데이터 커버리지를 확장할 수 없다.

"프라이빗 네트워크"(이메일, 건강, 재무 등 크롤러에 공개되지 않는 데이터)는 공개 네트워크보다 두 배 더 큰 것으로 추정되며, 아직 채굴되지 않은 풍부한 자원이다. 그러나 현재는 고립되어 있다.

오라클은 이 문을 열 수 있다. 환자가 자신의 병력을 업로드하여 의료 모델을 훈련하는 예를 들어, 사용자는 오라클을 통해 자신의 병력을 병원 포털에서 훈련 당사자에게 전달하고 데이터가 실제로 해당 포털에서 왔음을 증명할 수 있다. 이 과정에서 병원은 어떤 기본 인프라를 변경할 필요가 없다. 연결은 사용자가 시작한다.

프라이버시를 동시에 보호하려면 프라이버시 오라클(데이터가 암호화된 채널을 통해 이동)과 TEE를 겹쳐야 한다. TEE는 사용자에게 증명을 제시하여 자신이 "모델만 출력하는" 프라이버시 훈련 소프트웨어를 실행하고 있다는 것을 보여줄 수 있으며, 사용자는 데이터를 전송하기 전에 이를 검증할 수 있다.

이 기반 위에 차등 프라이버시(모델 출력이 특정 훈련 데이터에 대한 의존도가 극히 낮음), 데이터 사용 후 삭제, 완성된 모델은 화이트리스트에 있는 병원에서만 사용 가능 등의 더 세부적인 약속을 추가할 수 있다.

안전한 추론 파이프라인 및 보호된 파이프라인(Props)

같은 오라클과 신뢰할 수 있는 계산의 조합은 프라이빗 데이터에 대한 안전한 추론에도 사용할 수 있다.

은행 대출 승인 예를 들어보자: 모델은 신청자의 재무 문서를 읽고 승인 또는 거부를 출력한다. 현재의 프로세스는 대출자가 자료를 다운로드하거나 사진을 찍어 업로드하는 것으로, 이로 인해 두 가지 문제가 발생한다. 첫째, 대출자는 자료의 진위 여부를 확인할 수 없고 변조되지 않았음을 보장할 수 없다. 둘째, 대출자의 자료가 대출자의 모델 시스템에서 유출될 수 있어 양측 모두에게 위험이 된다.

프라이버시 오라클은 출처의 진위를 해결하고, 비밀 계산은 프라이버시를 해결하여 안전한 추론 파이프라인을 얻을 수 있다: 대출자는 모델 결론만 보게 되며, 입력이 신뢰할 수 있음을 확신할 수 있다.

프라이빗 출처는 신원 및 증명 시스템 역할도 할 수 있다.

대출자는 본인 신원이 포함된 은행 거래 내역, W-2 양식을 전송할 수 있으며, 이는 강력한 신원 증명으로 작용하여 기존 네트워크 서비스를 신원 도용 및 복지 사기를 방지하는 임시 신원 시스템으로 변환할 수 있다. 모델은 이를 바탕으로 증명을 발급할 수 있으며, 예를 들어 소규모 기업의 세금 및 운영 자료를 검증한 후 "특정 자격을 충족"하는 증명을 발급하고 추론 파이프라인의 증명을 첨부할 수 있다.

전체 과정은 분산화되어 완료될 수 있으며, 이론적으로 누구나 신뢰할 수 있는 추론 파이프라인을 구축할 수 있으며, 데이터 출처나 기존 권위의 협력이 필요하지 않다.

적대적 입력은 고질적인 문제이다. 공격자는 육안으로 정상으로 보이지만 정교하게 수정된 은행 거래 내역을 제출하여 모델이 잘못된 잔액을 읽고 대출을 승인하도록 유도할 수 있다. 학계는 적대적 샘플에 대한 연구를 "해킹---패치"의 순환으로 진행해 왔으며, 현재까지 일반적인 해결책은 없다.

안전한 추론 파이프라인은 새로운 접근 방식을 제공한다: 입력을 인증된 네트워크 출처에서만 오는 것으로 제한하여 공격자가 적대적 입력을 구성할 수 있는 공간을 줄이고, 모델 수준 방어와 상호 보완한다.

모델 자체의 프라이버시도 보호해야 한다. 공격자는 정교하게 구성된 쿼리를 통해 모델을 탈취하거나(특징을 추출하거나 심지어 전체 모델을 추출), 구성원 추론(특정 데이터가 훈련 세트에 포함되어 있는지 판단) 및 원본 훈련 데이터를 복원할 수 있으며, 이를 통해 시스템의 구성 및 전처리 선택을 엿볼 수 있다.

연구자들은 약 8000달러로 특정 대형 모델의 한 층의 가중치를 탈취할 수 있다고 추정했다. 개방형 시스템에서 일반적으로 사용되는 속도 제한은 매우 취약하다. 단일 익명 사용자가 대량의 사용자로 가장하여 마녀 공격(Sybil 공격)을 시작할 수 있기 때문이다.

안전한 추론 파이프라인은 양쪽에서 완화할 수 있다: 오라클을 사용하여 입력 유형을 제한하고, 다양한 쿼리가 필요한 추출 공격을 억제하며, 파이프라인 내에서 생성된 강력한 신원 증명을 통해 각 사용자에게 쿼리 횟수 제한을 부과하고, 플랫폼에 사용자 신원을 노출하지 않고 실행할 수 있어 마녀 공격을 억제할 수 있다.

에이전트 기억은 새롭게 나타난 공격 면이다. 공격자는 도구 호출이나 외부 자료 오염을 통해 에이전트에 주입된 맥락(기억 주입)을 유도하여 에이전트가 비정상적으로 행동하도록 할 수 있다. 예를 들어, 대량의 암호화폐 자산을 관리하는 ElizaOS 프레임워크에서 오염된 맥락은 에이전트가 무단 거래를 시작하도록 유도할 수 있다.

TEE는 부분적으로 완화할 수 있다: 에이전트를 TEE 내에서 실행하거나 인증된 맥락만 가져오도록 한다.

그러나 TEE가 있더라도 두 가지 어려움이 있다.

첫째, 신뢰할 수 있는 출처에도 오염된 내용이 있을 수 있다. 예를 들어, 소셜 플랫폼의 내용은 사용자가 스스로 생성한 것이며, 게시자는 자신의 게시물에 쉽게 독을 주입할 수 있다.

둘째, TEE 운영자는 롤백 또는 분기 공격을 시작하여 TEE 상태를 이전 체크포인트로 되돌리고 이후의 기억 업데이트를 지울 수 있다.

전자는 콘텐츠 검출 문제에 해당하며, 암호학으로 해결할 수 없다; 후자는 합의 접근 방식을 통해 대응할 수 있으며, ROTE, Narrator 등의 시스템은 분산 프로토콜이나 심지어 공용 체인을 사용하여 TEE 상태의 일관성과 신선함을 보장한다.

이 섹션의 구조를 요약하면, "보호된 파이프라인"(Props)이라는 일반적인 프레임워크가 된다. 목표는 기존 인프라를 변경하지 않고 프라이빗 데이터를 안전하게 사용하는 것이다.

이 프레임워크는 오라클과 신뢰할 수 있는 계산을 세 부분으로 나눈다: 오라클은 인증된 프라이빗 출처에서 데이터를 가져오고 출처를 증명하며, TEE는 암호화 경계 내에서 훈련 또는 추론을 완료하고, TEE는 모델이나 결론을 출력하며 파이프라인 속성(데이터 출처, 소프트웨어 또는 모델의 코드 해시 등)에 대한 증명을 첨부한다.

Props는 세 가지 속성을 보장한다: 종단 간 입력 무결성(출력은 신뢰할 수 있는 프라이빗 출처의 인증 데이터에만 의존), 기본 비밀성(입력 및 중간 상태는 보호된 경계를 넘지 않으며, 출력만 공개됨), 증명 가능하지만 누출되지 않음(증명은 데이터 제공자와 결과 사용자가 무결성과 비밀성이 성립함을 확신하게 한다).

또한 "투명한 버전"이 있으며, 데이터와 계산은 비밀일 필요가 없고 인증만 필요하며, 출처는 공개적이거나 비공식적일 수 있다.

Crypto x AI에 대한 다섯 가지 오해

Crypto x AI 플랫폼 및 응용 프로그램을 둘러싸고 업계에서는 여러 가지 일반적인 오해나 오도된 주장이 나타났다. 다음 다섯 가지는 전적으로 거짓이 아니지만, 현재 어떤 부분이 성립하고 어떤 부분이 더 많은 증거가 필요한지를 명확히 하는 것이 중요하다.

오해 1: 블록체인은 AI 생성 콘텐츠와 인간 생성 콘텐츠를 구분할 수 있다

콘텐츠를 체인에 등록하면 나중에 AI가 생성했는지 인간이 생성했는지 판단할 수 있다는 주장은 자주 인용되며, 이미 AI 생성 콘텐츠를 체인에 올리는 프로젝트(예: Everlyn AI)가 있다. 그러나 블록체인은 일반적인 의미에서 이를 수행할 수 없으며, "콘텐츠 검출"과 "콘텐츠 출처 추적" 두 가지 문제를 분리하여 살펴봐야 한다.

콘텐츠 검출은 특정 콘텐츠가 인간인지 AI에 의해 생성되었는지를 판단하는 것이다. 현재 주류는 사후 검출이며, 사전에 심어진 메타데이터나 신호에 의존하지 않는다. 두 가지 유형이 있다: 하나는 AI 분류기로, 딥러닝을 사용하여 생성 모델의 고유한 통계적 특성을 인식한다; 다른 하나는 통계적 증거로, 픽셀 수준의 노이즈 분포 및 구조적 이상(예: AI 얼굴의 생리적 불일치)을 분석한다.

문제는 블록체인 자체가 이러한 체인 외부 정보를 인식할 수 없다는 것이다. 분류 결과는 반드시 외부 분류기에 의해 제공되어야 한다. 체인에 올리는 것은 이 결과를 고정하는 것일 뿐, 기록 제출 후 변조되지 않도록 보장할 수 있지만, 기록이 작성될 때 진짜인지 보장할 수는 없다. 외부 검출기가 잘못 판단하면 블록체인은 잘못된 정보를 영구적으로 저장하게 된다. 즉, 블록체인이 제공하는 것은 "선언의 무결성"이지 "선언이 진실임을 검증하는 것"이 아니다.

콘텐츠 출처 추적은 디지털 자산이 생성된 이력을 기록하는 것이다. C2PA와 같은 산업 표준은 제작자나 장치가 미디어에 암호학적 서명이 포함된 메타데이터(콘텐츠 증명)를 부여하여 출처, 저자 및 후속 편집을 기록하게 한다. Numbers Protocol, Starling Lab 등은 블록체인을 사용하여 이러한 증명의 공개 불변 등록부를 만든다.

그러나 체인에 고정된 건전한 출처 추적 시스템이 있더라도 콘텐츠가 처음에 인간인지 AI에 의해 생성되었는지를 보장할 수는 없다.

사용자는 AI가 생성한 이미지를 고해상도 화면에 표시한 후, C2PA에 부합하는 카메라로 촬영하여 서명이 유효하고 "실제 촬영"으로 표시된 파일을 얻을 수 있다. 텍스트도 마찬가지로, AI가 생성한 후 수동으로 규정 준수 편집기에 다시 입력하면 "인간 창작"의 합법적인 출처 정보가 포함된다.

또한 콘텐츠가 체인 기록과 일치하지 않도록 수정되면 출처가 끊어지며, 모든 콘텐츠를 포괄하는 일반 등록부는 가시적인 미래에 거의 불가능하게 나타날 것이므로, 출처 시스템에는 필연적으로 많은 결함이 존재할 것이다.

요점: 좁은 의미에서 블록체인은 출처 메타데이터에 대한 건전한 무결성 보장을 제공할 수 있지만, AI 생성 콘텐츠 검출 문제의 완전한 해결책은 아니다.

실제로 효과적인 솔루션은 모든 콘텐츠가 신뢰할 수 있는 장치로 캡처되고 즉시 체인에 올려지는 일반 생태계를 필요로 하며, 현실에서는 대다수 콘텐츠가 암호학적 고정을 지원하지 않는 도구로 생성되고 공유되며, 미표기 콘텐츠는 여전히 모호한 지대에 있다.

오해 2: 블록체인 또는 분산화가 AI의 편견 및 공정성 문제를 해결할 수 있다

"모델 추론 및 훈련을 체인에 올리면 AI의 불공정성과 편견을 해결할 수 있다"는 광범위한 주장을 평가하려면, 먼저 다양한 유형의 편견을 구분해야 한다.

알고리즘 편견은 AI 분야에서 가장 흔한 공정성 개념이다. 모델은 데이터 세트의 불균형을 학습하거나 심지어 확대하여, 판별 모델이 약자 집단에서 저조한 성능을 보이거나 생성 모델이 훈련 데이터의 부정적인 경향(예: 유해한 언어, 고정관념)을 이어받게 된다.

학계에서는 훈련 시 및 추론 시(보호 장치)의 기술적 솔루션을 제안했지만, 이러한 보호는 완벽하지 않으며, 공정성은 여전히 해결되지 않은 문제로, 영원히 완전히 해결되지 않을 수도 있다. "공정성을 정의하는 방법" 자체도 많은 선택을 요구한다.

분산화는 알고리즘 편견을 해결할 수 없다. 이는 훈련 과정 자체에서 발생하며, 일반적으로 훈련 또는 추론 기술을 개선하여 완화해야 하며, 분산화는 근본 원인에 접근할 수 없다.

그러나 편견의 두 번째 출처는 모델 성능에 영향을 미치는 고위 결정이다: 어떤 데이터를 사용할 것인지, 어떤 구조를 사용할 것인지, 기여자에게 어떻게 보상할 것인지. 이 층은 AI 분야에서 일반적으로 이해하는 공정성과는 정교하게 교차하지만, 알고리즘 편견에 영향을 미칠 수 있으며, 일부는 분산화의 두 가지 특성을 통해 개선할 수 있다.

첫 번째 특성은 투명성이다. 개발자는 블록체인을 사용하여 훈련 데이터, 훈련 알고리즘, 모델 체크포인트 및 추론 보호 장치를 공개적으로 약속할 수 있으며, 운영자는 특정 훈련 또는 추론의 출력을 추적할 수 있다.

그러나 이는 대형 모델 및 체크포인트와 같은 훈련 시 생성물에 확장하기 어렵다(저장 및 계산 비용이 너무 높다). 기존 시스템에서는 이러한 데이터가 대부분 체인 외부에 존재하며, 사용자는 직접 접근할 수 없다. 단기적으로 투명성의 이점은 추론 단계에만 국한될 수 있다.

더 중요한 것은, 업계가 이러한 투명성이 어떤 사용 사례를 위해 제공되어야 하는지, 어떤 인터페이스를 제공해야 하는지(예: 사용자가 데이터가 부당하게 사용되었다고 신고할 수 있도록 하려면, 진정한 데이터 소유권을 확립하고 기계적 망각 등의 기술을 갖춰야 한다) 명확히 하지 않는 한, 투명성 자체가 사람들이 AI를 개발하고 사용하는 방식을 변화시킬 수는 없다.

두 번째 특성은 분산 거버넌스이다. 두 가지 유형을 구분해야 한다. 첫 번째는 블록체인 내에서 탐색되고 채택된 커뮤니티 거버넌스 메커니즘(토큰 가중 투표, 유동 민주주의, 후자는 투표를 신뢰할 수 있는 사람에게 위임할 수 있는 것을 의미)이다. 두 번째는 DAO가 대표하는 분산 자치 거버넌스, 즉 스마트 계약이 거버넌스 결정을 강제적으로 실행하는 것이다.

두 가지의 공통된 핵심은 커뮤니티 거버넌스와 같은 메커니즘은 블록체인 없이도 구현할 수 있다는 것이다. 따라서 이를 "블록체인이 해결한 AI 문제"라고 하는 것은 부정확하다. 기술적이고 성능에 민감한 AI 결정은 광범위한 투표에 적합하지 않지만, 가치 지향적 결정(예: 모델 정렬)은 더 적합하다. 주류 AI 개발자는 이를 탐색했지만, 아직 실제로 구현되지 않았다.

스마트 계약이 강제로 실행하는 체인 상 거버넌스(직접 실행 또는 스테이킹 벌금)는 견고성을 강화할 수 있지만, 체인 상 투명성과 동일한 기술 장벽에 직면해 있다. 현재 인프라는 AI의 저장 및 계산 요구를 지원하지 않으며, 실제로 구현되려면 검증 가능한 훈련의 중대한 발전이 필요하다. 이는 자가 일관성이 있지만 시기상조인 장기 비전이다.

요점: 블록체인 자체는 알고리즘 편견을 줄이지 않지만, AI 생애 주기의 각 단계에서 투명성을 촉진하고 AI 거버넌스의 참여를 확대할 수 있다.

오해 3: AI 에이전트에게 지갑을 주면 자율적으로 된다

"에이전트 지갑" 및 결제 프로토콜을 만드는 프로젝트는 종종 AI 에이전트에게 지갑을 주고 스스로 벌고, 쓰고, 스스로 "살아가게" 하면 자율적으로 된다고 주장한다. 이러한 주장은 몇 가지 다른 개념을 혼동한다.

모호함은 "자율"이 두 개의 분야에서 다른 의미를 가진다는 데서 비롯된다. AI 맥락에서 자율 에이전트는 자신의 인식, 학습 및 경험에 기반하여 행동할 수 있는 것을 의미하며, 사전 설정된 규칙을 고수하는 것이 아니다. 스마트 계약도 자율적이라고 불리지만, 강조하는 것은 변조 저항성, 검열 저항성 및 종료 저항성이다.

전자는 "지능적 자율성"이라고 하고, 후자는 "실행 자율성"이라고 한다. 현대 AI 에이전트는 상당한 지능적 자율성을 가지고 있지만, 반드시 실행 자율성을 가지고 있는 것은 아니다. 관리자는 여전히 그것을 실행하는 서버를 종료할 수 있다.

에이전트 지갑이 가져오는 것은 두 가지 자율성이 아니다. 지갑을 소유한다고 해서 AI가 더 똑똑해지거나 인위적 조작이나 종료에 저항할 수 있게 되는 것은 아니다. 그것이 가져오는 것은 자동화이다: 에이전트는 프로그래밍 방식으로 거래하고, 송금하며, 체인 상 시설을 호출할 수 있으며, 인위적 승인 절차를 거치지 않아도 된다.

이러한 자동화는 블록체인에만 국한되지 않으며, 중앙 집중식 금융 인프라도 에이전트가 프로그래밍 방식으로 호출할 수 있다. 더 확고한 해석은 블록체인 결제 시스템이 중앙 집중식 솔루션보다 더 강한 자율성을 제공한다는 것이다(비록 에이전트를 위해 특별히 설계된 것은 아니지만), 예를 들어 에이전트의 거래가 차별 대우를 받지 않도록 보장할 수 있다. 즉, 중립성과 검열 저항성을 제공한다.

요점: 에이전트 지갑은 AI 에이전트가 금융 인터페이스를 쉽게 호출하고 경제적 상호작용을 자동화하며 인위적 승인을 면제할 수 있게 하지만, 자동화는 자율성과 동일하지 않다. 지갑만으로는 에이전트가 인간의 통제를 벗어날 수 없으며(운영자는 여전히 그것이 의존하는 모델이나 시설을 종료할 수 있다), 자동화 결제는 블록체인 없이도 중앙 집중식 시스템에서도 구현할 수 있다.

블록체인 결제의 진정한 장점은 중립성과 검열 저항성으로, 결제가 억압되거나 간섭받을 우려가 있는 상황에 적합하다.

오해 4: 투명한 AI는 신뢰할 수 있는 AI이다

모델의 데이터 출처와 추론 기록을 체인에 올리는 것은 AI의 신뢰성을 보장하는 이상적인 도구처럼 보인다. 이 주장은 널리 인용되는 IBM 블로그에서 유래되었으며, AI 에이전트에도 확장되었다. 그러나 두 가지 층으로 나누어야 한다.

모델 층의 투명성 측면에서, 훈련 데이터 출처를 기록하는 것은 모델 생성에 대한 투명성을 가져오는 것처럼 보이지만, "데이터 출처 기록"과 "모델 행동 보장" 사이에는 거대한 간극이 있다.

첫째, 체인 상 기록은 단순한 기록일 뿐 출처의 증명이 아니다(훈련 세트 구성에 대한 증명은 별도의 기술이 필요하다).

둘째, 훈련 데이터를 완전히 이해하더라도 모델이 어떻게 행동할지를 판단할 수 없다. 훈련 과정과 계산 환경 또한 모델 행동을 결정하기 때문이다.

셋째, 데이터에서 모델로의 전체 프로세스를 이해하고 모델을 재현할 수 있다고 하더라도, 무작위 훈련의 본질적인 비결정성으로 인해 "훈련 프로세스를 통해 모델 가중치를 검증하는 것"은 원리적으로 불가능하다.

더욱이, 가중치를 확보하더라도 훈련 중에 심어진 백도어나 적대적 조작을 탐지할 수 있는 보편적으로 유효한 수단이 없으며, 모델 데이터와 훈련 정보를 체인에 기록한다고 해서 그 행동 특성이나 적대적 조작이 없음을 직접 보장할 수는 없다.

추론 층의 투명성 측면에서, 모델 입력과 해당 추론을 체인에 기록하는 것은 모델 사용에 대한 투명성을 가져오는 것처럼 보이지만, 블록체인은 거래를 투명하게 할 뿐 추론을 투명하게 하지는 않는다. "모델 X가 입력 Y에서 추론 Z를 얻었다"는 체인 상 기록은 Z의 신뢰성을 거의 증명할 수 없다.

왜냐하면 그것은 "정확한 실행"을 증명할 수 없기 때문이다(이 삼중항이 실제로 모델 X에 의해 규격에 따라 계산되었음을 증명하려면 TEE 또는 비싼 암호학적 수단이 필요하다). 또한 "모델이 신뢰할 수 있다"는 것을 증명할 수 없다.

설령 실행이 올바르다고 증명되더라도, 더 근본적인 문제는 모델 X의 전체 출처 기록이 그것이 사용자 기대나 업계 규범에 부합하는지를 의미적으로 증명할 수 없다는 것이다. 가중치 해시를 사용하여 모델을 지정하는 것은 보장이 더 약해지며, 모델의 신원은 모델의 신뢰성과 동일하지 않다.

블록체인은 특정 신뢰 목표에 유용할 수 있다. 예를 들어 기관이 오픈 소스 가중치 모델의 해시를 체인에 공개하여 변조되지 않은 참조로 삼아 사용자가 실제로 수정되지 않은 모델을 사용하고 있음을 확인할 수 있도록 한다. 유사한 변조 방지 로그 아이디어는 펌웨어 업데이트 기록 및 인증서 투명성(유사 블록체인 방식의 추가 로그를 유지하여 공개 감사 가능한 인증서 발급 기록)을 위해 사용된다.

요점: 모델 데이터 출처와 추론 기록을 체인에 올리는 것과 "모델 및 추론의 신뢰성을 보장하는 의미 있는 보장" 사이에는 여전히 상당한 간극이 존재한다.

오해 5: 분산화는 AI 작업을 더 저렴하게 만든다

일부 프로젝트는 분산 네트워크를 더 효율적이고 저렴한 AI 솔루션으로 간주하며, 전형적인 예는 분산 물리적 인프라 네트워크(DePIN)로, 사용자가 자신의 하드웨어(예: GPU)를 임대하여 주된 판매 포인트는 비용을 절감하는 것이다. DePIN의 GPU를 임대하는 것이 동급의 클라우드 서비스 제공업체에서 임대하는 것보다 저렴할 수 있다.

그러나 저렴한 기계가 반드시 더 낮은 작업 총 비용을 가져오는 것은 아니다. 분산 노드는 공용 네트워크 통신을 통해 AI 작업의 처리량 및 지연 요구가 총 비용에 상당한 영향을 미치며, 초대형 작업(예: 최첨단 모델 훈련)은 일반적으로 처리량 병목 현상에 의해 제약을 받는다.

현재 직접적인 비용 비교는 어렵다. 업계는 여전히 시스템적인 기준 테스트가 부족하여 DePIN의 AI 작업과 전통적인 클라우드의 성능 및 비용을 동일한 기준으로 비교할 수 없다.

요점: 분산 네트워크는 고비용 중앙 집중식 클라우드의 매력적인 대안 옵션이지만, 현재 데이터는 특정 작업이 DePIN 또는 분산 AI 플랫폼에서 중앙 집중식 클라우드보다 저렴할 시점을 예측하기에 충분하지 않다.

소규모 작업(추론, 소규모 훈련)은 더 저렴할 가능성이 높지만, 초대형 작업(기본 모델 훈련)은 노드 간 불안정하고 낮은 대역폭의 통신으로 인해 영향을 받을 수 있다. 이러한 균형을 명확히 하려면 여전히 더 많은 연구가 필요하다.

이 다섯 가지 오해의 공통점은 블록체인이 제공할 수 있는 것은 "무결성"과 "검증 가능성"이 더 많지, "진실성"이나 "신뢰성" 자체는 아니라는 것이다. Crypto x AI는 여전히 증거로 말해야 하며, 서사에 의존해서는 안 되는 초기 단계에 있다.

Join ChainCatcher Official

Telegram Feed: @chaincatcher

X (Twitter): @ChainCatcher_

위험 경고