Foresight Ventures: 탈중앙화 AI 마켓플레이스의 최고의 시도

포사이트 벤처스

2023-07-05 16:41:15

수집

저자: Ian, Foresight Ventures

TL;DR

성공적인 탈중앙화 AI 마켓플레이스는 AI와 Web3의 장점을 긴밀히 결합해야 하며, 분산형, 자산 소유권, 수익 분배 및 탈중앙화 컴퓨팅 파워의 부가 가치를 활용하여 AI 애플리케이션의 진입 장벽을 낮추고, 개발자가 모델을 업로드하고 공유하도록 장려하며, 사용자 데이터의 개인 정보 보호를 보장하여 개발자 친화적이고 사용자 요구를 충족하는 AI 자원 거래 및 공유 플랫폼을 구축해야 합니다.
데이터 기반 AI 마켓플레이스는 더 큰 잠재력을 가지고 있습니다. 모델에 집착하는 마켓플레이스는 고품질 모델의 지원이 필요하지만 초기 플랫폼은 사용자 기반과 우수한 자원이 부족하여 뛰어난 모델 제공자의 인센티브가 부족하고 고품질 모델을 유치하기 어렵습니다. 반면 데이터 기반 마켓플레이스는 탈중앙화를 통해 분산적으로 데이터를 수집하고 인센티브 레이어 설계 및 데이터 소유권 보장을 통해 가치 있는 데이터와 자원을 대량으로 축적할 수 있습니다. 특히 개인 영역 데이터에서 그렇습니다. 그러나 데이터 마켓도 데이터 개인 정보 보호 문제를 해결해야 하며, 해결책에는 사용자 맞춤형 개인 정보 수준 설정을 허용하는 더 유연한 정책 설계가 포함됩니다.
탈중앙화 AI 마켓플레이스의 성공은 사용자 자원의 축적과 강력한 네트워크 효과에 의존하며, 사용자와 개발자가 시장에서 얻는 가치는 그들이 시장 외부에서 얻을 수 있는 가치를 초과해야 합니다. 시장 초기에는 우수한 모델을 축적하여 사용자 유치 및 유지에 집중하고, 이후 우수한 모델 라이브러리와 데이터 장벽을 구축한 후 더 많은 최종 사용자를 유치하고 유지하는 방향으로 전환해야 합니다. 또한 우수한 AI 마켓플레이스는 각 이해관계자의 균형점을 찾아 데이터 소유권, 모델 품질, 사용자 개인 정보, 컴퓨팅 파워, 인센티브 알고리즘 등의 요소를 적절히 처리해야 합니다.

1. Web3의 AI Marketplace

1.1 web3 분야의 AI 경로 회고

먼저 제가 이전에 언급한 AI와 암호화폐의 결합 두 가지 큰 방향, ZKML과 탈중앙화 컴퓨팅 네트워크를 회고해 보겠습니다.

ZKML

ZKML은 AI 모델을 투명하고 검증 가능하게 만들어 줍니다. 즉, 모델 아키텍처, 모델 파라미터와 가중치, 모델 입력 이 세 가지 요소가 전체 네트워크에서 검증될 수 있도록 보장합니다. ZKML의 의미는 탈중앙화와 신뢰 없는 기반을 희생하지 않고 Web3 세계에 다음 단계의 가치를 창출하고 더 넓은 응용 프로그램을 수용하고 더 큰 가능성을 창출할 수 있는 능력을 제공하는 것입니다.

Foresight Ventures: AI + Web3 = ?

컴퓨팅 네트워크

컴퓨팅 자원은 다음 10년의 전쟁터가 될 것이며, 향후 고성능 컴퓨팅 인프라에 대한 투자는 기하급수적으로 증가할 것입니다. 탈중앙화 컴퓨팅의 응용 시나리오는 모델 추론과 모델 훈련 두 가지 방향으로 나뉘며, AI 대형 모델 훈련에 대한 수요가 가장 크지만, 동시에 가장 큰 도전과 기술적 병목 현상에 직면해 있습니다. 복잡한 데이터 동기화 및 네트워크 최적화 문제 등이 포함됩니다. 모델 추론에서는 더 많은 기회가 있으며, 미래의 증가 공간도 충분히 큽니다.

1.2 AI Marketplace란 무엇인가?

AI 마켓플레이스는 그리 새로운 개념이 아닙니다. Hugging Face는 가장 성공적인 AI 마켓플레이스라고 할 수 있습니다(거래 및 가격 책정 메커니즘이 없다는 점을 제외하고). NLP 분야에서 Hugging Face는 개발자와 사용자가 다양한 사전 훈련 모델을 공유하고 사용할 수 있는 매우 중요한 활성 커뮤니티 플랫폼을 제공합니다.

Hugging Face의 성공에서 볼 수 있듯이, AI 마켓플레이스는 다음과 같은 요소를 갖추어야 합니다:

a. 모델 자원

Hugging Face는 다양한 NLP 작업을 포괄하는 많은 사전 훈련 모델을 제공합니다. 이러한 자원의 풍부함은 많은 사용자를 끌어들이며, 이는 활성 커뮤니티를 형성하고 사용자 축적의 기초가 됩니다.

b. 오픈 소스 정신 + 전파 공유

Hugging Face는 개발자가 자신의 모델을 업로드하고 공유하도록 장려합니다. 이러한 개방적 공유 정신은 커뮤니티의 활력을 높이고 최신 연구 결과가 빠르게 많은 사용자에게 활용될 수 있도록 합니다. 이는 우수한 개발자와 모델을 축적하는 기반 위에서 연구 결과의 검증 및 확산 효율을 가속화합니다.

c. 개발자 친화적 + 사용 용이성

Hugging Face는 사용하기 쉬운 API와 문서를 제공하여 개발자가 제공된 모델을 빠르게 이해하고 사용할 수 있도록 합니다. 이는 사용 장벽을 낮추고 사용자 경험을 향상시켜 더 많은 개발자를 끌어들입니다.

비록 Hugging Face는 거래 메커니즘이 없지만, 여전히 AI 모델의 공유와 사용을 위한 중요한 플랫폼을 제공합니다. 따라서 AI 마켓플레이스는 전체 산업의 귀중한 자원이 될 기회를 가지고 있습니다.

탈중앙화 AI 마켓플레이스 요약:

위의 요소를 바탕으로, 탈중앙화 AI 마켓플레이스는 블록체인 기술을 기반으로 하여 사용자가 자신의 데이터와 모델 자산에 대한 소유권을 가집니다. Web3가 가져오는 가치는 인센티브와 거래 메커니즘에 반영되며, 사용자는 자유롭게 모델을 선택하거나 시스템을 통해 적합한 모델을 매칭받을 수 있으며, 자신이 훈련한 모델을 상장하여 수익을 얻을 수 있습니다.

사용자는 자신의 AI 자산에 대한 소유권을 가지며, AI 마켓플레이스 자체는 데이터와 모델에 대한 통제권이 없습니다. 반대로, 시장의 발전은 사용자 수와 그에 따른 모델 및 데이터의 축적에 의존합니다. 이러한 축적은 장기적인 과정이지만, 제품 장벽을 점진적으로 구축하는 과정이기도 하며, 시장 발전을 지탱하는 것은 사용자 수와 사용자가 업로드한 모델 및 데이터의 수량/품질입니다.

1.3 왜 Web3의 AI Marketplace에 주목해야 하는가?

1.3.1 컴퓨팅 응용의 큰 방향과의 일치

통신 압력 등의 이유로 탈중앙화 컴퓨팅이 기본 모델 훈련에 적용되기 어려울 수 있지만, 미세 조정(finetune)에서는 압력이 훨씬 적기 때문에 중앙 집중식 컴퓨팅 네트워크가 적용될 수 있는 최적의 시나리오 중 하나가 될 수 있습니다.

배경 지식: 왜 미세 조정 단계가 더 쉽게 적용될 수 있는가

Foresight Ventures: 탈중앙화 컴퓨팅 네트워크를 이성적으로 바라보기

AI 모델의 훈련은 사전 훈련(pretraining)과 미세 조정(fine-tuning)으로 나뉩니다. 사전 훈련은 대량의 데이터와 많은 계산을 포함하며, 구체적인 내용은 제가 위에서 분석한 글을 참고하시기 바랍니다. 미세 조정은 기본 모델을 기반으로 특정 작업의 데이터를 사용하여 모델 파라미터를 조정하여 특정 작업에 대해 더 나은 성능을 발휘하도록 합니다. 모델 미세 조정 단계에서 필요한 계산 자원은 사전 훈련 단계보다 훨씬 적습니다. 주된 이유는 다음과 같습니다:

데이터 양: 사전 훈련 단계에서는 모델이 일반적인 언어 표현을 학습하기 위해 대규모 데이터 세트에서 훈련해야 합니다. 예를 들어, BERT 모델의 사전 훈련은 수십억 개의 단어를 포함하는 Wikipedia와 BookCorpus에서 수행되었습니다. 반면 미세 조정 단계에서는 모델이 일반적으로 특정 작업의 소규모 데이터 세트에서 훈련됩니다. 예를 들어, 감정 분석 작업을 위한 미세 조정 데이터 세트는 몇 천 개에서 몇 만 개의 리뷰만 필요할 수 있습니다.
훈련 단계 수: 사전 훈련 단계에서는 수백만 또는 수십억 단계의 훈련이 필요하지만, 미세 조정 단계에서는 일반적으로 몇 천에서 몇 만 단계만 필요합니다. 이는 사전 훈련 단계에서 언어의 기본 구조와 의미를 학습해야 하기 때문이며, 미세 조정 단계에서는 특정 작업에 적합하도록 모델의 일부 파라미터만 조정하면 되기 때문입니다.

예를 들어, GPT-3의 경우 사전 훈련 단계에서 45TB의 텍스트 데이터를 사용하여 훈련했으며, 미세 조정 단계에서는 약 5GB의 데이터만 필요합니다. 사전 훈련 단계의 훈련 시간은 몇 주에서 몇 개월이 걸리지만, 미세 조정 단계는 몇 시간에서 며칠이면 충분합니다.

1.3.2 AI와 암호화폐의 교차점

Web3 프로젝트가 합리적인지 판단하는 데 중요한 점 중 하나는, 그것이 암호화폐를 위한 암호화폐인지, 프로젝트가 Web3가 가져오는 가치를 최대한 활용하고 있는지, Web3의 부가 가치가 차별화를 가져오는지입니다. 분명히 Web3는 이러한 AI 마켓플레이스에 대체 불가능한 소유권, 수익 분배 및 컴퓨팅 파워의 부가 가치를 제공합니다.

저는 훌륭한 Web3 AI 마켓플레이스가 AI와 암호화폐를 긴밀히 결합할 수 있다고 생각합니다. 가장 완벽한 결합은 AI 시장이 Web3에 어떤 응용 프로그램이나 인프라를 제공하는 것이 아니라, Web3가 AI 시장에 무엇을 제공할 수 있는가입니다. 예를 들어, 각 사용자가 자신의 AI 모델과 데이터에 대한 소유권을 가질 수 있으며(예: AI 모델과 데이터를 NFT로 포장), 이를 상품으로 거래할 수 있는 것은 Web3가 발휘할 수 있는 가치를 잘 활용하는 것입니다. 이는 AI 개발자와 데이터 제공자를 자극할 뿐만 아니라 AI의 응용을 더욱 광범위하게 만듭니다. 만약 모델이 충분히 유용하다면, 소유자는 다른 사람과 공유하기 위해 업로드할 동기가 더욱 강해집니다.

동시에, 탈중앙화 AI 마켓플레이스는 모델, 데이터의 판매 및 임대, 작업 크라우드소싱 등 새로운 비즈니스 모델을 도입할 수 있습니다.

1.3.3 AI 애플리케이션의 진입 장벽 낮추기

모든 사람은 자신의 인공지능 모델을 훈련할 수 있는 능력을 가져야 하며, 이를 위해서는 충분히 낮은 진입 장벽을 가진 플랫폼이 자원 지원을 제공해야 합니다.

1.3.4 수요와 공급

대형 모델은 강력한 추론 능력을 가지고 있지만 만능은 아닙니다. 특정 작업과 시나리오에 맞춰 미세 조정하면 더 나은 결과를 얻을 수 있으며, 더 강력한 실용성을 갖추게 됩니다. 따라서 수요 측면에서 사용자는 다양한 시나리오에서 유용한 모델을 얻기 위해 AI 모델 시장이 필요하며, 개발자는 모델을 개발하기 위해 막대한 자원 편의성을 제공하는 플랫폼이 필요하고, 자신의 전문 지식을 통해 수익을 얻어야 합니다.

2. 모델 기반 vs 데이터 기반

2.1 모델 시장

모델

툴링을 판매 포인트로 하여, 체인의 첫 번째 고리로서 프로젝트는 초기 단계에서 충분한 모델 개발자를 유치하여 우수한 모델을 배포하여 시장에 공급을 구축해야 합니다.

이러한 모델에서는 개발자를 유치하는 주요 포인트는 편리하고 사용하기 쉬운 인프라와 툴링이며, 데이터는 개발자의 능력에 따라 달라지며, 특정 분야에서 경험이 있는 사람들이 가치를 창출할 수 있는 이유입니다. 이 분야의 데이터는 개발자가 직접 수집하고 성능이 더 좋은 모델로 미세 조정해야 합니다.

생각

최근 AI 마켓플레이스와 Web3의 결합에 대한 많은 프로젝트를 보았지만, 저는 탈중앙화 AI 모델 시장을 만드는 것이 과연 진정한 과제인지 고민하게 됩니다.

먼저 우리는 Web3가 제공할 수 있는 가치가 무엇인지 생각해야 합니다.

단순히 토큰의 인센티브나 모델의 소유권 서사만으로는 충분하지 않습니다. 실제로 플랫폼에서 고품질 모델은 전체 제품의 핵심이며, 우수한 모델은 일반적으로 매우 높은 경제적 가치를 의미합니다. 모델 제공자의 관점에서 그들은 자신의 우수한 모델을 AI 마켓플레이스에 배포할 충분한 동기가 필요하지만, 토큰과 소유권이 제공하는 인센티브가 그들이 모델 가치에 대한 기대를 충족할 수 있을까요? 초기 사용자 기반이 부족한 플랫폼에서는 분명히 불가능합니다. 뛰어난 모델이 없다면 전체 비즈니스 모델은 성립하지 않습니다. 따라서 문제는 초기 사용자 부족 상황에서 모델 제공자가 충분한 수익을 얻도록 하는 것입니다.

2.2 데이터 시장

모델

탈중앙화 데이터 수집을 기반으로 하여, 인센티브 레이어 설계와 데이터 소유권 서사를 통해 더 많은 데이터 제공자를 onboard하고, 데이터에 레이블을 붙이는 사용자도 포함됩니다. 암호화폐의 지원을 통해 플랫폼은 일정 기간 내에 많은 가치 있는 데이터를 축적할 기회를 가집니다. 특히 현재 부족한 개인 영역 데이터에서 그렇습니다.

제가 가장 흥미롭게 생각하는 점은 이러한 하향식 발전 모델이 크라우드 펀딩의 방식과 유사하다는 것입니다. 아무리 경험이 많은 사람이라도 특정 분야의 완벽한 데이터를 보유할 수는 없습니다. Web3가 제공하는 가치 중 하나는 무허가 및 탈중앙화된 데이터 수집입니다. 이 모델은 각 분야의 전문 지식과 데이터를 집중시킬 수 있을 뿐만 아니라, 더 큰 사용자 집단에 AI 서비스를 제공할 수 있습니다. 단일 사용자의 데이터와 비교할 때, 이러한 크라우드 소싱 데이터는 많은 실제 사용자들의 실제 시나리오에서 수집된 것이므로, 단일 출처에서 수집된 데이터보다 현실 세계의 복잡성과 다양성을 더 잘 반영할 수 있습니다. 이는 모델의 일반화 능력과 강인성을 크게 향상시켜 AI 모델이 다양한 환경에서 높은 성능을 발휘할 수 있도록 합니다.

예를 들어, 한 사람이 영양학에 대한 풍부한 경험을 가지고 많은 데이터를 축적했더라도, 개인의 데이터만으로는 우수한 모델을 훈련하기에 충분하지 않습니다. 사용자가 데이터를 공유하는 동시에, 플랫폼에서 동일한 분야의 다른 사용자들이 기여한 가치 있는 데이터에 잘 접근하고 활용할 수 있어 더 나은 미세 조정 효과를 얻을 수 있습니다.

생각

이 관점에서 탈중앙화 데이터 시장을 만드는 것도 좋은 시도일 수 있습니다. 데이터는 더 낮은 진입 장벽과 더 짧은 생산 경로, 더 넓은 제공자 밀도를 가진 "상품"으로서 Web3가 제공할 수 있는 가치를 더 잘 활용할 수 있습니다. 인센티브 알고리즘과 데이터 소유권 메커니즘은 사용자가 데이터를 업로드하도록 동기를 부여할 수 있습니다. 현재의 모델에서는 데이터가 일회성 상품처럼 보이며, 한 번 사용한 후에는 거의 가치가 없습니다. 탈중앙화 AI 모델 시장에서는 사용자의 데이터가 반복적으로 사용되고 이익을 얻을 수 있으며, 데이터의 가치는 더 장기적으로 실현될 수 있습니다.

데이터를 통해 사용자를 축적하는 것은 좋은 선택인 것 같습니다. 대형 모델의 핵심 및 장벽 중 하나는 우수하고 다차원적인 데이터입니다. 많은 데이터 제공자를 onboard한 후, 이들은 최종 사용자 또는 모델 제공자로 전환될 기회를 가질 수 있습니다. 이러한 기반 위에 AI 마켓플레이스는 실제로 우수한 모델에 대한 기본 가치를 제공하여 알고리즘 엔지니어가 플랫폼에서 모델을 기여하도록 동기를 부여할 수 있습니다.

이러한 동기는 0에서 1로의 변화입니다. 현재 대기업은 방대한 데이터를 보유하고 있어 더 정확한 모델을 훈련할 수 있으며, 이는 소규모 기업과 개인 개발자가 경쟁하기 어렵게 만듭니다. 사용자가 특정 분야에서 매우 가치 있는 데이터를 보유하고 있더라도, 이 작은 데이터 조각이 더 큰 집합의 데이터와 결합되지 않으면 가치를 발휘하기 어렵습니다. 그러나 탈중앙화된 시장에서는 모든 사람이 데이터에 접근하고 사용할 수 있는 기회를 가지며, 이러한 전문가들이 가치 있는 증분 데이터를 플랫폼에 추가하므로 플랫폼의 데이터 품질과 양이 더욱 향상됩니다. 이는 모든 사람이 우수한 모델을 훈련할 수 있는 가능성을 높이고, AI 혁신을 촉진할 수 있습니다.

데이터 자체는 이러한 AI 마켓플레이스의 경쟁 장벽이 되기에 적합합니다. 우수한 인센티브 레이어와 안전한 개인 정보 보호는 더 많은 소규모 투자자가 전체 프로토콜에 참여하여 데이터를 기여할 수 있게 합니다. 또한 사용자 수가 증가함에 따라 데이터의 품질과 양도 지속적으로 향상될 것입니다. 이는 커뮤니티와 네트워크 효과를 생성하여 시장이 제공할 수 있는 가치를 더욱 확대하고, 신규 사용자에 대한 매력을 높이는 과정이 됩니다.

따라서 본질적으로 데이터 기반 AI 마켓플레이스를 잘 구축하기 위해 가장 중요한 것은 다음 4가지입니다:

인센티브 레이어: 사용자에게 고품질 데이터를 제공하도록 효과적으로 유도하는 알고리즘을 설계하고, 인센티브의 강도와 시장의 지속 가능성을 균형 있게 조정해야 합니다.
개인 정보 보호: 데이터 개인 정보를 보호하고 데이터 사용 효율성을 보장해야 합니다.
사용자: 초기 단계에서 사용자를 신속하게 축적하고 더 많은 가치 있는 데이터를 수집해야 합니다.
데이터 품질: 데이터는 다양한 출처에서 오며, 효과적인 품질 관리 메커니즘을 설계해야 합니다.

왜 모델 제공자가 이 시나리오에서 핵심 요소로 나열되지 않았는가?

주요 이유는 위의 네 가지 요소에 기반하여 우수한 모델 제공자가 참여하는 것은 자연스러운 결과이기 때문입니다.

2.3 데이터 시장의 가치와 도전

개인 영역 데이터

개인 영역 데이터의 가치는 특정 분야 내에서 독특하고 얻기 어려운 정보를 포함하고 있으며, 이러한 정보는 AI 모델의 미세 조정에 특히 중요합니다. 개인 영역 데이터를 사용하면 더 정확하고 개인화된 모델을 생성할 수 있으며, 이러한 모델은 특정 시나리오에서 공공 데이터 세트를 사용하여 훈련한 모델보다 더 나은 성능을 발휘할 수 있습니다.

현재 기본 모델 구축 과정에서 대량의 공공 데이터를 수집할 수 있으므로, Web3 데이터 시장의 발력점은 이러한 데이터에 있지 않습니다. 훈련 과정에서 개인 영역 데이터를 어떻게 확보하고 추가할 것인가는 현재의 병목 현상이며, 개인 영역 데이터와 공공 데이터 세트를 결합함으로써 모델이 다양한 문제와 사용자 요구에 적응할 수 있는 능력과 모델의 정확도를 높일 수 있습니다.

예를 들어 의료 건강 시나리오를 들면, 개인 영역 데이터를 사용하는 AI 모델은 예측 정확도를 보통 10%에서 30%까지 향상시킬 수 있습니다. 스탠포드의 연구를 참고하면, 개인 영역 의료 데이터를 사용하는 딥러닝 모델은 폐암 예측에서 공공 데이터 모델보다 15% 더 높은 정확도를 보였습니다.

데이터 개인 정보 보호

개인 정보 보호가 AI + Web3의 병목 현상이 될 수 있을까요? 현재의 발전을 보면, AI가 Web3에 적용되는 방향은 점차 명확해지고 있지만, 모든 응용 프로그램이 개인 정보 보호 문제를 피할 수 없는 것 같습니다. 탈중앙화 컴퓨팅은 모델 훈련이나 모델 추론에서 데이터와 모델의 개인 정보를 보장해야 합니다. zkml이 성립하기 위한 조건 중 하나는 모델이 악의적인 노드에 의해 남용되지 않도록 보장하는 것입니다.

AI 마켓플레이스는 사용자가 자신의 데이터를 통제할 수 있도록 보장하는 기반 위에 구축되므로, 사용자 데이터를 탈중앙화되고 분산된 방식으로 수집했더라도 모든 노드는 원시 데이터에 직접 접근해서는 안 됩니다. 현재의 암호화 수단은 사용에서 병목 현상에 직면해 있으며, 전동형 동형 암호(FHE)의 경우:

계산 복잡성: FHE는 전통적인 암호화 방식보다 더 복잡하여, 전동형 동형 암호 하에서 AI 모델 훈련의 계산 비용이 크게 증가하여 모델 훈련의 효율성이 극도로 낮아지거나 심지어 불가능해집니다. 따라서 대량의 계산 자원이 필요한 작업, 예를 들어 딥러닝 모델 훈련에서는 전동형 동형 암호가 이상적인 선택이 아닙니다.
계산 오차: FHE의 계산 과정에서 오차가 점차 누적되어 최종 계산 결과에 영향을 미치며, 이는 AI 모델의 성능에 영향을 미칠 수 있습니다.

개인 정보 보호는 수준이 다르며, 과도하게 걱정할 필요는 없습니다.

다양한 유형의 데이터는 서로 다른 수준의 개인 정보 보호 요구가 있습니다. 의료 기록, 금융 정보, 민감한 개인 정보 등은 높은 수준의 개인 정보 보호가 필요합니다.

따라서 탈중앙화 AI 마켓플레이스의 논의에서는 데이터의 다양성을 고려해야 하며, 가장 중요한 것은 균형을 맞추는 것입니다. 사용자 참여도와 플랫폼 자원의 풍부함을 극대화하기 위해, 사용자 맞춤형 개인 정보 수준 설정을 허용하는 더 유연한 정책을 설계하는 것이 필요합니다. 모든 데이터가 최고 수준의 개인 정보 보호가 필요한 것은 아닙니다.

3. 탈중앙화 AI Marketplace에 대한 반성

3.1 사용자가 자산에 대한 지배권을 가지면, 사용자가 철수할 경우 플랫폼이 붕괴될 수 있는가?

탈중앙화 AI 마켓플레이스의 장점은 사용자가 자원에 대한 소유권을 가지며, 사용자는 언제든지 자신의 자원을 철수할 수 있지만, 사용자가 자원(모델, 데이터)을 일정 수준 이상 축적하게 되면 플랫폼은 영향을 받지 않을 것이라고 생각합니다. 물론 이는 프로젝트 초기 단계에서 사용자와 자원을 안정시키기 위해 많은 자금을 소모해야 함을 의미하며, 초기 스타트업 팀에게는 매우 어려운 일이 될 것입니다.

커뮤니티 합의

탈중앙화 AI 마켓플레이스가 강력한 네트워크 효과를 형성하면, 더 많은 사용자와 개발자가 끈끈한 관계를 형성하게 됩니다. 또한 사용자 수의 증가로 인해 데이터와 모델의 품질과 수량이 증가하여 시장이 더욱 성숙해질 것입니다. 다양한 이해관계에 따라 동기 부여된 사용자들이 시장에서 얻는 가치가 커질수록, 적은 수의 사용자가 이탈할 수 있지만, 이러한 경우에도 신규 사용자의 증가 속도는 이론적으로 느려지지 않을 것이며, 시장은 여전히 발전하고 더 큰 가치를 제공할 수 있습니다.

인센티브 메커니즘

인센티브 레이어가 합리적으로 설계되면, 참여자가 증가하고 다양한 자원이 축적됨에 따라 각 측의 이익도 증가할 것입니다. 탈중앙화 AI 마켓플레이스는 사용자가 데이터와 모델을 거래할 수 있는 플랫폼을 제공할 뿐만 아니라, 사용자가 자신의 데이터와 모델에서 수익을 얻을 수 있는 메커니즘을 제공할 수 있습니다. 예를 들어 사용자가 자신의 데이터를 판매하거나 다른 사람이 자신의 모델을 사용하도록 하여 보상을 받을 수 있습니다.

모델 개발자에게는: 다른 플랫폼에서 배포할 경우 충분한 데이터 지원이 없어 미세 조정(finetune)하여 성능이 더 좋은 모델을 만들기 어려울 수 있습니다.

데이터 제공자에게는: 다른 플랫폼이 이처럼 완벽한 데이터 기반을 갖추지 못할 수 있으며, 사용자가 단독으로 소량의 데이터로는 가치를 발휘하고 충분한 사용량과 수익을 얻기 어려울 수 있습니다.

요약

탈중앙화 AI 마켓플레이스에서 프로젝트 측은 중개 및 플랫폼 제공 역할만 수행하지만, 실제 장벽은 사용자 수의 축적이 가져오는 데이터와 모델의 축적에 있습니다. 사용자는 시장에서 철수할 자유가 있지만, 성숙한 AI 마켓플레이스는 종종 그들이 시장에서 얻는 가치가 시장 외부에서 얻을 수 있는 가치를 초과하게 하여, 사용자들이 시장에서 철수할 동기가 없게 만듭니다.

그러나 만약 대다수 사용자 또는 일부 고품질 모델/데이터 제공자가 철수하기로 결정한다면, 시장은 영향을 받을 수 있습니다. 이는 다양한 경제 시스템에서 사용자 진입과 퇴출의 동적 변화와 조정이 존재하는 것과 일치합니다.

3.2 먼저 닭이 있나, 먼저 알이 있나

위의 두 가지 경로를 보면, 어떤 경로가 최종적으로 성공할지는 말하기 어렵지만, 데이터 기반 AI 마켓플레이스가 더 합리적이며, 그 한계는 첫 번째 경로보다 훨씬 높습니다. 가장 큰 차이는 데이터 기반 시장이 장벽을 지속적으로 강화하고, 사용자 축적 과정이 데이터 축적 과정이기도 하며, 궁극적으로 Web3가 부여하는 가치는 거대한 탈중앙화 데이터베이스를 더욱 충실하게 만드는 것입니다. 이는 긍정적인 순환입니다. 동시에 본질적으로 이러한 플랫폼은 데이터를 보존할 필요가 없으며, 데이터를 기여하는 시장을 제공하는 것이 더 경량적입니다. 결국 이는 대규모 데이터 집합 시장이 되는 것이며, 이러한 장벽은 대체하기 어렵습니다.

공급과 수요의 관점에서 볼 때, AI 마켓플레이스는 두 가지 조건을 모두 갖추어야 합니다:

많은 우수한 모델
최종 사용자

어떤 측면에서는 이 두 조건이 서로 의존적입니다. 한편으로는 플랫폼이 충분한 사용자 수를 확보하여 모델과 데이터 제공자에게 사용 동기를 제공해야 하며, 충분한 사용자 수가 축적되어야 인센티브 레이어가 최대 가치를 발휘하고 데이터의 플라이휠이 돌아가게 됩니다. 그래야 더 많은 모델 제공자가 모델을 배포할 수 있습니다. 다른 한편으로는 충분한 최종 사용자는 유용한 모델을 찾기 위해 플랫폼에 옵니다. 사용자가 플랫폼을 선택하는 것은 플랫폼 모델의 품질과 능력에 대한 선택이므로, 일정 수의 우수한 모델이 축적되지 않으면 이러한 수요는 존재하지 않습니다. 라우팅 알고리즘이 아무리 발전해도 좋은 모델이 없다면 라우팅도 공허한 이야기입니다. 이는 마치 애플 스토어가 애플 없이는 존재할 수 없는 것과 같습니다.

따라서 비교적 좋은 발전 방향은 다음과 같습니다:

초기 전략

우수한 모델 축적: 초기 단계에서 가장 주목해야 할 것은 우수한 모델 라이브러리를 구축하는 것입니다. 그 이유는 최종 사용자가 아무리 많아도 그들이 선택하고 사용할 수 있는 고품질 모델이 없다면 플랫폼은 매력을 잃고, 사용자도 끈끈함과 유지가 없을 것입니다. 우수한 모델 라이브러리를 구축하는 데 집중함으로써 플랫폼은 초기 사용자가 필요한 모델을 찾을 수 있도록 보장하여 브랜드 평판과 사용자 신뢰를 구축하고, 점진적으로 커뮤니티와 네트워크 효과를 형성할 수 있습니다.

확장 전략

최종 사용자 유치: 우수한 모델 라이브러리를 구축한 후, 더 많은 최종 사용자를 유치하고 유지하는 방향으로 전환합니다. 많은 사용자는 모델 개발자에게 지속적으로 모델을 제공하고 개선할 수 있는 충분한 동기와 이익을 제공합니다. 또한 많은 사용자는 대량의 데이터를 생성하여 모델의 훈련과 최적화를 더욱 향상시킵니다.

요약

AI 마켓플레이스의 최선의 시도는 무엇인가? 한 마디로 말하자면, 플랫폼이 충분히 많은 우수한 모델을 제공하고, 사용자에게 적합한 모델을 효율적으로 매칭하여 문제를 해결할 수 있어야 한다는 것입니다. 이 문장은 두 가지 모순을 해결합니다. 첫째, 플랫폼이 개발자(모델 개발자와 사용자 모두 포함)에게 충분한 가치를 제공하여 플랫폼에 충분한 우수한 모델을 보유하게 해야 합니다. 둘째, 이러한 "상품"이 사용자에게 효율적인 솔루션을 제공하여 더 많은 사용자를 축적하고, 각 이해관계의 이익을 보장해야 합니다.

탈중앙화 AI 마켓플레이스는 AI + Web3가 쉽게 적용될 수 있는 방향이지만, 프로젝트는 이러한 플랫폼이 제공할 수 있는 진정한 가치가 무엇인지, 그리고 초기 단계에서 어떻게 많은 사용자를 onboard할 것인지에 대해 명확히 해야 합니다. 이 과정에서 각 이해관계의 균형점을 찾고, 데이터 소유권, 모델 품질, 사용자 개인 정보, 컴퓨팅 파워, 인센티브 알고리즘 등의 여러 요소를 잘 처리하여 궁극적으로 데이터, 모델 및 컴퓨팅 파워의 공유 및 거래 플랫폼이 되어야 합니다.

위험 경고