CZ는 한 중국계 3학년 학생에게 1,100만 달러의 시드 라운드를 투자하여 교육 에이전트를 운영합니다
원문 제목:《자오창펑이 한 중국계 3학년 학생에게 1100만 달러의 시드 라운드 투자, 교육 에이전트 사업을 시작하다》
원문 저자:지크 공원의 창업자 커뮤니티 Founder Park
중국계 3학년 학생이 1100만 달러의 시드 라운드를 통해 실리콘밸리 학생 창업 중 가장 높은 자금을 모은 제품을 선보였다.
개인 맞춤형 교육/강의 비디오를 한 문장으로 생성할 수 있는 K12 교육 에이전트 제품 VideoTutor가 오늘 1100만 달러의 시드 라운드 자금을 완료했다고 발표했다. 이번 라운드는 YZi Labs가 주도하고, 바이두 벤처, 진추 펀드, 아미노 캐피탈, 브릿지원 캐피탈 및 여러 유명 투자자들이 공동으로 참여했다.
이는 YZi Labs가 투자한 첫 번째 AI 제품 회사이기도 하다.
창립자 카이 자오(赵凯)는 VideoTutor가 CZ 및 YZi Labs 투자팀의 인정을 받았으며, 결국 YZi Labs가 이번 라운드를 주도하게 되었다고 밝혔다. 그들은 10개 이상의 TS(투자 의향서)를 받았고, 최종적으로 이 몇 개의 회사들을 선택했다.
5월 14일 첫 번째 제품 버전을 출시(Founder Park 제품 마켓에서 최초 발표)한 후, 시장의 인정을 받았고 PMF(제품-시장 적합성)의 검증을 받았다. 5개월이 채 안 되는 시간 안에 1100만 달러의 시드 라운드 자금을 완료했다.
카이는 그들이 이 자금을 확보할 수 있었던 핵심 이유는 방향이 올바른 전제 하에, "작은 천재 팀"이 시각적 학습 방식을 통해 K12 분야의 미국 대학 입시 학습의 고충을 해결했기 때문이라고 생각한다.
"이 분야는 젊은이들이 하기 적합하며, 매우 뛰어난 공학적 실무 능력과 창립자가 매우 좋은 통찰력과 경험을 가지고 있어 실행력이 매우 빠릅니다."
그들뿐만 아니라 Cursor, Mercor, Pika, GPTZero 등 실리콘밸리의 대학생들이 하나하나 새로운 자금 조달 기록을 세우는 AI 제품을 통해 AI 창업에 대한 인식을 새롭게 하고 있다.
AI 시대의 창업은 정말로 다르게 변하고 있다.
우리는 VideoTutor의 이 젊은이들과 대화를 나누며 그들이 어떻게 이 시드 라운드 자금을 확보할 수 있었는지, 현재 실리콘밸리 창업에서 어떤 변화가 일어나고 있는지, 그리고 왜 그들이 국내 대기업 직원들을 채용하고 싶어하는지 알아보았다.
인터뷰 게스트:CEO 카이 자오, CTO 제임스 잔.
인터뷰 및 편집 | 만후
다음은 인터뷰 내용으로, Founder Park에서 편집 및 정리한 것이다.

K12 분야, 시각적 학습이 진정한 방향
Founder Park:이렇게 많은 기관들이 여러분을 높이 평가하는데, 여러분이 보기에는 어떤 핵심 포인트가 그들을 감동시켰나요?
Kai:우선 방향이 올바르다고 생각합니다. AI 교육이라는 분야는 매우 잠재력과 전망이 큽니다. 우리가 진입한 교육 분야는 미국 대학 입시 SAT, AP입니다. 목표로 하는 사용자 집단은 K12의 고등학생이며, 우리는 이 사용자 집단과의 간극이 매우 작고 기본적으로 세대 차이가 없습니다. 우리는 전체 준비 학습 주기를 거쳤고, 시험과 준비의 고충이 어디에 있는지 알고 있으며, 이 집단의 고충을 진정으로 해결할 수 있는 제품을 만들 수 있습니다.
둘째, 팀이 매우 우수합니다. 제임스는 제미니 출신으로 구글에서 AI 엔지니어와 알고리즘의 핵심 엔지니어로 일했습니다. 저는 세 번의 교육 창업 경험이 있으며, 대학교 1학년 때부터 교육 소프트웨어를 창업했고, 2학년 동안 MathGPTPro를 공동 창립하여 그 프로젝트가 기적 창업 대회에 선정되었습니다. 교육 제품을 성공적으로 구축한 경험이 있습니다.
셋째, 우리가 하는 AI 교육 분야의 핵심은 애니메이션 엔진이며, 우리는 VideoTutor의 핵심 개발자로서 핵심 기술을 가장 잘 이해하는 팀입니다. 애니메이션 엔진을 매우 정밀하게 렌더링할 수 있습니다.
팀 자체에 매우 좋은 마케팅 유전자가 있어 어떻게 홍보할지 알고 있습니다.
VideoTutor는 미국 주류 VC의 투자 공감대인 "작은 천재 팀"에 매우 부합합니다. 이는 이 분야가 젊은이들이 하기 적합하며, 매우 뛰어난 공학적 실무 능력과 창립자가 매우 좋은 통찰력과 경험을 가지고 있어 실행력이 매우 빠르다는 것을 의미합니다. 저는 이것이 모든 투자자들이 긍정적으로 평가할 수 있는 공감대의 이유라고 생각합니다.

VideoTutor가 YZi Labs EASY Residency Demo Day에서 뉴욕 증권 거래소에 등장하다
Founder Park:여러분의 제품은 교육 산업의 어떤 핵심 문제를 해결하고자 하나요?
Kai:현재 시장에 있는 학습 제품은 두 가지로 나눌 수 있습니다: 능동 학습 제품과 수동 학습 제품입니다. 수동 학습 제품은 바이트의 Gauth, Chegg, AnswersAi 등으로, 우리가 "숙제 해결"이라고 부르는 장면을 포괄하며, 학습 경로가 매우 짧고 주로 학생들이 숙제를 해결하기 위해 비용을 지불합니다.
반면 VideoTutor는 능동 학습 장면을 포괄합니다. 우리는 학생들의 학습 동기를 고려할 필요가 없습니다. 왜냐하면 그들은 반드시 학습하고 시험을 봐야 하기 때문입니다. 예를 들어 미국 대학 입시 SAT, AP와 같은 경우입니다. 이 장면에서는 시각적 고충 수요가 대량으로 존재합니다. 미국 대학 입시의 80%는 함수, 미적분 등 복잡한 이미지 렌더링이 필요한 지식을 포함합니다. VideoTutor의 애니메이션 엔진은 이 장면을 매우 잘 해결할 수 있습니다.

게다가 이 분야의 고객 단가는 매우 높습니다. 미국에서는 매년 260만 명의 학생이 SAT 시험을 치르며, 유료 수요가 매우 큽니다. 오프라인 SAT 과정은 매우 비쌉니다. 패키지로 요금을 부과하는 것이 아니라 시간당 요금을 부과하며, 평균적으로 시간당 150달러부터 시작하고 대부분은 230달러입니다. 많은 학생과 부모가 유료 학습을 선택합니다. 그러나 VideoTutor는 교사의 교육을 잘 대체하거나 심지어 대체할 수 있습니다. 현재 AI가 생성한 비디오와 교사의 교육 내용은 거의 차이가 없기 때문입니다. 이렇게 되면 학생들은 최소한의 비용으로 자신의 AI 개인화된 시험 준비 선생님을 가질 수 있습니다.
Founder Park:당시 이 제품을 만들기로 결정한 계기는 무엇인가요?
Kai:사실 우리가 시작하기 전에 스탠포드에서 Gatekeep Ai라는 팀이 이미 있었습니다. 그들은 시각적 학습을 하고 싶어했습니다. 저는 이 방향의 영향력을 이미 인식하고 있었습니다. 이전 몇 번의 창업에서 모두가 교육 제품을 만들 때 기본적으로 GPT의 API를 연결하는 방식으로, 일종의 ChatGPT Wrapper 제품과 유사했습니다. 그러나 우리는 단순히 텍스트 기반의 질문과 답변에 기반한 제품은 한계가 있다는 것을 발견했습니다. Chegg, Gauth와 같은 비즈니스가 감소하고 있는 것을 볼 수 있습니다. 많은 장면이 ChatGPT에 의해 대체되었기 때문입니다. 학생들은 20달러를 지불하고 ChatGPT를 사용하여 많은 숙제 문제를 해결할 수 있습니다.
API 기반의 최적화 제품은 이미 한계에 도달했습니다.
하지만 다중 모달 비주얼 생성은 매우 큰 전망이 있습니다. 왜냐하면 미국 대학 입시 분야에는 매우 많은 시각적 학습 장면이 있기 때문입니다. 안타깝게도 Gatekeep는 좋은 시작을 했지만 계속 진행하지 못했습니다. 그들이 출시한 시점이 너무 이르렀고, 당시의 기본 모델 프로그래밍 능력이 아직 성숙하지 않았으며, GPT-4도 출시되지 않았습니다. 게다가 수학 애니메이션 엔진은 렌더링과 알고리즘과 관련이 있어 그들은 이를 해결하지 못했습니다. 그러나 우리 팀은 애니메이션 엔진의 모든 핵심 개발을掌握하고 이 문제를 해결하여 비디오 렌더링을 매우 정확하게 만들었습니다.
PMF:사용자의 유료 의지가 매우 강함
Founder Park:여러분이 제품을 출시한 후 몇몇 학교와 협력하게 되었는데, 여러분이 보기에는 언제 또는 어떤 기능이 "내가 이 제품을 제대로 만들었다, 고충을 잘 찾았다"라고 느끼게 했나요? PMF를 찾았다고 느낀 시점은 언제인가요?
Kai:세 가지 차원에서 이야기할 수 있습니다.
첫째, 수익 지표 차원에서 현재까지 VideoTutor는 1000개 기업의 API 요청을 받았으며, 미국의 모든 유명 대형 교육 기관을 포함하고 있습니다. 심지어 국내 기관들도 있습니다. 또한 많은 학교들이 서비스를 구매하고 싶어합니다. C단 사용자들의 의향은 더 직접적입니다. 한 학생의 부모는 투자자이기도 한데, 그는 제품을 체험한 후 모든 친척과 친구들에게 제품을 사용해 보라고 했습니다. 모두가 기꺼이 비용을 지불하겠다고 했습니다. 그리고 그는 어디서 내 전화번호를 얻었는지 모르겠지만, 저에게 문자를 보내 투자하고 싶다고 했습니다. C단 사용자들은 매우 강한 유료 의지를 가지고 있습니다.
둘째, 사용자 요구 측면에서 미국의 오프라인 1대1 튜터 교육이 그렇게 강한 이유는 무엇인가요? 부모들이 1대1 교육의 효과가 좋다고 생각하고 이 비용을 지불하고 싶어하기 때문입니다. 현재 다중 모달 AI 기술은 인간화된 1대1 교육 효과를 구현할 수 있으며, 질문한 대로 대답할 수 있습니다. 게다가 미국의 온라인 1대1 교육 선생님이 녹화한 수업은 사실 AI가 생성한 비디오와 차이가 없습니다. 제가 말하는 "수요 평행 이동"입니다. 학생들이 비싼 가격을 지불하고 구매하는 녹화된 강의는 AI가 생성한 것과 차이가 없으니, 왜 AI를 사용하지 않겠습니까? 비용이 더 낮고 교육 효과가 더 좋습니다.
우리는 많은 학생들로부터 매우 긍정적인 피드백을 받았으며, 많은 선생님들도 이 제품을 전파하고 싶어합니다. 초기의 완주율과 사용 시간도 특히 좋습니다. 현재 우리가 선별한 200명의 시드 사용자는 모두 초기 누적된 사용자들입니다.
셋째, 제품의 맛과 감각입니다. 여러분이 지속적으로 작업하면서 교육 산업의 발전, 학생과 부모의 유료 핵심 요구 사항, 그리고 제품 자체의 진화를 통해 전체 논리가 폐쇄 루프가 되어 돌아옵니다. 그래서 이 세 가지 차원에서 보면 PMF가 이미 충분하다고 느낍니다. 가장 핵심적인 것은 유료 의지가 매우 강하다는 것입니다.

FIZZ와 협력하게 되었다
Founder Park:많은 사용자들이 자발적으로 비용을 지불하고 싶어하며, 일부는 여러분에게 투자하고 싶어 연락을 해옵니다.
Kai:맞습니다. SAT, AP 분야는 본래 유료 의지가 매우 강합니다. 이 분야의 고객 단가는 100에서 200달러에 달하며, 오프라인 수업은 더 비쌉니다. 아마도 800달러가 필요할 것입니다. 미국에는 260만 명의 학생이 SAT를 치르며, 그 중 37%의 학생들이 자발적으로 비용을 지불합니다. 이는 유료 의지와 수요가 매우 강한 시장입니다. 우리의 제품은 매우 좋은 수요 평행 이동을 실현할 수 있습니다.
Founder Park:SAT 이 분야에서 수험생에게 진짜 선생님과 AI 중 누가 더 신뢰를 받을까요?
Kai:현재 AI가 미국 대학 입시 SAT, AP 수준의 문제에 답변할 때 사실적인 오류가 거의 발생하지 않습니다. 이러한 상황에서 AI가 오프라인 튜터보다 더 나은 이유는 무엇인가요? 첫째, 저렴하고, 둘째, 학생들은 어떤 질문이든 계속 질문할 수 있으며, 바보 같은 질문을 했을 때 선생님이 어떻게 생각할지 걱정할 필요가 없습니다. 언제 어디서나 24시간 학습할 수 있습니다.
게다가 이 시장은 평행 이동이 가능합니다. 미국 시장을 마친 후, 우리는 캐나다, 영국의 A-Level 시험 등으로 평행 이동할 수 있으며, 유료 수요가 매우 큽니다.
Founder Park:현재 비용 측면에서 어떻게 고려하고 있나요?
Kai:우리는 월 구독제로 운영하고 있으며, 또 하나는 학습 결과에 따라 비용을 지불하는 방식입니다. 현재 AI는 결과에 따라 비용을 지불할 수 있는 수준에 도달했다고 생각합니다. 우리는 799달러를 지불하면 자녀가 SAT 수학에서 만점을 받을 수 있도록 보장하는 패키지를 출시할 수 있습니다.
Founder Park:하지만 시험 결과에 따라 비용을 지불하는 것은 학생 개인의 능동성에 따라 달라지지 않나요?
Kai:이것은 중국의 대학 입시에서는 불가능할 수 있습니다. 왜냐하면 대학 입시는 매우 많은 평가 포인트가 있으며, 수천 개가 있기 때문입니다. 그러나 미국 대학 입시 SAT는 62개의 평가 포인트가 있으며, 그 중 50개는 일반적인 평가 포인트로 대부분의 학생들이 문제를 겪지 않습니다. 나머지 12개 평가 포인트도 기본적으로 습득할 수 있습니다. 학생의 논리 수준에 문제가 없다면 기본적으로 학습하지 못할 상황은 존재하지 않습니다. 그리고 AI의 효율성 향상 효과는 매우 뚜렷합니다.
사실 많은 미국 온라인 튜터들도 이 서비스를 제공하고 있습니다. 여러분이 선생님에게 1800달러를 지불하면, 선생님이 아이를 지도해주고 성공률은 기본적으로 100%입니다. 왜냐하면 SAT의 평가 포인트는 고정되어 있기 때문입니다. 학생의 지능 수준이 정상이라면 기본적으로 문제가 없습니다. 그러나 대학 입시는 그렇지 않습니다. 대학 입시는 단기간에 성적을 올릴 수 없습니다. 그리고 중국의 대학 입시는 점수 차이를 벌려야 하며, 어려운 문제가 있을 수 있지만, 미국 대학 입시는 절대적인 어려운 문제가 존재하지 않습니다. 왜냐하면 그것은 주로 여러분이 지식 포인트를 얼마나 잘 이해했는지를 평가하기 때문입니다.
결과에 따라 비용을 지불하는 것도 이전의 교재 보조 선생님들이 이미 사용하고 있는 모델로, 이 전제 조건이 필요합니다.
Founder Park:그렇다면 여러분의 가격 책정에서 모델 비용이 문제가 될까요? 비율이 높나요?
Kai:우리가 있는 이 분야의 고객 단가는 매우 높게 설정되어 있으며, 69달러부터 시작합니다. 모델 비용은 현재 매우 저렴하여 문제가 되지 않습니다. 교육 산업은 코딩 분야와 다릅니다. 왜냐하면 코딩은 긴 맥락을 지원해야 하므로 가격 경쟁이 심하기 때문입니다.
고등학생을 위한 제품, 웹 버전이 가장 중요하다
Founder Park:기억하기로는 여러분이 첫 번째 버전의 프로토타입을 만드는 데 두 달 정도 걸렸다고 하셨습니다. 당시 전체 개발 주기, 예를 들어 분업, 어떤 기능을 할지, 어떤 기능을 하지 않을지에 대한 고려는 어떻게 하셨나요?
Kai:우리 팀 모든 사람의 공감대는 빠른 반복이었습니다. 왜냐하면 빠르게 해야 초기 사용자 피드백을 빠르게 받을 수 있기 때문입니다.
첫 번째 버전을 트위터에 올린 후 큰 반향을 일으켰고, 많은 사용자를 끌어들였습니다. 그러나 이 사용자들 중 많은 수가 프로그래머, 투자자 또는 기술 애호가들로, 우리는 이들을 "기술 체험자"라고 부를 수 있습니다. 그 단계에서 그들로부터 받은 피드백은 다소 분산되어 있어 가치가 크지 않았습니다. 여전히 이렇게 많은 광범위한 사용자들 중에서 진정한 핵심 시드 사용자를 선별해야 했습니다. 즉, 고품질의 고등학생을 선별하고, 상담 방식을 통해 유용한 피드백을 얻어야 했습니다.
우리가 얻은 핵심 피드백은 비디오 렌더링의 정확성이 100%에 도달해야 한다는 것이며, 이는 최적화의 최우선 사항입니다. UI가 예쁘거나 다양한 TTS 음색 선택을 지원하는 기능은 모두 제거되었습니다. 제품의 핵심으로 돌아가면, 우리는 이과 장면의 지식 학습을 하고 있으므로 그래픽 렌더링의 정확성이 핵심입니다.
Founder Park:생성 시간은 당시 어떻게 조정하셨나요?
Kai:그 당시 가장 높은 피크 시간은 약 6분이었습니다. 당시의 주요 고려 사항은 일반 문제의 설명과 지식 포인트 설명이 6분을 넘지 않아야 한다는 것이었습니다. 그러나 후속 피드백에서 우리는 일부 학습 능력이 그리 좋지 않은 학생들이 내용을 좀 더 천천히, 깊이 있게 설명해주기를 원한다는 것을 발견했습니다. 우리는 시간에 제한을 두지 말고, 오히려 사용자의 학습 능력에 따라 달라져야 한다고 인식하게 되었습니다.
Founder Park:현재 가장 긴 시간은 얼마나 되나요?
Kai:가장 긴 시간은 한 시간 이내여야 하며, 계속해서 질문할 수 있습니다. 대화하면서 실시간으로 생성할 수 있습니다. 그러나 이 기능은 최근에 추가된 것이며, 처음 버전에는 없었습니다.
Founder Park:당시 만들고 싶었지만 나중에 중요하지 않다고 판단하여 하지 않은 기능이 있나요?
Kai:예를 들어 앱입니다. 처음에는 앱을 빠르게 개발해야 할지 고민했지만, 나중에 미국의 대부분 학생들이 기본적으로 노트북이나 iPad로 학습하고 있다는 것을 발견했습니다. 미국의 대부분 K12 학교는 학생들에게 Chromebook을 제공하며, 컴퓨터 사용이 매우 보편화되어 있습니다. 고등학생들은 기본적으로 각자 컴퓨터를 가지고 있으며, 학습 장면에서 스마트폰의 비율은 5%도 안 됩니다.
Founder Park:따라서 교육이나 학생 집단을 주로 겨냥한 제품이라면 웹 버전이 가장 먼저 만들어져야 하고, 앱은 그리 중요하지 않다는 것이군요.
Kai:맞습니다. 당시 이미 이 데이터를 알고 있었습니다. 결국 미국에서 오랜 시간 공부했기 때문입니다. 이후 우리는 초기 몇 만 명의 사용자 중 100명의 학생을 조사하여 이 100명 중 90명 이상이 컴퓨터를 가지고 있다는 것을 확인했습니다.
Founder Park:여러분이 첫 번째 버전을 출시할 때도 K12 집단을 겨냥했나요?
Kai:네, 이후에도 이 집단을 겨냥했습니다. 우리는 Gauth와 경쟁 제품이 아니며, 우리는 주로 시험 준비 장면을 다룹니다. 미국의 많은 고등학생들이 오프라인 교육이나 온라인 학습 플랫폼을 선택하고 있으며, VideoTutor는 이 수요를 잘 평행 이동시켰습니다.
**Founder Park:K12















