扫码下载
BTC $63,580.78 +2.20%
ETH $1,690.07 +3.67%
BNB $605.01 +1.83%
XRP $1.17 +2.62%
SOL $67.12 +2.94%
TRX $0.3258 -0.47%
DOGE $0.0868 +2.33%
ADA $0.1696 +4.30%
BCH $211.53 -5.92%
LINK $8.01 +3.28%
HYPE $64.13 +9.45%
AAVE $64.17 +1.79%
SUI $0.7637 +2.46%
XLM $0.2000 -2.51%
ZEC $447.58 +6.41%
BTC $63,580.78 +2.20%
ETH $1,690.07 +3.67%
BNB $605.01 +1.83%
XRP $1.17 +2.62%
SOL $67.12 +2.94%
TRX $0.3258 -0.47%
DOGE $0.0868 +2.33%
ADA $0.1696 +4.30%
BCH $211.53 -5.92%
LINK $8.01 +3.28%
HYPE $64.13 +9.45%
AAVE $64.17 +1.79%
SUI $0.7637 +2.46%
XLM $0.2000 -2.51%
ZEC $447.58 +6.41%

马斯克认同 AI 训练数据已耗尽的观点,并称合成数据将成未来方向

2025-01-09 19:18:27
收藏

ChainCatcher 消息,据 TechCrunch 报道,埃隆·马斯克在与 Stagwell 董事长 Mark Penn 的直播对话中表示,目前 AI 模型的训练已基本耗尽真实世界的数据,“我们已经用尽了人类知识的累积总和,这在去年就发生了。”马斯克与前 Open AI 首席科学家 Ilya Sutskever 的观点一致,后者在 NeurIPS 机器学习大会上提出 AI 行业已达到“数据峰值”,未来可能需要改变模型开发方式。

马斯克认为,合成数据将是补充真实数据的途径, AI 将通过生成和自我评估数据实现自我学习。这一趋势已被包括微软、 Meta 、Open AI 和 Anthropic 等科技巨头采用,如微软 Phi -4 模型和谷歌 Gemma 模型都结合了真实数据和合成数据进行训练。 Gartner 预测,2024年 AI 和分析项目中约 60% 的数据将为合成生成。

合成数据的优势包括成本节约,例如 AI 初创公司 Writer 仅花费约 70 万美元开发其几乎完全基于合成数据的 Palmyra X 004 模型,相比之下,类似规模的 Open AI 模型开发成本约为 460 万美元。然而,合成数据也存在风险,包括模型创造力下降、输出偏差加剧,以及潜在的模型崩溃,尤其当训练数据本身存在偏差时,生成结果也可能受到影响。

app_icon
ChainCatcher 与创新者共建Web3世界