掃碼下載
BTC $60,800.75 -0.97%
ETH $1,565.20 -2.02%
BNB $574.10 -0.46%
XRP $1.09 -1.22%
SOL $62.05 -3.68%
TRX $0.3240 +1.12%
DOGE $0.0817 -0.99%
ADA $0.1569 -0.89%
BCH $216.77 +2.48%
LINK $7.38 -0.63%
HYPE $56.66 -5.89%
AAVE $60.69 -3.44%
SUI $0.7171 -0.24%
XLM $0.2117 +3.61%
ZEC $365.53 -7.53%
BTC $60,800.75 -0.97%
ETH $1,565.20 -2.02%
BNB $574.10 -0.46%
XRP $1.09 -1.22%
SOL $62.05 -3.68%
TRX $0.3240 +1.12%
DOGE $0.0817 -0.99%
ADA $0.1569 -0.89%
BCH $216.77 +2.48%
LINK $7.38 -0.63%
HYPE $56.66 -5.89%
AAVE $60.69 -3.44%
SUI $0.7171 -0.24%
XLM $0.2117 +3.61%
ZEC $365.53 -7.53%

OpenAI 員工公開指責 xAI 最新 AI 模型 Grok3 的基準測試結果具有誤導性

2025-02-23 11:03:04
收藏

ChainCatcher 消息,据金十報導,OpenAI 的一名員工公開指責馬斯克旗下的xAI公司,稱其發布的最新 AI 模型 Grok3 的基準測試結果具有誤導性。對此,xAI 的聯合創始人伊戈爾・巴布什金(Igor Babushkin)則堅稱公司並無不當。

xAI 的圖表顯示,Grok3 的兩個版本------Grok3 Reasoning Beta 和 Grok3 mini Reasoning------在 AIME 2025 上的表現超過了 OpenAI 當前最強的可用模型 o3-mini-high。然而,OpenAI 的員工很快在 X 平台上指出,xAI的圖表並未包含 o3-mini-high 在"cons@64"條件下的 AIME 2025 得分。

巴布什金在 X 平台上辯稱,OpenAI 過去也曾發布過類似的誤導性基準測試圖表。儘管這些圖表是用於比較其自身模型的表現。

app_icon
ChainCatcher 與創新者共建Web3世界