QRコードをスキャンしてダウンロードしてください。
BTC $60,888.88 -1.98%
ETH $1,565.43 -6.12%
BNB $575.01 -3.22%
XRP $1.09 -3.43%
SOL $62.59 -6.00%
TRX $0.3199 -1.99%
DOGE $0.0818 -3.07%
ADA $0.1586 -3.31%
BCH $217.34 -2.78%
LINK $7.38 -2.96%
HYPE $58.92 -5.33%
AAVE $61.73 -5.32%
SUI $0.7171 -1.07%
XLM $0.1990 +4.47%
ZEC $365.77 +15.74%
BTC $60,888.88 -1.98%
ETH $1,565.43 -6.12%
BNB $575.01 -3.22%
XRP $1.09 -3.43%
SOL $62.59 -6.00%
TRX $0.3199 -1.99%
DOGE $0.0818 -3.07%
ADA $0.1586 -3.31%
BCH $217.34 -2.78%
LINK $7.38 -2.96%
HYPE $58.92 -5.33%
AAVE $61.73 -5.32%
SUI $0.7171 -1.07%
XLM $0.1990 +4.47%
ZEC $365.77 +15.74%

OpenAIの社員がxAIの最新AIモデルGrok3のベンチマーク結果が誤解を招くものであると公然と非難した。

2025-02-23 11:03:04
コレクション

ChainCatcher のメッセージによると、金十の報道で、OpenAI の社員がマスク氏の xAI 社を公然と非難し、同社が発表した最新の AI モデル Grok3 のベンチマーク結果が誤解を招くものであると述べました。これに対し、xAI の共同創業者イゴール・バブシキン(Igor Babushkin)は、同社に不正はないと主張しました。

xAI のグラフは、Grok3 の二つのバージョン------Grok3 Reasoning Beta と Grok3 mini Reasoning------が AIME 2025 で OpenAI の現在最強の利用可能なモデル o3-mini-high を上回るパフォーマンスを示していることを示しています。しかし、OpenAI の社員はすぐに X プラットフォーム上で、xAI のグラフには o3-mini-high の "cons@64" 条件下での AIME 2025 スコアが含まれていないことを指摘しました。

バブシキンは X プラットフォーム上で、OpenAI も過去に類似の誤解を招くベンチマークグラフを発表したことがあると主張しました。これらのグラフは、自社のモデルのパフォーマンスを比較するために使用されていました。

app_icon
ChainCatcher Building the Web3 world with innovations.