Grok音声モードはデバイスのカメラによるリアルタイム分析をサポートしました。
ChainCatcher のメッセージによると、マスクがリツイートしたツイートで、Grok の音声モードがカメラアクセスによるコンテンツ認識をサポートするようになったとのことです。ユーザーはスマートフォンを何かに向けて「私は何を見ていますか?」と尋ねることができます。
iOS の視覚機能により、チャットボットはデバイスのカメラを通じて現実世界の物体、テキスト、環境をリアルタイムで分析できます。ユーザーは製品、ロゴ、文書など、何でもスキャンでき、Grok は即座にコンテキスト情報と関連情報を提供します。








