Grok 4って結局ChatGPTと何が違うの?

昨日イーロン・マスクが新しいAI「Grok 4」を発表したんだけど、X(旧Twitter)のライブ配信で「今までで一番賢いAI」って自慢してた。月30ドルでChatGPTより高いけど、性能の差がはっきりしてるらしい。


なんか面白いなと思ったのが、Grok 4 Heavyっていう上位版。複数のAIが同時に問題を解いて、それぞれの答えを比較して一番いい答えを選ぶんだって。勉強会みたいに色んな視点から検討するから、ミスが減るらしいよ。


黒背景にxAIのロゴとGrok 4の白文字ロゴ


大学院生より賢いって本当なの?


普通のバージョンでも大学院生より賢いって評価されてるみたい。SATとかGREみたいな試験で満点取ったし、特にARC-AGIテストで15.9%っていう業界最高スコアを記録したんだって。他のAIはまだ一桁台のスコアしか取れないらしいから、けっこうすごいよね。


独立した評価機関でも73点取って、OpenAI o3(70点)、Google Gemini 2.5 Pro(70点)、Claude 4 Opus(64点)より高かったって。Humanity's Last Examっていう難しいテストでも、ツール使用時に41〜50.7%を記録したらしい。これはかなりの成果なんだって。


本一冊分を一気に読み込めるって便利そう


25万6千トークンまで入力できるから、膨大な文書もまるごと分析できるんだって。論文とかレポート全体を入れて「要約して」って頼めばすぐ整理してくれるみたい。学生とか会社員にはめちゃくちゃ便利そうだよね。


音声での会話もできて、感情表現までできるらしい。ささやいたり歌ったりもできるって、なんか不思議。Xプラットフォームと連携してて、リアルタイムの情報もすぐ反映されるから、最新ニュースとかトレンドの把握にも良さそう。


紫のグラデーション背景に「GROK 4 - The World's Most Powerful AI Model」と表示された発表画面

値段はちょっと高いけど、性能は確かみたい


普通のGrok 4は月30ドル(年300ドル)、Heavyバージョンは月300ドル(年3,000ドル)。Heavyバージョンは10倍も高いけど、マルチエージェント機能があるから専門家とかが使いそうだね。


マスクによると、今回のモデルは従来の100倍も多いコンピューターリソースを使って学習したんだって。20万個のGPUを使うColossusスーパーコンピューターで訓練したって、規模がやばいよね。


画像も一緒に入力できるマルチモーダル機能もあるから、写真の内容を説明してもらったり、チャートを分析してもらったりもできるみたい。APIでも提供されるから、開発者も自分のサービスに簡単に組み込めそう。


これからAI使うならGrok 4も選択肢に入るかも


正直、月30ドルは気軽に試せる値段じゃないけど、仕事とか勉強で本格的にAI使うなら検討する価値はありそう。特に複雑な問題を解いたり、大量の文書を処理したりする人には向いてるかも。


まだリリースされたばかりだから、実際の使い勝手はこれから分かってくるだろうけど、ChatGPTとかClaudeに満足してない人は注目してもいいかもね。とりあえずXでの発表動画とか見てみると、どんな感じか分かるよ。


月2.9万円のAIブラウザが昨日出たって?話題のCometを調べてみた