Grok 4って結局ChatGPTと何が違うの？

昨日イーロン・マスクが新しいAI「Grok 4」を発表したんだけど、X（旧Twitter）のライブ配信で「今までで一番賢いAI」って自慢してた。月30ドルでChatGPTより高いけど、性能の差がはっきりしてるらしい。

なんか面白いなと思ったのが、Grok 4 Heavyっていう上位版。複数のAIが同時に問題を解いて、それぞれの答えを比較して一番いい答えを選ぶんだって。勉強会みたいに色んな視点から検討するから、ミスが減るらしいよ。

大学院生より賢いって本当なの？

普通のバージョンでも大学院生より賢いって評価されてるみたい。SATとかGREみたいな試験で満点取ったし、特にARC-AGIテストで15.9%っていう業界最高スコアを記録したんだって。他のAIはまだ一桁台のスコアしか取れないらしいから、けっこうすごいよね。

独立した評価機関でも73点取って、OpenAI o3（70点）、Google Gemini 2.5 Pro（70点）、Claude 4 Opus（64点）より高かったって。Humanity's Last Examっていう難しいテストでも、ツール使用時に41〜50.7%を記録したらしい。これはかなりの成果なんだって。

本一冊分を一気に読み込めるって便利そう

25万6千トークンまで入力できるから、膨大な文書もまるごと分析できるんだって。論文とかレポート全体を入れて「要約して」って頼めばすぐ整理してくれるみたい。学生とか会社員にはめちゃくちゃ便利そうだよね。

音声での会話もできて、感情表現までできるらしい。ささやいたり歌ったりもできるって、なんか不思議。Xプラットフォームと連携してて、リアルタイムの情報もすぐ反映されるから、最新ニュースとかトレンドの把握にも良さそう。

紫のグラデーション背景に「GROK 4 - The World's Most Powerful AI Model」と表示された発表画面

値段はちょっと高いけど、性能は確かみたい

普通のGrok 4は月30ドル（年300ドル）、Heavyバージョンは月300ドル（年3,000ドル）。Heavyバージョンは10倍も高いけど、マルチエージェント機能があるから専門家とかが使いそうだね。

マスクによると、今回のモデルは従来の100倍も多いコンピューターリソースを使って学習したんだって。20万個のGPUを使うColossusスーパーコンピューターで訓練したって、規模がやばいよね。

画像も一緒に入力できるマルチモーダル機能もあるから、写真の内容を説明してもらったり、チャートを分析してもらったりもできるみたい。APIでも提供されるから、開発者も自分のサービスに簡単に組み込めそう。

これからAI使うならGrok 4も選択肢に入るかも

正直、月30ドルは気軽に試せる値段じゃないけど、仕事とか勉強で本格的にAI使うなら検討する価値はありそう。特に複雑な問題を解いたり、大量の文書を処理したりする人には向いてるかも。

まだリリースされたばかりだから、実際の使い勝手はこれから分かってくるだろうけど、ChatGPTとかClaudeに満足してない人は注目してもいいかもね。とりあえずXでの発表動画とか見てみると、どんな感じか分かるよ。

ソウルメモ

このブログを検索