昨日イーロン・マスクが新しいAI「Grok 4」を発表したんだけど、X(旧Twitter)のライブ配信で「今までで一番賢いAI」って自慢してた。月30ドルでChatGPTより高いけど、性能の差がはっきりしてるらしい。
なんか面白いなと思ったのが、Grok 4 Heavyっていう上位版。複数のAIが同時に問題を解いて、それぞれの答えを比較して一番いい答えを選ぶんだって。勉強会みたいに色んな視点から検討するから、ミスが減るらしいよ。
大学院生より賢いって本当なの?
普通のバージョンでも大学院生より賢いって評価されてるみたい。SATとかGREみたいな試験で満点取ったし、特にARC-AGIテストで15.9%っていう業界最高スコアを記録したんだって。他のAIはまだ一桁台のスコアしか取れないらしいから、けっこうすごいよね。
独立した評価機関でも73点取って、OpenAI o3(70点)、Google Gemini 2.5 Pro(70点)、Claude 4 Opus(64点)より高かったって。Humanity's Last Examっていう難しいテストでも、ツール使用時に41〜50.7%を記録したらしい。これはかなりの成果なんだって。
本一冊分を一気に読み込めるって便利そう
25万6千トークンまで入力できるから、膨大な文書もまるごと分析できるんだって。論文とかレポート全体を入れて「要約して」って頼めばすぐ整理してくれるみたい。学生とか会社員にはめちゃくちゃ便利そうだよね。
音声での会話もできて、感情表現までできるらしい。ささやいたり歌ったりもできるって、なんか不思議。Xプラットフォームと連携してて、リアルタイムの情報もすぐ反映されるから、最新ニュースとかトレンドの把握にも良さそう。
値段はちょっと高いけど、性能は確かみたい
普通のGrok 4は月30ドル(年300ドル)、Heavyバージョンは月300ドル(年3,000ドル)。Heavyバージョンは10倍も高いけど、マルチエージェント機能があるから専門家とかが使いそうだね。
マスクによると、今回のモデルは従来の100倍も多いコンピューターリソースを使って学習したんだって。20万個のGPUを使うColossusスーパーコンピューターで訓練したって、規模がやばいよね。
画像も一緒に入力できるマルチモーダル機能もあるから、写真の内容を説明してもらったり、チャートを分析してもらったりもできるみたい。APIでも提供されるから、開発者も自分のサービスに簡単に組み込めそう。
これからAI使うならGrok 4も選択肢に入るかも
正直、月30ドルは気軽に試せる値段じゃないけど、仕事とか勉強で本格的にAI使うなら検討する価値はありそう。特に複雑な問題を解いたり、大量の文書を処理したりする人には向いてるかも。
まだリリースされたばかりだから、実際の使い勝手はこれから分かってくるだろうけど、ChatGPTとかClaudeに満足してない人は注目してもいいかもね。とりあえずXでの発表動画とか見てみると、どんな感じか分かるよ。