2026年4月版｜AIの進化をざっくり比較してみた

2025年、目覚ましい進化を遂げたAIは、今年に入ってから進化の加速をさらに早めました。

というわけで、300万トークン以上という時間を使って、お金を溶かし続けた私が、今のAI事情を比較・解説していこうと思います。

まずは、現時点での比較表です。

※評価基準：◎=2点、○=1点、△=0点、×=ー1点

順位	モデル	文章	コーディング	画像	推論力	合計
1位	Claude（Claude Code含む）	◎	◎	×	◎	5
2位	GPT (Codex含む)	○	○	◎	△	4
3位	Gemini（Nano Banana含む）	○	△	○	△	2
4位	X（Grokなど）	△	△	△	△	0
5位	Midjourney※	×	×	◎	×	-1

※芸術・アニメ系など用途限定

先月までは、GPTはコーディング△、画像〇で総合評価2点でGeminiと同率2位でしたが、今月のモデル改正で総合力で単独2位になりました。これについては後半に書きます。

まず、そもそもの話。現在のAIブームは、OpenAIが2022年11月にChatGPTを公開したことをきっかけに、一気に一般へ広がりました。

それを追いかけるように、Google、Claude、X（Grok）なども続き、各社がそれぞれの強みを出しながらAIを進化させてきました。これらはいずれもLLM（大規模言語モデル）と呼ばれており、今のAIブームを牽引するメインどころが勢揃いしてきた形です。

現在の主流の一角として存在感を持っているのがClaudeです。ClaudeはAnthropic社が開発したLLMで、同社の主要メンバーの多くは元OpenAI出身です。そこから独立してAnthropicを設立し、2023年にClaudeを公開しました。Claudeの最上位モデルは、その性能の高さから悪用リスクも指摘されており、現時点では提供先がかなり限定された形で運用されています。

このように、AI戦争で先行しながらも主導権をClaudeに持っていかれたOpenAIですが、今月、新たに「GPT-5.5」や「Image-2」といったモデルを発表しました。この性能は抜群で、特にImage-2は日本語の正確さ、画像の修正がガチャ頼りだったものが、非常に正確性に優れた画像生成モデルとなりました。

LLMの競争においてコード生成ではClaudeに一歩及ばないと判断したOpenAIは、動画生成（Sora）も諦め、画像生成の強化に舵を切ったと考えられます。今、GPTでこの記事を書いていますが、こう書いたら不服だそうで、「コードも頑張ってるわい」と言われました（笑）

推論力とは何か？

推論力とは前提条件を話さなくても会話が成立すること、または、あえて確認しなくてもお互い何について話しているか共有できることです。

人と人が話す場合は、これが前提となるので、主語が抜けていても、あるいは話のゴールがなんとなく分かったりします。

ところが、AIではそうはいきません。長々と前提条件を話さなければいけなかったり、目指していたゴールが違う場合も多々あります。

さらに厄介なのが、モデルが高性能になるほどこの問題が悪化するケースです。賢くなったAIは指示を「解釈」しようとするあまり、言った通りに動いてくれない。素直じゃなくなるんです。シンプルな指示ほど、余計な気を利かせて全然違う方向に進んでしまう、という逆転現象が起きます。

今回のGPT-5.5を検証したところでは、この行動が顕著に表れていました。なので今回の検証ではGPTの推論力は△とします。

では、次に、私がClaude Codeでした会話の一部をご覧ください。なぜ、Claudeだけ推論力が◎なのか分かります。

いかがでしょう？　ほぼ人です。まるで、ラインで話しているような気がして、時々、相手がAIであることを忘れます。

途中、「nanobanana捨てなくていいんじゃないですかね。」と言いますが、これが凄いとこで、他のAIにはマネができない推論力の高さを示しています。

ちなみに、Claude Codeのおかげで、私の作業時間が従来の30％になりました。

サイト制作のコーディングでスタイルを直接書くことはほとんどありません。なんとなく、「（ここのそこら辺に）余白取って」です。

今年の後半はどうなるか？

表を見ていただければ分かるように、現時点では全体的に一歩遅れを取っているGoogleが、この後どう巻き返してくるのかが、後半戦のポイントになると思います。

現状では、ただの検索AIとなってしまったGemini。Geminiに聞けば、まだまだGoogle AI Studioは、コアなプログラマーには支持を得ていると言ってますし、実際そうなのでしょうが、APIで気づかぬうちに料金をせしめようとするあたり、きな臭いAIになったなと、Googleらしくないなと思っています。

果たして、Nano Banana 3で巻き返しがあるでしょうか。

そんな中、2026年4月28日、Claudeが大きな動きを見せました。Blender、Autodesk、Adobe、Ableton、Spliceなど、クリエイティブ業界を代表するツールとの連携コネクターを一斉リリースしたのです。特にBlenderとの連携は衝撃的で、自然言語でBlenderのPython APIを操作できるようになりました。つまり「こういうオブジェクトを作って」と話しかければ、Claudeがスクリプトを生成してBlenderに直接流し込んでくれる。3Dクリエイターの作業効率が根本から変わる可能性があります。さらにAdobeとの連携では、Photoshop、Premiere、Illustratorなど50以上のツールをClaudeから横断的に操作できるようになりました。

Claudeは画像生成は×ですが、もはや自ら画像生成をする必要がない、とも言えます。優れた推論力とコーディング力を核に、画像生成は外部の専門ツールに任せる。この分業こそが、Claudeの戦略の本質かもしれません。
周りではどう車を作ろうか必死に考えているが、Claudeは一貫してエンジンの性能を上げることに集中している感じでしょうか。

今は、制作ツールのほとんどが、こういったLLMとどう連携をとるかがポイントになっています。FigmaやCanva、デザイン系のツールがLLMとうまく連携が取れると、私たちの作業工程にとって大きな革命になります。

以上のことを踏まえて考えてみると、やはりLLMの核は推論力と言えると思います。つまり、画像生成がどうこうというのは小さい話で、そのニッチな分野の競争は勝手にやって進歩してください。私たちは核の部分で勝負します、というClaudeは、現時点でもっとも「使えるAI」として頭一つ抜けた存在になりつつあると言っていいでしょう。