「AIに聞く」から「AIに任せる」へ
2024年くらいまで、AIとの付き合い方はだいたいこうでした。ChatGPTを開いて、質問を打って、返ってきた文章を読む。便利だけど、結局は「高性能な検索エンジン+文章生成機」みたいな使い方です。
2025年後半から2026年にかけて、その風景が変わってきています。AIが自分でファイルを読み、コードを書き、ブラウザを操作し、APIを叩き、エラーが出たら自分で直す。人間は「これやっといて」と言うだけ。
これがAIエージェントです。
言葉としてはバズワードっぽく聞こえるかもしれません。でも実際に使ってみると、これまでのAIとは根本的に違う体験です。ここでは、AIエージェントが何なのか、何ができて何ができないのか、実際に使っている立場からなるべく正直に書きます。
チャットボットとエージェントの違い
まず基本的なところから。
チャットボット(従来型AI):
- 人間が質問する → AIが答える → 人間が次の質問をする
- 1回のやりとりで完結する
- AIは「文章を生成する」ことしかできない
AIエージェント:
- 人間が目標を伝える → AIが計画を立てる → 必要なツールを使って実行する → 結果を確認する → 必要なら修正する
- 複数のステップを自律的に進める
- ファイル操作、コード実行、Web検索、API呼び出しなど「行動」ができる
たとえば「このCSVファイルを分析して、売上の傾向をグラフにして、レポートをPDFで作って」と頼んだとします。チャットボットだと、コードを提案してくれるけど実行は人間がやる。エージェントは、実際にコードを書いて、実行して、エラーが出たら直して、グラフを生成して、PDFにまとめるところまで自分でやります。
AIエージェントの「中身」— 何が動いているのか
技術的にそんなに難しい話ではないです。AIエージェントは、大きく3つの要素でできています。
1. LLM(大規模言語モデル)— 「脳」
Claude、GPT-4o、Geminiなど。これがエージェントの判断力の部分です。「次に何をすべきか」を考える。ただし、考えるだけで行動はできない。
2. ツール — 「手足」
ファイルを読む、コードを実行する、Webを検索する、データベースを操作する、メールを送る。これらの「道具」をLLMが呼び出せるようになっている。LLMが「この関数を呼び出して」と指示を出すと、システムが実際に実行する仕組みです。
3. ループ(計画→実行→観察→修正)— 「仕事の進め方」
ここが一番大事です。エージェントは以下のサイクルを繰り返します:
- 計画: 目標を達成するために何をすべきか考える
- 行動: ツールを使って実際に何かをやる
- 観察: その結果を見る(エラーが出た?成功した?)
- 修正: 必要なら計画を変えて、次のアクションを決める
このループが回り続ける限り、エージェントは「タスクが終わるまで」動き続けます。人間が途中で介入する必要がない(理想的には)。
今、実際に使えるAIエージェント
2026年3月時点で、実用レベルに達しているエージェントをいくつか紹介します。全部自分で触った上で書いています。
Claude Code(Anthropic)
ターミナルで動くコーディングエージェントです。「このバグを直して」「この機能を追加して」と言うと、ファイルを読んで、コードを書いて、テストを実行して、必要なら修正して、コミットまでやってくれます。
自分はこのサイトの構築にもClaude Codeを使っています。正直、もうこれなしでコードを書く気にはなれない。ただし、万能ではないです。大規模なリファクタリングで方向を見失ったり、既存のコードベースを完全に理解しきれなかったりすることはあります。
ChatGPT with Code Interpreter / Advanced Data Analysis
OpenAIのChatGPTに搭載されている機能。データ分析、グラフ作成、ファイル変換などをチャットの中で実行してくれます。Pythonコードを裏で動かしているので、かなり柔軟。データ分析の入口としてはかなり優秀です。
Devin / Copilot Workspace(開発特化型)
ソフトウェア開発に特化したエージェントたち。GitHubのIssueを読んで、コードを書いて、プルリクエストを作るところまでやる。ただし、2026年3月時点では「完全に任せられる」レベルにはまだ達していないのが正直なところです。簡単なバグ修正やドキュメント更新なら実用的。
Computer Use(画面操作型)
AnthropicのClaudeやOpenAIのモデルが「PCの画面を見て、マウスとキーボードを操作する」エージェント。Webブラウザを開いて、フォームに入力して、ボタンをクリックして…ということを自律的にやる。まだ発展途上だけど、RPA(ロボティック・プロセス・オートメーション)を完全に置き換える可能性があります。
エージェントが「苦手なこと」— 正直に言います
ここが大事です。AIエージェントの紹介記事は「すごい!」ばかりになりがちですが、実際に使い込んでいると限界がはっきり見えます。
長期的な計画を維持できない
20ステップ以上の複雑なタスクになると、途中で方針がブレたり、最初の目標を忘れたりします。コンテキストウィンドウ(AIが一度に覚えていられる量)には限りがあるので、これは構造的な問題です。
「確認せずに突っ走る」問題
エージェントは自律的に動くのが売りですが、裏を返せば「間違った方向に自律的に突っ走る」こともある。ファイルを上書きしたり、意図しない変更を加えたり。人間のレビューは必須です。
曖昧な指示に弱い
「いい感じにして」は通じません。何をもって「いい」とするかの判断基準が曖昧だと、エージェントは的外れな方向に進みます。具体的な目標とゴールの定義が大事です。
コストの問題
エージェントはチャットと違って、1つのタスクで何十回もAPIを呼び出します。Claude Codeを1時間ガッツリ使うと、APIコストが数千円になることもあります。「道具」として使う分には無視できるコストですが、知っておくべきことです。
エージェントを「うまく使う」ための考え方
半年ほどAIエージェントと一緒に仕事をしてきて、うまくいくパターンが見えてきました。
タスクを分割する
「アプリを作って」ではなく「ログイン画面のUIを作って」「APIのエンドポイントを3つ作って」のように、1回のセッションで完結する粒度に分ける。これだけで成功率が劇的に上がります。
ゴールを明確にする
「〜ができる状態」「〜のテストが通る状態」のように、完了条件を具体的に伝える。エージェントは「終わったかどうか」を判断する基準が必要です。
途中で軌道修正する
完全に放置するのではなく、中間成果物を確認して方向修正する。特に最初の数ステップは注意深く見る。方向がズレていたら早めに止める。
得意なことに使う
定型的なコード生成、データ変換、ドキュメント作成、テスト作成。こういう「やり方は分かるけど時間がかかる」タスクにエージェントは最高にフィットします。逆に、創造性や美的判断が求められるタスクはまだ人間がやった方がいい。
これからどうなるのか
2026年の時点で、AIエージェントは「使える人には革命的、使えない人にはまだ遠い」くらいの立ち位置です。
ただ、方向性ははっきりしています。
- ツールの標準化: Anthropicが提唱するMCP(Model Context Protocol)のように、AIが外部ツールと連携する方法が標準化されつつある
- コストの低下: モデルの効率化が進んでいて、エージェントの利用コストは確実に下がっている
- 信頼性の向上: 「確認せずに突っ走る」問題に対して、人間の承認を組み込む仕組みが整備されてきている
個人的な予測を言うと、2年以内に「エージェントを使わずに仕事をする」のは「スマホを使わずに仕事をする」くらいの感覚になると思います。それくらいのインパクトがある技術です。
とはいえ、AIエージェントは「魔法」ではないです。人間が方向を決めて、AIが実行する。その関係は当面変わらない。大事なのは「AIに何をさせるか」を判断できる力、つまり自分自身の仕事への理解力です。
道具が良くなっても、使う人の判断力が問われるのは変わらないんですよね。
]]>