AI

【前編】AIエージェント入門 — 定義・特性・基本構造・起動方式

この記事を書いたメンバー:

Keiichi Kurosawa

【前編】AIエージェント入門 — 定義・特性・基本構造・起動方式

目次

はじめに

こんにちは。 BeeXの黒澤です。

別ブログにても紹介しておりますが、2025年11月7日に開催された「TerraSkyDay 2025」にて、BeeXはセッション登壇およびブース出展を行いました。

https://www.beex-inc.com/blog/terraskyday2025-event-report

セッション後も多くの方にご興味を持っていただいており、個別でデモ等を含めたご相談もいただいており、AIエージェントに対する関心の高さを実感しております。

本記事では、AIエージェントについて少し掘り下げて解説し、AIエージェントの定義や基本的な仕組みについて紹介します。

(TerraskyDay 2025当日にはお話ししなかったのですが、企画当初予定していた内容でもあります。)

AIエージェント定義とその特性

AIエージェントの定義については、様々な記事がありますが、個人的に一番しっくりきたのはガートナー社の定義(https://www.gartner.co.jp/ja/articles/ai-agents)で、そこから引用します。

AIエージェントの定義

AIエージェントは、デジタルおよび現実の環境で、状況を認識し、意思決定を下し、アクションを起こし、目的を達成するためにAI技術を適用する自律的または半自律的なソフトウェアです。

AIエージェントの特性

以下の特性それぞれのレベルを高められると、より高度なAIエージェントを実現できます。

1. 適応性

変化に応じて、振る舞いや戦略を調整できる能力

2. 積極性

目的達成のために自らアクションを起こせる能力

3. 目的の複雑性

相互に関連する複数の目的達成に求められるタスクを管理し、実行できる能力

4. 環境の複雑性

不確実性、変動性、複雑性を伴う環境で、タスクを制御・実行できる能力

5. 自律性

ほとんどまたはまったく人間の介入なしで、独立して稼働できる能力




AIエージェントの基本的な仕組み

AIエージェントは、以下の主要なコンポーネントで構成されます。

  • 認識: ユーザからの質問や要求、収集したデータを解析し、状況を理解、意図を把握する(=五感)
    • ユーザから提供された情報やRAG、Web検索などで収集した外部情報を活用
  • 判断: 得た情報を基に、目的達成のための最適な行動を決定する(=脳)
    • LLMがここを担う。実行手順の計画や結果の評価などを行う
  • 実行: 具体的なアクションを起こす(=手足や道具)
    • ツールを呼び出し、外部に働きかける

これらをコーディングエージェントを例に、具体的に見ていきます。

  1. ユーザがLLMに対し、「特定の機能を持つコードを書き、テストを実行して欲しい」とリクエストする 認識
  2. LLMはユーザの要求を解析し、要求の実現に必要なステップを計画する(修正箇所の確認、修正内容の理解、修正の実行、テストの実行) 判断
  3. LLMは読み込みツールを使い、対象コードを取得し、修正箇所を確認する 実行
  4. 読み込んだコードを解析し、修正内容を理解する 判断
  5. LLMは書き込みツールを使い、コードの修正を実行する 実行
  6. LLMはテスト実行ツールを使い、修正後のコードのテストを実行する 実行
  7. テスト結果を評価し、必要に応じて修正を繰り返す 判断




AIエージェントの起動方式

AIエージェントの起動方式には、大きく分けて以下の3つがあります。

チャット駆動型

  • ユーザがチャットインターフェースを通じてAIエージェントと対話し、指示を与える方式
  • メリット:
    • ユーザが柔軟に指示を出せるため、臨機応変な対応が可能
    • 対話を通じて要求を詳細化・修正できる
    • 技術的なスキルがなくても自然言語で操作できる
  • 例: ChatGPTのプラグイン機能

ワークフロー駆動型

  • 事前に定義されたワークフローやスケジューラーに基づき、AIエージェントが自動的にタスクを実行する方式
  • メリット:
    • 定型的な業務を自動化し、人的リソースを削減できる
    • 決まった時間や条件で実行されるため、安定した運用が可能
    • 複雑な処理を事前に設計しておけば、確実に実行できる
  • 例: 自動化プラットフォームでのAIエージェントの利用

イベント駆動型

  • 特定のイベントやトリガーに応じてAIエージェントが起動し、タスクを実行する方式
  • メリット:
    • リアルタイムな状況変化に即座に対応できる
    • 必要なときにのみ起動するため、リソースを効率的に利用できる
    • 人間の介入を待たずに迅速なアクションが可能
  • 例: システム監視ツールでの異常検知時にAIエージェントが対応策を実行



チャット駆動型とワークフロー駆動型についてはTerraskyDay 2025当日に紹介したデモのチャットおよびレポート生成が該当する内容でした。

まとめ

本記事では、AIエージェントの定義、特性、基本的な仕組み、起動方式について解説しました。

AIエージェントは、従来のアプリケーションとは異なり、高度な自律性と適応性を持つソフトウェアであり、様々な業務プロセスの自動化や効率化に寄与します。

そうした中で、AIエージェントにより様々なことをさせるにはどうしたら良いか、より高度なことをさせるにはどうしたら良いか、という点については別記事にて掘り下げていきたいと思います。

以上、最後までお読みいただきありがとうございました。

カテゴリー
タグ

この記事を書いたメンバー

Keiichi Kurosawa
Keiichi Kurosawa

Application Engineer / 2023 Japan AWS All Certifications Engineers / GCP 10冠(Workspaces除く)

Pick upピックアップ

Search記事を探す

キーワード

SAPシステムや基幹システムのクラウド移行・構築・保守、
DXに関して
お気軽にご相談ください

03-6260-6240 (受付時間 平日9:30〜18:00)