Skip to content

Agent Course (Free) 学习笔记

来源: awesome-generative-ai-guide - Applied LLMs Mastery & Agents 101 学习日期: 2026-04-12

一、Agent 核心理论框架

Agent 三组件模型

LLM Agent 基于"大语言模型+工具"构建,核心由三个组件构成:

┌─────────────────────────────────────────┐
│                  Agent                   │
├─────────────┬──────────────┬────────────┤
│   Brain    │  Perception  │   Action   │
│ (大脑)     │   (感知)      │   (行动)   │
└─────────────┴──────────────┴────────────┘
组件职责说明
Brain中央控制器存储信息、处理思考、做出决策
Perception感知模块解析外部环境的各种感官输入
Action行动模块使用工具执行任务并影响周围环境

实用四组件模型

更常用的工程化框架:

组件职责示例
Agent Core核心决策目标定义、工具指令、行为模式
Memory Module记忆存储短期记忆(当前对话)+ 长期记忆(历史积累)
Tools工具调用RAG、代码解释器、搜索 API、天气查询
Planning Module规划模块任务分解(Task Decomposition)、反思批判(Reflection)

Memory 检索机制

  • 语义相似性: 基于 embedding 的向量检索
  • 重要性: 关键信息加权
  • 时序性: 最近交互优先
  • 应用特定指标: 领域相关的自定义权重

二、单 Agent 与多 Agent

单 Agent 局限

LLM Agent 通常孤立运行,缺乏:

  • 与其他 Agent 协作的能力
  • 从社会交互中学习的能力
  • 多轮反馈和协作处理复杂场景

多智能体系统 (Multi-Agent System, MAS)

┌──────────┐     ┌──────────┐     ┌──────────┐
│ Agent A  │ ←→  │ Agent B  │ ←→  │ Agent C  │
│ (专业领域) │     │ (协调器)  │     │ (执行器)  │
└──────────┘     └──────────┘     └──────────┘

优势:

  • 分工协作: 专业化 Agent 处理特定任务
  • 集体决策: 多角度分析提升质量
  • 任务分解: 复杂任务拆解为多个子任务

多 Agent 交互类型

类型特点适用场景
Cooperative(合作)Agent 协同追求共同目标任务分解流水线
Adversarial(对抗)Agent 通过博弈优化代码评审、质量把控

三、Agent 评估基准

基准用途链接
AgentBench综合评估THUDM/AgentBench
IGLU目标导向对话IGLU
ToolBench工具调用能力ToolBench
ClemBench多样化任务ClemBench

四、推荐学习路径 (5-Day Agent Roadmap)

Day 1-2: 基础概念

Day 3-4: 核心框架

Day 5: 实战构建


五、实战案例

项目说明链接
ChemCrow化学领域的工具增强 AgentPaper
BabyAGI轻量级任务驱动的 AgentGitHub
OS-Copilot通用计算机操作 AgentPaper

六、与现有文档的关系

本文档补充以下内容:

  • 理论框架: Brain/Perception/Action 三组件模型(现有文档侧重 ReAct/Plan-Execute 等工程模式)
  • 多 Agent 系统: 合作与对抗交互模式(现有文档尚未覆盖)
  • 评估基准: AgentBench 等标准化评估方法

建议与 Agent 模式索引 配合阅读。


相关资源

Built for frontend engineers · Powered by VitePress