Agent 工程实践与工具链
本文档整理自 Inbox 学习任务(第二批次),来源包括 Microsoft AI Agents、StackOverflow、GitHub 等。
1. Agent 系统架构
1.1 Agent 核心组件
┌─────────────────────────────────────────────────────┐
│ User Interface │
├─────────────────────────────────────────────────────┤
│ Orchestrator / Planner │
│ (任务分解 + 流程编排 + 决策) │
├──────────┬──────────┬──────────┬───────────────────┤
│ Tools │ Memory │ RAG │ LLM │
│ (工具) │ (记忆) │ (知识检索)│ (推理引擎) │
├──────────┴──────────┴──────────┴───────────────────┤
│ External Services / APIs │
└─────────────────────────────────────────────────────┘1.2 关键设计决策
- 集中式 vs 分布式编排:集中式更简单,分布式更适合复杂任务
- 同步 vs 异步执行:长时间运行任务适合异步
- 确定性 vs 概率性:Agent 输出具有概率性,需考虑容错
- 单 Agent vs 多 Agent:简单任务单 Agent 足够,复杂任务需要协作
1.3 Agent 文献综述
主要研究方向:
- Planning:任务分解、目标推理
- Memory:短期/长期记忆管理
- Tool Use:工具选择、工具调用
- Collaboration:多 Agent 协作
- Safety:Agent 安全边界
2. RAG (Retrieval Augmented Generation)
2.1 RAG 核心模式
Query → Embedding → Vector Search → Retrieved Docs → LLM → Response2.2 RAG 技术分类
| 技术 | 描述 | 适用场景 |
|---|---|---|
| Naive RAG | 直接检索 + 生成 | 简单 Q&A |
| Hybrid RAG | 关键词 + 向量混合 | 需要精确匹配 |
| Contextual RAG | 加入上下文 | 长文档检索 |
| Self-RAG | 自反思增强 | 高精度场景 |
| Corrective RAG | 检索结果校验 | 防止幻觉 |
2.3 Pinecone + Claude RAG 集成
python
# Pinecone + Claude RAG 示例框架
import pinecone
from anthropic import Anthropic
# 1. 初始化
pinecone.init(api_key=..., environment=...)
index = pinecone.Index("my-rag-index")
# 2. 检索相关文档
query_embedding = embed_model.encode("用户问题")
results = index.query(vector=query_embedding.tolist(), top_k=5)
# 3. 构建 context
context = "\n".join([r['text'] for r in results['matches']])
# 4. Claude 生成
client = Anthropic()
response = client.messages.create(
model="claude-3-5-sonnet-20241022",
max_tokens=1024,
messages=[{
"role": "user",
"content": f"Context:\n{context}\n\nQuestion: {user_question}"
}]
)3. Microsoft AI Agents for Beginners
3.1 微软 Agent 设计理念
- 可靠性优先:Agent 应能优雅处理失败
- 可观测性:完整的日志和追踪
- 渐进式复杂度:从简单开始,逐步增加功能
3.2 入门路径
- 理解 Agent 基础:LLM + Tools + Loop
- 掌握 Prompt Engineering:高质量 prompt 是基础
- 学习工具设计:工具定义、调用、结果处理
- 实践编排模式:从单步到多步编排
3.3 微软 vs 其他厂商
| 维度 | Microsoft | Anthropic | OpenAI |
|---|---|---|---|
| 生态 | Azure + .NET/JS | Claude SDK | OpenAI SDK |
| 专注点 | 企业应用 | 安全可靠 | 能力边界 |
| 多 Agent | handoffs | conversation | function calling |
4. AI Code Review 实践
4.1 AI Review 优势
- 速度:批量检查比人工快
- 一致性:不受情绪/疲劳影响
- 覆盖面:可检查所有变更
4.2 AI Review 最佳实践
- 聚焦可自动化项:风格、格式、安全漏洞
- 人工复核复杂逻辑:业务逻辑需人工把关
- 分阶段引入:先从低风险领域开始
- 持续优化 Prompt:根据反馈迭代 review prompt
4.3 AI Review Prompt 示例
你是一个资深代码审查员。审查以下 PR 变更:
- 只报告确定性问题(不报风格问题)
- 优先报告安全和性能问题
- 每个问题给出具体修复建议
- 如果变更看起来合理,简洁说明
变更内容:
{diff}5. Claude MD 编写指南
5.1 Claude MD 核心要素
Claude MD 是给 Claude Code 的配置文件,影响 AI 的行为模式。
关键配置项:
- model:使用的模型
- max_tokens:单次响应最大 token 数
- temperature:创造性/确定性平衡
- system_prompt:Agent 的角色和行为定义
5.2 最佳实践
- 清晰的任务描述:明确 AI 应该做什么
- 具体的约束条件:说明限制和边界
- 示例输出:展示期望的输出格式
- 渐进式设计:从简单 prompt 开始,逐步增加复杂度
6. Tiny LLM (轻量级模型)
6.1 何时使用 Tiny LLM
- 边缘部署:资源受限环境
- 快速原型:开发阶段快速迭代
- 特定任务:任务简单,不需要大盘模型
- 成本敏感:降低 API 调用成本
6.2 模型压缩技术
| 技术 | 原理 | 效果 |
|---|---|---|
| 知识蒸馏 | 大模型教小模型 | ~90% 大模型性能 |
| 量化 (Quantization) | INT8/INT4 替代 FP32 | 4x 内存降低 |
| 剪枝 (Pruning) | 移除不重要的权重 | 减少参数量 |
| 知识蒸馏 + 量化 | 组合使用 | 最佳性价比 |
7. MCP (Model Context Protocol) 生态
7.1 MCP 协议概述
MCP 是 Anthropic 推出的标准化工具调用协议,让 AI 可以连接各种外部工具和数据源。
核心架构:
Host (Claude Code) ←→ MCP Client ←→ MCP Server ←→ External Tool7.2 热门 MCP Servers
| Server | 用途 | 特点 |
|---|---|---|
| Figma | 设计工具集成 | UI 生成自动化 |
| Chrome | 浏览器自动化 | 网页抓取/交互 |
| GitHub | 代码托管 | PR/Issue 管理 |
| Filesystem | 本地文件 | 项目文件操作 |
| Slack | 团队协作 | 消息通知 |
7.3 Chrome MCP 集成场景
- 自动化测试:AI 驱动的 E2E 测试
- 内容抓取:自动化网页数据提取
- UI 验证:截图对比和视觉检查
8. StackOverflow Agent 设计指南
8.1 用户真正想要的 Agent 特性
- 透明可预测:用户能理解 Agent 在做什么
- 可纠正:用户能干预和纠正 Agent 行为
- 可靠:一致的结果,能处理边界情况
- 尊重边界:不越界,不做用户不想做的事
8.2 Agent UX 设计原则
- 渐进式披露:逐步展示复杂功能
- 即时反馈:每个操作都有状态反馈
- 优雅失败:出错时给出清晰的恢复建议
- 人工确认:关键操作前请求确认
9. 通往 AGI 之路
9.1 AGI 学习路径概览
- 基础:LLM 原理、Transformer 架构
- Prompt Engineering:有效使用 LLM
- Agent:工具使用、决策、规划
- 多模态:图像、视频、音频处理
- 自主性:长期任务、持续学习
9.2 前端 AI 赋能
来源:AI 赋能前端指南
- AI 生成 UI:自然语言描述 → 可用界面
- 智能组件:AI 根据上下文推荐组件
- 自动化测试:AI 生成测试用例
- 性能优化:AI 分析和优化建议
10. Cursor IDE 原理分析
来源:Cursor 抓包分析
10.1 Cursor 架构
- 基于 VSCode:继承 VSCode 生态
- AI 深度集成:Chat Panel + Inline Completions
- Context 管理:智能上下文选择和压缩
- 多模型支持:Claude + GPT + 本地模型
10.2 关键实现
- 流式响应:SSE 实现打字机效果
- 上下文窗口:智能决定上下文组成
- Agent Loop:Chat → Plan → Execute → Review