Skip to content

Agent 工程实践与工具链

本文档整理自 Inbox 学习任务(第二批次),来源包括 Microsoft AI Agents、StackOverflow、GitHub 等。

1. Agent 系统架构

来源:deepchat - Agent 系统架构详解

1.1 Agent 核心组件

┌─────────────────────────────────────────────────────┐
│                    User Interface                     │
├─────────────────────────────────────────────────────┤
│                  Orchestrator / Planner              │
│              (任务分解 + 流程编排 + 决策)              │
├──────────┬──────────┬──────────┬───────────────────┤
│  Tools   │ Memory   │  RAG     │  LLM              │
│  (工具)  │ (记忆)   │ (知识检索)│  (推理引擎)        │
├──────────┴──────────┴──────────┴───────────────────┤
│                  External Services / APIs            │
└─────────────────────────────────────────────────────┘

1.2 关键设计决策

  1. 集中式 vs 分布式编排:集中式更简单,分布式更适合复杂任务
  2. 同步 vs 异步执行:长时间运行任务适合异步
  3. 确定性 vs 概率性:Agent 输出具有概率性,需考虑容错
  4. 单 Agent vs 多 Agent:简单任务单 Agent 足够,复杂任务需要协作

1.3 Agent 文献综述

来源:ninehills - Agent 文献综述

主要研究方向:

  • Planning:任务分解、目标推理
  • Memory:短期/长期记忆管理
  • Tool Use:工具选择、工具调用
  • Collaboration:多 Agent 协作
  • Safety:Agent 安全边界

2. RAG (Retrieval Augmented Generation)

来源:RAG TechniquesPinecone RAG

2.1 RAG 核心模式

Query → Embedding → Vector Search → Retrieved Docs → LLM → Response

2.2 RAG 技术分类

技术描述适用场景
Naive RAG直接检索 + 生成简单 Q&A
Hybrid RAG关键词 + 向量混合需要精确匹配
Contextual RAG加入上下文长文档检索
Self-RAG自反思增强高精度场景
Corrective RAG检索结果校验防止幻觉

2.3 Pinecone + Claude RAG 集成

python
# Pinecone + Claude RAG 示例框架
import pinecone
from anthropic import Anthropic

# 1. 初始化
pinecone.init(api_key=..., environment=...)
index = pinecone.Index("my-rag-index")

# 2. 检索相关文档
query_embedding = embed_model.encode("用户问题")
results = index.query(vector=query_embedding.tolist(), top_k=5)

# 3. 构建 context
context = "\n".join([r['text'] for r in results['matches']])

# 4. Claude 生成
client = Anthropic()
response = client.messages.create(
    model="claude-3-5-sonnet-20241022",
    max_tokens=1024,
    messages=[{
        "role": "user",
        "content": f"Context:\n{context}\n\nQuestion: {user_question}"
    }]
)

3. Microsoft AI Agents for Beginners

来源:microsoft/ai-agents-for-beginners

3.1 微软 Agent 设计理念

  • 可靠性优先:Agent 应能优雅处理失败
  • 可观测性:完整的日志和追踪
  • 渐进式复杂度:从简单开始,逐步增加功能

3.2 入门路径

  1. 理解 Agent 基础:LLM + Tools + Loop
  2. 掌握 Prompt Engineering:高质量 prompt 是基础
  3. 学习工具设计:工具定义、调用、结果处理
  4. 实践编排模式:从单步到多步编排

3.3 微软 vs 其他厂商

维度MicrosoftAnthropicOpenAI
生态Azure + .NET/JSClaude SDKOpenAI SDK
专注点企业应用安全可靠能力边界
多 Agenthandoffsconversationfunction calling

4. AI Code Review 实践

来源:AI Code Review Trick

4.1 AI Review 优势

  • 速度:批量检查比人工快
  • 一致性:不受情绪/疲劳影响
  • 覆盖面:可检查所有变更

4.2 AI Review 最佳实践

  1. 聚焦可自动化项:风格、格式、安全漏洞
  2. 人工复核复杂逻辑:业务逻辑需人工把关
  3. 分阶段引入:先从低风险领域开始
  4. 持续优化 Prompt:根据反馈迭代 review prompt

4.3 AI Review Prompt 示例

你是一个资深代码审查员。审查以下 PR 变更:
- 只报告确定性问题(不报风格问题)
- 优先报告安全和性能问题
- 每个问题给出具体修复建议
- 如果变更看起来合理,简洁说明

变更内容:
{diff}

5. Claude MD 编写指南

来源:Writing a Good Claude MD

5.1 Claude MD 核心要素

Claude MD 是给 Claude Code 的配置文件,影响 AI 的行为模式。

关键配置项

  • model:使用的模型
  • max_tokens:单次响应最大 token 数
  • temperature:创造性/确定性平衡
  • system_prompt:Agent 的角色和行为定义

5.2 最佳实践

  1. 清晰的任务描述:明确 AI 应该做什么
  2. 具体的约束条件:说明限制和边界
  3. 示例输出:展示期望的输出格式
  4. 渐进式设计:从简单 prompt 开始,逐步增加复杂度

6. Tiny LLM (轻量级模型)

来源:skyzh/tiny-llm

6.1 何时使用 Tiny LLM

  • 边缘部署:资源受限环境
  • 快速原型:开发阶段快速迭代
  • 特定任务:任务简单,不需要大盘模型
  • 成本敏感:降低 API 调用成本

6.2 模型压缩技术

技术原理效果
知识蒸馏大模型教小模型~90% 大模型性能
量化 (Quantization)INT8/INT4 替代 FP324x 内存降低
剪枝 (Pruning)移除不重要的权重减少参数量
知识蒸馏 + 量化组合使用最佳性价比

7. MCP (Model Context Protocol) 生态

来源:Figma MCP ServerChrome MCP

7.1 MCP 协议概述

MCP 是 Anthropic 推出的标准化工具调用协议,让 AI 可以连接各种外部工具和数据源。

核心架构

Host (Claude Code) ←→ MCP Client ←→ MCP Server ←→ External Tool

7.2 热门 MCP Servers

Server用途特点
Figma设计工具集成UI 生成自动化
Chrome浏览器自动化网页抓取/交互
GitHub代码托管PR/Issue 管理
Filesystem本地文件项目文件操作
Slack团队协作消息通知

7.3 Chrome MCP 集成场景

  • 自动化测试:AI 驱动的 E2E 测试
  • 内容抓取:自动化网页数据提取
  • UI 验证:截图对比和视觉检查

8. StackOverflow Agent 设计指南

来源:Create Agents That People Want

8.1 用户真正想要的 Agent 特性

  1. 透明可预测:用户能理解 Agent 在做什么
  2. 可纠正:用户能干预和纠正 Agent 行为
  3. 可靠:一致的结果,能处理边界情况
  4. 尊重边界:不越界,不做用户不想做的事

8.2 Agent UX 设计原则

  • 渐进式披露:逐步展示复杂功能
  • 即时反馈:每个操作都有状态反馈
  • 优雅失败:出错时给出清晰的恢复建议
  • 人工确认:关键操作前请求确认

9. 通往 AGI 之路

来源:飞书 Wiki - 通往 AGI 之路

9.1 AGI 学习路径概览

  1. 基础:LLM 原理、Transformer 架构
  2. Prompt Engineering:有效使用 LLM
  3. Agent:工具使用、决策、规划
  4. 多模态:图像、视频、音频处理
  5. 自主性:长期任务、持续学习

9.2 前端 AI 赋能

来源:AI 赋能前端指南

  • AI 生成 UI:自然语言描述 → 可用界面
  • 智能组件:AI 根据上下文推荐组件
  • 自动化测试:AI 生成测试用例
  • 性能优化:AI 分析和优化建议

10. Cursor IDE 原理分析

来源:Cursor 抓包分析

10.1 Cursor 架构

  • 基于 VSCode:继承 VSCode 生态
  • AI 深度集成:Chat Panel + Inline Completions
  • Context 管理:智能上下文选择和压缩
  • 多模型支持:Claude + GPT + 本地模型

10.2 关键实现

  • 流式响应:SSE 实现打字机效果
  • 上下文窗口:智能决定上下文组成
  • Agent Loop:Chat → Plan → Execute → Review

11. 相关资源

Built for frontend engineers · Powered by VitePress