Essential Knowledge for Agent Development

Posted Apr 27, 2025 Updated Sep 4, 2025

By cryanskl

7 min read

1.AI Agent 技术发展史

Agent 技术的演化路径如下：

提示工程 → RAG → Function Calling → ReAct → 初代 Agent 框架 → Multi‑Agent → MCP → A2A

ReAct 是一种 Prompt 策略，交替生成 Thought: ... 与 Action: ...，并在每步后得到观测 Observation:，形成类似 “思考–行动–观测” 的循环路径 Lil’Log+1 ar5iv。
它能：
- 在复杂推理中主动调用工具（例如维基检索接口），支持动态纠错与计划调整；
- 在 QA、事实验证、文本游戏、网页导航等任务中表现优于只“思考”或只“行动”的模型 arXiv。
实验显示 ReAct 在 HotpotQA 和 FEVER 上提升显著，尤其当与 CoT（Chain‑of‑Thought）结合使用时效果更佳 arXiv。

背景与动因：
- 单个 Agent 面临工具使用、上下文长度限制等问题；
- 多场景下，规划能力较弱，难以灵活路由任务；
Multi-Agent 模型让多个子 Agent 分工协作（如前端 Agent、后端 Agent），协调解决复杂业务逻辑；
挑战包括子 Agent 之间的通信协议、状态一致性、协作调度等；
相关研究：
- Multi‑Agent 框架 1：（例如论文 arXiv:2308.10848）
- Multi‑Agent 框架 2：（例如论文 arXiv:2308.00352）

开发级别	特征与目标	主流工具/框架
低代码开发	可视化编排，快速上线，集成 RAG、工具、评测系统等	Coze、Dify、n8n
敏捷开发	模块化 Agent、工具、记忆、评测追踪等，适合快速构原型	LangChain、LlamaIndex、Haystack、AutoGen、CrewAI
底层开发	自研运行时／协议，最大灵活性，适配复杂场景	LangGraph、OpenAI Agents SDK / Responses API、Google ADK、Semantic Kernel

此分类有助于选择技术路径：低成本上手 VS 高度定制与扩展性。

Agent 技术全景认知：
- 架构基本要素：memory、tools、planning、action；
- 理解 Function Calling；
- 掌握主流框架与前沿协议（MCP、A2A）。
框架选型策略：
- 根据项目资源和需求选择适合的路径：省时快速 VS 灵活可扩展。
通用场景构建：
- 意图识别（Intent）设计；
- 安全护栏实现；
- 人机交互（如审批流程）；
- 性能与成本评估与控制。
大模型项目集成能力：
- Agent 与 RAG 如何融合；
- Agent 与传统业务流程集成；
- 不同 Agent 框架间的协作与对接。

框架选型：LangGraph、Agents SDK、Google ADK
- LangGraph 与 Google ADK 更适合底层深度定制开发；
- Agents SDK 提供更加完整的底层 + 敏捷支持，具备更多权限与灵活性。
多 Agent 上下文隔离策略
- 通常不建议完全隔离上下文；
- 推荐通过 “state 传递”方式共享必要信息。
流式输出与安全护栏
- 可提前让模型输出安全标志；
- 或者前端做短缓冲，边流边审核，遇触规则立刻停止响应。
Multi-Agent 中的智能路由
- 可使用小模型进行意图识别与任务路由。
RAG 的召回与重排行优化
- 使用 rerank 模型与后处理策略；
- 对重复或冗余索引内容进行去重和合并（如增量 merge）。
工具框架学习策略
- 深入学习 LangChain 和 LangGraph；
- Dify、Coze、n8n 可简要了解即可。