AI Agent
当前关于 Agent 工程的两大业内共识:
- 使用文件系统作为上下文(如使用文件保存 Agent 长期记忆,如 OpenClaw 的 SOUL.md/TOOLS.md/MEMORY.md 等)
- 编程是解决通用问题的一种普适方法(AI 更擅长使用代码解决问题:问题->生成代码->执行代码->Again->直到问题解决)
常用设计模式
ReAct 模式
ReAct 智能体的运作基于一个循环过程(不断迭代更新),包括以下三个步骤:
- 推理(Reasoning):依赖 LLM,分析当前任务状态,生产内部推理,决定下一步行动,核心思想是 CoT(Chain of Thought)
- 执行(Acting):根据上一步的推理结果,执行具体的操作,例如查询信息或调用外部工具(Function Tool,MCP, Shell 命令,代码执行等),具体依赖宿主机的执行环境与应用场景
- 观察(Observation):观察行动的结果,将反馈用于下一轮的思考;或者观察到已经判断是最终的答案,则整理输出结果
核心思想是交替进行“推理 → 行动 → 观察”。
典型流程:
- Thought(思考)
- Action(调用工具)
- Observation(获取结果)
适用于:
- 需要外部工具(搜索、数据库、API)
- 非一次性可解问题
特点:强化可解释性,但推理链较长、成本高。
**实现原理: **
思考和 Action 是通过 prompt 实现的,以下为 ReAct 的一个 prompt
1 | Answer the following questions as best you can. You have access to the following tools: |
案例:特斯拉股票多少钱?
1 | Thought: 需要获取特斯拉股价 |





