ReAct
Reasoning + Acting让 Agent 边想边做:每一步先写出 Thought,再决定 Action。
详解
ReAct 是 2022 年提出的经典 Agent 范式,把 Chain-of-Thought 和工具调用结合起来。核心循环是 Thought → Action → Observation 三件套:模型先用自然语言写出"我现在的判断"(Thought),再决定调用哪个工具(Action),看到工具返回值(Observation),然后开始下一轮循环,直到觉得可以给最终答案。它的强大之处在于:推理过程显式可见——你能 debug Agent 哪一步想歪了;推理和行动交错——不是想一大段再一次性执行,而是想一步、查一步、根据新信息调整。今天主流 Agent 框架(LangGraph、CrewAI)的默认范式都是 ReAct 或其变体。
一个类比
像侦探破案——不会坐在办公室里凭空推理完整套理论再动手,而是想一个假设、去现场查证、根据新线索调整下一步推理。每一步的"想"和"做"都是交错的。
举个例子
用户:"特斯拉和苹果哪个市值大?"
— Thought: 我需要分别查两家公司的市值
— Action: search("特斯拉 市值")
— Observation: "约 8000 亿美元"
— Thought: 接下来查苹果
— Action: search("苹果 市值")
— Observation: "约 3.5 万亿美元"
— Thought: 苹果远大于特斯拉,可以回答了
— Final Answer: "苹果市值约 3.5 万亿美元,远大于特斯拉的 8000 亿美元。"PYTHON 示例
相关概念
- → Agent Loop· 智能体循环
- → CoT (Chain-of-Thought)· 思维链
- → Planning / Plan-and-Execute· 规划
- → Reflection· 反思