ReAct

Reasoning + Acting

让 Agent 边想边做：每一步先写出 Thought，再决定 Action。

详解

ReAct 是 2022 年提出的经典 Agent 范式，把 Chain-of-Thought 和工具调用结合起来。核心循环是 Thought → Action → Observation 三件套：模型先用自然语言写出"我现在的判断"（Thought），再决定调用哪个工具（Action），看到工具返回值（Observation），然后开始下一轮循环，直到觉得可以给最终答案。它的强大之处在于：推理过程显式可见——你能 debug Agent 哪一步想歪了；推理和行动交错——不是想一大段再一次性执行，而是想一步、查一步、根据新信息调整。今天主流 Agent 框架（LangGraph、CrewAI）的默认范式都是 ReAct 或其变体。

一个类比

像侦探破案——不会坐在办公室里凭空推理完整套理论再动手，而是想一个假设、去现场查证、根据新线索调整下一步推理。每一步的"想"和"做"都是交错的。

举个例子

用户："特斯拉和苹果哪个市值大？"
— Thought: 我需要分别查两家公司的市值
— Action: search("特斯拉 市值")
— Observation: "约 8000 亿美元"
— Thought: 接下来查苹果
— Action: search("苹果 市值")
— Observation: "约 3.5 万亿美元"
— Thought: 苹果远大于特斯拉，可以回答了
— Final Answer: "苹果市值约 3.5 万亿美元，远大于特斯拉的 8000 亿美元。"

PYTHON 示例