Agentic Reasoning for Large Language Models

Posted on 一月 18, 2026

ArXiv ID: 2601.12538
作者: Tianxin Wei, Ting-Wei Li, Zhining Liu, Xuying Ning, Ze Yang 等 29 位作者
发布日期: 2026-01-18
分类: ai-agents

摘要

推理是人类推断、问题求解和决策的基本认知过程。虽然大语言模型（LLM）在封闭世界环境中展现了强大的推理能力，但在开放式动态环境中仍面临挑战。本文综述了**智能体推理（Agentic Reasoning）**这一范式转变：将 LLM 重新定义为能够自主规划、行动并通过持续交互学习的智能体。

研究框架沿三个互补维度组织：

本文首次将智能体推理组织为一个系统的三层框架，涵盖从单智能体基础能力到多智能体协作的完整谱系。这一框架使得研究者能够清晰定位自己的工作在整个领域中的位置。

跨越三个层次，综述区分了两种推理范式：

综述审查了涵盖科学研究、机器人技术、医疗保健、自主研究和数学等领域的代表性智能体推理框架。

基础层关注在相对稳定的环境中建立核心能力：

中间层研究智能体如何自我改进：

顶层扩展到多个智能体协同工作：

作为综述论文，本文通过对大量现有工作的系统分析，揭示了以下关键趋势：

这篇综述是对 2025-2026 年智能体推理领域最全面的梳理之一。三层框架的提出非常有价值，为理解智能体从单一推理到协作推理的演进提供了清晰的路径。特别值得关注的是对自进化推理的关注 – 这是从”使用工具的 LLM”到”真正自主智能体”的关键跨越。

配套的 Awesome-Agentic-Reasoning 仓库是极佳的跟踪资源。

评分: 4.5/5.0

分类置信度: High

代码仓库: GitHub