Agentic Reasoning for Large Language Models
ArXiv ID: 2601.12538作者: Tianxin Wei, Ting-Wei Li, Zhining Liu, Xuying Ning, Ze Yang 等 29 位作者发布日期: 2026-01-18分类: ai-agents
摘要推理是人类推断、问题求解和决策的基本认知过程。虽然大语言模型(LLM)在封闭世界环境中展现了强大的推理能力,但在开放式动态环境中仍面临挑战。本文综述了**智能体推理(Agentic Reasoning)**这一范式转变:将 LLM 重新定义为能够自主规划、行动并通过持续交互学习的智能体。
研究框架沿三个互补维度组织:
基础智能体推理 – 在稳定环境中建立核心单智能体能力(规划、工具使用、搜索)
自进化智能体推理 – 研究智能体如何通过反馈、记忆和适应...
Memory in the Age of AI Agents
Memory in the Age of AI Agents
ArXiv ID: 2512.13564作者: Yuyang Hu, Wangchunshu Zhou, Yixin Liu 等 47 位作者发布日期: 2025-12-15分类: context-engineering
摘要记忆已成为(并将持续是)基础模型智能体的核心能力。随着智能体记忆研究的快速扩展和前所未有的关注,该领域也变得日益碎片化 – 现有工作在动机、实现和评估协议上存在显著差异。传统的长期/短期记忆分类已不足以涵盖当代智能体记忆系统的多样性。
本文提供了一个全面的、多视角的智能体记忆研究全景,明确界定了智能体记忆的范畴,并将其与 LLM 记忆、RAG 和上下文工程等相关概念区分开来。
主要贡献1. 三视角分析框架提出了一个从三个维度理解智能体记忆的统一框架:
形式视角 (Forms)
Token ...
Reasoning Beyond Language: A Comprehensive Survey on Latent Chain-of-Thought Reasoning
Reasoning Beyond Language: A Comprehensive Survey on Latent Chain-of-Thought Reasoning
ArXiv ID: 2505.16782作者: Xinghao Chen, Anhao Zhao, Heming Xia, Xuan Lu, Hanlin Wang, Yanjun Chen, Wei Zhang, Jian Wang, Wenjie Li, Xiaoyu Shen发布日期: 2025-05-22分类: prompt-engineering
摘要传统的链式思维(CoT)推理依赖于显式的语言生成 – 模型必须将每个推理步骤以文本形式输出。本文综述了一个新兴且快速增长的研究方向:潜在 CoT 推理(Latent CoT Reasoning),其中推理过程嵌入在潜在空间中而非通过显式语言表达。通过将推...
自动提示工程综述:优化视角
A Survey of Automatic Prompt Engineering: An Optimization Perspective
ArXiv ID: 2502.11560作者: Wenwu Li, Xiangfeng Wang, Wenhao Li, Bo Jin发布日期: 2025-02-17分类: prompt-engineering, optimization
摘要基础模型的兴起使研究焦点从资源密集型的微调转向提示工程——一种通过输入设计而非权重更新来引导模型行为的范式。本综述首次从统一的优化视角对自动提示工程进行了全面考察。我们将提示优化形式化为离散、连续和混合提示空间上的最大化问题,考察了基于基础模型的优化、进化方法、基于梯度的优化和强化学习方法。通过分析优化变量 (指令、软提示、样例)、任务特定目标和计算框架,我们在理论形式化与跨文本、视觉和多模态领域的实际实...
基于图的检索增强生成(GraphRAG)
Retrieval-Augmented Generation with Graphs (GraphRAG)
ArXiv ID: 2501.00309作者: Haoyu Han, Yu Wang, Harry Shomer, and 15 other authors发布日期: 2025-01-08
摘要检索增强生成(RAG)已成为通过整合外部知识增强大语言模型的强大范式。传统RAG系统依赖于从非结构化文本进行基于向量的检索,而GraphRAG利用图结构数据通过节点和边编码大规模异构和关系信息。本综述对GraphRAG进行了全面考察,提出了一个整体框架,定义了包括查询处理器、检索器、组织器、生成器和数据源在内的关键组件。我们系统地回顾了针对不同领域定制的技术,并讨论了图构建、检索效率和与大语言模型集成方面的挑战。通过考察医疗、金融和电子商务等专业领域的实现,我们突出了图结构在捕获复杂关...
大语言模型在不同NLP任务中的提示工程方法综述
大语言模型在不同NLP任务中的提示工程方法综述论文概述本文是一篇关于提示工程的综述性研究论文,由 Shubham Vatsal 等2位研究者共同完成。
This 综合性 综述 examines 44 research papers covering 39 different prompting methods applied across 29 NLP tasks. The paper provides a 系统性 taxonomy of 提示工程 techniques and evaluates their performance across various datasets and 大语言模型s, offering practical guidance for researchers and practitioners in selecting appropriate prom...
大语言模型提示工程系统性综述:技术与应用
大语言模型提示工程系统性综述:技术与应用论文概述本文是一篇关于提示工程的综述性研究论文,由 Pranab Sahoo 等6位研究者共同完成。
This 综合性 综述 provides a structured overview of recent advancements in 提示工程 for 大语言模型 (大语言模型s) and vision-language models (VLMs). It addresses the gap in 系统性 organization by categorizing approaches by application area, providing detailed summaries of prompting methodologies, models, datasets, and creating a taxonomy of techniq...