Think-with-Me:交互式测试时干预解决LLM过度思考问题

Posted on 一月 16, 2026

Beyond Model Scaling: Test-Time Intervention for Efficient Deep Reasoning ArXiv ID: 2601.11252作者: Qianyue Wang, Jinwu Hu, Yufeng Wang, Huanxiang Lin, Bolin Chen, Zhiquan Wen, Yaofo Chen, Mingkui Tan发布日期: 2026-01-16内容级别: Analysis 摘要大型推理模型(如QwQ-32B、DeepSeek-R1)在面对推理任务时常常”过度思考”–即使已经得到正确答案仍继续冗余推理,导致上下文窗口浪费和推理延迟增加。本文提出Think-with-Me,一种测试时交互式推理范式,在推理过程中的转折连词处引入外部反馈干预,自适应决定终止或继续推理。在AIME24上,Think-with...

阅读全文

Focused Chain-of-Thought: 通过结构化输入信息实现高效 LLM 推理

Posted on 十一月 27, 2025

Focused Chain-of-Thought: 通过结构化输入信息实现高效 LLM 推理 ArXiv ID: 2511.22176作者: Lukas Struppek, Dominik Hintersdorf, Hannah Struppek, Daniel Neider, Kristian Kersting发布日期: 2025-11-27分类: prompt-engineering, reasoning-efficiency 摘要受认知心理学启发，本文提出了 Focused Chain-of-Thought (F-CoT)，一种将信息提取与推理过程分离的方法。F-CoT 首先将查询中的关键信息组织成简洁的结构化上下文，然后引导模型仅在此上下文上进行推理。在算术应用题上，F-CoT 将生成的 token 减少 2-3 倍，同时保持与标准零样本 CoT 相当的准确率。这是一种无需...

阅读全文