更宽还是更深？通过自适应分支树搜索扩展 LLM 推理时计算

Posted on 三月 6, 2025

更宽还是更深？通过自适应分支树搜索扩展 LLM 推理时计算 ArXiv ID: 2503.04412作者: Yuichi Inoue, Kou Misaki, Yuki Imajuku, So Kuroki, Taishi Nakamura, Takuya Akiba机构: Preferred Networks发布日期: 2025-03-06接收: ICLR 2025 Workshop, NeurIPS 2025 Spotlight 摘要在 LLM 推理时扩展（test-time scaling）中，一个核心问题是：应该探索更多不同的回答（更宽），还是深入改进已有回答（更深）？本文提出的 AB-MCTS（Adaptive Branching MCTS）框架通过自适应地平衡这两种策略，在编码任务上显著优于重复采样和标准 MCTS 方法。核心问题推理时扩展的两难选择123456...

阅读全文