失败是成功之母：利用负样本增强少样本上下文学习

Posted on 七月 31, 2025

失败是成功之母：利用负样本增强少样本上下文学习 ArXiv ID: 2507.23211作者: Yunhao Liang, Ruixuan Ying, Takuya Taniguchi, Zhe Cui机构: Zhejiang University, HIT发布日期: 2025-07-31 摘要大型语言模型展现出强大的少样本上下文学习（ICL）能力，但性能对提供的示例高度敏感。最近的研究主要集中在为每个查询检索正样本示例，忽略了负样本（导致错误预测的示例）的额外信息。本文提出利用负样本更好地选择正样本示例，通过分析负样本的特征识别导致失败的模式，从而选择更具代表性和互补性的正样本。实验表明，结合负样本信息的方法比仅使用正样本提升**12-18%**的准确率。问题背景少样本上下文学习的挑战12345678910111213传统 ICL 示例选择方法：正样本方法：查询："...

阅读全文

什么使上下文学习在数学推理中有效：理论分析

Posted on 十二月 11, 2024

什么使上下文学习在数学推理中有效：理论分析论文概述本文是一篇关于推理能力的研究论文，由 Jiayu Liu 等6位研究者共同完成。本文提供了首个关于上下文学习（In-Context Learning, ICL）在大语言模型数学推理中有效性的理论分析。虽然少样本示例有时会带来负面性能，其有效性仍不可靠，但这项工作证明了推理效能可以通过面向大语言模型的语义相似性和示例的推理稳定性来限定。基于这一理论基础，作者提出了 LMS3，一种示例选择方法，能够自适应地为不同大语言模型选择最相关的样本，并包含一种新颖的自动拒绝机制来过滤不合适的示例。该方法在多个数据集上实现了一致的改进，而现有方法在这些数据集上均已失败。研究目标本研究的主要目标包括：首次通过语义相似性和推理稳定性界定上下文学习推理效能的理论分析证明理论框架适用于单样本和少样本场景提出具有理论基础的 LMS3 示例选择方法 ...

阅读全文

基于大语言模型的少样本上下文偏好学习

Posted on 十月 22, 2024

基于大语言模型的少样本上下文偏好学习论文信息标题: ICPL: Few-shot In-context Preference Learning via LLMs 作者: Chao Yu, Qixin Tan, Hong Lu, Jiaxuan Gao, Xinting Yang, Yu Wang, Yi Wu, Eugene Vinitsky 发布日期: 2024-10-22 ArXiv链接: https://arxiv.org/abs/2410.17233 核心概述基于偏好的强化学习是处理难以明确定义奖励函数任务的有效方法,但传统偏好学习往往需要从零开始,效率极低。本文展示了大语言模型(LLM)具有原生的偏好学习能力,可以实现高效的样本效率偏好学习,从而解决这一挑战。主要贡献研究提出了ICPL(In-Context Preference Learning)框架,利用LLM...

阅读全文

长上下文 LLM 在长上下文学习中的挑战

Posted on 四月 2, 2024

长上下文 LLM 在长上下文学习中的挑战 ArXiv ID: 2404.02060作者: Tianle Li, Ge Zhang, Quy Duc Do, Xiang Yue, Wenhu Chen机构: University of Waterloo, Tencent AI Lab发布日期: 2024-04-02基准: LongICLBench 摘要大型语言模型在处理长序列方面取得了重大进展，一些模型甚至声称能够处理数百万 token。然而，它们的性能评估主要局限于困惑度和合成任务等指标。本文提出 LongICLBench，一个全面的基准测试套件，专门评估长上下文 LLM 在实际长上下文学习任务中的表现。评估结果揭示了令人惊讶的发现：即使是声称支持超长上下文的模型，在实际长上下文学习任务中也表现不佳。性能随上下文长度增加显著下降，尤其是当有用信息分散在长文本中时。问题背景长上...

阅读全文