COSTAR-A: 增强 LLM 在视角问题上表现的提示框架
ArXiv ID: 2510.12637
作者: Nzubechukwu C. Ohalete, Kevin B. Gittner, Lauren M. Matheny
发布日期: 2025-10-14
摘要
大型语言模型对提示设计高度敏感。本研究引入 COSTAR-A,一种增强现有 COSTAR 方法的新型提示工程框架。该框架特别针对视角(Point-of-View)问题进行了优化,增加了 Assumption(假设) 维度。研究在多个视角相关任务上评估 COSTAR-A,实验表明该框架在所有模型规模上都带来了8-20% 的性能提升,对小型模型的提升更加显著。
COSTAR-A 框架
从 COSTAR 到 COSTAR-A
1 | 原始 COSTAR 框架(6 维度): |
完整框架详解
1 | COSTAR-A 7 维度: |
Prompt 模板
1 | def build_costar_a_prompt(context, objective, style, tone, |
实验结果
实验设置
任务类型:
- 角色对话生成
- 立场分析
- 观点论证
- 视角转换
评估模型:
- 小型模型(<3B 参数)
- 中型模型(7B-13B 参数)
- 大型模型(70B+ 参数)
对比方法:
- 零样本提示
- 少样本提示
- Chain-of-Thought
- 原始 COSTAR
主要结果
角色对话生成
| 模型规模 | 零样本 | CoT | COSTAR | COSTAR-A |
|---|---|---|---|---|
| 小型 (<3B) | 52.3% | 58.5% | 65.2% | 72.8% |
| 中型 (7B) | 61.5% | 68.2% | 73.5% | 79.1% |
| 大型 (70B) | 72.3% | 78.5% | 82.1% | 85.3% |
提升:相比 COSTAR 提升 5-8%
立场分析
| 方法 | 小型模型 | 中型模型 | 大型模型 |
|---|---|---|---|
| 零样本 | 45.2% | 55.3% | 68.5% |
| 少样本 | 52.1% | 62.5% | 72.3% |
| COSTAR | 58.5% | 68.2% | 78.1% |
| COSTAR-A | 68.3% | 75.5% | 82.5% |
消融实验
假设维度贡献
| 配置 | 对话生成 | 立场分析 | 观点论证 |
|---|---|---|---|
| COSTAR | 65.2% | 58.5% | 62.3% |
| + 假设(隐式) | 68.5% | 62.1% | 65.8% |
| + 假设(显式) | 72.8% | 68.3% | 70.5% |
结论:显式假设维度是关键提升因素
各维度重要性
| 维度移除 | 性能下降 |
|---|---|
| 移除 Context | -12% |
| 移除 Objective | -15% |
| 移除 Assumption | -18% |
| 移除其他 | -5% ~ -8% |
结论:Assumption 是最重要的新增维度
实践指南
快速上手
1 | # 简化的 COSTAR-A 快速模板 |
最佳实践
| 场景 | 推荐重点 |
|---|---|
| 客服对话 | Assumption + Tone |
| 创意写作 | Style + Context |
| 分析任务 | Objective + Assumption |
| 教育内容 | Audience + Tone |
总结
COSTAR-A 通过增加 Assumption 维度,显著提升了视角相关任务的表现:
核心贡献:
- 新增 Assumption 维度明确推理基础
- 7 维度结构化框架
- 适用于各种模型规模
实际价值:
- 8-20% 性能提升
- 对小型模型提升更显著
- 减少试错成本
评分: 4.0/5.0 ⭐⭐⭐⭐
推荐度: 推荐。实用的提示工程框架。