Claude高级工具使用:工具搜索、程序化调用与使用示例三大新功能

Claude高级工具使用:工具搜索、程序化调用与使用示例三大新功能

来源: Anthropic Engineering Blog
作者: Bin Wu 及 Claude Developer Platform 团队
发布日期: 2025-11-24
分类: ai-agents

概述

Anthropic在Claude开发者平台推出三项高级工具使用Beta功能,分别解决传统工具使用的三大瓶颈:工具定义的上下文膨胀(可超过50,000 tokens)、每次调用的推理开销、以及JSON Schema无法表达使用模式的参数歧义问题。这三项功能将AI Agent从”简单函数调用”推向”智能编排”的新阶段。

核心内容

传统工具使用的三大瓶颈

  1. 上下文膨胀:工具Schema在Agent处理用户请求前就可能消耗50,000+个token
  2. 推理开销:每次工具调用需要完整模型推理,中间结果在上下文中累积
  3. 参数歧义:JSON Schema定义结构但无法表达使用模式和约定

功能一:工具搜索工具 (Tool Search Tool)

核心机制:按需发现工具,而非预先加载所有定义。

使用defer_loading: true标记工具,提供基于正则或BM25的搜索机制。只保留3-5个关键高频工具始终加载。

性能数据

  • 上下文消耗减少 85%,同时保持对完整工具库的访问
  • Opus 4 准确率:49% -> 74%
  • Opus 4.5 准确率:79.5% -> 88.1%
  • 保留 prompt 缓存能力

适用场景:工具定义超过10K tokens、工具选择准确率低、管理10+工具跨多个MCP服务器。

功能二:程序化工具调用 (Programmatic Tool Calling)

核心机制:Claude编写Python代码来编排工具,而非顺序API调用。

代码可以:

  • 调用多个工具而不将中间结果返回上下文
  • 执行数据过滤、转换和聚合
  • 控制哪些信息进入模型的上下文窗口

性能数据

  • Token使用:43,588 -> 27,297(节省37%)
  • 延迟改进:20+次工具调用不再需要19+次推理
  • 知识检索准确率:25.6% -> 28.5%

真实案例:Claude for Excel使用此功能”读写数千行电子表格而不过载模型的上下文窗口”。

适用场景:大型数据集处理、多步依赖工作流、并行操作、数据转换后推理。

功能三:工具使用示例 (Tool Use Examples)

核心机制:提供超越JSON Schema的具体使用模式。

演示内容:

  • 格式约定(日期格式、ID模式)
  • 嵌套结构模式
  • 可选参数关联
  • 合理的工具组合

性能数据:复杂参数处理准确率从 72% 提升到 90%

最佳实践

  • 使用真实数据(避免占位符)
  • 展示最小、部分和完整规范模式
  • 每个工具1-5个示例
  • 聚焦Schema无法澄清的歧义领域

分层实施指南

  1. 识别主要瓶颈:上下文膨胀?中间结果?参数错误?
  2. 针对性应用:不要同时实施所有三项功能
  3. 按需叠加:三项功能相互互补

代码示例

1
2
3
# 启用高级工具使用 Beta 功能
betas = ["advanced-tool-use-2025-11-20"]
model = "claude-sonnet-4-5-20250929"

个人评价

这篇文章展示了Anthropic在工具使用领域的系统性思考。三项功能分别对应三个独立的瓶颈,设计上相互正交又可叠加,这是优秀的工程设计。特别值得注意的是程序化工具调用——它本质上是让模型用代码来管理自己的上下文窗口,这与之前的”Code execution with MCP”文章形成了完美的呼应。性能数据也非常说服力:85%的上下文减少和37%的token节省不是增量改进,而是量级的变化。对于管理大量工具的Agent开发者来说,这些功能将是架构设计的关键基础设施。


评分: 4.90/5.0

分类置信度: high

相关链接:

© 2026 Generative AI Discovery All Rights Reserved.
Theme by hiero