Claude高级工具使用：工具搜索、程序化调用与使用示例三大新功能

Posted on 十一月 24, 2025

Claude高级工具使用：工具搜索、程序化调用与使用示例三大新功能

来源: Anthropic Engineering Blog
作者: Bin Wu 及 Claude Developer Platform 团队
发布日期: 2025-11-24
分类: ai-agents

概述

Anthropic在Claude开发者平台推出三项高级工具使用Beta功能，分别解决传统工具使用的三大瓶颈：工具定义的上下文膨胀（可超过50,000 tokens）、每次调用的推理开销、以及JSON Schema无法表达使用模式的参数歧义问题。这三项功能将AI Agent从”简单函数调用”推向”智能编排”的新阶段。

核心内容

传统工具使用的三大瓶颈

上下文膨胀：工具Schema在Agent处理用户请求前就可能消耗50,000+个token
推理开销：每次工具调用需要完整模型推理，中间结果在上下文中累积
参数歧义：JSON Schema定义结构但无法表达使用模式和约定

功能一：工具搜索工具 (Tool Search Tool)

核心机制：按需发现工具，而非预先加载所有定义。

使用defer_loading: true标记工具，提供基于正则或BM25的搜索机制。只保留3-5个关键高频工具始终加载。

性能数据：

上下文消耗减少 85%，同时保持对完整工具库的访问
Opus 4 准确率：49% -> 74%
Opus 4.5 准确率：79.5% -> 88.1%
保留 prompt 缓存能力

适用场景：工具定义超过10K tokens、工具选择准确率低、管理10+工具跨多个MCP服务器。

功能二：程序化工具调用 (Programmatic Tool Calling)

核心机制：Claude编写Python代码来编排工具，而非顺序API调用。

代码可以：

调用多个工具而不将中间结果返回上下文
执行数据过滤、转换和聚合
控制哪些信息进入模型的上下文窗口

性能数据：

Token使用：43,588 -> 27,297（节省37%）
延迟改进：20+次工具调用不再需要19+次推理
知识检索准确率：25.6% -> 28.5%

真实案例：Claude for Excel使用此功能”读写数千行电子表格而不过载模型的上下文窗口”。

适用场景：大型数据集处理、多步依赖工作流、并行操作、数据转换后推理。

功能三：工具使用示例 (Tool Use Examples)

核心机制：提供超越JSON Schema的具体使用模式。

演示内容：

格式约定（日期格式、ID模式）
嵌套结构模式
可选参数关联
合理的工具组合

性能数据：复杂参数处理准确率从 72% 提升到 90%。

最佳实践：

使用真实数据（避免占位符）
展示最小、部分和完整规范模式
每个工具1-5个示例
聚焦Schema无法澄清的歧义领域

分层实施指南

识别主要瓶颈：上下文膨胀？中间结果？参数错误？
针对性应用：不要同时实施所有三项功能
按需叠加：三项功能相互互补

代码示例

1
2
3

# 启用高级工具使用 Beta 功能
betas = ["advanced-tool-use-2025-11-20"]
model = "claude-sonnet-4-5-20250929"

个人评价

这篇文章展示了Anthropic在工具使用领域的系统性思考。三项功能分别对应三个独立的瓶颈，设计上相互正交又可叠加，这是优秀的工程设计。特别值得注意的是程序化工具调用——它本质上是让模型用代码来管理自己的上下文窗口，这与之前的”Code execution with MCP”文章形成了完美的呼应。性能数据也非常说服力：85%的上下文减少和37%的token节省不是增量改进，而是量级的变化。对于管理大量工具的Agent开发者来说，这些功能将是架构设计的关键基础设施。

评分: 4.90/5.0

分类置信度: high

相关链接: