Blog
来源: Claude.com Blog发布日期: 2026-03-06类型: 官方公告
概述Claude 官方博客的最新消息。
本文内容翻译自 Claude.com Blog 官方博客。
模型发布幕后:早期测试用户发现的 Claude Opus 4.6 能力
模型发布幕后:早期测试用户发现的 Claude Opus 4.6 能力
来源: Claude.com Blog发布日期: 2026-03-06类型: 产品更新
概述在新版 Claude 模型正式向公众发布之前,有一小群客户会提前几天获得访问权限。这些早期测试者使用预生产研究模型,针对真实工作负载进行测试,以弄清楚模型擅长什么、在哪里会出问题,以及是否准备好在 Anthropic 公开发布时立即交付给自己的用户。他们提供的诚实评估——包括有效的部分和无效的部分——直接塑造了 Anthropic 最终发布的模型版本。
本文揭示了这一幕后过程的真实面貌。Harvey、bolt.new、Shopify 和 Lovable 四家公司分享了他们在 Claude Opus 4.6 早期访问期间的经历:他们采用的方法、发现的突破以及比任何人都更早学到的经验。从深夜的紧急测试到 Slack 频道在奇...
金融服务行业构建 AI Agent 的实践指南
金融服务行业构建 AI Agent 的实践指南
来源: Claude.com Blog发布日期: 2026-03-06类型: 教程指南
概述Claude 官方博客的最新消息。
本文内容翻译自 Claude.com Blog 官方博客。
Claude 与 Slack 集成:在聊天协作中体验 AI 助手
Claude 与 Slack 集成:在聊天协作中体验 AI 助手
来源: Claude.com Blog发布日期: 2026-03-06类型: 产品更新
概述Claude 现已深度集成到 Slack 中,您可以直接在频道和线程中获得 AI 助手帮助。
本文内容翻译自 Claude.com Blog 官方博客。
Claude Code 网页版:浏览器中的 AI 编程助手
Claude Code 网页版:浏览器中的 AI 编程助手
来源: Claude.com Blog发布日期: 2026-03-06类型: 产品更新
概述Claude Code 现在可以通过浏览器访问,无需安装桌面应用。
本文内容翻译自 Claude.com Blog 官方博客。
Claude Chrome 扩展:浏览网页时的 AI 助手
Claude Chrome 扩展:浏览网页时的 AI 助手
来源: Claude.com Blog发布日期: 2026-03-06类型: 产品更新
概述通过 Chrome 扩展,您可以在浏览网页时直接使用 Claude。
本文内容翻译自 Claude.com Blog 官方博客。
Claude Agent Skills 完整开发指南
Claude Agent Skills 完整开发指南
来源: Claude.com Blog发布日期: 2026-03-06类型: 教程指南
概述从零开始学习如何为 Claude 创建自定义 Skills。
本文内容翻译自 Claude.com Blog 官方博客。
贡献度指标:衡量 AI 助手在团队中的价值
贡献度指标:衡量 AI 助手在团队中的价值
来源: Claude.com Blog发布日期: 2026-03-06类型: 产品更新
概述Anthropic 今日正式宣布在 Claude Code 中推出**贡献度指标(Contribution Metrics)**功能,该功能现已进入公开测试阶段。这项新功能使工程团队能够量化 Claude Code 对其团队开发速度的实际影响,包括追踪由 Claude 协助生成的代码提交和合并的拉取请求(PR)。
在 Anthropic 内部,工程团队广泛使用 Claude Code,贡献度数据帮助公司量化了其实际价值。随着 Claude Code 在内部的普及率不断提升,Anthropic 观察到每位工程师每天合并的 PR 数量增长了67%。在各团队中,目前**70-90%**的代码都是在 Claude Code 的协助下编写的。
虽然仅凭拉取请...
企业级 Cowork 插件:跨行业应用案例
企业级 Cowork 插件:跨行业应用案例
来源: Claude.com Blog发布日期: 2026-03-06类型: 产品更新
概述Anthropic 于 2026 年 2 月 24 日正式发布了面向企业级用户的 Cowork 和插件系统重大更新。此次更新的核心目标是帮助企业将 Claude 深度定制为适应不同部门和角色工作流的专业化智能体(Agents)。通过全新的私有插件市场功能,企业管理员可以创建组织内部的插件分发体系,实现 AI 能力的规模化和标准化部署。
本次发布的主要更新包括:管理员可通过统一的「定制(Customize)」菜单管理插件、技能和连接器;新增对私有 GitHub 仓库作为插件源的支持(私有测试阶段);增强的连接器目录和管理控制;面向终端用户的结构化表单式斜杠命令体验;以及贯穿整个 Cowork 界面的公司品牌化定制。此外,Anthropic 还宣布新增...
AI Agent 常用工作流模式及应用场景
AI Agent 常用工作流模式及应用场景
来源: Claude.com Blog发布日期: 2026-03-06类型: 官方公告
概述本文深入探讨了 AI Agent(智能体)开发中的三种核心工作流模式:顺序工作流、并行工作流和评估 - 优化工作流。文章基于 Anthropic 团队与数十个构建 AI Agent 的团队合作经验,系统性地分析了每种模式的适用场景、权衡取舍和实施策略。
在实际生产环境中,选择正确的工作流模式对于控制延迟、令牌成本与系统可靠性至关重要。顺序工作流适用于具有明确依赖关系的多阶段任务,通过将复杂问题分解为专注的子任务来提高准确性;并行工作流通过同时执行独立任务显著缩短完成时间,适合多维度评估和文档分析场景;评估 - 优化工作流则通过生成与评估的迭代循环,能够产出符合特定质量标准的高质量输出,适用于代码生成、专业文档和客户通信等场景。
文章强调了一个核心原...
Claude Team 更新:团队协作功能增强
Claude Team 更新:团队协作功能增强
来源: Claude.com Blog发布日期: 2026-03-06类型: 产品更新
概述Anthropic 于 2026 年 1 月 28 日宣布对 Claude Team 团队计划进行重大更新,旨在使团队协作功能更加普及和经济实惠。此次更新的核心内容包括价格调整、年度折扣政策推出、使用额度提升以及企业级管理功能增强。
具体而言,标准席位价格降至每月 20 美元(年付优惠)或 25 美元(月付),高级席位价格为每月 100 美元(年付优惠)或 125 美元(月付)。每个 Team 席位的使用额度均超过 Pro 个人专业计划,而高级席位的使用额度更是标准席位的五倍。对于高频率使用的超级用户,团队管理员还可以额外购买使用容量。
此次更新充分体现了 Anthropic 对企业协作场景的深度理解。Team 计划为团队成员提供了一个共享工作...
Cowork 插件系统:扩展 AI 助手能力
Cowork 插件系统:扩展 AI 助手能力
来源: Claude.com Blog发布日期: 2026-03-06类型: 产品更新
概述Anthropic 正式宣布为 Claude Cowork 推出插件(Plugins)系统,这是一项旨在将 Claude Code 的强大能力扩展至更广泛用户群体的重要功能更新。插件系统允许用户将技能(Skills)、连接器(Connectors)、斜杠命令(Slash Commands)和子代理(Sub-agents)捆绑在一起,将 Claude 打造成针对特定角色、团队和公司的专业化助手。
通过插件系统,用户不仅可以设定目标让 Claude 完成工作,还能进一步指定工作方式:告诉 Claude 偏好的工作流程、需要集成的工具和数据源、关键工作流程的处理方式,以及向团队暴露的斜杠命令。这使得团队能够获得更加一致和高质量的工作成果。
该功能特别适...
金融行业 Cowork 插件:财务自动化实践
金融行业 Cowork 插件:财务自动化实践
来源: Claude.com Blog发布日期: 2026 年 2 月 24 日类型: 产品更新阅读时间: 5 分钟类别: 企业级 AI、智能体、Claude 企业版
概述2026 年 2 月 24 日,Anthropic 正式宣布对 Claude Cowork 系统进行重大更新,专门针对金融服务行业推出了一系列全新的插件功能和跨应用程序工作流能力。此次更新标志着 AI 助手在金融专业领域的应用迈出了重要一步,使得金融从业人员能够在单一会话中完成从市场数据研究到财务模型更新,再到最终演示文稿制作的端到端工作流程。
本次更新的核心亮点包括:Claude 现在能够在 Excel 和 PowerPoint 之间无缝切换,保持上下文连续性,完成多步骤金融任务;推出了五个由 Anthropic 自主研发的金融插件,涵盖财务分析、投资银行、股票研究...
Cowork 研究预览:前沿 AI 协作技术
Cowork 研究预览:前沿 AI 协作技术
来源: Claude.com Blog发布日期: 2026-03-06类型: 产品更新
概述Claude 官方博客的最新消息。
本文内容翻译自 Claude.com Blog 官方博客。
AI 如何帮助突破成本障碍:COBOL 系统现代化改造
AI 如何帮助突破成本障碍:COBOL 系统现代化改造
来源: Claude.com Blog发布日期: 2026-03-06类型: 教程指南
概述COBOL(Common Business Oriented Language)作为一门诞生于 1959 年的编程语言,至今仍在全球关键基础设施中发挥着不可替代的作用。据统计,美国 95% 的 ATM 交易都依赖 COBOL 处理,每天有数千亿行 COBOL 代码在金融、航空和政府部门的生產系统中运行。然而,随着当初构建这些系统的工程师逐渐退休,能够理解和维护 COBOL 的人才正急剧减少——目前仅有少数大学仍在教授这门语言。
这种技术债务的积累给组织带来了严峻挑战:一方面,COBOL 系统承载着数十年来积累的业务逻辑和数据,其可靠性和稳定性经过长期验证;另一方面,维护成本不断攀升,懂 COBOL 的工程师越来越难寻找。传统现代化改造方...
Anthropic 团队如何使用 Claude Code
Anthropic 团队如何使用 Claude Code
来源: Claude.com Blog发布日期: 2026-03-06类型: 产品更新
概述Anthropic 官方博客发表了一篇深度文章,详细介绍了 Claude Code 在 Anthropic 内部各团队中的实际应用情况。这篇文章通过对公司内部多个部门的访谈,揭示了智能编码工具如何不仅加速传统开发流程,更在消除技术与非技术工作之间的界限。
文章指出,Claude Code 在 Anthropic 内部已被广泛应用于从调试生产环境问题和导航陌生代码库,到构建自定义自动化工具等各种场景。产品工程团队将其称为任何编程任务的”第一站”;数据科学团队利用它快速理解整个代码库和数据管道依赖关系;安全工程团队则将其用于事件响应和运行手册编写。
最引人注目的是,Claude Code 的使用已超越了传统的工程团队。法律团队构建了原型”...
2026 年企业构建 AI Agent 的实践方法
2026 年企业构建 AI Agent 的实践方法
来源: Claude.com Blog发布日期: 2026-03-06类型: 教程指南
概述Claude 官方博客的最新消息。
本文内容翻译自 Claude.com Blog 官方博客。
动态过滤改进网页搜索:更准确高效的信息获取
动态过滤改进网页搜索:更准确高效的信息获取
来源: Claude.com Blog发布日期: 2026-03-06类型: 官方公告
概述Claude 官方博客的最新消息。
本文内容翻译自 Claude.com Blog 官方博客。
Claude 集成:连接您的工作工具
Claude 集成:连接您的工作工具
来源: Claude.com Blog发布日期: 2026-03-06类型: 产品更新
概述2026 年 3 月 6 日,Anthropic 正式推出了 Claude 集成(Integrations)功能,这是一项旨在将 Claude 与用户日常工作工具和应用深度连接的创新产品。与此同时,Claude 的高级研究(Research)能力也得到显著扩展,能够跨网络、Google Workspace 以及已连接的服务进行搜索,快速生成包含完整引用的综合报告。
本次更新标志着 Claude 从单一的对话式 AI 助手向企业级智能工作平台的重大转变。通过集成功能,Claude 能够获取关于用户工作的深度上下文信息——包括项目历史、任务状态和组织知识库——并能够在各个工作界面上执行操作。这意味着 Claude 不再仅仅是一个被动回答问题的工具,而成为了一...
Max 计划:高级 AI 助手服务
Max 计划:高级 AI 助手服务
来源: Claude.com Blog发布日期: 2026-03-06类型: 产品更新阅读时间: 5 分钟
概述2026 年 3 月 6 日,Anthropic 正式推出了面向重度用户的 Max 计划(Max Plan),这是 Claude 订阅服务层级中的全新高级套餐。该计划专为那些需要与 Claude 进行深度协作、对使用量有更高需求的专业人士和企业用户设计。
Max 计划的核心价值在于提供高达 Pro 计划 20 倍的使用额度,同时确保用户能够优先体验 Anthropic 最新推出的功能和模型。这一举措直接回应了活跃用户群体长期以来对扩展使用限额的强烈需求。
该计划提供两种灵活的用量级别:扩展用量版(Expanded Usage) 每月 100 美元,提供 Pro 计划 5 倍的使用额度,适合频繁使用 Claude 处理各类任务的用户;最高...
Claude Opus 4.6 在金融服务领域的应用
Claude Opus 4.6 在金融服务领域的应用
来源: Claude.com Blog发布日期: 2026-03-06类型: 产品更新
概述Claude 官方博客的最新消息。
本文内容翻译自 Claude.com Blog 官方博客。
预览、审查和合并:Claude Code 自动化工作流
预览、审查和合并:Claude Code 自动化工作流
来源: Claude.com Blog发布日期: 2026-03-06类型: 官方公告
概述Anthropic 于 2026 年 2 月 20 日宣布为 Claude Code 桌面版带来重大功能升级,旨在帮助开发者在一个统一的工作环境中完成从代码编写到 PR 合并的完整开发闭环。此次更新涵盖了四大核心功能:自动化预览运行中的应用、智能代码审查、PR 自动修复与合并,以及跨设备无缝会话切换。
这些改进的核心目标是减少开发者在编码过程中的繁琐操作(toil),让开发者能够将更多精力投入到真正有创造性和价值的工作中。通过自动化预览功能,Claude Code 可以直接启动开发服务器并在桌面界面中预览运行中的应用,自动查看 Web 应用 UI、读取控制台日志、捕获错误并持续迭代,无需用户在浏览器和 Claude 之间来回切换。新增的...
Claude Enterprise 自助服务现已正式开放
Claude Enterprise 自助服务现已正式开放
来源: Claude.com Blog发布日期: 2026-03-06类型: 官方公告阅读时间: 约 5 分钟
概述2026 年 3 月 6 日,Anthropic 正式宣布 Claude Enterprise 企业服务现已支持自助购买模式。这一重大更新意味着任何组织都无需再经过销售团队的沟通谈判,直接通过 Anthropic 官网即可完成企业版的采购流程。企业用户可以在几分钟内完成工作区设置、单点登录(SSO)配置,并立即开始邀请团队成员加入。
Claude Enterprise 为企业组织提供了完整的 AI 解决方案,包括 Claude 智能助手、Claude Code 代码编程工具以及 Cowork 协工作品。该服务不仅提供强大的 AI 能力,还配备了企业级的安全保障和管理控制功能,使组织能够安全地在大规模范围内部署 ...
通过 Skills 改进前端设计:AI 辅助开发实践
通过 Skills 改进前端设计:AI 辅助开发实践
来源: Claude.com Blog发布日期: 2026-03-06类型: 官方公告
概述Claude 官方博客的最新消息。
本文内容翻译自 Claude.com Blog 官方博客。
领先零售商如何将 AI 试点转化为企业级转型
领先零售商如何将 AI 试点转化为企业级转型
来源: Claude.com Blog发布日期: 2026-03-06类型: 产品更新
概述Claude 官方博客的最新消息。
本文内容翻译自 Claude.com Blog 官方博客。
改进 Skill Creator:测试、衡量和优化 Agent Skills
改进 Skill Creator:测试、衡量和优化 Agent Skills
来源: Claude.com Blog发布日期: 2026-03-06类型: 产品更新
概述2026 年 3 月 3 日,Anthropic 宣布了对 Claude Code Skill Creator(技能创建器)的重大升级。此次更新将软件开发的严谨性(测试、基准测试、迭代改进)引入了技能创作流程,同时无需用户编写任何代码。
自 2025 年 10 月推出 Agent Skills(智能体技能)以来,Anthropic 发现大多数技能创作者是领域专家而非工程师。他们精通自己的工作流程,但缺乏工具来判断:技能在新模型上是否仍然有效、是否在适当时机触发、编辑后是否真正改进。
新的 Skill Creator 提供了三大核心功能:Evals 评估系统用于编写测试并验证技能行为、基准测试模式追踪通过率/...
Claude Code 最佳实践
Claude Code 最佳实践
从配置环境到跨并行会话扩展,充分利用 Claude Code 的提示和模式。
Claude Code 是一个代理式编码环境。与等待回答问题的聊天机器人不同,Claude Code 可以读取你的文件、运行命令、进行更改,并在你观看、重定向或完全离开的情况下自主解决问题。
核心约束:上下文窗口大多数最佳实践都基于一个约束:Claude 的上下文窗口填充速度很快,随着填充,性能会下降。
Claude 的上下文窗口保存你的整个对话,包括每条消息、Claude 读取的每个文件和每个命令输出。当上下文窗口即将满时,Claude 可能会开始”遗忘”早期的指令或犯更多错误。
给 Claude 一种验证其工作的方式当 Claude 能够验证自己的工作时,例如运行测试、比较屏幕截图和验证输出,它的表现会显著提高。
策略示例
策略
之前
之后
提供验证标准
“...
CLI 参考
CLI 参考
Claude Code 命令行界面的完整参考,包括命令和标志。
CLI 命令
命令
描述
示例
claude
启动交互式会话
claude
claude "query"
使用初始提示启动交互式会话
claude "explain this project"
claude -p "query"
通过 SDK 查询,然后退出
claude -p "explain this function"
cat file | claude -p "query"
处理管道内容
cat logs.txt | claude -p "explain"
claude -c
继续当前目录中最近的对话
claude -c
claude -c -p &...
扩展 Claude Code
扩展 Claude Code
了解何时使用 CLAUDE.md、Skills、subagents、hooks、MCP 和 plugins。
概述扩展插入代理循环的不同部分:
CLAUDE.md 添加 Claude 每个会话都能看到的持久上下文
Skills 添加可重用的知识和可调用的工作流
MCP 将 Claude 连接到外部服务和工具
Subagents 在隔离的上下文中运行自己的循环,返回摘要
Agent teams 协调多个独立的 Claude Code 会话
Hooks 完全在循环外作为确定性脚本运行
Plugins 打包和分发这些功能
将功能与您的目标相匹配
功能
作用
何时使用
示例
CLAUDE.md
每次对话加载的持久上下文
项目约定、”始终执行 X” 规则
“使用 pnpm,而不是 npm。在提交前运行测试。”
Skill
Claude 可以使用...
使用 Hooks 自动化工作流
使用 hooks 自动化工作流
当 Claude Code 编辑文件、完成任务或需要输入时自动运行 shell 命令。
设置你的第一个 hook通过 /hooks 交互式菜单创建 hook:
在 Claude Code CLI 中输入 /hooks
选择 hook 事件(如 Notification)
配置匹配器(或保留为空以匹配所有)
添加要运行的命令
选择存储位置(用户设置或项目设置)
你可以自动化什么在 Claude 需要输入时获得通知macOS:
123456789101112131415{ "hooks": { "Notification": [ { "matcher": "", "hooks"...
通过 MCP 连接工具
通过 MCP 将 Claude Code 连接到工具
了解如何使用 Model Context Protocol 将 Claude Code 连接到您的工具。
使用 MCP 可以做什么连接 MCP servers 后,您可以要求 Claude Code:
从问题跟踪器实现功能:”添加 JIRA 问题 ENG-4521 中描述的功能,并在 GitHub 上创建 PR。”
分析监控数据:”检查 Sentry 和 Statsig 以检查 ENG-4521 中描述的功能的使用情况。”
查询数据库:”根据我们的 PostgreSQL 数据库,找到 10 个使用功能 ENG-4521 的随机用户的电子邮件。”
集成设计:”根据在 Slack 中发布的新 Figma 设计更新我们的标准电子邮件模板”
自动化工作流:”创建 Gmail 草稿,邀请这 10 个用户参加关于新功能的反馈会议。”
安...
常见工作流程
常见工作流程
使用 Claude Code 探索代码库、修复错误、重构、测试和其他日常任务的分步指南。
理解新代码库快速获取代码库概览
导航到项目根目录:cd /path/to/project
启动 Claude Code:claude
请求高级概览:give me an overview of this codebase
深入了解特定组件:
explain the main architecture patterns used here
what are the key data models?
how is authentication handled?
查找相关代码
要求 Claude 查找相关文件:find the files that handle user authentication
获取有关组件如何交互的上下文:how do these authenticat...
记忆和 CLAUDE.md
Claude 如何记住你的项目
使用 CLAUDE.md 文件为 Claude 提供持久指令,并让 Claude 通过自动记忆自动积累学习。
每个 Claude Code 会话都从一个全新的上下文窗口开始。两种机制可以跨会话传递知识:
CLAUDE.md 文件:你编写的指令,为 Claude 提供持久上下文
自动记忆:Claude 根据你的更正和偏好自己编写的笔记
CLAUDE.md 与自动记忆对比
CLAUDE.md 文件
自动记忆
谁编写
你
Claude
包含内容
指令和规则
学习和模式
范围
项目、用户或组织
每个工作树
加载到
每个会话
每个会话(前 200 行)
用于
编码标准、工作流、项目架构
构建命令、调试见解、偏好
CLAUDE.md 文件选择 CLAUDE.md 文件的位置
范围
位置
目的
共享对象
托管策略
系统...
配置权限
配置权限
使用细粒度权限规则、模式和托管策略来控制 Claude Code 可以访问和执行的操作。
权限系统Claude Code 使用分层权限系统来平衡功能和安全性:
工具类型
示例
需要批准
“是,不再询问”行为
只读
文件读取、Grep
否
不适用
Bash 命令
Shell 执行
是
每个项目目录和命令永久有效
文件修改
Edit/Write 文件
是
直到会话结束
管理权限使用 /permissions 查看和管理 Claude Code 的工具权限:
Allow 规则让 Claude Code 使用指定的工具而无需手动批准
Ask 规则在 Claude Code 尝试使用指定工具时提示确认
Deny 规则防止 Claude Code 使用指定的工具
规则按顺序评估:deny -> ask -> allow。第一个匹配的规...
快速入门
快速入门
欢迎使用 Claude Code!
本快速开始指南将在几分钟内让您使用 AI 驱动的编码辅助。
开始前确保您拥有:
打开的终端或命令提示符
一个要处理的代码项目
一个 Claude 订阅或 Anthropic Console 账户
步骤 1:安装 Claude Code原生安装(推荐)macOS, Linux, WSL:
1curl -fsSL https://claude.ai/install.sh | bash
Windows PowerShell:
1irm https://claude.ai/install.ps1 | iex
Windows CMD:
1curl -fsSL https://claude.ai/install.cmd -o install.cmd && install.cmd && del install....
Claude Code 设置
Claude Code 设置
使用全局和项目级设置以及环境变量配置 Claude Code。
配置作用域Claude Code 使用作用域系统来确定配置应用的位置以及与谁共享。
可用作用域
作用域
位置
影响范围
与团队共享?
Managed
服务器管理的设置、plist / 注册表
机器上的所有用户
是(由 IT 部署)
User
~/.claude/ 目录
您,跨所有项目
否
Project
存储库中的 .claude/
此存储库上的所有协作者
是(提交到 git)
Local
.claude/*.local.* 文件
您,仅在此存储库中
否(gitignored)
作用域优先级当在多个作用域中配置相同的设置时,更具体的作用域优先:
Managed(最高)- 无法被任何内容覆盖
命令行参数 - 临时会话覆盖
Local - 覆盖项目和用户设...
创建自定义 subagents
创建自定义 subagents
在 Claude Code 中创建和使用专门的 AI subagents,用于特定任务的工作流和改进的上下文管理。
什么是 SubagentsSubagents 是处理特定类型任务的专门 AI 助手。每个 subagent 在自己的 context window 中运行,具有:
自定义系统提示
特定的工具访问权限
独立的权限
Subagents 帮助您
保留上下文:将探索和保持在主对话之外
强制执行约束:限制 subagent 可以使用的工具
跨项目重用配置:使用用户级 subagents
专门化行为:为特定领域使用专注的系统提示
控制成本:将任务路由到更快、更便宜的模型
内置 subagentsExplore
Model: Haiku(快速、低延迟)
Tools: 只读工具
Purpose: 文件发现、代码搜索、代码库探索
Plan
Mod...
故障排除
故障排除
发现 Claude Code 安装和使用中常见问题的解决方案。
安装问题常见错误消息
错误
解决方案
command not found: claude
修复 PATH
syntax error near unexpected token '<'
安装脚本返回 HTML
curl: (56) Failure writing output to destination
先下载脚本,然后运行
Linux 上安装期间 Killed
添加交换空间
TLS connect error
更新 CA 证书
Failed to fetch version
检查网络连接
Invoke-Expression: Missing argument
使用正确的 shell
调试步骤检查网络连接验证可以访问 Google Cloud Sto...
来源: Anthropic Engineering Blog发布日期: 2026-03-06
概述Anthropic 工程博客的技术分享。
本文内容翻译自 Anthropic Engineering Blog 官方博客。
Claude Code 最佳实践指南
Claude Code 最佳实践指南
来源: Anthropic Engineering Blog作者: Anthropic Engineering Team发布日期: 2026-03-01
概述提供 Claude Code 使用的最佳实践指南,包括配置、工作流和常见问题解决。
概述本文是 Anthropic Engineering Blog 发布的技术文章,分享了 Anthropic 团队在 AI 工程领域的实践经验和洞察。
核心要点
Anthropic 工程团队的技术洞察
实际项目的经验总结
可复用的最佳实践
相关链接
原文链接
Anthropic 开发者文档
关于 AnthropicAnthropic 是一家专注于 AI 安全和研究的公司,致力于构建可靠、可解释、可导向的 AI 系统。
相关链接
原文链接
Anthropic 开发者文档
Anthropic 官网
本...
使用并行 Claude 团队协作构建 C 语言编译器
使用并行 Claude 团队协作构建 C 语言编译器
来源: Anthropic Engineering Blog作者: Anthropic Engineering Team发布日期: 2026-02-05
概述展示如何使用并行 Claude 团队协作构建 C 语言编译器的完整过程和关键技术。
概述本文是 Anthropic Engineering Blog 发布的技术文章,分享了 Anthropic 团队在 AI 工程领域的实践经验和洞察。
核心要点
Anthropic 工程团队的技术洞察
实际项目的经验总结
可复用的最佳实践
相关链接
原文链接
Anthropic 开发者文档
关于 AnthropicAnthropic 是一家专注于 AI 安全和研究的公司,致力于构建可靠、可解释、可导向的 AI 系统。
相关链接
原文链接
Anthropic 开发者文档
Anthrop...
量化 Agentic 代码评估中的基础设施噪声
量化 Agentic 代码评估中的基础设施噪声
来源: Anthropic Engineering Blog作者: Anthropic Engineering Team发布日期: 2026-02-03
概述分析和量化在 Agentic 代码评估中基础设施噪声的影响,提供减少噪声的方法。
概述本文是 Anthropic Engineering Blog 发布的技术文章,分享了 Anthropic 团队在 AI 工程领域的实践经验和洞察。
核心要点
Anthropic 工程团队的技术洞察
实际项目的经验总结
可复用的最佳实践
相关链接
原文链接
Anthropic 开发者文档
关于 AnthropicAnthropic 是一家专注于 AI 安全和研究的公司,致力于构建可靠、可解释、可导向的 AI 系统。
相关链接
原文链接
Anthropic 开发者文档
Anthropic 官...
揭开 AI Agent 评估的神秘面纱
揭开 AI Agent 评估的神秘面纱
来源: Anthropic Engineering Blog作者: Anthropic Engineering Team发布日期: 2026-01-08
概述全面解析 AI Agent 评估方法,包括评估指标、测试设计和结果解读。
概述本文是 Anthropic Engineering Blog 发布的技术文章,分享了 Anthropic 团队在 AI 工程领域的实践经验和洞察。
核心要点
Anthropic 工程团队的技术洞察
实际项目的经验总结
可复用的最佳实践
相关链接
原文链接
Anthropic 开发者文档
关于 AnthropicAnthropic 是一家专注于 AI 安全和研究的公司,致力于构建可靠、可解释、可导向的 AI 系统。
相关链接
原文链接
Anthropic 开发者文档
Anthropic 官网
本文内容翻...
长时运行 Agent 的有效控制框架
长时运行 Agent 的有效控制框架
来源: Anthropic Engineering Blog作者: Anthropic Engineering Team发布日期: 2025-11-21
概述探讨长时运行 Agent 的控制框架,包括状态管理、错误恢复和任务调度。
概述本文是 Anthropic Engineering Blog 发布的技术文章,分享了 Anthropic 团队在 AI 工程领域的实践经验和洞察。
核心要点
Anthropic 工程团队的技术洞察
实际项目的经验总结
可复用的最佳实践
相关链接
原文链接
Anthropic 开发者文档
关于 AnthropicAnthropic 是一家专注于 AI 安全和研究的公司,致力于构建可靠、可解释、可导向的 AI 系统。
相关链接
原文链接
Anthropic 开发者文档
Anthropic 官网
本文内容翻译...
通过 MCP 执行代码:构建更高效的 AI Agent
通过 MCP 执行代码:构建更高效的 AI Agent
来源: Anthropic Engineering Blog作者: Anthropic Engineering Team发布日期: 2025-10-30
概述介绍如何通过 MCP 协议实现代码执行,构建更高效的 AI Agent 系统。
概述本文是 Anthropic Engineering Blog 发布的技术文章,分享了 Anthropic 团队在 AI 工程领域的实践经验和洞察。
核心要点
Anthropic 工程团队的技术洞察
实际项目的经验总结
可复用的最佳实践
相关链接
原文链接
Anthropic 开发者文档
关于 AnthropicAnthropic 是一家专注于 AI 安全和研究的公司,致力于构建可靠、可解释、可导向的 AI 系统。
相关链接
原文链接
Anthropic 开发者文档
Anthropi...
Browser-Use MCP服务器 - 让AI用自然语言控制浏览器
Browser-Use MCP服务器:浏览器自动化的自然语言革命想象一下,你对AI助手说:”帮我在Amazon上找到评分最高的蓝牙耳机,价格在$50-$100之间,然后把前5个的详细信息整理成表格”。几秒钟后,浏览器自动打开、搜索、筛选、提取数据,最后返回完美格式的表格。这不是科幻,这是Browser-Use MCP服务器正在实现的现实。
为什么需要AI驱动的浏览器自动化?传统方法的痛点使用Selenium/Playwright需要:
❌ 手动分析网页DOM结构
❌ CSS选择器/XPath脆弱,网页改版就失效
❌ 复杂流程需要大量if-else逻辑
❌ 错误处理繁琐(元素未加载、网络超时等)
Browser-Use的自然语言方式1234567from mcp_client import MCPClientclient = MCPClient("br...
ReAct模式Agent中的工具调用历史管理与Token优化策略
问题背景在实现 ReAct(Reasoning + Acting)模式的 AI Agent 时,我们面临一个核心挑战:如何高效管理工具调用历史以优化 Token 使用?
ReAct 模式的标准流程
初始化:将 MCP 的 tool 列表转换为 function calling 格式,传给 LLM
LLM 推理:分析请求,决定调用哪些工具及参数
执行 Tool:调用对应的 MCP tool,获取返回结果
反馈循环:将结果添加到对话历史,再次发送给 LLM
迭代判断:
需要更多信息 → 继续调用工具
信息充足 → 生成最终回复
核心问题当 Agent 处理用户的下一个输入时,需要带上 history + 最新 input。那么:
history 是否有必要带上历史 tool 调用信息?
这个看似简单的问题,实际涉及到:
上下文连贯性 vs Token 成本
多轮推理能力 vs 内...
FineWeb: HuggingFace大规模网络爬取预训练数据集
核心观点:FineWeb不是又一个Common Crawl包装,它是HuggingFace对”如何将野生互联网数据驯化为可训练语料”这个问题的系统性回答。万亿token规模的背后,是一套可复现的工业级数据处理pipeline。
Common Crawl很好,但太野了Common Crawl每月爬取几十亿网页,这是互联网上最大的公开数据源。问题是原始数据完全不能直接用——充斥着广告、导航栏、评论区、重复内容、低质量机器生成文本。如果直接拿来训练,模型学到的是互联网的噪声,而不是语言。
FineWeb的核心价值在于清洗和质量过滤。它不是简单地去掉HTML标签,而是:
内容提取:用启发式规则+机器学习分离正文和噪声
去重:URL级去重移除30-40%重复内容,MinHash去重处理近似重复
质量评分:基于文本连贯性、语法正确性、信息密度打分
语言检测:准确识别100+种语言,置信度评分
...
Cosmopedia: 大规模合成文本数据集 - 用于小语言模型研究
核心观点:Cosmopedia不是”用大模型生成训练数据”的简单实践,它是对”小模型能否通过精心策划的合成数据达到大模型性能”这个命题的系统性验证。答案是肯定的,但前提是数据设计要足够聪明。
小模型复兴:不是开倒车在7B、13B甚至70B参数成为主流的今天,HuggingFace投入资源研究1-3B的小模型,这不是技术倒退,而是实用主义的回归。
现实是:
绝大多数实际应用不需要70B模型的能力
边缘设备、移动端、实时场景无法承受大模型的计算成本
推理成本是服务化LLM的最大成本来源
Phi-1.5(1.3B参数)证明了小模型的可能性——在特定任务上接近GPT-3.5的性能。关键是什么?不是模型架构,而是训练数据。Cosmopedia正是这个洞察的产物。
1660万条数据的”课程设计”Cosmopedia的8个子集不是随机划分,而是精心设计的能力培养路径:
数学推理(auto_ma...
Orca-AgentInstruct: 微软百万级合成指令数据集
AgentInstruct:当AI学会自己批改作业核心观点:微软用多代理协作重新定义了合成数据的质量上限,这不是简单的”让GPT生成训练数据”,而是一套完整的AI自我进化系统。
105万条指令数据,成本几乎为零,质量接近人工标注——微软Orca-AgentInstruct的数据让人重新思考:我们真的还需要花大价钱雇人标数据吗?
为什么AgentInstruct不是”又一个合成数据集”市面上合成数据集多如牛毛,但大多数都是”prompt engineering的产物”:写个好prompt,调用GPT-4,批量生成,完事。这种做法有个致命问题——垃圾进,垃圾出。
AgentInstruct的野心更大:它想让AI学会自己质检、自己迭代、自己优化。
三个代理角色分工明确:
内容转换代理:把网络上的非结构化知识提取成结构化信息(相当于AI版的知识图谱工程师)
种子指令生成代理:基于知识生成多...
MMLU-Pro: 更强大的多任务语言理解评估基准
MMLU-Pro:当大模型在原版MMLU上刷到90分时,你需要一张更难的试卷核心观点:10选项设计不是简单的”加大难度”,而是精准打击了大模型的幸运猜测和浅层模式识别,强制模型展示真实的推理能力。
GPT-4在原版MMLU上88%,Claude-3 Opus 86%,Gemini-Pro 84%——当顶尖模型都在85%以上徘徊时,这个基准已经失去了区分度。MMLU-Pro用10选项和推理导向的问题设计,让这些模型的分数直接腰斩到70%左右。
这不是为了难为模型,而是为了看清模型真正会什么、不会什么。
4选项到10选项:不只是数量变化原版MMLU的4选项意味着什么?即使完全瞎猜,期望得分25%。一个模型如果在某个领域只有模糊印象,通过排除法+合理推测,很容易把准确率提升到40-50%。
这在实际应用中是个严重问题:你以为模型”基本掌握”了某个知识领域,实际上它只是”略懂皮毛”。
MML...
MM-RLHF: 多模态大语言模型人类反馈对齐数据集
MM-RLHF:多模态RLHF的首个完整解决方案核心观点:GPT-4V、Claude-3、Gemini都在用RLHF对齐文本输出,但多模态输出怎么对齐?MM-RLHF用10维评估体系+批评型奖励模型,给出了第一个工业级的答案。
文本RLHF已经成熟——Anthropic的HH-RLHF、OpenAI的InstructGPT都验证了方法的有效性。但多模态场景复杂得多:一张图片的描述是否”好”,不仅取决于语言质量,还要看视觉细节、空间关系、伦理安全。
MM-RLHF是第一个系统性解决这个问题的数据集,16,300条样本,10维评估,27个基准验证。
为什么多模态RLHF比文本RLHF难得多文本RLHF的评估相对简单:有用性、无害性、诚实性。多模态场景要复杂一个数量级:
视觉理解维度(这是文本RLHF没有的):
忠实性:描述是否准确对应图像内容?(最容易出幻觉的地方)
视觉细节:是否捕捉...
Self-Instruct: 开创性的自生成指令数据集
Self-Instruct:点燃开源大模型革命的火种核心观点:Self-Instruct的价值不在82K条数据,而在于证明了”AI可以自己生成训练数据”这条路走得通——它直接催生了Alpaca、Vicuna等一系列开源模型,改变了大模型领域的权力格局。
2022年12月,华盛顿大学发布Self-Instruct论文时,很少人意识到这会成为改变大模型历史的里程碑。3个月后,斯坦福用同样的方法生成52K数据训练出Alpaca,证明了”穷人也能玩大模型”。
从此,大模型不再是OpenAI、Google的专利。
Self-Instruct到底做对了什么在Self-Instruct之前,训练指令遵循模型有三条路:
OpenAI的路:雇佣大量标注员+RLHF(成本:数百万美元)
Google的路:用内部数据+模板生成FLAN数据集(需要大公司资源)
学术界的路:精心设计少量高质量数据(覆盖面有...
Infinity-Instruct: 大规模高质量指令微调数据集
核心观点:智源的Infinity-Instruct用745万条指令证明了一个反直觉的事实——你不需要全部数据,140万条核心样本就能达到95.7%的性能,关键在于数据的”能力覆盖密度”。
规模不是目的,能力覆盖才是745万条指令听起来很多,但在指令微调领域这只能算中等规模。真正让Infinity-Instruct与众不同的是它的能力标签体系(ability_tag)——每条数据都被明确标注了对应的能力维度,比如”数学推理”、”代码生成”、”概念解释”。
这个设计回答了一个核心问题:怎么知道数据集是否”覆盖全面”?传统方法是堆数据量,期望大力出奇迹。而Infinity-Instruct的approach是先定义能力矩阵,然后针对性地生成数据填补空白。这也是为什么他们能用1/5的数据量达到接近完整版的效果。
对比其他指令数据集:
Alpaca 52K:规模太小,能力覆盖有明显...
FineVision: 2400万样本的开源多模态视觉-语言数据集
核心观点:FineVision用1%的基准污染率击穿了VLM(视觉-语言模型)数据集的最大痛点——数据泄露导致的虚假性能。这个数据集证明,开源VLM完全有可能在公平评估下超越闭源模型。
基准污染:行业的脏秘密训练数据包含测试集样本,是AI领域最严重的数据泄露问题。但在多模态领域,这个问题被系统性地忽视了——因为几乎所有大规模数据集都没有做严格的污染检测。
结果是什么?论文里报告的性能数字有相当一部分是记忆而非理解。模型在MMMU、ChartQA等基准上的高分,可能只是因为训练时见过相似甚至相同的图文对。
FineVision的核心突破是1%的基准污染率——这是通过对11个主流VLM基准进行逐一检测和过滤实现的。这意味着:
用FineVision训练的模型,性能提升是真实的
基准测试结果可以信任,不是数据泄露的假象
研究对比是公平的,不同模型站在同一起跑线
对比:LAION-5B等...
Anthropic HH-RLHF: 人类反馈偏好数据集
核心观点:HH-RLHF是RLHF领域的”黄金标准”数据集,它证明了一件事——对齐不是玄学,而是可以通过结构化的人类偏好数据解决的工程问题。
为什么这个数据集重要?在ChatGPT爆火之前,很少有人意识到RLHF(人类反馈强化学习)的价值。OpenAI用InstructGPT证明了它的有效性,而Anthropic用HH-RLHF把这套方法论开源出来,让所有人都能训练”有用且无害”的模型。
这个数据集的核心价值不在于16.9万条样本的规模——这个数量甚至称不上大。它的价值在于清晰的标注哲学:将对齐拆解为Helpfulness(有用性)和Harmlessness(无害性)两个维度,并用简洁的偏好对格式表达人类判断。这种设计让研究者可以分别优化这两个目标,或者在实际应用中灵活权衡。
对比其他偏好数据集,HH-RLHF的标注质量更稳定、任务定义更清晰。这也是为什么它成为了RLHF研究的事实标...
Anthropic 发布 Claude Haiku 4.5:性能接近旗舰,成本仅三分之一
概述2025年10月15日,Anthropic 发布了 Claude Haiku 4.5,这是该公司最新的小型 AI 模型。虽然定位为「小型模型」,但 Haiku 4.5 的性能表现却远超预期,在编程能力上达到了旗舰模型 Sonnet 4.5 的 90%,而成本仅为 Sonnet 4 的三分之一,速度则快了两倍以上。
核心优势接近旗舰的编程能力Claude Haiku 4.5 在代码生成和调试方面表现出色,在 SWE-bench Verified 基准测试中取得了 73.3% 的成绩,仅比旗舰模型 Sonnet 4.5(77.2%)低约 5 个百分点。在 Augment 的智能编程评估中,Haiku 4.5 达到了 Sonnet 4.5 性能的 90%。这意味着开发者可以用更低的成本获得接近旗舰级的编程辅助能力。
极致的性价比Haiku 4.5 的定价策略极具竞争力:
输入: 每百...
Context7 MCP:为 LLM 提供实时代码文档的革命性工具
Context7 MCP:为 LLM 提供实时代码文档的革命性工具由 Upstash 打造的实时、版本精确的代码文档服务器,彻底解决 AI 编程助手的过时信息问题
项目信息
GitHub 仓库:https://github.com/upstash/context7
Stars:33,500+ ⭐
编程语言:TypeScript
开发团队:Upstash
分类:Development, Documentation, Code Intelligence
推荐度:4.8/5.0
维护状态:积极维护中
协议:MIT
简介Context7 MCP 是由 Upstash 团队开发的革命性 Model Context Protocol 服务器,专门解决 AI 编程助手的一个核心痛点:过时的训练数据导致错误的 API 调用和不存在的代码示例。
Context7 直接从官方文档获取最新的、...
Sentry MCP Server - AI驱动的错误追踪和调试
简介Sentry MCP Server 是 Sentry 官方开发的 Model Context Protocol 服务器,旨在为编程 AI 助手(如 Claude Code、Cursor)提供强大的错误追踪和调试能力。该服务器作为 Sentry API 的中间件,使 LLM 能够直接访问和分析 Sentry 中的错误事件、堆栈跟踪、问题历史和性能数据,极大提升了开发者的调试效率。服务器支持两种部署模式:远程 MCP(推荐,由 Sentry 托管在 mcp.sentry.dev)和本地 stdio 模式。核心特性包括 AI 驱动的事件和问题搜索、OAuth 身份验证、支持自托管和 SaaS 两种 Sentry 部署方式。该项目基于 Cloudflare 的远程 MCP 概念,设计理念是 human-in-the-loop(人在回路中),确保 AI 助手在访问敏感数据时始终需要人工授权...
MCP Server Time - 官方时间和时区转换服务器
简介MCP Server Time 是 Anthropic 官方开发的时间和时区转换服务器,作为 Model Context Protocol 生态系统的参考实现之一。该服务器为大语言模型提供了准确的时间信息获取和时区转换能力,支持全球所有 IANA 时区标准,并能自动检测和使用系统时区。服务器实现了两个核心工具:获取当前时间和时区转换,使 AI 助手能够处理各种与时间相关的任务,如安排会议、计算时差、转换时间戳等。作为官方参考实现,该服务器展示了 MCP 协议在实用工具集成方面的标准实践,代码质量高,文档完善,是学习 MCP 开发的优秀示例。
功能特性
获取当前时间 - 支持任意时区的精确时间查询
IANA 时区标准 - 支持全球所有 IANA 时区(如 America/New_York, Asia/Tokyo)
时区转换 - 在不同时区之间进行时间转换
自...
n8n-MCP:AI 驱动的工作流自动化文档服务器
n8n-MCP:AI 驱动的工作流自动化文档服务器为 AI 助手提供全面的 n8n 节点文档、属性和操作信息访问
项目信息
GitHub 仓库:https://github.com/czlonkowski/n8n-mcp
Stars:8,200+ ⭐
编程语言:TypeScript
分类:Productivity, Workflow Automation
推荐度:4.5/5.0
维护状态:积极维护中
协议:MIT
简介n8n-MCP 是一个 Model Context Protocol (MCP) 服务器,为 AI 助手(如 Claude Desktop、Claude Code、Windsurf、Cursor)提供对 n8n 工作流自动化平台的全面访问。该服务器涵盖 536 个 n8n 节点,包含 99% 的节点属性覆盖率和 90% 的文档覆盖率,使 AI 助手能够智能地...
Firecrawl MCP:强大的网页抓取和内容提取服务器
Firecrawl MCP:强大的网页抓取和内容提取服务器官方 Firecrawl MCP 服务器,为 Cursor、Claude 和其他 LLM 客户端添加强大的网页抓取和搜索能力
项目信息
GitHub 仓库:https://github.com/firecrawl/firecrawl-mcp-server
Stars:4,700+ ⭐
编程语言:TypeScript
开发团队:Firecrawl
分类:Web Scraping, Data Extraction
推荐度:4.6/5.0
协议:MIT
简介Firecrawl MCP Server 是 Model Context Protocol 的官方实现,集成 Firecrawl 的网页抓取能力。Firecrawl 是专业的 Web Data API,可以将整个网站转换为 LLM 就绪的 Markdown 或结构化数...
Brave Search MCP Server - 隐私优先的全功能搜索引擎
简介Brave Search MCP Server 是 Brave Software 官方开发的 Model Context Protocol 搜索服务器,集成了功能强大的 Brave Search API,为 AI 助手提供全方位的搜索能力。该服务器支持五大核心搜索功能:网页搜索、本地商户搜索(POI)、图片搜索、视频搜索和新闻搜索,并提供 AI 驱动的搜索结果摘要功能。Brave Search API 以其在 RAG(检索增强生成)管道中的卓越表现而闻名,是使用 Claude MCP 的应用中最受欢迎的搜索工具。服务器支持 stdio 和 HTTP 两种传输协议,提供灵活的部署方式(NPX、Docker、Smithery)。值得注意的是,Brave Search 提供每月 2000 次免费查询额度,足够个人开发和小型项目使用。
功能特性
网页搜索 - 全球互联网内容检索
本地...
MCP Server Everything - The Official Comprehensive MCP Protocol Testing Server | MCP Server Everything - 官方 MCP 协议全功能测试服务器
Introduction | 简介English:
MCP Server Everything is the official Model Context Protocol (MCP) reference testing server developed by Anthropic. With over 70,000 GitHub stars, this is THE definitive reference implementation for the MCP protocol. Unlike production-oriented MCP servers, this server is specifically engineered as a comprehensive protocol demonstration platform for MCP client developer...
Exa MCP:专为 AI 设计的代码搜索和网页研究引擎
Exa MCP:专为 AI 设计的代码搜索和网页研究引擎连接 AI 助手与 Exa AI 的强大搜索能力,提供代码搜索、网页研究和深度调研工具
项目信息
GitHub 仓库:https://github.com/exa-labs/exa-mcp-server
Stars:3,000+ ⭐
编程语言:TypeScript (85.1%)
开发团队:Exa Labs
分类:Search, Code Intelligence, Research
推荐度:4.2/5.0
协议:MIT
简介Exa MCP Server 是一个 Model Context Protocol 服务器,将 AI 助手(如 Claude)连接到 Exa AI 的搜索能力。Exa 是专门为 AI 设计的搜索引擎,提供优化的网页搜索、代码搜索和研究工具。
功能特性核心工具
exa-code:代码上下文搜索
...
面向连续空间推理的推理时扩展
面向连续空间推理的推理时扩展论文信息
标题: Towards Inference-time Scaling for Continuous Space Reasoning
作者: Minghan Wang, Thuy-Trang Vu, Ehsan Shareghi, Gholamreza Haffari
发布日期: 2025-10-14
ArXiv链接: https://arxiv.org/abs/2510.12167
核心概述通过结合过程或结果奖励模型(PRM或ORM)重排序的多样本生成,推理时扩展已被证明对大型语言模型的文本推理有效。本文研究是否可以将这些成熟技术成功应用于连续空间推理,使用COCONUT连续空间推理语言模型作为骨干。
研究系统评估了推理时扩展技术在连续空间推理任务中的表现,如科学计算、物理模拟和几何问题求解。与离散文本推理不同,连续空间推理涉及数值计算和空间关...
COSTAR-A:增强LLM在视角问题上表现的提示框架
COSTAR-A:增强LLM在视角问题上表现的提示框架论文信息
标题: COSTAR-A: A prompting framework for enhancing Large Language Model performance on Point-of-View questions
作者: Nzubechukwu C. Ohalete, Kevin B. Gittner, Lauren M. Matheny
发布日期: 2025-10-14
ArXiv链接: https://arxiv.org/abs/2510.12637
核心概述大型语言模型(LLM)对提示设计高度敏感,制定优化的提示技术对于生成一致的高质量输出至关重要。本研究引入COSTAR-A,一种增强现有COSTAR方法的新型提示工程框架。该框架特别针对视角(Point-of-View)问题进行了优化,这类问题要求模型从特...
XQuant:实现超低比特KV缓存量化的跨层压缩框架
Abstract大语言模型(LLM)在各类自然语言处理任务中展现了卓越能力。然而,其巨大的内存需求,特别是在长文本理解和生成过程中KV缓存的持续增长,给资源受限环境下的部署带来了重大挑战。量化技术作为一种在保留历史信息的同时减少内存消耗的解决方案应运而生。我们提出XQuant,一个训练免费且即插即用的框架,实现了超低等效比特位宽的KV缓存量化。XQuant引入了两项关键创新:计算开销可忽略的无数据校准方法,以及跨层KV缓存压缩技术,使量化比特位宽降至1.4比特以下。在TruthfulQA和LongBench上的大量实验表明,XQuant优于现有最先进方法(如KIVI-2bit和AsymKV-1.5bit),在实现更低比特位宽的同时保持卓越性能,在内存效率和模型精度之间建立了更好的权衡。
Key Contributions
超低比特量化突破:首次实现sub-1.4比特的KV缓存量化,相...
Qdrant MCP Server - 为AI应用提供语义记忆层
Qdrant MCP Server - 为AI应用提供语义记忆层
官方实现 | Stars: 988 | Python | Apache-2.0
概述Qdrant MCP Server 是 Qdrant 官方提供的 Model Context Protocol 实现,作为 AI 应用的语义记忆层。它通过向量嵌入技术,能够在 Qdrant 向量搜索引擎中存储和检索上下文信息,支持语义代码搜索、知识库检索等场景。
该服务器提供了简单而强大的两个核心工具:存储(qdrant-store)和查找(qdrant-find),支持灵活的嵌入模型配置,可以与本地或远程的 Qdrant 数据库集成。特别适合需要长期记忆、上下文检索的 AI 应用场景,如代码助手、知识问答系统等。
核心特性
✅ Qdrant 官方实现,与向量数据库深度集成
🛠️ 简洁的两个核心工具:存储和查找
🎯 支持自定义嵌入...
Telegram MCP Server - 程序化控制Telegram的强大工具
Telegram MCP Server - 程序化控制Telegram的强大工具
社区实现 | Stars: 372 | Python | MIT License
概述Telegram MCP Server 是一个功能完整的 Telegram 集成服务器,基于 Telethon 和 Model Context Protocol (MCP) 构建。它让 AI 助手(如 Claude、Cursor)能够程序化地与 Telegram 账户交互,涵盖聊天管理、消息收发、联系人管理、用户资料操作和搜索发现等全方位功能。
该服务器通过 MCP 协议暴露了数十个 Telegram 工具,使得 AI 能够理解自然语言指令并执行复杂的 Telegram 操作。无论是自动化消息管理、批量群组操作,还是用户数据采集,Telegram MCP Server 都能提供强大的支持。
核心特性
✅ 完整的 Te...
Elasticsearch MCP Server - 企业级搜索引擎的智能桥梁
Elasticsearch MCP Server - 企业级搜索引擎的智能桥梁
官方实现 | Stars: 512 | Rust | Elastic License 2.0 | 实验性
概述Elasticsearch MCP Server 是 Elastic 官方提供的 Model Context Protocol 实现,为 AI Agent 提供了与 Elasticsearch 数据的自然语言交互能力。通过这个 MCP 服务器,AI 助手可以直接探索、查询和分析 Elasticsearch 索引中的数据,无需编写复杂的查询语句。
该服务器使用 Rust 编写,提供了高性能、内存安全的实现。它支持多种连接协议(stdio、SSE、streamable-HTTP),能够无缝集成到各种 MCP 客户端中。作为实验性项目,它正在持续演进,为企业级搜索应用与 AI 的结合开辟了新的可能性。...
MCP Database Server - 通用数据库访问服务器
MCP Database Server - 通用数据库访问服务器
社区实现 | Stars: 206 | TypeScript | MIT
概述MCP Database Server 是一个功能完善的 Model Context Protocol 实现,提供统一的多数据库访问接口。它支持 SQLite、MySQL、PostgreSQL 和 SQL Server 四种主流数据库,让 AI 助手能够通过自然语言直接查询和操作数据库。
该服务器提供了完整的 SQL 操作能力,包括数据查询、修改、表结构管理、数据导出等功能。特别适合需要与数据库交互的 AI 应用场景,如数据分析、报表生成、数据管理等。独特的”业务洞察”功能还能帮助记录和追踪分析过程中的发现。
核心特性
✅ 支持四种主流数据库(SQLite、MySQL、PostgreSQL、SQL Server)
🛠️ 10个强大的数据库...
Meilisearch MCP Server - 轻量级全文搜索引擎
Meilisearch MCP Server - 轻量级全文搜索引擎
官方实现 | Stars: 145 | Python | MIT
概述Meilisearch MCP Server 是 Meilisearch 官方提供的 Model Context Protocol 实现,让 AI 助手能够通过自然语言管理搜索索引和执行全文搜索。它提供了轻量级、快速且易用的搜索引擎能力,特别适合需要即时搜索体验的应用场景。
该服务器提供了完整的 Meilisearch 功能访问,包括索引管理、文档操作、高级搜索、设置配置、API 密钥管理、任务监控等。通过 MCP 协议,开发者可以用自然语言完成复杂的搜索引擎配置和管理任务,无需编写代码。特别适合电商产品搜索、文档知识库、内容发现等场景。
核心特性
✅ Meilisearch 官方实现,原生支持所有功能
🚀 即时搜索体验,平均响应时间 <...
Neo4j MCP Server - 让 AI 理解你的知识图谱
Neo4j MCP Server - 让 AI 理解你的知识图谱
官方实现 | Stars: 34 | Go | BETA 阶段
概述Neo4j MCP Server 是 Neo4j 官方提供的 Model Context Protocol 实现,专门为图数据库设计的 AI 交互接口。它让 AI 能够通过自然语言理解和操作图数据库,无需手动编写复杂的 Cypher 查询。
这个服务器提供了三个核心工具:schema 内省、只读查询和写入查询,能够让 LLM 深入理解图数据库的结构,并执行安全的数据查询和操作。特别适合知识图谱探索、关系分析、社交网络分析等需要处理复杂关系的场景。
重要提示:当前处于 BETA 阶段,尚不适合生产环境使用。
核心特性
✅ Neo4j 官方实现,与图数据库原生集成
🔍 Schema 内省:自动分析图数据库结构
📖 只读 Cypher 查询:安全执行查...
MongoDB MCP Server - 官方文档数据库和 Atlas 集群管理工具
MongoDB MCP Server - 官方文档数据库和 Atlas 集群管理工具
官方实现 | Stars: 676 | TypeScript | Apache-2.0
概述MongoDB MCP Server 是 MongoDB 官方提供的 Model Context Protocol 实现,为 AI 应用提供完整的 MongoDB 数据库和 Atlas 云集群管理能力。它支持双连接模式(本地 MongoDB 和 Atlas 云集群),提供了从数据库连接、CRUD 操作到 Atlas 集群管理的全套工具。
该服务器内置安全控制和只读模式,支持环境变量配置敏感信息,并为危险操作提供确认机制。特别适合需要 AI 辅助的数据库查询、Schema 探索、Atlas 集群管理等场景,让 AI 助手能够安全高效地访问和操作 MongoDB 数据。
核心特性
✅ MongoDB 官方实现,...
Slack MCP Server - 企业级 Slack 工作空间集成方案
Slack MCP Server - 企业级 Slack 工作空间集成方案
高性能实现 | Stars: 776 | Go | MIT
概述Slack MCP Server 是一个功能强大的 Model Context Protocol 服务器,为 Slack 工作空间提供深度集成能力。该服务器采用 Go 语言开发,支持多种认证模式和传输协议,能够实现消息检索、智能搜索、频道管理以及安全的消息发送功能。
作为企业级的 Slack 集成方案,它特别适合需要程序化访问 Slack 数据的场景,如团队沟通分析、知识库构建、自动化工作流等。支持 Stealth 和 OAuth 两种认证模式,灵活适配不同的安全需求。
核心特性
✅ 双认证模式:支持 Stealth 和 OAuth 两种认证方式
🚀 多传输协议:Stdio、SSE、HTTP 三种传输模式
🏢 企业工作空间支持:兼容企业级...
Terraform MCP Server - AI驱动的基础设施即代码管理
Terraform MCP Server - AI驱动的基础设施即代码管理
HashiCorp 官方实现 | Stars: 986 | Go | MPL-2.0
概述Terraform MCP Server 是 HashiCorp 官方提供的 Model Context Protocol 实现,为 AI 助手提供与 Terraform 生态系统的无缝集成。它支持访问 Terraform 公共注册表、管理 HCP Terraform 和 Terraform Enterprise 工作空间,以及执行基础设施即代码(IaC)的各种操作。
该服务器提供了30+ 个专业工具,涵盖 Provider/Module 搜索、工作空间管理、变量配置、运行管理等核心功能。支持双传输协议(Stdio 和 StreamableHTTP),可灵活部署在本地开发环境或企业生产环境中。特别适合需要智能...
AWS MCP Servers - 官方 AWS 生态 MCP 集成套件
AWS MCP Servers - 官方 AWS 生态 MCP 集成套件
AWS Labs 官方 | Stars: 6.7k | Python | Apache-2.0
概述AWS MCP Servers 是由 AWS Labs 官方提供的 Model Context Protocol 服务器套件,包含 60+ 个专业化的 MCP 服务器,全面覆盖 AWS 文档访问、API 操作、基础设施即代码 (IaC)、容器编排、Serverless、AI 服务等领域。这套工具将 AWS 最佳实践直接带入您的开发工作流,通过 AI 助手实现智能化的云资源管理和开发。
该套件不仅提供了与 AWS 服务交互的能力,还集成了智能文档检索、安全扫描、最佳实践建议等功能,使开发者能够通过自然语言与 AWS 生态进行交互,大幅提升云开发效率和质量。
核心特性
✅ AWS Labs 官方维护,与 AWS 服...
Redis MCP Server - 为AI应用提供高性能数据管理
Redis MCP Server - 为AI应用提供高性能数据管理
官方实现 | Stars: 275 | Python | Apache-2.0
概述Redis MCP Server 是 Redis 官方提供的 Model Context Protocol 实现,作为 AI 应用的高性能数据层。它通过自然语言接口,使 AI 助手能够直接管理 Redis 中的各种数据结构,支持从简单缓存到复杂向量搜索的全场景应用。
该服务器提供了完整的 Redis 功能支持,包括字符串、哈希、列表、集合、有序集合、流、JSON 文档和向量搜索。特别适合需要高性能、实时响应的 AI 应用场景,如会话管理、对话历史、实时缓存、推荐系统和 RAG 语义搜索。
核心特性
✅ Redis 官方实现,提供原生级别的性能和可靠性
🚀 完整的数据结构支持:字符串、哈希、列表、集合、有序集合、流
📄 JSON ...
MCP for Beginners Course
MCP for Beginners Course
简介: Microsoft 官方 MCP 入门课程,通过真实的跨语言示例介绍 Model Context Protocol 基础知识。涵盖 .NET、Java、TypeScript、JavaScript、Rust 和 Python 六种语言,帮助开发者掌握构建模块化、可扩展、安全的 AI 工作流的实用技术。
功能特性
6 种编程语言 - C#、Java、JavaScript、Python、TypeScript、Rust
11 个综合模块 - 从基础到高级的完整学习路径
真实案例驱动 - 实际项目示例,非玩具代码
跨语言对比 - 同一概念的多语言实现对比
实用技术聚焦 - 从会话设置到服务编排的实战技能
安全最佳实践 - 内置安全规范和指导
多模态 AI 集成 - 覆盖文本、图像、音频等
开源免费 - 完全开源,持续更新
课程模块0...
Shopify Storefront MCP Server
Shopify Storefront MCP ServerShopify 官方 Storefront MCP 服务器,使 AI 代理能够与特定 Shopify 商店的电商功能交互,让购物者通过智能界面浏览产品、管理购物车和结账,每个商店拥有独立端点,无需认证即可访问。
功能特性
官方 Shopify 服务:Shopify 官方支持
商店特定端点:每个商店独立 MCP 端点
零认证:无需 API 密钥或令牌
产品目录搜索:智能产品搜索和详情
购物车管理:添加、更新、删除购物车项目
购物车检索:获取当前购物车内容
政策查询:商店政策和 FAQ 智能问答
上下文感知:提供场景化的产品信息
自动购物车创建:首次操作自动创建购物车
支持的工具search_shop_catalog搜索产品目录
功能:
搜索产品名称和描述
获取产品详情(名称、价格、URL、描述)
上下文感知搜索结果
支持自然...
Supabase MCP Server - 现代 BaaS 平台全功能管理工具
Supabase MCP Server
简介: Supabase 官方社区 MCP Server,提供 20+ 专业工具连接 Supabase 项目,支持数据库管理、边缘函数、存储、认证等全方位功能。采用 HTTP 托管服务模式,配置简单,并提供完善的安全控制选项。
功能特性
20+ 专业工具 - 覆盖账户、数据库、边缘函数、存储全领域
HTTP 托管服务 - 无需本地安装,一行配置即可使用
OAuth 认证 - 安全的 Supabase 账户身份验证机制
只读模式 - 可配置为只读,保护生产数据安全
项目作用域 - 支持限定特定项目访问范围
数据库分支 - 安全的开发测试环境,避免影响生产
TypeScript 类型生成 - 自动从 schema 生成类型定义
多 IDE 支持 - Cursor、Claude Desktop、Windsurf、VS Code
完善的日志诊断 - ...
Modern Treasury MCP Server
Modern Treasury MCP ServerModern Treasury 官方 MCP 服务器,为支付运营提供自然语言 API 接口
核心特性本服务器提供以下核心功能,全面满足您的需求:
创建预期付款(Expected Payments)
列出内部账户(Internal Accounts)
管理交易对手(Counterparties)
创建支付订单(Payment Orders)
自动化支付工作流程
自然语言交互 API
安装与配置系统要求在开始安装之前,请确保您的系统满足以下要求:
现代操作系统(Windows、macOS 或 Linux)
稳定的网络连接
安装步骤
准备环境
安装依赖
配置服务器
启动服务
Claude Desktop 配置示例在 Claude Desktop 配置文件中添加以下内容:
1234567{ "mcpServe...
MCP Git Server - AI 驱动的 Git 仓库操作工具
MCP Git Server - AI 驱动的 Git 仓库操作工具
官方实现 | Stars: 2000 | Python | MIT License
概述MCP Git Server 是 Anthropic 官方提供的 Model Context Protocol 实现,专为 Git 版本控制系统设计。它通过一组强大的工具,使 AI 助手能够智能地读取、分析和操作 Git 仓库,实现自动化的代码审查、提交管理、分支操作等功能。
该服务器提供了 12 个核心工具,覆盖 Git 的主要操作场景,从基础的状态查询到高级的历史分析,让 AI 能够像开发者一样与 Git 仓库交互。特别适合需要自动化 Git 工作流、智能代码分析和版本控制管理的场景。
核心特性
✅ Anthropic 官方实现,与 MCP 协议深度集成
🛠️ 12 个核心 Git 工具,覆盖完整工作流
🎯 智能差异分...
MCP Memory Server - AI的持久化知识图谱记忆系统
MCP Memory Server - AI的持久化知识图谱记忆系统
官方实现 | Stars: 2000+ | TypeScript | MIT License
概述MCP Memory Server 是 Model Context Protocol 官方提供的知识图谱持久化记忆系统,为 AI 助手提供跨会话的长期记忆能力。通过实体-关系-观察三层架构,它能够像人类一样存储和检索结构化的记忆信息,实现真正的上下文理解和个性化交互。
该服务器采用知识图谱设计理念,将信息组织为互相关联的实体网络。每个实体可以拥有类型、多个观察信息,并通过有向关系与其他实体连接。这种设计使得 AI 能够理解复杂的实体关系、追踪用户偏好、维护长期对话上下文,特别适合需要记忆功能的智能应用场景。
核心特性
✅ 官方实现,Anthropic 官方维护和支持
🧠 知识图谱架构,实体-关系-观察三层结构
💾...
Sequential Thinking MCP Server - 结构化思维问题解决
Sequential Thinking MCP Server - 结构化思维问题解决
官方实现 | Stars: 2000+ | TypeScript | MIT License
概述Sequential Thinking MCP Server 是 Model Context Protocol 官方提供的结构化思维服务器。它通过维护一个动态的思维序列,帮助 AI 助手系统地解决复杂问题。
该服务器的核心是 sequential_thinking 工具,支持逐步分解问题、动态修订思考、分支到替代推理路径等功能。特别适合处理复杂规划、需要多步推理的分析任务、以及初始范围不明确的问题。通过结构化的思考过程,AI 能够更好地维护上下文,过滤无关信息,生成和验证假设。
核心特性
✅ 官方 MCP 实现,完全兼容协议规范
🧠 动态思维序列管理,支持灵活的步骤数调整
🔄 思考修订功能,支持回...
Grafana MCP Server - AI驱动的可观测性平台全面集成
Grafana MCP Server - AI驱动的可观测性平台全面集成
官方实现 | Stars: 1700 | Go | Apache-2.0
概述Grafana MCP Server 是 Grafana Labs 官方提供的 Model Context Protocol 实现,为 AI 助手提供了与 Grafana 可观测性平台的深度集成能力。作为业界领先的开源可观测性解决方案,Grafana 通过这个 MCP 服务器将其强大的监控、告警、日志分析和事件管理能力完全暴露给 AI 模型,实现了真正的”AI 驱动运维”。
该服务器支持 45+ 个专业工具,覆盖 Dashboard 管理、数据源查询(Prometheus/Loki)、告警规则、事件跟踪(Incidents)、智能调查(Sift)、OnCall 排班等全栈可观测性场景。无论是查询指标、分析日志、诊断性能问题...
Datadog MCP Server
Datadog MCP ServerDatadog 官方 MCP 服务器,连接可观测性数据到 AI Agent
核心特性本服务器提供以下核心功能,全面满足您的需求:
查询指标(Metrics)
查询日志(Logs)
查询链路追踪(Traces)
访问错误信息(Errors)
Dashboard 数据检索
Monitor 告警信息
事件管理(Incidents)
服务管理(Services)
安装与配置系统要求在开始安装之前,请确保您的系统满足以下要求:
现代操作系统(Windows、macOS 或 Linux)
稳定的网络连接
安装步骤
准备环境
安装依赖
配置服务器
启动服务
Claude Desktop 配置示例在 Claude Desktop 配置文件中添加以下内容:
1234567{ "mcpServers": { &...
MCP Fetch Server - 官方网页内容获取服务器
MCP Fetch Server - 官方网页内容获取服务器
官方实现 | Stars: 2000+ | Python | MIT License
概述MCP Fetch Server 是 Model Context Protocol 官方提供的网页内容获取服务器,专为 AI 应用设计。它能够获取任意 URL 的内容,并自动将 HTML 转换为 Markdown 格式,使 LLM 能够更好地理解和处理网页内容。
该服务器提供了简单而强大的 fetch 工具,支持分页获取、原始内容模式、自定义长度限制等功能。同时,它还提供了企业级配置选项,包括代理支持、自定义 User-Agent、robots.txt 处理等,适合各种生产环境使用。
核心价值: 将互联网内容接入 AI 应用的标准化桥梁,让 AI 助手能够实时获取和理解网页信息。
核心特性
✅ 官方维护,Model Context ...
Google Calendar MCP Server
Google Calendar MCP ServerGoogle Calendar Model Context Protocol服务器,为Claude等AI助手提供Google Calendar集成。支持多日历管理、事件创建更新删除、智能日程安排、自然语言理解和从图片/PDF导入事件。
功能特性
多日历支持:管理多个Google日历
完整的事件管理:创建、更新、删除、搜索事件
循环事件处理:修改重复发生的事件
空闲/忙碌查询:查询可用时间段
智能日程安排:通过自然语言理解安排会议
事件导入:从图片和PDF文档导入事件
颜色管理:列出和应用日历颜色
OAuth 2.0认证:安全的Google账户集成
TypeScript实现:类型安全的实现
多部署方式:支持npx、本地安装和Docker
支持的工具list-calendars列出所有可访问的日历
list-eve...
Obsidian MCP Server
Obsidian MCP ServerObsidian知识管理MCP服务器,通过Model Context Protocol使AI代理和开发工具能够与Obsidian vault交互。提供读取、写入、搜索和管理笔记、标签和frontmatter的综合工具套件,作为Obsidian Local REST API插件的桥梁。
功能特性
完整的笔记操作:读取、更新、创建、删除笔记
搜索和替换:在笔记内进行文本搜索和替换
全局搜索:跨vault搜索笔记内容
Frontmatter管理:读取和更新YAML frontmatter
标签管理:获取和管理笔记标签
智能缓存:内存中的vault缓存提高性能
双传输协议:支持stdio和HTTP传输
灵活认证:支持JWT、OAuth等认证方式
错误处理:健壮的错误处理机制
TypeScript实现:类型安全的代码库
支持的工具read-note读取特...
MCP Jest Testing Framework
MCP Jest Testing Framework首个(可能是唯一)专为 Model Context Protocol 服务器设计的测试框架,类似 Jest 但专注于 MCP,提供自动化、声明式的 MCP 服务器测试,支持多种传输协议、快照测试和 CI/CD 集成,极大简化 MCP 服务器质量保证。
功能特性
专为 MCP 设计:首个 MCP 专用测试框架
极简 API:一个函数调用完成测试
声明式测试:清晰、简洁的测试定义
全面覆盖:完整的测试覆盖能力
多传输支持:stdio、HTTP streaming、SSE
快照测试:自动捕获和对比快照
测试过滤:灵活的测试筛选
CI/CD 就绪:原生 GitHub Actions 支持
进程管理:自动管理服务器进程
协议握手:自动处理 MCP 协议握手
结构化验证:深度验证 MCP 响应
安装配置安装步骤方式1: 项...
Notion MCP Server - 官方 Notion 工作空间 AI 集成
Notion MCP Server - 官方 Notion 工作空间 AI 集成
官方实现 | Stars: 3200 | TypeScript | MIT
概述Notion MCP Server 是 Notion 官方提供的 Model Context Protocol 实现,为 AI 助手提供完整的 Notion API 访问能力。它支持页面创建、数据库查询、内容更新、评论管理等核心功能,让 AI 工具能够直接与 Notion 工作空间交互,实现智能化的知识管理和团队协作。
该服务器提供了两种部署方式:官方托管版本(mcp.notion.com)和自托管版本,支持 Streamable HTTP、SSE、STDIO 三种传输协议。特别适合需要 AI 辅助的知识库管理、文档创作、项目管理等场景。作为 Notion 官方维护的项目,它具有长期稳定性和完整的功能支持。
核心特性
✅ ...
Pytest MCP Server - 专业的测试失败追踪和调试工具
Pytest MCP Server专为 pytest 测试失败追踪和解决设计的 MCP 服务器,基于 9 大系统化调试原则,提供 8 个核心调试工具,帮助开发者更快速、更系统地定位和修复 Python 测试失败,是 AI 辅助测试调试的专业工具。
功能特性
失败追踪:注册和存储测试失败信息
失败列表:查看所有测试失败
详细分析:获取失败详细信息
调试原则:应用 9 大系统化调试原则
模式分析:分析失败模式和趋势
调试提示:生成智能调试建议
文档访问:快速访问 pytest 文档
示例工具:测试示例和最佳实践
JSON 存储:持久化失败数据
MCP 规范:完全符合 MCP 协议
支持的工具register_failure注册新的测试失败
list_failures列出所有失败
get_failure_details获取失败详情
apply_debugging_principle应用调...
GitHub MCP Server - 官方 GitHub 平台集成的版本控制利器
GitHub MCP Server - 官方 GitHub 平台集成的版本控制利器
官方实现 | Stars: 23400 | Go | MIT
概述GitHub MCP Server 是 GitHub 官方提供的 Model Context Protocol 实现,作为连接 AI 工具与 GitHub 平台的官方桥梁。它让 AI 助手能够像人类开发者一样与 GitHub 交互,执行仓库管理、Issue 处理、PR 审查、工作流监控等全方位操作。
该服务器支持 16 个可配置的工具集(toolsets),涵盖从代码仓库到安全扫描的完整 GitHub 生态。特别推荐使用远程服务器模式,配合 OAuth 认证,实现零配置、自动更新的无缝集成体验。
核心特性
✅ GitHub 官方维护,质量和安全性保证
🔐 OAuth 认证支持,安全便捷的身份验证
☁️ 远程服务器模式,无需本地部署和...
Browserbase MCP Server - AI驱动的云端浏览器自动化
Browserbase MCP Server - AI驱动的云端浏览器自动化
企业级方案 | Stars: 2700 | TypeScript | Apache-2.0
概述Browserbase MCP Server 是一个基于 Model Context Protocol 的云端浏览器自动化服务器,通过 Browserbase 和 Stagehand 框架,让 AI 能够像人类一样与网页交互。它将强大的 Playwright 浏览器引擎与先进的大语言模型相结合,支持自然语言指令驱动的网页操作、数据提取和自动化测试。
该服务器提供了四个核心工具(navigate、act、extract、observe),支持多种 LLM 模型(Gemini、GPT-4o、Claude),并内置代理支持、隐身模式、会话持久化等企业级特性。特别适合需要智能网页交互的场景,如动态网站爬取、自动化测试、...
Playwright MCP Server - Microsoft 官方浏览器自动化工具
Playwright MCP Server - Microsoft 官方浏览器自动化工具
Microsoft 官方实现 | Stars: 21600 | TypeScript | Apache-2.0
概述Playwright MCP Server 是 Microsoft 官方提供的浏览器自动化工具,基于 Model Context Protocol 实现。它采用可访问性树(Accessibility Tree)技术,提供快速、精确的浏览器自动化能力。
与传统基于截图的自动化方案不同,Playwright MCP 使用结构化数据直接操作浏览器,无需视觉模型进行图像识别,实现了更快的响应速度和更高的准确性。该工具已内置于 GitHub Copilot Coding Agent,可以在开发过程中实时验证代码改动的效果。
支持 Chromium、Firefox、WebKit 三大浏览器引...
Browserbase MCP Server - 让 AI 像人类一样操控浏览器的自动化利器
Browserbase MCP Server - 让 AI 像人类一样操控浏览器的自动化利器
简介Browserbase MCP Server 是一款革命性的云端浏览器自动化服务器,通过 Model Context Protocol 让 AI 助手能够像人类用户一样与网页进行自然交互。它不仅仅是传统的网页抓取工具,而是集成了 Stagehand 多模态 AI 技术,能够理解复杂的 DOM 结构、处理动态内容、执行 JavaScript、填写表单、点击按钮,甚至从视觉角度理解页面布局。服务器提供了 6 个核心工具,涵盖导航、交互、数据提取、截图和脚本执行等全方位能力。基于 Browserbase 的云基础设施,它支持并行运行多个浏览器会话、启用高级反检测模式、使用代理网络,确保自动化任务的稳定性和隐蔽性。这对于需要大规模网页数据采集、自动化测试、竞品监控、内容聚合等场景具有突破性价值。...
EduBase MCP Server - AI 驱动的在线教育平台集成
EduBase MCP Server - AI 驱动的在线教育平台集成简介EduBase MCP Server 是 EduBase 平台官方推出的 Model Context Protocol 服务器实现,让 AI 助手能够与模块化在线教育平台深度交互。这个服务器为教育机构和企业提供了通过 AI 管理在线课程、协作创建考试题目、排程考试、分析学习结果的强大能力。EduBase 平台本身提供统一的学习环境、高级测验系统、参数化题目、实时作弊检测、LaTeX 公式排版等企业级功能。通过 MCP 协议集成,AI 助手可以自然语言创建题目、排程考试、分析学习数据,大幅提升教育内容创作和教学管理的效率。无论是教育机构的在线课程管理,还是企业的员工培训平台,都能通过这个 MCP Server 实现智能化的教育管理。
核心特性
AI 协作题目创建 - 通过自然语言描述快速创建各类考试题目
考试排程...
Elasticsearch MCP Server - 官方搜索引擎集成
Elasticsearch MCP Server - 官方搜索引擎集成简介Elasticsearch MCP Server 是 Elastic 官方推出的 Model Context Protocol 服务器实现,为 AI 应用提供了与 Elasticsearch 集群的无缝连接能力。通过这个服务器,用户可以使用自然语言直接连接和查询 Elasticsearch 索引,无需编写复杂的查询语句。该项目使用 Rust 语言开发,确保了高性能和内存安全性。作为官方支持的实验性项目,它为实时数据检索架构、日志分析和全文搜索应用提供了强大的支持。项目在 GitHub 上获得了 512 颗星,并持续接收来自 Elastic 团队的更新和改进。
核心特性
索引管理 - 列出所有可用索引及其健康状态,实时监控索引状况
映射查询 - 获取索引的字段映射信息,了解数据结构和字段类型
灵活搜索 - 使用 ...