Qdrant MCP Server - 为AI应用提供语义记忆层
官方实现 | Stars: 988 | Python | Apache-2.0
概述
Qdrant MCP Server 是 Qdrant 官方提供的 Model Context Protocol 实现,作为 AI 应用的语义记忆层。它通过向量嵌入技术,能够在 Qdrant 向量搜索引擎中存储和检索上下文信息,支持语义代码搜索、知识库检索等场景。
该服务器提供了简单而强大的两个核心工具:存储(qdrant-store)和查找(qdrant-find),支持灵活的嵌入模型配置,可以与本地或远程的 Qdrant 数据库集成。特别适合需要长期记忆、上下文检索的 AI 应用场景,如代码助手、知识问答系统等。
核心特性
- ✅ Qdrant 官方实现,与向量数据库深度集成
- 🛠️ 简洁的两个核心工具:存储和查找
- 🎯 支持自定义嵌入模型
- 📊 灵活的元数据支持
- 🌐 支持本地和远程 Qdrant 部署
- 🔌 兼容多种 MCP 客户端(Cursor、VS Code、Claude Code)
- 🚀 支持多种传输协议(stdio、SSE、streamable-HTTP)
工具列表
1. qdrant-store
功能:在 Qdrant 数据库中存储信息,支持添加元数据
参数:
information(string, 必需) - 要存储的文本信息metadata(object, 可选) - 附加的元数据(JSON格式)collection_name(string, 必需) - 存储信息的集合名称
示例:
1 | { |
2. qdrant-find
功能:从 Qdrant 数据库中检索相关信息
参数:
query(string, 必需) - 搜索查询文本collection_name(string, 必需) - 要搜索的集合名称
示例:
1 | { |
配置方式
环境变量
1 | # Qdrant 服务器 URL |
Claude Desktop 配置
在 claude_desktop_config.json 中添加:
1 | { |
Docker 部署
1 | docker run -p 8000:8000 \ |
本地运行
1 | # 设置环境变量 |
使用场景
1. 语义代码搜索
存储代码片段和文档,通过自然语言查询快速找到相关代码。
示例流程:
- 使用
qdrant-store存储代码库中的函数和类 - 用户询问:”如何实现用户认证?”
qdrant-find返回相关的认证代码片段
2. 知识库问答
构建企业知识库,支持基于语义的智能问答。
示例流程:
- 将公司文档、FAQ、技术文档存入 Qdrant
- 员工提问:”产品退货政策是什么?”
- 系统检索并返回相关政策文档
3. 上下文检索增强
为 LLM 提供长期记忆,增强对话上下文理解。
示例流程:
- 对话过程中存储重要信息
- 后续对话可以检索历史上下文
- 实现跨会话的记忆功能
4. 文档相似度搜索
存储文档内容,快速找到语义相似的文档。
示例流程:
- 存储所有技术文档
- 上传新文档时,查找相似内容
- 避免重复文档,发现相关资料
技术架构
向量嵌入流程
1 | 文本信息 → 嵌入模型 → 向量表示 → 存储到 Qdrant |
支持的嵌入模型
- 默认:
sentence-transformers/all-MiniLM-L6-v2 - 可选: 任何兼容的 Sentence Transformers 模型
- 自定义: 通过
EMBEDDING_MODEL环境变量配置
传输协议
- stdio - 标准输入输出(Claude Desktop)
- SSE - Server-Sent Events(Web应用)
- streamable-HTTP - HTTP 流式传输
与其他 MCP 服务器对比
| 特性 | Qdrant MCP | Memory MCP | SQLite MCP |
|---|---|---|---|
| 语义搜索 | ✅ 原生支持 | ❌ 无 | ❌ 无 |
| 向量存储 | ✅ 专业级 | ❌ 简单KV | ❌ 关系型 |
| 扩展性 | ⭐⭐⭐⭐⭐ | ⭐⭐⭐ | ⭐⭐⭐ |
| 查询速度 | 快 | 中 | 中 |
| 适用场景 | RAG、语义搜索 | 简单记忆 | 结构化数据 |
最佳实践
1. 选择合适的嵌入模型
1 | # 多语言场景 |
2. 合理设计元数据
1 | # 好的元数据设计 |
3. 集合命名规范
1 | # 按项目分离 |
4. 性能优化
- 批量存储:一次存储多条信息,减少网络开销
- 本地部署:使用本地 Qdrant 服务器,降低延迟
- 索引优化:合理配置 Qdrant 的 HNSW 参数
常见问题
Q: 如何部署本地 Qdrant 服务器?
1 | # Docker 方式 |
Q: 支持哪些数据格式?
支持任何文本数据,包括:
- 纯文本
- Markdown
- JSON
- 代码片段
- HTML(会被转换为文本)
Q: 如何迁移现有数据?
1 | # 示例:从文件批量导入 |
Q: 性能如何?
- 存储速度: ~1000 docs/秒(本地部署)
- 查询速度: <50ms(HNSW索引)
- 内存占用: 取决于集合大小和向量维度
评分详情
| 维度 | 评分 | 说明 |
|---|---|---|
| 功能性 | 4.5/5.0 | 核心功能完善,语义搜索准确 |
| 文档质量 | 4.8/5.0 | 文档清晰,示例丰富 |
| 社区活跃度 | 4.6/5.0 | Qdrant 官方维护,社区活跃 |
| 维护状态 | 4.7/5.0 | 定期更新,响应及时 |
| 代码质量 | 4.5/5.0 | 代码规范,测试覆盖良好 |
| 综合评分 | 4.6/5.0 | 优秀的语义搜索 MCP 实现 |
总结
Qdrant MCP Server 是构建 AI 应用语义记忆层的理想选择。它将专业级向量搜索能力与 MCP 协议完美结合,为开发者提供了简单易用的接口。
推荐指数: ⭐⭐⭐⭐⭐ (5/5)
适合你的情况:
- ✅ 需要语义搜索功能
- ✅ 构建 RAG 应用
- ✅ 需要长期记忆能力
- ✅ 处理大规模文本数据
不适合的情况:
- ❌ 只需要简单键值存储
- ❌ 严格的关系型数据查询
- ❌ 实时流式处理
相关资源
- GitHub: https://github.com/qdrant/mcp-server-qdrant
- Qdrant 文档: https://qdrant.tech/documentation/
- MCP 协议: https://modelcontextprotocol.io/
- Sentence Transformers: https://www.sbert.net/
更新时间: 2025-10-14
数据来源: GitHub, 质量评分: 4.6/5.0