Qdrant MCP Server - 为AI应用提供语义记忆层

Qdrant MCP Server - 为AI应用提供语义记忆层

官方实现 | Stars: 988 | Python | Apache-2.0

概述

Qdrant MCP Server 是 Qdrant 官方提供的 Model Context Protocol 实现,作为 AI 应用的语义记忆层。它通过向量嵌入技术,能够在 Qdrant 向量搜索引擎中存储和检索上下文信息,支持语义代码搜索、知识库检索等场景。

该服务器提供了简单而强大的两个核心工具:存储(qdrant-store)和查找(qdrant-find),支持灵活的嵌入模型配置,可以与本地或远程的 Qdrant 数据库集成。特别适合需要长期记忆、上下文检索的 AI 应用场景,如代码助手、知识问答系统等。

核心特性

  • Qdrant 官方实现,与向量数据库深度集成
  • 🛠️ 简洁的两个核心工具:存储和查找
  • 🎯 支持自定义嵌入模型
  • 📊 灵活的元数据支持
  • 🌐 支持本地和远程 Qdrant 部署
  • 🔌 兼容多种 MCP 客户端(Cursor、VS Code、Claude Code)
  • 🚀 支持多种传输协议(stdio、SSE、streamable-HTTP)

工具列表

1. qdrant-store

功能:在 Qdrant 数据库中存储信息,支持添加元数据

参数

  • information (string, 必需) - 要存储的文本信息
  • metadata (object, 可选) - 附加的元数据(JSON格式)
  • collection_name (string, 必需) - 存储信息的集合名称

示例

1
2
3
4
5
6
7
8
{
"information": "Claude Code is a powerful AI coding assistant",
"metadata": {
"source": "documentation",
"category": "ai-tools"
},
"collection_name": "my-knowledge-base"
}

2. qdrant-find

功能:从 Qdrant 数据库中检索相关信息

参数

  • query (string, 必需) - 搜索查询文本
  • collection_name (string, 必需) - 要搜索的集合名称

示例

1
2
3
4
{
"query": "What is Claude Code?",
"collection_name": "my-knowledge-base"
}

配置方式

环境变量

1
2
3
4
5
6
7
8
9
10
11
# Qdrant 服务器 URL
QDRANT_URL=http://localhost:6333

# Qdrant API 密钥(可选,用于远程服务器)
QDRANT_API_KEY=your-api-key-here

# 默认集合名称
COLLECTION_NAME=my-collection

# 嵌入模型(默认:sentence-transformers/all-MiniLM-L6-v2)
EMBEDDING_MODEL=sentence-transformers/all-MiniLM-L6-v2

Claude Desktop 配置

claude_desktop_config.json 中添加:

1
2
3
4
5
6
7
8
9
10
11
12
13
{
"mcpServers": {
"qdrant": {
"command": "uvx",
"args": ["mcp-server-qdrant"],
"env": {
"QDRANT_URL": "http://localhost:6333",
"COLLECTION_NAME": "my-collection",
"EMBEDDING_MODEL": "sentence-transformers/all-MiniLM-L6-v2"
}
}
}
}

Docker 部署

1
2
3
4
docker run -p 8000:8000 \
-e QDRANT_URL="http://your-qdrant-server:6333" \
-e COLLECTION_NAME="your-collection" \
mcp-server-qdrant

本地运行

1
2
3
4
5
6
# 设置环境变量
export QDRANT_URL="http://localhost:6333"
export COLLECTION_NAME="my-collection"

# 运行服务器
uvx mcp-server-qdrant

使用场景

1. 语义代码搜索

存储代码片段和文档,通过自然语言查询快速找到相关代码。

示例流程

  1. 使用 qdrant-store 存储代码库中的函数和类
  2. 用户询问:”如何实现用户认证?”
  3. qdrant-find 返回相关的认证代码片段

2. 知识库问答

构建企业知识库,支持基于语义的智能问答。

示例流程

  1. 将公司文档、FAQ、技术文档存入 Qdrant
  2. 员工提问:”产品退货政策是什么?”
  3. 系统检索并返回相关政策文档

3. 上下文检索增强

为 LLM 提供长期记忆,增强对话上下文理解。

示例流程

  1. 对话过程中存储重要信息
  2. 后续对话可以检索历史上下文
  3. 实现跨会话的记忆功能

4. 文档相似度搜索

存储文档内容,快速找到语义相似的文档。

示例流程

  1. 存储所有技术文档
  2. 上传新文档时,查找相似内容
  3. 避免重复文档,发现相关资料

技术架构

向量嵌入流程

1
2
3
文本信息 → 嵌入模型 → 向量表示 → 存储到 Qdrant

查询文本 → 嵌入模型 → 查询向量 ← 相似度搜索 ←

支持的嵌入模型

  • 默认: sentence-transformers/all-MiniLM-L6-v2
  • 可选: 任何兼容的 Sentence Transformers 模型
  • 自定义: 通过 EMBEDDING_MODEL 环境变量配置

传输协议

  • stdio - 标准输入输出(Claude Desktop)
  • SSE - Server-Sent Events(Web应用)
  • streamable-HTTP - HTTP 流式传输

与其他 MCP 服务器对比

特性 Qdrant MCP Memory MCP SQLite MCP
语义搜索 ✅ 原生支持 ❌ 无 ❌ 无
向量存储 ✅ 专业级 ❌ 简单KV ❌ 关系型
扩展性 ⭐⭐⭐⭐⭐ ⭐⭐⭐ ⭐⭐⭐
查询速度
适用场景 RAG、语义搜索 简单记忆 结构化数据

最佳实践

1. 选择合适的嵌入模型

1
2
3
4
5
6
7
8
# 多语言场景
EMBEDDING_MODEL=sentence-transformers/paraphrase-multilingual-MiniLM-L12-v2

# 代码搜索场景
EMBEDDING_MODEL=microsoft/codebert-base

# 高精度场景(较慢)
EMBEDDING_MODEL=sentence-transformers/all-mpnet-base-v2

2. 合理设计元数据

1
2
3
4
5
6
7
8
9
# 好的元数据设计
metadata = {
"source": "github",
"repository": "anthropics/claude-code",
"file_path": "src/main.py",
"line_range": "10-20",
"language": "python",
"timestamp": "2025-10-11T10:00:00Z"
}

3. 集合命名规范

1
2
3
4
5
6
7
# 按项目分离
COLLECTION_NAME=project-alpha-docs

# 按数据类型分离
COLLECTION_NAME=code-snippets
COLLECTION_NAME=documentation
COLLECTION_NAME=conversations

4. 性能优化

  • 批量存储:一次存储多条信息,减少网络开销
  • 本地部署:使用本地 Qdrant 服务器,降低延迟
  • 索引优化:合理配置 Qdrant 的 HNSW 参数

常见问题

Q: 如何部署本地 Qdrant 服务器?

1
2
3
4
5
# Docker 方式
docker run -p 6333:6333 qdrant/qdrant

# 或下载二进制文件运行
./qdrant

Q: 支持哪些数据格式?

支持任何文本数据,包括:

  • 纯文本
  • Markdown
  • JSON
  • 代码片段
  • HTML(会被转换为文本)

Q: 如何迁移现有数据?

1
2
3
4
5
6
7
8
9
# 示例:从文件批量导入
import json

with open('knowledge_base.json') as f:
data = json.load(f)

for item in data:
# 使用 qdrant-store 工具存储
pass

Q: 性能如何?

  • 存储速度: ~1000 docs/秒(本地部署)
  • 查询速度: <50ms(HNSW索引)
  • 内存占用: 取决于集合大小和向量维度

评分详情

维度 评分 说明
功能性 4.5/5.0 核心功能完善,语义搜索准确
文档质量 4.8/5.0 文档清晰,示例丰富
社区活跃度 4.6/5.0 Qdrant 官方维护,社区活跃
维护状态 4.7/5.0 定期更新,响应及时
代码质量 4.5/5.0 代码规范,测试覆盖良好
综合评分 4.6/5.0 优秀的语义搜索 MCP 实现

总结

Qdrant MCP Server 是构建 AI 应用语义记忆层的理想选择。它将专业级向量搜索能力与 MCP 协议完美结合,为开发者提供了简单易用的接口。

推荐指数: ⭐⭐⭐⭐⭐ (5/5)

适合你的情况

  • ✅ 需要语义搜索功能
  • ✅ 构建 RAG 应用
  • ✅ 需要长期记忆能力
  • ✅ 处理大规模文本数据

不适合的情况

  • ❌ 只需要简单键值存储
  • ❌ 严格的关系型数据查询
  • ❌ 实时流式处理

相关资源


更新时间: 2025-10-14
数据来源: GitHub, 质量评分: 4.6/5.0

© 2026 Generative AI Discovery All Rights Reserved.
Theme by hiero