Qdrant MCP Server - 为AI应用提供语义记忆层

Posted on 十月 11, 2025

Qdrant MCP Server - 为AI应用提供语义记忆层

官方实现 | Stars: 988 | Python | Apache-2.0

概述

Qdrant MCP Server 是 Qdrant 官方提供的 Model Context Protocol 实现，作为 AI 应用的语义记忆层。它通过向量嵌入技术，能够在 Qdrant 向量搜索引擎中存储和检索上下文信息，支持语义代码搜索、知识库检索等场景。

该服务器提供了简单而强大的两个核心工具：存储（qdrant-store）和查找（qdrant-find），支持灵活的嵌入模型配置，可以与本地或远程的 Qdrant 数据库集成。特别适合需要长期记忆、上下文检索的 AI 应用场景，如代码助手、知识问答系统等。

核心特性

✅ Qdrant 官方实现，与向量数据库深度集成
🛠️ 简洁的两个核心工具：存储和查找
🎯 支持自定义嵌入模型
📊 灵活的元数据支持
🌐 支持本地和远程 Qdrant 部署
🔌 兼容多种 MCP 客户端（Cursor、VS Code、Claude Code）
🚀 支持多种传输协议（stdio、SSE、streamable-HTTP）

工具列表

1. qdrant-store

功能：在 Qdrant 数据库中存储信息，支持添加元数据

参数：

information (string, 必需) - 要存储的文本信息
metadata (object, 可选) - 附加的元数据（JSON格式）
collection_name (string, 必需) - 存储信息的集合名称

示例：

{
  "information": "Claude Code is a powerful AI coding assistant",
  "metadata": {
    "source": "documentation",
    "category": "ai-tools"
  },
  "collection_name": "my-knowledge-base"
}

2. qdrant-find

功能：从 Qdrant 数据库中检索相关信息

参数：

query (string, 必需) - 搜索查询文本
collection_name (string, 必需) - 要搜索的集合名称

示例：

{
  "query": "What is Claude Code?",
  "collection_name": "my-knowledge-base"
}

配置方式

环境变量

# Qdrant 服务器 URL
QDRANT_URL=http://localhost:6333

# Qdrant API 密钥（可选，用于远程服务器）
QDRANT_API_KEY=your-api-key-here

# 默认集合名称
COLLECTION_NAME=my-collection

# 嵌入模型（默认：sentence-transformers/all-MiniLM-L6-v2）
EMBEDDING_MODEL=sentence-transformers/all-MiniLM-L6-v2

Claude Desktop 配置

在 claude_desktop_config.json 中添加：

{
  "mcpServers": {
    "qdrant": {
      "command": "uvx",
      "args": ["mcp-server-qdrant"],
      "env": {
        "QDRANT_URL": "http://localhost:6333",
        "COLLECTION_NAME": "my-collection",
        "EMBEDDING_MODEL": "sentence-transformers/all-MiniLM-L6-v2"
      }
    }
  }
}

Docker 部署

docker run -p 8000:8000 \
  -e QDRANT_URL="http://your-qdrant-server:6333" \
  -e COLLECTION_NAME="your-collection" \
  mcp-server-qdrant

本地运行

# 设置环境变量
export QDRANT_URL="http://localhost:6333"
export COLLECTION_NAME="my-collection"

# 运行服务器
uvx mcp-server-qdrant

使用场景

1. 语义代码搜索

存储代码片段和文档，通过自然语言查询快速找到相关代码。

示例流程：

使用 qdrant-store 存储代码库中的函数和类
用户询问：”如何实现用户认证？”
qdrant-find 返回相关的认证代码片段

2. 知识库问答

构建企业知识库，支持基于语义的智能问答。

示例流程：

将公司文档、FAQ、技术文档存入 Qdrant
员工提问：”产品退货政策是什么？”
系统检索并返回相关政策文档

3. 上下文检索增强

为 LLM 提供长期记忆，增强对话上下文理解。

示例流程：

对话过程中存储重要信息
后续对话可以检索历史上下文
实现跨会话的记忆功能

4. 文档相似度搜索

存储文档内容，快速找到语义相似的文档。

示例流程：

存储所有技术文档
上传新文档时，查找相似内容
避免重复文档，发现相关资料

技术架构

向量嵌入流程

1
2
3

文本信息 → 嵌入模型 → 向量表示 → 存储到 Qdrant
                                              ↓
查询文本 → 嵌入模型 → 查询向量 ← 相似度搜索 ←

支持的嵌入模型

默认: sentence-transformers/all-MiniLM-L6-v2
可选: 任何兼容的 Sentence Transformers 模型
自定义: 通过 EMBEDDING_MODEL 环境变量配置

传输协议

stdio - 标准输入输出（Claude Desktop）
SSE - Server-Sent Events（Web应用）
streamable-HTTP - HTTP 流式传输

与其他 MCP 服务器对比

特性	Qdrant MCP	Memory MCP	SQLite MCP
语义搜索	✅ 原生支持	❌ 无	❌ 无
向量存储	✅ 专业级	❌ 简单KV	❌ 关系型
扩展性	⭐⭐⭐⭐⭐	⭐⭐⭐	⭐⭐⭐
查询速度	快	中	中
适用场景	RAG、语义搜索	简单记忆	结构化数据

最佳实践

1. 选择合适的嵌入模型

# 多语言场景
EMBEDDING_MODEL=sentence-transformers/paraphrase-multilingual-MiniLM-L12-v2

# 代码搜索场景
EMBEDDING_MODEL=microsoft/codebert-base

# 高精度场景（较慢）
EMBEDDING_MODEL=sentence-transformers/all-mpnet-base-v2

2. 合理设计元数据

# 好的元数据设计
metadata = {
    "source": "github",
    "repository": "anthropics/claude-code",
    "file_path": "src/main.py",
    "line_range": "10-20",
    "language": "python",
    "timestamp": "2025-10-11T10:00:00Z"
}

3. 集合命名规范

# 按项目分离
COLLECTION_NAME=project-alpha-docs

# 按数据类型分离
COLLECTION_NAME=code-snippets
COLLECTION_NAME=documentation
COLLECTION_NAME=conversations

4. 性能优化

批量存储：一次存储多条信息，减少网络开销
本地部署：使用本地 Qdrant 服务器，降低延迟
索引优化：合理配置 Qdrant 的 HNSW 参数

常见问题

Q: 如何部署本地 Qdrant 服务器？

# Docker 方式
docker run -p 6333:6333 qdrant/qdrant

# 或下载二进制文件运行
./qdrant

Q: 支持哪些数据格式？

支持任何文本数据，包括：

纯文本
Markdown
JSON
代码片段
HTML（会被转换为文本）

Q: 如何迁移现有数据？

# 示例：从文件批量导入
import json

with open('knowledge_base.json') as f:
    data = json.load(f)

for item in data:
    # 使用 qdrant-store 工具存储
    pass

Q: 性能如何？

存储速度: ~1000 docs/秒（本地部署）
查询速度: <50ms（HNSW索引）
内存占用: 取决于集合大小和向量维度

评分详情

维度	评分	说明
功能性	4.5/5.0	核心功能完善，语义搜索准确
文档质量	4.8/5.0	文档清晰，示例丰富
社区活跃度	4.6/5.0	Qdrant 官方维护，社区活跃
维护状态	4.7/5.0	定期更新，响应及时
代码质量	4.5/5.0	代码规范，测试覆盖良好
综合评分	4.6/5.0	优秀的语义搜索 MCP 实现

总结

Qdrant MCP Server 是构建 AI 应用语义记忆层的理想选择。它将专业级向量搜索能力与 MCP 协议完美结合，为开发者提供了简单易用的接口。

推荐指数: ⭐⭐⭐⭐⭐ (5/5)

适合你的情况：

✅ 需要语义搜索功能
✅ 构建 RAG 应用
✅ 需要长期记忆能力
✅ 处理大规模文本数据

不适合的情况：

❌ 只需要简单键值存储
❌ 严格的关系型数据查询
❌ 实时流式处理

Qdrant MCP Server - 为AI应用提供语义记忆层

概述

核心特性

工具列表

1. qdrant-store

2. qdrant-find

配置方式

环境变量

Claude Desktop 配置

Docker 部署

本地运行

使用场景

1. 语义代码搜索

2. 知识库问答

3. 上下文检索增强

4. 文档相似度搜索

技术架构

向量嵌入流程

支持的嵌入模型

传输协议

与其他 MCP 服务器对比

最佳实践

1. 选择合适的嵌入模型

2. 合理设计元数据

3. 集合命名规范

4. 性能优化

常见问题

Q: 如何部署本地 Qdrant 服务器？

Q: 支持哪些数据格式？

Q: 如何迁移现有数据？

Q: 性能如何？

评分详情

总结

相关资源