SemaFind 旗下的 SemaDB 是一款简便的向量相似度数据库,用于构建 AI 应用程序。托管的 SemaDB Cloud 为开发者提供简单易用的上手体验。
完整的 API 文档以及示例和交互式操作台可在 RapidAPI 上获取。
本 notebook 演示了 SemaDB Cloud 向量存储的用法。
使用此集成需要通过 pip install -qU langchain-community 安装 langchain-community。
加载文档嵌入
为了在本地运行,我们使用常用于句子嵌入的 Sentence Transformers。您可以使用 LangChain 提供的任意嵌入模型。连接到 SemaDB
SemaDB Cloud 使用 RapidAPI 密钥 进行身份验证。您可以通过创建免费的 RapidAPI 账户获取密钥。- “mycollection”:存储这些向量的集合名称。
- 768:向量的维度。在本例中,sentence transformer 嵌入生成 768 维向量。
- API_KEY:您的 RapidAPI 密钥。
- embeddings:对应文档、文本和查询的嵌入生成方式。
- DistanceStrategy:使用的距离度量。使用 COSINE 时,包装器会自动对向量进行归一化。
相似性搜索
我们使用 LangChain 的默认相似性搜索接口来搜索最相似的句子。清理
可以删除集合以移除所有数据。将这些文档连接 到 Claude、VSCode 等,通过 MCP 获取实时答案。

