NebiusRetriever 支持使用来自 Nebius AI Studio 的嵌入进行高效的相似性搜索。它利用高质量的嵌入模型,实现对文档的语义搜索。
此检索器针对需要对文档集合执行相似性搜索但无需将向量持久化到向量数据库的场景进行了优化。它使用矩阵操作在内存中执行向量相似性搜索,对于中等规模的文档集合非常高效。
设置
安装
可以通过 pip 安装 Nebius 集成:凭据
Nebius 需要一个 API 密钥,可以作为初始化参数api_key 传递,也可以设置为环境变量 NEBIUS_API_KEY。您可以通过在 Nebius AI Studio 上创建账户来获取 API 密钥。
实例化
NebiusRetriever 需要一个 NebiusEmbeddings 实例和一个文档列表。以下是初始化方法:
用法
检索相关文档
您可以使用检索器查找与查询相关的文档:使用 get_relevant_documents
您也可以直接使用get_relevant_documents 方法(尽管 invoke 是首选接口):
自定义结果数量
您可以在查询时通过传递k 参数来调整结果数量:
异步支持
NebiusRetriever 支持异步操作:处理空文档
在链中使用
NebiusRetriever 可以无缝地在 LangChain RAG 管道中工作。以下是一个使用 NebiusRetriever 创建简单 RAG 链的示例:创建搜索工具
您可以使用NebiusRetrievalTool 为代理创建工具:
工作原理
NebiusRetriever 的工作方式如下:-
在初始化期间:
- 存储提供的文档
- 使用提供的 NebiusEmbeddings 为所有文档计算嵌入
- 这些嵌入存储在内存中以供快速检索
-
在检索期间(
invoke或get_relevant_documents):- 使用相同的嵌入模型对查询进行嵌入
- 计算查询嵌入与所有文档嵌入之间的相似度分数
- 返回按相似度排序的前 k 个文档
API 参考
有关 Nebius AI Studio API 的更多详细信息,请访问 Nebius AI Studio 文档。通过 MCP 将这些文档连接到 Claude、VSCode 等 以获取实时答案。

