NebiusRetriever 能够使用 Nebius AI Studio 的嵌入模型进行高效的相似性搜索。它利用高质量的嵌入模型实现文档的语义搜索。
该检索器针对以下场景进行了优化:需要对文档集合进行相似性搜索,但无需将向量持久化到向量数据库。它使用矩阵运算在内存中执行向量相似性搜索,对于中等规模的文档集合非常高效。
设置
安装
可以通过 pip 安装 Nebius 集成:凭证
Nebius 需要一个 API 密钥,可以通过初始化参数api_key 传入,或设置为环境变量 NEBIUS_API_KEY。你可以在 Nebius AI Studio 创建账号来获取 API 密钥。
实例化
NebiusRetriever 需要一个 NebiusEmbeddings 实例和一组文档。以下是初始化方式:
使用
检索相关文档
你可以使用检索器查找与查询相关的文档:使用 get_relevant_documents
你也可以直接使用get_relevant_documents 方法(不过 invoke 是推荐接口):
自定义结果数量
你可以在查询时通过传入k 参数来调整返回的结果数量:
异步支持
NebiusRetriever 支持异步操作:处理空文档
在链中使用
NebiusRetriever 可以无缝集成到 LangChain RAG 流水线中。以下是使用 NebiusRetriever 创建简单 RAG 链的示例:创建搜索工具
你可以使用NebiusRetrievalTool 为智能体创建工具:
工作原理
NebiusRetriever 的工作方式如下:-
初始化阶段:
- 存储提供的文档
- 使用提供的 NebiusEmbeddings 计算所有文档的嵌入向量
- 将这些嵌入向量存储在内存中以供快速检索
-
检索阶段(
invoke或get_relevant_documents):- 使用相同的嵌入模型对查询进行嵌入
- 计算查询嵌入与所有文档嵌入之间的相似度分数
- 返回按相似度排序的 top-k 文档
API 参考
有关 Nebius AI Studio API 的更多详情,请访问 Nebius AI Studio 文档。通过 MCP 将这些文档连接到 Claude、VSCode 等工具,获取实时答案。

