PerplexityEmbeddings 功能和配置选项的详细文档,请参阅 API 参考。
概述
集成详情
| 类 | 包 | 本地 | Python 支持 | 包下载量 | 包最新版本 |
|---|---|---|---|---|---|
PerplexityEmbeddings | langchain-perplexity | ❌ | ✅ |
设置
要访问 Perplexity 嵌入模型,您需要创建一个 Perplexity 账户,获取 API 密钥,并安装langchain-perplexity 集成包。
凭证
前往 https://www.perplexity.ai/account/api/keys 注册 Perplexity API 并生成 API 密钥。完成此操作后,设置PPLX_API_KEY(或 PERPLEXITY_API_KEY)环境变量:
安装
LangChain Perplexity 集成包含在langchain-perplexity 包中:
实例化
现在我们可以实例化嵌入模型对象并生成嵌入向量:pplx-embed-v1-4b(默认)和 pplx-embed-v1-0.6b。有关当前列表和维度,请参阅 Perplexity Embeddings API 参考。
索引与检索
嵌入模型通常用于检索增强生成(RAG)流程中,既作为索引数据的一部分,也用于后续检索。更详细的说明,请参阅我们的 RAG 教程。 下面,了解如何使用我们上面初始化的embeddings 对象来索引和检索数据。在此示例中,我们将在 InMemoryVectorStore 中索引和检索一个示例文档。
直接使用
在底层,向量存储和检索器实现分别调用embeddings.embed_documents(...) 和 embeddings.embed_query(...) 来为 from_texts 和检索 invoke 操作中使用的文本创建嵌入向量。
您可以直接调用这些方法来获取您自己用例的嵌入向量。
嵌入单个文本
您可以使用embed_query 嵌入单个文本或文档:
嵌入多个文本
您可以使用embed_documents 嵌入多个文本:
异步使用
PerplexityEmbeddings 也提供了异步方法:
Perplexity 返回 base64 编码的有符号 int8 嵌入向量。
PerplexityEmbeddings 将其解码为 [-128, 127] 范围内的 list[float] 值。其大小保留了 API 量化输出的原始值;余弦相似度不受缺少单位长度归一化的影响。API 参考
有关PerplexityEmbeddings 功能和配置选项的详细文档,请参阅 API 参考 和 Perplexity Embeddings API 文档。
将这些文档通过 MCP 连接到 Claude、VSCode 等,以获取实时答案。

