Hugging Face 集成 - Docs by LangChain

本地嵌入

您可以使用 HuggingFaceEmbeddings 类在本地生成嵌入。这利用了 sentence_transformers 库来下载模型权重并直接在您的机器上运行。让我们加载 Hugging Face 嵌入类。

pip install -qU  langchain langchain-huggingface sentence_transformers

from langchain_huggingface.embeddings import HuggingFaceEmbeddings

embeddings = HuggingFaceEmbeddings(model_name="sentence-transformers/all-mpnet-base-v2")

text = "This is a test document."

query_result = embeddings.embed_query(text)

query_result[:3]

[-0.04895168915390968, -0.03986193612217903, -0.021562768146395683]

doc_result = embeddings.embed_documents([text])

如果您不想在本地下载模型，可以通过推理端点访问嵌入模型，这让我们能够使用 Hugging Face 可扩展无服务器基础设施上的开源模型。确保您已安装 huggingface_hub，它通常已包含在 langchain-huggingface 中。

!pip install huggingface_hub

首先，我们需要从 Hugging Face 获取一个只读 API 密钥。

import os
from getpass import getpass

os.environ["HUGGINGFACEHUB_API_TOKEN"] = getpass()

现在我们可以使用 HuggingFaceEndpointEmbeddings 类通过 API 远程运行开源嵌入模型。

from langchain_huggingface.embeddings import HuggingFaceEndpointEmbeddings

embeddings = HuggingFaceEndpointEmbeddings(
    model="sentence-transformers/all-MiniLM-L6-v2"
)

text = "This is a test document."

query_result = embeddings.embed_query(text)

query_result[:3]

连接这些文档到 Claude、VSCode 等，通过 MCP 获取实时答案。