GoogleGenerativeAIEmbeddings 类连接 Google 生成式 AI 嵌入服务。
本文将帮助您使用 LangChain 快速上手 Google 生成式 AI 嵌入模型(如 Gemini)。有关 GoogleGenerativeAIEmbeddings 功能和配置选项的详细文档,请参阅 API 参考。
概述
集成详情
设置
要访问 Google 生成式 AI 嵌入模型,您需要创建一个 Google Cloud 项目、启用生成式语言 API、获取 API 密钥,并安装langchain-google-genai 集成包。
凭证
要使用 Google 生成式 AI 模型,您必须拥有 API 密钥。您可以在 Google AI Studio 中创建一个。请参阅 Google 文档 获取说明。 获得密钥后,将其设置为环境变量GOOGLE_API_KEY:
安装
使用方法
批量处理
您也可以一次嵌入多个字符串以加快处理速度:索引与检索
嵌入模型通常用于检索增强生成(RAG)流程,既用于数据索引,也用于后续检索。有关更详细的说明,请参阅我们的 RAG 教程。 以下展示了如何使用上面初始化的embeddings 对象进行索引和检索。在此示例中,我们将在 InMemoryVectorStore 中索引并检索一个示例文档。
任务类型
GoogleGenerativeAIEmbeddings 可选支持 task_type,目前必须为以下之一:
SEMANTIC_SIMILARITY:用于生成针对文本相似度评估优化的嵌入。CLASSIFICATION:用于生成针对按预设标签分类文本优化的嵌入。CLUSTERING:用于生成针对基于相似度聚类文本优化的嵌入。RETRIEVAL_DOCUMENT、RETRIEVAL_QUERY、QUESTION_ANSWERING和FACT_VERIFICATION:用于生成针对文档搜索或信息检索优化的嵌入。CODE_RETRIEVAL_QUERY:用于根据自然语言查询检索代码块,例如排序数组或反转链表。代码块的嵌入使用RETRIEVAL_DOCUMENT计算。
embed_documents 方法使用 RETRIEVAL_DOCUMENT,embed_query 方法使用 RETRIEVAL_QUERY。如果您提供了任务类型,我们将对所有方法使用该类型。
API 参考
有关GoogleGenerativeAIEmbeddings 功能和配置选项的详细文档,请参阅 API 参考。
其他配置
您可以将以下参数传递给 ChatGoogleGenerativeAI 以自定义 SDK 的行为:client_options:传递给 Google API 客户端的客户端选项,例如自定义client_options["api_endpoint"]。transport:要使用的传输方法,例如rest、grpc或grpc_asyncio。
通过 MCP 将这些文档连接 到 Claude、VSCode 等,获取实时解答。

