Vertex AI 提供 Google Cloud 中所有基础模型,如 gemini-2.5-pro、gemini-2.5-flash 等。有关可用模型的完整和最新列表,请访问 VertexAI 文档。
Google Cloud VertexAI 与 Gemini APIGoogle Cloud VertexAI 集成与 Google Gemini API 是独立的。本页展示通过 Google Cloud Platform(GCP)提供的企业级 Gemini 版本。
集成详情
模型功能
要访问 VertexAI 模型,您需要创建一个 Google Cloud Platform 账户、配置凭证,并安装 langchain-google-vertexai 集成包。
要使用此集成,您必须满足以下其中一项条件:
- 为您的环境配置凭证(gcloud、工作负载身份等)
- 将服务账户 JSON 文件的路径存储为
GOOGLE_APPLICATION_CREDENTIALS 环境变量
此代码库使用 google.auth 库,它会首先查找上述应用凭证变量,然后查找系统级身份验证。
更多信息请参阅 google.auth API 参考。
要启用模型调用的自动追踪,请设置您的 LangSmith API 密钥:
os.environ["LANGSMITH_API_KEY"] = getpass.getpass("Enter your LangSmith API key: ")
os.environ["LANGSMITH_TRACING"] = "true"
LangChain VertexAI 集成位于 langchain-google-vertexai 包中:
pip install -qU langchain-google-vertexai
实例化
现在我们可以实例化模型对象并生成聊天补全:
from langchain_google_vertexai import ChatVertexAI
llm = ChatVertexAI(
model="gemini-2.5-flash",
temperature=0,
max_tokens=None,
max_retries=6,
stop=None,
# other params...
)
messages = [
(
"system",
"You are a helpful assistant that translates English to French. Translate the user sentence.",
),
("human", "I love programming."),
]
ai_msg = llm.invoke(messages)
ai_msg
AIMessage(content="J'adore programmer. \n", response_metadata={'is_blocked': False, 'safety_ratings': [{'category': 'HARM_CATEGORY_HATE_SPEECH', 'probability_label': 'NEGLIGIBLE', 'blocked': False}, {'category': 'HARM_CATEGORY_DANGEROUS_CONTENT', 'probability_label': 'NEGLIGIBLE', 'blocked': False}, {'category': 'HARM_CATEGORY_HARASSMENT', 'probability_label': 'NEGLIGIBLE', 'blocked': False}, {'category': 'HARM_CATEGORY_SEXUALLY_EXPLICIT', 'probability_label': 'NEGLIGIBLE', 'blocked': False}], 'usage_metadata': {'prompt_token_count': 20, 'candidates_token_count': 7, 'total_token_count': 27}}, id='run-7032733c-d05c-4f0c-a17a-6c575fdd1ae0-0', usage_metadata={'input_tokens': 20, 'output_tokens': 7, 'total_tokens': 27})
内置工具
Gemini 支持一系列在服务端执行的工具。
Google 搜索
需要 langchain-google-vertexai>=2.0.11
Gemini 可以执行 Google 搜索并使用搜索结果为其响应提供依据:
from langchain_google_vertexai import ChatVertexAI
llm = ChatVertexAI(model="gemini-2.5-flash").bind_tools([{"google_search": {}}])
response = llm.invoke("What is today's news?")
代码执行
需要 langchain-google-vertexai>=2.0.25
Gemini 可以生成并执行 Python 代码:
from langchain_google_vertexai import ChatVertexAI
llm = ChatVertexAI(model="gemini-2.5-flash").bind_tools([{"code_execution": {}}])
response = llm.invoke("What is 3^3?")
API 参考
有关所有功能和配置选项的详细文档,请访问 ChatVertexAI API 参考。