Vertex AI 暴露了 Google Cloud 中所有可用的基础模型,例如 gemini-2.5-pro、gemini-2.5-flash 等。有关可用模型的完整且最新的列表,请访问 VertexAI 文档 。
Google Cloud VertexAI 与 Gemini API Google Cloud VertexAI 集成与 Google Gemini API 是分开的。本页面展示了通过 Google Cloud Platform (GCP) 提供的企业版 Gemini。
集成详情
模型功能
要访问 VertexAI 模型,您需要创建一个 Google Cloud Platform 帐户、设置凭据并安装 langchain-google-vertexai 集成包。
要使用此集成,您必须:
为您的环境配置凭据(gcloud、工作负载身份等…)
将服务帐户 JSON 文件的路径存储为 GOOGLE_APPLICATION_CREDENTIALS 环境变量
此代码库使用 google.auth 库,该库首先查找上述应用程序凭据变量,然后查找系统级身份验证。
有关更多信息,请参阅 google.auth API 参考 。
要启用模型调用的自动跟踪,请设置您的 LangSmith API 密钥:
os . environ [ " LANGSMITH_API_KEY " ] = getpass . getpass ( "Enter your LangSmith API key: " )
os . environ [ " LANGSMITH_TRACING " ] = "true"
LangChain VertexAI 集成位于 langchain-google-vertexai 包中:
pip install - qU langchain - google - vertexai
实例化
现在我们可以实例化模型对象并生成聊天补全:
from langchain_google_vertexai import ChatVertexAI
llm = ChatVertexAI (
model = "gemini-2.5-flash" ,
temperature = 0 ,
max_tokens = None ,
max_retries = 6 ,
stop = None ,
# other params...
)
messages = [
(
"system" ,
"You are a helpful assistant that translates English to French. Translate the user sentence." ,
),
( "human" , "I love programming." ),
]
ai_msg = llm . invoke ( messages )
ai_msg
AIMessage(content="J'adore programmer. \n", response_metadata={'is_blocked': False, 'safety_ratings': [{'category': 'HARM_CATEGORY_HATE_SPEECH', 'probability_label': 'NEGLIGIBLE', 'blocked': False}, {'category': 'HARM_CATEGORY_DANGEROUS_CONTENT', 'probability_label': 'NEGLIGIBLE', 'blocked': False}, {'category': 'HARM_CATEGORY_HARASSMENT', 'probability_label': 'NEGLIGIBLE', 'blocked': False}, {'category': 'HARM_CATEGORY_SEXUALLY_EXPLICIT', 'probability_label': 'NEGLIGIBLE', 'blocked': False}], 'usage_metadata': {'prompt_token_count': 20, 'candidates_token_count': 7, 'total_token_count': 27}}, id='run-7032733c-d05c-4f0c-a17a-6c575fdd1ae0-0', usage_metadata={'input_tokens': 20, 'output_tokens': 7, 'total_tokens': 27})
内置工具
Gemini 支持一系列在服务器端执行的工具。
Google 搜索
需要 langchain-google-vertexai>=2.0.11
Gemini 可以执行 Google 搜索并使用结果来为其响应提供依据 :
from langchain_google_vertexai import ChatVertexAI
llm = ChatVertexAI ( model = "gemini-2.5-flash" ). bind_tools ([{ "google_search" : {}}])
response = llm . invoke ( "What is today's news?" )
代码执行
需要 langchain-google-vertexai>=2.0.25
Gemini 可以生成并执行 Python 代码 :
from langchain_google_vertexai import ChatVertexAI
llm = ChatVertexAI ( model = "gemini-2.5-flash" ). bind_tools ([{ "code_execution" : {}}])
response = llm . invoke ( "What is 3^3?" )
API 参考
有关所有功能和配置选项的详细文档,请访问 ChatVertexAI API 参考。
将这些文档 通过 MCP 连接到 Claude、VSCode 等,以获取实时答案。