Google Vertex AI 嵌入

这将帮助您开始使用 LangChain 中的 Google Vertex AI 嵌入模型。有关Google Vertex AI 嵌入功能和配置选项的详细文档，请参阅API 参考。

概述

集成细节

提供商	包
Google	langchain-google-vertexai

设置

要访问 Google Vertex AI 嵌入模型，您需要

创建一个 Google Cloud 帐户
安装langchain-google-vertexai集成包。

凭据

前往Google Cloud注册以创建帐户。完成此操作后，设置GOOGLE_APPLICATION_CREDENTIALS环境变量

可选：验证您的笔记本环境（仅限 Colab）

如果您在 Google Colab 上运行此笔记本，请运行以下单元格以验证您的环境。

import sys

if "google.colab" in sys.modules:
    from google.colab import auth

    auth.authenticate_user()

设置 Google Cloud 项目信息并初始化 Vertex AI SDK

要开始使用 Vertex AI，您必须拥有一个现有的 Google Cloud 项目并启用 Vertex AI API。

详细了解设置项目和开发环境。

PROJECT_ID = "[your-project-id]"  # @param {type:"string"}
LOCATION = "us-central1"  # @param {type:"string"}

import vertexai

vertexai.init(project=PROJECT_ID, location=LOCATION)

如果您希望自动跟踪模型调用，您还可以设置您的LangSmith API 密钥，方法是取消以下注释

# os.environ["LANGCHAIN_TRACING_V2"] = "true"
# os.environ["LANGCHAIN_API_KEY"] = getpass.getpass("Enter your LangSmith API key: ")

安装

LangChain Google Vertex AI 嵌入集成位于langchain-google-vertexai包中

%pip install -qU langchain-google-vertexai

实例化

现在我们可以实例化我们的模型对象并生成嵌入

查看支持的模型列表

from langchain_google_vertexai import VertexAIEmbeddings

# Initialize the a specific Embeddings Model version
embeddings = VertexAIEmbeddings(model_name="text-embedding-004")

索引和检索

嵌入模型通常用于检索增强生成 (RAG) 流程，既可以作为索引数据的一部分，也可以作为以后检索数据的一部分。有关更详细的说明，请参阅我们使用外部知识教程下的 RAG 教程。

下面，请参阅如何使用我们上面初始化的embeddings对象索引和检索数据。在此示例中，我们将使用InMemoryVectorStore索引和检索示例文档。

# Create a vector store with a sample text
from langchain_core.vectorstores import InMemoryVectorStore

text = "LangChain is the framework for building context-aware reasoning applications"

vectorstore = InMemoryVectorStore.from_texts(
    [text],
    embedding=embeddings,
)

# Use the vectorstore as a retriever
retriever = vectorstore.as_retriever()

# Retrieve the most similar text
retrieved_documents = retriever.invoke("What is LangChain?")

# show the retrieved document's content
retrieved_documents[0].page_content

API 参考：InMemoryVectorStore

'LangChain is the framework for building context-aware reasoning applications'

直接使用

在后台，向量存储和检索器实现分别调用embeddings.embed_documents(...)和embeddings.embed_query(...)来为from_texts中使用的文本和检索invoke操作创建嵌入。

您可以直接调用这些方法来获取您自己的用例的嵌入。

嵌入单个文本

您可以使用embed_query嵌入单个文本或文档

single_vector = embeddings.embed_query(text)
print(str(single_vector)[:100])  # Show the first 100 characters of the vector

[-0.02831101417541504, 0.022063178941607475, -0.07454229146242142, 0.006448323838412762, 0.001955120

嵌入多个文本

您可以使用embed_documents嵌入多个文本

text2 = (
    "LangGraph is a library for building stateful, multi-actor applications with LLMs"
)
two_vectors = embeddings.embed_documents([text, text2])
for vector in two_vectors:
    print(str(vector)[:100])  # Show the first 100 characters of the vector

[-0.01092718355357647, 0.01213780976831913, -0.05650627985596657, 0.006737854331731796, 0.0085973171
[0.010135706514120102, 0.01234869472682476, -0.07284046709537506, 0.00027134662377648056, 0.01546290

API 参考

有关Google Vertex AI 嵌入功能和配置选项的详细文档，请参阅API 参考。

嵌入模型概念指南
嵌入模型操作指南

Google Vertex AI 嵌入

概述

集成细节

设置

凭据

安装

实例化

索引和检索

直接使用

嵌入单个文本

嵌入多个文本

API 参考

此页面是否有帮助？

您也可以留下详细的反馈在 GitHub 上.

Google Vertex AI 嵌入

概述​

集成细节​

设置​

凭据​

安装​

实例化​

索引和检索​

直接使用​

嵌入单个文本​

嵌入多个文本​

API 参考​

相关​

此页面是否有帮助？

您也可以留下详细的反馈 在 GitHub 上.

概述

集成细节

设置

凭据

安装

实例化

索引和检索

直接使用

嵌入单个文本

嵌入多个文本

API 参考

相关

您也可以留下详细的反馈在 GitHub 上.