文本嵌入模型

信息

前往集成以查看关于与文本嵌入模型提供商的内置集成的文档。

Embeddings 类是一个旨在与文本嵌入模型交互的类。有许多嵌入模型提供商（OpenAI、Cohere、Hugging Face 等）——此类的设计旨在为所有这些提供一个标准接口。

嵌入将一段文本创建为向量表示。这很有用，因为这意味着我们可以在向量空间中思考文本，并进行语义搜索，在向量空间中寻找最相似的文本片段。

LangChain 中的基础 Embeddings 类提供了两种方法：一种用于嵌入文档，另一种用于嵌入查询。前者 .embed_documents 接收多个文本作为输入，而后者 .embed_query 接收单个文本。之所以将它们分为两种独立的方法，是因为某些嵌入提供商对于文档（用于搜索）和查询（搜索查询本身）有不同的嵌入方法。.embed_query 将返回一个浮点数列表，而 .embed_documents 返回一个浮点数列表的列表。

开始

设置

选择嵌入模型

pip install -qU langchain-openai

import getpass
import os

if not os.environ.get("OPENAI_API_KEY"):
  os.environ["OPENAI_API_KEY"] = getpass.getpass("Enter API key for OpenAI: ")

from langchain_openai import OpenAIEmbeddings

embeddings_model = OpenAIEmbeddings(model="text-embedding-3-large")

`embed_documents`

嵌入文本列表

使用 .embed_documents 嵌入字符串列表，并获取嵌入列表。

embeddings = embeddings_model.embed_documents(
    [
        "Hi there!",
        "Oh, hello!",
        "What's your name?",
        "My friends call me World",
        "Hello World!"
    ]
)
len(embeddings), len(embeddings[0])

(5, 1536)

`embed_query`

嵌入单个查询

使用 .embed_query 嵌入单个文本（例如，为了与其他嵌入文本进行比较）。

embedded_query = embeddings_model.embed_query("What was the name mentioned in the conversation?")
embedded_query[:5]

[0.0053587136790156364,
 -0.0004999046213924885,
 0.038883671164512634,
 -0.003001077566295862,
 -0.00900818221271038]

开始​

设置​

embed_documents​

嵌入文本列表​

embed_query​

嵌入单个查询​

开始

设置

`embed_documents`

嵌入文本列表

`embed_query`

嵌入单个查询