NVIDIA

langchain-nvidia-ai-endpoints 包包含 LangChain 集成，用于构建在 NVIDIA NIM 推理微服务上使用模型的应用程序。NIM 支持来自社区以及 NVIDIA 的跨领域模型，如聊天、嵌入和重排序模型。这些模型由 NVIDIA 优化，可在 NVIDIA 加速基础设施上提供最佳性能，并作为 NIM 部署，NIM 是一种易于使用、预构建的容器，可以使用单个命令在 NVIDIA 加速基础设施上随处部署。

NIM 的 NVIDIA 托管部署可在 NVIDIA API 目录上进行测试。测试后，可以使用 NVIDIA AI Enterprise 许可证从 NVIDIA 的 API 目录导出 NIM，并在本地或云端运行，使企业拥有其 IP 和 AI 应用程序的所有权和完全控制权。

NIM 以每个模型为基础打包为容器镜像，并通过 NVIDIA NGC Catalog 作为 NGC 容器镜像分发。NIM 的核心是为在 AI 模型上运行推理提供简单、一致和熟悉的 API。

以下是如何使用围绕文本生成和嵌入模型的一些常见功能的示例。

安装

pip install -U --quiet langchain-nvidia-ai-endpoints

设置

开始使用

在 NVIDIA 上创建一个免费帐户，该帐户托管 NVIDIA AI Foundation 模型。
点击您选择的模型。
在输入下选择 Python 选项卡，然后点击 获取 API 密钥。然后点击 生成密钥。
复制生成的密钥并将其保存为 NVIDIA_API_KEY。从那里，您应该可以访问端点。

import getpass
import os

if not os.environ.get("NVIDIA_API_KEY", "").startswith("nvapi-"):
    nvidia_api_key = getpass.getpass("Enter your NVIDIA API key: ")
    assert nvidia_api_key.startswith("nvapi-"), f"{nvidia_api_key[:5]}... is not a valid key"
    os.environ["NVIDIA_API_KEY"] = nvidia_api_key

使用 NVIDIA API 目录

from langchain_nvidia_ai_endpoints import ChatNVIDIA

llm = ChatNVIDIA(model="mistralai/mixtral-8x22b-instruct-v0.1")
result = llm.invoke("Write a ballad about LangChain.")
print(result.content)

API 参考：ChatNVIDIA

使用 API，您可以查询 NVIDIA API Catalog 上提供的实时端点，以从 DGX 托管的云计算环境获得快速结果。所有模型都是源可访问的，可以使用 NVIDIA NIM 部署在您自己的计算集群上，NVIDIA NIM 是 NVIDIA AI Enterprise 的一部分，如下一节使用 NVIDIA NIM 所示。

使用 NVIDIA NIM

准备好部署时，您可以使用 NVIDIA NIM 自托管模型（NVIDIA NIM 包含在 NVIDIA AI Enterprise 软件许可证中），并在任何地方运行它们，让您拥有定制的所有权，并完全控制您的知识产权 (IP) 和 AI 应用程序。

了解有关 NIM 的更多信息

from langchain_nvidia_ai_endpoints import ChatNVIDIA, NVIDIAEmbeddings, NVIDIARerank

# connect to a chat NIM running at localhost:8000, specifying a model
llm = ChatNVIDIA(base_url="http://localhost:8000/v1", model="meta/llama3-8b-instruct")

# connect to an embedding NIM running at localhost:8080
embedder = NVIDIAEmbeddings(base_url="http://localhost:8080/v1")

# connect to a reranking NIM running at localhost:2016
ranker = NVIDIARerank(base_url="http://localhost:2016/v1")

API 参考：ChatNVIDIA | NVIDIAEmbeddings | NVIDIARerank

使用 NVIDIA AI Foundation 端点

LangChain 直接支持一系列 NVIDIA AI Foundation 模型，并提供熟悉的 API。

可以在 API 目录中找到支持的活动模型。

以下是一些可能有用的示例，可帮助您入门

安装​

设置​

使用 NVIDIA API 目录​

使用 NVIDIA NIM​

使用 NVIDIA AI Foundation 端点​

此页是否对您有帮助？

安装

设置

使用 NVIDIA API 目录

使用 NVIDIA NIM

使用 NVIDIA AI Foundation 端点