Databricks

Databricks Lakehouse Platform 将数据、分析和 AI 统一在一个平台上。

本笔记本提供了 Databricks LLM 模型的快速入门概览。有关所有功能和配置的详细文档，请查阅 API 参考。

概述

Databricks LLM 类封装了一个补全端点，该端点以以下两种端点类型之一托管：

Databricks 模型服务，推荐用于生产和开发，
集群驱动代理应用程序，推荐用于交互式开发。

本示例笔记本展示了如何封装您的 LLM 端点，并在 LangChain 应用程序中将其用作 LLM。

限制

Databricks LLM 类是旧版实现，在功能兼容性方面存在一些限制。

仅支持同步调用。不支持流式或异步 API。
不支持 batch API。

要使用这些功能，请改用新的 ChatDatabricks 类。ChatDatabricks 支持 ChatModel 的所有 API，包括流式、异步、批量等。

设置

要访问 Databricks 模型，您需要创建一个 Databricks 帐户，设置凭据（仅当您在 Databricks 工作区之外时），并安装所需的包。

凭据（仅当您在 Databricks 外部时）

如果您正在 Databricks 内部运行 LangChain 应用程序，则可以跳过此步骤。

否则，您需要手动将 Databricks 工作区主机名和个人访问令牌分别设置为 DATABRICKS_HOST 和 DATABRICKS_TOKEN 环境变量。有关如何获取访问令牌，请参阅身份验证文档。

import getpass
import os

os.environ["DATABRICKS_HOST"] = "https://your-workspace.cloud.databricks.com"
if "DATABRICKS_TOKEN" not in os.environ:
    os.environ["DATABRICKS_TOKEN"] = getpass.getpass(
        "Enter your Databricks access token: "
    )

或者，您可以在初始化 Databricks 类时传递这些参数。

from langchain_community.llms import Databricks

databricks = Databricks(
    host="https://your-workspace.cloud.databricks.com",
    # We strongly recommend NOT to hardcode your access token in your code, instead use secret management tools
    # or environment variables to store your access token securely. The following example uses Databricks Secrets
    # to retrieve the access token that is available within the Databricks notebook.
    token=dbutils.secrets.get(scope="YOUR_SECRET_SCOPE", key="databricks-token"),  # noqa: F821
)

API 参考：Databricks

安装

LangChain Databricks 集成位于 langchain-community 包中。此外，运行此笔记本中的代码需要 mlflow >= 2.9。

%pip install -qU langchain-community mlflow>=2.9.0

封装模型服务端点

先决条件：

一个 LLM 已注册并部署到一个 Databricks 服务端点。
您拥有该端点的“可查询”权限。

预期的 MLflow 模型签名是：

inputs: [{"name": "prompt", "type": "string"}, {"name": "stop", "type": "list[string]"}]
outputs: [{"type": "string"}]

调用

from langchain_community.llms import Databricks

llm = Databricks(endpoint_name="YOUR_ENDPOINT_NAME")
llm.invoke("How are you?")

API 参考：Databricks

'I am happy to hear that you are in good health and as always, you are appreciated.'

llm.invoke("How are you?", stop=["."])

'Good'

转换输入和输出

有时您可能希望封装一个具有不兼容模型签名或想要插入额外配置的服务端点。您可以使用 transform_input_fn 和 transform_output_fn 参数来定义额外的预处理/后处理。

# Use `transform_input_fn` and `transform_output_fn` if the serving endpoint
# expects a different input schema and does not return a JSON string,
# respectively, or you want to apply a prompt template on top.


def transform_input(**request):
    full_prompt = f"""{request["prompt"]}
    Be Concise.
    """
    request["prompt"] = full_prompt
    return request


def transform_output(response):
    return response.upper()


llm = Databricks(
    endpoint_name="YOUR_ENDPOINT_NAME",
    transform_input_fn=transform_input,
    transform_output_fn=transform_output,
)

llm.invoke("How are you?")

'I AM DOING GREAT THANK YOU.'

LLM 概念指南
LLM 操作指南

概述​

限制​

设置​

凭据（仅当您在 Databricks 外部时）​

安装​

封装模型服务端点​

先决条件：​

调用​

转换输入和输出​

相关​

概述

限制

设置

凭据（仅当您在 Databricks 外部时）

安装

封装模型服务端点

先决条件：

调用

转换输入和输出

相关