操作指南
在这里,您将找到 “我该如何…?” 类型问题的答案。这些指南是以目标为导向且具体的;它们旨在帮助您完成特定的任务。有关概念性解释,请参阅概念指南。有关端到端演练,请参阅教程。有关每个类和函数的全面描述,请参阅API 参考。
安装
主要功能
这突出显示了使用 LangChain 的核心功能。
LangChain 表达式语言 (LCEL)
LangChain 表达式语言 是一种创建任意自定义链的方法。它基于 Runnable 协议构建。
LCEL 速查表:快速了解如何使用主要的 LCEL 原语。
迁移指南:用于将旧版链抽象迁移到 LCEL。
- 操作方法:链接可运行对象
- 如何:流式传输可运行对象
- 操作方法:并行调用可运行对象
- 操作方法:向可运行对象添加默认调用参数
- 操作方法:将任何函数转换为可运行对象
- 操作方法:将输入从一个链步骤传递到下一个链步骤
- 操作方法:在运行时配置可运行对象的行为
- 操作方法:向链添加消息历史记录(内存)
- 操作方法:在子链之间路由
- 操作方法:创建动态(自构建)链
- 操作方法:检查可运行对象
- 操作方法:向可运行对象添加回退
- 操作方法:将运行时机密传递给可运行对象
组件
这些是构建应用程序时可以使用的核心构建模块。
提示模板
提示模板 负责将用户输入格式化为可以传递给语言模型的格式。
示例选择器
示例选择器 负责选择要传递给提示的正确的少样本示例。
- 操作方法:使用示例选择器
- 操作方法:按长度选择示例
- 操作方法:按语义相似性选择示例
- 操作方法:按语义 n 元语法重叠选择示例
- 操作方法:通过最大边际相关性选择示例
- 操作方法:从 LangSmith 少样本数据集选择示例
聊天模型
聊天模型 是较新的语言模型形式,它接收消息并输出消息。请参阅 受支持的集成,了解有关如何开始使用来自特定提供商的聊天模型的详细信息。
- 操作方法:执行函数/工具调用
- 操作方法:使模型返回结构化输出
- 操作方法:缓存模型响应
- 操作方法:获取对数概率
- 操作方法:创建自定义聊天模型类
- 操作方法:流式返回响应
- 操作方法:跟踪令牌使用情况
- 操作方法:跨提供商跟踪响应元数据
- 操作方法:使用聊天模型调用工具
- 操作方法:流式传输工具调用
- 操作方法:处理速率限制
- 操作方法:少样本提示工具行为
- 操作方法:绑定特定于模型的格式化工具
- 操作方法:强制进行特定的工具调用
- 操作方法:使用本地模型
- 操作方法:一行初始化任何模型
消息
消息 是聊天模型的输入和输出。它们具有一些 content
和一个 role
,用于描述消息的来源。
LLM
LangChain 称为 LLM 的是较旧的语言模型形式,它接收字符串并输出字符串。
输出解析器
输出解析器 负责接收 LLM 的输出并解析为更结构化的格式。
- 操作方法:解析来自消息对象的文本
- 操作方法:使用输出解析器将 LLM 响应解析为结构化格式
- 操作方法:解析 JSON 输出
- 操作方法:解析 XML 输出
- 操作方法:解析 YAML 输出
- 操作方法:在输出解析错误发生时重试
- 操作方法:尝试修复输出解析中的错误
- 操作方法:编写自定义输出解析器类
文档加载器
文档加载器 负责从各种来源加载文档。
- 操作方法:加载 PDF 文件
- 操作方法:加载网页
- 操作方法:加载 CSV 数据
- 操作方法:从目录加载数据
- 操作方法:加载 HTML 数据
- 操作方法:加载 JSON 数据
- 操作方法:加载 Markdown 数据
- 操作方法:加载 Microsoft Office 数据
- 操作方法:编写自定义文档加载器
文本分割器
文本分割器 接收一个文档并将其拆分为可用于检索的块。
- 操作方法:递归拆分文本
- 操作方法:按 HTML 标头拆分
- 操作方法:按 HTML 部分拆分
- 操作方法:按字符拆分
- 操作方法:拆分代码
- 操作方法:按标头拆分 Markdown
- 操作方法:递归拆分 JSON
- 操作方法:将文本拆分为语义块
- 操作方法:按令牌拆分
嵌入模型
嵌入模型 接收一段文本并创建它的数值表示。请参阅 受支持的集成,了解有关如何开始使用来自特定提供商的嵌入模型的详细信息。
向量存储
向量存储 是可以有效地存储和检索嵌入的数据库。请参阅 受支持的集成,了解有关如何开始使用来自特定提供商的向量存储的详细信息。
检索器
检索器 负责接收查询并返回相关文档。
- 操作方法:使用向量存储检索数据
- 操作方法:生成多个查询以检索数据
- 操作方法:使用上下文压缩来压缩检索到的数据
- 操作方法:编写自定义检索器类
- 操作方法:向检索器结果添加相似性分数
- 操作方法:合并来自多个检索器的结果
- 操作方法:重新排序检索到的结果以缓解“中间丢失”效应
- 操作方法:为每个文档生成多个嵌入
- 操作方法:检索块的整个文档
- 操作方法:生成元数据筛选器
- 操作方法:创建时间加权检索器
- 操作方法:使用混合向量和关键字检索
索引
索引是将您的向量存储与底层数据源保持同步的过程。
工具
LangChain 工具 包含工具的描述(传递给语言模型)以及要调用的函数的实现。请参阅 此处 获取预构建工具的列表。
- 操作方法:创建工具
- 操作方法:使用内置工具和工具包
- 操作方法:使用聊天模型调用工具
- 操作方法:将工具输出传递给聊天模型
- 操作方法:将运行时值传递给工具
- 操作方法:为工具添加人工干预
- 操作方法:处理工具错误
- 操作方法:强制模型调用工具
- 操作方法:禁用并行工具调用
- 操作方法:从工具访问
RunnableConfig
- 操作方法:从工具流式传输事件
- 操作方法:从工具返回工件
- 操作方法:将可运行对象转换为工具
- 操作方法:向模型添加临时工具调用功能
- 操作方法:传入运行时机密
多模态
代理
有关代理的深入操作指南,请查看 LangGraph 文档。
回调
回调 允许您挂接到 LLM 应用程序执行的各个阶段。
自定义
所有 LangChain 组件都可以轻松扩展以支持您自己的版本。
- 操作方法:创建自定义聊天模型类
- 操作方法:创建自定义 LLM 类
- 操作方法:创建自定义嵌入类
- 操作方法:编写自定义检索器类
- 操作方法:编写自定义文档加载器
- 操作方法:编写自定义输出解析器类
- 操作方法:创建自定义回调处理程序
- 如何:定义自定义工具
- 操作方法:调度自定义回调事件
序列化
用例
这些指南涵盖了特定用例的详细信息。
使用 RAG 进行问答
检索增强生成 (RAG) 是一种将 LLM 连接到外部数据源的方法。有关 RAG 的高级教程,请查看本指南。
提取
提取是指使用 LLM 从非结构化文本中提取结构化信息。有关提取的高级教程,请查看本指南。
聊天机器人
聊天机器人涉及使用 LLM 进行对话。有关构建聊天机器人的高级教程,请查看本指南。
查询分析
查询分析是使用 LLM 生成发送到检索器的查询的任务。有关查询分析的高级教程,请查看本指南。
基于 SQL + CSV 的问答
您可以使用 LLM 对表格数据进行问答。有关高级教程,请查看本指南。
基于图数据库的问答
您可以使用 LLM 对图数据库进行问答。有关高级教程,请查看本指南。
摘要
LLM 可以汇总和提炼文本中的所需信息,包括大量文本。有关高级教程,请查看本指南。
LangGraph
LangGraph 是 LangChain 的一个扩展,旨在通过将步骤建模为图中的边和节点来构建使用 LLM 的健壮且有状态的多参与者应用程序。
LangGraph 文档目前托管在一个单独的站点上。您可以在此处浏览LangGraph 操作指南。
LangSmith
LangSmith 允许您密切跟踪、监控和评估您的 LLM 应用程序。它与 LangChain 和 LangGraph 无缝集成,您可以使用它来检查和调试您构建的链和代理的各个步骤。
LangSmith 文档托管在一个单独的站点上。您可以在此处浏览LangSmith 操作指南,但我们将重点介绍以下几个与 LangChain 特别相关的部分
评估
评估性能是构建 LLM 驱动应用程序的重要组成部分。LangSmith 有助于流程的每个步骤,从创建数据集到定义指标再到运行评估器。
要了解更多信息,请查看LangSmith 评估操作指南。
追踪
追踪使您可以观察链和代理内部的情况,这对于诊断问题至关重要。
您可以在LangSmith 文档的此部分中查看与追踪相关的通用操作指南。