跳到主要内容
Open In ColabOpen on GitHub

ReadTheDocs 文档

Read the Docs 是一个开源的免费软件文档托管平台。它生成用 Sphinx 文档生成器编写的文档。

本 notebook 介绍如何从作为 Read-The-Docs 构建一部分生成的 HTML 中加载内容。

有关实际示例,请参阅此处

这假设 HTML 已经抓取到一个文件夹中。可以通过取消注释并运行以下命令来完成:

%pip install --upgrade --quiet  beautifulsoup4
#!wget -r -A.html -P rtdocs https://python.langchain.ac.cn/en/latest/
from langchain_community.document_loaders import ReadTheDocsLoader
loader = ReadTheDocsLoader("rtdocs")
docs = loader.load()