提供商更多HTML转文本本页内容HTML转文本 html2text 是一个 Python 包,可以将 HTML 页面转换为简洁、易读的纯 ASCII 文本。 该 ASCII 文本也恰好是有效的 Markdown (一种文本到 HTML 的格式)。 安装和设置 pip install html2text 文档转换器 查看使用示例。 from langchain_community.document_loaders import Html2TextTransformer