跳至主要内容

HTML转文本

html2text 是一个 Python 包,可以将 HTML 页面转换为简洁、易读的纯 ASCII 文本

该 ASCII 文本也恰好是有效的 Markdown (一种文本到 HTML 的格式)。

安装和设置

pip install html2text

文档转换器

查看使用示例

from langchain_community.document_loaders import Html2TextTransformer

此页是否对您有帮助?