跳到主要内容
Open on GitHub

HTML 到文本

html2text 是一个 Python 包,可以将 HTML 页面转换为干净、易于阅读的纯 ASCII 文本

该 ASCII 文本同时也是有效的 Markdown(一种文本到 HTML 的格式)。

安装与设置

pip install html2text

文档转换器

请参阅使用示例

from langchain_community.document_loaders import Html2TextTransformer
© . This site is unofficial and not affiliated with LangChain, Inc.
这些文档随着 LangChain v1.0 在 2025 年 10 月的发布而弃用,并且不再维护。 请访问 v1.0 文档