提供商更多HTML 到文本本页内容HTML 到文本 html2text 是一个 Python 包,可以将 HTML 页面转换为干净、易于阅读的纯 ASCII 文本。 该 ASCII 文本同时也是有效的 Markdown(一种文本到 HTML 的格式)。 安装与设置 pip install html2text 文档转换器 请参阅使用示例。 from langchain_community.document_loaders import Html2TextTransformer