提供商更多HTML 转文本本页内容HTML 转文本 html2text 是一个 Python 包,用于将 HTML 页面转换为干净、易于阅读的纯 ASCII 文本。 ASCII 也恰好是有效的 Markdown(一种文本到 HTML 的格式)。 安装和设置 pip install html2text 文档转换器 查看使用示例。 from langchain_community.document_loaders import Html2TextTransformer