跳到主要内容
Open on GitHub

Docugami

Docugami 将商业文档转换为文档 XML 知识图谱,生成代表整个文档的 XML 语义树森林。这是一种丰富的表示形式,将文档中各种块的语义和结构特征作为 XML 树包含在内。

安装与设置

pip install dgml-utils
pip install docugami-langchain

文档加载器

查看使用示例

from docugami_langchain.document_loaders import DocugamiLoader