跳到主要内容
Open In ColabOpen on GitHub

PyMuPDF4LLM

PyMuPDF4LLM 旨在使提取 PDF 内容为 Markdown 格式变得更容易,以满足 LLM 和 RAG 应用的需求。

langchain-pymupdf4llm 将 PyMuPDF4LLM 作为文档加载器集成到 LangChain 中。

%pip install -qU langchain-pymupdf4llm
from langchain_pymupdf4llm import PyMuPDF4LLMLoader, PyMuPDF4LLMParser