跳到主要内容
Open on GitHub

Arxiv

arXiv 是一个开放获取的存档库,收录了物理学、数学、计算机科学、定量生物学、定量金融、统计学、电气工程和系统科学以及经济学领域的200万篇学术文章。

安装与设置

首先,您需要安装 arxiv Python 包。

pip install arxiv

其次,您需要安装 PyMuPDF Python 包,它将从 arxiv.org 网站下载的 PDF 文件转换为文本格式。

pip install pymupdf

文档加载器

请参阅使用示例

from langchain_community.document_loaders import ArxivLoader
API 参考:ArxivLoader

检索器

请参阅使用示例

from langchain_community.retrievers import ArxivRetriever
API 参考:ArxivRetriever