Arxiv
arXiv 是一个开放存取的档案库,收录了物理学、数学、计算机科学、定量生物学、定量金融、统计学、电气工程和系统科学以及经济学领域的 200 万篇学术文章。
安装和设置
首先,您需要安装 arxiv
python 包。
pip install arxiv
其次,您需要安装 PyMuPDF
python 包,它将从 arxiv.org
站点下载的 PDF 文件转换为文本格式。
pip install pymupdf
文档加载器
请参阅使用示例。
from langchain_community.document_loaders import ArxivLoader
API 参考:ArxivLoader
检索器
请参阅使用示例。
from langchain_community.retrievers import ArxivRetriever
API 参考:ArxivRetriever