Skip to main content
arXiv 是一个开放获取档案库,收录了物理学、数学、计算机科学、 定量生物学、定量金融、统计学、电气工程与系统科学以及经济学领域的 200 万篇学术文章。

安装与设置

首先,您需要安装 arxiv Python 包。
pip install arxiv
其次,您需要安装 PyMuPDF Python 包,它可以将从 arxiv.org 下载的 PDF 文件转换为文本格式。
pip install pymupdf

文档加载器

查看使用示例
from langchain_community.document_loaders import ArxivLoader

检索器

查看使用示例
from langchain_community.retrievers import ArxivRetriever