Skip to main content
本笔记本演示如何使用 RSpace 文档加载器,将 RSpace 电子实验室笔记本(Electronic Lab Notebook)中的研究笔记和文档导入 LangChain 流程。 首先,您需要一个 RSpace 账户和 API 密钥。 您可以在 https://community.researchspace.com 注册免费账户,或使用您所在机构的 RSpace。 您可以从账户的个人资料页面获取 RSpace API 令牌。
pip install -qU  rspace_client
建议将 RSpace API 密钥存储为环境变量。 RSPACE_API_KEY=<YOUR_KEY> 您还需要设置 RSpace 安装地址的 URL,例如: RSPACE_URL=https://community.researchspace.com 如果您使用上述精确的环境变量名称,它们将被自动识别。
from langchain_community.document_loaders.rspace import RSpaceLoader
您可以从 RSpace 导入多种内容:
  • 单个 RSpace 结构化文档或基础文档——将与 LangChain 文档一一对应。
  • 文件夹或笔记本——笔记本或文件夹中的所有文档都将作为 LangChain 文档导入。
  • 如果您在 RSpace 图库中有 PDF 文件,也可以单独导入。底层会使用 LangChain 的 PDF 加载器,每个 PDF 页面对应一个 LangChain 文档。
## 请将这些 id 替换为您自己研究笔记中的 id。
## 确保使用全局 id(带有 2 个字符前缀)。这有助于加载器判断应向 RSpace API 发起哪些调用。

rspace_ids = ["NB1932027", "FL1921314", "SD1932029", "GL1932384"]
for rs_id in rspace_ids:
    loader = RSpaceLoader(global_id=rs_id)
    docs = loader.load()
    for doc in docs:
        ## 名称和 ID 会被添加到 'source' 元数据属性中。
        print(doc.metadata)
        print(doc.page_content[:500])
如果不希望使用上述环境变量,也可以直接将参数传入 RSpaceLoader:
loader = RSpaceLoader(
    global_id=rs_id, api_key="MY_API_KEY", url="https://my.researchspace.com"
)