rspace
本笔记展示了如何使用 RSpace 文档加载器将 RSpace 电子实验日志中的研究笔记和文档导入 Langchain 管道。
首先,你需要一个 RSpace 账户和 API 密钥。
你可以在 https://community.researchspace.com 注册一个免费账户,或者使用你的机构 RSpace。
你可以从你的账户资料页面获取 RSpace API 令牌。
%pip install --upgrade --quiet rspace_client
最好将你的 RSpace API 密钥存储为环境变量。
RSPACE_API_KEY=<你的密钥>
你还需要设置你的 RSpace 安装地址,例如:
RSPACE_URL=https://community.researchspace.com
如果你使用这些确切的环境变量名称,它们将自动被检测到。
from langchain_community.document_loaders.rspace import RSpaceLoader
API 参考:RSpaceLoader
你可以从 RSpace 导入各种项目
- 单个 RSpace 结构化或基本文档。这将与 Langchain 文档一对一映射。
- 一个文件夹或笔记本。笔记本或文件夹中的所有文档都将作为 Langchain 文档导入。
- 如果你在 RSpace 图库中有 PDF 文件,这些也可以单独导入。在底层,将使用 Langchain 的 PDF 加载器,每个 PDF 页面都会创建一个 Langchain 文档。
## replace these ids with some from your own research notes.
## Make sure to use global ids (with the 2 character prefix). This helps the loader know which API calls to make
## to RSpace API.
rspace_ids = ["NB1932027", "FL1921314", "SD1932029", "GL1932384"]
for rs_id in rspace_ids:
loader = RSpaceLoader(global_id=rs_id)
docs = loader.load()
for doc in docs:
## the name and ID are added to the 'source' metadata property.
print(doc.metadata)
print(doc.page_content[:500])
如果你不想使用上述环境变量,你可以将它们传递给 RSpaceLoader。
loader = RSpaceLoader(
global_id=rs_id, api_key="MY_API_KEY", url="https://my.researchspace.com"
)