Skip to main content
lakeFS 为数据湖提供可扩展的版本控制,并使用类似 Git 的语义来创建和访问版本。
本文档介绍如何从 lakeFS 路径(无论是对象还是前缀)加载文档对象。

初始化 lakeFS 加载器

ENDPOINTLAKEFS_ACCESS_KEYLAKEFS_SECRET_KEY 替换为您自己的值。
from langchain_community.document_loaders import LakeFSLoader
ENDPOINT = ""
LAKEFS_ACCESS_KEY = ""
LAKEFS_SECRET_KEY = ""

lakefs_loader = LakeFSLoader(
    lakefs_access_key=LAKEFS_ACCESS_KEY,
    lakefs_secret_key=LAKEFS_SECRET_KEY,
    lakefs_endpoint=ENDPOINT,
)

指定路径

您可以指定前缀或完整对象路径来控制加载哪些文件。 在对应的 REPOREFPATH 中指定仓库、引用(分支、提交 ID 或标签)和路径,以加载文档:
REPO = ""
REF = ""
PATH = ""

lakefs_loader.set_repo(REPO)
lakefs_loader.set_ref(REF)
lakefs_loader.set_path(PATH)

docs = lakefs_loader.load()
docs