Skip to main content
Amazon Simple Storage Service (Amazon S3) 是一项对象存储服务
AWS S3 目录
本文介绍如何从 AWS S3 Directory 对象中加载文档对象。
pip install -qU  boto3
from langchain_community.document_loaders import S3DirectoryLoader
loader = S3DirectoryLoader("testing-hwc")
loader.load()

指定前缀

您还可以指定前缀,以对要加载的文件进行更精细的控制。
loader = S3DirectoryLoader("testing-hwc", prefix="fake")
loader.load()
[Document(page_content='Lorem ipsum dolor sit amet.', lookup_str='', metadata={'source': 's3://testing-hwc/fake.docx'}, lookup_index=0)]

配置 AWS Boto3 客户端

您可以通过在创建 S3DirectoryLoader 时传入命名参数来配置 AWS Boto3 客户端。 例如,当 AWS 凭证无法设置为环境变量时,这非常有用。 请参阅可配置的参数列表
loader = S3DirectoryLoader(
    "testing-hwc", aws_access_key_id="xxxx", aws_secret_access_key="yyyy"
)
loader.load()