Skip to main content
兼容性仅在 Node.js 上可用。
本文档介绍如何从 s3 文件对象加载文档对象。

设置

要运行此索引,您需要已经设置好 Unstructured 并准备好在可用的 URL 端点使用。它也可以配置为本地运行。 有关如何执行此操作的信息,请参阅 Unstructured 文件加载器文档 您还需要安装官方 AWS SDK:
npm
npm install @langchain/community @langchain/core @aws-sdk/client-s3

用法

一旦 Unstructured 配置完成,您就可以使用 S3 加载器加载文件,然后将它们转换为文档。 您可以选择提供 s3Config 参数来指定您的存储桶区域、访问密钥和秘密访问密钥。如果未提供这些信息,您需要在环境中设置它们(例如,通过运行 aws configure)。
import { S3Loader } from "@langchain/community/document_loaders/web/s3";

const loader = new S3Loader({
  bucket: "my-document-bucket-123",
  key: "AccountingOverview.pdf",
  s3Config: {
    region: "us-east-1",
    credentials: {
      accessKeyId: "AKIAIOSFODNN7EXAMPLE",
      secretAccessKey: "wJalrXUtnFEMI/K7MDENG/bPxRfiCYEXAMPLEKEY",
    },
  },
  unstructuredAPIURL: "http://localhost:8000/general/v0/general",
  unstructuredAPIKey: "", // 这将很快成为必需项
});

const docs = await loader.load();

console.log(docs);