Skip to main content
兼容性仅在 Node.js 上可用。
本文档介绍如何将 Google Cloud Storage 文件加载到 LangChain 文档中。

设置

要使用此加载器,您需要已经设置好 Unstructured 并准备在可用的 URL 端点使用。它也可以配置为本地运行。 有关如何执行此操作的信息,请参阅 Unstructured 文件加载器文档 您还需要安装官方的 Google Cloud Storage SDK:
npm
npm install @langchain/community @langchain/core @google-cloud/storage

用法

一旦 Unstructured 配置完成,您就可以使用 Google Cloud Storage 加载器加载文件,然后将它们转换为文档。 此外,您可以选择提供一个 storageOptions 参数,以指定您的存储选项,以及如果您不想使用应用程序默认凭据 (ADC) 作为默认方式时的其他身份验证方式。
import { GoogleCloudStorageLoader } from "@langchain/community/document_loaders/web/google_cloud_storage";

const loader = new GoogleCloudStorageLoader({
  bucket: "my-bucket-123",
  file: "path/to/file.pdf",
  storageOptions: {
    keyFilename: "/path/to/keyfile.json",
  },
  unstructuredLoaderOptions: {
    apiUrl: "http://localhost:8000/general/v0/general",
    apiKey: "", // 这将很快成为必需项
  },
});

const docs = await loader.load();

console.log(docs);