Skip to main content

Supadata

本页介绍如何在 LangChain 中使用 Supadata 生态系统。它允许您从 YouTube、TikTok 及其他平台加载数据。

安装与设置

要使用 Supadata,您需要安装独立的集成包。
pip install supadata-langchain

文档加载器

Supadata 集成允许您将各视频平台的内容作为 LangChain 文档加载。它支持获取字幕和元数据。
import os
from supadata_langchain import SupadataLoader

os.environ["SUPADATA_API_KEY"] = "YOUR_API_KEY"

loader = SupadataLoader()

# 获取字幕
docs = loader.load(
    {
        "url": "[https://www.youtube.com/watch?v=dQw4w9WgXcQ](https://www.youtube.com/watch?v=dQw4w9WgXcQ)",
        "operation": "transcript",
        "lang": "en",
        "text": True,
        "mode": "auto",
    }
)

print(docs[0].page_content)
print(docs[0].metadata)

元数据

您也可以获取视频结构化元数据。
# 获取元数据
docs = loader.load(
    {
        "url": "https://www.youtube.com/watch?v=dQw4w9WgXcQ",
        "operation": "metadata",
    }
)

print(docs[0].page_content)

资源

有关详细用法示例和 API 文档,请参阅官方 GitHub 仓库