AssemblyAIAudioTranscriptLoader 允许使用 AssemblyAI API 转录音频文件,并将转录文本加载为文档。
使用前,您需要安装 assemblyai Python 包,并将环境变量 ASSEMBLYAI_API_KEY 设置为您的 API 密钥。也可以通过参数直接传入 API 密钥。
关于 AssemblyAI 的更多信息:
安装
首先,您需要安装assemblyai Python 包。
更多信息请参阅 assemblyai-python-sdk GitHub 仓库。
示例
AssemblyAIAudioTranscriptLoader 至少需要 file_path 参数。音频文件可以指定为 URL 或本地文件路径。
loader.load() 会阻塞直到转录完成。
转录文本可在 page_content 中获取:
metadata 包含完整的 JSON 响应及更多元信息:
转录格式
您可以指定transcript_format 参数以使用不同的格式。
根据格式不同,会返回一个或多个文档。以下是不同的 TranscriptFormat 选项:
TEXT:包含转录文本的单个文档SENTENCES:多个文档,按句子拆分转录文本PARAGRAPHS:多个文档,按段落拆分转录文本SUBTITLES_SRT:包含以 SRT 字幕格式导出的转录文本的单个文档SUBTITLES_VTT:包含以 VTT 字幕格式导出的转录文本的单个文档
转录配置
您还可以指定config 参数以使用不同的音频智能模型。
访问 AssemblyAI API 文档 以获取所有可用模型的概览!
通过参数传入 API 密钥
除了将 API 密钥设置为环境变量ASSEMBLYAI_API_KEY,还可以通过参数传入。
Connect these docs to Claude, VSCode, and more via MCP for real-time answers.

