Skip to main content
AssemblyAIAudioTranscriptLoader 允许使用 AssemblyAI API 转录音频文件,并将转录文本加载为文档。 使用前,您需要安装 assemblyai Python 包,并将环境变量 ASSEMBLYAI_API_KEY 设置为您的 API 密钥。也可以通过参数直接传入 API 密钥。 关于 AssemblyAI 的更多信息:

安装

首先,您需要安装 assemblyai Python 包。 更多信息请参阅 assemblyai-python-sdk GitHub 仓库
pip install -qU  assemblyai

示例

AssemblyAIAudioTranscriptLoader 至少需要 file_path 参数。音频文件可以指定为 URL 或本地文件路径。
from langchain_community.document_loaders import AssemblyAIAudioTranscriptLoader

audio_file = "https://storage.googleapis.com/aai-docs-samples/nbc.mp3"
# or a local file path: audio_file = "./nbc.mp3"

loader = AssemblyAIAudioTranscriptLoader(file_path=audio_file)

docs = loader.load()
注意:调用 loader.load() 会阻塞直到转录完成。 转录文本可在 page_content 中获取:
docs[0].page_content
"Load time, a new president and new congressional makeup. Same old ..."
metadata 包含完整的 JSON 响应及更多元信息:
docs[0].metadata
{'language_code': <LanguageCode.en_us: 'en_us'>,
 'audio_url': 'https://storage.googleapis.com/aai-docs-samples/nbc.mp3',
 'punctuate': True,
 'format_text': True,
  ...
}

转录格式

您可以指定 transcript_format 参数以使用不同的格式。 根据格式不同,会返回一个或多个文档。以下是不同的 TranscriptFormat 选项:
  • TEXT:包含转录文本的单个文档
  • SENTENCES:多个文档,按句子拆分转录文本
  • PARAGRAPHS:多个文档,按段落拆分转录文本
  • SUBTITLES_SRT:包含以 SRT 字幕格式导出的转录文本的单个文档
  • SUBTITLES_VTT:包含以 VTT 字幕格式导出的转录文本的单个文档
from langchain_community.document_loaders.assemblyai import TranscriptFormat

loader = AssemblyAIAudioTranscriptLoader(
    file_path="./your_file.mp3",
    transcript_format=TranscriptFormat.SENTENCES,
)

docs = loader.load()

转录配置

您还可以指定 config 参数以使用不同的音频智能模型。 访问 AssemblyAI API 文档 以获取所有可用模型的概览!
import assemblyai as aai

config = aai.TranscriptionConfig(
    speaker_labels=True, auto_chapters=True, entity_detection=True
)

loader = AssemblyAIAudioTranscriptLoader(file_path="./your_file.mp3", config=config)

通过参数传入 API 密钥

除了将 API 密钥设置为环境变量 ASSEMBLYAI_API_KEY,还可以通过参数传入。
loader = AssemblyAIAudioTranscriptLoader(
    file_path="./your_file.mp3", api_key="YOUR_KEY"
)