YouTube URL 到 视频音频 再到 文本 最终实现 对话!
我们将使用 OpenAIWhisperParser,它通过 OpenAI Whisper API 将音频转录为文本;以及 OpenAIWhisperParserLocal,用于本地支持和在私有云或本地部署环境中运行。
注意:您需要提供 OPENAI_API_KEY。
yt_dlp 下载 YouTube URL 的音频。
我们将使用 pydub 分割已下载的音频文件(以符合 Whisper API 25MB 的文件大小限制)。
YouTube URL 转文本
使用YoutubeAudioLoader 获取/下载音频文件。
然后使用 OpenAIWhisperParser() 将其转录为文本。
以 Andrej Karpathy YouTube 课程的第一讲为例!
基于 YouTube 视频构建聊天应用
有了Documents,我们可以轻松实现聊天/问答功能。
将这些文档连接到 Claude、VSCode 等,通过 MCP 获取实时解答。

