PDFParser 文档加载器 快速入门的概述。
WRITER 的 PDF 解析器 可将 PDF 文档转换为文本或 Markdown 等其他格式。当您需要从 PDF 文件中提取和处理文本内容以进行进一步分析或集成到工作流时,这尤为有用。在 langchain-writer 中,我们将 WRITER 的 PDF 解析器作为 LangChain 文档解析器提供使用。
概述
集成详情
| 类 | 包 | 本地 | 可序列化 | JS 支持 | 下载量 | 版本 |
|---|---|---|---|---|---|---|
| PDFParser | langchain-writer | ❌ | ❌ | ❌ |
配置
PDFParser 可在 langchain-writer 包中获取:
凭据
注册 WRITER AI Studio 以生成 API 密钥(可参考此快速入门)。然后,设置 WRITER_API_KEY 环境变量:LANGSMITH_TRACING 和 LANGSMITH_API_KEY 环境变量:
实例化
接下来,以所需输出格式实例化 WRITER PDF 解析器:用法
使用 PDF 解析器有两种方式:同步或异步。两种情况下,PDF 解析器都将返回Document 对象列表,每个对象包含 PDF 文件中一页的已解析内容。
同步用法
要同步调用 PDF 解析器,请将引用目标 PDF 文件的Blob 对象传递给 parse 方法:
异步用法
要异步调用 PDF 解析器,请将引用目标 PDF 文件的Blob 对象传递给 aparse 方法:
API 参考
有关所有PDFParser 功能和配置的详细文档,请访问 API 参考。
其他资源
您可以在 WRITER 文档 中找到有关 WRITER 模型(包括费用、上下文窗口和支持的输入类型)和工具的信息。将这些文档连接 到 Claude、VSCode 等,通过 MCP 获取实时答案。

