Parallel 是一个专为 LLM 和 AI 应用设计的实时网页搜索与内容提取平台。
ParallelExtractTool 提供对 Parallel Extract API 的访问,可从网页中提取干净、结构化的内容。
概述
集成详情
| 类 | 包 | 可序列化 | JS 支持 | 包最新版本 |
|---|---|---|---|---|
ParallelExtractTool | langchain-parallel | ❌ | ❌ |
工具功能
- 干净的内容提取:从网页中提取主要内容,去除广告、导航栏和样板文字
- Markdown 格式:以干净的 Markdown 格式返回内容
- 批量处理:在单次 API 调用中提取多个 URL 的内容
- 元数据提取:包含标题、发布日期及其他元数据
- 内容长度控制:可配置每次提取的最大字符数
- 错误处理:优雅地处理提取失败的情况,并提供详细的错误信息
- 异步支持:完整的 async/await 支持,提升性能
设置
该集成位于langchain-parallel 包中。
凭据
前往 Parallel 注册并生成 API 密钥。完成后,设置PARALLEL_API_KEY 环境变量:
实例化
下面展示如何实例化ParallelExtractTool。该工具可以通过 API 密钥和内容长度参数进行配置:
调用
直接使用参数调用
可以传入 URL 列表来提取内容:使用 ToolCall 调用
也可以使用模型生成的 ToolCall 来调用工具,此时会返回 ToolMessage:
异步使用
该工具支持完整的 async/await 操作,适用于异步应用以提升性能:高级功能
extract 工具支持使用搜索目标/查询进行聚焦提取,并提供抓取策略及对摘要和完整内容的精细控制:错误处理
工具会优雅地处理提取失败的 URL,并在结果中包含错误信息:最佳实践
- 批量处理 URL:在单次调用中提取多个 URL,以提升性能
- 设置内容长度限制:使用
max_chars_per_extract控制响应大小和 token 用量 - 处理错误:检查结果中的
error_type字段以识别提取失败的情况 - 异步以提升性能:在异步应用中使用
ainvoke()以获得更好的性能 - 元数据字段:在可用时利用
publish_date和其他元数据提供上下文
响应格式
该工具返回字典列表,格式如下:API 参考
关于所有功能和配置选项的详细文档,请参阅ParallelExtractTool API 参考或 Parallel extract 参考文档。
Connect these docs to Claude, VSCode, and more via MCP for real-time answers.

