- 即时可扩展性 - 无需基础设施烦恼,即可在几秒钟内启动数百个浏览器会话
- 简单集成 - 与 Puppeteer 和 Playwright 等流行工具无缝协作
- 强大 API - 用于抓取/爬取任何网站的易于使用的 API,以及更多功能
- 绕过反机器人措施 - 内置隐身模式、广告拦截、自动验证码解决和轮换代理
HyperbrowserLoader 文档加载器 的概述。
有关 Hyperbrowser 的更多信息,请访问 Hyperbrowser 网站,或者如果您想查看文档,可以访问 Hyperbrowser 文档。
概述
集成详情
| 类 | 包 | 本地 | 可序列化 | JS 支持 |
|---|---|---|---|---|
HyperbrowserLoader | langchain-hyperbrowser | ❌ | ❌ | ❌ |
加载器功能
| 来源 | 文档延迟加载 | 原生异步支持 |
|---|---|---|
HyperbrowserLoader | ✅ | ✅ |
设置
要访问 Hyperbrowser 文档加载器,您需要安装langchain-hyperbrowser 集成包,并创建一个 Hyperbrowser 帐户并获取 API 密钥。
凭证
前往 Hyperbrowser 注册并生成 API 密钥。完成此操作后,设置 HYPERBROWSER_API_KEY 环境变量:安装
安装 langchain-hyperbrowser。初始化
现在我们可以实例化模型对象并加载文档:加载
延迟加载
高级用法
您可以指定加载器要执行的操作。默认操作是scrape。对于 scrape,您可以提供单个 URL 或要抓取的 URL 列表。对于 crawl,您只能提供单个 URL。crawl 操作将爬取提供的页面和子页面,并为每个页面返回一个文档。
params 参数中提供。有关支持的参数的更多信息,请访问 docs.hyperbrowser.ai/reference/sdks/python/scrape#start-scrape-job-and-wait 或 docs.hyperbrowser.ai/reference/sdks/python/crawl#start-crawl-job-and-wait。
API 参考
通过 MCP 将这些文档 连接到 Claude、VSCode 等,以获取实时答案。

