概述
Spider 允许您使用高性能代理来防止检测、缓存 AI 操作、用于爬取状态的 Webhook、计划爬取等… 本指南展示了如何使用 Spider 爬取/抓取网站,并使用 LangChain 中的SpiderLoader 加载 LLM 就绪的文档。
设置
在 spider.cloud 获取您自己的 Spider API 密钥。用法
以下是使用SpiderLoader 的示例:
Spider 提供两种抓取模式:scrape 和 crawl。Scrape 仅获取所提供 URL 的内容,而 crawl 会获取所提供 URL 的内容,并跟随子页面进行更深层次的爬取。
附加参数
请参阅 Spider 文档 了解所有可用的params。
通过 MCP 将这些文档连接到 Claude、VSCode 等工具 以获取实时答案。

