概述
Spider 允许你使用高性能代理来防止检测,缓存 AI 操作,提供爬取状态的 webhook,以及定时爬取等… 本指南展示如何使用 Spider 爬取/抓取网站,并使用 LangChain 中的SpiderLoader 加载 LLM 就绪的文档。
设置
在 spider.cloud 获取你自己的 Spider API 密钥。用法
以下是使用SpiderLoader 的示例:
Spider 提供两种抓取模式:scrape(抓取)和 crawl(爬取)。scrape 仅获取所提供 URL 的内容,而 crawl 则获取所提供 URL 的内容并深入爬取子页面。
附加参数
所有可用的params 请参阅 Spider 文档。
将这些文档通过 MCP 连接到 Claude、VSCode 等,以获取实时答案。

