Beautiful Soup 是一个用于解析 HTML 和 XML 文档(包括格式不规范的标记,即未闭合标签,因此得名”标签汤”)的 Python 包。 它为解析后的页面创建解析树,可用于从 HTML 中提取数据,非常适合网页抓取。
安装与设置
文档转换器
查看使用示例。通过 MCP 将这些文档接入 Claude、VSCode 等工具,获取实时解答。
使用 LangChain Python 集成 Beautiful Soup。
Beautiful Soup 是一个用于解析 HTML 和 XML 文档(包括格式不规范的标记,即未闭合标签,因此得名”标签汤”)的 Python 包。 它为解析后的页面创建解析树,可用于从 HTML 中提取数据,非常适合网页抓取。