Skip to main content
html2text 是一个 Python 包,可将 HTML 页面转换为干净易读的纯 ASCII 文本
ASCII 文本同时也是有效的 Markdown(一种文本转 HTML 格式)。

安装与设置

pip install html2text

文档转换器

查看使用示例
from langchain_community.document_loaders import Html2TextTransformer