Python
使用 LangChain Python 与 HTML 转文本集成。
html2text 是一个 Python 包,可将 HTML 页面转换为干净易读的纯 ASCII 文本。
HTML
ASCII 文本
Markdown
pip install html2text
from langchain_community.document_loaders import Html2TextTransformer