Python
使用 LangChain Python 集成 Docugami。
Docugami 将业务文档转换为文档 XML 知识图谱,生成代表整个文档的 XML 语义树森林。这是一种丰富的表示方式,以 XML 树的形式包含文档中各块的语义和结构特征。
pip install dgml-utils pip install docugami-langchain
from docugami_langchain.document_loaders import DocugamiLoader