Docling 将 PDF、DOCX、PPTX、HTML 等格式解析为丰富的统一表示,
包括文档布局、表格等,使其为 RAG 等生成式 AI 工作流做好准备。
此集成通过 DoclingLoader 文档加载器提供 Docling 的功能。
安装与设置
只需从包管理器安装langchain-docling,例如 pip:
文档加载器
langchain-docling 中的 DoclingLoader 类将 Docling 无缝集成到 LangChain 中,使您能够:
- 轻松快捷地在 LLM 应用中使用各种文档类型,以及
- 利用 Docling 丰富的表示进行高级、文档原生的溯源。
额外资源
通过 MCP 将这些文档连接到 Claude、VSCode 等,获取实时答案。

