概述
集成详情
| 类 | 包 | 本地支持 | 可序列化 | JS 支持 |
|---|---|---|---|---|
| UnstructuredMarkdownLoader | langchain_community | ❌ | ❌ | ✅ |
加载器功能
| 来源 | 文档懒加载 | 原生异步支持 |
|---|---|---|
| UnstructuredMarkdownLoader | ✅ | ❌ |
安装
要访问 UnstructuredMarkdownLoader 文档加载器,您需要安装langchain-community 集成包和 unstructured Python 包。
凭证
使用此加载器无需任何凭证。 要启用模型调用的自动追踪,请设置您的 LangSmith API 密钥:安装依赖
安装 langchain_community 和 unstructured初始化
现在可以实例化模型对象并加载文档。 您可以在两种模式下运行加载器:“single”(单文档)和 “elements”(元素)模式。使用 “single” 模式时,文档将作为单个Document 对象返回。使用 “elements” 模式时,unstructured 库会将文档拆分为 Title(标题)和 NarrativeText(叙述文本)等元素。mode 参数之后还可以传入其他 unstructured 关键字参数,以应用不同的 unstructured 设置。
加载
懒加载
加载元素
在此示例中,我们将使用elements 模式进行加载,该模式将返回 Markdown 文档中各元素的列表:
example.md 文件中提取了 29 个元素。第一个元素是文档的标题,符合预期:
API 参考
有关 UnstructuredMarkdownLoader 所有功能和配置的详细文档,请参阅 API 参考:python.langchain.com/api_reference/community/document_loaders/langchain_community.document_loaders.markdown.UnstructuredMarkdownLoader.html将这些文档连接到 Claude、VSCode 等,通过 MCP 获取实时解答。

