Wikipedia 是一部多语言免费在线百科全书,由被称为维基人(Wikipedians)的志愿者社区通过开放协作方式,使用名为 MediaWiki 的基于 wiki 的编辑系统共同编写和维护。Wikipedia 是人类历史上最大、阅读量最多的参考资料。
本笔记本演示如何将 wikipedia.org 上的维基页面加载为下游使用的 Document 格式。
安装
首先,您需要安装langchain_community 和 wikipedia 包。
参数
WikipediaLoader 具有以下参数:
query:用于在 Wikipedia 中搜索文档的自由文本lang(可选):默认为 “en”。用于在 Wikipedia 的特定语言版本中搜索load_max_docs(可选):默认为 100。用于限制下载文档数量。下载全部 100 个文档需要时间,实验时建议使用较小的数值。目前硬限制为 300。load_all_available_meta(可选):默认为 False。默认情况下只下载最重要的字段:title和summary。若设为True,则下载所有可用字段。doc_content_chars_max(可选):默认为 4000。文档内容的最大字符数。
示例
将这些文档连接到 Claude、VSCode 等,通过 MCP 获取实时解答。

