Apache Doris 是一个用于实时分析的现代数据仓库, 能够在大规模实时数据上实现闪电般快速的分析。
通常 Apache Doris 被归类为 OLAP 数据库,并在 ClickBench — 分析型数据库基准测试 中表现出色。由于其拥有超快的向量化执行引擎,因此也可用作高性能向量数据库。
使用此集成需要通过 pip install -qU langchain-community 安装 langchain-community。
以下将展示如何使用 Apache Doris 向量存储。
配置
update_vectordb 设置为 False。如果没有文档更新,则无需重新构建文档的嵌入向量。
加载文档并将其拆分为 token
加载docs 目录下的所有 Markdown 文件。
对于 Apache Doris 文档,您可以从 github.com/apache/doris 克隆仓库,其中包含 docs 目录。
update_vectordb 设置为 True,因为有新的文档/token。
创建向量数据库实例
使用 Apache Doris 作为向量数据库
将 token 转换为嵌入向量并存入向量数据库
这里使用 Apache Doris 作为向量数据库,您可以通过ApacheDorisSettings 配置 Apache Doris 实例。
配置 Apache Doris 实例与配置 MySQL 实例基本相同,需要指定:
- host/port(主机/端口)
- username(用户名,默认为 ‘root’)
- password(密码,默认为 ”)
- database(数据库,默认为 ‘default’)
- table(表名,默认为 ‘langchain’)
构建问答系统并提问
Connect these docs to Claude, VSCode, and more via MCP for real-time answers.

