StarRocks 是一款高性能分析型数据库。StarRocks 是面向全场景分析的新一代亚秒级 MPP 数据库,支持多维分析、实时分析和即席查询。
通常 StarRocks 被归类为 OLAP 数据库,它在 ClickBench — 分析型 DBMS 基准测试 中表现出色。由于其超快的向量化执行引擎,它也可以作为快速的向量数据库使用。
本文将演示如何使用 StarRocks 向量存储。
设置
update_vectordb = False。如果没有文档更新,则无需重新构建文档的嵌入。
加载文档并将其拆分为 token
加载docs 目录下的所有 Markdown 文件
对于 StarRocks 文档,你可以从 github.com/StarRocks/starrocks 克隆仓库,其中有一个 docs 目录。
update_vectordb = True,因为存在新的文档/token。
创建向量数据库实例
将 StarRocks 用作向量数据库
将 token 转换为嵌入并存入向量数据库
这里使用 StarRocks 作为向量数据库,你可以通过StarRocksSettings 配置 StarRocks 实例。
配置 StarRocks 实例与配置 MySQL 实例类似,需要指定:
- host/port(主机/端口)
- username(默认:‘root’)
- password(默认:”)
- database(默认:‘default’)
- table(默认:‘langchain’)
构建 QA 并提问
通过 MCP 将这些文档连接到 Claude、VSCode 等工具,获取实时解答。

