StarRocks 是一个高性能分析型数据库。
StarRocks 是一个用于全分析场景的下一代亚秒级 MPP 数据库,包括多维分析、实时分析和即席查询。
通常 StarRocks 被归类为 OLAP,并且在 ClickBench — 分析型 DBMS 基准测试 中表现出色。由于它拥有超快的向量化执行引擎,因此也可以用作快速向量数据库。
这里我们将展示如何使用 StarRocks 向量存储。
设置
update_vectordb = False。如果没有文档更新,则无需重新构建文档的嵌入。
加载文档并将其拆分为标记
加载docs 目录下的所有 markdown 文件
对于 starrocks 文档,您可以从 github.com/StarRocks/starrocks 克隆仓库,其中包含 docs 目录。
update_vectordb = True,因为有新的文档/标记。
创建向量数据库实例
使用 StarRocks 作为向量数据库
将标记转换为嵌入并放入向量数据库
这里我们使用 StarRocks 作为向量数据库,您可以通过StarRocksSettings 配置 StarRocks 实例。
配置 StarRocks 实例与配置 mysql 实例非常相似。您需要指定:
- host/port
- username(默认值:‘root’)
- password(默认值:”)
- database(默认值:‘default’)
- table(默认值:‘langchain’)
构建 QA 并向其提问
连接这些文档 到 Claude、VSCode 等,通过 MCP 获取实时答案。

