CockroachDB 是一款构建于事务性强一致键值存储之上的分布式 SQL 数据库。它可水平扩展,能够在磁盘、机器、机架乃至数据中心故障时以极低的延迟中断存活,且无需人工干预。核心特性:
- 分布式 SQL:在保持 ACID 保证的同时实现横向扩展
- 原生向量支持:内置
VECTOR类型(v24.2+)和 C-SPANN 索引(v25.2+) - PostgreSQL 兼容:PostgreSQL 应用的直接替代方案
- 全球复制:低延迟的多区域部署
- 自动分片:数据自动分布到各节点
- 可序列化隔离:默认使用最强隔离级别
安装与设置
安装 LangChain 集成:获取 CockroachDB 连接字符串
您需要一个 CockroachDB 集群。选择以下一种方式: 方式一:CockroachDB Cloud(推荐)- 在 cockroachlabs.cloud 注册
- 创建免费集群
- 获取连接字符串:
cockroachdb://user:pass@host:26257/db?sslmode=verify-full
cockroachdb://root@localhost:26257/defaultdb?sslmode=disable
方式三:本地二进制文件
从 cockroachlabs.com/docs/releases 下载
集成
向量存储
CockroachDB 可以使用原生VECTOR 类型和 C-SPANN 分布式索引作为向量存储。
核心特性:
- 原生向量支持(v24.2+)
- 针对分布式系统优化的 C-SPANN 索引(v25.2+)
- 高级元数据过滤
- 使用前缀列的多租户
- 横向可扩展性
聊天消息历史
将对话历史存储在 CockroachDB 中,构建持久化、分布式的聊天应用。 核心特性:- 自动复制的分布式存储
- 强一致性(可序列化)
- 基于会话的组织
- 高可用性
为什么选择 CockroachDB 用于 AI 应用?
天生分布式
- 横向可扩展性:添加节点以处理更多负载
- 多区域部署:以低延迟为全球用户提供服务
- 自动再平衡:数据自动在节点间分布
生产级可靠性
- 高可用性:能够在节点、机架和数据中心故障时存活
- 零停机升级:滚动更新,无需停机
- 备份与恢复:时间点恢复
规模化向量搜索
- C-SPANN 索引:分布式近似最近邻搜索
- 原生向量类型:嵌入的一等公民支持
- 实时索引:新向量无需重建索引
- 多租户:使用前缀列进行高效租户隔离
PostgreSQL 兼容性
- 轻松迁移:PostgreSQL 的直接替代方案
- 熟悉的 SQL:标准 PostgreSQL 语法
- 现有工具:兼容 PostgreSQL 驱动和工具
资源
- CockroachDB 文档
- langchain-cockroachdb GitHub
- langchain-cockroachdb PyPI
- CockroachDB Cloud
- CockroachDB University(免费课程)
支持
通过 MCP 将这些文档连接到 Claude、VSCode 等,获取实时答案。

