Transwarp Hippo 是一款企业级云原生分布式向量数据库,支持对海量向量数据集进行存储、检索和管理。它能有效解决向量相似度检索和高密度向量聚类等问题。Hippo 具备高可用性、高性能和易扩展性等特点,并拥有多种向量搜索索引、数据分区与分片、数据持久化、增量数据摄取、向量标量字段过滤及混合查询等丰富功能,能够有效满足企业对海量向量数据高实时检索的需求。
入门指南
此处唯一的前提条件是来自 OpenAI 官网的 API 密钥。请确保您已经启动了一个 Hippo 实例。安装依赖
首先,我们需要安装某些依赖项,例如 OpenAI、LangChain 和 Hippo-API。请注意,您应安装适合您环境的相应版本。最佳实践
导入依赖包
加载知识文档
对知识文档进行分段
此处,我们使用 LangChain 的 CharacterTextSplitter 进行分段,分隔符为句号。分段后,文本段不超过 1000 个字符,重复字符数为 0。声明嵌入模型
下面,我们使用 LangChain 的OpenAIEmbeddings 方法创建 OpenAI 或 Azure 嵌入模型。
声明 Hippo 客户端
存储文档
进行基于知识的问答
创建大语言模型问答模型
下面,我们分别使用 LangChain 的 AzureChatOpenAI 和 ChatOpenAI 方法创建 OpenAI 或 Azure 大语言问答模型。根据问题获取相关知识
构建 Prompt 模板
等待大语言模型生成答案
通过 MCP 将这些文档连接 到 Claude、VSCode 等,获取实时答案。

