Skip to main content
本页介绍如何在 LangChain 中使用 MyScale 向量数据库。 内容分两个部分:安装与设置,以及对特定 MyScale 封装器的说明。 借助 MyScale,您可以管理结构化和非结构化(向量化)数据,并使用 SQL 对两种类型的数据执行联合查询和分析。此外,MyScale 建立在 ClickHouse 之上的云原生 OLAP 架构可在海量数据集上实现闪电般的数据处理速度。

简介

MyScale 可扩展向量数据库概览及高性能向量搜索 您现在可以在我们的 SaaS 上注册并立即启动集群! 如果您也对我们如何集成 SQL 和向量感兴趣,请参阅此文档获取进一步的语法参考。 我们还在 Hugging Face 上提供了实时演示!请查看我们的 Hugging Face 空间!它们能在瞬间搜索数百万个向量!

安装与设置

  • 使用 pip install clickhouse-connect 安装 Python SDK

设置环境

有两种方式设置 MyScale 索引的参数。
  1. 环境变量 运行应用前,请用 export 设置环境变量: export MYSCALE_HOST='<your-endpoints-url>' MYSCALE_PORT=<your-endpoints-port> MYSCALE_USERNAME=<your-username> MYSCALE_PASSWORD=<your-password> ... 您可以在我们的 SaaS 上轻松找到账户、密码和其他信息。详情请参阅此文档MyScaleSettings 下的每个属性都可以用 MYSCALE_ 前缀设置,不区分大小写。
  2. 使用参数创建 MyScaleSettings 对象
    from langchain_community.vectorstores import MyScale, MyScaleSettings
    config = MyScaleSettings(host="<your-backend-url>", port=8443, ...)
    index = MyScale(embedding_function, config)
    index.add_documents(...)
    

封装器

支持的函数:
  • add_texts
  • add_documents
  • from_texts
  • from_documents
  • similarity_search
  • asimilarity_search
  • similarity_search_by_vector
  • asimilarity_search_by_vector
  • similarity_search_with_relevance_scores
  • delete

向量存储

MyScale 数据库有一个封装器,可将其作为向量存储使用,支持语义搜索或相似示例检索。 导入该向量存储:
from langchain_community.vectorstores import MyScale
更详细的 MyScale 封装器演练,请参阅此 notebook