Skip to main content
Clarifai 是最早的深度学习平台之一,成立于 2013 年。Clarifai 提供完整 AI 生命周期的 AI 平台,涵盖围绕图像、视频、文本和音频数据的数据探索、数据标注、模型训练、评估与推理。在 LangChain 生态系统中,据我们所知,Clarifai 是唯一一家在单一生产级平台上同时支持 LLM、嵌入和向量存储的提供商,使其成为将 LangChain 实现投入生产运营的绝佳选择。 Clarifai 为众多不同用例提供数千种 AI 模型。您可以在此处探索,找到最适合您用例的模型。这些模型包括来自 OpenAI、Anthropic、Cohere、AI21 等其他提供商创建的模型,以及 Falcon、InstructorXL 等开源领域的最先进模型,让您将最优秀的 AI 融入产品中。您会发现这些模型按创建者的 user_id 和我们称为 applications(由 app_id 标识)的项目进行组织。除了 model_id 和可选的 version_id 之外,还需要这些 ID,因此找到最佳模型后请记下所有这些 ID! 另请注意,由于有许多用于图像、视频、文本和音频理解的模型,您可以构建一些有趣的 AI 智能体,利用各种 AI 模型作为专家来理解这些数据类型。

安装与设置

  • 安装 Python SDK:
pip install clarifai
注册 Clarifai 账户,然后从您的安全设置获取个人访问令牌以访问 Clarifai API,并将其设置为环境变量(CLARIFAI_PAT)。

LLM

要在 Clarifai 平台中查找 LLM 的选择,您可以在此处选择文本到文本模型类型。
from langchain_community.llms import Clarifai
llm = Clarifai(pat=CLARIFAI_PAT, user_id=USER_ID, app_id=APP_ID, model_id=MODEL_ID)
有关更多详情,Clarifai LLM 封装文档提供了详细介绍

嵌入模型

要在 Clarifai 平台中查找嵌入模型的选择,您可以在此处选择文本到嵌入模型类型。 LangChain 中有一个 Clarifai 嵌入模型,可以通过以下方式访问:
from langchain_community.embeddings import ClarifaiEmbeddings
embeddings = ClarifaiEmbeddings(pat=CLARIFAI_PAT, user_id=USER_ID, app_id=APP_ID, model_id=MODEL_ID)
查看使用示例

向量存储

Clarifai 的向量数据库于 2016 年推出,已针对支持实时搜索查询进行了优化。通过 Clarifai 平台中的工作流,您的数据会通过嵌入模型(以及可选的其他模型)自动建立索引,并将信息存入数据库以供搜索。您不仅可以通过向量查询数据库,还可以通过元数据匹配、其他 AI 预测的概念进行过滤,甚至进行地理坐标搜索。只需创建一个应用,选择适合您数据类型的基础工作流,然后上传数据(通过 API,如此处记录的,或通过 clarifai.com 的用户界面)。 您也可以直接从 LangChain 添加数据,自动索引会自动为您完成。您会注意到这与其他需要在构造函数中提供嵌入模型并让 LangChain 协调从文本获取嵌入并将其写入索引的向量存储略有不同。这不仅更方便,而且使用 Clarifai 的分布式云在后台完成所有索引更具可扩展性。
from langchain_community.vectorstores import Clarifai
clarifai_vector_db = Clarifai.from_texts(user_id=USER_ID, app_id=APP_ID, texts=texts, pat=CLARIFAI_PAT, number_of_docs=NUMBER_OF_DOCS, metadatas = metadatas)
有关更多详情,Clarifai 向量存储文档提供了详细介绍