Skip to main content
Isaacus 是一家基础法律 AI 研究公司,为法律科技生态系统构建 AI 模型、应用和工具。 Isaacus 的产品包括 Kanon 2 Embedder——世界上最好的法律嵌入模型(按大规模法律嵌入基准衡量),以及法律零样本分类法律抽取式问答模型 Isaacus 通过 langchain-isaacus 集成包为 LangChain 的嵌入接口提供一流支持。

设置

要开始使用 LangChain 的 Isaacus 模型,请前往 Isaacus 平台 创建新账号。 注册后,添加付款方式(从而获得你的免费积分)并生成 API 密钥 接下来,安装 langchain-isaacus 集成包:
pip install langchain-isaacus
然后将你的 ISAACUS_API_KEY 环境变量设置为你的 Isaacus API 密钥。
export ISAACUS_API_KEY="your_api_key_here"

嵌入

下面的代码片段演示了如何使用 Isaacus 的 Kanon 2 Embedder 模型结合 LangChain 来评估法律查询与法律文件的语义相似性。有关如何使用 Isaacus LangChain 集成生成嵌入的更详细说明,请参阅此处
import numpy as np # 注意:你可能需要 `pip install numpy`。

from langchain_isaacus import IsaacusEmbeddings

# 为 Kanon 2 Embedder 创建 Isaacus API 客户端。
client = IsaacusEmbeddings(
    "kanon-2-embedder",
    # dimensions=1792, # 你可以选择指定更低的维度。
)

# 嵌入一个示例文档。
document_embedding = client.embed_documents(texts=["These are GitHub's billing policies."])[0]

# 嵌入搜索查询。
relevant_query_embedding = client.embed_query(text="What are GitHub's billing policies?")
irrelevant_query_embedding = client.embed_query(text="What are Microsoft's billing policies?")

# 计算查询与文档之间的相似度。
relevant_similarity = np.dot(relevant_query_embedding, document_embedding)
irrelevant_similarity = np.dot(irrelevant_query_embedding, document_embedding)

# 记录结果。
print(f"Similarity of relevant query to the document: {relevant_similarity * 100:.2f}")
print(f"Similarity of irrelevant query to the document: {irrelevant_similarity * 100:.2f}")