Skip to main content
时间加权检索器是一种在相似度之外还考虑新近度的检索器。评分算法如下:
let score = (1.0 - this.decayRate) ** hoursPassed + vectorRelevance;
值得注意的是,上面的 hoursPassed 指的是检索器中的对象最后一次被访问以来的时间,而不是创建以来的时间。这意味着经常访问的对象保持“新鲜”并获得更高的分数。 this.decayRate 是一个介于 0 和 1 之间的可配置小数。较小的数字意味着文档将被“记住”更长时间,而较大的数字则强烈加权最近访问的文档。 请注意,将衰减率设置为正好 0 或 1 会使 hoursPassed 无关紧要,并使此检索器等同于标准向量查找。

用法

此示例展示了如何使用向量存储初始化 TimeWeightedVectorStoreRetriever。 重要的是要注意,由于所需的元数据,必须使用 检索器 上的 addDocuments 方法将所有文档添加到支持的向量存储中,而不是向量存储本身。
import { TimeWeightedVectorStoreRetriever } from "@langchain/classic/retrievers/time_weighted";
import { MemoryVectorStore } from "@langchain/classic/vectorstores/memory";
import { OpenAIEmbeddings } from "@langchain/openai";

const vectorStore = new MemoryVectorStore(new OpenAIEmbeddings());

const retriever = new TimeWeightedVectorStoreRetriever({
  vectorStore,
  memoryStream: [],
  searchKwargs: 2,
});

const documents = [
  "My name is John.",
  "My name is Bob.",
  "My favourite food is pizza.",
  "My favourite food is pasta.",
  "My favourite food is sushi.",
].map((pageContent) => ({ pageContent, metadata: {} }));

// 必须使用检索器上的此方法添加所有文档(而不是向量存储!)
// 以便填充正确的访问历史元数据
await retriever.addDocuments(documents);

const results1 = await retriever.invoke("What is my favourite food?");

console.log(results1);

/*
[
  Document { pageContent: 'My favourite food is pasta.', metadata: {} }
]
 */

const results2 = await retriever.invoke("What is my favourite food?");

console.log(results2);

/*
[
  Document { pageContent: 'My favourite food is pasta.', metadata: {} }
]
 */

相关