Elasticsearch 是一个分布式、RESTful 的搜索和分析引擎。它提供了一个分布式、多租户的全文搜索引擎,具有 HTTP Web 接口和无模式的 JSON 文档。
在信息检索中,Okapi BM25(BM 是 best matching 的缩写)是一种排序函数,搜索引擎用它来估计文档与给定搜索查询的相关性。它基于 Stephen E. Robertson、Karen Spärck Jones 等人在 1970 年代和 1980 年代开发的概率检索框架。
实际排序函数的名称是 BM25。更全的名称 Okapi BM25 包含了第一个使用它的系统的名称,即 Okapi 信息检索系统,该系统于 1980 年代和 1990 年代在伦敦城市大学实现。BM25 及其更新的变体,例如 BM25F(一种可以考虑文档结构和锚文本的 BM25 版本),代表了用于文档检索的类 TF-IDF 检索函数。本笔记本展示了如何使用一个使用
ElasticSearch 和 BM25 的检索器。
有关 BM25 细节的更多信息,请参阅这篇博客文章。
创建新的检索器
添加文本(如果需要)
我们可以选择性地向检索器添加文本(如果它们尚未存在)使用检索器
我们现在可以使用检索器了!将这些文档连接到 Claude、VSCode 等,通过 MCP 获取实时答案。

