我正在使用弹性搜索进行研究。我打算使用余弦相似度,但我注意到它不可用,而是我们将BM25作为默认评分函数。
是否有理由……
长期弹性搜索使用TF / IDF算法来查找查询中的相似性。但数字版本之前更改为BM25更高效。你可以阅读信息 文件 。 好的文章解释了什么是弹性搜索以及如何在ES中进行相似性 。
您还可以为elasticsearch编写自定义算法。 这里有一篇关于如何做的好文章 。