将余弦相似性与二进制数据结合使用 - Mahout

作者: 至此
发布时间: 2024-09-04 05:56:24 (24天前)
转自：

2 条回复

0#
回复此人
没身份别烦我 | 2019-08-31 10-32

<div class =“post-text”itemprop =“text”> <P> 100％的精度是不可能的，所以有些不对劲。所有相似性指标都可以与布尔数据一起使用。请记住，空间具有非常高的维度。 </p> <P> 您的示例数据只有两个项目（BTW ID应为0，基于旧的hadoop版本的Mahout）。因此，所示的数据集不会给出有效的精度分数。 </p> <P> 我用大型E-Com数据集完成了这项工作，而Log-likelihood在布尔数据上的表现远远超过其他指标。 </p> <P> BTW Mahout已从Hadoop转向Spark，我们唯一的指标是LLR。这里实现了一个完整的Universal推荐器，它带有基于Mahout-Samsara的事件存储和预测服务器： <a href="http://templates.prediction.io/PredictionIO/template-scala-parallel-universal-recommendation" rel="nofollow"> http://templates.prediction.io/PredictionIO/template-scala-parallel-universal-recommendation </A> 幻灯片在这里描述： <a href="http://www.slideshare.net/pferrel/unified-recommender-39986309" rel="nofollow"> http://www.slideshare.net/pferrel/unified-recommender-39986309 </A> </p> </DIV>

编辑

登录后才能参与评论