目前,我正在实施Mahout的基于用户的推荐系统,请参阅http://mahout.apache.org/users/recommender/userbased-5-minutes.html
最初,我以为我可以实现某种……
在大多数推荐者中存在随机过程来对用于计算模型的数据进行下采样,使得它可以是O(n)复杂度。如果希望下采样具有确定性,则可以提供固定的RNG种子值。如何执行此操作取决于您使用的推荐器的包装。
您使用的是内存版本,Hadoop版本还是Spark版本+搜索引擎?
最新的Mahout推荐代码完全集成到事件摄取,模型计算和实时服务中 这个版本 这里RNG种子在配置文件engine.json中。