我只使用Spark ALS解决了这个问题。培训过程花费不到2分钟
的
我的膝上型计算机
</强>
在具有相同参数的相同数据集上。
我现在可以理解为什么一些机器学习算法由于性能问题而被弃用…(例如,Minhash算法)
我正在尝试在AWS EMR集群上运行Mahout ALS建议,但是,它需要的时间比我预期的要长。
以下是我运行的命令:
aws add-steps –cluster-id&lt; cluster_id&gt; \
…