除了Mahout,你应该看看 SLEPc (这是一个基于的工具包 PETSc的 )用于求解非常大的稀疏矩阵的特征值问题。它使用MPI,因此它将运行在许多不同的并行和分布式体系结构上。还有 Gensim ,用Python编写。它可能不像Mahout或SLEPc那样可扩展,但它更容易使用。
看一下 亨利马乌 因为SVD是在那里实现的。