我认为Mahout不受支持。
默认情况下,Google Cloud Dataproc不捆绑Apache Mahout,但它可以通过几种不同的方式与Dataproc一起使用。
您可以将它捆绑到jar中(使用Maven阴影或程序集插件或您选择的构建工具中的等效插件),并将其作为常规Hadoop MapReduce或Spark作业运行。
Mahout 0.11.0可用作Dataproc内的Apache Bigtop软件包。如果您运行:
sudo apt-get update sudo apt-get install mahout -y
在主节点上,无论是在SSHing之后还是在初始化操作中,都应该使用具有适当类路径的'mahout'命令。
Mahout 0.11.0仅支持Spark 1.3,但Dataproc(1.0)附带Spark 1.6.1。您可以下载或捆绑Mahout 0.12.0。上周发布,但即使只是声称支持Spark 1.5。当有更好的Spark兼容性解决方案时,我们将在。创建一个Mahout初始化操作 https://github.com/GoogleCloudPlatform/dataproc-initialization-actions 。