我们可以将MR作业提交给hadoop集群的最佳方式是什么?
场景:
开发人员有自己的id,例如dev-user1,dev-user2等
Hadoop集群有各种各样的id …
开发人员可以向hadoop集群提交作业的最佳实践?
取决于工作...... yarn jar 将用于MapReduce
yarn jar
这意味着dev-user1无法读取/写入HDFS,因为它是可以访问HDFS的hdfs id。
并非所有内容都归hdfs用户所有。你需要做 /user/dev-user1 该用户拥有的HDFS目录,以便用户拥有“私有”空间。您仍然可以在多个用户写入的HDFS上的任何其他位置创建目录。
/user/dev-user1
只有你在HDFS上明确启用了权限才会检查权限...即使你这样做了,你仍然可以将两个用户放在同一个POSIX组中,或者使所有目录全局可写。
https://hadoop.apache.org/docs/r2.7.3/hadoop-project-dist/hadoop-hdfs/HdfsPermissionsGuide.html
在生产级集群中,Hadoop由Kerberos凭据保护,ACL通过Apache Ranger或Sentry进行管理,这两者都允许细粒度的权限管理