的情况下 公平的调度程序 ,当有一个作业运行时,该作业使用整个集群。提交其他作业时,将释放的任务槽分配给新作业,以便每个作业获得大致相同的CPU时间。
不像 默认Hadoop 调度程序,它形成一个工作队列,这可以让短工作在合理的时间内完成,同时不会使长期工作挨饿。它也是在多个用户之间共享群集的简便方法。公平共享也可以与作业优先级一起使用 - 优先级用作权重来确定每个作业获得的总计算时间的比例。
该 CapacityScheduler 旨在允许共享大型集群,同时为每个组织提供最低容量保证。中心思想是Hadoop Map-Reduce集群中的可用资源在多个组织之间进行分区,这些组织根据计算需求共同为集群提供资金。组织可以访问其他人未使用的多余容量,这是一个额外的好处。这为组织提供了具有成本效益的弹性。