摘要(Abstract)

Ambari™:基于Web的工具,用于配置,管理和监控Apache Hadoop集群,包括对Hadoop HDFS,Hadoop MapReduce,Hive,HCatalog,HBase,ZooKeeper,Oozie,Pig和Sqoop的支持。 Ambari还提供了一个用于查看群集运行状况的仪表板,例如热图和能够直观地查看MapReduce,Pig和Hive应用程序以及以用户友好的方式诊断其性能特征的功能。 Avro™:数据序列化系统。 Chukwa™:用于管理大型分布式系统的数据收集系统。 Mahout™:可扩展的机器学习和数据挖掘库。 Tez™:基于Hadoop YARN的通用数据流编程框架,它提供了一个功能强大且灵活的引擎来执行任意DAG任务,以处理批量和交互式用例的数据。 Tez正在被Hadoop生态系统中的Hive™,Pig™和其他框架采用,也被其他商业软件(例如ETL工具)采用,以取代Hadoop™MapReduce作为底层执行引擎。 ZooKeeper™:用于分布式应用程序的高性能协调服务。

主题(Topic)



项目(Project)


全部项目