Hbase优化---参数优化.doc


立即下载 v-star*위위
2024-12-10
HBase table 数据
61.5 KB

本文主要是从HBase应用程序设计与开发的角度,总结几种常用的性能优化方法。有关HBase系统配置级别的优化,这里涉及的不多,这部分可以参考:淘宝Ken Wu同学的博客 (​http:​/​​/​kenwublog.com​/​hbase-performance-tuning​)。
1. 表的设计
1.1 Pre-Creating Regions
    默认情况下,在创建HBase表的时候会自动创建一个region分区,当导入数据的时候,所有的HBase客户端都向这一个region写数据,直到这个region足够大了才进行切分。一种可以加快批量写入速度的方法是通过预先创建一些空的regions,这样当数据写入HBase时,会按照region分区情况,在集群内做数据的负载均衡。
    有关预分区,详情参见:Table Creation: Pre-Creating Regions (​http:​/​​/​hbase.apache.org​/​book.html" \l "precreate.regions" \t "http:​/​​/​blogread.cn​/​it​/​article​/​_blank​),下面是一个例子:
public static boolean createTable(HBaseAdmin admin, HTableDescriptor table, byte[][] splits)
throws IOException {
try {
admin.createTable(table, splits);
return true;
} catch (TableExistsException e) {
logger.info("table " + table.getNameAsString() + " already exists");
// the table already exists...
return false;
}
}
public static byte[][] getHexSplits(String startKey, String endKey, int numRegions) {
byte[][] splits = new by


HBase/table/数据/ HBase/table/数据/
-1 条回复
登录 后才能参与评论
-->