在五台服务器上有HBase,其中一个Table包含一列Family,我应该为每个键执行一些map任务并保存结果。主要问题是:
保持数据的位置……
哪一个更好:在存在表上创建新的列族 或创建新表
我建议更多地关注表格设计的架构和简单性,而不是试图破解HBase内部以获得最佳性能。如果来自这两个列族的信息是相关的,并且您需要在map-reduce扫描中访问这两个CF,请将它们保存在同一个表中。如果信息是100%独立的,您将永远不需要同时扫描它们 - 将它们保存在不同的表中。同样,这是一个架构设计问题,不要尝试执行过早的优化。
第二个问题 - 我不明白你在说什么,抱歉。