PROSAGA码农传奇-hbase-HBase中每行的不同列？

<div class =“post-text”itemprop =“text”>
  
    HBase将给定列族的所有记录存储在同一文件中，因此即使应用过滤器，扫描也必须在所有键值对上运行。对于您建议存储数据的两种方式都是如此。
  
  
    为了获得此特定扫描的最佳性能，您应该考虑存储您的
     <code>
 s2
 </code>
     不同列族中的数据。在引擎盖下，HBase将以下列方式存储您的数据：
  
  
    一个文件：
  
   <pre>
 <code>
 1-1040 cf1:s1
2-1040 cf1:s5
2-1045 cf1:s99
3-1040 cf1:s75
3-1042 cf1:s135

</code>
 </pre>
  
    另一个档案：
  
   <pre>
 <code>
 1-1040 cf2:s2
1-1043 cf2:s2

</code>
 </pre>
  
    然后你可以运行扫描
     <code>
 cf2
 </code>
    ，HBase只会读取包含的数据
     <code>
 s2
 </code>
    ，使操作更快。
  
   <pre>
 <code>
 scan 'tb', {COLUMNS => 'cf2', STARTROW=>'1-1040s2', ENDROW=>'1-1044'}

</code>
 </pre>
  
    注意事项：
  
  <UL>
    <LI>
      建议每个表只有两个或三个列系列，因此如果要运行此查询，则不应实现此功能
       <code>
 s5
 </code>
      ，
       <code>
 s75
 </code>
       在这种情况下，您的复合rowkey选项更好，因为HBase只需要查看rowkey，而不是列限定符。
    </LI>
    <LI>
      这取决于您将运行哪些查询，以及您运行它们的频率。这是获取相关值的最快方法
       <code>
 s2
 </code>
      ，但对于其他查询可能不是最快的。
    </LI>
  </UL>
</DIV>