因为HBase表是稀疏表,所以HBase不仅为每个单元存储值,而且存储识别单元所需的所有信息(通常称为Key,不要与RowKey混淆).Key如下:
RowKey-的ColumnFamily - ColumnQualifier时间戳
并且为每个条目存储所有这些信息.这就是为什么建议使用列族和列限定符的短名称来减少额外的开销.
我的问题:为什么我需要为每个条目存储ColumnFamily?据我所知,每个商店文件都属于一个列族.每个商店文件存储一次列族名称是不够的?这样可以减少开销,可以使用任意列族名称,我们仍然可以为每个条目识别列族.我在这里错过了什么?