当前位置: 开发笔记 > 编程语言 > 正文

HBase压缩和分割原理

作者：我们的生活小窍门 | 来源：互联网 | 2023-09-24 19:58

HRegionServer调用合并请求主要逻辑如下:遍历每个Store然后计算需要合并的文件，生成CompactionRequest对象并提交到线程池中执行根据thr

HRegionServer调用合并请求

主要逻辑如下:

//遍历每个Store然后计算需要合并的文件&＃xff0c;生成
//CompactionRequest对象并提交到线程池中执行
//根据throttleCompaction()函数规则来判断是提交到
//largeCompactions线程池还是smallCompactions线程池
CompactSplitThread#requestCompaction() {
for (Store s : r.getStores().values()) {
CompactionRequest cr &＃61; Store.requestCompaction(priority, request);
ThreadPoolExecutor pool &＃61; s.throttleCompaction(cr.getSize())
? largeCompactions : smallCompactions;
pool.execute(cr);
ret.add(cr);
}
}
//如果CompactionRequest的总大小 >
//minFilesToCompact * 2 * memstoreFlushSize
//则这次任务为major合并&＃xff0c;否则在为minor合并
Store#throttleCompaction() {
long throttlePoint &＃61; conf.getLong(
"hbase.regionserver.thread.compaction.throttle",
2 * this.minFilesToCompact * this.region.memstoreFlushSize);
return compactionSize > throttlePoint;
}
Store#compactSelection() {
//选择出已经过期的StoreFile
if(storefile.maxTimeStamp &＃43; store.ttl < now_timestamp) {
//返回已经过期的store file文件集合
}
//从0开始遍历到最后&＃xff0c;如果发现有文件 > maxCompactSize则pos&＃43;&＃43;
//然后过滤掉这些大于maxCompactSize的文件
while (pos < compactSelection.getFilesToCompact().size() &&
compactSelection.getFilesToCompact().get(pos).getReader().length()
> while (pos < compactSelection.getFilesToCompact().size() &&
compactSelection.getFilesToCompact().get(pos).getReader().length()
> maxCompactSize &&
!compactSelection.getFilesToCompact().get(pos).isReference()) &＃43;&＃43;pos;
if (pos !&＃61; 0) compactSelection.clearSubList(0, pos); &&
!compactSelection.getFilesToCompact().get(pos).isReference()) {
&＃43;&＃43;pos;
}
if (pos !&＃61; 0) {
compactSelection.clearSubList(0, pos);
}
if (compactSelection.getFilesToCompact().size() < minFilesToCompact) {
return;
}
//计算出sumSize数组&＃xff0c;数组大小就是Store中的文件数量
//sumSize数组中每个元素的大小是根据StroeFile的大小再加上 sumSize[i&＃43;1](或者0)
//然后减去fileSizes[tooFar](或者0)
//sumSize的内容跟元素的fileSizes数组应该差别不大
int countOfFiles &＃61; compactSelection.getFilesToCompact().size();
long [] fileSizes &＃61; new long[countOfFiles];
long [] sumSize &＃61; new long[countOfFiles];
for (int i &＃61; countOfFiles-1; i >&＃61; 0; --i) {
StoreFile file &＃61; compactSelection.getFilesToCompact().get(i);
fileSizes[i] &＃61; file.getReader().length();
// calculate the sum of fileSizes[i,i&＃43;maxFilesToCompact-1) for algo
int tooFar &＃61; i &＃43; this.maxFilesToCompact - 1;
sumSize[i] &＃61; fileSizes[i] &＃43; ((i&＃43;1 < countOfFiles) ? sumSize[i&＃43;1] : 0)
- ((tooFar < countOfFiles) ? fileSizes[tooFar] : 0);
}
//如果fileSize[start] > Math.max(minCompactSize,sumSize[start&＃43;1] * r)
//则下标&＃43;&＃43;&＃xff0c;这里的操作是过滤掉过大的文件&＃xff0c;以免影响合并时间
while(countOfFiles - start >&＃61; this.minFilesToCompact && fileSizes[start] >
Math.max(minCompactSize, (long)(sumSize[start&＃43;1] * r))) {
&＃43;&＃43;start;
}
int end &＃61; Math.min(countOfFiles, start &＃43; this.maxFilesToCompact);
long totalSize &＃61; fileSizes[start] &＃43; ((start&＃43;1 < countOfFiles) ? sumSize[start&＃43;1] : 0);
compactSelection &＃61; compactSelection.getSubList(start, end);
//如果是major compact&＃xff0c;并且需要执行的文件数量过多&＃xff0c;则去掉一些
if(majorcompaction && compactSelection.getFilesToCompact().size() > this.maxFilesToCompact) {
int pastMax &＃61; compactSelection.getFilesToCompact().size() - this.maxFilesToCompact;
compactSelection.getFilesToCompact().subList(0, pastMax).clear();
}
}

CompactionRequest线程(用于执行major和minor合并)

压缩相关的类图如下:

major和minor合并的差别其实很小&＃xff0c;如果最后待合并的总大小 > 2*minFilesToCompact*memstoreFlushSize

则认为这次是一个major合并&＃xff0c;方到major线程池中执行&＃xff0c;否则认为是一次minor合并

另外在创建StoreScanner构造函数时&＃xff0c;会根据ScanType来判断是major还是minor合并&＃xff0c;之后在

ScanQueryMathcer中根据ScanType的不同(有用户类型&＃xff0c;minor和major三种类型)来决定返回的不同值的

主要逻辑如下:

//在单独的线程中执行合并
CompactionRequest#run() {
boolean completed &＃61; HRegion.compact(this);
if (completed) {
if (s.getCompactPriority() <&＃61; 0) {
server.getCompactSplitThread().requestCompaction(r, s, "Recursive enqueue", null);
} else {
// see if the compaction has caused us to exceed max region size
server.getCompactSplitThread().requestSplit(r);
}
}
}
//这里会调用Store&＃xff0c;来执行compact
HRegion#compact() {
Preconditions.checkArgument(cr.getHRegion().equals(this));
lock.readLock().lock();
CompactionRequest.getStore().compact(cr);
lock.readLock().unlock();
}
//完成合并&＃xff0c;调用Compactor#compact()完成最核心的compact逻辑
//将合并后的文件移动到最终目录下并删除掉旧的文件
Store#compact() {
List filesToCompact &＃61; request.getFiles();
StoreFile.Writer writer &＃61; this.compactor.compact(cr, maxId);
if (this.conf.getBoolean("hbase.hstore.compaction.complete", true)) {
sf &＃61; completeCompaction(filesToCompact, writer);
}else {
// Create storefile around what we wrote with a reader on it.
sf &＃61; new StoreFile(this.fs, writer.getPath(), this.conf, this.cacheConf,
this.family.getBloomFilterType(), this.dataBlockEncoder);
sf.createReader();
}
}
//将 /hbase/mytable/963cf86f3fd07c3d3161c1f4f15bef5a/.tmp/9c8614a6bd0d4833b419a13abfde5ac1
//移动到
// /hbase/mytable/963cf86f3fd07c3d3161c1f4f15bef5a/value/9c8614a6bd0d4833b419a13abfde5ac1
//再对新的目标文件创建一个StroeFile对象包装
//将旧的文件(这些底层的HFile都已经合并成一个文件了)删除
//最后计算新的StoreFile文件大小等信息并返回
Store#completeCompaction() {
Path origPath &＃61; compactedFile.getPath();
Path destPath &＃61; new Path(homedir, origPath.getName());
HBaseFileSystem.renameDirForFileSystem(fs, origPath, destPath);
StoreFile result &＃61; new StoreFile(this.fs, destPath, this.conf, this.cacheConf,
this.family.getBloomFilterType(), this.dataBlockEncoder);
passSchemaMetricsTo(result);
result.createReader();
}
//compact的最核心逻辑!!
//对多个StoreFile进行合并&＃xff0c;这里使用到了StoreScanner
//迭代读取所有的StroeFile然后使用堆排序输出&＃xff0c;并写入到
//StoreFile$Writer#append()中
Compactor#compact() {
for (StoreFile file : filesToCompact) {
StoreFile.Reader r &＃61; file.getReader();
long keyCount &＃61; (r.getBloomFilterType() &＃61;&＃61; store.getFamily()
.getBloomFilterType()) ?
r.getFilterEntries() : r.getEntries();
maxKeyCount &＃43;&＃61; keyCount;
}
int compactionKVMax &＃61; getConf().getInt("hbase.hstore.compaction.kv.max", 10);
Compression.Algorithm compression &＃61; store.getFamily().getCompression();
List scanners &＃61; StoreFileScanner
.getScannersForStoreFiles(filesToCompact, false, false, true);
Scan scan &＃61; new Scan();
scan.setMaxVersions(store.getFamily().getMaxVersions());
//这里会根据当前合并的类型选择ScanType的类型&＃xff0c;之后ScanQueryMatcher根据ScanType的
//的类型返回不同的值
InternalScanner scanner &＃61; new StoreScanner(store, store.getScanInfo(), scan, scanne rs,majorCompaction? ScanType.MAJOR_COMPACT : ScanType.MINOR_COMPACT,
smallestReadPoint, earliestPutTs);
do {
hasMore &＃61; scanner.next(kvs, compactionKVMax);
if (writer &＃61;&＃61; null && !kvs.isEmpty()) {
//在tmp目录下创建一个临时文件&＃xff0c;路径类似
// /hbase/mytable/963cf86f3fd07c3d3161c1f4f15bef5a/.tmp/9c8614a6bd0d4833b419a13abfde5ac1
writer &＃61; store.createWriterInTmp(maxKeyCount, compactionCompression, true,
maxMVCCReadpoint >&＃61; smallestReadPoint);
}
for (KeyValue kv : kvs) {
writer.append(kv);
}
}while(hasMore);
scanner.close();
StoreFile$Writer.appendMetadata(maxId, majorCompaction);
StoreFile$Writer.close();
}

压缩算法和的核心逻辑演示类图

根据由新到老排序文件&＃xff0c;选择出合适的文件

这里的滑动窗口是从0下标开始过滤掉size过大的文件&＃xff0c;这样可以提高合并效率

使用到的一些重要类

其中内部scan的时候使用到的相关类图如下

推荐阅读

schema
MySQL显示SQL语句执行时间的实例详解

本文详细介绍了如何使用MySQL来显示SQL语句的执行时间，并通过MySQL Query Profiler获取CPU和内存使用量以及系统锁和表锁的时间。同时介绍了效能分析的三种方法：瓶颈分析、工作负载分析和基于比率的分析。 ... [详细]

蜡笔小新 2023-12-12 16:16:42
python
计算机存储系统的层次结构及其优势

本文介绍了计算机存储系统的层次结构，包括高速缓存、主存储器和辅助存储器三个层次。通过分层存储数据可以提高程序的执行效率。计算机存储系统的层次结构将各种不同存储容量、存取速度和价格的存储器有机组合成整体，形成可寻址存储空间比主存储器空间大得多的存储整体。由于辅助存储器容量大、价格低，使得整体存储系统的平均价格降低。同时，高速缓存的存取速度可以和CPU的工作速度相匹配，进一步提高程序执行效率。 ... [详细]

蜡笔小新 2023-12-13 17:32:41
express
关于Linq to sql 实现模糊查询 string数组

前景：当UI一个查询条件为多项选择，或录入多个条件的时候，比如查询所有名称里面包含以下动态条件，需要模糊查询里面每一项时比如是这样一个数组条件：newstring[]{兴业银行, ... [详细]

蜡笔小新 2023-12-13 09:34:59
io
VB.NET在线急等问题解决方法，如何统计数据库字段下的数据并显示在文本框里？

本文介绍了一个在线急等问题解决方法，即如何统计数据库中某个字段下的所有数据，并将结果显示在文本框里。作者提到了自己是一个菜鸟，希望能够得到帮助。作者使用的是ACCESS数据库，并且给出了一个例子，希望得到的结果是560。作者还提到自己已经尝试了使用"select sum(字段2) from 表名"的语句，得到的结果是650，但不知道如何得到560。希望能够得到解决方案。 ... [详细]

蜡笔小新 2023-12-13 15:15:30
object
SpringJdbcTemplate的使用详解

本文详细介绍了Spring的JdbcTemplate的使用方法，包括执行存储过程、存储函数的call()方法，执行任何SQL语句的execute()方法，单个更新和批量更新的update()和batchUpdate()方法，以及单查和列表查询的query()和queryForXXX()方法。提供了经过测试的API供使用。 ... [详细]

蜡笔小新 2023-12-13 14:27:11
blob
Android 7自学笔记总结、移动架构视频、安卓面试真题、项目实战源码讲义

本文介绍了Android 7的学习笔记总结，包括最新的移动架构视频、大厂安卓面试真题和项目实战源码讲义。同时还分享了开源的完整内容，并提醒读者在使用FileProvider适配时要注意不同模块的AndroidManfiest.xml中配置的xml文件名必须不同，否则会出现问题。 ... [详细]

蜡笔小新 2023-12-13 10:06:58
random
标题: C#随机生成中文姓名的方法及代码分享

摘要: 在测试数据中，生成中文姓名是一个常见的需求。本文介绍了使用C#编写的随机生成中文姓名的方法，并分享了相关代码。作者欢迎读者提出意见和建议。 ... [详细]

蜡笔小新 2023-12-12 20:40:34
range
如何更高效地使用IF函数来获取输出列表

本文讨论了如何使用IF函数从基于有限输入列表的有限输出列表中获取输出，并提出了是否有更快/更有效的执行代码的方法。作者希望了解是否有办法缩短代码，并从自我开发的角度来看是否有更好的方法。提供的代码可以按原样工作，但作者想知道是否有更好的方法来执行这样的任务。 ... [详细]

蜡笔小新 2023-12-12 17:32:28
python
第四章高阶函数（参数传递、高阶函数、lambda表达式）（python进阶）的讲解和应用

本文主要讲解了第四章高阶函数（参数传递、高阶函数、lambda表达式）的相关知识，包括函数参数传递机制和赋值机制、引用传递的概念和应用、默认参数的定义和使用等内容。同时介绍了高阶函数和lambda表达式的概念，并给出了一些实例代码进行演示。对于想要进一步提升python编程能力的读者来说，本文将是一个不错的学习资料。 ... [详细]

蜡笔小新 2023-12-12 15:52:48
filter
Android自定义控件绘图篇之Paint函数大汇总

本文介绍了Android自定义控件绘图篇中的Paint函数大汇总，包括重置画笔、设置颜色、设置透明度、设置样式、设置宽度、设置抗锯齿等功能。通过学习这些函数，可以更好地掌握Paint的用法。 ... [详细]

蜡笔小新 2023-12-10 23:11:57
io
Android开发优化之软引用与弱引用的应用

本文介绍了在Android开发中使用软引用和弱引用的应用。如果一个对象只具有软引用，那么只有在内存不够的情况下才会被回收，可以用来实现内存敏感的高速缓存；而如果一个对象只具有弱引用，不管内存是否足够，都会被垃圾回收器回收。软引用和弱引用还可以与引用队列联合使用，当被引用的对象被回收时，会将引用加入到关联的引用队列中。软引用和弱引用的根本区别在于生命周期的长短，弱引用的对象可能随时被回收，而软引用的对象只有在内存不够时才会被回收。 ... [详细]

蜡笔小新 2023-12-10 16:33:12
filter
用Vue实现的Demo商品管理效果图及实现代码

本文介绍了一个使用Vue实现的Demo商品管理的效果图及实现代码。 ... [详细]

蜡笔小新 2023-12-10 15:14:25
filter
java drools5_Java Drools5.1 规则流基础【示例】（中）

五、规则文件及规则流EduInfoRule.drl:packagemyrules;importsample.Employ;ruleBachelorruleflow-group ... [详细]

蜡笔小新 2023-12-10 15:01:31
shell
解决Sharepoint 2013运行状况分析出现的“一个或多个服务器未响应”问题的方法

本文介绍了解决Sharepoint 2013运行状况分析中出现的“一个或多个服务器未响应”问题的方法。对于有高要求的客户来说，系统检测问题的存在是不可接受的。文章详细描述了解决该问题的步骤，包括删除服务器、处理分布式缓存留下的记录以及使用代码等方法。同时还提供了相关关键词和错误提示信息，以帮助读者更好地理解和解决该问题。 ... [详细]

蜡笔小新 2023-12-10 13:37:58
io
php缓存ri,浅析ThinkPHP缓存之快速缓存(F方法)和动态缓存(S方法)(日常整理)

thinkPHP的F方法只能用于缓存简单数据类型，不支持有效期和缓存对象。S()缓存方法支持有效期，又称动态缓存方法。本文是小编日常整理有关thinkp ... [详细]

蜡笔小新 2023-12-09 17:54:25

我们的生活小窍门

这个家伙很懒，什么也没留下！

Tags | 热门标签

RankList | 热门文章