当前位置: 开发笔记 > 编程语言 > 正文

java实现hbase分页,实现Hbase的分页

作者：上当受骗的家_908 | 来源：互联网 | 2023-10-09 22:23

作者：R星月出处：http:www.cnblogs.comrxingyue欢迎转载，也请保留这段声明。谢谢!做一个项目中由于数据量比较大&

作者&＃xff1a;R星月出处&＃xff1a;http://www.cnblogs.com/rxingyue 欢迎转载&＃xff0c;也请保留这段声明。谢谢!

做一个项目中由于数据量比较大&＃xff0c;并且需要定时增量分析&＃xff0c;做了hbase的分页。项目中用到的版本是hbase1.1 。需要启用协处理器 Aggregation

1.启动全局aggregation&＃xff0c;能过操纵所有的表上的数据。通过修改hbase-site.xml这个文件来实现&＃xff0c;只需要添加如下代码&＃xff1a;

hbase.coprocessor.user.region.classes

org.apache.hadoop.hbase.coprocessor.AggregateImplementation

2.启用表aggregation&＃xff0c;只对特定的表生效。通过HBase Shell 来实现。

(1)disable指定表。hbase> disable ‘mytable’

(2)添加aggregation hbase> alter ‘mytable’, METHOD &＃61;> ‘table_att’,’coprocessor’&＃61;>’|org.apache.hadoop.hbase.coprocessor.AggregateImplementation||’

(3)重启指定表 hbase> enable ‘mytable’

Hbase客户端调用代码示例

1、得到hbase的表结构总数

public int getTotalRecord(Table keyIndexTable , String nowTime){

int count&＃61;0;

AggregationClient aggregationClient &＃61; new AggregationClient(config);

Scan scan&＃61;new Scan();

scan.setStopRow(nowTime.getBytes());//小于当前时间

try {

Long rowCount &＃61; aggregationClient.rowCount(keyIndexTable, new LongColumnInterpreter(), scan);

aggregationClient.close();

count&＃61;rowCount.intValue();

} catch (Throwable e) {

e.printStackTrace();

}

return count;

}

2 &＃xff0c;实现分页

public MapgetIndexTableInfo(Table table,String tableName, String nowTime,String startRow, Integer currentPage, Integer pageSize){

Map communtiyKeysMap&＃61;new TreeMap();

ResultScanner scanner&＃61; null;//为分页创建的封装类对象&＃xff0c;下面有给出具体属性

try{//获取最大返回结果数量

if (pageSize &＃61;&＃61; null || pageSize &＃61;&＃61; 0L)

pageSize&＃61; 100;if (currentPage &＃61;&＃61; null || currentPage &＃61;&＃61; 0)

currentPage&＃61; 1;//计算起始页和结束页

Integer nowPageSize&＃61;pageSize&＃43;1;//MUST_PASS_ALL(条件 AND) MUST_PASS_ONE(条件OR)

FilterList filterList &＃61; newFilterList(FilterList.Operator.MUST_PASS_ALL);

Filter filter1&＃61;newPageFilter(nowPageSize);

filterList.addFilter(filter1);//if(tableName.equals("COMMUNITY_KEYS_INDEX")){//Filter filter2 &＃61; new QualifierFilter(CompareOp.EQUAL, new BinaryComparator(Bytes.toBytes("communitykey")));//filterList.addFilter(filter2);//}

Scan scan &＃61; newScan();

scan.setFilter(filterList);

scan.setMaxResultSize(nowPageSize);

scan.setStartRow(Bytes.toBytes(startRow));if(!nowTime.equals("")){

scan.setStopRow(nowTime.getBytes());

}

scanner&＃61;table.getScanner(scan);int i &＃61; 1;//遍历扫描器对象&＃xff0c; 并将需要查询出来的数据row key取出

for(Result result : scanner) {

String row&＃61;newString(result.getRow());for(Cell cell : result.rawCells()) {//System.out.println("列族:"&＃43;new String(CellUtil.cloneQualifier(cell))&＃43;">>>"&＃43;new String(CellUtil.cloneValue(cell)));

if(i&＃61;&＃61;nowPageSize){

communtiyKeysMap.put("nextStart", row.substring(0,row.lastIndexOf(":")));break;

}

communtiyKeysMap.put(row,newString(CellUtil.cloneValue(cell)));

}

i&＃43;&＃43;;

}

}catch(IOException e) {

e.printStackTrace();

}finally{if (scanner !&＃61; null)

scanner.close();

}returncommuntiyKeysMap;

}

3&＃xff0c;该分页中处理和跳转下一页

for(int page&＃61;1;page<&＃61;pageNum;page&＃43;&＃43;){ //分页

List pageList &＃61; new ArrayList(); //子类调用具体分析//1.查出要分析的数据

Map communtiyKeysMap&＃61;getIndexTableInfo(hTable,hbaseIndexTabel,nowTime,startRow,page,pageSize);for(String communitykey:communtiyKeysMap.keySet()){

String rowKeyIndex&＃61;communitykey;

String cellValue&＃61;communtiyKeysMap.get(rowKeyIndex);if(communitykey.equals("nextStart")){

startRow&＃61;cellValue;continue; //下一页进行跳转

}

}//实现调用具体的分析//实现该分页处理

}

该过程总共为三步&＃xff0c;1.设置表的协处理器 Aggregation&＃xff0c;使表能够实现统计功能。2.分页&＃xff0c;每次取出1001条数据&＃xff0c;每页数据为1000条&＃xff0c;第1001条的rowkey为下一页的startrowkey&＃xff0c;做为标志“nextStart” 。3分页之后进行查找关联数据和进行逻辑分析处理。

推荐阅读

post
Web学习历程记录（七）——Tomcat基本概念和配置

本文介绍了Web学习历程记录中关于Tomcat的基本概念和配置。首先解释了Web静态Web资源和动态Web资源的概念，以及C/S架构和B/S架构的区别。然后介绍了常见的Web服务器，包括Weblogic、WebSphere和Tomcat。接着详细讲解了Tomcat的虚拟主机、web应用和虚拟路径映射的概念和配置过程。最后简要介绍了http协议的作用。本文内容详实，适合初学者了解Tomcat的基础知识。 ... [详细]

蜡笔小新 2023-12-13 17:08:24
java
sqoop自定义分隔符的实现方法及步骤详解

本文介绍了在sqoop1.4.*版本中，如何实现自定义分隔符的方法及步骤。通过修改sqoop生成的java文件，并重新编译，可以满足实际开发中对分隔符的需求。具体步骤包括修改java文件中的一行代码，重新编译所需的hadoop包等。详细步骤和编译方法在本文中都有详细说明。 ... [详细]

蜡笔小新 2023-12-10 11:29:22
post
java 模拟get post请求_Java后台模拟发送http的get和post请求，并测试

个人学习使用：谨慎参考1Client类importcom.thoughtworks.gauge.Step;importcom.thoughtworks.gauge.T ... [详细]

蜡笔小新 2023-12-13 14:20:23
java
java命令运行

Java在运行已编译完成的类时，是通过java虚拟机来装载和执行的，java虚拟机通过操作系统命令JAVA_HOMEbinjava–option来启 ... [详细]

蜡笔小新 2023-12-12 19:26:55
java
七牛上传图片成功之后，图片裂了

图像因存在错误而无法显示 ... [详细]

蜡笔小新 2023-12-11 13:17:11
js
Servlet多用户登录时HttpSession会话信息覆盖问题的解决方案

本文讨论了在Servlet多用户登录时可能出现的HttpSession会话信息覆盖问题，并提供了解决方案。通过分析JSESSIONID的作用机制和编码方式，我们可以得出每个HttpSession对象都是通过客户端发送的唯一JSESSIONID来识别的，因此无需担心会话信息被覆盖的问题。需要注意的是，本文讨论的是多个客户端级别上的多用户登录，而非同一个浏览器级别上的多用户登录。 ... [详细]

蜡笔小新 2023-12-10 12:00:40
java
Java多线程总结（8）concurrent.locks包下的锁机制的使用

1Lock与ReadWriteLock1.1LockpublicinterfaceLock{voidlock();voidlockInterruptibl ... [详细]

蜡笔小新 2023-12-09 09:15:17
default
org.apache.hadoop.hbase.client.Increment.getDurability()方法的使用及代码示例

本文整理了Java中org.apache.hadoop.hbase.client.Increment.getDurability()方法的一些代码示例，展示了 ... [详细]

蜡笔小新 2023-10-17 12:30:05
require
Spring源码解密之默认标签的解析方式分析

本文分析了Spring源码解密中默认标签的解析方式。通过对命名空间的判断，区分默认命名空间和自定义命名空间，并采用不同的解析方式。其中，bean标签的解析最为复杂和重要。 ... [详细]

蜡笔小新 2023-12-14 17:24:50
import
Golang如何使用Cookie跟踪位置

关键词：Golang, Cookie, 跟踪位置, net/http/cookiejar, package main, golang.org/x/net/publicsuffix, io/ioutil, log, net/http, net/http/cookiejar ... [详细]

蜡笔小新 2023-12-13 15:47:22
java
如何清除Eclipse中SVN用户的设置

本文介绍了如何清除Eclipse中SVN用户的设置。首先需要查看使用的SVN接口，然后根据接口类型找到相应的目录并删除相关文件。最后使用SVN更新或提交来应用更改。 ... [详细]

蜡笔小新 2023-12-12 14:42:31
java
Windows7 64位系统安装PLSQL Developer的步骤和注意事项

本文介绍了在Windows7 64位系统上安装PLSQL Developer的步骤和注意事项。首先下载并安装PLSQL Developer，注意不要安装在默认目录下。然后下载Windows 32位的oracle instant client，并解压到指定路径。最后，按照自己的喜好对解压后的文件进行命名和压缩。 ... [详细]

蜡笔小新 2023-12-12 13:32:08
post
解决nginx启动报错epoll_wait() reported that client prematurely closed connection的方法

本文介绍了解决nginx启动报错epoll_wait() reported that client prematurely closed connection的方法，包括检查location配置是否正确、pass_proxy是否需要加“/”等。同时，还介绍了修改nginx的error.log日志级别为debug，以便查看详细日志信息。 ... [详细]

蜡笔小新 2023-12-12 13:19:04
install
CEPH LIO iSCSI Gateway及其使用参考文档

本文介绍了CEPH LIO iSCSI Gateway以及使用该网关的参考文档，包括Ceph Block Device、CEPH ISCSI GATEWAY、USING AN ISCSI GATEWAY等。同时提供了多个参考链接，详细介绍了CEPH LIO iSCSI Gateway的配置和使用方法。 ... [详细]

蜡笔小新 2023-12-12 10:10:14
java
Hbase Region Server和Hbase Master启动报错 Direct buffer memory

2018-02-1420:07:13,610ERROR[main]regionserver.HRegionServerCommandLine:Regionserverexiting ... [详细]

蜡笔小新 2023-10-16 20:08:57

上当受骗的家_908

这个家伙很懒，什么也没留下！

Tags | 热门标签

RankList | 热门文章