python操作hbase如何快速录入100万数据_python操作hbase数据的方法

作者：虎爷2602900775 | 来源：互联网 | 2023-09-25 04:41

配置thriftpython使用的包thrift个人使用的python编译器是pycharmcommunityedition.在工程中设置中，找到projectint

配置 thrift

python使用的包 thrift

个人使用的python 编译器是pycharm community edition. 在工程中设置中&＃xff0c;找到project interpreter&＃xff0c; 在相应的工程下&＃xff0c;找到package&＃xff0c;然后选择 “&＃43;” 添加&＃xff0c; 搜索 hbase-thrift (Python client for HBase Thrift interface),然后安装包。

安装服务器端thrift。

参考官网&＃xff0c;同时也可以在本机上安装以终端使用。

thrift Getting Started

首先&＃xff0c;安装thrift

下载thrift&＃xff0c;这里&＃xff0c;我用的是thrift-0.7.0-dev.tar.gz 这个版本

tar xzf thrift-0.7.0-dev.tar.gz

cd thrift-0.7.0-dev

sudo ./configure –with-cpp&＃61;no –with-ruby&＃61;no

sudo make

sudo make install

然后&＃xff0c;到HBase的源码包里&＃xff0c;找到

src/main/resources/org/apache/hadoop/hbase/thrift/

执行

thrift –gen py Hbase.thrift

mv gen-py/hbase/ /usr/lib/python2.4/site-packages/ (根据python版本可能有不同)

获取数据示例 1

# coding:utf-8

from thrift import Thrift

from thrift.transport import TSocket

from thrift.transport import TTransport

from thrift.protocol import TBinaryProtocol

from hbase import Hbase

# from hbase.ttypes import ColumnDescriptor, Mutation, BatchMutation

from hbase.ttypes import *

import csv

def client_conn():

# Make socket

transport &＃61; TSocket.TSocket(&＃39;hostname,like:localhost&＃39;, port)

# Buffering is critical. Raw sockets are very slow

transport &＃61; TTransport.TBufferedTransport(transport)

# Wrap in a protocol

protocol &＃61; TBinaryProtocol.TBinaryProtocol(transport)

# Create a client to use the protocol encoder

client &＃61; Hbase.Client(protocol)

# Connect!

transport.open()

return client

if __name__ &＃61;&＃61; "__main__":

client &＃61; client_conn()

# r &＃61; client.getRowWithColumns(&＃39;table name&＃39;, &＃39;row name&＃39;, [&＃39;column name&＃39;])

# print(r[0].columns.get(&＃39;column name&＃39;)), type((r[0].columns.get(&＃39;column name&＃39;)))

result &＃61; client.getRow("table name","row name")

data_simple &＃61;[]

# print result[0].columns.items()

for k, v in result[0].columns.items(): #.keys()

#data.append((k,v))

# print type(k),type(v),v.value,,v.timestamp

data_simple.append((v.timestamp, v.value))

writer.writerows(data)

csvfile.close()

csvfile_simple &＃61; open("data_xy_simple.csv", "wb")

writer_simple &＃61; csv.writer(csvfile_simple)

writer_simple.writerow(["timestamp", "value"])

writer_simple.writerows(data_simple)

csvfile_simple.close()

print "finished"

会基础的python应该知道result是个list&＃xff0c;result[0].columns.items()是一个dict 的键值对。可以查询相关资料。或者通过输出变量&＃xff0c;观察变量的值与类型。

说明&＃xff1a;上面程序中 transport.open()进行链接&＃xff0c;在执行完后&＃xff0c;还需要断开transport.close()

目前只涉及到读数据&＃xff0c;之后还会继续更新其他dbase操作。

以上这篇python操作 hbase 数据的方法就是小编分享给大家的全部内容了&＃xff0c;希望能给大家一个参考&＃xff0c;也希望大家多多支持萬仟网。

希望与广大网友互动&＃xff1f;&＃xff1f;

点此进行留言吧&＃xff01;

推荐阅读

python
安装mysqlclient失败解决办法

本文介绍了在MAC系统中，使用django使用mysql数据库报错的解决办法。通过源码安装mysqlclient或将mysql_config添加到系统环境变量中，可以解决安装mysqlclient失败的问题。同时，还介绍了查看mysql安装路径和使配置文件生效的方法。 ... [详细]

蜡笔小新 2023-12-14 18:24:10
python
树莓派语音控制的配置方法和步骤

本文介绍了在树莓派上实现语音控制的配置方法和步骤。首先感谢博主Eoman的帮助，文章参考了他的内容。树莓派的配置需要通过sudo raspi-config进行，然后使用Eoman的控制方法，即安装wiringPi库并编写控制引脚的脚本。具体的安装步骤和脚本编写方法在文章中详细介绍。 ... [详细]

蜡笔小新 2023-12-12 03:02:49
python
树状笔记软件for linux,Ubuntu 14.04安装开源树状笔记管理软件 WikidPad 2.2

WikidPad是一款开源免费的wiki风格的树状笔记管理软件，类似于Notepad。基于Python，支持Windows、Mac、Linux等平台。W ... [详细]

蜡笔小新 2023-10-17 12:16:37
python
Python网络爬虫快速上手！零基础入门教程！

环境准备：事先安装好，pycharm打开File——Settings——Projext——ProjectInterpriter点击加号ÿ ... [详细]

蜡笔小新 2023-10-15 12:04:37
python
Thrift教程初级篇——RPC框架Thrift的安装环境变量配置与第一个实例

本文介绍了RPC框架Thrift的安装环境变量配置与第一个实例，讲解了RPC的概念以及如何解决跨语言、c++客户端、web服务端、远程调用等需求。Thrift开发方便上手快，性能和稳定性也不错，适合初学者学习和使用。 ... [详细]

蜡笔小新 2023-12-13 17:36:52
go
Ubuntu安装常用软件详细步骤

目录1.GoogleChrome浏览器2.搜狗拼音输入法3.Pycharm4.Clion5.其他软件1.GoogleChrome浏览器通过直接下载安装GoogleChro ... [详细]

蜡笔小新 2023-12-12 21:26:41
go
CEPH LIO iSCSI Gateway及其使用参考文档

本文介绍了CEPH LIO iSCSI Gateway以及使用该网关的参考文档，包括Ceph Block Device、CEPH ISCSI GATEWAY、USING AN ISCSI GATEWAY等。同时提供了多个参考链接，详细介绍了CEPH LIO iSCSI Gateway的配置和使用方法。 ... [详细]

蜡笔小新 2023-12-12 10:10:14
python
Python中如何隐藏密码输入

本文介绍了在Python中使用getpass模块隐藏密码输入的方法，以保护用户的密码不被其他人员看到。同时还提到了在PyCharm中运行该命令无效的问题，需要在terminal中运行。 ... [详细]

蜡笔小新 2023-12-11 13:46:19
python
零基础用Python打造Android字符串资源翻译器（五）：增加图形化界面

目录 ... [详细]

蜡笔小新 2023-10-17 16:25:44
python
【爬虫训练场】：分页爬虫案例设计Demo，Python Flask与MySQL的完美连接

网站类应用，一定离不开MySQL，所以本案例将带着大家学习一下，通过Flask调用MySQL数据，并实现分页呈现。类被称作蓝图，它是一个存储操作方法的容器，Flask可以通过Blu ... [详细]

蜡笔小新 2023-10-17 16:00:33
python
与.Net大师Jeffrey Richter面对面交流——TUP对话大师系列活动回顾（多图配详细文字）...

与.Net大师JeffreyRichter面对面交流——TUP对话大师系列活动回顾（多图配文字）上周末很有幸参加了CSDN举行的TUP活动， ... [详细]

蜡笔小新 2023-10-17 08:39:50
python
让你明白kvm是什么

参考：https:blog.csdn.netbbwangjarticledetails80465320KVM工具集合：libvirt：操作和管理KVM虚机的虚拟化API ... [详细]

蜡笔小新 2023-10-16 03:47:56
python
1.《Python程序设计基础与应用》第1章 Python概述

第1章Python概述1.1Python语言简介（1）Python是一门跨平台、开源、免费的解释型高级动态编程语言。（2࿰ ... [详细]

蜡笔小新 2023-10-15 18:43:04
python
scrapy和scrapy_redis入门

Scarp框架需求获取网页的url下载网页内容(Downloader下载器)定位元素位置,获取特定的信息(Spiders蜘蛛)存储信息(ItemPipeline,一条一条从管里走) ... [详细]

蜡笔小新 2023-10-15 10:13:53
python
用Python手把手教你搭建一个web框架-flask微框架！

在之前的文章当中，小编已经教过大家怎么搭建一个Django框架，今天我们来探索另外的一种框架的搭建，这个框架就是web框架-flask微框架啦！首先我们带着以下的几个问题来阅读本文：1、flask ... [详细]

蜡笔小新 2023-10-15 09:39:27

虎爷2602900775

这个家伙很懒，什么也没留下！

Tags | 热门标签

RankList | 热门文章