热门标签 | HotTags
当前位置:  开发笔记 > 编程语言 > 正文

sqoop导入数据到hdfs初始化

#!binbash###########################################SystemName:大数据智慧分析平台##Author:heguoxi


#!/bin/bash

##########################################
# System Name : 大数据智慧分析平台 #
# Author : heguoxiu #
# Description : sqoop导入数据到hdfs #
##########################################


#引用公共变量配置文件
source /qhapp/cdh//parse/opt/shell/public/public_db.cfg


#变量说明
#v_table="ec_sales_order_detail_0000"
v_columns="pay_jnl_no ,order_no ,channel ,channel_date ,channel_type ,sys_code ,um_no ,um_name ,product_code ,trans_action ,merchant_id ,merchant_name ,store_id ,pay_path_no ,trans_date ,app_id ,open_id ,currency ,trans_amt ,order_info ,pay_type ,req_url ,pay_status ,status_code ,status_msg ,created_by ,date_created ,updated_by ,date_updated ,channel_jnl_no ,pay_direction ,trans_acct_date ,summary ,rev_status ,check_status ,pmt_cmp_no"

v_key="trans_amt"


###补数据时间###
year=`date -d "-1 day 2017-03-03" +%Y`
mOnth=`date -d "-1 day 2017-03-03" +%Y%m`
day=`date -d "-1 day 2017-03-03" +%Y%m%d`
start_dt=`date -d "+0 day 2018-01-01" +%Y-%m-%d`
end_dt=`date -d "+0 day 2018-08-09" +%Y-%m-%d`

inc_dt="date_created"
where_cOndition="${inc_dt} >= '${start_dt}' AND ${inc_dt} <'${end_dt}'"


#把hive目标表对应的表目录赋值变量
hdfs_dir="/ods/ods_initdb/ods_initdb_ec_sales_pay_detail"
parse_path="/qhapp/cdh/parse/opt/shell/import/import_init"

hadoop fs -rmr ${hdfs_dir}/*

echo "ec_sales_pay_detail_0012
ec_sales_pay_detail_0013
ec_sales_pay_detail_0014
ec_sales_pay_detail_0015" |
while read line;do
echo $line | { eval $( awk -F "\n" '{print "v_table="$1}');

echo "###开始导入${v_table}: `date +"%Y-%m-%d %H:%M:%S"`"

sqoop import --connect ${v_host}:${v_port}${v_database} --username ${v_username} --password ${v_password} \
--query "select ${v_columns} from ${v_table} t WHERE \$CONDITIONS and ${where_condition} " \
--null-string '\\N' --null-non-string '\\N' --split-by ${v_key} -m 4 --fields-terminated-by "\001" --lines-terminated-by "\n" --append --target-dir ${hdfs_dir}

echo "###导入结束${v_table}: `date +"%Y-%m-%d %H:%M:%S"`"
}
done

hive -hivevar inc_dt=${inc_dt} -hivevar v_fm_tm=${start_dt} -hivevar v_to_tm=${end_dt} -f "${parse_path}/ods_initdb_ec_sales_pay_detail.sql"

 

 

 

sqoop import --connect jdbc:oracle:thin:@10.10.10.2:1521:orcl --username iecbi --password 123456 \
--query "select t.bi_value,t.catagory_id,t.bi_datetime from BI_TRADING_TRENDS_CATATORY t WHERE \$CONDITIONS " \
--null-string '\\N' --null-non-string '\\N' --split-by 'bi_value' -m 1 --fields-terminated-by "," --lines-terminated-by "\n" --delete-target-dir --target-dir /ML_DB/LINEAR_REGRESSION


推荐阅读
  • Python操作MySQL(pymysql模块)详解及示例代码
    本文介绍了使用Python操作MySQL数据库的方法,详细讲解了pymysql模块的安装和连接MySQL数据库的步骤,并提供了示例代码。内容涵盖了创建表、插入数据、查询数据等操作,帮助读者快速掌握Python操作MySQL的技巧。 ... [详细]
  • 本文介绍了数据库的存储结构及其重要性,强调了关系数据库范例中将逻辑存储与物理存储分开的必要性。通过逻辑结构和物理结构的分离,可以实现对物理存储的重新组织和数据库的迁移,而应用程序不会察觉到任何更改。文章还展示了Oracle数据库的逻辑结构和物理结构,并介绍了表空间的概念和作用。 ... [详细]
  • javascript  – 概述在Firefox上无法正常工作
    我试图提出一些自定义大纲,以达到一些Web可访问性建议.但我不能用Firefox制作.这就是它在Chrome上的外观:而那个图标实际上是一个锚点.在Firefox上,它只概述了整个 ... [详细]
  • 使用Ubuntu中的Python获取浏览器历史记录原文: ... [详细]
  • 本文讨论了一个关于cuowu类的问题,作者在使用cuowu类时遇到了错误提示和使用AdjustmentListener的问题。文章提供了16个解决方案,并给出了两个可能导致错误的原因。 ... [详细]
  • Oracle seg,V$TEMPSEG_USAGE与Oracle排序的关系及使用方法
    本文介绍了Oracle seg,V$TEMPSEG_USAGE与Oracle排序之间的关系,V$TEMPSEG_USAGE是V_$SORT_USAGE的同义词,通过查询dba_objects和dba_synonyms视图可以了解到它们的详细信息。同时,还探讨了V$TEMPSEG_USAGE的使用方法。 ... [详细]
  • 本文详细介绍了如何使用MySQL来显示SQL语句的执行时间,并通过MySQL Query Profiler获取CPU和内存使用量以及系统锁和表锁的时间。同时介绍了效能分析的三种方法:瓶颈分析、工作负载分析和基于比率的分析。 ... [详细]
  • WhenIusepythontoapplythepymysqlmoduletoaddafieldtoatableinthemysqldatabase,itdo ... [详细]
  • 在Oracle11g以前版本中的的DataGuard物理备用数据库,可以以只读的方式打开数据库,但此时MediaRecovery利用日志进行数据同步的过 ... [详细]
  • MySQL语句大全:创建、授权、查询、修改等【MySQL】的使用方法详解
    本文详细介绍了MySQL语句的使用方法,包括创建用户、授权、查询、修改等操作。通过连接MySQL数据库,可以使用命令创建用户,并指定该用户在哪个主机上可以登录。同时,还可以设置用户的登录密码。通过本文,您可以全面了解MySQL语句的使用方法。 ... [详细]
  • 解决.net项目中未注册“microsoft.ACE.oledb.12.0”提供程序的方法
    在开发.net项目中,通过microsoft.ACE.oledb读取excel文件信息时,报错“未在本地计算机上注册“microsoft.ACE.oledb.12.0”提供程序”。本文提供了解决这个问题的方法,包括错误描述和代码示例。通过注册提供程序和修改连接字符串,可以成功读取excel文件信息。 ... [详细]
  • 本文介绍了如何使用PHP代码将表格导出为UTF8格式的Excel文件。首先,需要连接到数据库并获取表格的列名。然后,设置文件名和文件指针,并将内容写入文件。最后,设置响应头部,将文件作为附件下载。 ... [详细]
  • 本文介绍了使用数据库管理员用户执行onstat -l命令来监控GBase8s数据库的物理日志和逻辑日志的使用情况,并强调了对已使用的逻辑日志是否及时备份的重要性。同时提供了监控方法和注意事项。 ... [详细]
  • 大数据Hadoop生态(20)MapReduce框架原理OutputFormat的开发笔记
    本文介绍了大数据Hadoop生态(20)MapReduce框架原理OutputFormat的开发笔记,包括outputFormat接口实现类、自定义outputFormat步骤和案例。案例中将包含nty的日志输出到nty.log文件,其他日志输出到other.log文件。同时提供了一些相关网址供参考。 ... [详细]
  • 本文介绍了在sqoop1.4.*版本中,如何实现自定义分隔符的方法及步骤。通过修改sqoop生成的java文件,并重新编译,可以满足实际开发中对分隔符的需求。具体步骤包括修改java文件中的一行代码,重新编译所需的hadoop包等。详细步骤和编译方法在本文中都有详细说明。 ... [详细]
author-avatar
零摄氏度玫瑰_460
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有