热门标签 | HotTags
当前位置:  开发笔记 > 编程语言 > 正文

Hadoop框架之HDFS的shell操作

既然HDFS是存取数据的分布式文件系统,那么对HDFS的操作,就是文件系统的基本操作,比如文件的创建、修改、删除、修改权限等,文件夹的创建、删除、重命名等。对HDFS的操作命令类似于Linux的she

既然HDFS是存取数据的分布式文件系统,那么对HDFS的操作,就是文件系统的基本操作,比如文件的创建、修改、删除、修改权限等,文件夹的创建、删除、重命名等。对HDFS的操作命令类似于Linux的shell对文件的操作,如ls、mkdir、rm等。

我们执行以下操作的时候,一定要确定hadoop是正常运行的,使用jps命令确保看到各个hadoop进程。

我们执行命令hadoop fs,如图4-1所示。

图4-1

图中显示了很多命令选项信息。以上截图不全,我在表格4-1中完整地列出了支持的命令选项。

选项名称

使用格式

含义

-ls

-ls <路径>

查看指定路径的当前目录结构

-lsr

-lsr <路径>

递归查看指定路径的目录结构

-du

-du <路径>

统计目录下个文件大小

-dus

-dus <路径>

汇总统计目录下文件(夹)大小

-count

-count [-q] <路径>

统计文件(夹)数量

-mv

-mv <源路径> <目的路径>

移动

-cp

-cp <源路径> <目的路径>

复制

-rm

-rm [-skipTrash] <路径>

删除文件/空白文件夹

-rmr

-rmr [-skipTrash] <路径>

递归删除

-put

-put <多个linux上的文件>

上传文件

-copyFromLocal

-copyFromLocal <多个linux上的文件>

从本地复制

-moveFromLocal

-moveFromLocal <多个linux上的文件>

从本地移动

-getmerge

-getmerge <源路径>

合并到本地

-cat

-cat

查看文件内容

-text

-text

查看文件内容

-copyToLocal

-copyToLocal [-ignoreCrc] [-crc] [hdfs源路径] [linux目的路径]

从本地复制

-moveToLocal

-moveToLocal [-crc]

从本地移动

-mkdir

-mkdir

创建空白文件夹

-setrep

-setrep [-R] [-w] <副本数> <路径>

修改副本数量

-touchz

-touchz <文件路径>

创建空白文件

-stat

-stat [format] <路径>

显示文件统计信息

-tail

-tail [-f] <文件>

查看文件尾部信息

-chmod

-chmod [-R] <权限模式> [路径]

修改权限

-chown

-chown [-R] [属主][:[属组]] 路径

修改属主

-chgrp

-chgrp [-R] 属组名称 路径

修改属组

-help

-help [命令选项]

帮助

注意:以上表格中路径包括hdfs中的路径和linux中的路径。对于容易产生歧义的地方,会特别指出“linux路径”或者“hdfs路径”。如果没有明确指出,意味着是hdfs路径。

下面我们讲述每个命令选项的用法。

-ls 显示当前目录结构

该命令选项表示查看指定路径的当前目录结构,后面跟hdfs路径,如图4-1所示。

 

图4-1

上图中的路径是hdfs根目录,显示的内容格式与linux的命令ls –l显示的内容格式非常相似,下面解析每一行的内容格式:

l 首字母表示文件夹(如果是“d”)还是文件(如果是“-”);

l 后面的9位字符表示权限;

l 后面的数字或者“-”表示副本数。如果是文件,使用数字表示副本数;文件夹没有副本;

l 后面的“root”表示属主;

l 后面的“supergroup”表示属组;

l 后面的“0”、“6176”、“37645”表示文件大小,单位是字节;

l 后面的时间表示修改时间,格式是年月日时分;

l 最后一项表示文件路径。

可见根目录下面有四个文件夹、两个文件。

如果该命令选项后面没有路径,那么就会访问/user/<当前用户>目录。我们使用root用户登录,因此会访问hdfs的/user/root目录,如图4-2所示。

 

图4-2

如果没有这个目录/user/root,会提示文件不存在的错误。

-lsr 递归显示目录结构

该命令选项表示递归显示当前路径的目录结构,后面跟hdfs路径。如图4-3所示。

 

图4-3

显示/user目录下有个root目录,root目录下有文件abc。

-du 统计目录下各文件大小

该命令选项显示指定路径下的文件大小,单位是字节,如图4-4所示。

 

图4-4

-dus 汇总统计目录下文件大小

该命令选项显示指定路径的文件大小,单位是字节,如图4-5所示。

 

图4-5

请读者比较图4-4与图4-5的区别,体会两个命令选项的不同含义。

-count 统计文件(夹)数量

该命令选项显示指定路径下的文件夹数量、文件数量、文件总大小信息,如图4-6所示。

 

图4-6

在图4-6中有两条命令,下面的命令是为了佐证上面命令的正确性的。

-mv 移动

该命令选项表示移动hdfs的文件到指定的hdfs目录中。后面跟两个路径,第一个表示源文件,第二个表示目的目录,如图4-7所示。

 

图4-7

在图4-7中有三条命令,是为了体现移动前后的变化情况。

-cp 复制

该命令选项表示复制hdfs指定的文件到指定的hdfs目录中。后面跟两个路径,第一个是被复制的文件,第二个是目的地,如图4-8所示。

 

图4-8

在图4-8中有三条命令,是为了体现复制前后的变化情况。

-rm 删除文件/空白文件夹

该命令选项表示删除指定的文件或者空目录,如图4-9所示。

 

图4-9

在图4-9中,前三条命令是为了体现执行前后的变化情况。第四条命令是删除非空的“/user/root”目录,操作失败,表明不能删除非空目录。

-rmr 递归删除

该命令选项表示递归删除指定目录下的所有子目录和文件,如图4-10所示。

 

图4-10

-put 上传文件

该命令选项表示把linux上的文件复制到hdfs中,如图4-11所示。

 

图4-11

-copyFromLocal 从本地复制

操作与-put一致,不再举例。

-moveFromLocal 从本地移动

该命令表示把文件从linux上移动到hdfs中,如图4-12所示。

 

图4-12

-getmerge 合并到本地

该命令选项的含义是把hdfs指定目录下的所有文件内容合并到本地linux的文件中,如图4-13所示。

图4-13

-cat 查看文件内容

该命令选项是查看文件内容,如图4-14所示。

 

图4-14

-text 查看文件内容

该命令选项可以认为作用和用法与-cat相同,此处略。

-mkdir 创建空白文件夹

该命令选项表示创建文件夹,后面跟的路径是在hdfs将要创建的文件夹,如图4-15所示。

 

图4-15

-setrep 设置副本数量

该命令选项是修改已保存文件的副本数量,后面跟副本数量,再跟文件路径,如图4-16所示。

 

图4-16

在图4-16中,我们修改了文件/install.log的副本数,由1修改为2,意味着多了一个副本,HDFS会自动执行文件的复制工作,产生新的副本。

如果最后的路径表示文件夹,那么需要跟选项-R,表示对文件夹中的所有文件都修改副本,如图4-17所示。

图4-17

在图4-17中,我们对/user文件夹进行的操作,使用了选项-R,那么/user/root下的文件abc的副本数发生了改变。

还有一个选项是-w,表示等待副本操作结束才退出命令,如图4-18所示。

 

图4-18

请读者自己比较以上两图中使用-q前后执行结果的变化情况。

-touchz 创建空白文件

该命令选项是在hdfs中创建空白文件,如图4-19所示。

 

图4-19

-stat 显示文件的统计信息

该命令选项显示文件的一些统计信息,如图4-20所示。

 

图4-20

在图4-20中,命令选项后面可以有格式,使用引号表示。示例中的格式“%b %n %o %r %Y”依次表示文件大小、文件名称、块大小、副本数、访问时间。

-tail 查看文件尾部内容

该命令选项显示文件最后1K字节的内容。一般用于查看日志。如果带有选项-f,那么当文件内容变化时,也会自动显示,如图4-21所示。

 

图4-21

-chmod 修改文件权限

该命令选项的使用类似于linux的shell中的chmod用法,作用是修改文件的权限,如图4-22所示。

 

图4-22

在图4-22中,修改了文件/emptyfile的权限。

如果加上选项-R,可以对文件夹中的所有文件修改权限,如图4-23所示。

图4-23

-chown 修改属主

该命令选项表示修改文件的属主,如图4-24所示。

 

图4-24

上图中把文件/emptyfile的属主由root修改为itcast。

也可以同时修改属组,如图4-25所示。

 

图4-25

在图4-25中,把文件/emptyfile的属主和属组都修改为itcast,如果只修改属组,可以使用“:itcast”。

如果带有选项-R,意味着可以递归修改文件夹中的所有文件的属主、属组信息。

-chgrp 修改属组

该命令的作用是修改文件的属组,该命令相当于“chown :属组”的用法,如图4-26所示。

 

图4-26

-help 帮助

该命令选项会显示帮助信息,后面跟上需要查询的命令选项即可,如图4-27所示。

 

图4-27

在图4-27中,查询的rm的用法。

该命令选项显示的内容并非完全准确,比如查询count的结果就不准确,而是把所有命令选项的用法都显示出来,如图4-28所示。希望新的版本以后改进。

 

图4-28

读者短时间无法掌握全部命令用法,请重点掌握ls(r)、rm(r)、mkdir、put、get的使用。

 -----------------------------------------------------------------------------

来源链接:https://wenku.baidu.com/view/3406704cf01dc281e53af0f8.html


推荐阅读
  • Hadoop2.6.0 + 云centos +伪分布式只谈部署
    3.0.3玩不好,现将2.6.0tar.gz上传到usr,chmod-Rhadoop:hadophadoop-2.6.0,rm掉3.0.32.在etcp ... [详细]
  • 向QTextEdit拖放文件的方法及实现步骤
    本文介绍了在使用QTextEdit时如何实现拖放文件的功能,包括相关的方法和实现步骤。通过重写dragEnterEvent和dropEvent函数,并结合QMimeData和QUrl等类,可以轻松实现向QTextEdit拖放文件的功能。详细的代码实现和说明可以参考本文提供的示例代码。 ... [详细]
  • Linux重启网络命令实例及关机和重启示例教程
    本文介绍了Linux系统中重启网络命令的实例,以及使用不同方式关机和重启系统的示例教程。包括使用图形界面和控制台访问系统的方法,以及使用shutdown命令进行系统关机和重启的句法和用法。 ... [详细]
  • Metasploit攻击渗透实践
    本文介绍了Metasploit攻击渗透实践的内容和要求,包括主动攻击、针对浏览器和客户端的攻击,以及成功应用辅助模块的实践过程。其中涉及使用Hydra在不知道密码的情况下攻击metsploit2靶机获取密码,以及攻击浏览器中的tomcat服务的具体步骤。同时还讲解了爆破密码的方法和设置攻击目标主机的相关参数。 ... [详细]
  • baresip android编译、运行教程1语音通话
    本文介绍了如何在安卓平台上编译和运行baresip android,包括下载相关的sdk和ndk,修改ndk路径和输出目录,以及创建一个c++的安卓工程并将目录考到cpp下。详细步骤可参考给出的链接和文档。 ... [详细]
  • 如何在服务器主机上实现文件共享的方法和工具
    本文介绍了在服务器主机上实现文件共享的方法和工具,包括Linux主机和Windows主机的文件传输方式,Web运维和FTP/SFTP客户端运维两种方式,以及使用WinSCP工具将文件上传至Linux云服务器的操作方法。此外,还介绍了在迁移过程中需要安装迁移Agent并输入目的端服务器所在华为云的AK/SK,以及主机迁移服务会收集的源端服务器信息。 ... [详细]
  • Linux如何安装Mongodb的详细步骤和注意事项
    本文介绍了Linux如何安装Mongodb的详细步骤和注意事项,同时介绍了Mongodb的特点和优势。Mongodb是一个开源的数据库,适用于各种规模的企业和各类应用程序。它具有灵活的数据模式和高性能的数据读写操作,能够提高企业的敏捷性和可扩展性。文章还提供了Mongodb的下载安装包地址。 ... [详细]
  • Go GUIlxn/walk 学习3.菜单栏和工具栏的具体实现
    本文介绍了使用Go语言的GUI库lxn/walk实现菜单栏和工具栏的具体方法,包括消息窗口的产生、文件放置动作响应和提示框的应用。部分代码来自上一篇博客和lxn/walk官方示例。文章提供了学习GUI开发的实际案例和代码示例。 ... [详细]
  • 解决github访问慢的问题的方法集锦
    本文总结了国内用户在访问github网站时可能遇到的加载慢的问题,并提供了解决方法,其中包括修改hosts文件来加速访问。 ... [详细]
  • 大数据Hadoop生态(20)MapReduce框架原理OutputFormat的开发笔记
    本文介绍了大数据Hadoop生态(20)MapReduce框架原理OutputFormat的开发笔记,包括outputFormat接口实现类、自定义outputFormat步骤和案例。案例中将包含nty的日志输出到nty.log文件,其他日志输出到other.log文件。同时提供了一些相关网址供参考。 ... [详细]
  •     这里使用自己编译的hadoop-2.7.0版本部署在windows上,记得几年前,部署hadoop需要借助于cygwin,还需要开启ssh服务,最近发现,原来不需要借助cy ... [详细]
  • 对于开源的东东,尤其是刚出来不久,我认为最好的学习方式就是能够看源代码和doc,測试它的样例为了方便查看源代码,关联导入源代 ... [详细]
  • MR程序的几种提交运行模式本地模型运行1在windows的eclipse里面直接运行main方法,就会将job提交给本地执行器localjobrunner执行-- ... [详细]
  • Voicewo在线语音识别转换jQuery插件的特点和示例
    本文介绍了一款名为Voicewo的在线语音识别转换jQuery插件,该插件具有快速、架构、风格、扩展和兼容等特点,适合在互联网应用中使用。同时还提供了一个快速示例供开发人员参考。 ... [详细]
  • WhenIusepythontoapplythepymysqlmoduletoaddafieldtoatableinthemysqldatabase,itdo ... [详细]
author-avatar
Quan
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有