热门标签 | HotTags
当前位置:  开发笔记 > 后端 > 正文

Hadoop的体系结构简介

主题:Hadoop的体系结构详解(重点)注意:大数据的一些组件的结构基本上都是主从式的结构一、Hadoop的分布式文件存储

主题:Hadoop的体系结构详解(重点)


注意:大数据的一些组件的结构基本上都是主从式的结构

一、Hadoop的分布式文件存储系统HDFS的体系结构

HDFS的体系结构图:

HDFS的伪分布环境下的结构:

    

HDFS体系结构包括:

    (1)、NameNode 名称节点

                作用:

                        (*)维护管理HDFS

                        (*)接收客户端的请求:上传、下载、创建目录、查看等;

                        (*)维护了两个重要核心文件:EditLog,FsImage

                                    a、EditLog 代表的是HDFS的操作日志文件

                                         (*) 操作日志文件位置信息:/tmp/dfs/name/current/

                                         

                                         (*)日志都是二进制格式 ,edit viewer  将二进制文件转换成xml格式的数据格式

                                                  hdfs oev -i    edits_inprogress_0000000000000000128  -o ~/edit_inprogress.xml 

                                               

                                        (*)、EditLog记录了操作HDFS的行为信息

                                    b、FsImage 代表的是HDFS的元信息文件

                                        (*)位置:/tmp/dfs/name/current/                                                                                                                                                      

                                         (*)二进制文件,image viewer,将二进制转换成可读的文本或xml格式的数据

                                                 hdfs oiv -i fsimage_0000000000000000127 -o ~/fsimage.xml -p XML

                                                  

                                         (*)记录了数据块的位置信息、数据块的冗余信息等

    (2)、DataNode   数据节点 

                作用:用于保存数据块及将数据块进行水平复制,达到Hadoop数据块冗余度的要求

                (*)hadoop 1.x版本的数据块大小 64M hadoop2.x以上的数据块大小 128M

                (*)位置:进入到hadoop的安装路径下/training/hadoop-2.7.3/tmp/dfs/data/current/BP-2021293766-192.168.215.163-1551103164079/current/finalized/subdir0/subdir0

                (*)案例:

                            上传一个文件,看看会不会对文件进行切割

                   

    (3)、SecondaryNameNode    第二名称节点

                作用:将edit的最新信息合并到fsimage文件中,目的是减少集群的启动时间

                (*)位置:一般会与NameNode在一起,处于效率的角度考虑

                (*)合并过程,画图说明:

                            

                   (*)检查点什么时候发生:

                             默认:(1)时间达到60分钟时发生

                                       (2)edit日志文化大小达到64M时发生

    

二、Hadoop的分布式资源协调框架Yarn的体系结构

    (1)、ResourceManager  资源管理器

    (2)、NodeManager      节点管理器

三、Hadoop的分布式数据库HBase的体系结构

    (1)、HMaster   主节点

    (2)、ReginServer 从节点


推荐阅读
  • 基于layUI的图片上传前预览功能的2种实现方式
    本文介绍了基于layUI的图片上传前预览功能的两种实现方式:一种是使用blob+FileReader,另一种是使用layUI自带的参数。通过选择文件后点击文件名,在页面中间弹窗内预览图片。其中,layUI自带的参数实现了图片预览功能。该功能依赖于layUI的上传模块,并使用了blob和FileReader来读取本地文件并获取图像的base64编码。点击文件名时会执行See()函数。摘要长度为169字。 ... [详细]
  • 本文介绍了Java工具类库Hutool,该工具包封装了对文件、流、加密解密、转码、正则、线程、XML等JDK方法的封装,并提供了各种Util工具类。同时,还介绍了Hutool的组件,包括动态代理、布隆过滤、缓存、定时任务等功能。该工具包可以简化Java代码,提高开发效率。 ... [详细]
  • 图解redis的持久化存储机制RDB和AOF的原理和优缺点
    本文通过图解的方式介绍了redis的持久化存储机制RDB和AOF的原理和优缺点。RDB是将redis内存中的数据保存为快照文件,恢复速度较快但不支持拉链式快照。AOF是将操作日志保存到磁盘,实时存储数据但恢复速度较慢。文章详细分析了两种机制的优缺点,帮助读者更好地理解redis的持久化存储策略。 ... [详细]
  • 本文介绍了高校天文共享平台的开发过程中的思考和规划。该平台旨在为高校学生提供天象预报、科普知识、观测活动、图片分享等功能。文章分析了项目的技术栈选择、网站前端布局、业务流程、数据库结构等方面,并总结了项目存在的问题,如前后端未分离、代码混乱等。作者表示希望通过记录和规划,能够理清思路,进一步完善该平台。 ... [详细]
  • 本文介绍了sqlserver云存储和本地存储的区别,云存储是将数据存储在网络上,方便查看和调用;本地存储是将数据存储在电脑磁盘上,只能在存储的电脑上查看。同时提供了几种启动sqlserver的方法。此外,还介绍了如何导出数据库的步骤和工具。 ... [详细]
  • 本文介绍了如何使用php限制数据库插入的条数并显示每次插入数据库之间的数据数目,以及避免重复提交的方法。同时还介绍了如何限制某一个数据库用户的并发连接数,以及设置数据库的连接数和连接超时时间的方法。最后提供了一些关于浏览器在线用户数和数据库连接数量比例的参考值。 ... [详细]
  • 本文讲述了如何通过代码在Android中更改Recycler视图项的背景颜色。通过在onBindViewHolder方法中设置条件判断,可以实现根据条件改变背景颜色的效果。同时,还介绍了如何修改底部边框颜色以及提供了RecyclerView Fragment layout.xml和项目布局文件的示例代码。 ... [详细]
  • 在说Hibernate映射前,我们先来了解下对象关系映射ORM。ORM的实现思想就是将关系数据库中表的数据映射成对象,以对象的形式展现。这样开发人员就可以把对数据库的操作转化为对 ... [详细]
  • 本文详细介绍了MysqlDump和mysqldump进行全库备份的相关知识,包括备份命令的使用方法、my.cnf配置文件的设置、binlog日志的位置指定、增量恢复的方式以及适用于innodb引擎和myisam引擎的备份方法。对于需要进行数据库备份的用户来说,本文提供了一些有价值的参考内容。 ... [详细]
  • eclipse学习(第三章:ssh中的Hibernate)——11.Hibernate的缓存(2级缓存,get和load)
    本文介绍了eclipse学习中的第三章内容,主要讲解了ssh中的Hibernate的缓存,包括2级缓存和get方法、load方法的区别。文章还涉及了项目实践和相关知识点的讲解。 ... [详细]
  • 本文介绍了在Vue项目中如何结合Element UI解决连续上传多张图片及图片编辑的问题。作者强调了在编码前要明确需求和所需要的结果,并详细描述了自己的代码实现过程。 ... [详细]
  • 如何在服务器主机上实现文件共享的方法和工具
    本文介绍了在服务器主机上实现文件共享的方法和工具,包括Linux主机和Windows主机的文件传输方式,Web运维和FTP/SFTP客户端运维两种方式,以及使用WinSCP工具将文件上传至Linux云服务器的操作方法。此外,还介绍了在迁移过程中需要安装迁移Agent并输入目的端服务器所在华为云的AK/SK,以及主机迁移服务会收集的源端服务器信息。 ... [详细]
  • 集成电路企业在进行跨隔离网数据交换时面临着安全性问题,传统的数据交换方式存在安全性堪忧、效率低下等问题。本文以《Ftrans跨网文件安全交换系统》为例,介绍了如何通过丰富的审批流程来满足企业的合规要求,保障数据交换的安全性。 ... [详细]
  • 阿里云虚拟主机安装多个织梦系统的方法
    本文介绍了在阿里云虚拟主机上安装多个织梦系统的方法。通过创建不同名称的文件夹并将不同的域名解析到对应的目录,可以实现多个系统的安装。在安装过程中需要注意修改数据库前缀,并在系统设置中还原数据库。同时还介绍了阿里云虚拟主机二级域名绑定二级目录和域名重定向的用法。 ... [详细]
  • 在Oracle11g以前版本中的的DataGuard物理备用数据库,可以以只读的方式打开数据库,但此时MediaRecovery利用日志进行数据同步的过 ... [详细]
author-avatar
苦蔷薇1988
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有