热门标签 | HotTags
当前位置:  开发笔记 > 后端 > 正文

Hadoop的体系结构简介

主题:Hadoop的体系结构详解(重点)注意:大数据的一些组件的结构基本上都是主从式的结构一、Hadoop的分布式文件存储

主题:Hadoop的体系结构详解(重点)


注意:大数据的一些组件的结构基本上都是主从式的结构

一、Hadoop的分布式文件存储系统HDFS的体系结构

HDFS的体系结构图:

HDFS的伪分布环境下的结构:

    

HDFS体系结构包括:

    (1)、NameNode 名称节点

                作用:

                        (*)维护管理HDFS

                        (*)接收客户端的请求:上传、下载、创建目录、查看等;

                        (*)维护了两个重要核心文件:EditLog,FsImage

                                    a、EditLog 代表的是HDFS的操作日志文件

                                         (*) 操作日志文件位置信息:/tmp/dfs/name/current/

                                         

                                         (*)日志都是二进制格式 ,edit viewer  将二进制文件转换成xml格式的数据格式

                                                  hdfs oev -i    edits_inprogress_0000000000000000128  -o ~/edit_inprogress.xml 

                                               

                                        (*)、EditLog记录了操作HDFS的行为信息

                                    b、FsImage 代表的是HDFS的元信息文件

                                        (*)位置:/tmp/dfs/name/current/                                                                                                                                                      

                                         (*)二进制文件,image viewer,将二进制转换成可读的文本或xml格式的数据

                                                 hdfs oiv -i fsimage_0000000000000000127 -o ~/fsimage.xml -p XML

                                                  

                                         (*)记录了数据块的位置信息、数据块的冗余信息等

    (2)、DataNode   数据节点 

                作用:用于保存数据块及将数据块进行水平复制,达到Hadoop数据块冗余度的要求

                (*)hadoop 1.x版本的数据块大小 64M hadoop2.x以上的数据块大小 128M

                (*)位置:进入到hadoop的安装路径下/training/hadoop-2.7.3/tmp/dfs/data/current/BP-2021293766-192.168.215.163-1551103164079/current/finalized/subdir0/subdir0

                (*)案例:

                            上传一个文件,看看会不会对文件进行切割

                   

    (3)、SecondaryNameNode    第二名称节点

                作用:将edit的最新信息合并到fsimage文件中,目的是减少集群的启动时间

                (*)位置:一般会与NameNode在一起,处于效率的角度考虑

                (*)合并过程,画图说明:

                            

                   (*)检查点什么时候发生:

                             默认:(1)时间达到60分钟时发生

                                       (2)edit日志文化大小达到64M时发生

    

二、Hadoop的分布式资源协调框架Yarn的体系结构

    (1)、ResourceManager  资源管理器

    (2)、NodeManager      节点管理器

三、Hadoop的分布式数据库HBase的体系结构

    (1)、HMaster   主节点

    (2)、ReginServer 从节点


推荐阅读
  • Hadoop之Yarn
    目录1Hadoop1.x和Hadoop2.x架构区别2Yarn概述3Yarn基本架构4Yarn工作机制5作业提交全过程6资源调度器7任务的推测执行1Hadoop1.x和Hadoo ... [详细]
  • t-io 2.0.0发布-法网天眼第一版的回顾和更新说明
    本文回顾了t-io 1.x版本的工程结构和性能数据,并介绍了t-io在码云上的成绩和用户反馈。同时,还提到了@openSeLi同学发布的t-io 30W长连接并发压力测试报告。最后,详细介绍了t-io 2.0.0版本的更新内容,包括更简洁的使用方式和内置的httpsession功能。 ... [详细]
  • Hadoop2.6.0 + 云centos +伪分布式只谈部署
    3.0.3玩不好,现将2.6.0tar.gz上传到usr,chmod-Rhadoop:hadophadoop-2.6.0,rm掉3.0.32.在etcp ... [详细]
  •        在搭建Hadoop环境之前,请先阅读如下博文,把搭建Hadoop环境之前的准备工作做好,博文如下:       1、CentOS6.7下安装JDK,地址:http:b ... [详细]
  • 本文介绍了使用kotlin实现动画效果的方法,包括上下移动、放大缩小、旋转等功能。通过代码示例演示了如何使用ObjectAnimator和AnimatorSet来实现动画效果,并提供了实现抖动效果的代码。同时还介绍了如何使用translationY和translationX来实现上下和左右移动的效果。最后还提供了一个anim_small.xml文件的代码示例,可以用来实现放大缩小的效果。 ... [详细]
  • Nginx使用(server参数配置)
    本文介绍了Nginx的使用,重点讲解了server参数配置,包括端口号、主机名、根目录等内容。同时,还介绍了Nginx的反向代理功能。 ... [详细]
  • 本文介绍了Java工具类库Hutool,该工具包封装了对文件、流、加密解密、转码、正则、线程、XML等JDK方法的封装,并提供了各种Util工具类。同时,还介绍了Hutool的组件,包括动态代理、布隆过滤、缓存、定时任务等功能。该工具包可以简化Java代码,提高开发效率。 ... [详细]
  • android listview OnItemClickListener失效原因
    最近在做listview时发现OnItemClickListener失效的问题,经过查找发现是因为button的原因。不仅listitem中存在button会影响OnItemClickListener事件的失效,还会导致单击后listview每个item的背景改变,使得item中的所有有关焦点的事件都失效。本文给出了一个范例来说明这种情况,并提供了解决方法。 ... [详细]
  • 本文讲述了如何通过代码在Android中更改Recycler视图项的背景颜色。通过在onBindViewHolder方法中设置条件判断,可以实现根据条件改变背景颜色的效果。同时,还介绍了如何修改底部边框颜色以及提供了RecyclerView Fragment layout.xml和项目布局文件的示例代码。 ... [详细]
  • 在说Hibernate映射前,我们先来了解下对象关系映射ORM。ORM的实现思想就是将关系数据库中表的数据映射成对象,以对象的形式展现。这样开发人员就可以把对数据库的操作转化为对 ... [详细]
  • 图解redis的持久化存储机制RDB和AOF的原理和优缺点
    本文通过图解的方式介绍了redis的持久化存储机制RDB和AOF的原理和优缺点。RDB是将redis内存中的数据保存为快照文件,恢复速度较快但不支持拉链式快照。AOF是将操作日志保存到磁盘,实时存储数据但恢复速度较慢。文章详细分析了两种机制的优缺点,帮助读者更好地理解redis的持久化存储策略。 ... [详细]
  • 欢乐的票圈重构之旅——RecyclerView的头尾布局增加
    项目重构的Git地址:https:github.comrazerdpFriendCircletreemain-dev项目同步更新的文集:http:www.jianshu.comno ... [详细]
  • ZooKeeper 学习
    前言相信大家对ZooKeeper应该不算陌生。但是你真的了解ZooKeeper是个什么东西吗?如果别人面试官让你给他讲讲ZooKeeper是个什么东西, ... [详细]
  • MapReduce 切片机制源码分析
     总体来说大概有以下2个大的步骤1.连接集群(yarnrunner或者是localjobrunner)2.submitter.submitJobInternal()在该方法中会创建 ... [详细]
  • SparkOnYarn在YARN上启动Spark应用有两种模式。在cluster模式下,Spark驱动器(driver)在YARNApp ... [详细]
author-avatar
苦蔷薇1988
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有