首页技术博客 PHP教程数据库技术前端开发 HTML5 Nginx php论坛

新用户注册 | 会员登录

热门标签 | HotTags

当前位置: 开发笔记 > 编程语言 > 正文

HadoopHDFS（二）

作者：小雨闹不住 | 来源：互联网 | 2023-10-11 14:50

微信公众号：码农小胡HadoopHDFS（二）NAMENODE工作机制NAMENODE职责：（1）

微信公众号&＃xff1a;码农小胡

Hadoop HDFS&＃xff08;二&＃xff09;

NAMENODE工作机制

NAMENODE职责&＃xff1a;

&＃xff08;1&＃xff09;负责客户端请求的响应。 &＃xff08;2&＃xff09;元数据的管理&＃xff0c;查询&＃xff0c;修改。

元数据管理&＃xff1a;

namenode对数据的管理采用了三种形式&＃xff1a; 内存元数据磁盘元数据镜像文件数据操作日志文件

元数据存储机制

1&＃xff09;、内存中有一份完整的元数据

2&＃xff09;、磁盘中有一个“准完整”的元数据镜像

3&＃xff09;、用于衔接内存metadata和持久化元数据镜像fsimage之间的操作日志

checkpoint的详细过程

1、更新内存。

2、secondarynamenode请求是否需要checkpoint&＃xff0c;如果满足条件&＃xff0c;checkpoint。

3、namnode滚动&＃xff0c;当前正在写的edits。

4、下载操作的文件到secondarynamenode。

5、加载到内存中并合并数据。

6、dump成新的image文件。

7、上传到namenode中。

8、重命名成fsimage文件。

&＃xff08; 附带作用&＃xff1a;namenode和secondary namenode的工作目录存储结构完全相同&＃xff0c;所以&＃xff0c;当namenode故障退出需要重新恢复的时候&＃xff0c;可以从secondary namenode的工作目录中将fsimage拷贝到namenode的工作目录&＃xff0c;以恢复namenode的元数据 &＃xff09;

DATANODE工作机制

工作职责&＃xff1a;

存储用户的文件块数据

定期向namenode汇报自身所持有的block信息

datanode掉线判断时限参数

datanode进程死亡或者网络故障造成datanode无法与namenode通信&＃xff0c;namenode不会立即把该节点判定死亡&＃xff0c;要经过一段时间&＃xff0c;这段时间暂称操作时长&＃xff0c;HDFS默认的超时时长为10分钟&＃43;30秒

HDFS JAVA 操作直接放代码到GitHub上面了

GitHub地址

推荐阅读

git
HDFS基础知识与数据读写机制详解

本文详细介绍了HDFS的基础知识及其数据读写机制。首先，文章阐述了HDFS的架构，包括其核心组件及其角色和功能。特别地，对NameNode进行了深入解析，指出其主要负责在内存中存储元数据、目录结构以及文件块的映射关系，并通过持久化方案确保数据的可靠性和高可用性。此外，还探讨了DataNode的角色及其在数据存储和读取过程中的关键作用。 ... [详细]

蜡笔小新 2024-10-30 11:58:25
java
HBase在金融大数据迁移中的应用与挑战

随着最后一台设备的下线，标志着超过10PB的HBase数据迁移项目顺利完成。目前，新的集群已在新机房稳定运行超过两个月，监控数据显示，新集群的查询响应时间显著降低，系统稳定性大幅提升。此外，数据消费的波动也变得更加平滑，整体性能得到了显著优化。 ... [详细]

蜡笔小新 2024-10-31 14:06:06
stream
技术日志：深入探讨Spark Streaming与Spark SQL的融合应用

技术日志：深入探讨Spark Streaming与Spark SQL的融合应用 ... [详细]

蜡笔小新 2024-10-30 14:20:53
java
修复一个 Bug 竟耗时两天？真的有那么复杂吗？

修复一个 Bug 竟然耗费了两天时间？这背后究竟隐藏着怎样的复杂性？本文将深入探讨这个看似简单的 Bug 为何会如此棘手，从代码层面剖析问题根源，并分享解决过程中遇到的技术挑战和心得。 ... [详细]

蜡笔小新 2024-10-30 13:58:14
java
提升工作效率：掌握这些技巧，IDEA 使用效率翻倍 | IDEA 高效操作指南

提升工作效率：掌握这些技巧，IDEA 使用效率翻倍 | IDEA 高效操作指南 ... [详细]

蜡笔小新 2024-10-29 19:14:04
install
在Python 3环境中实现离线模块安装的方法与技巧

在Python 3环境中，当无法连接互联网时，可以通过下载离线模块包来实现模块的安装。具体步骤包括：首先从PyPI网站下载所需的模块包，然后将其传输到目标环境，并使用`pip install`命令进行本地安装。此方法不仅适用于单个模块，还支持依赖项的批量安装，确保开发环境的完整性和一致性。 ... [详细]

蜡笔小新 2024-10-28 15:57:25
callback
为何Serverless将成为未来十年的主导技术领域？

为何Serverless将成为未来十年的主导技术领域？ ... [详细]

蜡笔小新 2024-10-28 09:23:05
utf-8
如何在微信公众平台构建新浪云服务应用程序

如何在微信公众平台集成新浪云服务应用摘要：新浪云服务平台SinaAppEngine（简称SAE）自2009年启动内部研发，并于同年对外开放。本文详细介绍了如何利用SAE的强大功能，在微信公众平台上构建高效、稳定的云服务应用程序，涵盖从环境配置到应用部署的全流程，为开发者提供详尽的技术指导与实践案例。 ... [详细]

蜡笔小新 2024-10-26 19:45:54
config
org.codehaus.enunciate.config.EnunciateConfiguration.getDefaultRestSubcontext()方法的使用及代码示例

本文整理了Java中org.codehaus.enunciate.config.EnunciateConfiguration.getDefaultRestSubcontext() ... [详细]

蜡笔小新 2024-10-19 10:41:58
java
FileBeat + Flume + Kafka + HDFS + Neo4j + SparkStreaming + MySQL：【案例】三度关系推荐V1.0版本11：每周一计算最近一月主播视频评级

一、数据计算步骤汇总下面我们通过文字梳理一下具体的数据计算步骤。第一步：历史粉丝关注数据初始化第二步：实时维护粉丝关注数据第三步：每天定 ... [详细]

蜡笔小新 2024-10-17 15:50:44
export
安装hadoop2.9.2jdk1.8centos7

安装JDK1.8查看JDK1.8的安装https:www.cnblogs.comTJ21p13208514.html安装hadoop上传hadoop下载hadoop地址http:m ... [详细]

蜡笔小新 2024-10-16 12:02:42
export
【原创】七、Hadoop 2.5.2+zookeeper高可用部署

一、原理（四大要点）（1）保证元数据一致（edits）namenode（fsimage edits）a、NFSb、journalnodec、zk（2）只有一台namenode对外提 ... [详细]

蜡笔小新 2024-10-15 12:25:58
java
hadoop3.1.2 first programdefault wordcount (Mac)

hadoop3.1.2安装完成后的第一个实操示例程 ... [详细]

蜡笔小新 2024-10-15 11:11:55
stream
ImageSharp源码详解之JPEG编码原理（1）JPEG介绍

最近在看GitHub上的一个很火的项目是：ImageSharp。这是一个纯.netcore的图像处理库，没有使用其他的任何依赖。在看这个项目过程中激发了我对图像文件编码解码的兴趣。 ... [详细]

蜡笔小新 2024-10-14 20:34:45
stream
Hadoop——实验七：MapReduce编程实践

文章目录一.实验目的二.实验内容三.实验步骤及结果分析 1.基于ubuntukylin14.04(7)版本，安装hadoop-eclipse-kepler-plugi ... [详细]

蜡笔小新 2024-10-14 18:07:40

小雨闹不住

这个家伙很懒，什么也没留下！

Tags | 热门标签

RankList | 热门文章

PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved |

京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区版权所有