HDFS的故障恢复和高可用 _千锋教育

千锋教育-做有情怀、有良心、有品质的职业教育机构

手机站

千锋教育

千锋学习站 | 随时随地免费学

千锋教育

扫一扫进入千锋手机站

领取全套视频

千锋教育

关注千锋学习站小程序
随时随地免费学习课程

行业头条

大数据分析入门到就业要多久？ 查看详情>>

大数据软件开发的就业前景如何？ 查看详情>>

大数据目前就业前景怎么样？ 查看详情>>

大数据培训就业方向有哪些？ 查看详情>>

大数据分析就业高薪岗位介绍 查看详情>>

大数据分析编程就业方向如何？ 查看详情>>

女生学大数据分析就业前景好吗？ 查看详情>>

学习大数据编程好就业吗？ 查看详情>>

大数据分析就业前景及工资如何？ 查看详情>>

大数据有那些就业方向？ 查看详情>>

400-811-9990 全国咨询热线

首页视频教程培训课程师资团队技术干货常见问题面试题职场就业零基础学大数据行业资讯

【热点话题】大数据技术干货大数据学习教程大数据学习笔记大数据面试题大数据培训问答大数据培训机构哪些好大数据职场就业

当前位置：大数据培训 > 大数据学习教程 > HDFS的故障恢复和高可用

HDFS的故障恢复和高可用

来源：千锋教育

发布人：wjy

时间： 2022-12-09 15:41:00 1670571660

　　作为分布式文件系统的HDFS，在Hadoop技术生态当中，始终是不容忽视的。HDFS的稳定性和可靠性，对于后续的数据处理环节，提供底层支持，起着至关重要的作用。今天的大数据开发分享，我们就主要来讲讲HDFS的故障恢复和高可用。

　　

HDFS的故障恢复和高可用 1

　　HDFS的故障恢复和高可用，是确保数据存储稳定和高效的重要举措，要讲故障恢复和高可用，我们先要了解HDFS的存储运行流程。

　　HDFS存储运行流程

　　1、HDFS读取数据

　　

HDFS的故障恢复和高可用 2

　　步骤：

　　客户端调用FileStype对象的open()方法打开希望打开的文件;

　　DistributedFileSystem通过RPC调用NameNode来获取起始块的位置。NameNode返回的是含有该块副本的DataNode地址(DataNode与客户端的网络拓扑排序);

　　DistributedFileSystem返回一个FSDataInputStram对象给客户端并读取数据;

　　客户端调用read()方法从DataNode读取块;

　　一个数据块传输到客户端完毕后，寻找下个块的最佳DataNode;

　　所有块读取完毕后，FSDataInputStram调用close()方法，完成数据读取。

　　2、HDFS数据写入

　　

HDFS的故障恢复和高可用 3

　　步骤：

　　客户端通过对DistributedFileSystem调用create()方法来新建文件;

　　对NameNode创建一个RPC调用，在文件系统NameSpace中新建一个文件，此时NameNode会执行各种检查以确保文件不存在及客户端的创建权限;

　　检查通过，DistributedFileSystem向客户端返回一个FSDataOutputStream对象，负责DataNode和NameNode之间的通信。FSDataOutputStream将数据分成一个个的数据包并写入数据队列;

　　FSDataOutputStream向NameNode申请保存数据块的DataNode列表，假如副本数为3，3个DataNode构成一个数据管道，队列中的数据包会依次写入管道;

　　接收到数据包的DataNode需要向发送者发送“确认包”，“确认队列”逆流而上直到客户端收到应答，并将数据包从数据队列中删除;

　　客户端调用close()完成数据的写入。

　　HDFS的故障恢复和高可用

　　1、HDFS NameNode冷备份

　　NameNode运行期间，HDFS的所有更新操作都记录在EditLog中，久而久之EditLog文件将变得很大。当NameNode重启时，需要先将FsImage加载到内存，然后逐条执行EditLog中的记录。当EditLog变得巨大时，会导致NameNode启动非常慢，同时由于HDFS系统处于安全模式，无法提供对外写操作，影响用户的使用。

　　解决方案：Secondly NameNode-用于保存NameNode中对元数据的备份，减少NameNode的启动时间，一般单独运行在一台机器中。具体实现如下：

　　SecondlyNameNode定义和NameNode通信，请求其停止使用EditLog,并暂时将新的更新操作记录到edit.new文件;

　　SecondlyNameNode通过HTTP GET方式从NameNode下载FsImage和EditLog文件到本地;

　　SecondlyNameNode将FsImage加载到内存，并逐条执行EditLog的记录，使FsImage保持到最新;

　　SecondlyNameNode通过POST方式将新的FsImage发送到NameNode;

　　NameNode用新的FsImage替换掉旧的FsImage文件，并将edit.new替换为正式的EditLog，此时EditLog便完成了“瘦身”。

　　

HDFS的故障恢复和高可用 4

　　2、DataNode出错

　　每个DataNode定期向NameNode发送“心跳”汇报自己的健康状态;

　　当DataNode发生故障或者网络故障，NameNode无法接收DataNode的心跳，这些NataNode会标记为宕机，该节点的数据不可读;

　　DadaNode的失效会导致数据块的副本数小于最小冗余因子，NameNode会启动副本冗余复制，产生新的副本。

　　3、数据出错

　　网络原因和硬盘错误等因素会造成数据错误。

　　客户端读取到数据后，就采用MD5和SHA1算法对数据块进行校验，以确保读到正确的数据。

　　文件创建时，客户端会对每一个文件进行信息摘录并将信息存储到同一路径的隐藏文件里;客户端读取文件时，会先校验该信息文件与读取的文件，如果校验出错，便请求到另一DataNode读取数据，同时向NameNode汇报，以删除和复制这个数据块。

　　关于大数据开发，HDFS的故障恢复和高可用，以上就为大家做了简单的介绍了。HDFS作为Hadoop的核心组件之一，在学习阶段是需要重点掌握的，理论结合实操，才能真正掌握到家

　　注：本文部分文字和图片来源于网络，如有侵权，请联系删除。版权归原作者所有!此页面下方声明无效！

声明：本站稿件版权均属千锋教育所有，未经许可不得擅自转载。

上一篇

大数据开发：Flink on Yarn原理

下一篇

大数据开发：Hive小文件合并

猜你喜欢LIKE

大数据开发：基于Hadoop的数仓设计

大数据开发：基于Hadoop的数仓设计

Kafka工作原理入门

Kafka工作原理入门

Java大数据开发：Java基础类库和API

Java大数据开发：Java基础类库和API

Apache Kafka分布式流式系统

Apache Kafka分布式流式系统

最新文章NEW

HDFS文件管理系统简介

HDFS文件管理系统简介

HDFS架构演进之路

HDFS架构演进之路

大数据开发：Hive小文件合并

大数据开发：Hive小文件合并

HDFS的故障恢复和高可用

HDFS的故障恢复和高可用

相关推荐HOT

更多>>

HDFS架构演进之路

当active Namenode出现故障或者宕机的时候，standby会自动切换为新的active Namenode对外提供服务，并且HA对外提供了统一的访问名称，对于用户...详情>>

2022-12-09 15:44:00

大数据开发：Hive小文件合并

Hadoop生态技术体系下，负责大数据存储管理的组件，涉及到HDFS、Hive、Hbase等。Hive作为数据仓库工具，最初的存储还是落地到HDFS上，这其中就...详情>>

2022-12-09 15:42:00

HDFS的故障恢复和高可用

客户端读取文件时，会先校验该信息文件与读取的文件，如果校验出错，便请求到另一DataNode读取数据，同时向NameNode汇报，以删除和复制这个数据...详情>>

2022-12-09 15:41:00

大数据开发：Flink on Yarn原理

这个Container通过Application Master启动进程，Application Master里面运行的是Flink程序，即Flink-Yarn ResourceManager和JobManager。详情>>

2022-12-09 15:39:00

大数据开发基础：Java基础数据类型

在Java基础入门学习阶段，Java基础数据类型无疑是基础当中的重点，掌握基础数据类型，对于后续去理解和掌握更深入的理论，是有紧密的关联性的。...详情>>

2022-12-09 15:38:13

大数据培训问答 更多>>

大数据都学什么？5大核心知识必学内容有哪些

大数据报班多少钱？如何选择培训机构

人工智能学什么？自学可以成才吗

数据处理包括哪些内容？是不是所有课程需要分别报课

大数据分析需要学什么？怎么学比较好

人工智能专业学什么？人工智能有哪些课程

大数据数据分析师要学什么？好就业吗

大数据面试题库 更多>>

大数据的五个V是什么?

涨薪指数

数据及集群管理（三）

涨薪指数

数据及集群管理（二）

涨薪指数

大数据的五个V是什么?

数据及集群管理（三）

数据及集群管理（二）

数据及集群管理（一）

大数据之hbase的优化读数据方面

大数据之hbase的优化写入数据方面

大数据师资团队 更多>>

开班信息

北京校区

北京校区
大连校区
广州校区
成都校区
杭州校区
长沙校区
合肥校区
南京校区
上海校区
深圳校区
武汉校区
郑州校区
西安校区
青岛校区
重庆校区
太原校区
沈阳校区
南昌校区
哈尔滨校区

14天品质课程免费学

10年以上业内强师带你蜕变精英

提交领取