大数据入门HDFS数据读写机制

美丽时装
彩妆资讯
历史明星
乐活安卓
数码常识
驾车健康
苹果问答
网络发型
电视车载
室内电影
游戏科学
音乐整形

　　作为Hadoop的分布式文件系统的HDFS，是Hadoop框架学习当中的重点内容，HDFS的设计初衷，是致力于存储超大文件，能够通过构建在普通PC设备上的集群环境，以较低成本完成大规模数据存储任务。今天的大数据入门分享，我们就主要来讲讲HDFS数据读写机制。
　　HDFS在数据存储上，具备高可靠性，提供容错机制，为整个Hadoop框架的数据处理提供了更稳固的底层支持。这其中，HDFS数据读写机制是发挥着重要的作用的。
　　HDFS相关的基本概念
　　块（block）
　　这是HDFS的基本思想，把大的文件分成块，每块64M。
　　备份（replicas）
　　热备份：b是a的热备份，如果a坏掉。那么b马上运行代替a的工作。
　　冷备份：b是a的冷备份，如果a坏掉。那么b不能马上代替a工作。但是b上存储a的一些信息，减少a坏掉之后的损失。
　　机架（rack）
　　由几个DataNode组成的部件称为机架。
　　MetaData
　　描述我们要存储数据的数据结构。
　　HDFSnamespace
　　这个命名空间指的是文件的目录结构，与我们单个电脑的文件的结构树相似。
　　EditLog
　　记录文件系统的metadata变化的事务日志，是HDFS的核心数据结构。例如，写入一个文件或修改复制因子都会向EditLog中写入一条record。
　　FsImage
　　整个文件系统的命名空间，包括block到文件的映射，文件系统的属性（大小，被分为几个block，只读，权限等信息），都被存储在一个文件中，这个文件就是FsImage。
　　HDFSnamespace，EditLog，FsImage都存储在NameNode上。
　　HeartBeat
　　NameNode和DataNode通过HeartBeat进行通信，每隔一定时间，DataNode就会向NameNode发送心跳信号，以此报告给NameNode，说我还活着，这样NameNode在接到读写任务时，会发命令给它。
　　HDFS如何分解文件
　　HDFS默认会将文件分割成block，64M为1个block，然后将block按键值对存储在HDFS上，并将键值对的映射存到内存中。每个文件默认会保存3份。
　　HDFS的基本架构，按照Master和Slave的结构，主要的组件包括：NameNode、SecondaryNameNode、DataNode。
　　NameNode：是Master节点，处理客户端的读、写请求；管理数据块映射；管理HDFS的名称空间；配置副本策略；
　　SecondaryNameNode：合并fsimage和fsedits，然后再发给namenode，尽量不要与NameNode部署在同一个host上，这样避免内存的过多消耗；NameNode的冷备份；
　　DataNode：Slave节点，干活的。负责存储client发来的数据块block，执行数据块的读写操作。HDFS读写机制
　　1、数据写入
　　客户端访问NameNode请求上传文件；
　　NameNode检查目标文件和目录是否已经存在；
　　NameNode响应客户端是否可以上传；
　　客户端请求NameNode文件块Block01上传服务位置；
　　NameNode响应返回3个DataNode节点；
　　客户端通过输入流建立DataNode01传输通道；
　　DataNode01调用DataNode02，DataNode02调用DataNode03，通信管道建立完成；
　　DataNode01、DataNode02、DataNode03逐级应答客户端。
　　客户端向DataNode01上传第一个文件块Block；
　　DataNode01接收后传给DataNode02，DataNode02传给DataNode03；
　　Block01传输完成之后，客户端再次请求NameNode上传第二个文件块。
　　2、数据读取
　　客户端通过向NameNode请求下载文件；
　　NameNode查询获取文件元数据并返回；
　　客户端通过元数据信息获取文件DataNode地址；
　　就近原则选择一台DataNode服务器，请求读取数据；
　　DataNode传输数据返回给客户端；
　　客户端以本地处理目标文件。
　　关于大数据入门，HDFS数据读写机制，以上就为大家做了简单的介绍了。在Hadoop框架当中，HDFS作为分布式文件系统，地位十分关键，而想要把HDFS学好学懂，还是需要多下功夫的。

内外兼修，朦胧透透的ROGPUGIOII烈刃2无线三模鼠标开废话在前：不是外设爱好者，个人日常基本也是一键一鼠，但并不是一鼠用到坏的那种人，添置替换的鼠标频率会比较高一些的，理由其实很简单，喜新厌旧和喜欢折腾，因为相对于其它的产品……特斯拉股价未来10年会大涨么？这3个原因，决定它的万亿美金市特斯拉的股票波动一直都很大，似乎没人知道未来会发生什么。但放远未来来看，这家新能源行业第一巨头，未来10年还会大幅上涨么？最近，来自EVANNEX网站的分析称，这可能取决于3个……5分钟轻松搞定一碗正宗印尼方便面，崔始源打call劲道鲜美没在深夜吃过方便面的人，不足以谈人生。虽然做法简单，但无数个深夜，充满魔性与诱惑的它，不仅能让你体验味蕾的刺激，更能慰藉饥饿的灵魂图片来自：《太阳的后裔》尤其……你以为洗头就是洗头发？英王室御用品牌超软按摩洗头刷当代人的烦恼，可以用两个字可以形容：脱！贫！脱发且贫穷，实在是太惨了！洗的勤，掉头发。洗的少，出油快。有时候早上洗，中午就油！一挠头皮，指甲缝里都是白泥！再一扒拉，……通络堂国药冷敷凝胶未经授用国药集团品牌，虚假宣传该由何人买单近年来，随着大健康行业的火爆，以冷敷凝胶类产品布局微商、新零售等市场的品牌越来越多。现如今，频频出现在大众朋友圈中的通络堂国药冷敷凝胶也已凭借其出众的功效而成为了备受经销商追捧……红鼎奖设计师评统帅冰箱好设计能激发创作灵感美具有相似性，设计领域亦具有设计审美共通性。不同设计领域相互触碰，也容易擦出设计创意新火花。11月2日，统帅冰箱与红鼎奖设计师梁莉莉交融合作就上演了设计创意荟的生动一课。统帅冰……GPU可能成为未来网络攻击的特洛伊木马显卡是用于游戏和创意工作的强大工具，但它也可能成为恶意软件的特洛伊木马。网络犯罪分子正在寻找利用显卡及其VRAM将恶意代码注入系统的方法。据称，黑客已经成功地在AMD、英特尔和……网络用语热词梗查询网站小鸡词典网站篇哈喽，各位小宝贝大家好，今天给小伙伴分享一个查网络流行语的网站，热门热词，查网络流行语，就上小鸡词典！小鸡词典是一本可自由编辑的网络词典，任何人都可以写下对一个词、一件事的定义……鸿蒙商标惹争议，一教育机构叫板华为？提到鸿蒙相信大家首先想到的就是华为的鸿蒙系统，如今鸿蒙系统已经可以在华为的一些手机上下载运行了，随着使用用户的增多，鸿蒙的知名度必将越来越广。但是我们今天要讲的不是鸿蒙系……侏儒北欧神话中的类人生物侏儒北欧地区写法：Dvergr单数Dvergar众数（儒威尔格）、Svartlfar（黑精灵）、Dkklfar（暗精灵）是许多奇幻作品中虚构生物矮人（Dwarf）的……特斯拉事故真相还原之深度分析与方法（独家答案）原标题：特斯拉事故如何才能真相大白？（独家答案）原创发表于芯媒，授权发布于此作者：Chritt日期：20210425自特斯拉公布安阳车主事故前一分钟的数……华为目前已有1200万台第三方产品支持鸿蒙系统一年过亿不难9月12日消息，在9月10日华为开发者大会上，华为消费者业务CEO余承东正式公布了鸿蒙OS2。0，同时鸿蒙系统也将正式开源。按照官方的表态，从9月10日起，鸿蒙OS将面向……

<<<<<<－>>>>>>

ZNDS众测高颜值的实力派Yolandamini体脂秤智能体序言篇现如今，智能市场上的产品可谓是日新月异了，而智能称可以说是健身爱好者的初级设备，也是最为实用性的设备。再此首先感谢Yolandamini体脂秤厂家和ZNDS对我的信……坦克500正式亮相，产品力的确很强，但定位是不是有点飘了？近段时间，长城旗下又有一款车在网上引起大量关注度，它便是定位高于坦克300的一款硬派越野SUV，关于这款车的诸多官图在网上被疯狂转载，包括很多媒体以及汽车爱好者对这款车都发表了……不惧卡脖子！小米成功进入工业4。0时代，但雷军的野心远不止于这几年，卡脖子的问题一直都是中国科技企业心中的痛，而半导体研发、芯片制造、智能化制造等领域是被卡脖子最严重的行业，所以中国企业在这些行业内每一次进步，都值得被关注和点赞。……解读联想新财年季报研发投入激增，高新业务开花，从做大到做强8月11日，联想集团发布了截至2021年6月30日的202122财年Q1财报。由于202122财年Q1财报是联想集团在2月份业务架构大调整之后的第一个完整季财报，同时又是……国产中型车能月销过万，13万左右就能买到，红旗H5的高光时刻虽说国产品牌在SUV市场已经很有话语权，但在轿车领域却没什么大的作为，依旧被合资品牌把控，首先国产中型车本就比较少，其次就是大部分国产品牌的影响力不足以支撑起中型车的价格，唯一……奥迪A5车主苦苦等待一天，最后被车窗膜的效果惊艳施工车型：奥迪A5车型颜色：旋风黑施工项目：威固全车隔热太阳膜车型介绍：奥迪A5拥有多达五种操控模式：高效、舒适、动感、自动和与选装MMI导航系统组合的……湘电能源科技与湖北高投新能源签署战略合作协议7月12日，湖南湘电能源工程科技有限公司董事长、总经理邹卫华与湖北高投新能源投资有限公司董事长、总经理胡立刚共同在战略合作协议上签字，标志着双方正式成为战略合作伙伴。协议……特斯拉在中国反应出道德与良知前段时间，网上对特斯拉电动车一片骂声，我了解一下，大概意思就是，一位女驾驶员，在一次外出途中，驾驶特斯拉电动车，发生交通事故，这位女士事后说是由于刹车出了问题，所以导致交通事故……Python其实很简单第二十一章DataFrame数据处理将Excel中的的数据读入数据框架DataFrame后，可以非常方便的进行各种数据处理。21。1列间求和求总分（总分语文数学英语）对于上一章所提到的学生成绩表……外国科学家助力中国科技真是激动人心啊，外国的科学家也跳槽到中国，中国科技或将屹立在世界之巅。究竟有哪些方面呢，一分钟讲清楚。1。微N米机器人。日本的微N机器人之父田闽南……gv300s和v霸250该如何选择？谢邀！我是骠骑府！资深摩托车媒体编辑，点击头像查阅更多精彩摩托车内容，欢迎关注！这是一位关注骠骑府的网友lanny0803发起的问题邀请。上图为KRGV300……6G要来了！？这些新材料将大有所为据了解，6G将可能使用太赫兹（THz）频段，其传输能力可能比5G提升100倍，网络延迟也可能从毫秒降到微秒级。具体到太赫兹（Terahertz，THz）本身来说，它是一个……

友情链接：易事利快生活快传网聚热点七猫云快好知快百科中准网快好找文好找中准网快软网