HDFS源码（二）

张

张建站

2026/5/12 6:33:54

10分钟阅读

DataNode启动源码创建HttpServer初始化DataNode Rpc服务获取NameNode Rpc代理Datanode向NameNode注册DataNode与NameNode周期心跳及block块汇报数据上传源码创建文件系统及初始化DFSClient连接NN创建目录启动DataStreamer线程向dataQueue队列中写入packet设置副本写入策略源码protected Node chooseTargetInOrder(int numOfReplicas, Node writer, final SetNode excludedNodes, final long blocksize, final int maxNodesPerRack, final ListDatanodeStorageInfo results, final boolean avoidStaleNodes, final boolean newBlock, EnumMapStorageType, Integer storageTypes) throws NotEnoughReplicasException { // 计算结果列表的大小默认初始 results 为0result集合表示副本所在的节点 final int numOfResults results.size(); // 如果结果列表为空 if (numOfResults 0) { // 选择本地节点作为第一个副本存储位置并向result中加入节点 DatanodeStorageInfo storageInfo chooseLocalStorage(writer, excludedNodes, blocksize, maxNodesPerRack, results, avoidStaleNodes, storageTypes, true); //writer第一个副本要写出的DataNode节点 writer (storageInfo ! null) ? storageInfo.getDatanodeDescriptor() : null; //减去一个副本后如果为0则返回writer,否则不返回继续 if (--numOfReplicas 0) { return writer; } } //第一个副本所在DN节点 final DatanodeDescriptor dn0 results.get(0).getDatanodeDescriptor(); if (numOfResults 1) { //选择远程机架存放第二个副本 chooseRemoteRack(1, dn0, excludedNodes, blocksize, maxNodesPerRack, results, avoidStaleNodes, storageTypes); if (--numOfReplicas 0) { //writer第一个副本要写出的DataNode节点 return writer; } } if (numOfResults 2) { //第二个副本所在DN节点 final DatanodeDescriptor dn1 results.get(1).getDatanodeDescriptor(); if (clusterMap.isOnSameRack(dn0, dn1)) {//如果dn0与dn1是同一机架第三个副本选择不同机架 chooseRemoteRack(1, dn0, excludedNodes, blocksize, maxNodesPerRack, results, avoidStaleNodes, storageTypes); } else if (newBlock){//如果是新块选择与dn1 第二个副本所在节点相同的机架上放第三个副本 chooseLocalRack(dn1, excludedNodes, blocksize, maxNodesPerRack, results, avoidStaleNodes, storageTypes); } else {//随机选择一台节点存储第3个副本 chooseLocalRack(writer, excludedNodes, blocksize, maxNodesPerRack, results, avoidStaleNodes, storageTypes); } if (--numOfReplicas 0) { //writer第一个副本要写出的DataNode节点 return writer; } } //大于3个副本随机选择节点存放副本 chooseRandom(numOfReplicas, NodeBase.ROOT, excludedNodes, blocksize, maxNodesPerRack, results, avoidStaleNodes, storageTypes); //writer第一个副本要写出的DataNode节点 return writer; }“chooseTargetInOrder”方法代码逻辑为block 副本找到存储节点的策略然后返回block所在的第一个节点首先第一个block存储在本机第二个block存储在远程机架第三个副本存储时先判断是否第一个副本和第二个副本是否在同一机架如果在同一机架那么第三个副本选择不同机架进行存储否则选择与第二个副本相同机架的随机节点进行存储。最终该方法返回存储第一个副本的DataNode节点。客户端与DataNode建立socket通信向Datanode中写入数据数据读取源码数据从HDFS中读取数据代码如下public class ReadDataFromHDFS { public static void main(String[] args) throws IOException, InterruptedException { Configuration conf new Configuration(); //创建FileSystem对象 FileSystem fs FileSystem.get(URI.create(hdfs://node1:8020/),conf,root); //创建HDFS文件路径 Path path new Path(/test.txt); FSDataInputStream in fs.open(path); //读取HDFS中数据 BufferedReader br new BufferedReader(new InputStreamReader(in)); String newLine ; while((newLine br.readLine()) ! null) { System.out.println(newLine); } //关闭流对象 br.close(); in.close(); } }HDFS中数据读取源码相对简单客户端从HDFS中获取文件数据时首先会向NameNode获取文件相关的block信息然后连接各个Datanode以流方式读取数据即可。连接NameNode获取block信息“namenode.getBlockLocations(src, start, length)”最终调用到NameNodeRpcServer.getBlockLocations(...)方法。回到DFSClient.open()方法中最终通过执行“return openInternal(locatedBlocks, src, verifyChecksum);”返回DFSInputStream对象。客户端通过socket连接DataNodeDataNode返回block数据流最终通过readBuffer(...)从DataNode中获取文件数据。

西门子S7-300/400老系统改造：用DP/DP Coupler打通新旧产线数据（附Step7组态避坑点）

西门子S7-300/400老系统改造：用DP/DP Coupler打通新旧产线数据（附Step7组态避坑点） 在工业自动化领域，老旧产线升级改造往往面临新旧设备通讯协议不兼容的难题。当传统S7-300系统需要与现代化S7-400或带PN接口的PLC进行数据交互时…...

2026/5/12 6:33:47 阅读更多 →

质因数相乘

1，请把一个整数（范围2到10的8次方）拆解成质因数相乘的形式，质因数按从小到大排列例： 输入： 60 输出： 2*2*3*5 c #include<bits/stdc.h> using namespace std; int f(int a){for(int…...

2026/5/12 6:32:35 阅读更多 →

英雄联盟游戏效率工具League Akari：智能自动化与数据分析完整指南

英雄联盟游戏效率工具League Akari：智能自动化与数据分析完整指南【免费下载链接】League-Toolkit An all-in-one toolkit for LeagueClient. Gathering power 🚀. 项目地址: https://gitcode.com/gh_mirrors/le/League-Toolkit 还在为BP阶段手速…...

2026/5/12 6:29:43 阅读更多 →

【阳师范学院主办，多高校承协办 | IET出版，往届连续4届EI稳定检索，平均刊后2个月EI检索，EI检索稳定 | 择优至EI期刊】第五届电力工程与电气技术学术会议（ICPEET 2026）

ICPEET 2026 已申请IET (CA) EAI (JA) 出版会议论文（CA）： 会议已申请IET Conference Proceedings (ISSN: 2732-4494) 出版，收录于IET数字图书馆，并提交EI Compendex、Scopus、IEEE Xplore等数据库进行检索。期刊论文…...

2026/5/12 3:35:40 阅读更多 →