hadoop是做什么的

1、Hadoop主要是分布式计算和存储的框架,所以Hadoop工作过程主要依赖于HDFS(Hadoop Distributed File System)分布式存储系统和Mapreduce分布式计算框架 。
2、分布式存储系统HDFS中工作主要是一个主节点namenode(master)(hadoop1.x只要一个namenode节点,2.x中可以有多个节点)和若干个从节点Datanode(数据节点)相互配合进行工作 。
3、HDFS主要是存储Hadoop中的大量的数据,namenode节点主要负责的是:接收client用户的操作请求,这种用户主要指的是开发工程师的Java代码或者是命令客户端操作 。维护文件系统的目录结构,主要就是大量数据的关系以及位置信息等 。管理文件系统与block的关系 。
【hadoop是做什么的】4、Hadoop中大量的数据为了方便存储和管理主要是以block块(64M)的形式储存 。一个文件被分成大量的block块存储之后,block块之间都是有顺序关系的,这个文件与block之间的关系以及block属于哪个datanode都是有namenode来管理 。

以上就是hadoop是做什么的的内容啦,希望本文可以帮到你!