Hadoop分布式文件系统架构和设计
- 引言
Hadoop 分布式文件系统 (HDFS) 是一个设计用于在普通硬件上运行的分布式文件系统。它与现有的分布式文件系统有许多相似之处。然而,HDFS 与其他分布式文件系统的差异是显著的。HDFS具有高度的容错能力,并且设计用于在低成本硬件上部署。HDFS 提供高吞吐量的数据访问,适合处理大型数据集的应用程序。HDFS放宽了一些 POSIX规范,以支持对文件系统数据的流式访问。HDFS 最初是作为 Apache Nutch 网络搜索引擎项目的基础设施构建的。HDFS是Apache Hadoop 核心项目的一部分。项目网址是,http://hadoop.apache.org/core/。
- 假设与目标
2.1 硬件故障
标签:HDFS,架构,Hadoop,硬件,Apache,设计,分布式文件系统 From: https://blog.csdn.net/zkmrobot/article/details/143414226