第七周总结

第七周总结

时间：2024-09-09 16:06:48浏览次数：8

标签：总结 HDFS 第七处理 MapReduce Hadoop 学习数据

这周，我开始了对Hadoop的学习之旅。Hadoop是一个开源软件框架，用于分布式存储和处理大型数据集，它以一种可靠、可扩展且高效的方式工作。起初，我对它的了解仅仅停留在这是一个能够处理大数据的工具上，但随着深入学习，我发现它远不止如此。

周一的时候，我首先从理解Hadoop的基本概念开始，包括它的核心组成部分——HDFS（Hadoop Distributed File System）和MapReduce。通过阅读官方文档和一些教程，我了解到HDFS是如何将文件分割成块存储在多个节点上的，而MapReduce则是一种编程模型，用于大规模数据集的并行运算。理论知识虽然重要，但没有实践总是觉得空洞，所以我决定安装一个Hadoop环境来亲自体验一下。

到了周二，我遇到了第一个挑战：搭建Hadoop集群。尽管有很多在线资源可以参考，但由于我的计算机配置有限，只能尝试单机模式下的伪分布式环境。在这个过程中，我遇到了各种环境配置的问题，比如Java版本不兼容、配置文件设置错误等。好在经过不断的调试与查阅资料，终于在周三晚上成功启动了Hadoop，并完成了几个简单的文件读写操作，那一刻成就感满满。

周四到周五，我主要是在做一些基础的MapReduce程序练习。从最经典的WordCount程序开始，逐渐尝试了更复杂的算法实现，比如矩阵乘法等。在这个过程中，我对Hadoop的数据处理逻辑有了更深的理解，也更加熟悉了如何编写Map和Reduce函数来处理数据。

周末，我花了一些时间回顾这一周所学的内容，并开始思考如何将Hadoop应用到实际项目中去。虽然目前只是初步接触，但我已经感受到了它在处理大规模数据时的强大能力。未来，我还计划继续深入学习Hadoop生态系统中的其他组件，比如YARN（Yet Another Resource Negotiator），以及Hadoop生态圈内的其他工具如Hive、HBase等，希望能够在数据分析领域有更进一步的发展。

这一周的学习让我对大数据处理有了全新的认识，也激发了我对技术探索的热情。接下来的日子里，我会继续保持这种学习状态，争取早日成为一名合格的大数据工程师。

标签：总结,HDFS,第七,处理,MapReduce,Hadoop,学习,数据
From： https://www.cnblogs.com/galileo9527/p/18404722

CCF推荐B类会议和期刊总结：（计算机体系结构/并行与分布计算/存储系统领域）
目录前言B类会议1.SoCC2.SPAA3.PODC4.FPGA5.CGO6.DATE7.HOTCHIPS8.CLUSTER9.ICCD10.ICCAD11.ICDCS12.CODES+ISSS13.HiPEAC14.SIGMETRICS15.PACT16.ICPP17.ICS18.VEE19.IPDPS20.Performance21.HPDC22.ITC23.LISA24.MSST25......
git使用的说明总结
Git使用说明下载安装(下载地址)macOS:Git-DownloadingmacOSWindows:Git-DownloadingWindowsLinux/Unix:Git(git-scm.com)创建新仓库本地创建新仓库：创建新文件夹，进入文件夹目录，执行指令gitinit，用以创建新的git克隆仓库执行指令用以创建一个本地......
selenium自动化检测方法总结携带用户数据绕过检测无头模式句柄切换
1.selenium携带用户数据fromseleniumimportwebdriverfromselenium.webdriver.chrome.serviceimportServiceservice=Service(executable_path='chromedriver.exe')option=webdriver.ChromeOptions()user_data_dir=r'C:\Users\12501\AppData\Local......
C++期末复习超详细总结知识点（期末冲刺）
指数形式(即浮点形式)1.5、字符型常量作用：字符型变量用于显示单个字符语法：charch='a';注意1：在显示字符型变量时，用单引号将字符括起来，不要用双引号注意2：单引号内只能有一个字符，不可以是字符串C和C++中字符型变量只占用1个字节。字符常量只能包括一个字符，如......
iptables 命令使用帮助总结
1.iptables命令帮助参数root@controller1:~#iptables--helpiptablesv1.6.1Usage:iptables-[ACD]chainrule-specification[options]iptables-Ichain[rulenum]rule-specification[options]iptables-Rchainrulenumrule-specification[options]......
Modbus协议总结
ModbusTCP通信概述ModbusTCP是一种基于TCP/IP协议的Modbus通信协议，用于在客户机和服务器之间进行数据通信。它常用于工业自动化控制、电力监控与管理、温湿度监测等领域。ModbusTCP协议使用标准的TCP/IP协议栈，通过以太网进行通信，并支持多个设备同时访问同一个ModbusTCP服务......
python 总结
数据变量指向a="hellopython"b=aa=123#a与b指向同一内存空间字符串name="alex\tnameisalex"name.capitalize()#首字母大写name.count("a")#统计字母个数name.center(50,"-")#总共打印50个字符，并把nam放在中间，不够的用-补上name.endswith("ex")#......
【算法笔记】树形DP算法总结&详解
0.定义树形DP，又称树状DP，即在树上进行的DP，是DP（动态规划）算法中较为复杂的一种。1.基础令\(f[u]=~\)与树上顶点\(u\)有关的某些数据，并按照拓扑序（从叶子节点向上到根节点的顺序）进行\(\text{DP}\)，确保在更新一个顶点时其子节点的dp值已经被更新好，以更新当前节点的\(\text{DP}\)值......
Hadoop学习总结
在深入学习Hadoop的过程中，我逐渐探索了其高级特性和性能优化的技巧，发现这些方法对提升数据处理的效率和集群的稳定性至关重要。Hadoop，作为一个强大的大数据处理框架，其核心组件包括HDFS（分布式文件系统）和YARN（YetAnotherResourceNegotiator）。在掌握了基本的使用方法后，我开始关注如......
考前突击高数下框框老师题型总结
（1）不定积分1.直接积分表 2.利用凑微分法求不定积分三角函数的“六边形”关系 3.第二类换元法求不定积分 4.分部积分法被积函数都是两类相乘（反对幂三指越靠后越容易拿出来） 5.求分式函数的不定积分 6.三角函数相除......

相关文章

赞助商

阅读排行