首页 > 其他分享 >第七周总结

第七周总结

时间:2024-09-09 16:06:48浏览次数:8  
标签:总结 HDFS 第七 处理 MapReduce Hadoop 学习 数据

这周,我开始了对Hadoop的学习之旅。Hadoop是一个开源软件框架,用于分布式存储和处理大型数据集,它以一种可靠、可扩展且高效的方式工作。起初,我对它的了解仅仅停留在这是一个能够处理大数据的工具上,但随着深入学习,我发现它远不止如此。

周一的时候,我首先从理解Hadoop的基本概念开始,包括它的核心组成部分——HDFS(Hadoop Distributed File System)和MapReduce。通过阅读官方文档和一些教程,我了解到HDFS是如何将文件分割成块存储在多个节点上的,而MapReduce则是一种编程模型,用于大规模数据集的并行运算。理论知识虽然重要,但没有实践总是觉得空洞,所以我决定安装一个Hadoop环境来亲自体验一下。

到了周二,我遇到了第一个挑战:搭建Hadoop集群。尽管有很多在线资源可以参考,但由于我的计算机配置有限,只能尝试单机模式下的伪分布式环境。在这个过程中,我遇到了各种环境配置的问题,比如Java版本不兼容、配置文件设置错误等。好在经过不断的调试与查阅资料,终于在周三晚上成功启动了Hadoop,并完成了几个简单的文件读写操作,那一刻成就感满满。

周四到周五,我主要是在做一些基础的MapReduce程序练习。从最经典的WordCount程序开始,逐渐尝试了更复杂的算法实现,比如矩阵乘法等。在这个过程中,我对Hadoop的数据处理逻辑有了更深的理解,也更加熟悉了如何编写Map和Reduce函数来处理数据。

周末,我花了一些时间回顾这一周所学的内容,并开始思考如何将Hadoop应用到实际项目中去。虽然目前只是初步接触,但我已经感受到了它在处理大规模数据时的强大能力。未来,我还计划继续深入学习Hadoop生态系统中的其他组件,比如YARN(Yet Another Resource Negotiator),以及Hadoop生态圈内的其他工具如Hive、HBase等,希望能够在数据分析领域有更进一步的发展。

这一周的学习让我对大数据处理有了全新的认识,也激发了我对技术探索的热情。接下来的日子里,我会继续保持这种学习状态,争取早日成为一名合格的大数据工程师。

标签:总结,HDFS,第七,处理,MapReduce,Hadoop,学习,数据
From: https://www.cnblogs.com/galileo9527/p/18404722

相关文章

  • CCF推荐B类会议和期刊总结:(计算机体系结构/并行与分布计算/存储系统领域)
    目录前言B类会议1.SoCC2.SPAA3.PODC4.FPGA5.CGO6.DATE7.HOTCHIPS8.CLUSTER9.ICCD10.ICCAD11.ICDCS12.CODES+ISSS13.HiPEAC14.SIGMETRICS15.PACT16.ICPP17.ICS18.VEE19.IPDPS20.Performance21.HPDC22.ITC23.LISA24.MSST25......
  • git使用的说明总结
    Git使用说明下载安装(下载地址)macOS:Git-DownloadingmacOSWindows:Git-DownloadingWindowsLinux/Unix:Git(git-scm.com)创建新仓库本地创建新仓库:创建新文件夹,进入文件夹目录,执行指令gitinit,用以创建新的git克隆仓库执行指令用以创建一个本地......
  • selenium自动化检测方法总结 携带用户数据 绕过检测 无头模式 句柄切换
    1.selenium携带用户数据fromseleniumimportwebdriverfromselenium.webdriver.chrome.serviceimportServiceservice=Service(executable_path='chromedriver.exe')option=webdriver.ChromeOptions()user_data_dir=r'C:\Users\12501\AppData\Local......
  • C++期末复习超详细总结知识点(期末冲刺)
    指数形式(即浮点形式)1.5、字符型常量作用:字符型变量用于显示单个字符语法:charch='a';注意1:在显示字符型变量时,用单引号将字符括起来,不要用双引号注意2:单引号内只能有一个字符,不可以是字符串C和C++中字符型变量只占用1个字节。字符常量只能包括一个字符,如......
  • iptables 命令使用帮助总结
    1.iptables命令帮助参数root@controller1:~#iptables--helpiptablesv1.6.1Usage:iptables-[ACD]chainrule-specification[options]iptables-Ichain[rulenum]rule-specification[options]iptables-Rchainrulenumrule-specification[options]......
  • Modbus协议总结
    ModbusTCP通信概述ModbusTCP是一种基于TCP/IP协议的Modbus通信协议,用于在客户机和服务器之间进行数据通信。它常用于工业自动化控制、电力监控与管理、温湿度监测等领域。ModbusTCP协议使用标准的TCP/IP协议栈,通过以太网进行通信,并支持多个设备同时访问同一个ModbusTCP服务......
  • python 总结
    数据变量指向a="hellopython"b=aa=123#a与b指向同一内存空间字符串name="alex\tnameisalex"name.capitalize()#首字母大写name.count("a")#统计字母个数name.center(50,"-")#总共打印50个字符,并把nam放在中间,不够的用-补上name.endswith("ex")#......
  • 【算法笔记】树形DP算法总结&详解
    0.定义树形DP,又称树状DP,即在树上进行的DP,是DP(动态规划)算法中较为复杂的一种。1.基础令\(f[u]=~\)与树上顶点\(u\)有关的某些数据,并按照拓扑序(从叶子节点向上到根节点的顺序)进行\(\text{DP}\),确保在更新一个顶点时其子节点的dp值已经被更新好,以更新当前节点的\(\text{DP}\)值......
  • Hadoop学习总结
    在深入学习Hadoop的过程中,我逐渐探索了其高级特性和性能优化的技巧,发现这些方法对提升数据处理的效率和集群的稳定性至关重要。Hadoop,作为一个强大的大数据处理框架,其核心组件包括HDFS(分布式文件系统)和YARN(YetAnotherResourceNegotiator)。在掌握了基本的使用方法后,我开始关注如......
  • 考前突击高数下框框老师题型总结
    (1)不定积分1.直接积分表 2.利用凑微分法求不定积分三角函数的“六边形”关系 3.第二类换元法求不定积分 4.分部积分法被积函数都是两类相乘(反对幂三指越靠后越容易拿出来)  5.求分式函数的不定积分 6.三角函数相除......