首页 > 其他分享 >暑假第二周总结

暑假第二周总结

时间:2024-07-13 20:42:02浏览次数:11  
标签:总结 虚拟机 配置 环境 Hadoop 学习 第二周 暑假 数据

 本周主要学习了如何配置hadoop,真的是超级麻烦。本周完成了对Linux系统的学习,安装了vm虚拟机,配置了3个centos虚拟机,完成了虚拟机之间的免密登录等一系列的操作,虚拟机配置了java环境,hadoop环境,部署了HDFS集群。了解了大数据的软件生态、Hadoop是什么以及为什么需要分布式存储。

  本周的学习和实践经历让我深刻体会到了配置Hadoop的复杂性。尽管过程繁琐,但通过不懈的努力,我成功地在Linux系统上安装并配置了VMware虚拟机,创建了3个CentOS虚拟机。这些虚拟机不仅实现了免密登录,还配置了Java环境和Hadoop环境,为HDFS集群的部署奠定了基础。这一过程让我对大数据软件生态有了更深入的了解,也认识到了分布式存储在处理大规模数据时的重要性。

在配置过程中,我遇到了不少挑战。例如,虚拟机之间的网络配置、Hadoop环境变量的设置等,都曾让我头疼不已。但通过查阅资料、反复试验,我逐步解决了这些问题。这些经历教会了我,学习新技术时,环境配置是至关重要的第一步。如果环境配置不当,后续的学习将难以为继。

此外,我还学习了Hadoop的基本原理和架构。Hadoop是一个开源的分布式存储和计算框架,它能够处理大量数据,并且具有高可靠性和可扩展性。通过HDFS,Hadoop提供了一个分布式文件系统,允许数据在多个节点上存储和访问,从而提高了数据的可用性和容错性。

在接下来的学习中,我计划深入了解Hadoop的MapReduce编程模型。MapReduce是Hadoop的核心计算框架,它通过简单的接口,允许用户编写并行处理大量数据的程序。我希望通过实践MapReduce,进一步提高我的数据处理能力。

同时,我也意识到了学习大数据技术不仅仅是掌握工具的使用,更重要的是理解其背后的原理和思想。因此,我将花更多时间研究Hadoop的内部机制,包括它的调度算法、数据本地性原则等,以便更好地利用这一强大的工具。

    配置的过程很麻烦,在配置的时候遇到了一些小问题,但都得以解决。学习新技术的时候,配置环境是最重要的,环境若配置不对,后面的学习将无法进行

标签:总结,虚拟机,配置,环境,Hadoop,学习,第二周,暑假,数据
From: https://www.cnblogs.com/drip3775/p/18300682

相关文章

  • 2024/07/13(暑假学习hadoop第一周总结)
    在本周的学习中,我构建了学习Hadoop所需的基础环境,这包括安装虚拟机VMware和部署CentOS操作系统。这些步骤是学习Hadoop开始,也为是深入学习Hadoop技术做好前置的准备工作。下面将详细介绍如何安装VMware和部署CentOS系统:首先,我们需要下载VMware软件并进行安装。在安装过程中,请务必......
  • 暑期每周总结
     每周总结 这一周,我进行大数据技术的学习和应用。首先,我成功配置了Hadoop的YARN和Hive。YARN是Hadoop的资源管理器,它在集群上管理和调度计算资源,而Hive是一个基于Hadoop的数据仓库工具,它提供了类似SQL的查询语言,用于分析存储在Hadoop分布式文件系统(HDFS)中的大数据。通过这次配......
  • 每周总结:hadoop学习
    在大数据时代的背景下,Hadoop作为一种开源的分布式处理框架,为我打开了一扇通往高效数据处理的大门。通过对Hadoop的学习,我不仅掌握了其核心组件的工作原理,还体验到了分布式计算的强大威力。Hadoop的核心之一HDFS(HadoopDistributedFileSystem),以其高可靠性和高扩展性,为大数据......
  • 周总结一
    hadoop学习总结 一、学习总结1、hadoop集群的搭建。由于之前在学校中学习过伪分布式的搭建,在构建集群时还是比较容易上手的。主要的搭建过程分为以下几步:第一步,配置hosts列表;第二步,安装JDK;第三步,免密钥登录配置;第四步,Hadoop配置部署;第五步,将主节点的配置文件复制到从节点;第六......
  • 小学期第二周总结
    数据结构第二阶段综合应用算法训练自选题,我选择的是文件压缩解压。一、问题描述:名称:基于哈夫曼编码的文件压缩解压目的:利用哈夫曼编码压缩存储文件,节省空间输入:任何格式的文件(压缩)或压缩文件(解压)输出:压缩文件或解压后的原文件功能:利用哈夫曼编码压缩解压文件性能:快速二、......
  • 每周总结1
      HadoopHDFS(核心):Hadoop分布式存储系统;Yarn(核心):Hadoop2.x版本开始才有的资源管理系统;MapReduce(核心):并行处理框架;HBase:基于HDFS的列式存储数据库,它是一种NoSQL数据库,非常适用于存储海量的稀疏的数据集;Hive:ApacheHive是一个数据仓库基础工具,它适用于处理结构化数据......
  • 2024 暑假友谊赛-热身2
    1.G-......
  • 第二周进度总结
    (1)本周做了什么,花在学习上多长时间,花在代码时间上多长时间,花在解决问题用了多长时间。本周完成了yarn集群和hive数据库的部署使用的命令如下su-aaacd/export/server/hadoop/etc/hadoop/llvimmapred-env.shexportJAVA_HOME=/export/server/jdkexportHADOOP_JOB_HISTORYSERV......
  • 暑假集训 · 第一间
    7.11上午唐诗名校联考也是考完了看得出来学校很重视这次考试啊答题卡都印的黑白的……你说得对,但是请你先赏析一下微醺不过这并不能影响我的发挥成功的一张卷子也没做完......
  • 第二周学习报告
    又经过了一周的学习,今天对本周学习进行总结本周安装了IDEA,了解并学习了相关知识。还学习了Java中键盘录入、运算符、判断和循环的用法。IDEAIDEA全称IntelliJIDEA,是java编程语言的集成开发环境,它广泛应用于软件开发领域。IDEA官网:https://www.jetbrains.com/idea/键盘录入J......