大数据技术原理与应用——从入门到文档数据库

时间：2024-09-17 10:23:38浏览次数：10

标签：HDFS 入门数据库 Hadoop 文档 HBase 数据节点

大数据技术原理与应用

3次信息化的浪潮

研究问题的四个阶段

大数据技术的层次

大数据的计算模式

PaaS

物联网的概念

云计算、大数据、物联网之间的关系

Hadoop应用现状

选择Hdoop需要考虑的因素

Hadoop的定量评分（满分为5分）

总体评价

Ubuntu的一些基本知识（之所以不用CentOs，是因为其太重了）

Hadoop安装方式

Hadoop是什么

Hadoop的发展历程（了解）

安装Hadoop前的jdk路径

Hadoop使用

3种Shell命令方式

MapReduce两大核心组件

热备份：

HDFS

是 Hadoop Distribution File System的缩写

HDFS实现目标

HDFS的局限性

HDFS的相关概念
1.块

为什么要这样设计：

这样设计的好处：

2.名称节点（NameNode）与数据节点(DataNode)

FsImage：

元数据：

名称节点的具体文件结构：

名称节点与数据节点经常通信、传递信息，所以名称节点知道各个数据节点的信息

开始shell后的操作流程：

文件保存的位置：

HDFS的体系结构：
局限性：

第二名称节点的作用、冷备份：

3.4 HDFS存储原理

3.5.1 HDFS读数据过程

3.5.2 HDFS写数据过程

4.1 HBase简介

是一个稀疏的列式数据库

HBase与关系数据库的联系和区别：

访问接口：

4.2 HBase数据模型

定位一个数据：
4个必须：行键、列组、列限定符、时间戳：

概念示图（可能比较稀疏）：

底层存储示意图（基本都是紧凑地存储）：

面向行的存储的优势和缺点：

如何选择列式数据库还是行式数据库：

4.3 HBase的实现原理

HBase的功能组件：
库函数；Master服务器；Region服务器

Master服务器的作用：

Region的拆分（拆分速度很快，只是修改链接，并不会修改物理地址；只有合并后的才需要修改物理地址）及大小配置：
补充：同一个Region只是会在一个Region服务器上；每个Region大概能存储10-1000个region

寻址结构：

3层结构及作用：

查找数据时的缓存：

4.4 HBase运行机制

读写数据的过程：

写数据：

HLog的工作原理：

4.5 HBase应用方案

性能优化方法：

HBase怎么检测性能：

Ambari

4.6 HBase安装配置和常用Shell命令

5.1 NoSQL概述

NoSQL特点：

传统的关系数据库性能上的缺陷：

MySQL集群方式的缺陷：

NoSQL兴起的原因：

在web2.0时代，关系数据库没法发挥的特性

5.2 NoSQL与关系数据库的比较

关系数据库的优势：

NoSQL数据库的优势和劣势

5.3.1键值数据库和列族数据库

不同数据库的分类

不同类型数据库的举例

键值数据库

列族数据库

5.3.2文档数据库图数据库以及不同数据库比较分析

文档数据库

图数据库

5.4.1 CAP理论

CAP理论：

CAP理论理论下的几种选择

不同产品在CAP理论理论下的不同设计原则

5.4.2 BASE和最终一致性

BASE:

最终一致性；

回话一致性；单调写一致性

如何实现各种类型的一致性

N/W/R之间的关系

举例：

5.5 从NoSQL到NewSQL数据库

数据库的发展，伴随着大数据的发展

newSQL数据库

5.6 文档数据库MongoDB

标签：HDFS,入门,数据库,Hadoop,文档,HBase,数据,节点
From： https://www.cnblogs.com/fromWell888Dare/p/16651563.html

Python 操作 MySQL 数据库
Python操作MySQL数据库Python标准数据库接口为PythonDB-API，PythonDB-API为开发人员提供了数据库应用编程接口。Python数据库接口支持非常多的数据库，你可以选择适合你项目的数据库：GadFlymSQLMySQLPostgreSQLMicrosoftSQLServer2000InformixInterbaseOracleSybase......
数据库的基本使用
数据存储逻辑数据存储的逻辑是行和列。我们根据数据库中的表的结构来认识数据的存储结构，用什么的结构去呈现我们所要存储的数据。 6.2数据库架构 MySQL是一种可移植的数据库，几乎能在当前所有的操作系统中运行，如......
Faiss向量数据库
安装Faiss：......
汽车资讯网站|基于springboot+vue的汽车资讯网站(源码+数据库+文档)
汽车资讯网站目录基于springboot+vue的汽车资讯网站一、前言二、系统设计三、系统功能设计四、数据库设计五、核心代码六、论文参考七、最新计算机毕设选题推荐八、源码获取：博主介绍：✌️大厂码农|毕设布道师，阿里云开发社区乘风者计划专家博主，CSDN平台Java领......
企业管理|基于springboot+vue的企业OA管理系统(源码+数据库+文档)
企业管理目录基于springboot+vue的企业OA管理系统一、前言二、系统设计三、系统功能设计四、数据库设计五、核心代码六、论文参考七、最新计算机毕设选题推荐八、源码获取：博主介绍：✌️大厂码农|毕设布道师，阿里云开发社区乘风者计划专家博主，CSDN平台Java领域......
智慧宿舍平台|基于Springboot+vue的智慧宿舍系统(源码+数据库+文档)
智慧宿舍系统目录基于Springboot+vue的智慧宿舍系统一、前言二、系统设计三、系统功能设计四、数据库设计五、核心代码六、论文参考七、最新计算机毕设选题推荐八、源码获取博主介绍：✌️大厂码农|毕设布道师，阿里云开发社区乘风者计划专家博主，CSDN平台Java领域......
电子竞技信息交流平台|基于java的电子竞技信息交流平台系统小程序(源码+数据库+文档)
电子竞技信息交流平台系统小程序目录基于java的电子竞技信息交流平台系统小程序一、前言二、系统设计三、系统功能设计四、数据库设计五、核心代码六、论文参考七、最新计算机毕设选题推荐八、源码获取：博主介绍：✌️大厂码农|毕设布道师，阿里云开发社区乘风者计......
课堂助手|微信课堂助手系统小程序(源码+数据库+文档)
课堂助手|课堂助手系统小程序目录微信课堂助手系统小程序一、前言二、系统设计三、系统功能设计四、数据库设计五、核心代码六、论文参考七、最新计算机毕设选题推荐八、源码获取：博主介绍：✌️大厂码农|毕设布道师，阿里云开发社区乘风者计划专家博主，CSDN平台......
SQL Server_查询某一数据库中的所有表的内容
1.查看所有表的表名要列出CrabFarmDB数据库中的所有表（名），可以使用以下SQL语句：USECrabFarmDB;--切换到目标数据库GOSELECTTABLE_NAMEFROMINFORMATION_SCHEMA.TABLESWHERETABLE_TYPE='BASETABLE';对这段SQL脚本的解释：SELECTTABLE_NAME：这个语句的作用是......
IntelliJ IDEA内置代码文档汉化简单指南
测试环境:IntelliJIDEA2024.1(CommunityEdition)IntelliJIDEA，作为一款业界领先的集成开发环境（IDE），提供了丰富的代码提示和文档支持功能，极大地促进了开发者的编码效率。然而，对于中文用户，尤其是初学者，英文的代码文档提示可能会成为理解和使用的障碍。因此，将IntelliJIDEA......