介绍
1)linux 开发平台
2)mysql 数据库--数据存储和查询的工具
3)kettle 数据采集工具
4)FineB 数据可视化工具
1.
大数据属于新处理模式----传统的工具无法处理(太大 无法捕捉等)
解决 1)海量数据存储 2) 海量数据运算
特点 大(数据体量大)
多(种类的来源多样化)
值(低价值密度)
快(速度快)
信(数据的质量)
2.
应用场景
1)金融---效率提升(量化)
2)互联网---广告营销(聚类算法)
3)短视频频台---视频推送
4)导航---路线规划
5)物流
3.
大数据分析的业务步骤
明确数据分析的目的和思路---数据收集---数据处理(提取 清洗 转化 加载)--- 数据分析(统计 建模 挖掘)---数据可视化 --- 报告撰写
第一章 Linux 服务器系统
1)
硬件 输入输出设备 存储设备(cpu 内存条 硬盘 无线网卡 键盘)
软件 电脑上的程序 系统软件和应用软件(windows qq v )
操作系统 (operating system OS),管理和控制硬件和软件资源的计算机程序. 所有软件必须在操作系统的支持下才能运行。连接应用软件和硬件之间的桥梁
2)
常见的操作系统
Unix (No.1收费) Windows(收费 X86构造 复杂) Linux(free) Mac(更适合开发 简易)
Android/ios (移动端)
3)
Linux 系统介绍
Linux 包括 linux内核 系统库 系统程序 Linux内核是其最基础的部分。
apache(免费开源)
Redhat 功能全面 稳定(最大的Linux发行厂商)2018被IBM收购
Centos (免费)被Redhat收购
Deepin (国产发行最好的一款Linux发行版)
4)
虚拟机
VMware > VirtualBox(不方便 但是较小)
5)远程连接工具
使用FinalShell 连接
ssh可以直接连接,但是部分功能无法使用。
6)Linux 目录结构
Linux 没有盘符,只有一个根目录(/),所有文件在它下面。(Windows 拥有多个盘 例如c d e盘)
树状结构
7)
常用的目录:
/bin 二进制命令所在的目录 终端指令集存放的目录
/boot 系统引导程序所需要的文件目录
/dev 设备软件目录 磁盘 光驱
/etc 系统配置,启动程序
/home 普通用户的家 目录默认数据存放目录 (桌面)
/lib 共享库文件和内核模块存放目录
/mnt 临时挂载储存设备的挂载点
/opt 额外的应用软件包 应用程序存在根的目录 相当于windows中的software目录
/proc 操作系统运行时,进程信息和内核信息存放在这里
/root Linux超级权限用户root的家目录 (超级)最高权限!!!
/sbin 超级管理用户使用的指令集,包括用户的创建删除等指令。
8)
FinalShell
只可以拖入不可拉出
9)
Linux 常见命令
command : 命令名
【-options】 : 选项
parameter : 传给命令的参数
10)
显示文件列表命令---- ls 命令 .开头普遍为隐藏文件
-a:显示所有的文件(包括隐藏文件)
-l 以列表的形式显示详细信息 展示文件的详细信息 包括权限 归属 文件大小 创建修改时间 文件名称
-h 更合适的单位显示文件大小 赋予最恰当的单位
ls -lh 展示文件的详细信息列表 并且合理展示单位
ls -al 展示所有文件详细信息列表 包括隐藏文件
ls -alh 展示所有文件详细信息列表 包括隐藏文件 并且合理展示单位
ls -l 可以用 ll 代替
11)Linux 路径
Linux 不允许出现中文路径
绝对路径中 Linux 是从根目录出发进行查找相反 window则是从盘符进行查找。
../ 回到上个目录(相对路径)
./ 当前目录 (./可以被省略)
绝对路径不变
相对路径需要使用../返回 如果在当前文件下的 可以使用./ (./可以被省略)
12) cd 目录操作命令
cd 切换目录工作的命令
pwd 命令获取的就是当前所在的工作的所在
cd - 回到上次操作的地方
cd / 进入根目录
cd (cd ~)回到家目录下
cd加空格!!! cd / cd ~ cd ../ cd ./