首页 > 系统相关 >Linux_命令行用于数据分析

Linux_命令行用于数据分析

时间:2023-07-14 17:35:00浏览次数:52  
标签:数据分析 format -- data 命令行 Linux 数据

the command line 命令行用于数据分析

is not just for installing software, configuring systems, and searching files.	
数据输入--数据变换-数据输出- take data as input, do something to it, and print the result. 
(1) obtaining data, (2) scrubbing data, (3) exploring data, (4) modeling data, and (5) interpreting data
discusses more than 90 command-line tools	 

命令行:

 explore, and model data	
 awk sed grep 
 sort cut	
 
流程--
  01.获取数据--从其他地方下载到本地,查询数据库后者API的数据,从文件系统提取数据,产生自定义数据
     format: plain text, CSV, JSON, HTML, or XML format.
  02.数据规整: 数据清洗,数据格式整理-过滤-提取-替换-处理缺失值和重复值,格式转换
  03.数据探索:描述性统计,示例
  04.数据建模:
  05.数展示: 提取结论-沟通数据结果

参考

https://jeroenjanssens.com/dsatcl/chapter-1-introduction.html#obtaining-data	

标签:数据分析,format,--,data,命令行,Linux,数据
From: https://www.cnblogs.com/ytwang/p/17554546.html

相关文章

  • linux centos上传下载文件
    1、使用LePutty2、解压运行3、设置Connection——Zmodem——rz和sz对应目录修改下。Dowloadfolder也最好修改下4、使用。上传,输入命令rz 5、点左上角ZmodemUpload上传  ————————————————6、安装zip和uzip命令:yuminstallzip命令:yuminstallu......
  • Linux命令----modprobe命令详解
    【原文链接】Linux命令----modprobe命令详解一、modprobe命令的作用加载内核模块:使用modprobe命令可以加载指定的内核模块到运行中的内核中。加载内核模块可以在运行时添加新的功能、驱动程序或修改内核行为。解决模块依赖关系:modprobe命令可以自动解决内核模块之间的依......
  • linux 约束
    在关系型数据库中,约束是用于限制表中数据规则的一种机制。它可以确保表中的数据满足特定的条件,以确保数据的完整性和一致性。目录一、约束的概念二、约束的作用三、约束的分类四、约束的应用场景五、约束的管理六、总结    一、约束的概念1.约束的概念......
  • 性能优化 - Nginx & Linux
    性能优化-Nginx&Linux来自鑫哥[鑫哥的技术思维]2022-05-0709:26发表于湖北纲要Nginx优化后的完整配置Linux内核参数优化修改最大打开文件句柄数Nginx优化后的完整配置#核心参数(其他参数大部分情况下用不到)#userUSERNAME[GROUP]#解释:指定运行nginx的wo......
  • Linux下chkconfig命令详解(service)
    Linux下chkconfig命令详解(service)一、释义chkconfig命令主要用来更新(启动或停止)和查询系统服务的运行级信息。谨记chkconfig不是立即自动禁止或激活一个服务,它只是简单的改变了符号连接。二、使用语法chkconfig[--add][--del][--list][系统服务]或chkconfig[--level......
  • Cygwin、Linux Bash计算某个时刻偏移一定时间长度后的时间通用函数:datetimecount
    datetimecount函数代码datetimecount(){ #计算某个日期时间偏移一定时间长度后的时刻(目前主要供录制IPTV直播源时计算视频时长使用) #$1-->偏移量:符合date命令的描述参数即可,也支持传递标准时间格式:eg:+01:23:35(标记符号(加减号)可省略,小时字段可省略) #$2-->要计算偏移......
  • Linux 服务器安全加固十条建议
    1、https://www.51cto.com/article/695880.html1、设置复杂密码服务器设置大写、小写、特殊字符、数字组成的12-16位的复杂密码,也可使用密码生成器自动生成复杂密码,这里给您一个链接参考:https://suijimimashengcheng.51240.com/ 复制echo "root:wgr1TDs2Mnx0XuAv" | c......
  • Linux版本分类
    Linux的发行版本大致可以分为两类,一类是商业公司维护的发行版本,一类是社区组织维护的发行版本。前者以著名的RedHat (RHEL红帽)为代表,后者以Debian为代表Redhat系列的包管理方式采用的是基于RPM包和YUM包的管理方式,包分发方式是编译好的二进制文件RHEL(RedhatEnterpri......
  • Linux常用命令大全
    Linux常用命令大全1.Linux管理文件和目录的命令命令 功能 命令 功能Pwd 显示当前目录 ls 查看目录下的内容Cd 改变所在目录 cat 显示文件的内容Grep 在文件中查找某字符 cp 复制文件Touch 创建文件 mv 移动文件Rm 删除文件 rmd......
  • linux文件内容查看命令
    1、https://www.cnblogs.com/my-first-blog-lgz/p/13353051.html文件内容查看 1.cat:从第一行开始显示文件内容。用来读文章,或者读取配置文件 2.tac:从最后一行开始显示,可以看出tac是cat倒着写。 3.nl:显示的时候,顺便输出行号。看代码的时候希望显示行号。 4.more:一页一页显示......