本次数据分析在Hadoop大数据平台的基础上,导入外部数据,使用Spark进行数据清洗,使用Hive进行数据存储,同时使用Tableau进行可视化展示。本次使用数据为《NBA2011-2012季后赛球员数据统计》
因初始数据为 .xlsx 格式,为了兼容性着想,首先需要把文件转换为csv格式,使其在Linux中方便读取。
使用Excel打开文件后,点击左上角文件菜单==》另存为,保存类型选择CSV(逗号分隔)格式
转换格式后的数据如下
通过 Xftp4 把文件从 Windows 上传到 Linux ,至此,数据导入的工作完成
标签:数据分析,文件,导入,Linux,格式,数据 From: https://www.cnblogs.com/yenaibo/p/17133751.html