首页 > 数据库 >CS 7280数据库管理专题

CS 7280数据库管理专题

时间:2024-04-06 16:34:07浏览次数:25  
标签:Canvas 7280 数据库 文件格式 提交 PPT CS PDF 数据

CS 7280数据库管理专题2024春季项目3:大数据分析
目标:
1.了解Hadoop生态系统和数据分析
2.熟悉MapReduce编程和Spark
3.获得大数据和数据分析研究经验这将是一个为期一学期的小组项目(由两名学生)。这样做的主要目的项目是为了熟悉大数据平台,包括Hadoop系统,MapReduce编程和基于云的大数据解决方案(如谷歌大查询)。你需要按照指示进行这个项目。
第一阶段(15%):选择数据集-截止日期:2024年3月27日(周三)
•每位学生研究您感兴趣的任何数据,并收集有关数据的信息。
•找到您选择的数据的任何特征,并描述您为什么对感兴趣
•如果可能,准备3~4个样本数据,这些数据可以是真实数据,也可以是操纵数据一
•制作2-3页的Powerpoint文件作为报告
•将PPT文件提交到Canvas
o仅PPT、PPTX或PDF文件格式第二阶段(15%):确定问题——截止日期:2024年4月3日(周三)
•在第二阶段,您将根据您在阶段1中选择的数据:-您可以根据Hadoop HDFS使用所选数据分析什么Spark和使用GCP的Google Big Query。
o 1个火花
o 1使用GCP的谷歌大查询-如何收集至少1GB的数据。这意味着你的数据必须在第4-5阶段使用VM上传到HDFS。
•制作2-3页的Powerpoint文件作为报告
•将PPT文件提交到Canvas
o仅PPT、PPTX或PDF文件格式第三阶段(20%):编制建议书——截止日期:2024年4月3日(周三)
•使用MS单词模板准备提案:可以找到提案模板在Canvas
o仅限DOC、DOCX或PDF文件格式
•准备并提交5~10页的Powerpoint文件用于演示
o仅PPT、PPTX或PDF文件格式
•然后,向Canvas提交10分钟的演示视频
o提交YouTube等链接,或使用Canvas录制演示文稿
•在您的提案中,您需要考虑如何准备的最终交付成果
以下输出
1.写
2.源代码
3.数据集
4.海报
**请注意,这是一个计划,准备1~4以上。目前尚未实施。
•然后,将您的提案提交给Canvas
•准备5分钟的提案演示(同时提交PPT文件)
第4阶段(25%):实施——截止日期:2024年4月10日(周三)
1.准备数据并上传到HDFS。您可以使用多种方式来准备数据集包括:-使用每个网站提供的API,如Facebook API、Twitter API和Flickr API使用基准测试数据集,例如
o UCI数据集:http://archive.ics.uci.edu/ml/datasets.html
o维基百科数据库:https://en.wikipedia.org/wiki/Database_testing政府数据库
o美国人口普查数据:
http://factfinder.census.gov/faces/nav/jsf/pages/index.xhtml
o NOAA天气数据:https://www.ncdc.noaa.gov/cdo-web/
-利用Web查询实现数据采集程序
-合成数据集
-使用谷歌搜索
2.您的数据集必须至少有100000个实例(或行)
3.将您的数据集上传到HDFS(VM)
4.实现Spark或Big Query
-您可以将PySpark或任何Steaming与其他程序语言一起使用,例如
蟒蛇o 1个火花,或o 1大查询
5.将源代码提交到Canvas并下载数据集的链接-所有源文件都应该使用TAR压缩(例如,TAR cvf XXX.TAR)
VM(仅限JAR、TAR或ZIP文件格式)-对于数据集,您可以将其上传到Google Drive(或任何Web硬盘),然后提交源代码时发送链接
6.然后,向Canvas提交10分钟的演示视频-提交一个链接,如YouTube,或使用Canvas录制您的演示第5阶段(25%):项目介绍——截止日期:2024年4月17日(周三)上课前。
1.写作(至少4页IEEE格式)。您必须使用IEEE格式。仅限DOC、DOCX或PDF文件格式
2.海报(36 x 24英寸Powerpoint文件)。您可以使用提供的模板之一画布上。o仅PPT、PPTX或PDF文件格式
3.将您的论文和海报提交到Canvas
4.制作8~10页的Powerpoint文件并提交给Canvas
o仅PPT、PPTX或PDF文件格式
5.然后,在2022年4月27日(星期三)准备8分钟的期末报告
屈服
您将使用Canvas提交您的程序。如果你在使用黑板方面有任何困难,您可以联系TA或讲师。

标签:Canvas,7280,数据库,文件格式,提交,PPT,CS,PDF,数据
From: https://www.cnblogs.com/gzashang/p/18117536

相关文章

  • css预编译sass,css也可以变得优雅
    1.嵌套选择器#content{article{h1{color:#333}p{margin-bottom:1.4em}}aside{background-color:#EEE}}编译后#contentarticleh1{color:#333}#contentarticlep{margin-bottom:1.4em}#contentaside{background-color......
  • CCF-CSP认证202403个人总结以及部分代码
    第一次参加,总分340,这个成绩个人觉得比较满意了,毕竟考前一直在划水,也很久没写算法题了。写到第四题,觉得还剩一个小时肯定写不完就又开始划水,暴力模拟完了就开始翻网页抄自己的提交记录,无所事事,想提前交卷。考试结束在网上一搜,第四题好像不是很难,瞬间觉得没写到最后亏了,开始后悔。......
  • TVM Pass优化 -- 公共子表达式消除(Common Subexpr Elimination, CSE)
    定义(What)公共子表达式消除就是如果表达式E的值已经计算的到了,并且自计算的到值后E的值就不再改变了,就说,表达式E在后续计算中是一个公共表达式。简单说,该表达式上面已经执行过了,下面没必要再执行了举个例子:importtvmfromtvmimportrelayfromtvm.relayimporttransform......
  • Arm架构下麒麟操作系统安装配置Mariadb数据库
    1、安装配置JDK(1)检查机器是否已安装JDK执行java-version命令查看机器是否安装JDK,一般麒麟操作系统默认安装openjdk1.8。  (2)安装指定版本JDK如果麒麟操作系统默认安装的openjdk1.8不符合需求的话,可以卸载机器安装的openjdk1.8并按需安装所需的openjdk版本,此步骤本文不......
  • 通过CSS设置元素水平垂直居中的方式大全
    元素水平垂直居中方法方案一、弹性盒子沿主轴和侧轴居中.outer{width:400px;height:400px;background-color:#888;display:flex;justify-content:center; align-items:ceter;}.inner{width:100px;height:100px;ba......
  • 阿里云购买ECS后 部署GO
     一installnginx检测APTsudoaptinstall-ycurlgnupg2ca-certificateslsb-release安装NGINX sudoaptinstallnginxsudoufwapplist查询http sudoufwallow'NginxHTTP'查询状态sudoufwstatus 二修改nginx.conf文件server{listen80;#监......
  • CSS样式继承
    CSS样式继承是指子元素会继承父元素的某些样式属性。常见的可以继承的CSS属性包括font-family、color、font-size、line-height。1.color子元素会继承父元素的文字颜色。.parent{color:blue;}.child{/*子元素继承父元素的文字颜色*/}2.font-size......
  • CSS隐藏元素的多种方式
    CSS中隐藏元素有多种方式,主要区别在于元素隐藏后是否占据空间以及是否会对文档流产生影响。1.display:none完全隐藏元素,不占据任何空间。.demo{display:none;}2.visibility:hidden隐藏元素,但仍占据空间。.demo{visibility:hidden;}3.opacity:0......
  • 游戏攻略|基于Springboot和vue的游戏分享平台系统设计与实现(源码+数据库+文档)
    游戏攻略分享平台目录基于Springboot的在线考试管理系统设计与实现一、前言二、系统设计三、系统功能设计 1、前台:2、后台5.2.1管理员功能模块四、数据库设计 五、核心代码 六、论文参考七、最新计算机毕设选题推荐八、源码获取:博主介绍:✌️大厂码农|毕设布道......
  • MySQL 数据库重置密码
    1.Linux中MySQL数据库重置密码停止服务:systemctlstopmysql打开my.cnf(没有则创建一个):vim/etc/my.cnf在[mysqld]下添加:skip-grant-tables;[mysqld]skip-grant-tables启动数据库:systemctlstartmysqld重置密码:#无需密码,直接登录mysql-uroot-p#设置密码mys......