首页 > 其他分享 >练习题:观影大数据分析

练习题:观影大数据分析

时间:2023-11-24 19:22:05浏览次数:30  
标签:练习题 数据分析 tmdb 电影 5000 观影 csv 1000

王 S 聪想要在海外开拓万 D 电影的市场,这次他在考虑:怎么拍商业电影才 能赚钱?毕竟一些制作成本超过 1 亿美元的大型电影也会失败。这个问题对电影 业来说比以往任何时候都更加重要。 所以,他就请来了你(数据分析师)来帮 他解决问题,给出一些建议,根据数据分析一下商业电影的成功是否存在统一公 式?以帮助他更好地进行决策。 解决的终极问题是:电影票房的影响因素有哪些? 接下来我们就分不同的维度分析: • 观众喜欢什么电影类型?有什么主题关键词? • 电影风格随时间是如何变化的? • 电影预算高低是否影响票房? • 高票房或者高评分的导演有哪些? • 电影的发行时间最好选在啥时候? • 拍原创电影好还是改编电影好? 本次使用的数据来自于 Kaggle 平台(TMDb 5000 Movie Database)。收录了 美国地区 1916-2017 年近 5000 部电影的数据,包含预算、导演、票房、电影评 分等信息。原始数据集包含 2 个文件: • tmdb_5000_movies:电影基本信息,包含 20 个变量 • tmdb_5000_credits:演职员信息,包含 4 个变量 请使用 Python 编程,完成下列问题: (1)使用附件中的 tmdb_5000_movies.csv 和 tmdb_5000_credits.csv 数据集,进 行数据清洗、数据挖掘、数据分析和数据可视化等,研究电影票房的影响因素有 哪些?从不同的维度分析电影,讨论并分析你的结果。 (2)附件 tmdb_1000_predict.csv 中包含 1000 部电影的基本信息,请你选择 合适的指标,进行特征提取,建立机器学习的预测模型,预测 1000 部电影的 vote_average 和 vote_count,并保存为 tmdb_1000_predicted.csv。

标签:练习题,数据分析,tmdb,电影,5000,观影,csv,1000
From: https://www.cnblogs.com/lxh-666/p/17854571.html

相关文章

  • 产品经理如何做数据分析?
    当产品经理进行数据分析时,需要掌握一系列方法和工具,以便深入了解用户行为、产品表现和市场趋势。下面是一个详细的描述,将涵盖数据收集、数据处理、数据分析工具和技术,以及数据分析在产品决策中的应用。第一部分:数据收集与整理用户行为数据的收集方式网站分析工具(如GoogleAnaly......
  • R数据分析:集成学习方法之随机生存森林的原理和做法,实例解析
    很久很久以前给大家写过决策树,非常简单明了的算法。今天给大家写随机(生存)森林,随机森林是集成了很多个决策数的集成模型。像随机森林这样将很多个基本学习器集合起来形成一个更加强大的学习器的这么一种集成思想还是非常好的。所以今天来写写这类算法。 集成学习方法Ensembl......
  • 数据分析从入门到高级,10分钟帮你构建知识体系!
    数据分析是一种通过收集、整理、解释和可视化数据来获得洞察力和做出决策的过程。它在各行各业都起着至关重要的作用,包括市场营销、金融、医疗保健、人力资源等领域。在本文中,我将为你介绍数据分析的入门知识,并逐步向你介绍一些高级概念和技巧。入门知识1.数据分析的基本概念......
  • 大数据分析使用哪些工具?
    大数据分析常用的工具包括但不限于以下几种:Hadoop:Hadoop是一个开源的分布式存储和计算框架,包括HDFS(Hadoop分布式文件系统)和MapReduce(分布式计算框架)。Hadoop可以处理大规模数据,并且提供容错性、高可用性和高性能。Spark:ApacheSpark是一个快速、通用的大数据处理引擎,它提供了基......
  • 这些仪表板常用的数据分析模型,你都见过吗?
    本文由葡萄城技术团队发布。转载请注明出处:葡萄城官网,葡萄城为开发者提供专业的开发工具、解决方案和服务,赋能开发者。前言在数字化时代,数据已经成为了企业决策和管理的重要依据。而仪表板作为一种数据可视化工具,则可以帮助企业更加直观地了解和分析数据,从而作出更准确和有效......
  • 硕迪数据分析系统功能使用怎么样?
    硕迪数据分析系统功能使用怎么样?1、硕迪数据分析系统做大屏有什么亮点吗?2、硕迪数据分析系统部署方不方便?3、硕迪数据分析系统支不支持Liunx?4、硕迪数据分析系统能不能完成复杂的报表?5、硕迪数据分析系统大屏的图表样式多不多?6、硕迪数据分析系统都支持那些数据源连接呢?—————......
  • 如何做一个优秀的数据分析项目?
    数据分析项目的成功往往取决于项目的规划、数据收集、清理、分析和结果呈现。以下是详细的步骤和技巧,以确保您可以完成一个优秀的数据分析项目。1.制定项目目标和范围在开始项目之前,确定项目的具体目标和范围至关重要。这将为整个项目提供方向,并帮助您定义需要采取的行动。2......
  • 数据分析方法之一:标签分析法
    标签分析法(TagAnalysisMethod)是一种常用的数据分析方法,它基于对数据中的标签进行统计和分析,以揭示数据的特征和关联。标签分析法广泛应用于社交媒体数据、商品评论、用户标记等领域,它可以帮助我们了解用户行为、产品特征以及社交关系等方面的信息。理论基础标签分析法的核心......
  • 数据分析师如何做好PPT
    作为一名数据分析师,制作出色的PPT是非常重要的技能之一。一个好的PPT可以让你的数据洞察更加生动有趣,并有效传达给观众。以下是一些详细的步骤和技巧,帮助你成为一名擅长制作PPT的数据分析师:确定目标和受众:在开始设计PPT之前,明确你的目标和受众是非常重要的。了解你的受众是谁,他们......
  • C语言程序代码练习题
    1.#include<stdio.h>voidmain(){chargrade[10];printf("请输入您的成绩等级:");scanf("%s",grade);if(stricmp("A",grade))printf("成绩等级为A");elseif(stricmp("B",grade))printf("成绩等级为B");elseif(stric......