首页 > 其他分享 >二手车网数据分析

二手车网数据分析

时间:2024-03-30 23:32:12浏览次数:21  
标签:数据分析 title 二手车 hadoop li 可视化 安装 css

不知名小白

Email : [email protected]

 Time of completion:2024.3.30

文章目录

前言

一、运行环境

1、jdk

2、maven

3、idea安装

4、scala

5、VMware虚拟机安装和hadoop

(1)安装vm17

(2)安装ubuntu16  root

(3)登录ubuntu16,创建hadoop用户

(4)安装jdk

(5)下载 Hadoop

(6)安装hadoop

(7)配置hadoop环境变量

(8)查看hadoop命令

二、设计思路

数据采集:

数据处理:

数据分析:

可视化展示:

三、内容

1.数据采集

2.功能设计和实现

总结


前言

中国二手车市场是一个万亿级的市场。自21世纪汽车大量进入中国家庭以来,汽车在不断地更新换代,加之汽车在使用一段时间后出现机件性能下降、养护成本提高等,促使用户更新在用车辆。


一、运行环境

1、jdk

①将java文件夹拷贝到C:\ProgramFiles目录下

②配置环境变量

在系统变量中创建CLASSPATH,设置路径.;C:\ProgramFiles\Java\jdk1.8.0_131\lib

在Path中设置C:\ProgramFiles\Java\jdk1.8.0_131\bin路径

2、maven

①将maven文件夹拷贝到C:\ProgramFiles目录下

②配置环境变量

在Path中设置C:\ProgramFiles\apache-maven-3.6.3\bin

③在命令提示符输入mvn-v可以显示maven的版本号

3、idea安装

①根据向导进行安装(注意路径的选择,不要包含空格、中文字符)

②破解文件的配置

4、scala

①在idea中选择file->settings->选择plugins搜索scala进行在线安装

5、VMware虚拟机安装和hadoop

安装步骤:

(1)安装vm17

(2)安装ubuntu16  root

(3)登录ubuntu16,创建hadoop用户

$sudo passwd root

#useradd -m hadoop -s /bin/bash

#passwd  hadoop

#adduser  hadoop  sudo

#su hadoop

hadoop@ubuntu01:~$

(4)安装jdk


查看是否安装成功
$java -version

(5)下载 Hadoop

ubuntu下打开firefox浏览器,输入 www.baidu.com  ->https://hadoop.apache.org/

下载hadoop

正常在  Download

#mv  hadoop-2.10.2.tar.gz  /home/hadoop

(6)安装hadoop

hadoop@ubuntu01:$ tar -xvf  hadoop-2.10.2.tar.gz 

用tar解压后,在路径下看到hadoop的文件夹

/home/hadoop/hadoop-2.10.2/

(7)配置hadoop环境变量

$sudo  vim  /etc/profile

使配置profile生效,

$source  /etc/profile

(8)查看hadoop命令

$hadoop version

二、设计思路

  1. 数据采集:

  2. 数据处理:

  3. 数据分析:

  4. 可视化展示:

三、内容

1.数据采集

代码如下(示例):

import csv

import requests
import parsel

f = open('datacar.csv',mode='a',encoding='utf-8',newline='')
csv_writer = csv.DictWriter(f, fieldnames=[
       '标题',
       '年份',
       '里程',
       '城市',
       '价格',
       '标签儿',
       '保修又没',
       '详情页',

])
csv_writer.writeheader()
for page in range(1,51):
    print(f'=======ciajidi{page}yedeshujuneiron======')
    headers = {
        'Cookie':'......',
        'User-Agent':'......'
    }
    url=f'https://..........com/all/?page={page}&'
    response = requests.get(url=url,headers=headers)
    html_data = response.text
    print(response)
    selector = parsel.Selector(html_data)
    lis = selector.css('.Content_left .gongge_ul li')
    for li in lis:
       title = li.css('.title::attr(title)').get()
       car_info = li.css('.gongge_main p i::text').getall()
       year = car_info[0]
       mileage =car_info[1]
       city = car_info[2].strip()
       label = li.css('.car_tag em::text').get().strip()
       tag = li.css('.tc_label::text').get()
       price = li.css('.Total::text').get()
       href = li.css('.title::attr(href)').get()
       dit={
           '标题': title,
           '年份': year,
           '里程': mileage,
           '城市': city,
           '价格': price,
           '标签儿': label,
           '保修又没': tag,
           '详情页': href,

       }
       csv_writer.writerow(dit)
       print(title,year,mileage,city,price,label,tag,href)

2.功能设计和实现

  1. 车辆销售趋势分析 输入:year 输出:year、count 可视化展示:柱状图

数据处理和分析:在输入的年份范围内,统计每年的销售量,并将结果保存为 year 和 count 的列表。具体实现可以使用sql语句进行数据读取和处理,然后转换为json获取数据。

关键代码:

Html可视化关键代码:

可视化展示:

  • 结果解释和分析:根据柱状图分析车辆销售量的变化趋势,找出销售波动的原因,如政策调整、经济形势等。
  • 总结:汽车销售量在2021年左右到达最高,随后开始下降,推测是由于疫情的原因导致汽车销售量下降
  1. 价格与行驶距离分析 输入:mileage price 输出:mileage price 可视化展示:折线图

数据处理和分析:读入车辆的里程数和价格数据,将其按里程数从小到大排序并绘制成折线图展示。具体实现可以使用sql语句进行数据读取和处理,然后转换为json获取数据。

关键代码

html可视化关键代码

可视化展示:

  • 结果解释和分析:根据折线图分析价格和行驶距离的关系,找出价格变化的规律和原因,如车辆年份、品牌等。
  • 总结:行驶距离在8-10万公里平均价格最低,0-2万公里平均价格最高,随行驶距离的减少价格增高
  1. 不同城市的车型偏好分析 输入:city title count 输出:city、title、count 可视化展示:3d柱状图。具体实现可以使用sql语句进行数据读取和处理,然后转换为json获取数据。
  • 数据处理和分析:根据输入的数据,统计不同城市的车型销售量,并将结果保存为 city、title 和 count 的列表。

关键代码:

Html可视化关键代码:

可视化展示:

  • 结果解释和分析:根据 3D 柱状图分析不同城市的购车偏好,找出城市间偏好的差异和原因,如地理位置、交通情况等。
  • 总结:大众在各个城市最为密集,相比较其他品牌销售量更高,适合大多数人购买

4.数据采集:通过pycharm用pyhton语言进行数据爬取的方法获取数据

  • 数据爬取网站:https://zhengzhou.taoche.com/

关键代码:

输出展示:

5:搜索引擎本地数据:通过爬取的数据将其转换为json加载在html,通过关键字搜索获取所需数据

关键代码

   Html关键代码

   Html展示:


总结

IDEAL、HTML、Spark和Echarts是我们在完成二手车项目时用到的重要工具和技术。它们极大地提高了我们数据分析的效率和准确性,并且最终实现了我们对二手车市场的深入了解。

如果感觉对您有用,请点个关注支持一下吧,相关源码私信

标签:数据分析,title,二手车,hadoop,li,可视化,安装,css
From: https://blog.csdn.net/weixin_75027717/article/details/137185817

相关文章

  • 毕业设计:基于python的药品销售数据分析可视化系统 大数据
    目录前言课题背景和意义实现技术思路一、算法理论基础1.1 ETL技术1.2OLAP技术1.3数据可视化二、 数据集三、实验及结果分析3.1 实验环境搭建3.2 模型训练最后前言  ......
  • 【全开源】JAVA二手车交易二手车市场系统源码支持微信小程序+微信公众号+H5+APP_博纳
    二手车交易二手车市场系统源码微信小程序——买卖无忧,交易更便捷在日益繁荣的二手车市场中,寻找一个高效、可靠的交易平台成为了买卖双方共同的需求。为满足这一需求,我们推出了二手车交易二手车市场系统源码微信小程序,让买卖无忧,交易更便捷。这款微信小程序整合了丰富的二手车......
  • 数据分析师英文简历(精选篇)
    数据分析师英文求职简历范文参考一份精准且具有说服力的英文求职简历,对于数据分析师求职至关重要,为此,我们整理一篇数据分析师英文求职简历范文,欢迎大家阅读参考。同时,也诚邀体验我们丰富的简历模板和便捷的在线制作工具,助大家轻松打造专业求职简历。WorkExperienceTime:&n......
  • 4.Python数据分析—数据分析入门知识图谱&索引(知识体系下篇)
    4.Python数据分析—数据分析入门知识图谱&索引-知识体系下篇一·个人简介二·机器学习基础2.1监督学习与无监督学习2.1.1监督学习:2.1.2无监督学习:2.2特征工程2.3常用机器学习算法概述2.3.1监督学习算法:2.3.2无监督学习算法:2.3.3强化学习:2.4模型评估与选择三......
  • 基于spark的大数据分析预测地震受灾情况的系统设计
    基于spark的大数据分析预测地震受灾情况的系统设计在本篇博客中,我们将介绍如何使用ApacheSpark框架进行地震受灾情况的预测。我们将结合数据分析、特征工程、模型训练和评估等步骤,最终建立一个预测模型来预测地震造成的破坏程度,同时使用可视化大屏的方式展示数据的分布。......
  • 石家庄铁道大学2024年春季 2020 级课堂测试试卷—数据分析练习
    石家庄铁道大学2024年春季  2020级课堂测试试卷—数据分析练习课程名称: 大数据库技术与应用  任课教师:王建民  考试时间: 实现为止 分钟  一、 原始数据: 二、 地域维度标准化:地域属性在科技成果分析中作为一个重要维度,其标准取值非常必要,目前我国采用的标......
  • 【前端素材】推荐5种优质大数据分析展示页面网站设计(16)(附源码)
    一、需求分析1、功能分析大数据分析展示页面是一个用于呈现和分析大数据的平台界面,旨在帮助用户更直观、更高效地理解和利用数据。该页面通常结合了数据分析、可视化技术以及用户交互设计,以提供丰富的数据展示和分析功能。大数据分析展示页面是大数据分析过程中至关重要的一......
  • 【前端素材】推荐5种优质大数据分析展示页面网站设计(18)(附源码)
    一、需求分析1、功能分析大数据分析展示页面是一个用于呈现和分析大数据的平台界面,旨在帮助用户更直观、更高效地理解和利用数据。该页面通常结合了数据分析、可视化技术以及用户交互设计,以提供丰富的数据展示和分析功能。大数据分析展示页面是大数据分析过程中至关重要的一......
  • 深入浅出数据分析-CH13整理数据-R语言/EXCEL
    EXCEL原始数据,本文章附件,下面介绍两种处理方式:EXCEL&R 一、EXCEL清洗数据格式点分列的第一个分列 填入其他一个#,点击下一步完成 分列后的表格如图 按下ctrl+F,点击替换全部  此时此刻处理完成FirstName,开始处理LastName选中C列 CTRL+F,输入(*),点击全部替......
  • 172基于springboot的二手车交易系统的设计与实现
    ......