首页 > 编程语言 >【House Prices】程序改进1

【House Prices】程序改进1

时间:2023-10-09 20:22:07浏览次数:32  
标签:尝试 变量 House NaN 选取 改进 Prices

基本思路

我们第一次实现是选取了十个基本变量作为特征,训练集里NaN的值全都填了0。

仔细想想,可以多选取几个变量,这样或许能提高预测的正确率。

具体实现

首先,我输出了15个关系度比较大的变量,其中,"YearRemodAdd","Fireplaces","BsmtFinSF1"是三个有价值的变量,可以尝试加进去看看效果

结果与反思

喜提0.6分,还不如第一次

仔细想想,实际上我训练出的模型就是一个数学公式,增加这些0.3 0.4相关度的东西反而会导致计算不精确。也许下一次可以试试少一个变量

尝试删除了两个变量,只保留八个变量后,分数比12个变量好,但是比10个变量差很多。

我重新考虑了一下,也许可以从NaN值入手。

 

 

 

标签:尝试,变量,House,NaN,选取,改进,Prices
From: https://www.cnblogs.com/railgunRG/p/17753057.html

相关文章

  • Clickhouse时间日期函数一文详解+代码展示
    转:https://blog.csdn.net/master_hunter/article/details/125762575一、时间函数和MySQL时间函数有些不同,但是时间函数的功能是一样的,这里把常用的时间函数给出,效果以实际代码运行结果为准: 1.取当前时间SELECT now()AStimeSELECT today()AStime获取当前时间戳SELECT ......
  • clickhouse及gbase中文字段导出的问题
    【1】clickhouse及gbase中文字段导出可能出现换行或者乱码等情况导出时可以使用正则表达式替换特殊字符clickhouse:replace(replace(replaceRegexpAll(substring(coalesce(XXXX,''),1,2),'"|\'|\\|/||\|',''),char(10),''),char(13),'')gbase:......
  • docker安装clickhouse
    #创建相关配置目录mkdir-p/data/clickhouse/datamkdir-p/data/clickhouse/confmkdir-p/data/clickhouse/log#拉取镜像#下载最新版本clickhousedockerpullclickhouse/clickhouse-server#下载指定版本clickhousedockerpullclickhouse/clickhouse-server:23.1.3.5-alp......
  • 点赞功能改进-定时任务持久化缓存数据
             ......
  • 点赞功能改进-改造查询点赞状态接口
               ......
  • 点赞功能改进-改造点赞和取消点赞接口
                ......
  • ClickHouse内存配置参数
    1.max_memory_usage运行单个查询时使用的最大内存量。默认设置为无限(设置为0)。该设置不考虑可用内存容量或机器上的内存总量。该限制适用于单个服务器中的单个查询。你可以使用SHOWPROCESSLIST查看每个查询的当前内存消耗。此外,每次查询的内存消耗峰值都会被跟踪并写入日志。某......
  • 【House Prices】基本思路
    在考虑使用什么模型之前,我们先看评分标准和数据特点Kaggle给的评测标准是用"均方根误差",可以联想到,可能是一个线性回归问题。看一下数据情况    ......
  • ClickHouse选择正确的join算法
    支持的JOIN类型 JOIN算法概览clickhouse提供了6种JOIN算法:1.直接连接(Directjoin)2.哈希连接(Hashjoin)3.并行哈希连接(Parallelhashjoin)4.优雅哈希连接(Gracehashjoin)5.全排序合并连接(Fullsortingmergejoin)6.部分合并连接(Partialmergejoin) 这......
  • 火山引擎 ByteHouse:TB 级数据下,如何实现高效、稳定的数据导入
    更多技术交流、求职机会,欢迎关注字节跳动数据平台微信公众号,回复【1】进入官方交流群近期,火山引擎开发者社区、火山引擎数智平台(VeDI)联合举办以《数智化转型背景下的火山引擎大数据技术揭秘》为主题的线下Meeup。活动主要从数据分析、数据治理、研发提效等角度,带领数据领域从业者......