基本思路
我们第一次实现是选取了十个基本变量作为特征,训练集里NaN的值全都填了0。
仔细想想,可以多选取几个变量,这样或许能提高预测的正确率。
具体实现
首先,我输出了15个关系度比较大的变量,其中,"YearRemodAdd","Fireplaces","BsmtFinSF1"是三个有价值的变量,可以尝试加进去看看效果
结果与反思
喜提0.6分,还不如第一次
仔细想想,实际上我训练出的模型就是一个数学公式,增加这些0.3 0.4相关度的东西反而会导致计算不精确。也许下一次可以试试少一个变量
尝试删除了两个变量,只保留八个变量后,分数比12个变量好,但是比10个变量差很多。
我重新考虑了一下,也许可以从NaN值入手。
标签:尝试,变量,House,NaN,选取,改进,Prices From: https://www.cnblogs.com/railgunRG/p/17753057.html