首页 > 其他分享 >2022年工匠杯赛题

2022年工匠杯赛题

时间:2022-09-03 16:11:09浏览次数:55  
标签:format df coef 工匠 train 杯赛 2022 test mse

1. 第一题

from random import choice
from numpy import *
import pandas as pd
import matplotlib.pyplot as plt

#1 
df = pd.read_csv('stock_prices.tsv', sep='\t')

n1 = choice(df[df['Industry']=='retail']['Symbol'].unique())
n2 = choice(df[df['Industry']=='health']['Symbol'].unique())
print('stock: {}, {}'.format(n1, n2))

s1 = df[(df['Industry']=='retail') & (df['Symbol']==n1)].sort_values('Date')['Adj Close']
s2 = df[(df['Industry']=='health') & (df['Symbol']==n2)].sort_values('Date')['Adj Close']

log1 = (log(s1)-log(s1.shift(1))).dropna()
log2 = (log(s2)-log(s2.shift(1))).dropna()

print('mean: {}, {}'.format(mean(log1), mean(log2)))
print('std: {}, {}'.format(std(log1), std(log2)))
print('var: {}, {}'.format(var(log1), var(log2)))
print('corrcofe: {}'.format(corrcoef(log1,log2)[0,1]))

#2
l,x,y=[],[],[]
for w in arange(0, 1.1, 0.1):
  ary = w*array(log1)+(1-w)*array(log2)
  la = '({:.0%},{:.0%})'.format(w,1-w)
  st = std(ary)
  me= mean(ary)
  print('{}, std:{}, mean:{}'.format(la,st,me))
  l.append(la)
  x.append(st)
  y.append(me)
  
# 3
plt.scatter(x,y)
idx = argmin(x)
plt.text(x[idx],y[idx],l[idx],c='r')
plt.show()

2. 第一题

import pandas as pd
import matplotlib.pyplot as plt
from sklearn.model_selection import train_test_split
from sklearn.linear_model import LinearRegression, Lasso, Ridge
from sklearn.metrics import mean_squared_error as mse

#1 
df = pd.read_csv('loan_amount_by_risk_control_zscore.tsv', sep='\t')

x = df[['ApplicantIncome']]
y = df[['LoanAmount']]
x_train,x_test,y_train,y_test = train_test_split(x, y)

r = LinearRegression().fit(x_train,y_train)
y_p = r.predict(x_test)
print('Linear, coef:{}, inter:{}, mse:{}'.format(r.coef_, r.intercept_, mse(y_test,y_p)))


#2
r1 = Lasso(alpha=0.1).fit(x_train,y_train)
y_p1 = r1.predict(x_test)
print('L1, coef:{}, inter:{}, mse:{}'.format(r1.coef_, r1.intercept_, mse(y_test,y_p1)))

r2 = Ridge(alpha=0.1).fit(x_train,y_train)
y_p2 = r2.predict(x_test)
print('L2, coef:{}, inter:{}, mse:{}'.format(r2.coef_, r2.intercept_, mse(y_test,y_p2)))

plt.scatter(x_test,y_test)
plt.plot(x_test,y_p,label='Linear')
plt.plot(x_test,y_p1,label='L1')
plt.plot(x_test,y_p2,label='L2')
plt.legend()
plt.show()

#3
x = df[['Gender','Married','Dependents','Education','Self_Employed','ApplicantIncome','CoapplicantIncome']]
y = df[['LoanAmount']]
x_train,x_test,y_train,y_test = train_test_split(x, y)

r = LinearRegression().fit(x_train,y_train)
y_p = r.predict(x_test)
print('Linear, coef:{}, inter:{}, mse:{}'.format(r.coef_, r.intercept_, mse(y_test,y_p)))

r1 = Lasso(alpha=0.1).fit(x_train,y_train)
y_p1 = r1.predict(x_test)
print('L1, coef:{}, inter:{}, mse:{}'.format(r1.coef_, r1.intercept_, mse(y_test,y_p1)))

r2 = Ridge(alpha=0.1).fit(x_train,y_train)
y_p2 = r2.predict(x_test)
print('L2, coef:{}, inter:{}, mse:{}'.format(r2.coef_, r2.intercept_, mse(y_test,y_p2)))

标签:format,df,coef,工匠,train,杯赛,2022,test,mse
From: https://www.cnblogs.com/unique2cxy/p/16652771.html

相关文章

  • 2022-2023-1 20221326 《计算机基础与程序设计》第一周学习总结
    作业信息班级:https://edu.cnblogs.com/campus/besti/2022-2023-1-CFAP作业要求:https://www.cnblogs.com/rocedu/p/9577842.html#WEEK01作业目标:快速浏览教材作业正文:博客......
  • CVE-2022-22978 Spring-Security 漏洞复现
    1说明在SpringSecurity中使用RegexRequestMatcher且规则中包含带点号的正则表达式时,攻击者可以通过构造恶意数据包绕过身份认证2环境搭建环境搭建地址可以参考如下的......
  • redis缓存恢复-2022新项目
    一、业务场景Web项目开发中,为了加快数据处理的的效率,大量的使用了各种缓存,缓存技术主要使用的是redis。导致出现的小小的问题是对redis缓存形成了一个比较强的依赖,并......
  • 2022-2023-1 20221301 《计算机基础与程序设计》第1周学习总结
    2022-2023-120221301《计算机基础与程序设计》第1周学习总结安装Linux操作系统,学习Linux基础这个作业属于哪个课程<班级的链接>(2022-2023-1-计算机基础与程序设计)......
  • NOI 2022梦游记
    Day1:开场看了一下T1,会了nlog线段树合并摩尔投票做法。然后开T2,看了30min不会,润回T1。9:00的时候过了T1,再来看T2。看到10:00还是不会,开始打表。看表看到11:00还是不会。猛......
  • 2022-2023-1 20221420 《计算机基础与程序设计》第1周学习总结
    第一章1.1出现量子计算机之前还会不会有新一代计算机。1.2下一代软件是否有可能实现编程的简易化,实现人人可编程。第二章2.1会不会出现三进制或者其他进制的计算机。2.2......
  • 适合初学者的 7 个有趣的 CSS 项目创意和主题 [2022]
    适合初学者的7个有趣的CSS项目创意和主题[2022]任何想成为网页设计师的人都必须了解CSS的重要性。您的网站可以使用CSS进行创造性的设计和布局,使其具有独特的外......
  • NOI2022游记
    就简单记录一下两天比赛的过程。Day1比赛前想的是要尽快切完前两题,第三题多打一点部分分,争取拿到250+。打开题面,发现有一个交互题,简单扫了一眼,就大概知道这题非常毒瘤,应......
  • 2022.36 AIOT 概念
    AIoT融合AI技术和IoT技术,通过物联网产生、收集来自不同维度的、海量的数据存储于云端、边缘端,再通过大数据分析,以及更高形式的人工智能,实现万物数据化、万物智联化。物联网......
  • 前端面试题 JavaScript 基础 —— 2022-09-03
    每日3题13以下代码执行后,控制台中的输出内容为?Object.prototype.a=1;Function.prototype.b=2;functionF(){}varf=newF();console.log(F.a);console.lo......