逻辑回归是一种广义的线性回归模型,用于解决二分类问题。它通过Sigmoid函数将线性回归模型的输出转换为0到1之间的概率值,用于预测二元响应变量的分类概率。在逻辑回归中,我们通过极大化似然函数或最小化损失函数(如对数损失函数)来求解模型参数,并利用梯度下降算法进行参数优化。
案例分析
前进银行搜集了贷款用户的数据,包括用户年龄、欠款额(百元)、月收入(元)和是否逾期的信息,数据在下表中。使用五个用户的数据建立一个逻辑回归模型。通过6号用户的个人信息,判断用户贷款20万元后是否会逾期。
阶段一:建立逻辑回归模型
STEP1:加载数据集
import pandas as pd
df = pd.read_csv("exp08credit-overdue.csv", header=0) # 加载数据集
df.head() #查看前5行数据
STEP2:绘制数据的散点图,查看数据分布情况
from matplotlib import pyplot as plt
## 在Notebook中内嵌绘图,使得绘制的图形可以直接在Notebook中显示
%matplotlib inline
plt.figure(figsize=(10, 6))
# 定义了一个字典map_size,它将overdue列的值(假设为0或1)映射到一个特定的大小
map_size = {0: 20, 1: 100}
# 使用map函数和一个匿名函数(lambda函数)来根据df['overdue']列中的每个值从map_size字典中获取对应的大小,
# 并将结果转换为列表。这样,我们就得到了一个与df['overdue']列相对应的大小列表。
size = list(map(lambda x: map_size[x], df['overdue']))
# 根据DataFrame df中的三列数据('debt', 'income', 和 'overdue')来绘制一个散点图
# 其中点的大小和颜色都根据'overdue'列的值来确定。
plt.scatter(df['debt'],df['income'], s=size,c=df['overdue'],marker='v')
标签:map,逻辑,函数,逾期,df,回归,用户,overdue,size
From: https://blog.csdn.net/lingqi070/article/details/140363912