首页 > 其他分享 >机器学习之logistic回归

机器学习之logistic回归

时间:2024-06-30 23:53:58浏览次数:1  
标签:机器 mat weight 回归 list label logistic line data

import numpy as np
from matplotlib import pyplot as plt


def load_dataset():
    data_list = []
    label_list = []
    with open('testSet.txt', 'r') as f:
        for line in f.readlines():
            line_arr = line.strip().split()
            data_list.append([1.0, float(line_arr[0]), float(line_arr[1])])
            label_list.append(int(line_arr[2]))
    return data_list, label_list


def sigmoid(x):
    return 1.0 / (1.0 + np.exp(-x))


def grad_ascent(data_list, label_list):
    alpha = 0.001
    data_mat = np.matrix(data_list)
    label_mat = np.matrix(label_list).transpose()
    m, n = data_mat.shape
    max_cycles = 500
    weight = np.ones((n, 1))
    for i in range(max_cycles):
        h = sigmoid(data_mat * weight)
        error = label_mat - h
        weight = weight + alpha * data_mat.transpose() * error
    return weight


def plot_best_fit(weight):
    data_list, label_list = load_dataset()
    data_arr = np.array(data_list)
    n = data_arr.shape[0]
    x_cord1 = []
    y_cord1 = []
    x_cord2 = []
    y_cord2 = []
    for i in range(n):
        if label_list[i] == 1:
            x_cord1.append(data_arr[i, 1])
            y_cord1.append(data_arr[i, 2])
        else:
            x_cord2.append(data_arr[i, 1])
            y_cord2.append(data_arr[i, 2])
    fig = plt.figure()
    ax = fig.add_subplot(111)
    ax.scatter(x_cord1, y_cord1, s=10, c='red', marker='s')
    ax.scatter(x_cord2, y_cord2, s=10, c='green')
    x = np.arange(-3.0, 3.0, 0.1)
    y = (-weight[0, 0] - weight[1, 0] * x) / weight[2, 0]
    ax.plot(x, y)
    plt.xlabel('X1')
    plt.ylabel('X2')
    plt.show()


def random_grad_ascent(data_list, label_list):
    data_mat = np.matrix(data_list)
    label_mat = np.matrix(label_list).transpose()
    m, n = data_mat.shape
    alpha = 0.01
    weight = np.ones((n, 1))
    for i in range(m):
        h = sigmoid(data_mat * weight)
        error = label_mat - h
        weight = weight + alpha * data_mat.transpose() * error
    return weight


def random_grad_ascent1(data_list, label_list, num=150):
    data_mat = np.matrix(data_list)
    label_mat = np.matrix(label_list).transpose()
    m, n = data_mat.shape
    weight = np.ones((n, 1))
    for i in range(num):
        data_index = range(m)
        for j in range(m):
            alpha = 4 / (1.0 + i + j) + 0.01
            rand_index = int(np.random.uniform(0, len(data_index)))
            h = sigmoid(data_mat[data_index[rand_index]] * weight)
            error = label_mat[rand_index] - h
            weight = weight + alpha * data_mat[data_index[rand_index]].transpose() * error
            # del data_index[rand_index]
    return weight


def classify_vector(x, weight):
    prob = sigmoid(sum(x * weight))
    return 1.0 if prob > 0.5 else 0.0


def colic_test():
    with open('horseColicTraining.txt', 'r') as f:
        train_set = []
        train_label = []
        for line in f.readlines():
            line_arr1 = line.strip().split("\t")
            line_arr2 = [float(_) for _ in line_arr1[:21]]
            train_set.append(line_arr2)
            train_label.append(float(line_arr1[21]))
    train_weight = random_grad_ascent1(data_list=train_set, label_list=train_label)
    error_count = 0
    num_test_vec = 0.0
    with open('horseColicTest.txt', 'r') as f:
        for line in f.readlines():
            num_test_vec += 1.0
            line_arr1 = line.strip().split("\t")
            line_arr2 = [float(_) for _ in line_arr1[:21]]
            if int(classify_vector(np.array(line_arr2), train_weight)) != int(line_arr1[21]):
                error_count += 1
    error_rate = error_count / num_test_vec
    return error_rate


def multi_test():
    num_test = 10
    error_sum = 0.0
    for i in range(num_test):
        error_sum += colic_test()
    print(f"num_test={num_test}, error_sum={error_sum},error_rate={error_sum / num_test}")


if __name__ == '__main__':
    data_list, label_list = load_dataset()
    weight1 = grad_ascent(data_list, label_list)
    plot_best_fit(weight1)
    weight2 = random_grad_ascent(data_list, label_list)
    plot_best_fit(weight2)
    weight3 = random_grad_ascent1(data_list, label_list, num=150)
    plot_best_fit(weight3)
    multi_test()

其他logistic示例或者基于主流机器学习框架实现的决策树代码地址:

https://gitee.com/navysummer/machine-learning/tree/master/logistic

  

标签:机器,mat,weight,回归,list,label,logistic,line,data
From: https://www.cnblogs.com/navysummer/p/18277203

相关文章

  • 独家原创 | Matlab实现CNN-Transformer多变量回归预测
    独家原创|Matlab实现CNN-Transformer多变量回归预测目录独家原创|Matlab实现CNN-Transformer多变量回归预测效果一览基本介绍程序设计参考资料效果一览基本介绍1.Matlab实现CNN-Transformer多变量回归预测;2.运行环境为Matlab2023b及以上;3.data为数......
  • 【机器学习】Datawhale-AI夏令营分子性质AI预测挑战赛
    #ai夏令营#datawhale#夏令营1.赛事简介还是大家熟悉的预测算法类:分子性质AI预测挑战赛要求选手根据提供的demo数据集,可以基于demo数据集进行数据增强、自行搜集数据等方式扩充数据集,并自行划分数据。运用深度学习、强化学习或更加优秀人工智能的方法预测PROTACs的降解......
  • 贝叶斯回归器概览
    序言线性回归是机器学习中一种常用的回归方法。线性回归基于这样的假设,即基础数据是正态分布的,并且所有相关的预测变量与结果具有线性关系。但在现实世界中,这并不总是可能的,它将遵循这些假设,贝叶斯回归可能是更好的选择。贝叶斯回归使用关于数据的先验信念或知识来“学习......
  • 应用数学与机器学习基础 - 深度学习的动机与挑战篇
    序言深度学习,作为当代人工智能领域的核心驱动力,其动机源于对模拟人类智能深层认知机制的渴望。我们追求的是让机器能够像人类一样理解、分析并应对复杂多变的世界。然而,这一追求之路并非坦途,面临着数据获取与处理的挑战、模型复杂度的控制、计算资源的巨大消耗等重重障碍。......
  • 【深度学习】图形模型基础(3):从零开始认识机器学习模型
    1.引言机器学习,这一古老而又充满活力的领域,其历史可追溯至上世纪中叶。然而,直到20世纪90年代初,机器学习才开始展现出其广泛的应用潜力。在过去的十年里,机器学习更是迎来了前所未有的蓬勃发展,其应用范畴广泛,不仅在网络搜索、自动驾驶汽车、医学成像和语音识别等领域大放异彩......
  • 【Python机器学习】聚类算法的对比与评估——在人脸数据集上比较算法
    数据探查:我们将k均值、DBSCAN和凝聚聚类算法应用于Wild数据集中的LabeledFaces,并查看它们是否找到了有趣的结构。我们将使用数据的特征脸表示,它由包含100个成分的PCA(whiten=True)生成:people=fetch_lfw_people(data_home="C:\\Users\\86185\\Downloads\\",min_faces_per_......
  • 【机器学习】在【Pycharm】中的应用:【线性回归模型】进行【房价预测】
     专栏:机器学习笔记pycharm专业版免费激活教程见资源,私信我给你发python相关库的安装:pandas,numpy,matplotlib,statsmodels1.引言线性回归(LinearRegression)是一种常见的统计方法和机器学习算法,用于根据一个或多个特征变量(自变量)来预测目标变量(因变量)的值。在许多实际......
  • 机器人控制系列教程之关节空间运动控制器搭建(2)
    推文:机器人控制系列教程之关节空间运动控制器搭建(1)中,主要讲解了在关节空间中,基于计算力矩的控制系统设计和搭建,我们直接使用了Simulink中的JointSpaceMotionModel模块来进行控制系统的搭建和调试,下面我们将详细讲解一下另外两种控制器。PD控制器在基于PD控制器来控制......
  • 想要成为一名人工智能从业者?系统学习机器学习是重点!
    想要成为一名人工智能从业者?系统学习机器学习是重点!机器学习是一门不需要进行明确编程就能使计算机发挥作用的科学。在过去的十年里,机器学习已经为我们提供了自动驾驶汽车、实时语音识别、高效网络搜索等实用工具,并帮助我们极大地提升了对人类基因组的认知。许多研究人员都......
  • 【机器学习】自然语言处理的新前沿:GPT-4与Beyond
      ......