人工智能02-简单分类问题？逻辑回归！

时间：2024-03-18 20:30:49浏览次数：34

标签：02 逻辑 right log 人工智能 0.5 xi theta left

02-逻辑回归

引入

问题：根据余额判断小明是否回去看电影。
训练数据：

余额	-5	-4	-3	-2	-1	1	2	3	4	5
是否看电影（0/1）	0	0	0	0	0	1	1	1	1	1

Y = 0.1364 x + 0.5 → y = { 1 , Y ≥ 0.5 0 , Y > 0.5 Y=0.1364x+0.5\rightarrow y=\begin{cases}1,Y\geq0.5 \\ 0,Y>0.5\end{cases} Y=0.1364x+0.5→y={1,Y≥0.50,Y>0.5
但是，当加入一个数据 ( 50 , 1 ) (50,1) (50,1)时，数据不对称，其实当 x = 1 x=1 x=1时，被预测为 Y = 0.4888 , y = 0 Y=0.4888,y=0 Y=0.4888,y=0，准确率降低！

在这里插入图片描述

不能再使用线性回归！

分类任务

基本框架：
{ y = f ( x 1 , x 2 , ⋯ , x n ) , y = 0 , 1 , ⋯ , n − 1 判断为类别 I , 如果 y = i , i = 0 , 1 , ⋯ , n − 1 \left\{ \begin{aligned} y=f(x_1,x_2,\cdots,x_n),y=0,1,\cdots,n-1 \\ \text{判断为类别}I,\text{如果}y=i,i=0,1,\cdots,n-1 \end{aligned} \right. {y=f(x1,x2,⋯,xn),y=0,1,⋯,n−1判断为类别I,如果y=i,i=0,1,⋯,n−1

逻辑回归

简单逻辑回归

定义：用于解决分类问题的一种模型。根据数据特征或属性，计算其归属于某一类别的概率 P ( x ) P(x) P(x)，根据概率数值判断其所属类别。
主要应用场景：二分类问题

例如引入中的问题，可表示为sigmoid方程：

P ( x ) = 1 1 + e − x , y = { 1 , P ( x ) ≥ 0.5 0 , P ( x ) < 0.5 P(x)=\frac{1}{1+e^{-x}},y=\begin{cases}1,P(x)\geq0.5\\0,P(x)<0.5\end{cases} P(x)=1+e−x1,y={1,P(x)≥0.50,P(x)<0.5
在这里插入图片描述

其中， y y y为类别结果， P P P为概率分布函数， x x x为特征值。

复杂逻辑回归

在这里插入图片描述

如图，此时为二维问题， x 1 , x 2 x_1,x_2 x1,x2均作为输入，两个自变量判断 y 1 y_1 y1的概率，此时的概率函数为：
P ( x ) = 1 1 + e − g ( x ) , g ( x ) = θ 0 + θ 1 x 1 + θ 2 x 2 P(x)=\frac{1}{1+e^{-g(x)}},g(x)=\theta_0+\theta_1x_1+\theta_2x_2 P(x)=1+e−g(x)1,g(x)=θ0+θ1x1+θ2x2
此时， g ( x ) g(x) g(x)即为图中蓝色线的表达式，该线称为决策边界(Decision Boundary)。许多决策问题即为找出决策边界。

在这里插入图片描述

再举一个栗子，如图决策边界为圆形， x 1 , x 2 x_1,x_2 x1,x2均作为输入，两个自变量判断概率 y 1 y_1 y1，此时的概率函数为：
P ( x ) = 1 1 + e − g ( x ) , g ( x ) = θ 0 + θ 1 x 1 + θ 2 x 2 + θ 3 x 1 2 + θ 4 x 2 2 P(x)=\frac{1}{1+e^{-g(x)}},g(x)=\theta_0+\theta_1x_1+\theta_2x_2+\theta_3x_1^2+\theta_4x_2^2 P(x)=1+e−g(x)1,g(x)=θ0+θ1x1+θ2x2+θ3x12+θ4x22
⋆ \star ⋆逻辑回归结合多项式边界函数可解决复杂的分类问题！

损失函数

J i = { − log ⁡ ( P ( x i ) ) , y i = 1 − log ⁡ ( 1 − P ( x i ) ) , y i = 0 J_i=\begin{cases}-\log\left(P\left(x_i\right)\right),y_i=1\\-\log\left(1-P\left(x_i\right)\right),y_i=0 \end{cases} Ji={−log(P(xi)),yi=1−log(1−P(xi)),yi=0

P ( x i ) P(x_i) P(xi)即 x i x_i xi为正样本的概率函数， x i x_i xi的损失函数 J i J_i Ji理解：

当 y i = 1 y_i=1 yi=1即为正样本，若 P ( x i ) = 0 P(x_i)=0 P(xi)=0时，此时损失极大，随着其接近1，损失减小
当 y i = 0 y_i=0 yi=0即为负样本，若 P ( x i ) = 1 P(x_i)=1 P(xi)=1时，此时损失极大，随着其接近0，损失减小

接下来最小化损失函数：
J = 1 m ∑ i = 1 m J i = − 1 m [ ∑ i = 1 m ( y i log ⁡ ( P ( x i ) ) ) + ( 1 − y i ) log ⁡ ( 1 − P ( x i ) ) ] J=\frac{1}{m}\sum^m_{i=1}J_i=-\frac{1}{m}\left[\sum^m_{i=1}\left(y_i\log{\left(P\left(x_i\right)\right)}\right)+(1-y_i)\log{\left(1-P\left(x_i\right)\right)}\right] J=m1i=1∑mJi=−m1[i=1∑m(yilog(P(xi)))+(1−yi)log(1−P(xi))]
此时， P ( x ) = 1 1 + e − g ( x ) , g ( x ) = θ 0 + θ 1 x 1 + ⋯ P(x)=\frac{1}{1+e^{-g(x)}},g(x)=\theta_0+\theta_1x_1+\cdots P(x)=1+e−g(x)1,g(x)=θ0+θ1x1+⋯

使用梯度下降法，重复计算直到收敛：
{ t e m p θ j = θ j − α ∂ ∂ θ j J ( θ ) θ j = t e m p θ j } \begin{Bmatrix} temp_{\theta_j}=\theta_j-\alpha\frac{\partial}{\partial\theta_j}J(\theta)\\ \theta_j=temp_{\theta_j} \end{Bmatrix} {tempθj=θj−α∂θj∂J(θ)θj=tempθj}

以上为B站BV1884y1k7cv的课程笔记，如有不足之处请指出，谢谢！

标签：02,逻辑,right,log,人工智能,0.5,xi,theta,left
From： https://blog.csdn.net/qq_50475642/article/details/136793864

LeetCode2024年3月18日每日一题（303. 区域和检索 - 数组不可变）
303.区域和检索-数组不可变一维前缀和定义构建前缀和数组区间求和示例适用场景题目代码解释成员变量构造函数`sumRange`方法注释版代码一维前缀和是处理数组区间求和问题的一种非常有效的方法。它通过预处理输入数组，使得任何区间的和都可以在常数时间内被计算......
Unity类银河恶魔城学习记录10-14 p102 Applying damage to skills and clean up源代码
Alex教程每一P的教程原代码加上我自己的理解初步理解写的注释，可供学习Alex教程的人参考此代码仅为较上一P有所改变的代码【Unity教程】从0编程制作类银河恶魔城游戏_哔哩哔哩_bilibiliEntity.csusingSystem.Collections;usingSystem.Collections.Generic;usingUnit......
L2-022 重排链表
这道题真的烦，输出想半天。反正就是要区分奇偶，才能知道那个结点最后要打印出-1.我看网上遇到的都是测试点3的问题，不过我有问题的是测试点1，前三个出问题就是节点数奇偶的问题。#include<bits/stdc++.h>usingnamespacestd;map<int,pair<int,int>>mp;intmain(){ ints......
华为OD机试真题-找数字-2024年OD统一考试（C卷）
题目描述：小扇和小船今天又玩起来了数字游戏，小船给小扇一个正整数n(1<=n<=1e9)，小扇需要找到一个比n大的数字m，使得m和n对应的二进制中1的个数要相同（如4对应二进制100,8对应二进制1000,1的个数都为1），现在求m的最小值。输入描述：输入：第一行输入一个正整数n(1<=n<=1e9)。输出......
刷题日记——干碎那个BFS！(含国科大机试2021)
例题小引——迷宫问题问题描述:迷宫由n行m列的单元格组成(n，m都小于等于50），每个单元格要么是空地，要么是障碍物。现请你找到一条从起点到终点的最短路径长度。分析——（迷宫问题BFS解法）使用BFS算法，进行广度优先遍历，总体思路是访问一个结点，就把相邻的结点入队，然后下一个访......
2024.2.27校招实习内推面经
绿*泡*泡VX：neituijunsir 交流*裙，内推/实习/校招汇总表格1、校招|蔚来2024届春季校园招聘启动（内推）校招|蔚来2024届春季校园招聘启动（内推）2、校招|经纬恒润2024春季校园招聘正式启动（内推）校招|经纬恒润2024春季校园招聘正式启动（内推）3、校招|众星智能2024......
B3856 [语言月赛 202309] 椰奶国
题目背景扶苏的梦想是在椰奶国生活。这个国度的成员都是可爱的椰奶，椰奶们无需在意外面的世界，快乐地生活在椰奶国里。题目描述椰奶国的一天共有 n 个小时。第 i 个小时（0≤i<n）共有 i+1 分钟，第 i 个小时的第 j 分钟（0≤j≤i）共有 10j+1 秒。注意，这里小时、分钟、秒......
2024渲染农场的软件选择指南
渲染农场是为影视动画、设计效果图等提供渲染服务的平台。根据运行方式，渲染农场可以分为本地渲染农场和云渲染农场。但目前，云渲染农场由于其庞大的计算机算力和专业维护团队，成为了主流选择，能够满足影视级别的渲染任务。无论是本地还是云渲染农场，其核心在于支持的软件。下面看看2......
2024/3/18
三一重工沃尔核材海南椰岛雪人股份铝中航光电盘龙药业对未来经济大形势，大盘，行业先有一个大概判断--判断是上升的，可以玩选方向，半导体/5G/医药/新能源/汽车/人工智能/智能驾驶/氢能源/资源类/白酒/军工/消费电子/工程机械，他们都有技术上修复的需求和可能性，但是反弹力度有大......
2024年3月的计算机视觉论文推荐
从去年开始，针对LLM的研究成为了大家关注的焦点。但是其实针对于计算机视觉的研究领域也在快速的发展。每周都有计算机视觉领域的创新研究，包括图像识别、视觉模型优化、生成对抗网络(gan)、图像分割、视频分析等。我们今天来总结一下2024年3月上半月份发表的最重要的论文，无论您是......

人工智能02-简单分类问题？逻辑回归！

02-逻辑回归

引入

分类任务

逻辑回归

简单逻辑回归

复杂逻辑回归

损失函数

相关文章

赞助商

阅读排行