阶跃函数Sigmoid

\[g(z)=\frac{1}{1+e^{-z}} \]

线性函数进行sigmoid操作

\[h_{\theta}(x)=g\left(\theta^{T} x\right)=\frac{1}{1+e^{-\theta^{T} x}} \]

对于分类任务

\[\begin{array}{l}P(y=1 \mid x ; \theta)=h_{\theta}(x) \\ P(y=0 \mid x ; \theta)=1-h_{\theta}(x)\end{array} \]

整合以上式子得出

\[P(y \mid x ; \theta)=\left(h_{\theta}(x)\right)^{\mathrm{y}}\left(1-h_{\theta}(x)\right)^{1-y} \]

得出似然函数

\[L(\theta)=\prod_{i=1}^{m} P\left(y_{i} \mid x_{i} ; \theta\right)=\prod_{i=1}^{m}\left(h_{\theta}\left(x_{i}\right)\right)^{y_{i}}\left(1-h_{\theta}\left(x_{i}\right)\right)^{1-y_{i}} \]

得出对数似然函数

\[l(\theta)=\log L(\theta)=\sum_{i=1}^{m}\left(y_{i} \log h_{\theta}\left(x_{i}\right)+\left(1-y_{i}\right) \log \left(1-h_{\theta}\left(x_{i}\right)\right)\right) \]

以上极大似然，当然是越大越好，这样就需要梯度上升，转化为梯度下降如下

\[J(\theta)=-\frac{1}{m} l(\theta) \]

对似然函数求导

\[\begin{array}{l}l(\theta)=\log L(\theta)=\sum_{i=1}^{m}\left(y_{i} \log h_{\theta}\left(x_{i}\right)+\left(1-y_{i}\right) \log \left(1-h_{\theta}\left(x_{i}\right)\right)\right) \\ \frac{\delta}{\delta_{\theta_{j}}} J(\theta)=-\frac{1}{m} \sum_{i=1}^{m}\left(y_{i} \frac{1}{h_{\theta}\left(x_{i}\right)} \frac{\delta}{\delta_{\theta_{j}}} h_{\theta}\left(x_{i}\right)-\left(1-\mathrm{y}_{\mathrm{i}}\right) \frac{1}{1-h_{\theta}\left(x_{i}\right)} \frac{\delta}{\delta_{\theta_{j}}} h_{\theta}\left(x_{i}\right)\right) \\ =-\frac{1}{m} \sum_{i=1}^{m}\left(y_{i} \frac{1}{g\left(\theta^{\mathrm{T}} x_{i}\right)}-\left(1-\mathrm{y}_{\mathrm{i}}\right) \frac{1}{1-g\left(\theta^{\mathrm{T}} x_{i}\right)}\right) \frac{\delta}{\delta_{\theta}} g\left(\theta^{\mathrm{T}} x_{i}\right) \\ =-\frac{1}{m} \sum_{i=1}^{m}\left(y_{i} \frac{1}{g\left(\theta^{\mathrm{T}} x_{i}\right)}-\left(1-\mathrm{y}_{\mathrm{i}}\right) \frac{1}{1-g\left(\theta^{\mathrm{T}} x_{i}\right)}\right) g\left(\theta^{\mathrm{T}} x_{i}\right)\left(1-g\left(\theta^{\mathrm{T}} x_{i}\right)\right) \frac{\delta}{\delta_{\theta}} \theta^{\mathrm{T}} x_{i} \\ =-\frac{1}{m} \sum_{i=1}^{m}\left(y_{i}\left(1-g\left(\theta^{\mathrm{T}} x_{i}\right)\right)-\left(1-\mathrm{y}_{\mathrm{i}}\right) g\left(\theta^{\mathrm{T}} x_{i}\right)\right) x_{i}^{j} \\ =-\frac{1}{m} \sum_{i=1}^{m}\left(y_{i}-g\left(\theta^{\mathrm{T}} x_{i}\right)\right) x_{i}^{j}\end{array} \]

参数更新

\[\theta_{j}:=\theta_{j}-\alpha \frac{1}{m} \sum_{i=1}^{m}\left(h_{\theta}\left(x_{i}\right)-y_{i}\right) x_{i}^{j} \]

多分类softmax

\[h_{\theta}\left(x^{(i)}\right)=\left[\begin{array}{c}p\left(y^{(i)}=1 \mid x^{(i)} ; \theta\right) \\ p\left(y^{(i)}=2 \mid x^{(i)} ; \theta\right) \\ \vdots \\ p\left(y^{(i)}=k \mid x^{(i)} ; \theta\right)\end{array}\right]=\frac{1}{\sum_{j=1}^{k} e^{\theta_{j}^{T} x^{(i)}}}\left[\begin{array}{c}e^{\theta_{1}^{T} x^{(i)}} \\ e^{\theta_{2}^{T} x^{(i)}} \\ \vdots \\ e^{\theta_{k}^{T} x^{(i)}}\end{array}\right] \]

\[\hat{p}_{k}=\sigma(\mathbf{s}(\mathbf{x}))_{k}=\frac{\exp \left(s_{k}(\mathbf{x})\right)}{\sum_{j=1}^{K} \exp \left(s_{j}(\mathbf{x})\right)} \]

损失函数交叉熵

\[J(\Theta)=-\frac{1}{m} \sum_{i=1}^{m} \sum_{k=1}^{K} y_{k}^{(i)} \log \left(\hat{p}_{k}^{(i)}\right) \]

标签：逻辑,right,frac,回归,算法,theta,mathrm,sum,left
From： https://www.cnblogs.com/CallMeRoot/p/18038686

聚类算法
这个算法是无监督算法，没有标签。K-MEANS算法基本概念要得到蔟的个数，需要指定K值质心：均值，向量各维度取平均值距离的度量：常用欧几里得距离和余弦相似度（先标准化）优化目标如下，\[\min\sum_{i=1}^{K}\sum_{x\inC_{i}}\operatorname{dist}\left(c_{i},x\right)^{2}\]算法......
线性回归
误差项拟合的线性函数如下，\[h_{\theta}(x)=\sum_{i=0}^{n}\theta_{i}x_{i}=\theta^{T}x\]对于每个样本，真实值和预测值之间的偏差，如下，\[y^{(i)}=\theta^{T}x^{(i)}+\varepsilon^{(i)}\]独立同分布误差项是独立同分布的，并且服从均值为0方差为\[\theta^2\]的正态分布。......
day43 动态规划part5 代码随想录算法训练营 474. 一和零【粗略理解】
题目：474.一和零我的感悟：有点难想，加油、111本题没敲，有机会敲一遍理解难点：两个维度的背包听课笔记：代码示例：classSolution:deffindMaxForm(self,strs:List[str],m:int,n:int)->int:dp=[[0]*(n+1)for_inrange(m+1)]#创建二维动......
day43 动态规划part5 代码随想录算法训练营 494. 目标和
题目：494.目标和我的感悟：加油！理解难点：dp的几种方法的应用记住dp[j]+=dp[j-nums[i]]听课笔记：代码示例：classSolution:deffindTargetSumWays(self,nums:List[int],target:int)->int:total_sum=sum(nums)ifabs(target)>total_sum:......
2024牛客寒假算法基础集训营5 题解（ A,C,G,H,I,L,M ）
2024牛客寒假算法基础集训营5题解（A,C,G,H,I,L,M）A mutsumi的质数合数题意有一个由$n$个正整数组成的数组，她想知道数组中质数和合数共有几个。思路由质数和合数的定义可知，正整数范围内除$1$外，要么是质数要么是合数，本题直接统计不是$1$的正整数的个数即可代码......
day43 动态规划part5 代码随想录算法训练营 1049. 最后一块石头的重量 II
题目：1049.最后一块石头的重量II我的感悟：复习了昨天的模板是不一样，今天这个我推出来了。哈哈理解难点：按照昨天的思路，dp[target]里面是能凑出来的最大值。a是另外能凑出来的和。diff是两者的差。听课笔记：我自己先写出的代码：classSolution:deflastStoneW......
代码随想录算法训练营第三十天|回溯法总结
回溯法总结回溯算法能解决如下问题：组合问题：N个数里面按一定规则找出k个数的集合排列问题：N个数按一定规则全排列，有几种排列方式切割问题：一个字符串按一定规则有几种切割方式子集问题：一个N个数的集合里有多少符合条件的子集棋盘问题：N皇后，解数独等等代码随想录(programmerc......
m基于深度学习的QPSK调制解调系统相位检测和补偿算法matlab仿真
1.算法仿真效果matlab2022a仿真结果如下： 2.算法涉及理论知识概要在数字通信中，正交相移键控（QPSK）是一种高效的调制方法，它能够在有限的带宽内传输更多的信息。然而，在实际通信过程中，由于信道噪声、多径效应等因素，接收到的QPSK信号可能会出现相位偏移，导......
复习回顾-动态规划算法-416. 分割等和子集
注意点&感悟：其实也没啥，不行就背呗~~题目链接：416.分割等和子集自己独立写的代码：classSolution:defcanPartition(self,nums:List[int])->bool:target=sum(nums)iftarget%2==1:#说明是奇数returnFalsetarget=......
基础字符串算法
1哈希1.1概念哈希就是构造一个数字使之唯一的代表一个字符串。我们来考虑一下二进制数的转化：$(1001)2=1\times23+0\times22+0\times2^1+1=(9)$现在，我们令$'a'=1,'b'=2,'c'=3\cdots,'z'=26$。然后将进制$p$设为$131$。就能得到：$(abc)p=1\timesp^2+2\timesp+3=(22483......

逻辑回归（分类算法）

阶跃函数Sigmoid

相关文章

赞助商

阅读排行