首页 > 其他分享 >对数几率回归中Sigmoid 函数的求导数 ′()并将σ ′ (x) 表达为 σ(x)(1−σ(x)) 的形式

对数几率回归中Sigmoid 函数的求导数 ′()并将σ ′ (x) 表达为 σ(x)(1−σ(x)) 的形式

时间:2024-09-15 14:49:24浏览次数:12  
标签:frac 函数 导数 Sigmoid 求导 对数 sigma

我们从 Sigmoid 函数的定义出发,逐步推导出这一公式。让我们详细说明这个推导过程。

1. Sigmoid 函数的定义

首先,Sigmoid 函数定义为:

σ ( x ) = 1 1 + e − x \sigma(x) = \frac{1}{1 + e^{-x}} σ(x)=1+e−x1​

其中 e e e 是自然常数, x x x 是输入。

2. 求导公式

我们希望对 σ ( x ) \sigma(x) σ(x) 求导,得到 σ ′ ( x ) \sigma'(x) σ′(x)。可以使用链式法则来对这个复合函数求导。

首先,将 Sigmoid 函数的分母记为 f ( x ) = 1 + e − x f(x) = 1 + e^{-x} f(x)=1+e−x,那么可以表示为:

σ ( x ) = 1 f ( x ) \sigma(x) = \frac{1}{f(x)} σ(x)=f(x)1​

对这个函数求导,使用商的求导法则,公式为:

d d x ( 1 f ( x ) ) = − f ′ ( x ) f ( x ) 2 \frac{d}{dx} \left( \frac{1}{f(x)} \right) = -\frac{f'(x)}{f(x)^2} dxd​(f(x)1​)=−f(x)2f′(x)​

3. 求导数

接下来,我们需要对 f ( x ) = 1 + e − x f(x) = 1 + e^{-x} f(x)=1+e−x 进行求导。

对 f ( x ) f(x) f(x) 求导得到:

f ′ ( x ) = − e − x f'(x) = -e^{-x} f′(x)=−e−x

将其代入到商的求导法则中:

σ ′ ( x ) = − − e − x ( 1 + e − x ) 2 \sigma'(x) = -\frac{-e^{-x}}{(1 + e^{-x})^2} σ′(x)=−(1+e−x)2−e−x​

简化后得:
σ ′ ( x ) = e − x ( 1 + e − x ) 2 \sigma'(x) = \frac{e^{-x}}{(1 + e^{-x})^2} σ′(x)=(1+e−x)2e−x​

4. 化简表达式

我们希望将这个结果表达为 σ ( x ) \sigma(x) σ(x) 的形式。注意到 σ ( x ) = 1 1 + e − x \sigma(x) = \frac{1}{1 + e^{-x}} σ(x)=1+e−x1​,因此:
1 + e − x = 1 σ ( x ) 1 + e^{-x} = \frac{1}{\sigma(x)} 1+e−x=σ(x)1​
并且:
e − x = 1 σ ( x ) − 1 e^{-x} = \frac{1}{\sigma(x)} - 1 e−x=σ(x)1​−1

现在,我们将 σ ( x ) \sigma(x) σ(x) 带入导数公式中。首先,将 σ ( x ) \sigma(x) σ(x) 的表达式代入导数结果:
σ ′ ( x ) = e − x ( 1 + e − x ) 2 \sigma'(x) = \frac{e^{-x}}{(1 + e^{-x})^2} σ′(x)=(1+e−x)2e−x​
可以写成:
σ ′ ( x ) = σ ( x ) ⋅ ( 1 − σ ( x ) ) \sigma'(x) = \sigma(x) \cdot \left(1 - \sigma(x)\right) σ′(x)=σ(x)⋅(1−σ(x))

5. 结论

因此,Sigmoid 函数的导数 σ ′ ( x ) \sigma'(x) σ′(x) 可以写成:
σ ′ ( x ) = σ ( x ) ⋅ ( 1 − σ ( x ) ) \sigma'(x) = \sigma(x) \cdot \left(1 - \sigma(x)\right) σ′(x)=σ(x)⋅(1−σ(x))

这个结果说明了 Sigmoid 函数导数的简洁性质,它与 Sigmoid 函数本身相关。

标签:frac,函数,导数,Sigmoid,求导,对数,sigma
From: https://blog.csdn.net/u013172930/article/details/142282056

相关文章

  • 对数几率回归(逻辑回归)中的sigmoid函数两边取对数转换为对数几率回归模型表达式的过程
    公式(3-4)是:y=11+......
  • 高等数学 2.1 导数概念
    目录一、导数的定义函数在一点处的导数与导函数单侧导数二、导数的几何意义三、函数可导性与连续性的关系一、导数的定义函数在一点处的导数与导函数定义设函数\(y=f(x)\)在点\(x_0\)的某个邻域内有定义,当自变量\(x\)在\(x_0\)处取得增量\(\Deltax\)(点\(x_0+......
  • 为什么以a为底,n的对数(以b为底)为指数的幂等于以n为底,a的对数(以b 为底)为指数的幂?
    这个问题涉及对数和指数的性质。我们可以用数学公式来清晰地表达和证明这一等式。首先,我们有:\[a^{\log_b(n)}\]我们想证明这等于:\[n^{\log_b(a)}\]证明如下:定义对数:\[\log_b(n)=x\]意味着\[b^x=n\]应用对数定义:由定义,我们有\[a^{\log_b(n)}=a^{x}\]和\[n^{......
  • 为什么以a为底,n的对数(以b为底)为指数的幂等于以n为底,a的对数(以b 为底)为指数的幂?
    这个问题涉及到对数的换底公式。换底公式是数学中一个重要的公式,它允许我们将不同底数的对数转换为相同的底数,从而便于计算。换底公式的表达式是:\[\log_ab=\frac{\log_cb}{\log_ca}\]其中(a)和(b)是底数,(c)是任意正实数(通常在计算中使用10或自然对数底数(e))......
  • 对数函数
    首先,我们应该了解自然对数\(e\)的定义:\[e^x=\lim\limits_{h\to0}(1+hx)^{\frac{1}{h}}\]这是它的一个定义,他的引出貌似来自于一个有趣的问题,假如你有\(100\)块钱,有种理财方式是每过一年使存的钱增加\(r=d\%\),一种是把一年分成\(2\)个半年,每半年增加\(\frac{d}{2}\%\),这......
  • 如何在Spark键值对数据中,对指定的Key进行输出/筛选/模式匹配
    在用键值对RDD进行操作时,经常会遇到不知道如何筛选出想要数据的情况,这里提供了一些解决方法目录1、对固定的Key数据进行查询2、对不固定的Key数据进行模糊查询1、对固定的Key数据进行查询代码说明:SparkConf:配置Spark应用程序的一些基本信息。SparkContext:创建Spark......
  • 运用DBLINK与数据泵导数据时报错ORA-39006、ORA-39113、PLS-00352、PLS-00201、ORA-39
    问题描述:运用DBLINK与数据泵导数据时报错ORA-39006、ORA-39113、PLS-00352、PLS-00201、ORA-39097,如下所示:数据库:源端oracle12.2.0.1目标端:oracle12.2.0.11、问题重现[oracle@hisdb1scripts]$tail-500fnohup.outImport:Release12.2.0.1.0-ProductiononFriSep......
  • 导数(1)
    导数学习笔记(1)Frombilibili一数导数1~6求导公式:\[f'(x)=\lim_{\Deltax\rightarrow0}\frac{f(x+\Deltax)-f(x)}{\Deltax}\]手动求导举例:对\(f(x)=x^2\)求导:\[\begin{aligned}f’(x)&=\lim_{\Deltax\rightarrow0}\frac{f(x+\Deltax)-f(x)}{\Deltax}......
  • 机器学习:对数据进行降维(PCA和SVD)
    目录前言一、PCA1.PCA是什么?2.PCA的实现使用步骤3.PCA参数解释4.代码实现5.PCA的优缺点二、SVD1.SVD是什么?2.SVD的实现步骤3.代码实现总结前言        数据降维是将高维数据转换为较低维度的过程,同时尽量保留数据中的关键信息。这有助于减少计算复杂性......
  • 在 SQLAlchemy 中对数据异步处理的时候,获得关联集合的处理方式
    我们在定义SQLAlchemy对象模型的关系的时候,用到了relationship来标识关系,其中lazy的参数有多种不同的加载策略,本篇随笔介绍它们之间的关系,以及在异步处理中的一些代码案例。1、在SQLAlchemy中定义关系在SQLAlchemy中,relationship()函数用于定义表之间的关系(如one-to-ma......