对数几率回归中Sigmoid 函数的求导数 ′()并将σ ′ (x) 表达为 σ(x)(1−σ(x)) 的形式

时间：2024-09-15 14:49:24浏览次数：12

标签：frac 函数导数 Sigmoid 求导对数 sigma

我们从 Sigmoid 函数的定义出发，逐步推导出这一公式。让我们详细说明这个推导过程。

1. Sigmoid 函数的定义

首先，Sigmoid 函数定义为：

σ ( x ) = 1 1 + e − x \sigma(x) = \frac{1}{1 + e^{-x}} σ(x)=1+e−x1

其中 e e e 是自然常数， x x x 是输入。

2. 求导公式

我们希望对 σ ( x ) \sigma(x) σ(x) 求导，得到 σ ′ ( x ) \sigma'(x) σ′(x)。可以使用链式法则来对这个复合函数求导。

首先，将 Sigmoid 函数的分母记为 f ( x ) = 1 + e − x f(x) = 1 + e^{-x} f(x)=1+e−x，那么可以表示为：

σ ( x ) = 1 f ( x ) \sigma(x) = \frac{1}{f(x)} σ(x)=f(x)1

对这个函数求导，使用商的求导法则，公式为：

d d x ( 1 f ( x ) ) = − f ′ ( x ) f ( x ) 2 \frac{d}{dx} \left( \frac{1}{f(x)} \right) = -\frac{f'(x)}{f(x)^2} dxd(f(x)1)=−f(x)2f′(x)

3. 求导数

接下来，我们需要对 f ( x ) = 1 + e − x f(x) = 1 + e^{-x} f(x)=1+e−x 进行求导。

对 f ( x ) f(x) f(x) 求导得到：

f ′ ( x ) = − e − x f'(x) = -e^{-x} f′(x)=−e−x

将其代入到商的求导法则中：

σ ′ ( x ) = − − e − x ( 1 + e − x ) 2 \sigma'(x) = -\frac{-e^{-x}}{(1 + e^{-x})^2} σ′(x)=−(1+e−x)2−e−x

简化后得：
σ ′ ( x ) = e − x ( 1 + e − x ) 2 \sigma'(x) = \frac{e^{-x}}{(1 + e^{-x})^2} σ′(x)=(1+e−x)2e−x

4. 化简表达式

我们希望将这个结果表达为 σ ( x ) \sigma(x) σ(x) 的形式。注意到 σ ( x ) = 1 1 + e − x \sigma(x) = \frac{1}{1 + e^{-x}} σ(x)=1+e−x1，因此：
1 + e − x = 1 σ ( x ) 1 + e^{-x} = \frac{1}{\sigma(x)} 1+e−x=σ(x)1
并且：
e − x = 1 σ ( x ) − 1 e^{-x} = \frac{1}{\sigma(x)} - 1 e−x=σ(x)1−1

现在，我们将 σ ( x ) \sigma(x) σ(x) 带入导数公式中。首先，将 σ ( x ) \sigma(x) σ(x) 的表达式代入导数结果：
σ ′ ( x ) = e − x ( 1 + e − x ) 2 \sigma'(x) = \frac{e^{-x}}{(1 + e^{-x})^2} σ′(x)=(1+e−x)2e−x
可以写成：
σ ′ ( x ) = σ ( x ) ⋅ ( 1 − σ ( x ) ) \sigma'(x) = \sigma(x) \cdot \left(1 - \sigma(x)\right) σ′(x)=σ(x)⋅(1−σ(x))

5. 结论

因此，Sigmoid 函数的导数 σ ′ ( x ) \sigma'(x) σ′(x) 可以写成：
σ ′ ( x ) = σ ( x ) ⋅ ( 1 − σ ( x ) ) \sigma'(x) = \sigma(x) \cdot \left(1 - \sigma(x)\right) σ′(x)=σ(x)⋅(1−σ(x))

这个结果说明了 Sigmoid 函数导数的简洁性质，它与 Sigmoid 函数本身相关。

标签：frac,函数,导数,Sigmoid,求导,对数,sigma
From： https://blog.csdn.net/u013172930/article/details/142282056

对数几率回归（逻辑回归）中的sigmoid函数两边取对数转换为对数几率回归模型表达式的过程
公式(3-4)是：y=11+......
高等数学 2.1 导数概念
目录一、导数的定义函数在一点处的导数与导函数单侧导数二、导数的几何意义三、函数可导性与连续性的关系一、导数的定义函数在一点处的导数与导函数定义设函数$y=f(x)$在点$x_0$的某个邻域内有定义，当自变量$x$在$x_0$处取得增量$\Deltax$（点\(x_0+......
为什么以a为底，n的对数（以b为底）为指数的幂等于以n为底，a的对数（以b 为底）为指数的幂？
这个问题涉及对数和指数的性质。我们可以用数学公式来清晰地表达和证明这一等式。首先，我们有：\[a^{\log_b(n)}\]我们想证明这等于：\[n^{\log_b(a)}\]证明如下：定义对数：\[\log_b(n)=x\]意味着\[b^x=n\]应用对数定义：由定义，我们有\[a^{\log_b(n)}=a^{x}\]和\[n^{......
为什么以a为底，n的对数（以b为底）为指数的幂等于以n为底，a的对数（以b 为底）为指数的幂？
这个问题涉及到对数的换底公式。换底公式是数学中一个重要的公式，它允许我们将不同底数的对数转换为相同的底数，从而便于计算。换底公式的表达式是：\[\log_ab=\frac{\log_cb}{\log_ca}\]其中(a)和(b)是底数，(c)是任意正实数（通常在计算中使用10或自然对数底数(e)）......
对数函数
首先，我们应该了解自然对数$e$的定义：\[e^x=\lim\limits_{h\to0}(1+hx)^{\frac{1}{h}}\]这是它的一个定义，他的引出貌似来自于一个有趣的问题，假如你有$100$块钱，有种理财方式是每过一年使存的钱增加$r=d\%$，一种是把一年分成$2$个半年，每半年增加$\frac{d}{2}\%$，这......
如何在Spark键值对数据中，对指定的Key进行输出/筛选/模式匹配
在用键值对RDD进行操作时，经常会遇到不知道如何筛选出想要数据的情况，这里提供了一些解决方法目录1、对固定的Key数据进行查询2、对不固定的Key数据进行模糊查询1、对固定的Key数据进行查询代码说明:SparkConf：配置Spark应用程序的一些基本信息。SparkContext：创建Spark......
运用DBLINK与数据泵导数据时报错ORA-39006、ORA-39113、PLS-00352、PLS-00201、ORA-39
问题描述：运用DBLINK与数据泵导数据时报错ORA-39006、ORA-39113、PLS-00352、PLS-00201、ORA-39097，如下所示：数据库：源端oracle12.2.0.1目标端：oracle12.2.0.11、问题重现[oracle@hisdb1scripts]$tail-500fnohup.outImport:Release12.2.0.1.0-ProductiononFriSep......
导数(1)
导数学习笔记（1）Frombilibili一数导数1~6求导公式：\[f'(x)=\lim_{\Deltax\rightarrow0}\frac{f(x+\Deltax)-f(x)}{\Deltax}\]手动求导举例：对$f(x)=x^2$求导：\[\begin{aligned}f’(x)&=\lim_{\Deltax\rightarrow0}\frac{f(x+\Deltax)-f(x)}{\Deltax}......
机器学习：对数据进行降维（PCA和SVD）
目录前言一、PCA1.PCA是什么？2.PCA的实现使用步骤3.PCA参数解释4.代码实现5.PCA的优缺点二、SVD1.SVD是什么？2.SVD的实现步骤3.代码实现总结前言数据降维是将高维数据转换为较低维度的过程，同时尽量保留数据中的关键信息。这有助于减少计算复杂性......
在 SQLAlchemy 中对数据异步处理的时候，获得关联集合的处理方式
我们在定义SQLAlchemy对象模型的关系的时候，用到了relationship来标识关系，其中lazy的参数有多种不同的加载策略，本篇随笔介绍它们之间的关系，以及在异步处理中的一些代码案例。1、在SQLAlchemy中定义关系在SQLAlchemy中，relationship()函数用于定义表之间的关系（如one-to-ma......