首页 > 其他分享 >机器学习常用基本数学符号概括总结

机器学习常用基本数学符号概括总结

时间:2024-06-17 12:28:36浏览次数:15  
标签:总结 符号 概括 text 元素 序列 集合 quad

序言

在阅读机器学习的描述时,我们无法避免遇到各种数学符号。通常只要方程中的一个项或一个符号片段即可完全影响我们对整个过程的理解。这可能非常令人沮丧,尤其是适用于来自开发领域的机器学习初学者。如果我们了解数学符号的一些基本领域和一些工作技巧,则可以取得进步。学完本文后,将了解:

  • 算术符号,包括乘法、指数、根和对数
  • 序列和集合的表示法,包括索引、求和和集合关系

概述

  • 数学符号
  • 算术符号
  • 希腊字母
  • 序列符号
  • 集合符号
  • 其他符号

数学符号

在阅读有关机器学习算法的资料时,将遇到数学符号。例如,符号可能用于:

  • 描述一个算法
  • 描述数据准备
  • 描述结果
  • 描述测试框架
  • 描述含义

这些描述可能出现在研究论文、教科书、博客文章等地方。通常术语定义清晰,但也有一些数学符号规范我们可能不熟悉。只要有一个术语或一个方程式不懂,我们对于整个方法的理解就会丢失。我自己就遇到过很多次这样的问题,这真是令人无比沮丧!以下我们将回顾一些基本的数学符号,这将有助于我们在阅读有关机器学习方法的描述时更好地理解。

算术符号

1. 简单算术

基本的算术运算符号写法。例如:
加法:24 + 1 = 25
减法:24 − 1 = 23
乘法:24 × 2 = 48
除法:24 ÷ 2 = 12,也可以 24 2 = 12 \frac{24}{2} = 12 224​=12
:上述运算符号,对应的LeTax写法,如下:

加法:$24 + 1 = 25$
减法:$24 - 1 = 23$
乘法:$24 \times 2 = 48$
除法:$\frac{24}{2} = 12$

大多数数学运算都有相应的逆运算,例如减法是加法的逆运算,除法是乘法的逆运算。

2. 代数

我们经常想要抽象地描述操作,以便将它们与特定的数据或特定的实现分开。因此,我们看到了大量的代数使用,即使用大小写字母或单词来表示数学符号中的项或概念。在数学中,也经常使用希腊字母。每个数学子领域可能都有自己的保留字母,即始终具有相同含义的术语或字母。尽管如此,代数术语应该作为描述的一部分进行定义,如果它们没有定义,那可能只是描述得不好,而不是你的错。

3. 乘法符号

乘法是一个常见的符号,并且有几个简写形式。通常使用一个小写的"x"(×)或者一个星号"*"来表示乘法:c = a × b 或者 c = a ∗ b
可能会看到使用点表示法,例如:c = a · b
另外,也可能会看到没有运算符和之前定义的术语之间没有空格分隔的情况,例如:c = ab
:上述涉及到符号和公式对应的LeTax写法,如下:

$\times$
$\ast$
$c = a \times b$
$c = a * b$
$c = a \cdot b$
$c = ab$

4. 指数和平方根

指数

指数是一个数被提升到的幂。这种表示法是将原始数字或基数写在一个上面,第二个数字或指数写在一个上标中。例如:
2 3 = 2 × 2 × 2 = 8 2^3 = 2 \times 2 \times 2 = 8 23=2×2×2=8,也就是2的三次方或立方。
又如,一个数的平方: 2 2 = 2 × 2 = 4 2^2 = 2 \times 2 = 4 22=2×2=4

平方根

一个数的平方可以通过计算平方根来反转。例如: 4 = 2 \sqrt{4} = 2 4 ​=2
我们可以根据已知结果和指数,找到基数。实际上,根操作可以用来反转任何指数,只是默认的平方根假设指数为2,这在平方根符号前面用下标2表示。

:上述涉及到公式对应的LeTax写法,如下:

$2^3 = 2 \times 2 \times 2 = 8$ 
$2^2 = 2 \times 2 = 4$
$\sqrt{4} = 2$

5. 对数和自然常数e

对数

当我们将10提升到一个整数指数时,我们通常称这为数量级。例如: 1 0 2 = 10 × 10 10^2 = 10 \times 10 102=10×10。
反转这个操作的另一种方法是通过计算结果100的对数,假设基数为10。在表示法中,写作: log ⁡ 10 ( ) \log_{10}() log10​(),则 log ⁡ 10 ( 100 ) = 2 \log_{10} (100) = 2 log10​(100)=2。
在这里,我们可以根据已知道结果和基数,找到指数。这使我们能够非常容易地上下移动数量级。
假设基数为2的对数也常用,考虑到计算机中使用的二进制算术。例如: 2 6 = 64 2^6 = 64 26=64 , log ⁡ 2 ( 64 ) = 6 \log_2 (64) = 6 log2​(64)=6

自然常数e

另一个流行的对数是假设自然基数 e e e。 e e e是保留的,是一个特殊的数字或常数,称为欧拉数(发音为oy-ler),它指的是一个具有实际无限精度的值。例如: e = 2.71828 … e = 2.71828\dots e=2.71828…,将 e e e提升到幂称为自然指数函数: e 2 = 7.38905 … e^2 = 7.38905\dots e2=7.38905…
它可以使用自然对数进行反转,自然对数表示为: ln ( ) \text{ln}() ln()。则 ln ( 7.3805 …   ) = 2 \text{ln}(7.3805\dots) = 2 ln(7.3805…)=2
自然指数和对数在数学中用于抽象地描述某些系统的连续增长,例如指数增长的系统,如复利。

:上述涉及到符号和公式对应的LeTax写法,如下:

$e$
$10^2 = 10 \times 10$
$\log_{10}()$
$\log_{10}(100) = 2$
$2^6 = 64$
$\log_{2}(64) = 6$
$e = 2.71828\dots$
$e^2 = 7.38905\dots$
$\text{ln}()$
$\text{ln}(7.38905\dots) = 2$

希腊字母

在数学符号中,希腊字母被广泛用于变量、常数、函数等。例如,在统计学中,我们使用小写的希腊字母mu (µ)来表示平均值,使用小写的希腊字母sigma (σ)来表示标准差。在线性回归中,我们谈论的系数使用小写的字母beta (β)。等等。知道所有的大写和小写希腊字母以及如何发音是有用的。以下是完整的希腊字母表:

名称 符号中文读音
Alpha A , α \Alpha,\alpha A,α阿尔法
Beta B , β \Beta,\beta B,β贝塔
Gamma Γ , γ \Gamma,\gamma Γ,γ伽玛
Delta Δ , δ \Delta,\delta Δ,δ德尔塔
Epsilon E , ϵ \Epsilon,\epsilon E,ϵ艾普西隆
Zeta Z , ζ \Zeta,\zeta Z,ζ泽塔
Eta H , η \Eta,\eta H,η伊塔
Theta Θ , θ \Theta,\theta Θ,θ西塔
Iota I , ι \Iota,\iota I,ι爱奥塔
Kappa K , κ \Kappa,\kappa K,κ卡帕
Lambda Λ , λ \Lambda,\lambda Λ,λ拉姆达
Mu M , μ \Mu,\mu M,μ
Nu N , ν \Nu,\nu N,ν
Xi Ξ , ξ \Xi,\xi Ξ,ξ克西
Omicron O , ο \Omicron,\omicron O,ο欧米克戎
Pi Π , π \Pi,\pi Π,π
Rho P , ρ \Rho,\rho P,ρ
Sigma Σ , σ \Sigma,\sigma Σ,σ西格玛
Tau T , τ \Tau,\tau T,τ
Upsilon Υ , υ \Upsilon,\upsilon Υ,υ阿普西隆
Phi Φ , ϕ \Phi,\phi Φ,ϕ
Chi X , χ \Chi,\chi X,χ
Psi Ψ , ψ \Psi,\psi Ψ,ψ普西
Omega Ω , ω \Omega,\omega Ω,ω欧米伽

请注意,sigma (σ)在数学符号中也可以表示为σ或ς,这取决于上下文和所使用的数学字体。同样,pi (π)也是一个特殊的常数,通常用圆周率表示,大约等于3.14159。

序列符号

机器学习符号经常描述对序列的操作。序列可能是一个数据数组或一系列项的列表。
在机器学习中,序列操作很常见,尤其是在处理时间序列数据、序列模型(如循环神经网络RNNs和长短期记忆网络LSTMs)以及自然语言处理(NLP)任务时。以下是几个与序列操作相关的机器学习符号和概念的例子:

  • 列预测:在时间序列分析中,我们可能会对未来的数据点进行预测。这可以通过各种机器学习模型来实现,如ARIMA、季节性分解的时间序列预测(STL)、随机森林等。
  • 序列模型:在序列模型中,如RNN和LSTM,输入序列被处理成一个序列的隐藏状态,这些隐藏状态可以捕获序列中的时间依赖性。
  • 序列标注:在序列标注任务中,如在NLP中标注句子中的词性或实体,每个序列中的项(如句子中的词)都被赋予一个标签。
  • 序列到序列学习:在序列到序列学习(Seq2Seq)中,模型学习将一个序列映射到另一个序列,这在机器翻译和对话系统中非常有用。
  • 注意力机制(Attention Mechanism):在处理序列数据时,注意力机制可以帮助模型集中在序列的特定部分,这对于理解序列中的关键信息非常重要。
  • 卷积神经网络(CNNs):尽管卷积神经网络通常用于图像处理,但它们也可以应用于序列数据,通过卷积操作在时间维度上捕捉局部模式。
  • 嵌入层(Embeddings):在NLP中,单词或其他术语被转换为密集的向量表示,这些向量可以捕捉词汇的语义和上下文信息。
  • 循环层(Recurrent Layers):在循环神经网络中,循环层允许模型在处理序列时保持状态,这使得模型能够记忆序列中的长期依赖关系。

机器学习中的序列操作通常涉及复杂的数学和算法,但它们是现代机器学习模型的核心组成部分,使得模型能够处理和理解各种序列数据。

1. 索引

索引是理解序列表示法的关键,它指的是序列中元素的位置。通常,表示法会指定序列的开始和结束,例如1到n,其中n将是序列的范围或长度。序列中的项目通过变量如i、j、k等作为下标来索引。这与数组表示法类似。例如,a_i是序列a的第i个元素。如果序列是二维的,可能会使用两个索引,例如:b_i_j是序列b的第(i,j)个元素。
在数学和计算机科学中,序列的索引通常遵循以下规则:

  • 一维序列:如果序列是一维的,通常使用单个下标来表示元素的位置。例如,对于长度为n的序列a,元素a_i表示序列中第i个位置的元素,其中i的取值范围是1到n。
  • 二维序列:如果序列是二维的,通常使用两个下标来表示元素的位置。例如,对于一个矩阵或二维数组b,元素b_i_j表示矩阵中第i行第j列的元素,其中i和j的取值范围取决于矩阵的大小。
  • 多维序列:序列可以是多维的,这时会使用多个下标。例如,一个三维数组c可能会用三个下标来表示元素的位置,如c_i_j_k。

在实际应用中,索引可以帮助我们准确地引用序列中的特定元素,这对于数据处理、算法设计和数学证明等方面非常重要。索引的使用确保了我们在序列中的操作是精确和一致的。

2. 序列操作符

数学运算可以在一个序列上执行。执行两个操作序列如此频繁,以至于它们有自己的速记,和和乘法。

序列求和

序列的和用大写希腊字母Sigma(Σ)表示。它用变量和序列求和的Sigma开始下标(例如i=1)以及求和结束的上标(例如n)。
例如: ∑ i = 1 n a i \sum_{i=1}^n a_i ∑i=1n​ai​ 或 ∑ i = 1 n a i \sum\limits_{i=1}^n a_i i=1∑n​ai​,这是从元素1到元素n的序列的和。
:上述涉及到符号和公式对应的LeTax写法,如下:

$\sum_{i=1}^n a_i$ 
$\sum\limits_{i=1}^n a_i$

序列乘积

序列的乘积用大写希腊字母Pi(Π)表示。它的表示方式与序列求和相同,即在字母下方和上方分别标明操作的开始和结束。
例如: ∏ i = 1 n a i \prod_{i=1}^n a_i ∏i=1n​ai​ 或 ∏ i = 1 n a i \prod\limits_{i=1}^n a_i i=1∏n​ai​,这是从元素1到元素n的序列a的乘积。
:上述涉及到符号和公式对应的LeTax写法,如下:

$\prod_{i=1}^n a_i$
$\prod\limits_{i=1}^n a_i$

集合符号

集合是由唯一项组成的一组。在定义机器学习中的术语时,我们可能会看到集合记号的使用。

1. 数字集合

你可能会看到的常见集合是一组数字,比如定义为整数集或实数集中的一个术语。你可能会看到的常见数字集合包括:
所有自然数的集合: N \mathbb{N} N
所有整数的集合: Z \mathbb{Z} Z
所有实数的集合: R \mathbb{R} R
在定义术语时,我们通常谈论实数值或实数,而不是浮点值,后者实际上是计算机操作中的一种离散创建。

:上述涉及到符号和公式对应的LeTax写法,如下:

$\mathbb{N}$ 
$\mathbb{Z}$
$\mathbb{R}$

2. 集合关系

在定义术语时,经常会看到集合成员的概念。集合成员用一个看起来像大写字母”E"的符号表示: ∈ \in ∈。
例如: a ∈ R a \in \mathbb{R} a∈R,这表示a被定义为实数集R的一个成员。
两个常见的集合运算(交集和并集),包括:

并集,或聚合(Union)

令 A 和 B 是两个集合。 A 和 B 的并集,记作 A ∪ B,是一个集合,其元素满足是 A 的元素或者是 B 的元素,或者两者都是。即:
A ∪ B = { x ∣ x ∈ A o r x ∈ B } \text{A} \cup \text{B} = \{ x \mid x \in \text{A} \quad or \quad x \in \text{B} \} A∪B={x∣x∈Aorx∈B}

交集,或重叠(Intersection)

令 A 和 B 是两个集合。 A 和 B 的交集,记作 A ∩ B,是一个集合,其元素满足既是 A 的元素又是 B 的元素。即:
A ∩ B = { x ∣ x ∈ A a n d x ∈ B } \text{A} \cap \text{B} = \{ x \mid x \in \text{A} \quad and \quad x \in \text{B} \} A∩B={x∣x∈Aandx∈B}

此外,还有许多集合运算,包括:

差集(Difference)

令 A 和 B 是两个集合。 A对 B 的差集,记作 A − B,是一个集合,其元素满足是 A 的元素但不是 B 的元素。即:
A − B = { x ∣ x ∈ A a n d x ∉ B } \text{A} - \text{B} = \{ x \mid x \in \text{A} \quad and \quad x \notin \text{B} \} A−B={x∣x∈Aandx∈/B}

补集(Complement)

令 A 是集合, U 是全集。 A 的补集,记作 A(或者 A ˉ \bar{\text{A}} Aˉ),是一个集合,是所有不在 A 里元素组成的集合。即:
A ˉ = { x ∣ x ∉ A } = U − A \bar{\text{A}} = \{ x \mid x \notin \text{A} \} = \text{U} - \text{A} Aˉ={x∣x∈/A}=U−A

对称差(Symmetric Difference)

令 A 和 B 是两个集合。 A 和 B 的对称,记作 A ⊕ B,是一个集合,其元素满足是 A 的元素或者是 B 的元素,但不同时是两个集合的元素。即:
A ⊕ B = { x ∣ x ∈ A a n d x ∈ B a n d x ∈ A ∩ B } = ( A − B ) ∩ ( B − A ) \text{A} \oplus \text{B} = \{ x \mid x \in \text{A} \quad and \quad x \in \text{B} \quad and \quad x \in \text{A} \cap \text{B} \} = (\text{A} - \text{B}) \cap (\text{B} - \text{A}) A⊕B={x∣x∈Aandx∈Bandx∈A∩B}=(A−B)∩(B−A)

幂集(Power Set)

令 A 是集合, A 的幂集,记作 P(A)(或者 2 A 2^{\text{A}} 2A),是一个所有 A 的子集组成的集合。即:
P ( A ) = { x ∣ x ⊆ A } \text{P}(\text{A}) = \{ x \mid x \subseteq \text{A} \} P(A)={x∣x⊆A}

广义交、广义并(Generalized Intersection, Generalized Union)

令 A 是一个集合。 A 的广义交,记作 ∩A,是集合 A 里所有元素的公共元素组成的集合。即:
∩ A = { x ∣ ∀ z ( z ∈ A → x ∈ z ) } \cap \text{A} = \{ x \mid \forall_z (z \in \text{A} \to x \in z) \} ∩A={x∣∀z​(z∈A→x∈z)}
A 的广义并,记作 ∪A,是集合 A 里所有元素的并集。即:
∪ A = { x ∣ ∃ z ( z ∈ A ∧ x ∈ z ) } \cup \text{A} = \{ x \mid \exists_z (z \in \text{A} \wedge x \in \text{z}) \} ∪A={x∣∃z​(z∈A∧x∈z)}

:上述涉及到符号和公式对应的LeTax写法,如下:

$\in$
$a \in \mathbb{R}$
并集:$\text{A} \cup \text{B} =  \{ x \mid x \in \text{A}  \quad or \quad x \in \text{B}  \}$
交集:$\text{A} \cap \text{B} =   \{ x \mid x \in \text{A}  \quad and \quad x \in \text{B}  \}$
差集:$\text{A} - \text{B} = \{ x \mid x \in \text{A} \quad and \quad x \notin \text{B}  \}$
补集:$\bar{\text{A}} = \{ x \mid x \notin \text{A}  \} = \text{U} - \text{A}$
对称集:$\text{A} \oplus \text{B} = \{ x \mid x \in \text{A} \quad and \quad x \in \text{B} \quad and \quad x \in \text{A} \cap \text{B}  \} = (\text{A} - \text{B}) \cap (\text{B} - \text{A})$
幂集:$\text{P}(\text{A}) = \{ x \mid x \subseteq \text{A} \}$
广义交:$\cap \text{A} = \{  x \mid \forall_z (z \in \text{A} \to x \in z) \}$
广义并:$\cup \text{A} = \{ x \mid \exists_z (z \in \text{A} \wedge x \in \text{z}) \}$

其他符号

还会遇到其他一些记号。通常,我们会先在抽象层面定义一个方法,然后再次定义它为一个具体的实现,使用不同的记号。例如,如果我们正在估计一个变量 x x x,我们可能使用修改 x x x的记号,例如:

x x x的平均值: x ˉ \bar{x} xˉ
x x x的导数: x ˋ \grave{x} xˋ
x x x的估计值: x ^ \hat{x} x^
x x x的近似值: x ~ \tilde{x} x~

:上述涉及到符号和公式对应的LeTax写法,如下:

$\bar{x}$
$\grave{x}$
$\hat{x}$
$\tilde{x}$

同样的记号在不同的上下文中可能有不同的含义,例如用于不同的对象或数学的子领域。例如,常见的混淆点是 ∣ x ∣ \lvert x \rvert ∣x∣,根据上下文的不同,它可以意味着:
∣ x ∣ \lvert x \rvert ∣x∣: x x x的绝对值或正值
∣ x ∣ \lvert x \rvert ∣x∣:向量 x x x的长度
∣ x ∣ \lvert x \rvert ∣x∣:集合 x x x的基数(元素数量)

有些与机器学习更相关的数学子领域应该更加详细地复习。它们包括:

  • 线性代数
  • 统计学
  • 概率论
  • 微积分

也许还应该涉及一些多元分析和信息理论。

标签:总结,符号,概括,text,元素,序列,集合,quad
From: https://blog.csdn.net/benny_zhou2004/article/details/139673749

相关文章

  • 滑动窗口总结
    classSolution{public:intminSubArrayLen(inttarget,vector<int>&nums){inti=0;intsum=0;intresult=INT32_MAX;for(intj=0;j<nums.size();j++){sum+=nums[j];while(sum>=tar......
  • 团队里程碑阶段一总结
    团队里程碑阶段一总结在第一阶段的开发工作中,我们深入讨论并总结了各项工作进展及成果。经过团队成员的共同努力,我们已经顺利完成了第一阶段的预期任务。以下是阶段性成果总结:功能整合与框架搭建:成功地整合了已经实现的各项功能,确保它们能够协同工作。初步搭建了软件框架,......
  • 代码随想录第11天 | ●字符串总结 ●双指针回顾
    字符串总结字符串是若干字符组成的有限序列,也叫字符数组。C语言中,把字符存入数组,以结束符'\0'为结束标志,'\0'可作为判断依据c++中,提供string类,string类提供各种接口,其中size()可作为结束判断标志。vector<char>和string相差不大,string类提供处理字符串的接口更多字符串类......
  • JS数组常用方法总结,含ES6新方法,附示例代码
    ......
  • 数据库恢复技术知识点合集(复习总结)
    目录一、事务的基本概念二、事务的ACID特性1.原子性2.一致性3.隔离性4.持续性三、数据库恢复概述四、故障的种类1.事务内部的故障2.系统故障——软故障1.系统故障的原因2.系统故障的恢复3.介质故障——硬故障1.介质故障的原因2.介质故障的恢复五、......
  • 使用Kimi+Markmap总结文件内容生成思维导图原创
    一份文件内容太长,完整阅读下来太费时间,但如果使用AI进行内容提炼,再总结成思维导图,方便快速看到这份文件的核心内容和主题结构,就会极大地节约时间,目前就可以使用Kimi+Markmap这两个工具,帮我们把ppt、word、pdf等文件内容快速总结成思维导图。一、工具准备Kimi,将文章或一篇网页投......
  • Unity学习笔记----摄像机组件信息相关知识点总结
    一.ClearFlags1.skybox天空盒一般用于3d游戏。2.SolidColor颜色填充一般用于2d游戏。3.Depthonly只画该层,背景透明与Depth配合使用,等会再写。4.Don'tClear不移除,渲染覆盖不会擦除上一帧的画面,一般不使用。默认二.CullingMask选择性渲染部分层级,可以指定渲染对......
  • #C语言结构体/结构体指针/单链表学习必备总结(浓缩版)#
    一.结构体的定义结构体是一种用户自定义的数据类型,用于将多个不同类型的数据组合在一起形成一个新的数据类型。结构体由多个成员变量组成,每个成员变量可以是不同的数据类型,可以是基本数据类型(如整型、浮点型、字符型等)或其他结构体类型。结构体的成员变量在内存中是按照声明的......
  • 3.7每日总结
    所花时间:7h代码量:600博客量:1了解的知识点:    记事本packagecom.example.myapplication; importandroid.annotation.SuppressLint;importandroid.content.Intent;importandroid.database.Cursor;importandroid.database.sqlite.SQLiteDatabase;importandroid......
  • 对分课堂总结
    1你觉得对分课堂最有益的部分是什么?请具体说明。能够提高对课本知识的熟悉程度。对分课堂中的“亮闪闪”模块需要认真研究才能做好总结,而不是简单的将书上的内容照搬到学习笔记中。能够提高对知识的掌握程度。通过考考你询问问题,在帮助同学的过程中,也可以检测自己的学习效......