首页 > 其他分享 >二进制求幂

二进制求幂

时间:2024-02-03 19:56:23浏览次数:28  
标签:right log 二进制 long times cdot left

定义

快速幂,二进制取幂(Binary Exponentiation,也称平方法),是一个在 \(\Theta(\log n)\) 的时间内计算 \(a^n\) 的小技巧,而暴力的计算需要 \(\Theta(n)\) 的时间。

这个技巧也常常用在非计算的场景,因为它可以应用在任何具有结合律的运算中。其中显然的是它可以应用于模意义下取幂、矩阵幂等运算,我们接下来会讨论。

解释

计算 \(a\) 的 \(n\) 次方表示将 \(n\) 个 \(a\) 乘在一起:\(a^{n} = \underbrace{a \times a \cdots \times a}_{n\text{ 个 a}}\)。然而当 \(a,n\) 太大的时侯,这种方法就不太适用了。不过我们知道:\(a^{b+c} = a^b \cdot a^c,\,\,a^{2b} = a^b \cdot a^b = (a^b)^2\)。二进制取幂的想法是,我们将取幂的任务按照指数的 二进制表示 来分割成更小的任务。

过程

迭代版本

首先我们将 \(n\) 表示为 2 进制,举一个例子:

\[3^{13} = 3^{(1101)_2} = 3^8 \cdot 3^4 \cdot 3^1 \]

因为 \(n\) 有 \(\lfloor \log_2 n \rfloor + 1\) 个二进制位,因此当我们知道了 \(a^1, a^2, a^4, a^8, \dots, a^{2^{\lfloor \log_2 n \rfloor}}\) 后,我们只用计算 \(\Theta(\log n)\) 次乘法就可以计算出 \(a^n\)。

于是我们只需要知道一个快速的方法来计算上述 3 的 \(2^k\) 次幂的序列。这个问题很简单,因为序列中(除第一个)任意一个元素就是其前一个元素的平方。举一个例子:

\[\begin{align} 3^1 &= 3 \\ 3^2 &= \left(3^1\right)^2 = 3^2 = 9 \\ 3^4 &= \left(3^2\right)^2 = 9^2 = 81 \\ 3^8 &= \left(3^4\right)^2 = 81^2 = 6561 \end{align} \]

因此为了计算 \(3^{13}\),我们只需要将对应二进制位为 1 的整系数幂乘起来就行了:

\[3^{13} = 6561 \cdot 81 \cdot 3 = 1594323 \]

将上述过程说得形式化一些,如果把 \(n\) 写作二进制为 \((n_tn_{t-1}\cdots n_1n_0)_2\),那么有:

\[n = n_t2^t + n_{t-1}2^{t-1} + n_{t-2}2^{t-2} + \cdots + n_12^1 + n_02^0 \]

其中 \(n_i\in\{0,1\}\)。那么就有

\[\begin{aligned} a^n & = (a^{n_t 2^t + \cdots + n_0 2^0})\\\\ & = a^{n_0 2^0} \times a^{n_1 2^1}\times \cdots \times a^{n_t2^t} \end{aligned} \]

根据上式我们发现,原问题被我们转化成了形式相同的子问题的乘积,并且我们可以在常数时间内从 \(2^i\) 项推出 \(2^{i+1}\) 项。

这个算法的复杂度是 \(\Theta(\log n)\) 的,我们计算了 \(\Theta(\log n)\) 个 \(2^k\) 次幂的数,然后花费 \(\Theta(\log n)\) 的时间选择二进制为 1 对应的幂来相乘。

递归版本

上述迭代版本中,由于 \(2^{i+1}\) 项依赖于 \(2^i\),使得其转换为递归版本比较困难(一方面需要返回一个额外的 \(a^{2^i}\),对函数来说无法实现一个只返回计算结果的接口;另一方面则是必须从低位往高位计算,即从高位往低位调用,这也造成了递归实现的困扰),下面则提供递归版本的思路。

给定形式 \(n_{t\dots i} = (n_tn_{t-1}\cdots n_i)_2\),即 \(n_{t\dots i}\) 表示将 \(n\) 的前 \(t - i + 1\) 位二进制位当作一个二进制数,则有如下变换:

\[\begin{aligned} n &= n_{t\dots 0} \\ &= 2\times n_{t\dots 1} + n_0\\ &= 2\times (2\times n_{t\dots 2} + n_1) + n_0 \\ &\cdots \end{aligned} \]

那么有:

\[\begin{aligned} a^n &= a^{n_{t\dots 0}} \\ &= a^{2\times n_{t\dots 1} + n_0} = \left(a^{n_{t\dots 1}}\right)^2 a^{n_0} \\ &= \left(a^{2\times n_{t\dots 2} + n_1}\right)^2 a^{n_0} = \left(\left(a^{n_{t\dots 2}}\right)^2 a^{n_1}\right)^2 a^{n_0} \\ &\cdots \end{aligned} \]

如上所述,在递归时,对于不同的递归深度是相同的处理:\(a^{n_{t\dots i}} = (a^{n_{t\dots (i+1)}})^2a^{n_i}\),即将当前递归的二进制数拆成两部分:最低位在递归出来时乘上去,其余部分则变成新的二进制数递归进入更深一层作相同的处理。

可以观察到,每递归深入一层则二进制位减少一位,所以该算法的时间复杂度也为 \(\Theta(\log n)\)。

实现

首先我们可以直接按照上述递归方法实现:

long long binpow(long long a, long long b) {
  if (b == 0) return 1;
long long res = binpow(a, b / 2);
  if (b % 2)
    return res * res * a;
  else
    return res * res;
}

第二种实现方法是非递归式的。它在循环的过程中将二进制位为 1 时对应的幂累乘到答案中。尽管两者的理论复杂度是相同的,但第二种在实践过程中的速度是比第一种更快的,因为递归会花费一定的开销。

long long binpow(long long a, long long b) {
  long long res = 1;
  while (b > 0) {
    if (b & 1) res = res * a;
    a = a * a;
    b >>= 1;
  }
  return res;
}

模板:Luogu P1226

应用

模意义下取幂

计算 \(x^n\bmod m\)。

这是一个非常常见的应用,例如它可以用于计算模意义下的乘法逆元。

既然我们知道取模的运算不会干涉乘法运算,因此我们只需要在计算的过程中取模即可。

long long binpow(long long a, long long b, long long m) {
  a %= m;
  long long res = 1;
  while (b > 0) {
    if (b & 1) res = res * a % m;
    a = a * a % m;
    b >>= 1;
  }
  return res;
}

注意:根据费马小定理,如果 \(m\) 是一个质数,我们可以计算 \(x^{n\bmod (m-1)}\) 来加速算法过程。

计算斐波那契数

计算斐波那契数列第 \(n\) 项 \(F_n\)。

根据斐波那契数列的递推式 \(F_n = F_{n-1} + F_{n-2}\),我们可以构建一个 \(2\times 2\) 的矩阵来表示从 \(F_i,F_{i+1}\) 到 \(F_{i+1},F_{i+2}\) 的变换。于是在计算这个矩阵的 \(n\) 次幂的时侯,我们使用快速幂的思想,可以在 \(\Theta(\log n)\) 的时间内计算出结果。

多次置换

给你一个长度为 \(n\) 的序列和一个置换,把这个序列置换 \(k\) 次。

简单地把这个置换取 \(k\) 次幂,然后把它应用到序列 \(n\) 上即可。时间复杂度是 \(O(n \log k)\) 的。

注意:给这个置换建图,然后在每一个环上分别做 \(k\) 次幂(事实上做一下 \(k\) 对环长取模的运算即可)可以取得更高效的算法,达到 \(O(n)\) 的复杂度。

加速几何中对点集的操作

引入

三维空间中,\(n\) 个点 \(p_i\),要求将 \(m\) 个操作都应用于这些点。包含 3 种操作:

  1. 沿某个向量移动点的位置(Shift)。
  2. 按比例缩放这个点的坐标(Scale)。
  3. 绕某个坐标轴旋转(Rotate)。

还有一个特殊的操作,就是将一个操作序列重复 \(k\) 次(Loop),这个序列中也可能有 Loop 操作(Loop 操作可以嵌套)。现在要求你在低于 \(O(n \cdot \textit{length})\) 的时间内将这些变换应用到这个 \(n\) 个点,其中 \(\textit{length}\) 表示把所有的 Loop 操作展开后的操作序列的长度。

解释

让我们来观察一下这三种操作对坐标的影响:

  1. Shift 操作:将每一维的坐标分别加上一个常量;
  2. Scale 操作:把每一维坐标分别乘上一个常量;
  3. Rotate 操作:这个有点复杂,我们不打算深入探究,不过我们仍然可以使用一个线性组合来表示新的坐标。

可以看到,每一个变换可以被表示为对坐标的线性运算,因此,一个变换可以用一个 \(4\times 4\) 的矩阵来表示:

\[\begin{bmatrix} a_{11} & a_ {12} & a_ {13} & a_ {14} \\ a_{21} & a_ {22} & a_ {23} & a_ {24} \\ a_{31} & a_ {32} & a_ {33} & a_ {34} \\ a_{41} & a_ {42} & a_ {43} & a_ {44} \\ \end{bmatrix} \]

使用这个矩阵就可以将一个坐标(向量)进行变换,得到新的坐标(向量):

\[\begin{bmatrix} a_{11} & a_ {12} & a_ {13} & a_ {14} \\ a_{21} & a_ {22} & a_ {23} & a_ {24} \\ a_{31} & a_ {32} & a_ {33} & a_ {34} \\ a_{41} & a_ {42} & a_ {43} & a_ {44} \\ \end{bmatrix}\cdot \begin{bmatrix} x \\ y \\ z \\ 1 \end{bmatrix} = \begin{bmatrix} x' \\ y' \\ z' \\ 1 \end{bmatrix} \]

你可能会问,为什么一个三维坐标会多一个 \(1\) 出来?原因在于,如果没有这个多出来的 \(1\),我们没法使用矩阵的线性变换来描述 \(Shift\) 操作。

过程

接下来举一些简单的例子来说明我们的思路:

  1. Shift 操作:让 \(x\) 坐标方向的位移为 \(5\),\(y\) 坐标的位移为 \(7\),\(z\) 坐标的位移为 \(9\):

    \[\begin{bmatrix} 1 & 0 & 0 & 5 \\ 0 & 1 & 0 & 7 \\ 0 & 0 & 1 & 9 \\ 0 & 0 & 0 & 1 \\ \end{bmatrix} \]

  2. Scale 操作:把 \(x\) 坐标拉伸 10 倍,\(y,z\) 坐标拉伸 5 倍:

    \[\begin{bmatrix} 10 & 0 & 0 & 0 \\ 0 & 5 & 0 & 0 \\ 0 & 0 & 5 & 0 \\ 0 & 0 & 0 & 1 \\ \end{bmatrix} \]

  3. Rotate 操作:绕 \(x\) 轴旋转 \(\theta\) 弧度,遵循右手定则(逆时针方向)

    \[\begin{bmatrix} 1 & 0 & 0 & 0 \\ 0 & \cos \theta & \sin \theta & 0 \\ 0 & -\sin \theta & \cos \theta & 0 \\ 0 & 0 & 0 & 1 \\ \end{bmatrix} \]

现在,每一种操作都被表示为了一个矩阵,变换序列可以用矩阵的乘积来表示,而一个 Loop 操作相当于取一个矩阵的 k 次幂。这样可以用 \(O(m \log k)\) 计算出整个变换序列最终形成的矩阵。最后将它应用到 \(n\) 个点上,总复杂度 \(O(n + m \log k)\)。

定长路径计数

给一个有向图(边权为 1),求任意两点 \(u,v\) 间从 \(u\) 到 \(v\),长度为 \(k\) 的路径的条数。

我们把该图的邻接矩阵 M 取 k 次幂,那么 \(M_{i,j}\) 就表示从 \(i\) 到 \(j\) 长度为 \(k\) 的路径的数目。该算法的复杂度是 \(O(n^3 \log k)\)。有关该算法的细节请参见 矩阵 页面。

模意义下大整数乘法

计算 \(a\times b\bmod m,\,\,a,b\le m\le 10^{18}\)。

与二进制取幂的思想一样,这次我们将其中的一个乘数表示为若干个 2 的整数次幂的和的形式。因为在对一个数做乘 2 并取模的运算的时侯,我们可以转化为加减操作防止溢出。这样仍可以在 \(O (\log_2 m)\) 的时内解决问题。递归方法如下:

\[a \cdot b = \begin{cases} 0 &\text{if }a = 0 \\\\ 2 \cdot \frac{a}{2} \cdot b &\text{if }a > 0 \text{ and }a \text{ even} \\\\ 2 \cdot \frac{a-1}{2} \cdot b + b &\text{if }a > 0 \text{ and }a \text{ odd} \end{cases} \]

快速乘

但是 \(O(\log_2 m)\) 的「龟速乘」还是太慢了,这在很多对常数要求比较高的算法比如 Miller_Rabin 和 Pollard-Rho 中,就显得不够用了。所以我们要介绍一种可以处理模数在 long long 范围内、不需要使用黑科技 __int128 的、复杂度为 \(O(1)\) 的「快速乘」。

我们发现:

\[a\times b\bmod m=a\times b-\left\lfloor \dfrac{ab}m \right\rfloor\times m \]

我们巧妙运用 unsigned long long 的自然溢出:

\[a\times b\bmod m=a\times b-\left\lfloor \dfrac{ab}m \right\rfloor\times m=\left(a\times b-\left\lfloor \dfrac{ab}m \right\rfloor\times m\right)\bmod 2^{64} \]

于是在算出 \(\left\lfloor\dfrac{ab}m\right\rfloor\) 后,两边的乘法和中间的减法部分都可以使用 unsigned long long 直接计算,现在我们只需要解决如何计算 \(\left\lfloor\dfrac {ab}m\right\rfloor\)。

我们考虑先使用 long double 算出 \(\dfrac am\) 再乘上 \(b\)。

既然使用了 long double,就无疑会有精度误差。极端情况就是第一个有效数字(二进制下)在小数点后一位。在 x86-64 机器下,long double 将被解释成 \(80\) 位拓展小数(即符号为 \(1\) 位,指数为 \(15\) 位,尾数为 \(64\) 位),所以 long double 最多能精确表示的有效位数为 \(64\)[^note1]。所以 \(\dfrac am\) 最差从第 \(65\) 位开始出错,误差范围为 \(\left(-2^{-64},2^{64}\right)\)。乘上 \(b\) 这个 \(64\) 位整数,误差范围为 \((-0.5,0.5)\),再加上 \(0.5\) 误差范围为 \((0,1)\),取整后误差范围位 \(\{0,1\}\)。于是乘上 \(-m\) 后,误差范围变成 \(\{0,-m\}\),我们需要判断这两种情况。

因为 \(m\) 在 long long 范围内,所以如果计算结果 \(r\) 在 \([0,m)\) 时,直接返回 \(r\),否则返回 \(r+m\),当然你也可以直接返回 \((r+m)\bmod m\)。

代码实现如下:

long long binmul(long long a, long long b, long long m) {
  unsigned long long c =
      (unsigned long long)a * b -
      (unsigned long long)((long double)a / m * b + 0.5L) * m;
  if (c < m) return c;
  return c + m;
}

高精度快速幂

例题【NOIP2003 普及组改编·麦森数】(原题在此

题目大意:从文件中输入 $P$($1000 < P < 3100000$),计算 $2^P−1$ 的最后 100 位数字(用十进制高精度数表示),不足 100 位时高位补 0。

代码实现如下:

#include <bits/stdc++.h>
using namespace std;
int a[505], b[505], t[505], i, j;

void mult(int x[], int y[])  // 高精度乘法
{
  memset(t, 0, sizeof(t));
  for (i = 1; i <= x[0]; i++) {
    for (j = 1; j <= y[0]; j++) {
      if (i + j - 1 > 100) continue;
      t[i + j - 1] += x[i] * y[j];
      t[i + j] += t[i + j - 1] / 10;
      t[i + j - 1] %= 10;
      t[0] = i + j;
    }
  }
  memcpy(b, t, sizeof(b));
}

void ksm(int p)  // 快速幂
{
  if (p == 1) {
    memcpy(b, a, sizeof(b));
    return;
  }
  ksm(p / 2);  //(2^(p/2))^2=2^p
  mult(b, b);  // 对b平方
  if (p % 2 == 1) mult(b, a);
}

int main() {
  int p;
  scanf("%d", &p);
  a[0] = 1;  // 记录a数组的位数
  a[1] = 2;  // 对2进行平方
  b[0] = 1;  // 记录b数组的位数
  b[1] = 1;  // 答案数组
  ksm(p);
  for (i = 100; i >= 1; i--) {
    if (i == 1) {
      printf("%d\n", b[i] - 1);  // 最后一位减1
    } else
      printf("%d", b[i]);
  }
}

同一底数与同一模数的预处理快速幂

在同一底数与同一模数的条件下,可以利用分块思想,用一定的时间(一般是 \(O(\sqrt n)\))预处理后用 \(O(1)\) 的时间回答一次幂询问。

过程

  1. 选定一个数 \(s\),预处理出 \(a^0\) 到 \(a^s\) 与 \(a^{0\cdot s}\) 到 \(a^{\lceil\frac ps\rceil\cdot s}\) 的值并存在一个(或两个)数组里;
  2. 对于每一次询问 \(a^b\bmod p\),将 \(b\) 拆分成 \(\left\lfloor\dfrac bs\right\rfloor\cdot s+b\bmod s\),则 \(a^b=a^{\lfloor\frac bs\rfloor\cdot s}\times a^{b\bmod s}\),可以 \(O(1)\) 求出答案。

关于这个数 \(s\) 的选择,我们一般选择 \(\sqrt p\) 或者一个大小适当的 \(2\) 的次幂(选择 \(\sqrt p\) 可以使预处理较优,选择 \(2\) 的次幂可以使用位运算优化/简化计算)。

int pow1[65536], pow2[65536];
void preproc(int a, int mod) {
  pow1[0] = pow2[0] = 1;
  for (int i = 1; i < 65536; i++) pow1[i] = 1LL * pow1[i - 1] * a % mod;
  int pow65536 = 1LL * pow1[65535] * a % mod;
  for (int i = 1; i < 65536; i++) pow2[i] = 1LL * pow2[i - 1] * pow65536 % mod;
}
int query(int pows) { return 1LL * pow1[pows & 65535] * pow2[pows >> 16]; }

习题

标签:right,log,二进制,long,times,cdot,left
From: https://www.cnblogs.com/BadBadBad/p/18005111/binary-exponentiation

相关文章

  • 数据数据是以二进制表示
    本周我观看了程序是怎么跑起来的中的,数据是以二进制表示的,这是因为计算机的硬件的物理层面,它含有硬件,而硬件的最适状态是0和1,也就是初中时所说的满二进一,而且计算机以这种方式方式进行表示,具有强烈的简单特点计算机便于理解,也具有强烈的可靠性,技术实现,在表示负数时也是二进制的部......
  • 数据是用二进制数表示的
    二进制数二进制是计算技术中广泛采用的一种数制。二进制数据是用0和1两个数码来表示的数。它的基数为2,进位规则是“逢二进一”,借位规则是“借一当二”。二进制数表示计算机的原因1容易表示二进制数只有“0”和“1”两个基本符号,易于用两种对立的物理状态表示。例如,可用"1"表示......
  • 我对二进制的运算和用途的认识与思考
    在初步了解计算机的“大脑核心“CPU之后,对于计算机是如何处理数据、指令、函数的流程有了大致的逻辑认知。在阅读过有关二进制的知识后,对于计算机构成和运行有了更深的了解,主要分为对于二进制的运算和用途的思考。首先,作为计算机核心的CPU同其他计算机组件一样,都属于IC集成电路的......
  • 数据为什么要用二进制数来表示
    1、易于实现数字电路里的状态是由开关来控制,开关只有开和关两种状态,而二进制也只有"0"和"1"两种状态,很容易用电子元件实现。因此采用二进制来表示,0表示低电平,1表示高电平,或者反过来表示的也有。2、简化运算二进制数加法和乘法仅各有3条运算规则(0+0=0,0+1=1,1+1=10和0×0=0,0×1=0,1×1=1......
  • 二进制
    二进制数0.1,用十进制表示。小数点后一位位权是2的-1次方=0.5即十进制数为0.5小数部分二进制转十进制例如0.1111转十进制12的-4次方+12的-3+12-2+12-1=0.0625+0.125+0.25+0.5小数点后四位范围0.0000~0.1111转化为十进制位0.5、0.25这些无序的十进制数编程语言提供两......
  • 《程序是怎样跑起来的》第二章——数据是用二进制数表示的?
    关于第二章,主要讲了关于二进制方面的知识。书上说大家都熟知计算机内部是由IC这种电子部件构成的,IC有不同的形状,带相同的是都有很多引脚,其实见过CPU的都知道CPU下部有着密密麻麻的针脚,IC的所有针脚都只有直流电压0V和0.5V两个状态,也就是说,一个针脚,只能表示两个状态。而这就决定了......
  • linux系统mysql下载安装(二进制下载)
    最近在重新学习测试的基础知识,刚好学到数据库这一章,打算搭建一套linux系统上搭建mysql的服务端,简单做个记录,今天主要了解了二进制下载CentOs默认使用的软件包管理器是yum,我是用的是CentOs7,执行安装命令为:sudoyuminstallmysql-server,但是在安装的时候遇到问题,提示“没有可用软......
  • 第二章:数据是用二进制表示的
    阅读了《程序是怎样跑起来的》的第2章,我对于计算机内部数据的二进制表示有了全新的认识。这一章像是一把钥匙,打开了通往计算机内部二进制世界的大门。、首先,我惊叹于计算机科学家们将复杂的数据和指令简洁地用0和1两个数字来表示的智慧。这种简洁性不仅让计算机的硬件实现变得更......
  • 二进制详解 —— 从十进制入手,学习了解二进制
    目录二进制与整数之间的转换二进制转化为十进制十进制转化为二进制与浮点数之间的转换二进制小数➡️十进制小数十进制小数➡️二进制小数二进制我认为想要降低对新事物的恐惧,快速学会新知识,最重要的是学会类比旧事物、推理和举一反三。二进制也不例外,所以再学习二进制之前,我们先......
  • 第二章 用二进制来理解数据
    阅读《程序是怎样跑起来的》的第二章,我深感二进制的奥秘与美妙。书中从二进制的角度,为我揭示了数据在计算机中的表达方式,让我对数据在程序中的处理有了更深入的理解。二进制,作为计算机内部信息处理的基础,它的重要性不言而喻。用C语言、JAVA等高级编程语言编写的程序中所描述的数......