首页 > 其他分享 >FFT 学习笔记

FFT 学习笔记

时间:2024-05-11 21:45:29浏览次数:31  
标签:std end int FFT 笔记 学习 vector omega

应用

FFT,中文“快速傅里叶变换”,用来加速多项式乘法和卷积,可以将 \(O(n^2)\) 的复杂度优化至 \(O(n \log n)\)。

多项式

系数表示法

一个 \(n\) 次 \(n+1\) 项的多项式 \(f(x)\) 可以表示为 \(f(x) = \sum\limits_{i = 0}^{n} a_ix^i\)。

也可以用每一项的系数表示 \(f(x)\),即 \(f(x) = \{a_0, a_1, \dots, a_n\}\)。这种表示方法称为系数表示法.

点值表示法

把多项式 \(f(x)\) 看成一个平面直角坐标系中的函数 \(y = f(x)\),再代入 \(n+1\) 个不同的 \(x\) 得到 \(n+1\) 个 \(y\),那么这 \(n\) 个点就可以唯一确定多项式 \(f(x)\),即有且仅有一个多项式 \(f(x)\),满足 \(\forall i \in [0, n], f(x_i) = y_i\)。因为可以看成是一个 \(n+1\) 元 \(n+1\) 次方程组,一定能解出该方程组。

那么 \(f(x)\) 还可以用 \(f(x) = \{(x_0, f(x_0)), (x_1, f(x_1)), \dots, (x_{n}, f(x_{n}))\}\) 表示,这就是点值表示法。

点值表示法与系数表示法的互相转化

  • 对于一个 \(n\) 次多项式,在已知系数的情况下,将其转化为点值表示法,称为 DFT(离散傅里叶变换)。
    对 \(n+1\) 个 \(x\) 分别代入计算,每次 \(O(n)\),总复杂度是 \(O(n^2)\)。

  • 对于一个由点值表示法表示的 \(n\) 次多项式,将其转化为系数表示法,称为 IDFT(离散傅里叶逆变换)。
    即解一个 \(n+1\) 元 \(n+1\) 次的方程组,使用高斯消元是 \(O(n^3)\) 的,可以用拉格朗日插值做到 \(O(n^2)\)。

两种表示法在多项式乘法上的区别

  • 对于两个用系数表示法表示的多项式 \(A(x), B(x)\),需要分别枚举两个多项式的次数再将系数相乘,系数表示法做多项式乘法的复杂度为 \(O(n^2)\)。

  • 对于两个用点值表示法表示的多项式:

    \[\begin{aligned} f(x) &= \{(x_0, f(x_0)), \dots, (x_{n}, f(x_{n}))\},\\ g(x) &= \{(x_0, g(x_0)), \dots, (x_{n}, g(x_{n}))\} \end{aligned} \]

    两者相乘的结果记为 \(h(x)\),则:

    \[h(x) = \{(x_0, f(x_0) \cdot g(x_0)), \dots, (x_{n}, f(x_{n}) \cdot g(x_{n}))\} \]

    时间复杂度 \(O(n)\)。

那么将系数表示法转化为点值,做乘法后再转换为系数表示法会不会更快呢?在使用 DFTIDFT 的情况下显然是不会的,因为转化是 \(O(n^2)\) 的。如果想要更快,就需要 FFT 了。

快速傅里叶变换

复数

复数基础详见高中数学必修二第七章。

复数可以写成 \(a + bi\) 的形式,在复平面上表示为 \((a, b)\)。

在快速傅里叶变换中,我们考虑更换点值表示法中代入的 \(x\),使得能通过 \(x\) 的一些性质减少部分运算。而这些 \(x\) 即为 \(x^n = 1\) 的 \(n\) 个根,根据高中数学知识,这些根的分布情况应为:(\(n = 8\))

即这 \(n\) 个点与原点的线段平分了单位圆,将编号为 \(1\) 的根称作 \(x^n = 1\) 的单位复数根,记为 \(\omega_n\),根据欧拉公式,有:

\[e^{i\theta} = \cos \theta + i \sin \theta \]

故 \(\omega_n = e^{i \cdot (2\pi / n)}\),其它根为 \(\omega_n\) 的若干次幂。

选择这 \(n\) 个点作为点值转化原因是它们满足以下两点性质。

  • 消去引理:\(\forall n \in N, k \in N, d \in N^{*}\),有 \(\omega^{dk}_{dn} = \omega^{k}_n\)。

    证明:

    \[\omega^{dk}_{dn} = (e^{i \cdot (2 \pi / dn)})^{dk} = (e^{i \cdot (2 \pi / n)})^k=\omega^k_n \]

  • 折半引理:\(\forall n \in N, k \in N\) 且 \(n\) 为偶数,有 \((\omega^{k + n/ 2}_n)^2 = \omega^k_{n / 2}\)。

    证明:

    \[(\omega^{k + n/ 2}_n)^2 = \omega^{2k+n}_n = \omega^{2k}_n = \omega^{k}_{n/2} \]

FFT

考虑将 \(\omega^0_n, \omega^1_n, \dots, \omega^{n - 1}_n\) 代入求值。

(由于下面的推导需要用到折半定理,所以将 \(n\) 视为 \(2\) 的次幂)

有多项式:

\[A(x) = a_0 + a_1x + a_2x^2 + \dots + a_{n - 1}x^{n - 1} \]

将 \(A(x)\) 中的单项按照下标奇偶性分开:

\[\begin{aligned} A(x) &= (a_0 + a_2x^2 + \dots + a_{n - 2}x^{n - 2}) + (a_1x + a_3x^3 + \dots + a_{n - 1}x^{n - 1})\\ &= (a_0 + a_2x^2 + \dots + a_{n - 2}x^{n - 2}) + x(a_1 + a_3x^2 + \dots + a_{n - 1}x^{n - 2}) \end{aligned} \]

令:

\[\begin{aligned} A_1(x) &= a_0 + a_2x + \dots + a_{n - 2}x^{n / 2 - 1} \\ A_2(x) &= a_1 + a_3x + \dots + a_{n - 1}x^{n / 2 - 1} \end{aligned} \]

则:

\[A(x) = A_1(x^2) + xA_2(x^2) \]

令 \(k \in [0, n / 2 - 1]\),将 \(\omega^k_n\) 代入 \(A(x)\) 后得:

\[\begin{aligned} A(\omega^k_n) &= A_1((\omega^k_n)^2) + \omega^k_nA_2((\omega^k_n)^2) \\ &= A_1(\omega^{2k}_n) + \omega^k_nA_2(\omega^{2k}_n) \\ &= A_1(\omega^{k}_{n / 2}) + \omega^k_nA_2(\omega^{k}_{n/2}) \end{aligned} \]

接着将 \(\omega^{k+n/2}_n\) 代入 \(A(x)\) 后得:

\[\begin{aligned} A(\omega^{k+n/2}_n) &= A_1((\omega^{k+n/2}_n)^2) + \omega^{k+n/2}_nA_2((\omega^{k+n/2}_n)^2) \\ &= A_1(\omega^{k}_{n / 2}) + \omega^{k+n/2}_nA_2(\omega^{k}_{n/2})\\ &= A_1(\omega^{k}_{n / 2}) - \omega^k_nA_2(\omega^{k}_{n/2}) \end{aligned} \]

可以观察到 \(A(\omega^k_n)\) 与 \(A(\omega^{k+n/2}_n)\) 化简后只有符号不同,也就是说,只要求出了 \(A_1(\omega^{k}_{n / 2})\) 和 \(A_2(\omega^{k}_{n/2})\) 的值,就能求出 \(A(\omega^k_n)\) 和 \(A(\omega^{k+n/2}_n)\) 的值。

问题就转化为了求 \(A_1(x)\) 与 \(A_2(x)\) 在 \(x = \omega^0_{n/2}, \omega^1_{n / 2}, \dots, \omega^{n / 2 - 1}_{n / 2}\) 的取值,递归求解即可,时间复杂度 \(O(n \log n)\)。

IFFT

通过 FFT,我们已经能在 \(O(n \log n)\) 的时间复杂度下将系数转化为点值,接下来,考虑如何将多项式的点值转化为系数。

对于前面的 FFT,其过程可以用矩阵乘法来表示:

\[\begin{bmatrix} 1 & 1 & 1 & \cdots & 1 \\ 1 & \omega^{1}_n & \omega^{2}_n & \cdots & \omega^{n - 1}_n \\ 1 & \omega^{2}_n & \omega^{4}_n & \cdots & \omega^{2n - 2}_n \\ \vdots & \vdots & \vdots & \ddots & \vdots \\ 1 & \omega^{n - 1}_n & \omega^{2n - 2}_n & \cdots & \omega^{(n-1)^2}_n \end{bmatrix} \times \begin{bmatrix} a_0 \\ a_1 \\ a_2 \\ \vdots \\ a_{n - 1} \end{bmatrix} = \begin{bmatrix} A(a_0) \\ A(a_1) \\ A(a_2) \\ \vdots \\ A(a_{n - 1}) \end{bmatrix} \]

所以构造出左边矩阵的逆矩阵即可,左边的矩阵满足 \(V_{i, j} = \omega^{ij}_n\),它的逆矩阵是 \(V^{-1}_{i, j} = \frac{\omega^{-ij}_n}{n}\)。所以就有:

\[\begin{bmatrix} 1 & 1 & 1 & \cdots & 1 \\ 1 & \omega^{-1}_n & \omega^{-2}_n & \cdots & \omega^{-n + 1}_n \\ 1 & \omega^{-2}_n & \omega^{-4}_n & \cdots & \omega^{-2n + 2}_n \\ \vdots & \vdots & \vdots & \ddots & \vdots \\ 1 & \omega^{-n + 1}_n & \omega^{-2n + 2}_n & \cdots & \omega^{-(n-1)^2}_n \end{bmatrix} \times \begin{bmatrix} A(a_0) \\ A(a_1) \\ A(a_2) \\ \vdots \\ A(a_{n - 1}) \end{bmatrix} = n \times \begin{bmatrix} a_0 \\ a_1 \\ a_2 \\ \vdots \\ a_{n - 1} \end{bmatrix} \]

相当于做 FFT 时将 \(\omega^k_n\) 变成 \(\omega^{-k}_n\),最后将结果除以 \(n\) 即可,时间复杂度也为 \(O(n \log n)\)。

有了 FFTIFFT 就可以写出递归版本的多项式乘法,下面是洛谷 P3803 的代码:

#include <bits/stdc++.h>

using i64 = long long;
using namespace std::complex_literals;
using complex = std::complex<double>;

int n, _m;
std::vector<complex> a, b;

const double pi = acos(-1.0);
void FFT(std::vector<complex> &a, int coef) {
    int n = a.size();
    if (n == 1)
        return ;
    std::vector<complex> a1, a2;
    for (int i = 0; i < n; ++i) {
        (i & 1 ? a2 : a1).push_back(a[i]);
    }
    FFT(a1, coef);
    FFT(a2, coef);
    double theta = coef * 2 * pi / n;
    complex wn{cos(theta), sin(theta)};
    complex w = 1;
    for (int k = 0; k < n / 2; ++k, w *= wn) {
        a[k] = a1[k] + w * a2[k];
        a[k + n / 2] = a1[k] - w * a2[k];
    }
}

std::vector<int> multiply(std::vector<int> _a, std::vector<int> _b) {
    std::vector<complex> a(_a.begin(), _a.end()), b(_b.begin(), _b.end());
    int n = a.size(), _m = b.size(), len = n + _m - 2;
    for (n += _m; n != (n & -n); ++n) ;
    a.resize(n);
    b.resize(n);

    FFT(a, 1);
    FFT(b, 1);
    for (int i = 0; i < n; ++i)
        a[i] = a[i] * b[i];
    FFT(a, -1);

    std::vector<int> c(len + 1);
    for (int i = 0; i <= len; ++i) {
        c[i] = (int)(a[i].real() / n + 0.5);
    }
    return c;
}

int main() {
    std::ios::sync_with_stdio(false);
    std::cin.tie(nullptr);

    int n, m;
    std::cin >> n >> m;
    ++n, ++m;
    std::vector<int> a, b;
    while (n--) {
        int x;
        std::cin >> x;
        a.push_back(x);
    }
    while (m--) {
        int x;
        std::cin >> x;
        b.push_back(x);
    }

    auto ans = multiply(a, b);
    for (auto x : ans)
        std::cout << x << ' ';
}

交上去能够通过,但常数较大(最慢的点跑了 1.5s)。考虑优化常数,下面介绍小常数迭代写法。

蝴蝶变换

考虑 FFT 过程中下标的变化:

观察到后序列的下标其实就是原序列下标二进制的翻转,因为每次都把奇数放在右边,偶数放在左边。有了这个性质,我们可以预先把下标放在后序列对应的下标上,然后对区间进行合并即可。

代码:

#include <bits/stdc++.h>

using i64 = long long;
using namespace std::complex_literals;
using complex = std::complex<double>;

const double pi = acos(-1.0);
void FFT(std::vector<complex> &a, int coef, const std::vector<int> &rev) {
    int n = a.size();
    for (int i = 0; i < n; ++i)
        if (i < rev[i])
            std::swap(a[i], a[rev[i]]);

    for (int k = 1; k < n; k <<= 1) {
        double theta = coef * pi / k;
        complex wn{cos(theta), sin(theta)};
        for (int i = 0; i < n; i += k * 2) {
            complex w = 1;
            for (int j = 0; j < k; ++j, w *= wn) {
                auto x = a[i + j], y = a[i + j + k] * w;
                a[i + j] = x + y;
                a[i + j + k] = x - y;
            }
        }
    }
}

std::vector<int> multiply(std::vector<int> _a, std::vector<int> _b) {
    std::vector<complex> a(_a.begin(), _a.end()), b(_b.begin(), _b.end());
    int n = a.size(), _m = b.size(), len = n + _m - 2;
    for (n += _m; n != (n & -n); ++n) ;
    a.resize(n);
    b.resize(n);
    int s = std::__lg(n);
    std::vector<int> rev(n);
    for (int i = 1; i < n; ++i)
        rev[i] = (rev[i >> 1] >> 1) | ((i & 1) << (s - 1));

    FFT(a, 1, rev);
    FFT(b, 1, rev);
    for (int i = 0; i < n; ++i)
        a[i] = a[i] * b[i];
    FFT(a, -1, rev);

    std::vector<int> c(len + 1);
    for (int i = 0; i <= len; ++i) {
        c[i] = (int)(a[i].real() / n + 0.5);
    }
    return c;
}

int main() {
    std::ios::sync_with_stdio(false);
    std::cin.tie(nullptr);

    int n, m;
    std::cin >> n >> m;
    ++n, ++m;
    std::vector<int> a, b;
    while (n--) {
        int x;
        std::cin >> x;
        a.push_back(x);
    }
    while (m--) {
        int x;
        std::cin >> x;
        b.push_back(x);
    }

    auto ans = multiply(a, b);
    for (auto x : ans)
        std::cout << x << ' ';
}

交上去最慢的点跑了 600ms,效率超过递归写法的两倍。

标签:std,end,int,FFT,笔记,学习,vector,omega
From: https://www.cnblogs.com/CTHOOH/p/18184021

相关文章

  • Windows 下 PyTorch 入门深度学习环境安装(CPU版本)
    Windows下PyTorch入门深度学习环境安装(CPU版本)一、安装Anaconda二、虚拟环境配置2.1基础命令列出虚拟环境condaenvlist创建虚拟环境https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/maincondacreate-n虚拟环境名字python=版本-c镜像地址激活环境conda......
  • PyTorch深度学习快速入门教程
    PyTorch深度学习快速入门教程一、基础知识1.1Python学习中的两大法宝1.2pycharm以及jupyter使用及对比将环境写入Notebook的kernel中:python-mipykernelinstall--user--name环境名称--display-name"Python(环境名称)"打开Jupyternotebook,新建Python文件,这时候......
  • Vue3笔记
    1.man.js文件//引入一个工厂函数createAppimport{createApp}from'vue'importAppfrom'./App.vue'//创建应用实例对象app---类似于vue2中的vm,但app比vm更'轻'constapp=createApp(App)console.log('app',app)app.mount('#app......
  • 42.C语言有关函数的学习整理
    先看一个简单的函数实现的就是将数组里面的数加起来\t缩进相当于Tab键inta[10]={9,8,7,6,5,4,3,2,1,0};for(inti=0;i<10;++i)a[i]=add(a[i],i);for(inti=0;i<10;++i)printf("%d\t",a[i]); intadd(i......
  • 一种利用光电容积描记(PPG)信号和深度学习模型对高血压分类的新方法
    具体的软硬件实现点击http://mcu-ai.com/MCU-AI技术网页_MCU-AI据世界心脏联合会统计,截至2022年,全球有13亿人被诊断患有高血压,每年约有1000万人死于高血压。一个人有必要拥有有益于心脏健康的生活方式,以防止被诊断出患有心血管疾病(CVD)和动脉疾病等致命疾病的风险。如果一......
  • 笛卡尔树学习笔记
    笛卡尔树引入是一种二叉树,每个节点由一个二元组\((k,w)\)形成。\(k\)满足二叉搜索树的性质,\(w\)满足堆的性质。上面这棵笛卡尔树相当于把数组元素值当作键值\(w\),而把数组下标当作键值\(k\)。显然可以发现,这棵树的键值\(k\)满足二叉搜索树的性质,而键值\(w\)满足小根......
  • 复习笔记
    1.对变量延迟初始化延迟初始化使用的是lateinit关键字,它可以告诉Kotlin编译器,我会在晚些时候对这个变量进行初始化,这样就不用在一开始的时候将它赋值为null。当你对一个全局变量使用了lateinit关键字时,请一定要确保它在被任何地方调用之前已经完成了初始化工作,否则Kotlin将无法......
  • 软件测评笔记04--操作系统
    编译原理高级语言源程序中的错误分为两类:语法错误和语义错误,其中语义错误可分为静态语义和动态语义错误语法错误:语言结构上的错误静态语义错误:编译时能发现的程序含义上的错误动态语义错误:只有程序运行时才能表现出来 程序编译过程过程:词法分析、语法分析、语义分析词法......
  • 分块 学习笔记
    什么是分块分块,顾名思义是一种将数据分成多块,以实现一些功能的算法。分块算法实质上是一种是通过将数据分成多块后在每块上打标记以实现快速区间修改,区间查询的一种算法。其均摊时间复杂度为\(O(\sqrt{n})\)分块的具体操作分块voidcreate(){ t=sqrt(n); for(inti=1;i<......
  • DSP学习笔记之IIC
    IIC简介IIC总线是同步通信的一种特殊形式,是一种串行,半双工的通信,I2C总线只有两根双向信号线。一根是数据线SDA,另一根是时钟线SCL。IIC分为硬件IIC和软件IIC,DSP中有硬件IIC,但是不方便拓展,所以日常使用时使用软件IIC居多。IIC总线通信过程主机发送起始信号启用总线主机发送......