首页 > 其他分享 >整除理论

整除理论

时间:2024-09-19 20:24:08浏览次数:7  
标签:约数 int dfrac 质数 合数 120 整除 理论

整除的基本知识

有 \(12\) 个苹果,恰好平分给 \(x\) 个人(每个人分到的苹果完整且数量相同),\(x\) 能取到哪些值?

分别以 \(1\) 到 \(12\) 假设 \(x\),发现只有 \(x=1,2,3,4,6,12\) 这 \(6\) 个数字满足,这里用到的就是整除的概念。整数之间的整除性,体现为两个整数相除没有余数,此时两数具有倍数和约数的关系。

设 \(a,b\) 是两个整数,且 \(a \ne 0\),如果存在另一个整数 \(q\),使得 \(b=aq\),那么就说 \(b\) 可被 \(a\) 整除,记作 \(a | b\),且称 \(b\) 是 \(a\) 的倍数,\(a\) 是 \(b\) 的约数

在 C++ 中,用 a%b==0 来表示 \(b\) 能够整除 \(a\)。

整除有几个常用性质:

  1. 若 \(a|b\) 且 \(b|c\),那么 \(a|c\)。
    回忆一下直尺上的刻度,每 \(5\) 个 \(1mm\) 小刻度形成一个 \(5mm\) 中刻度,两个 \(5mm\) 中刻度会形成一个 \(1cm\) 大刻度。这蕴涵了 \(10\) 个 \(1mm\) 小刻度形成 \(1cm\) 大刻度。也就是说,已知 \(1|5\) 和 \(5|10\),可以推出 \(1|10\)。
  2. 若 \(a|b\) 且 \(a|c\),那么对于任意的整数 \(x,y\),有 \(a|bx+cy\)。
    对 \(a\) 的倍数任意加减得到的仍然是 \(a\) 的倍数。想象一下一杯饮料 \(10\) 元,那么 \(20\) 元纸币恰好能买两杯,\(50\) 元纸币恰好能买五杯,那么无论多少张 \(20\) 元和 \(50\) 元纸币,都能买到整数杯饮料。甚至,找回来的钱也可以是 \(20\) 元纸币或 \(50\) 元纸币,对应减法。值得注意的是,\(0\) 是任何正整数的倍数。也就是说,\(a|(b-b)\) 也是对的。
  3. 设整数 \(m \ne 0\),那么 \(a|b\) 等价于 \(ma | mb\)。
    显然将两数放大若干倍,它们之间的整除性不变。

有 \(120\) 个苹果,恰好平分给 \(x\) 个人(每个人分到的苹果完整且数量相同),\(x\) 能取到哪些值?

实质上就是找 \(120\) 的所有约数,但是对于 \(120\),逐个枚举的计算量很大,但是注意到 \(120\) 的约数是成对出现的,比如 \(1 \times 120 = 120\) 和 \(2 \times 60 = 120\),其中 \(1,120,2,60\) 全都是 \(120\) 的约数。也就是说,一旦知道较小的因数 \(k\) 就可以求出那个较大的因数 \(\dfrac{120}{k}\),因为限定了大小,所以 \(k \le \dfrac{120}{k}\),\(k\) 是整数,可以得出 \(k \le 10 < \sqrt{120} < 11\),可以发现枚举量急剧减小。

不超过 \(10\) 的 \(120\) 的因数有 \(1,2,3,4,5,6,8,10\),那么对应的另一个约数就是 \(120,60,40,30,24,20,15,12\)。至此,很快就找出了 \(120\) 的全部约数。

同理,可以尝试应用这种优化过的枚举法寻找 \(n\) 的所有约数:如果 \(k\) 是 \(n\) 的约数,那么 \(n/k\) 也一定是 \(n\) 的约数,只要限定 \(k \le \dfrac{n}{k}\),即 \(k \le \sqrt{n}\),就可以在 \(O(\sqrt{n})\) 的时间复杂度内找到 \(n\) 的所有约数。

vector<int> vec; // vec用来存储n的所有约数(无序)
int find_divisors(int n) { // 返回值为约数个数
	int cnt = 0;
	for (int k = 1; k * k <= n; k++) {
		// 考虑到k*k有可能溢出,有时写成k<=n/k
		if (n % k == 0) {
			vec.push_back(k);
			if (k != n / k) vec.push_back(n / k);
			// 约数成对出现,但要注意k=n/k时可能出现重复
		}
	}
	return cnt;
}

例题:P2926 [USACO08DEC] Patting Heads S

给定 \(n\) 和 \(n\) 个正整数,求每个数是另外多少个数的倍数。\(n \le 10^5\),数字 \(a_i\) 不超过 \(10^6\)。例如给出 \(5\) 个数,分别是 \(2,1,2,3,4\) 时,答案分别是 \(2,0,2,1,3\)。

分析:如果直接枚举每对数,则时间复杂度为 \(O(n^2)\),显然不足以通过本题(能够获得 \(47\) 分)。

参考代码 $O(n^2)$
#include <cstdio>
const int N = 1e5 + 5;
int a[N], ans[N];
int main() 
{
    int n; scanf("%d", &n);
    for (int i = 1; i <= n; i++) scanf("%d", &a[i]);
    for (int i = 1; i <= n; i++) {
        for (int j = 1; j <= n; j++) {
            if (i == j) continue;
            if (a[i] % a[j] == 0) ans[i]++;
        }
    }
    for (int i = 1; i <= n; i++) printf("%d\n", ans[i]);
    return 0;
}

如果从枚举约数的角度思考,会很自然地得到这样一个算法:对于每个数 \(a_i\),枚举它的所有约数,再看这些约数在 \(n\) 个数中出现了几次(可以在输入时预处理),对它们求和即为答案。这个算法的时间复杂度是 \(O(n \sqrt{A})\),这里 \(A\) 指的是 \(\max \{ a_i \}\),比一开始的 \(O(n^2)\) 更优,能够通过本题。

参考代码 $O(n \sqrt { A })$
#include <cstdio>
const int N = 1e5 + 5;
const int A = 1e6 + 5;
int a[N], ans[N], cnt[A];
int main() 
{
    int n; scanf("%d", &n);
    for (int i = 1; i <= n; i++) {
        scanf("%d", &a[i]); cnt[a[i]]++;
    }
    for (int i = 1; i <= n; i++) {
        int ans = 0;
        // 枚举a[i]的所有约数
        for (int j = 1; j * j <= a[i]; j++) {
            if (a[i] % j == 0) {
                int d1 = j, d2 = a[i] / j;
                ans += cnt[d1];
                if (d2 != d1) ans += cnt[d2];
            }   
        }
        printf("%d\n", ans - 1); // 减去自己的贡献
    }
    return 0;
}

本题还可以从枚举倍数的角度思考:对于一个数 \(i\),如果它在原数组中出现了 \(c_i\) 次,那么 \(i\) 这个数会对它的每一个倍数产生 \(c_i\) 的贡献。

#include <cstdio>
#include <algorithm>
using std::max;
const int N = 1e5 + 5;
const int A = 1e6 + 5;
int a[N], ans[A], cnt[A]; 
int main()
{
    int n; scanf("%d", &n);
    int maxa = 0;
    for (int i = 1; i <= n; i++) {
        scanf("%d", &a[i]); cnt[a[i]]++; maxa = max(maxa, a[i]);
    }
    for (int i = 1; i <= maxa; i++) {
        for (int j = i; j <= maxa; j += i) {
            ans[j] += cnt[i]; // i 这个数会对 j 产生 cnt[i] 的贡献
        }
    }
    for (int i = 1; i <= n; i++) printf("%d\n", ans[a[i]] - 1); // 要减掉 a[i] 对自己的贡献
    return 0;
}

乍一看有上限到 \(10^6\) 的双重循环,但是实际上有这样一个数学性质:\(\sum \limits_{i=1}^{n} \dfrac{n}{i} \approx n \ln n\),因此上面这个算法的时间复杂度为 \(O(A \log A)\),由于换底公式,对数的底数不同可以忽略,不过不同于其他很多算法比如二分,在二分这样的算法中,对数的来源是折半,因此会涉及 $\log_2 $,而本题这种情况下涉及的对数是自然对数 \(\ln\),这个复杂度俗称为调和级数复杂度。

调和级数复杂度的证明涉及到微积分,目前可以先当成结论记忆。感兴趣可以阅读:调和级数的复杂度

质数与合数

当寻找 \(2,3,5,7,11,13\) 这些数的约数时,可以发现它们除了 \(1\) 和自身以外没有其他的约数,这类数被称作质数。

设正整数 \(p \ne 0,1\),如果它除了 \(1\) 和 \(p\) 以外没有其他的约数,那么就称 \(p\) 为质数。若正整数 \(a \ne 0\),\(1\) 且 \(a\) 不是质数,则称 \(a\) 为合数

若 \(a\) 为合数,则 \(a\) 能被表示成 \(a=pq\),其中 \(p,q>1\)。易证 \(p,q\) 中一定有一个不超过 \(\sqrt{a}\),因为如果 \(p,q\) 都超过 \(\sqrt{a}\),则会有 \(pq>a\),矛盾。更严格地,若 \(a\) 为合数,则一定存在质数 \(p|a\),且 \(p \le \sqrt{a}\)。

计算题:从 \(2\) 至 \(8\) 的 \(7\) 个整数中随机取 \(2\) 个不同的数,这两个数互质的概率为?

答案

从 \(8\) 个数中随机取 \(2\) 个不同的数有 \(C_7^2 = 21\) 种情况,其中互质的情况包括:\(2\) 与 \(3,5,7\),\(3\) 与 \(4,5,7,8\),\(4\) 与 \(5,7\),\(5\) 与 \(6,7,8\),\(6\) 与 \(7\),\(7\) 与 \(8\),因此概率为 \(\dfrac{3+4+2+3+1+1}{21} = \dfrac{2}{3}\)。

例题:P3383 【模板】线性筛素数

给出若干(不超过 \(10^6\))个正整数 \(k\),依次输出第 \(k\) 小的素数,素数的范围是 \(10^8\) 以内。

判断一个整数是否为质数有一个时间复杂度为 \(O(\sqrt{n})\) 的算法:

bool is_prime(int x) { // 判断x是否为质数
    for (int i = 2; i * i <= x; i++) { // 枚举不超过sqrt(x)的i
        if (x % i == 0) return false; 
    }
    return true;
}

这里之所以枚举到 \(\sqrt{x}\),就是因为如果 \(x\) 是合数,则一定存在质数 \(p|x\),且 \(p \le \sqrt{x}\)。

这同时也给出了一个寻找一定范围内所有质数的算法。例如,为了求出不超过 \(100\) 的所有质数,只要把 \(1\) 和不超过 \(100\) 的正合数都删去。

只需要用不超过 \(10\) 的全部质数(\(2,3,5,7\))找出,然后删去它们在 \(100\) 以内的所有倍数(\(2\) 的倍数,\(3\) 的倍数,\(5\) 的倍数,\(7\) 的倍数),就删去了所有 \(100\) 以内的合数,剩下的就是 \(100\) 以内的质数。

image

可以看出,没有删去的数是 \(2,3,5,7,\cdots,97\),共 \(25\) 个质数。从这 \(25\) 个质数出发,还可以找出 \(100 \times 100 = 10000\) 以内的所有质数。这个方法由古希腊数学家埃拉托斯特尼提出,称为埃拉托斯特尼筛,简称埃氏筛。

vector<int> p;
void eratosthenes_sieve(int n) {
    // 寻找不超过n的所有质数,数组flag用来做标记,flag[i]==true表示i被标记,是合数
    flag[1] = true;
    for (int i = 2; i * i <= n; i++) {
        if (!flag[i]) { // 如果i未被之前的数所标记说明i是质数
            for (int j = 2 * i; j <= n; j += i) {
                flag[j] = true; // 将i除了自己以外的倍数标记为合数
            }
        }
    }
    for (int i = 2; i <= n; i++)
        if (!flag[i]) p.push_back(i);
}

埃氏筛的时间复杂度是 \(O(n \ln\ln n)\)。

参考代码
#include <cstdio>
#include <vector>
using std::vector;
const int N = 1e8 + 5;
vector<int> p;
bool flag[N];
void eratosthenes_sieve(int n) {
    for (int i = 2; i * i <= n; i++) {
        if (!flag[i]) {
            for (int j = 2 * i; j <= n; j += i) {
                flag[j] = true;
            }
        }
    }   
    for (int i = 2; i <= n; i++) 
        if (!flag[i]) p.push_back(i);
}
int main()
{
    int n, q; scanf("%d%d", &n, &q);
    eratosthenes_sieve(n);
    for (int i = 1; i <= q; i++) {
        int k; scanf("%d", &k);
        printf("%d\n", p[k - 1]);
    }
    return 0;
}

既然质数的(大于 \(1\) 的)整数倍是合数,那么(大于 \(1\) 的)整数的质数倍数也一定是合数。就像 \(3\) 的 \(4\) 倍 \(12\) 是合数,那么 \(4\) 的 \(3\) 倍也一定是合数。于是可以得到埃氏筛的另外一种形式:

for (int i = 2; i <= n; i++) {
    if (!flag[i]) { // 如果i没有被筛去
        p.push_back(i); // 那么i就是一个质数
    }
    for (int j : p) { // 枚举当前的所有质数
        if (i > n / j) break; 
        flag[i * j] = true; // i的j倍是合数
    }
}

在这个形式中,只有当 \(j \le i\) 时,\(i \times j\) 才会被筛去。为什么这是正确的?考虑 \(j>i\) 的情况,设 \(i\) 的最小质因子是 \(p_i\),则 \(i \times j\) 会在 \(i' = j \times \dfrac{i}{p_i}, \ j' = p_i\) 的时候被筛去。

在这个基础上,再添加一行代码,就可以得到欧拉筛,一种时间复杂度为 \(O(n)\) 的线性筛。

for (int i = 2; i <= n; i++) {
    if (!flag[i]) { 
        p.push_back(i); 
    }
    for (int j : p) { 
        if (i > n / j) break; 
        flag[i * j] = true; 
        if (i % j == 0) break; // 欧拉筛的核心
    }
}

为什么增加这一句判断,就可以提前结束循环呢?设 \(n\) 的最小质因子为 \(p_n\),如 \(p_9 = 3, p_{12} = 2\)。那么在线性筛中,一个合数 \(n\) 会且仅会在 \(i = \dfrac{n}{p_n}\) 的时候被筛去。

首先证明充分性:合数 \(n\) 会在 \(i = \dfrac{n}{p_n}\) 的时候被筛去。显然 \(\dfrac{n}{p_n}\) 是大于等于 \(p_n\) 的,否则 \(\dfrac{n}{p_n}\) 的最小质因子一定比 \(p_n\) 小,且它也是 \(n\) 的一个质因子,那么 \(n\) 的最小质因子就不是 \(p_n\) 了。也就是说,当 \(i = \dfrac{n}{p_n}\) 时,\(p_n\) 一定已经被保存在 p 数组中。同时,如果 \(j\) 还没访问到 \(p_n\) 就已经 break 了,就代表着有一个比 \(p_n\) 更小的某个 \(j\),它可以整除 \(i\),也就是 \(i = \dfrac{n}{p_n}\) 的一个质因子,那么这个比 \(p_n\) 更小的质数 \(j\) 也一定是 \(n\) 的一个质因子,这也与 \(p_n\) 是 \(n\) 的最小质因子矛盾了。

然后证明必要性:合数 \(n\) 仅会在 \(i = \dfrac{n}{p_n}\) 的时候被筛去。假设 \(p'\) 是一个大于 \(p_n\) 的 \(n\) 的质因子,那么需要证明的是:当 \(i = \dfrac{n}{p'}\) 的时候,在 \(j\) 枚举到 \(p'\) 之前,第二层循环就已经 break 了。这其实也很简单:因为 \(p'\) 和 \(p_n\) 互质,且同时是 \(n\) 的质因子,所以 \(p_n\) 也一定是 \(\dfrac{n}{p'}\) 的一个质因子。那么当 \(i = \dfrac{n}{p'}\) 时,当 \(j\) 枚举到 \(p_n\) 时,\(j\) 就整除 \(i\) 了,此时第二层循环就会 break,而不会让 \(j\) 再往后枚举到 \(p'\)。

也就是说,对于每一个合数,它只会被 flag[i*j]=true 这条语句标记为合数一次,也就是说这条语句实际上只会被执行不超过 \(n\) 次,那么整个算法的时间复杂度显然就是 \(O(n)\) 了。

参考代码
#include <cstdio>
#include <vector>
using std::vector;
const int N = 1e8 + 5;
vector<int> p;
bool flag[N];
void euler_sieve(int n) {
    for (int i = 2; i <= n; i++) {
        if (!flag[i]) { 
            p.push_back(i); 
        }
        for (int j : p) { 
            if (i > n / j) break; 
            flag[i * j] = true;
            if (i % j == 0) break;
        }
    }
}
int main()
{
    int n, q; scanf("%d%d", &n, &q);
    euler_sieve(n);
    for (int i = 1; i <= q; i++) {
        int k; scanf("%d", &k);
        printf("%d\n", p[k - 1]);
    }
    return 0;
}

完善程序题:

好运的日期)一个日期可以用 \(x\) 年 \(y\) 月 \(z\) 日来表示。我们称一个日期是好运的,当且仅当 \(xy(w-z+1)\) 为质数,其中 \(w\) 为 \(x\) 年 \(y\) 月的总天数。输入 \(x,y,z\),判断其对应的日期是否好运。保证 \(x\) 是不超过 \(2024\) 的正整数,\(y\) 是不超过 \(12\) 的正整数,\(x,y,z\) 可以构成一个合法的日期。试补全线性筛法算法,空间限制 512MiB。

#include <bits/stdc++.h>
using namespace std;

const int MAXW = ①;
const int days[13] = {0, 31, 0, 31, 30, 31, 30, 31, 31, 30, 31, 30, 31};
int prime[MAXW], cnt;
bool not_prime[MAXW];

void linear_prime(int n) {
    --n;
    not_prime[0] = not_prime[1] = true;
    for (int i = 2; i <= n; i++) {
        if (not_prime[i] == false)
            prime[++cnt] = i;
        for (int j = 1; ②; j++) {
            not_prime[i * prime[j]] = 1;
            if (i % prime[j] == 0)
                ③;
        }
    }
}
bool check(int n) {
    return ④;
}

int main() {
    linear_prime(MAXW);
    int x, y, z, w;
    cin >> x >> y >> z;
    if (y == ⑤)
        w = check(x) ? 29 : 28;
    else
        w = days[y];
    if (not_prime[x * y * (w - z + 1)])
        cout << "unlucky" << endl;
    else
        cout << "lucky" << endl;
    return 0;
}

①处可以填?
A. 753005 / B. 10000000000 / C. 725041 / D. 2024

②处可以填?
A. j <= cnt / B. i * prime[j] <= n
C. (j <= cnt) && (i * prime[j] <= n) / D. (i <= cnt) && (prime[i] * prime[j] <= n)

③处可以填?
A. not_prime[i] = true / B. return / C. continue / D. break

④处可以填?
A. n % 4 == 0 / B. (n % 400 == 0 || (n % 4 == 0 && n % 100 != 0))
C. (n % 4 == 0 && n % 100 != 0) / D. (n % 100 == 0 || (n % 4 == 0 && n % 100 != 0))

⑤处可以填?
A. 1 / B. 7 / C. 8 / D. 2

答案

image

答案:ACDBD

标签:约数,int,dfrac,质数,合数,120,整除,理论
From: https://www.cnblogs.com/ronchen/p/18372320

相关文章

  • 26. 多进程理论、操作
    1.多进程相关理论1.1什么是进程进程是一个正在执行的任务或程序负责执行任务的是CPU(1)单任务单核CPU+多道技术实现多个进程的伪并发(2)多任务多个任务并发执行1.2 进程和程序的区别程序是代码的集合体进程是程序的执行过程1.3进程的调度算法(1)先来先服务算法 F......
  • 最优化理论与自动驾驶(十一):基于iLQR的自动驾驶轨迹跟踪算法(c++和python版本)
    最优化理论与自动驾驶(四):iLQR原理、公式及代码演示之前的章节我们介绍过,iLQR(迭代线性二次调节器)是一种用于求解非线性系统最优控制最优控制最优控制和规划问题的算法。本章节介绍采用iLQR算法对设定的自动驾驶轨迹进行跟踪,与第十章节纯跟踪算法采用同样跟踪轨迹,同时,我们仅对控......
  • 最优化理论与自动驾驶(十):纯跟踪算法原理、公式及代码演示
    纯跟踪算法(PurePursuitAlgorithm)是一种用于路径跟踪的几何控制算法,广泛应用于自动驾驶、机器人导航等领域。其基本思想是通过选择预定路径上的目标点(预瞄点),并控制转向角,使车辆不断逼近并跟随该目标点,从而达到路径跟踪的效果。1.纯跟踪算法的基本原理在纯跟踪算法中,控制车......
  • 皮带堵料监测AI算法:检测方法与理论依据
    皮带输送系统在矿山等工业环境中扮演着至关重要的角色。然而,皮带堵料问题常常导致生产效率降低、设备损坏,甚至可能引发安全事故。为了有效监测和预防皮带堵料,现代技术采用多种AI算法进行实时检测。本文将探讨几种皮带堵料监测的检测方法、理论依据,并分析哪种方法更适合矿山智能化应......
  • 【理论篇】数据挖掘 第六章 挖掘频繁模式、关联和相关性:基本概念和方法(下)
    说明:文章为《数据挖掘:概念与技术原书第03版》的学习笔记,该书是数据挖掘领域的经典之作,想了解更多内容请参阅原著。首先祝大家中秋快乐,本文章接上篇【理论篇】数据挖掘第六章挖掘频繁模式、关联和相关性:基本概念和方法(上)思考:满足最小支持度和最小置信度的模式一定是有趣......
  • DFT理论知识 scan insertion详解
    ###DFT理论知识:SCANInsertion详解####一、SCANInsertion概述**1.定义**SCANInsertion是设计可测试性(DesignForTestability,DFT)中的一种技术,通过在芯片设计中插入扫描链(ScanChain),使得原本难以测试的组合逻辑电路变得可测试。扫描链通过将触发器(Flip-Flop)转换为......
  • Leetcode 2183. 统计可以被 K 整除的下标对数目
    1.题目基本信息1.1.题目描述给你一个下标从0开始、长度为n的整数数组nums和一个整数k,返回满足下述条件的下标对(i,j)的数目:0<=i<j<=n-1且nums[i]*nums[j]能被k整除。1.2.题目地址https://leetcode.cn/problems/count-array-pairs-divisible-by-k......
  • 动态规划理论总结
    三个特征最优子结构问题最优解包含子问题的最优解,即可以通过子问题得到最优解。无后效性有两层含义:在后面的推到过程中,只关心前面的状态值,不关心这个状态是怎么一步步推导出来的。前面的状态如果已经确定,就不会收到后面状态影响子问题重叠不同的决策序列,到达某个......
  • 代码随想录算法训练营Day5 | 哈希表理论基础、242.有效的字母异位词、349.两个数组的
    哈希表理论基础哈希表哈希表是根据关键码的值而直接进行访问的数据结构。数组就是一张哈希表,哈希表中关键码就是数组的索引下标,然后通过下标直接访问数组中的元素,如下图所示:哈希表一般用来快速判断一个元素是否出现集合里。哈希函数哈希函数通过特定编码方式,可以将其......
  • 【python】python入门基础理论+实践,这一篇就够了
    简介:第一个helloworldprint("helloworld!");foriinrange(10):print('run:',i);importtime;time.sleep(10);字符串str在Python中,加了引号的字符都被认为是字符串!name="zhangsan"多引号多引号什么作⽤呢?作⽤就是多⾏字符串必须⽤多引号message='''这......