原理:取模运算低效的原因本质是除法运算的低效。如果能将除法变成其它运算就可以加速。具体地,将除以任意数转化成“乘一个数、除以一个2k”(取262即可确保int范围内运算较为精确)。需要使用__int128来进行乘法。
一般来说,模数是常数编译器会优化,速度不会太慢;如果模数不断变化,使用这个也不会加速(构造取模器本身需要除法)。所以如果模数是输入的一个固定数,适合使用该算法。
代码:
struct Mod
{
LL m, p;
void init(int pp) { m = (1LL << 62) / pp; p = pp; }
LL operator ()(LL x)
{
LL r = x - ((__int128(x) * m) >> 62) * p;
return r < 0 ? r+p : (r >= p ? r-p : r);
}
} mod;
感谢UOJ群老哥教我这个。
标签:取模,运算,int,算法,模数,Reduction,除法,Barrett From: https://www.cnblogs.com/kyeecccccc/p/16926104.html