首页 > 其他分享 >线性基学习笔记

线性基学习笔记

时间:2024-03-07 21:34:58浏览次数:31  
标签:return int 笔记 学习 -- 异或 long 线性

线性基学习笔记

定义

线性空间 \(V\) 内的一个极大线性无关组是 \(V\) 的一组 hamel 基线性基,简称

以上内容是 OI WIKI 中提及的定义。

更具体一点来说,对于一个向量组 \(v\),如果满足对于任意的取值,使 \(\sum_{i=1}^n\alpha_iv_i\ne0\)(\(\alpha\) 是常数),即不回到原点,那么称这个向量组是线性无关的。而一个极大线性无关组,对于一个 \(n\) 维空间来说,通常有 \(n\) 个元素,并且再加入任意一个元素都会使向量组 \(v\) 线性相关,即可以回到原点。对于任意的 \(\alpha\),\(\sum_{i=1}^n\alpha_iv_i\) 一定可以表示出整个空间内的任何一个点。

这些都是从几何层面上考虑。一个线性基说明我们可以用一种根简单更直观的方式来表示所有原集合中的内容。在 C++ 中包括实数线性基和异或线性基,而最常出现的是异或线性基。

异或线性基

和普通线性基一样的,异或线性基相当于将加法运算代替为异或运算,所以由定义可知异或线性基内的任意元素的异或值均不为 \(0\)。

异或线性基通常被用来求解集合内的异或 \(k\) 大值。

操作

添加元素

线性基的构造有两种方法,一种是动态的贪心构造,一种是静态的高斯消元构造。

贪心

void insert(ull x){
	for(int i=50;~i;i--){
		if(!(x>>i))continue;
		if(!d[i]){
			d[i]=x;
			break;
		}
		x^=d[i];
	}
	return ;
}

高斯消元

void gauss(){
	int j,k=1;
	for(int i=50;~i;i--){
		for(j=k;j<=n;j++){
			if(d[j]&(1ll<<i))break;
		}
		if(j>n)continue;
		swap(d[j],d[k]);
		for(j=1;j<=n;j++){
			if(j!=k&&d[j]&(1ll<<i))d[j]^=d[k];
		}
		k++;
	}
	k--;
	return ;
}

两种方法的复杂度都是 \(O(n\log a)\),其中 \(a\) 表示值域。高斯消元的常数更大,并且只适用于静态,因此不常选用。

这样构造出的线性基,\(d_i\) 所表示的线性基的第 \(i\) 位一定是 \(1\),第 \(i\) 位以前的一定是 \(0\)。

查询异或最大值

当然这个问题也适用于下面的异或 \(k\) 小值问题。

考虑到如果要让异或值最大,那么高位一定要大。又考虑到 \(d_i\) 的第 \(i\) 位一定是 \(1\),那么我们可以贪心,如果高位能够让结果变大,那么就选择异或。

code

long long MaxXor(){
	long long res=0;
	for(int i=62;i>=0;i--)res=max(res,res^d[i]);
	return res;
}

例题【P3505. [luogu3812]线性基模板】

没什么好说的,纯纯模板题。

code
#include <bits/stdc++.h>
using namespace std;
#define ull unsigned long long

int n;
ull ans;
ull p[64];

void insert(ull x){
	for(int i=50;~i;i--){
		if(!(x>>i))continue;
		if(!p[i]){
			p[i]=x;
			break;
		}
		x^=p[i];
	}
}

int main(){
	scanf("%d",&n);
	for(int i=1;i<=n;i++){
		ull a;
		scanf("%llu",&a);
		insert(a);
	}
	for(int i=50;~i;i--)ans=max(ans,ans^p[i]);
	printf("%llu",ans);
	return 0;
}

查询异或最小值

这个问题也可以类比到异或 \(k\) 小值。

考虑和刚才一样的思路,但是我们发现,如果有元素插入失败,则说明异或值可以为 \(0\),但由于线性基的定义导致了线性基内元素的异或值不可能为 \(0\),因此需要特判,反之,输出有确切值的最小的线性基。

code

int MinXor(){
	if(tot<n)return 0;
	for(int i=0;i<=62;i++){
		if(d[i])return d[i];
	}
}

查询异或 \(k\) 小值

和刚才一样考虑,我们发现,可以让对应二进制位的线性基异或,即如果 \(k\) 的二进制的第 \(i\) 位为 \(1\),那么就让结果异或第 \(k\) 大的有值的线性基。但如果这个样子,可能会因为之前的某一位上已经有了 \(1\) 而造成结果减小。为了保证这种情况不发生,我们应该保证如果第 \(i\) 个线性基有值,那么第 \(i\) 位有且仅有这一个线性基为 \(1\)。于是我们考虑像高斯消元一样重构。接着重复刚才的操作即可(注意特判 \(0\))。

code

void Rebuild(){
    for(int i=0;i<=62;i++){
        for(int j=i-1;j>=0;j--)d[i]=min(d[i],d[i]^d[j]);
    }
    return ;
}

例题【P575. [bzoj2844]albus就是要第一个出场】

先考虑问题在不可重集下的的情况,那么为了知道某个数的第一次出现的位置,我们可以二分出一个位置,如果过大则向前,过小则向后。现在考虑问题在可重集下的情况。如果线性基内有 \(|S|\) 个元素,那么说明剩下的 \(n-|S|\) 个元素一定都与线性基内的某些元素异或值为 \(0\)。不妨将外面的元素均看为 \(0\),如此一来,不管外面的元素选择什么,得到的异或值都不变 ,因此每个元素都会重复 \(2^{n-|S|}\) 次,并且,因为可以选择空集,所以异或值的集合里一定包含了 \(0\)。最后二分出答案算出该组元素的第一个的下标即可。

code
#include <bits/stdc++.h>
using namespace std;
#define ll long long

const int M=10086;
int n,x,Q,tot;
int d[32],arr[32];

void ins(int x){
    for(int i=30;i>=0;i--){
        if(((x>>i)&1)==0)continue;
        if(!d[i]){
            d[i]=x;
            break;
        }
        x^=d[i];
    }
    return ;
}

void rebuild(){
    for(int i=0;i<=30;i++){
        for(int j=i-1;j>=0;j--){
            if((d[i]>>j)&1)d[i]^=d[j];
        }
    }
    for(int i=0;i<=30;i++){
        if(d[i])arr[tot++]=i;
    }
    return ;
}

int kth(int k){
    int res=0;
    for(int i=tot-1;i>=0;i--){
        if((k>>i)&1)res^=d[arr[i]];
    }
    return res;
}

ll QuickPow(ll a,int b){
    ll res=1;
    while(b){
        if(b&1)res=res*a%M;
        a=a*a%M;
        b>>=1;
    }
    return res;
}

int main(){
    scanf("%d",&n);
    for(int i=1;i<=n;i++){
        scanf("%d",&x);
        ins(x);
    }
    rebuild();
    scanf("%d",&Q);
    ll l=0,r=(1<<tot)-1,ans=0;
    while(l<=r){
        ll mid=(l+r)>>1;
        if(kth(mid)>=Q){
            ans=mid;
            r=mid-1;
        }else l=mid+1;
    }
    printf("%lld",(ans%M*QuickPow(2,n-tot)%M+1)%M);
    return 0;
}

线性基合并

是的,线性基可以合并,只需要将一个线性基内的元素插入到另一个线性基内即可,时间复杂度是 \(O(\log^2 a)\)。

void merge(LineBasis x,LineBasis y){
    for(int i=62;i>=0;i--)x.ins(y.d[i]);
    return ;
}

区间异或最大值

可以类比为区间异或 \(k\) 大值,本质上只需要求出区间的线性基即可。

考虑和 RMQ 相同的思路,因为线性基内插入相同元素会插入失败,从而不影响结果,因此可以通过倍增求解连续 \(2^k\) 个元素的线性基,然后利用线性基合并,将整个区间有重的合并在一起。然后求解即可。

例题【P580. [bzoj4568] [Scoi2016]幸运数字】

考虑到求路径上选点权使异或值最大,考虑线性基,只需要得到路径上的所有点权并插入线性基即可,时间复杂度是 \(O(q\log n+qn)\) 的。考虑到线性基可以合并,那么我们可以利用倍增思想,将自己到自己的第 \(2^j\) 个祖先(不包括第 \(2^j\) 个祖先)的所有点权存储在线性基里面,在求解 LCA 的时候可以一并合并,这样的时间复杂度是 \(O(n\log n\log^2 a+q\log n\log^2 a)\),有一说一似乎比暴力更差。接着可以考虑和区间异或最大值的方法,用两个可重区间将整个区间覆盖,具体方式在于将两个节点到 LCA 的部分分开处理,每个部分相当于一个区间异或最大值,求解即可,复杂度能去掉一个 \(\log\),是 \(O(n\log n\log^2 a+q\log n+q\log^2 a)\) 的。

code
#include <bits/stdc++.h>
using namespace std;

const int N=2e4;
int n,m;
long long a[N+5];
struct Graph{
    int cnt;
    int head[N+5],v[(N<<1)+5],to[(N<<1)+5];
    void AddEdge(int x,int y){
        v[cnt]=y;
        to[cnt]=head[x];
        head[x]=cnt++;
        return ;
    }
    void Build(){
        cnt=1;
        int x,y;
        for(int i=1;i<n;i++){
            scanf("%d%d",&x,&y);
            AddEdge(x,y);
            AddEdge(y,x);
        }
        return ;
    }
}G;
struct LineBasis{
    long long d[64];
    void clear(){
        memset(d,0,sizeof d);
        return ;
    }
    void AddNumber(long long x){
        for(int i=60;~i;i--){
            if(((x>>i)&1)==1){
                if(d[i]==0){
                    d[i]=x;
                    break;
                }
                x^=d[i];
            }
        }
        return ;
    }
    void AddLB(LineBasis x){
        for(int i=60;~i;i--)AddNumber(x.d[i]);
        return ;
    }
    void show(){
        for(int i=60;i>=0;i--)printf("%lld ",d[i]);
        printf("\n");
        return ;
    }
};

int Log(int x){
    int res=0;
    while(x){
        res++;
        x>>=1;
    }
    return res-1;
}

struct LCA{
    int l;
    int dep[N+5],faz[N+5][20];
    LineBasis DisXor[N+5][20];
    void Dfs(int x,int fa){
        for(int i=1;i<=l;i++){
            faz[x][i]=faz[faz[x][i-1]][i-1];
            DisXor[x][i].AddLB(DisXor[x][i-1]);
            DisXor[x][i].AddLB(DisXor[faz[x][i-1]][i-1]);
        }
        for(int i=G.head[x];i;i=G.to[i]){
            int y=G.v[i];
            if(y==fa)continue;
            faz[y][0]=x;
            dep[y]=dep[x]+1;
            DisXor[y][0].AddNumber(a[y]);
            Dfs(y,x);
        }
        return ;
    }
    int kth(int x,int k){
        for(int i=l;i>=0;i--){
            if(((k>>i)&1)==0)continue;
            x=faz[x][i];
        }
        return x;
    }
    int lca(int x,int y){
        if(dep[x]<dep[y])swap(x,y);
        x=kth(x,dep[x]-dep[y]);
        if(x==y)return y;
        for(int i=l;i>=0;i--){
            if(faz[x][i]!=faz[y][i]){
                x=faz[x][i];
                y=faz[y][i];
            }
        }
        return faz[y][0];
    }
    void Build(){
        l=Log(n);
        Dfs(1,0);
        return ;
    }
}Lca;
struct Query{
    void Build(){
        int x,y;
        long long ans;
        LineBasis res;
        for(int i=1;i<=m;i++){
            ans=0;
            res.clear();
            scanf("%d%d",&x,&y);
            int lca=Lca.lca(x,y);
            res.AddNumber(a[lca]);
            int Len=Log(Lca.dep[x]-Lca.dep[lca]+1);
            res.AddLB(Lca.DisXor[x][Len]);
            res.AddLB(Lca.DisXor[Lca.kth(x,Lca.dep[x]-Lca.dep[lca]+1-(1<<Len))][Len]);
            Len=Log(Lca.dep[y]-Lca.dep[lca]+1);
            res.AddLB(Lca.DisXor[y][Len]);
            res.AddLB(Lca.DisXor[Lca.kth(y,Lca.dep[y]-Lca.dep[lca]+1-(1<<Len))][Len]);
            for(int i=60;~i;i--)ans=max(ans,ans^res.d[i]);
            printf("%lld\n",ans);
        }
        return ;
    }
}Q;

int main(){
    scanf("%d%d",&n,&m);
    for(int i=1;i<=n;i++)scanf("%lld",&a[i]);
    G.Build();
    Lca.Build();
    Q.Build();
    return 0;
}

奇怪性质

个数固定

正如定义里所说,一个极大线性无关组的大小通常是固定的。所以不管我们怎么插入,这个线性基内元素的个数总是固定的。可以理解为 \(a_1\oplus a_2=a_3\Rightarrow a_1\oplus a_3=a_2\)。

例题【P574. [bzoj2460] [BeiJing2011]元素】

因为线性基内元素个数是固定的,因此选择贪心,将权值大的尽可能靠前插入,这样得到的权值一定最大。

code
#include <bits/stdc++.h>
using namespace std;

int n,ans;
long long p[64];
struct stone{
	int m;
	long long x;
	friend bool operator <(const stone &a,const stone &b);
}a[1005];

bool operator <(const stone &a,const stone &b){
	return a.m>b.m;
}

bool ins(long long x){
	for(int i=62;~i;i--){
		if(!(x>>i))continue;
		if(!p[i]){
			p[i]=x;
			return 1;
		}
		x^=p[i];
	}
	return 0;
}

int main(){
	scanf("%d",&n);
	for(int i=1;i<=n;i++)scanf("%lld%d",&a[i].x,&a[i].m);
	sort(a+1,a+1+n);
	for(int i=1;i<=n;i++){
		if(ins(a[i].x))ans+=a[i].m;
	}
	printf("%d",ans);
    return 0;
}

练习题

P577. [bzoj3569]DZY Loves Chinese II

这道题需要先想一个奇怪的构造,之后的代码就简单了。首先在图里跑一个 DFS 树,将所有的非树边随机赋一个权值,接着将这条非树边在树上的两个端点之间的简单路径上的所有边的权值均异或上这条非树边的权值。当输入的 \(k\) 条边存在一些边的边权异或值为 \(0\),那么这个图不联通。

可以想象成每一个环都拥有不同的权值,当一个环内有两条边被同时去掉,那么这个环便不联通,所以整张图便不联通。但是如果一条边在多个环里,那么只要有一个环只去除了它一条边,那么整张图也是联通的,因为所有的不联通的环的两个部分都分别交于这条边的两个端点,所以它们联通。

这应该是哈希在线性基中的体现。

code

#include <bits/stdc++.h>
using namespace std;
#define ull unsigned long long

const int N=1e5,M=5e5;
int n,m,q,k,cnt,x,ans,tot;
int head[N+5],u[M+5],v[M+5];
ull d[64],w[M+5],a[N+5];
bool vis[N+5],inT[M+5];
mt19937_64 rnd(20100511);
struct edge{
    int to,v,id;
}e[(M<<1)+5];

void AddEdge(int x,int y,int z){
    e[cnt].v=y;
    e[cnt].to=head[x];
    e[cnt].id=z;
    head[x]=cnt++;
    return ;
}

void Dfs(int x){
    vis[x]=true;
    for(int i=head[x];i;i=e[i].to){
        int y=e[i].v,z=e[i].id;
        if(vis[y])continue;
        inT[z]=true;
        Dfs(y);
    }
    return ;
}

void Get(int x,int faz){
    for(int i=head[x];i;i=e[i].to){
        int y=e[i].v,z=e[i].id;
        if(y==faz||!inT[z])continue;
        Get(y,x);
        w[z]=a[y];
        a[x]^=a[y];
    }
    return ;
}

void Insert(int x){
    for(int i=63;i>=0;i--){
        if(((x>>i)&1)==0)continue;
        if(d[i]==0){
            tot++;
            d[i]=x;
            break;
        }
        x^=d[i];
    }
    return ;
}

int main(){
    scanf("%d%d",&n,&m);
    for(int i=1;i<=m;i++){
        scanf("%d%d",&u[i],&v[i]);
        AddEdge(u[i],v[i],i);
        AddEdge(v[i],u[i],i);
    }
    Dfs(1);
    for(int i=1;i<=m;i++){
        if(!inT[i]){
            w[i]=rnd();
            a[u[i]]^=w[i];
            a[v[i]]^=w[i];
        }
    }
    Get(1,0);
    scanf("%d",&q);
    while(q--){
        tot=0;
        for(int i=63;i>=0;i--)d[i]=0;
        scanf("%d",&k);
        for(int i=1;i<=k;i++){
            scanf("%d",&x);
            Insert(w[x^ans]);
        }
        if(tot<k)printf("Disconnected\n");
        else{
            ans++;
            printf("Connected\n");
        }
    }
    return 0;
}

P578. [bzoj4184] shallot

这道题需要用到线性基删除,但事实上,我翻遍了全网,也没有找到任何一个适用于本题的直接删除手段。因此我们考虑,对于每一个元素,都可以分配一个出现的时间和消失的时间,那么这就可以用到线段树分治,而我们只需要在向下遍历的时候将新元素加入线性基即可。

code

#include <bits/stdc++.h>
using namespace std;
#define lid id<<1
#define rid id<<1|1

const int N=5e5;
int n;
int a[N+5];
set<pair<int,int> >pos;
set<pair<int,int> >::iterator it;
stack<int>s;
vector<int>T[N<<2];
struct LineBasis{
    int d[31];
    void Insert(int x){
        for(int i=30;~i;i--){
            if(((x>>i)&1)==1){
                if(d[i]==0){
                    d[i]=x;
                    break;
                }
                x^=d[i];
            }
        }
        return ;
    }
}Lb;

void Build(int id,int l,int r){
    if(l==r)return ;
    int mid=(l+r)>>1;
    Build(lid,l,mid);
    Build(rid,mid+1,r);
    return ;
}

void Insert(int id,int l,int r,int p,int q,int x){
    if(p<=l&&r<=q){
        T[id].push_back(x);
        return ;
    }
    int mid=(l+r)>>1;
    if(p<=mid)Insert(lid,l,mid,p,q,x);
    if(q>mid)Insert(rid,mid+1,r,p,q,x);
    return ;
}

void Dfs(int id,int l,int r,LineBasis x){
    for(int i=0;i<(int)T[id].size();i++)x.Insert(T[id][i]);
    if(l==r){
        int ans=0;
        for(int i=30;~i;i--)ans=max(ans,ans^x.d[i]);
        printf("%d\n",ans);
    }else{
        int mid=(l+r)>>1;
        Dfs(lid,l,mid,x);
        Dfs(rid,mid+1,r,x);
    }
    return ;
}

int main(){
    scanf("%d",&n);
    Build(1,1,n);
    for(int i=1;i<=n;i++){
        scanf("%d",&a[i]);
        if(a[i]>0)pos.insert(make_pair(a[i],i));
        else{
            it=pos.lower_bound(make_pair(-a[i],0));
            Insert(1,1,n,(*it).second,i-1,-a[i]);
            pos.erase(it);
        }
    }
    for(it=pos.begin();it!=pos.end();it++)Insert(1,1,n,(*it).second,n,(*it).first);
    Dfs(1,1,n,Lb);
    return 0;
}

标签:return,int,笔记,学习,--,异或,long,线性
From: https://www.cnblogs.com/DycBlog/p/18059810

相关文章

  • 网络流学习笔记
    网络流学习笔记本来是不想写的,因为不想在里面博客插入图片,但是发现网络流似乎可以牵扯出许多不为人知的图论内容,因此特此写一篇博客铺路。前言网络流是一种说难也不难,说简单也不简单的结构。难就难在对于一道题来说,我们难以分辨需要用到什么算法,怎么建图,因此,我们只能多做多练,积......
  • 基环树学习笔记
    基环树学习笔记定义基环树指的是一张有\(n\)个节点和\(n\)条边的图,如果不保证连通的话,那么整张图是一张基环树森林。并且如果将环上的任意一条边去除,那么整棵基环树会成为一棵普通的树。分类基环树有以下几种特殊情况,也是题目中较多出现的。基环内向树指的是在一棵有向......
  • 笛卡尔树学习笔记
    笛卡尔树学习笔记定义笛卡尔树是一棵特殊的二叉树,它的每个节点都包含了两个值\((k,w)\)。其中,整棵树关于\(k\)为一棵二叉搜索树,而关于\(w\)为一个小根堆(或大根堆)。到这里可以发现,Treap是一种特殊的笛卡尔树,因为Treap相当于给定了\(k\),而我们人为将其随机了一个\(w\)......
  • A星算法笔记
    A星算法笔记参考:https://blog.csdn.net/hitwhylz/article/details/23089415原理heuristic启发式F=G+HG:distancebetweenstartandcurrentnodeH:distancebetweengoalandcurrentnode//TOSEARCH&CHECKManhatan距离:基本数据结构1.全局数组:openlistclose......
  • java基础 韩顺平老师的 面向对象(基础) 自己记的部分笔记
    194,对象内存布局基本数据类型放在堆里面,字符串类型放在方法区。栈:一般存放基本数据类型(局部变量)堆:存放对象(Catcat,数组等)方法区:常量池(常量,比如字符串),类加载信息 196,属性注意细节1,属性可以是基本数据类型,也可以是引用类型(对象,数组)2,属性的定义语法同变量,示例:访问修饰符属......
  • Contrastive Learning 对比学习 | 何恺明大神的 SimSiam
    论文题目:ExploringSimpleSiameseRepresentationLearning,CVPR2021。pdf:https://arxiv.org/abs/2011.10566相关博客:知乎|无门槛级讲解对比学习中的自监督模型Simsiam(通俗易懂)知乎|对比学习(ContrastiveLearning):研究进展精要(解释了为什么Simsiam会演变成这样)知......
  • 3/7学习进度
    大二学期第二周日报 第一天第二天第三天第四天第五天所花时间(包括上课) 190min≈3h≈4h  代码量(行) 75150行左右  0  博客量(篇) 1 1 1  了解到的知识点安装matlab,文件操作,安卓数据库操作复习 vue、axios......
  • Denoising Implicit Feedback for Recommendation论文阅读笔记
    Abstract​ 隐式反馈的普遍性使它们成为构建在线推荐系统的默认选择。虽然大量的隐式反馈缓解了数据的稀疏性问题,但缺点是它们在反映用户的实际满意度方面没有那么干净。例如,在电子商务中,很大一部分点击并不能转化为购买,许多购买最终会得到负面评论。因此,解释隐式反馈中不可避免......
  • mysql.h学习记录
    目录简介简介mysql.h是MySQLCAPI的主要头文件,它为C开发者提供了一套函数和定义,以与MySQL服务器交互。这些函数和定义使得开发者能够编写应用程序,实现与MySQL服务器的连接、执行查询、检索结果等操作。以下是一些常见的函数及其在mysql.h中的简要介绍:连接和关......
  • 旧时 科大部分物理笔记
    (怎么不见了这么多,后期纸制笔记未录入)有心力的角速度上的惯性离心势能势能(\(l\)为角动量):\(E_p=-\dfrac{1}{2}mw^2r^2=\dfrac{l^2}{2mr^2}\)(由\(l=mrv_\theta\)和动能分量\(\dfrac{1}{2}mv_\theta^2\)得)有效势能(总势能)对位置求导为0的是平衡点,其中二阶导大于\(0\)的是......