云智计划_数据结构_并查集

      算法介绍

其实没什么好说的

注意几个点

1.fa[i]=i;

2.按秩合并(亦称启发式合并)与路径优化可以同时存在,只有一个复杂度为O(nlog n),两个都用就是O(nα(n)),相当于O(n)

α()在1e6的数据下,也只有5,比常数还常数

代码

int find(int x){return(fa[x]==x?x:fa[x]=find(fa[x]));}

void marge(int a,int b) {     x=find(x);y=find(y);     if(a==b)return ;     else fa[a]=b;//实在复杂度就是差一点,可以写个按秩排序 }

 基础例题

1.P1111 修复公路 - 洛谷

其实就是板子

并查集特征:只关心谁与谁在同一集合

知识点:离线处理

然后就没辣

Talk is cheap,show me the code
//https://www.luogu.com.cn/problem/P1111 //P1111 修复公路 #include<iostream> #include<algorithm> #define maxm 100010 #define maxn 1010 using namespace std; struct EDGE {     int u,v,tim; }edge[maxm]; int tot; void add(int u,int v,int tim) {     edge[++tot].v=v;     edge[tot].tim=tim;     edge[tot].u=u; } bool rule(EDGE a,EDGE b) {     return a.tim<b.tim; } int fa[maxn]; int fd(int x){return(fa[x]==x?x:fa[x]=fd(fa[x]));} int main() {     int n,m;     cin>>n>>m;     for(int i=1;i<=m;i++)     {         int x,y,z;         cin>>x>>y>>z;         add(x,y,z);     }     sort(edge+1,edge+tot+1,rule);     for(int i=1;i<=n;i++)fa[i]=i;     int ans=0;     for(int i=1;i<=m;i++)     {         int u=edge[i].u,v=edge[i].v;         if(fd(u)==fd(v))continue;         ans=edge[i].tim;         fa[fd(u)]=fd(v);     }     int root=fd(1);     for(int i=2;i<=n;i++)if(fd(i)!=root)return cout<<-1,0;     cout<<ans;     return 0; }

我这个做法没写按秩还是AC了

然后就是我这个无论如何都等到了m条边遍历完

如果是在循环中统计集合个数,==1直接return输出,循环出来-1会更快

2.P1955 [NOI2015] 程序自动分析 - 洛谷

这道题其实特别简单

最开始我以为只需要半离线

把≠先离线(其实就相当于讯问了)

然后=具有传递性,直接放在同一集合

最后看看离线下来那些≠

在同一集合直接X

但是!!

1i,j1e9

看到这玩意直接吓哭孩子了

证据:#define maxi 1000000010

其实仔细一想,最多只会用到2n个数,其他的都没意义

(于是我开始尝试在不知道有“离散化”这个东西的情况下,手搓离散化)

(最开始想的是结构体存储对应关系,后来想到要1~tot循环查找2n次)

(时间复杂度直接飙升n^2,直接放弃了)

(看了题解才知道——啥玩意?有专门的算法?叫“离散化”?)

离散化

总得来说离散化有三步走战略:

1.去重(可以用到unique去重函数)排序

2.

3.二分索引(可以用到lower_bound函数)

(摘自 追梦_Chen)

这篇博客

举例:

a:{1,100,10,10000,1000,100}——原数组

t:{1,100,10,10000,1000,100}——复制

t:{1,10,100,100,1000,10000}——排序

t:{1,10,100,1000,1000}——unique//若有不需去重的,有更好做法,还是见那篇博客

去重后不相同元素的个数:就是函数返回值减去集合的初始位置。

  • a 这里的删除不是真的delete,而是将重复的元素放到容器末尾
  • b 一定要先对数组进行排序才可以使用unique函数
  • c unique函数的返回值是去重之后的尾地址

(引自 博客

a:{1,3,2,5,4,5}——lower_bound

具体解释最后一行

a[1]:1//我喜欢从1开始

在t里找到1的下标——1

a[1]=1

a[2]:100

在t里找到100的下标——3

a[2]=3

以此类推

 

因为要离散化,所以必然先离线

剩下的就最开始说的就行了

进士侯人!!

fa数组和离散化数组这些同时涉及到等号左右两个数的这些数组

大小要开2*n!!!

因为n条(不)等式会最多有2*n个数

Talk is cheap , show me the code
//https://www.luogu.com.cn/problem/P1955 //P1955 [NOI2015] ³ÌÐò×Ô¶¯·ÖÎö #include<iostream> #include<algorithm> #include<cstring> #define maxn 100010 using namespace std; struct REQU {     int x,y,relation; }a[maxn]; int cre[2*maxn];//一定别忘了开二倍!!!!因为每条指令两个数字 int tot,u[maxn],v[maxn];//赛博半离线 int fa[2*maxn]; int find(int x){return (fa[x]==x?x:fa[x]=find(fa[x]));} void marge(int x,int y) {     x=find(x);y=find(y);     if(x==y)return;     fa[x]=y; } int main() {     int t;     cin>>t;     while(t--)     {         int n;         tot=0;         memset(a,0,sizeof(a));         memset(cre,0,sizeof(cre));         cin>>n;         for(int i=1;i<=n;i++)cin>>a[i].x>>a[i].y>>a[i].relation;          //*+*+*+*+*+*+*离散化Discretization*+*+*+*+*+*+*         for(int i=1;i<=n;i++)cre[i]=a[i].x;         for(int i=1;i<=n;i++)cre[i+n]=a[i].y;         sort(cre+1,cre+n+n+1);         int m=unique(cre+1,cre+n+n+1)-cre-1;         //其实unique是有返回值的,返回值是去重之后的尾地址,减去头地址就是个数         for(int i=1;i<=n;i++)a[i].x=lower_bound(cre+1,cre+m+1,a[i].x)-cre;//是m不是n+n         for(int i=1;i<=n;i++)a[i].y=lower_bound(cre+1,cre+m+1,a[i].y)-cre;         //lower:大于等于,upper:大于         //我们这里是找等于         //*+*+*+*+*+*+*+*+*+*+*+*+*+*+*+*+*+*+*+*+*+*          for(int i=1;i<=m;i++)fa[i]=i;         for(int i=1;i<=n;i++)         {             if(a[i].relation==0)             {                 u[++tot]=a[i].x;                 v[tot]=a[i].y;                 continue;             }            marge(a[i].x,a[i].y);         }         bool yes=1;         for(int i=1;i<=tot;i++)             if(find(u[i])==find(v[i]))                 yes=0;         if(yes==1)cout<<"YESn";         else cout<<"NOn";     }     return 0; }

然后补充一点:lower_bound那一行,要的就是把数字替换成下标,所以a[i].xy就是直接等于下标

3.P1197 [JSOI2008] 星球大战 - 洛谷

刚开始看这道题,我的第一反应是:

因为这个需要考虑连边方式了,所以感觉就不像是并查集能做出来的题啊

果然:老师:断边维护联通块数量是困难的

我:离线化处理,从最后删的边一条一条加(时光倒流)

被自己的想法吓了一跳

竟然对了!

我的思路:先离线,然后遍历所有删除的点标vis

然后建图,遇到vis=1时,把这条边先存在vis=1的点(可能两个都是)里

可以开一个vector

然后时光倒流,把当前点所有边所指向的联通块的根节点的父亲设置为这个边

最后,完全正确

Talk is cheap , show me the code.
//https://www.luogu.com.cn/problem/P1197 //P1197 [JSOI2008] ÐÇÇò´óÕ½ #include<iostream> #include<vector> #define maxm 200010 #define maxn 400020 using namespace std; int n,m,k; int u[maxm],v[maxm]; bool vis[maxn]; int a[maxn]; int fa[maxn]; int ans[maxn]; vector <int> mp[maxn]; int find(int x){return (fa[x]==x?x:fa[x]=find(fa[x]));} int main() {     cin>>n>>m;     for(int i=1;i<=m;i++)cin>>u[i]>>v[i];     cin>>k;     for(int i=1;i<=k;i++)cin>>a[i];     for(int i=1;i<=k;i++)vis[a[i]]=1;     for(int i=0;i<n;i++)fa[i]=i;     int block=n-k;     for(int i=1;i<=m;i++)     {         int x=u[i],y=v[i];         if(vis[x]==1)         {             mp[x].push_back(y);         }         if(vis[y]==1)         {             mp[y].push_back(x);         }         if(vis[x]==0&&vis[y]==0)         {             x=find(x);y=find(y);             if(x!=y)             {                 block--;                 fa[y]=x;             }         }     }     ans[k+1]=block;     for(int i=k;i>=1;i--)     {         int p=a[i];         vis[p]=0;         block++;         for(auto to:mp[p])         {             if(vis[to]==1)continue;             if(find(to)!=find(p))             {                 block--;                 fa[find(to)]=find(p);             }         }         ans[i]=block;     }     for(int i=1;i<=k+1;i++)cout<<ans[i]<<"n";     return 0; }

总结:正难则反

常见类型:时间倒流


带权并查集

额外支持操作:

1.给某个元素所在集合当前时刻所在这个集合的所有元素加一个值

2.查询某个元素的值

暴力/朴素操作:

每个点有一个值tag,代表当前点所在子树内,所有的点都要加上这个值

加一个值的时候,加到这个点所在集合代表元素(根)的tag上

查询一个值时,查询的是从根节点到该节点路径上所有tag和

进行集合合并时,把a指向b时,a要减去b的tag

因为b的tag本来只分给b所在子树

结果先a所在子树也在b所在子树内了

如果不做减法操作,那么b的tag就会分给a所在子树

但其实a所在子树并没有这个tag

有点抽象,举个例子

带权并查集详细图解

三个点123(红色代表实际值,方便观察与理解,黄色代表要记录的tag)

云智计划_数据结构_并查集

先将2+1,表现为代表元素(2)的tag+1

云智计划_数据结构_并查集

再将2和3合并(2指向3)

所以2的tag要减3的tag,1-0=1

云智计划_数据结构_并查集

然后再将2+2,表现为代表元素(3)的tag+2

云智计划_数据结构_并查集

此时,查询2的值,从2的tag一路加到树根3的tag

1+2=3

而查询3的值,就是3的tag本身,为2

再将1的值+1

云智计划_数据结构_并查集

1指向3

此时,1的tag要减去3的tag,1-2=-1

云智计划_数据结构_并查集

什么?竟然可以出现负数?我一直在加正权值啊

别急,tag并不是-1的值

此时,查询1的值,会发现是1与3的tag相加

-1+2=1

现在好懂多了吧

优化

按秩合并还是那个样,记录size,size小的的fa设置为大的那个

然后大的size+=小的size,这样优化完O(n logn)

但是我们亲爱敬爱的路径压缩就有问题了

因为我们的真实值是要计算一路到达根节点的所有tag的

你这样直接接到根节点上肯定不行

难道你那一路上的所有tag都不要了?

那么,路径压缩,路径压缩

压缩路径不就完事了

把从根节点

(根节点不计入内,因为你接入根节点后,还是要加根节点的tag)

到这个点的路径上的权值加起来

作为这个点新的tag

即新tag=真实值-根节点tag

(根节点tag其实就是根节点真实值)

复杂度也是O(n logn)

P1196 [NOI2002] 银河英雄传说 - 洛谷

这道题其实挺简单的

tag[a]=sz[b];
sz[b]+=sz[a];
fa[a]=b;

这可以算是这道题的状态转移方程吧……

推了有一段时间才推出来的

特点就是需要单独维护一个sz数组,其他的就是带权并查集模板

这是带权并查集的路径压缩
int find(int x) {     if(fa[x]==x)return x;//递归·终止条件     int f=find(fa[x]);//先全部跑一遍,让每一个递归嵌套内的f=根节点     if(fa[x]!=fa[fa[x]])tag[x]+=tag[fa[x]];//从根节点往下一层一层累加,根节点不加     return fa[x]=f;//最后直接指向根节点 }

这是查询

int x=tag[find(a)]+tag[a],y=tag[find(b)]+tag[b];

由于这道题,易证根节点tag恒为0

所以孩子节点路径压缩可以多次加根节点的值

压缩后的孩子节点tag-根节点tag=孩子节点tag-0=孩子节点tag=实际值(前面还有几个战舰)

因为在输出答案之前,肯定事先跑过一遍find,压缩完了

所以输出答案时可以不用算,直接用tag就行

(后来补充:不过我后来为了标注模板,我还是压缩时把根节点tag减去了,讯问时把根节点tag加上了)

其余的横看竖看也没看出来啥特别的

毕竟只是绿题

那就这样吧

Talk is cheap, show me the code
//https://www.luogu.com.cn/problem/P1196 //P1196 [NOI2002] ÒøºÓÓ¢ÐÛ´«Ëµ #include<iostream> #define maxn 30010 using namespace std; int fa[maxn],sz[maxn],tag[maxn]; int find(int x) {     if(fa[x]==x)return x;//递归·终止条件     int f=find(fa[x]);//先全部跑一遍,让每一个递归嵌套内的f=根节点     tag[x]+=tag[fa[x]];//从根节点往下一层一层累加     return fa[x]=f;//最后直接指向根节点 } int main() {     for(int i=1;i<=30000;i++)fa[i]=i,sz[i]=1;     int t;     cin>>t;     while(t--)     {         int a,b;         char c;         cin>>c>>a>>b;         if(c=='M')         {             a=find(a);             b=find(b);             tag[a]=sz[b];             sz[b]+=sz[a];             fa[a]=b;         }         else         {             if(find(a)!=find(b))cout<<-1<<"n";             else             {                 int x=tag[a],y=tag[b];                 if(x>y)swap(x,y);                 cout<<y-x-1<<"n";             }         }     }     return 0; }
加上根节点tag的标准处理版
//https://www.luogu.com.cn/problem/P1196 //P1196 [NOI2002] ÒøºÓÓ¢ÐÛ´«Ëµ #include<iostream> #define maxn 30010 using namespace std; int fa[maxn],sz[maxn],tag[maxn]; int find(int x) {     if(fa[x]==x)return x;//递归·终止条件     int f=find(fa[x]);//先全部跑一遍,让每一个递归嵌套内的f=根节点     if(fa[x]!=fa[fa[x]])tag[x]+=tag[fa[x]];//从根节点往下一层一层累加,根节点不加     return fa[x]=f;//最后直接指向根节点 } int main() {     for(int i=1;i<=30000;i++)fa[i]=i,sz[i]=1;     int t;     cin>>t;     while(t--)     {         int a,b;         char c;         cin>>c>>a>>b;         if(c=='M')         {             a=find(a);             b=find(b);             tag[a]=sz[b];             sz[b]+=sz[a];             fa[a]=b;         }         else         {             if(find(a)!=find(b))cout<<-1<<"n";             else             {                 int x=tag[find(a)]+tag[a],y=tag[find(b)]+tag[b];                 if(x>y)swap(x,y);                 cout<<y-x-1<<"n";             }         }     }     return 0; }
发表评论

评论已关闭。

相关文章