首页 > 其他分享 >2023.3.24 【字符串】AC自动机

2023.3.24 【字符串】AC自动机

时间:2023-04-21 21:47:39浏览次数:44  
标签:24 AC 匹配 模式 next 2023.3 失配 个字符

2023.3.24 【模板】AC自动机

题目描述

有这样一个问题:

给定 \(n\) 个模式串 \(s_i\) 和一个文本串 \(t\),求有多少个不同的模式串在文本串里出现过。
两个模式串不同当且仅当他们编号不同。

题面多简单qwq

如果我们简化一下这个问题,模式串和文本串都只有一个,那么我们就可以用一个10行就能写完的算法——KMP字符串匹配来解决问题。

我们在匹配之前,先将这个模式串“自匹配”,设数组\(next[i]\)表示模式串前\(i\)个字符能进行自匹配的最大长度,这里我们定义“自匹配”:

如果字符串s的前k个字符等于后k个字符,且k是满足条件的最大值,那么我们就说k是s自匹配的最大长度。

从1到n(长度)循环,如果\(s[next[i - 1] + 1] == s[i]\),那么\(next[i]\)就可以由\(next[i - 1]\)延续而来,由于\(next[i - 1]\)是最大值,\(next[i]\)一定是最大值(匹配长度最多增加一位)

如果不等于,说明当前匹配长度\(next[i - 1]\)无法延伸到\(next[i]\),我们称这种情况叫做失配,失配后我们需要找到备选答案,即满足对于前\(i - 1\)个字符(第i个尚未匹配),有前k个字符等于后k个字符,但是k是小于\(next[i - 1]\)的(因为\(next[i - 1]\)不可取),然后再检验\(s[k + 1]\)是否等于\(s[i]\)。我们要想办法不重不漏、从大到小地选择这样的k值。

我们观察到一个性质,由于前i - 1个字符中,\(next[i - 1]\)已经是前后匹配的最大值,所以对于\(k < next[i - 1]\),前\(next[i - 1]\)这一段的后k个字符一定等于前\(i - 1\)个的后k个字符,也就是说,\(s[next[i - 1] - k + 1] \to s[next[i - 1]] == s[i - k] \to s[i - 1]\)

然而我们又要\(s[1] \to s[k] == s[i - k] \to s[i - 1]\)

所以\(s[1] \to s[k] == s[next[i - 1] - k + 1] \to s[next[i - 1]]\)

注意到,前\(next[i - 1]\)个字符中,前k个等于后k个,又因为我们要k除\(next[i - 1]\)外的最大值,所以根据定义 ,我们要的k就是\(next[next[i - 1]]\)

如图:

image

完成自匹配后,其实文本串和模式串匹配是一样的,记录当前\(t[i - 1]\)的最大匹配长度k,i每次增加是检验\(t[i]\)与\(s[k + 1]\)是否相等,如果不相等,就将\(k = next[k]\)再匹配即可,当\(k == s.length\)时,就是s在t中的一次出现。

Code

for(int i = 2,j = 0;i <= n;i++)
{
	while(j > 0 && s[i] != s[j + 1]) j = next[j];
	if(s[i] == s[j + 1]) j++;
	next[i] = j;
}
for(int i = 1,j = 0;i <= m;i++)
{
	while(j > 0 && (t[i] != s[j + 1] || j == n)) j = next[j];
	if(t[i] == s[j + 1]) j++;
	f[i] = j;
	if(j == n)
		otp.push(i - j + 1);
}

(此处s和t都从1开始)

这时向前看,我们就会发现\(next\)数组多了一种意义:当前模式串的前i个匹配后,如果失配了,接下来应该匹配模式串的前几个。相当于为我们指明了当前状态失配后应该转移到哪里去。这个在后来的AC自动机,PAM和SAM中都是十分普遍的概念。我们后来叫它fail数组,即“失配数组”。

KMP算法的复杂度是O(n + m)的,因为它的两个循环分别次数为n 和 m ,对于当前记录的长度k(即程序里的j),每次只会向后+1,而减少的量不会多于增加的量,所以最多移动2n个单位,复杂度也是\(O(n)\)的。

算法流程

简单版做完了,当我们遇到多个模式串时,还能\(O(n)\)解决问题吗?这时就要用到AC自动机。

标签:24,AC,匹配,模式,next,2023.3,失配,个字符
From: https://www.cnblogs.com/fanghaoyu801212/p/17253505.html

相关文章

  • React+hook+ts+ant design封装一个具有编辑和新增功能的页面
    前言我是歌谣我有个兄弟巅峰的时候排名c站总榜19叫前端小歌谣曾经我花了三年的时间创作了他现在我要用五年的时间超越他今天又是接近兄弟的一天人生难免坎坷大不了从头再来歌谣的意志是永恒的放弃很容易但是坚持一定很酷微信公众号前端小歌谣需求分析在前端项目中最常......
  • 使用递归完成RBAC
     先使用ling查询将每个角色下的权限进行查询其次调用并返回这个GetFor方法,第一个参数是当前角色下的权限,第二个是权限的父ID顶级为0,GetFor方法是查询当前list集合用Printid作为条件,然后返回类型是一对多的样式所以创建dto进行赋值,然后那个集合需要反复调用这个方法来查询这......
  • activiti表结构 .pig4cloud
    ${flag.equals('同意')} ${flag.equals('驳回')}  驳回线  https://paper.pig4cloud.com/#%E5%A4%9A%E7%A7%9F%E6%88%B7%E5%AE%9E%E7%8E%B0  介绍   https://www.devdoc.cn/  activiti表结构https://www.devdoc.cn/activiti-table-summary.html   activiti表......
  • 使用 go-conntrack 包来实现 conntrack 会话的创建和删除
    packagemainimport("fmt""time""github.com/florianl/go-conntrack")funcmain(){//创建conntrack客户端client,err:=conntrack.Dial(nil)iferr!=nil{panic(err)}deferclient......
  • oracle 增长列-主键
      oracle英[ˈɒrəkl]美[ˈɔːrəkl]n.(古希腊的)神示所;(传达神谕的)牧师,女祭司;(古希腊常有隐含意义的)神谕,神示;能提供宝贵信息的人(或书);权威;智囊;  INSERTINTOtbl_testVALUES(seq_test.nextval,'测试');  seq_test  就是   sequence增长列    n......
  • activiti 工作流 quartz 任务调度
    activiti:工作流workflowquartz有四个重要的组件 1.Scheduler代表一个Quartz的独立运行容器,Scheduler将Trigger绑定到特定JobDetail,这样当Trigger触发时,对应的Job就会被调度。2.Trigger描述Job执行的时间触发规则。主要有SimpleTrigger和CronTrigger两个子......
  • 异常:Caused by: java.lang.NoSuchMethodError: org.apache.poi.ss.usermodel.CellStyl
    1、EasyExcel是一个基于Java的简单、省内存的读写Excel的开源项目a.POI非常耗内存(大的excel需要上G的内存)系统容易出现OOMb.POI代码也相当复杂,后面在进行维护的时候也不大好操作2、在往Excel写入数据时出现如下错误com.alibaba.excel.exception.ExcelGenerat......
  • Oracle:fedora-server-38:安装oracle11g
    基本过程不再赘述。关键点:问题1:解决1: 问题2:解决2:  问题3: 解决3: ......
  • 部署Spring Boot + React前后端分离中的奇特发现
    今天在尝试在服务器上部署SpringBoot+React前后端分离应用时有一个奇特的发现。服务器首先是前端npmrunbuild之后,将构建好的应用移动到/var/www/html文件夹,nginx启动可以正常访问,axios接口访问地址为localhost:8080;后端maven构建并运行。本地电脑同样开始运行前后端。......
  • ruoyi整合ActiveMQ-Stomp
    https://www.cnblogs.com/SjhCode/p/ruoyiActiveMQ.htmlActiveMQ在若依中的配置,这里使用的传输协议是stomp协议消费时第一时间要确定对方打开了端口,是可以连接的状态。(cmd命令行测试telnet,ping)ActiveMQ消费消息consumeMsg:在处理业务时,需要判断JSON里面每一条数据有没有存......