首页 > 编程语言 >字符串算法

字符串算法

时间:2024-08-13 21:50:44浏览次数:5  
标签:ss s2 next int 算法 字符串 回文 define

KMP算法

前言

update 2024.7.31 今天重写了一篇 KMP 板子,之前是蒟蒻(现在也是),写的都是什么鬼,甚至没过模板题。感觉 KMP 优化没什么用,但是暂时保留吧。

简介

用模式串匹配文本串(主串)。

对于一个模式串,找出每个位置的 border(最长相等的前缀后缀),即为 \(next\) 数组。失陪时就跳到 border 的位置继续匹配(毕竟前缀是一样的)。注意加减细节。

KMP模板

#include <bits/stdc++.h>
// #define LOCAL
#define sf scanf
#define pf printf
#define rep(x,y,z) for(int x=y;x<=z;x++)
using namespace std;
typedef long long ll;
const int N = 1e6+7;
char s1[N],s2[N]; 
int nex[N];
int l1,l2;
void getnex() {
    int j=0;
    rep(i,1,l2-1) {
        while(j && s2[i]!=s2[j]) j=nex[j];
        if(s2[i]==s2[j]) j++;
        nex[i+1]=j;
    }
}
void KMP() {
    int j=0;
    rep(i,0,l1-1) {
        while(j && (s1[i]!=s2[j])) j=nex[j];
        if(s1[i]==s2[j]) j++;
        if(j==l2) {
            pf("%d\n",i-j+2);
        }
    }
}
int main() {
    #ifdef LOCAL
    freopen("in.txt","r",stdin);
    freopen("my.out","w",stdout);
    #endif
    sf("%s%s",s1,s2);
    l1=strlen(s1),l2=strlen(s2);
    getnex();
    KMP();
    rep(i,1,l2) pf("%d ",nex[i]);
}

KMP优化模板

#include<iostream>
#include<string>
#include<cstring>
#define ll long long
using namespace std;
const int N=105;
int ans;
struct node{
	string s;
	int len,next[N];
	int next_val[N]; 
}s1,s2;
void get_next(node &ss){
	int qz[N];
	memset(qz,0,sizeof(qz));
	ss.next[0]=-1; 
	ss.next_val[0]=-1;
	for(int i=1;i<ss.len;i++){
		int j=qz[i-1];
		while(j>0&&ss.s[i]!=ss.s[j]) j=qz[j-1];//难点
		if(ss.s[i]==ss.s[j]) j++;
		qz[i]=j;
		ss.next[i]=qz[i];
		if(ss.s[i+1]==ss.s[qz[i]])
		ss.next_val[i]=ss.next_val[ss.next[i]-1];
		else
		ss.next_val[i]==ss.next[i];
	}
}
int KMP(node s1,node s2){
	int i=0,j=0;
	while(i<s1.len&&j<s2.len){//难点 
		if(j==-1||s1.s[i]==s2.s[j]){
			i++;
			j++;
		}
		else j=s2.next_val[j-1];
	}
	if(j>=s2.len) return i-s2.len;
	else return -1;
}
int main(){
	cin>>s1.s>>s2.s;//s1为主串,s2为模式串 
	s1.len=s1.s.size();
	s2.len=s2.s.size();
	get_next(s2);//求模式串的next_val数组 
	ans=KMP(s1,s2);
	cout<<ans;
}

Manacher 马拉车算法

简介

用于找最长回文串。时间复杂度 \(O(n)\)。

朴素暴力找最长回文串是 \(O(n^2)\) 的。我们利用回文串的对称性,考虑顺序处理以每个位置为中心的回文串,为方便使每个中心是整数,可以在相邻字符间插入一个特殊字符,例如 #。数组 \(p_i\) 记录以 \(i\) 为中心的最长回文串半径。维护一个 \(r\) 表示当前处理完的回文串到达的最右边的位置,\(mid\) 表示最右边的回文串的中心。处理以 \(i\) 为中心的回文串时,把 \(i\) 关于 \(mid\) 对称得到 \(i'\),如果 \(i\le r\),由于对称性,\(i'\) 右侧一段会和 \(i\) 左侧相同,\(i'\) 左侧会有一段和 \(i\) 右侧相同,因此 \(p_i\) 可以直接继承继承 \(p_{i'}\) 但是要注意边界处理。然后我们可以暴力往 \(r\) 的右边扩展 \(p_i\),由于 \(r\) 最多扩展 \(n\) 次,所以这样的暴力也是 \(O(n)\) 次的。

Code

#include <bits/stdc++.h>
// #define LOCAL
#define sf scanf
#define pf printf
#define rep(x,y,z) for(int x=y;x<=z;x++)
using namespace std;
typedef long long ll;
const int N = 1.1e7+7;
char c[N<<1];
int n,ans;
inline void read() {
    char ch=getchar();
    c[0]='$',c[n=1]='#';
    for(;ch<'a'||ch>'z';ch=getchar());
    for(;ch>='a'&&ch<='z';ch=getchar()) c[++n]=ch,c[++n]='#';
    c[++n]='@';
}
int p[N<<1];
int main() {
    #ifdef LOCAL
    freopen("in.txt","r",stdin);
    freopen("my.out","w",stdout);
    #endif
    read();
    int mid=0,r=0;
    rep(i,1,n){
        if(i<=r) p[i]=min(p[(mid<<1)-i],r-i+1);
        while(c[i-p[i]]==c[i+p[i]]) p[i]++;
        if(p[i]+i>r) r=p[i]+i-1,mid=i;
        ans=max(ans,p[i]); 
    }
    pf("%d\n",ans-1);
}

trie 字典树

code

给出一棵普通字典树的代码:

#include <bits/stdc++.h>
// #define LOCAL
#define sf scanf
#define pf printf
#define rep(x,y,z) for(int x=y;x<=z;x++)
using namespace std;
typedef long long ll;
const int N=1e5+7,M=3e6+5;
int t,n,q;
char s[M];
int hs(char c){
    if(c>='0'&&c<='9') return c-'0';
    else if(c>='A'&&c<='Z') return c-'A'+10;
    else return c-'a'+36;
}
struct trie{
    int sum;
    int cnt[M];
    int ch[M][65];
    void clear() {
        rep(i,0,sum) {
            memset(ch[i],0,sizeof(ch[i]));
            cnt[i]=0;
        }
        sum=0;
    }
    void insert(char s[]){
        int p=0,len=strlen(s);
        rep(i,0,len-1){
            int c=hs(s[i]);
            if(!ch[p][c]) ch[p][c]=++sum;
            p=ch[p][c];
            cnt[p]++;
        }
    }
    int ask(char s[]){
        int p=0,len=strlen(s);
        rep(i,0,len-1){
            int c=hs(s[i]);
            if(!ch[p][c]) return 0;
            p=ch[p][c];
        }
        return cnt[p];
    }
}tr;
int main() {
    #ifdef LOCAL
    freopen("in.txt","r",stdin);
    freopen("my.out","w",stdout);
    #endif
    sf("%d",&t);
    while(t--){
        tr.clear();
        sf("%d%d",&n,&q);
        rep(i,1,n) {
            sf("%s",s);
            tr.insert(s);
        }
        rep(i,1,q){
            sf("%s",s);
            int ans=tr.ask(s);
            pf("%d\n",ans);
        }
    }
}

标签:ss,s2,next,int,算法,字符串,回文,define
From: https://www.cnblogs.com/liyixin0514/p/18357767

相关文章

  • USB协议详解第8讲(USB描述符-字符串和语言ID描述符)
    1.字符串描述符相关概念字符串描述符:首先,字符串描述符就是用字符串描述一个设备的一些属性,毕竟人能看懂的是字符,而不是十六进制,描述的属性包括设备厂商名字、产品名字、产品序列号、各个配置名字、各个接口名字,还有就是由我们用户自己定义的字符串,说白了就是起名字,让人们一看就知......
  • 最短路算法
    存在最短路的前提不存在负环。链接还是OIWiki好啊~~Floyd算法两两间最短路,可判负环。时间复杂度\(O(n^3)\)。像DP的思路一样。设\(f_{k,x,y}\)表示允许经过\(1\simk\)的点,\(x\toy\)的最短距离。\(O(n^3)\)的DP即可。按照\(k,x,y\)的顺序循环,每次与\(......
  • C语言入门零基础:9、字符串
    一、字符串定义    1、字符串和字符数组的区别:        字符数组存任意数组都可以,它可以以任何字符结尾;        字符串需要使用字符数组来存,但是结束必须要有一个'\0'字符;        只有字符串才能用双引号定义 ......
  • Python实现PID算法
    目录1.PID算法简介2.PID控制器的数学表达式3.Python实现PID算法场景:温度控制4.代码解释5.场景说明6.总结1.PID算法简介PID算法(Proportional-Integral-DerivativeControl)是经典的控制算法之一,广泛应用于自动控制系统中。PID控制器通过调节控制对象的输入,来实现对......
  • Python实现基因遗传算法
    目录基因遗传算法简介基因遗传算法的基本步骤Python实现基因遗传算法场景:优化二次函数Python代码实现代码解释场景说明总结基因遗传算法简介基因遗传算法(GeneticAlgorithm,GA)是一种基于自然选择和遗传学原理的优化算法,适用于求解复杂的组合优化问题。它通过模拟......
  • STL heap 算法库 堆操作
    算法库-堆操作基本操作make_heap()(1)从一个元素范围创建出一个最大堆(2)将区间内的元素转化为heap.--传比较器push_heap()对heap增加一个元素.将一个元素加入到一个最大堆pop_heap()对heap取出下一个元素.从最大堆中移除最大元素sort_heap()对heap转化为一......
  • 小白怎样理解AI大模型与传统算法?
    面对当前的AI大模型技术大潮的冲击,任何事情不提一提AI大模型,都会觉得自己落伍了,被时代所抛弃了。那AI大模型与传统算法到底有什么不同,是否会完全取代传统技术?我们有一个形象的类比,可以帮助大家更容易理解。这个类比的对象就是中医和西医。首先,我们来看看AI大模型与传统算法......
  • ChatGPT 大模型核心算法深度分析 2024
    在分析核心算法之前,我们先了解chatGPT相关技术发展进程首先介绍自然语言处理、大规模预训练语言模型以及ChatGPT技术的发展历程,接着就ChatGPT的技术优点和不足进行分析,然后讨论核心算法。1.1自然语言处理的发展历史人类语言(又称自然语言)具有无处不在的歧义性、高度......
  • 【算法】求1+2+3+...+n
    1.概述地址:JZ64求1+2+3+…+n描述求1+2+3+…+n,要求不能使用乘除法、for、while、if、else、switch、case等关键字及条件判断语句(A?B:C)。数据范围:0<n≤2000<n\le2000<n......
  • 嵌入式软件--数据结构与算法 DAY 12
    数据结构和算法是程序的核心,虽然在嵌入式应用中很少会用到,但了解认知这种思维过程是非常有必要的。一个好的程序员应该把数据结构和算法看的比代码更重要。1.数据结构是什么?定义1(宏观):数据结构是为了高效访问数据而设计出的一种数据的组织和存储方式。定义2(微观):数据结构......