浅谈后缀数组

浅谈后缀数组

时间：2023-09-01 22:13:11浏览次数：49

标签：log 后缀时间数组 sa rk 浅谈

编写中，待完善。。。

前置知识 : 后缀(???),基数排序(说通俗一点就是桶子排序)，基础倍增。

后缀数组是一种处理字符串问题的利器，可以起到代替后缀树的作用，在码量上具有绝对的优势。正常情况下，大家都会使用后缀数组而非后缀树。虽然后缀数组十分的好写，但是过程难以令人理解。今天我会使用尽量通俗的语言帮助大家理解什么是后缀数组，以及相关的拓展。

在开始之前

我们需要对于一些变量进行定义（别的数字在后边讲到）：

$sa_i$ 表示排名为 $i$ 的后缀下标是多少。

$rk_i$ 表示下标 $i$ 的后缀的排名是多少。

那么这两个数组是具有性质： $sa[rk_i]=rk[sa_i]=i$ 。这一点看起来比较的绕，但是还是稍加思考可以理解的。也就是说，我们知道了 $sa$ 和 $rk$ 中的一者，就可以在线性的时间内推出另一个。

后缀排序

现在进行了定义，该如何求出这个后缀数组呢？我们讲如下两种方法（最最最最牛逼但是常数和码量极大的 $\text{DC3}$ 我们暂不讨论）：

字符串哈希算法

这个算法的时间复杂度是 $O(n \log^2 n)$ 。因为相比其他解法较劣势的时间复杂度，并不是很常使用。

相比大家知道怎么编写 $std::sort$ 的自定义比较函数吧。如果这个比较的时间是 $O(T)$ 的，那么我们的排序时间就可以做到 $O(Tn \log n)$ 。那么现在我们的目标就是在尽量块的时间内比较两个后缀的字典序。

最简单的做法就是暴力的枚举，但是注意到 $LCP$ (最长公共前缀) 是可以二分的，所以我们可以去二分第一个不一样的前缀，比较最后一个字符的大小就可以了。问题就又变换为了如何去比较两个字符串相同，这个显然使用字符串哈希可以在 $O(1)$ 的时间内解决。那么我们的比较时间就从 $O(n)$ 优化到了 $O(n\log n)$ 。

最终的时间复杂度就是 $O(n \log^2 n)$ 。

代码

标签：log,后缀,时间,数组,sa,rk,浅谈
From： https://www.cnblogs.com/Diavolo/p/17672933.html

后缀数组
后缀数组前情回顾：KMP&AC自动机马拉车&回文自动机在写后缀自动机之前先写一个小清新的后缀相关算法，也就是后缀排序。后缀数组记录的就是排序之后的这个序，具体来说有三个重要的数组。现在有一个字符串$s$，为了方便记$s$的长度为$N$。$s_i$表示$s$这个字符串的......
JavaScript—数组
数组的概念数组是指一组数据的集合，其中的每一个数据称作元素在数组中可以存放任意类型的元素。数组是一种将一组数据存储在单个变量名下的方式。创建数组创建数组vararr=newArray();//使用new创建一个空数组vararr0=[];//利用数组字面量创建数组vara......
2023-09-01：用go语言编写。给出两个长度均为n的数组， A = { a1, a2, ... ,an }， B = { b1
2023-09-01：用go语言编写。给出两个长度均为n的数组，A={a1,a2,...,an}，B={b1,b2,...,bn}。你需要求出其有多少个区间[L,R]满足:数组A中下标在[L,R]中的元素之和在[La,Ra]之中，数组B中下标在[L,R]中的元素之和在[Lb,Rb]之中。输入：第一行有一个正整数N(1<=N<=100000)，代表两......
2023-09-01：用go语言编写。给出两个长度均为n的数组， A = { a1, a2, ... ,an }， B = { b1
2023-09-01：用go语言编写。给出两个长度均为n的数组，A={a1,a2,...,an}，B={b1,b2,...,bn}。你需要求出其有多少个区间[L,R]满足:数组A中下标在[L,R]中的元素之和在[La,Ra]之中，数组B中下标在[L,R]中的元素之和在[Lb,Rb]之中。输入：第一行有一个正整数N(1<=N<=10000......
关于处理 vue data中对象或数组中响应式数据的注意点
vue2中针对对象中的响应式数据，如果要想修改他们，只能通过监听的特性实现。不能直接赋值。在vue2源码中，计算属性和watch的实现方式是一样的，都具有监听响应式对象或数组中的数据的功能。区别就是，计算属性具有缓存机制。除此之外，还可以直接使用this.$set(obj,key:String,value......
Java：commons-codec实现byte数组和16进制字符串转换
(目录)commons-codec文档https://commons.apache.org/proper/commons-codec/https://mvnrepository.com/artifact/commons-codec/commons-codec坐标<dependency><groupId>commons-codec</groupId><artifactId>commons-codec</artifact......
Python-嵌套数组获取对应的值
二维数组示例：er_array=[['霹雳火','急先锋','超音速']]forinner_arrayiner_array:#嵌套二维数组，使用两个嵌套的for循环遍历数组并获取值forvalueininner_array:print(value) 方法一：使用enumerate函数，遍历获取元素的索引er_array=[['霹雳......
Python中如何快速解析JSON对象数组
由于浏览器可以迅速地解析JSON对象，它们有助于在客户端和服务器之间传输数据。本文将描述如何使用Python的JSON模块来传输和接收JSON数据。JavaScriptObjectNotationJSON(JavaScriptObjectNotation)是一种用于数据交换的语法，它对人的读写很简单，对计算机的解析和生产也很简单......
动态数组指针应用
TypeTMyArr=arrayofarrayofarrayofInteger;Pint=^TMyArr;varPArr:Pint;i,j,k,ic,jc,kc:Integer;beginic:=2;jc:=3;kc:=4;New(PArr);SetLength(PArr^,ic,jc,kc);fori:=0toic-1doforj:=0tojc-1......
数组类型指针
{使用一个元素的数组指针}PMyRec=^TMyRec;TMyRec=recordF1:Char;F2:Word;end;procedureTForm1.Button1Click(Sender:TObject);typePArr=^TArr;TArr=array[0..0]ofTMyRec;varbuf:PArr;i:Integer;beginGetMem(buf,SizeOf......

在开始之前

后缀排序

字符串哈希算法

相关文章

赞助商

阅读排行