首页 > 其他分享 >Lyndon 串相关知识速记

Lyndon 串相关知识速记

时间:2024-05-28 15:21:49浏览次数:19  
标签:后缀 知识 ge Lyndon 速记 cdots 引理 Lambda

Lyndon Words

一个串为 Lyndon 串当且仅当其为其所有后缀中字典序最小的.

Lyndon 分解:将一个串 \(w\) 分解为若干个字典序单调不增的 Lyndon 串 \(w_1, w_2, \cdots, w_k\) 的拼接,每个 \(w_i\) 为 \(w\) 的 Lyndon 因子.

可以证明一个串的 Lyndon 分解是存在且唯一的.

引理 1:若 \(u, v\) 均是 Lyndon 串且 \(u < v\),则 \(uv\) 也是 Lyndon 串.

分讨易证.


引理 2:Lyndon 分解的最后一个 Lyndon 串为原串的最小后缀.

由 Lyndon 分解的单调性及 Lyndon 串的性质易证.

考虑每个单个字符都是 Lyndon 串,由引理 1 不断合并,可以得到一组合法的 Lyndon 分解;由最小后缀的唯一性,利用引理 2 归纳,可以导出 Lyndon 分解的唯一性.

可以将相同的 Lyndon 串写成幂的形式,即 \(w= w_1^{p_1}w_2^{p_2}\cdots w_k^{p_k}\).


Duval 算法:称形如 \(u^ku'\) 的串为近似 Lyndon 串,其中 \(u\) 为 Lyndon 串,\(u'\) 为 \(u\) 的一个前缀. 增量维护近似 Lyndon 串即可,也是 \(\mathcal{O}(|w|)\).


Significant Suffix

记 \(\operatorname{minsuf}(u)\) 为 \(u\) 的最小后缀,记 \(\operatorname{minsuf}(u, v) = \min_{w\in \operatorname{suf}(u)}wv\).

对于字符串 \(w\) 的后缀 \(w'\),若存在字符串 \(v\) 使得 \(w'v\) 为字符串集合 \(\{w''v|w''\in \operatorname{suf}(w)\}\) 中字典序最小的元素,则称 \(w'\) 为 \(w\) 的 Significant Suffix. 将字符串 \(w\) 的所有 Significant Suffix 组成的集合记做 \(\Lambda(w)\).


引理 3:

\[v < uv < u^2v < \cdots < u^\infty \]

\[v > uv > u^2v > \cdots > u^\infty \]

两条不等式链中一定恰有一条成立.

证明考虑 \(v < uv\) 和 \(v > uv\) 中恰有一条成立,反复运用即可.


引理 4:\(\Lambda(w)\) 的元素形如 \(w_i^{p_i}\cdots w_k^{p_k}\),将这个串记做 \(s_i\).

首先由 Lyndon 串的性质,一定形如 \(w_i^tw_{i+1}^{p_{i+1}}\cdots w_{k}^{p_k}\),再由引理 3 可知当 \(t\in(0, k_i)\cap \mathbb N\) 时都无法取到最值.

(似乎?)可以证明这里的 \(s_i\) 的字典序是单减的,考虑反证

若 \(s_{i+1}> s_{i}\),则 \(s_{i+1}>w_i^{p_i}s_{i+1}\),由引理 3 知 \(s_{i+1}>w_{i}^\infty\),那么存在 \(j\in[i+1, k]\cap \mathbb N\) 和 \(w_i\) 的某个后缀 \(w'_i\) 使得 \(w_j>w'_i>w_i\),与 Lyndon 分解的性质矛盾.


显然有 \(\forall s\in \Lambda(w), \nexists s', s'\vartriangleleft s\)

再由 \(s_i\) 的单调性,\(s_i\) 为 Significant Suffix 的一个必要条件是 \(s_i\sqsupset s_{i+1}\).

引理 5:\(s_i\sqsupset s_{i+1} \iff w_i\sqsupset s_{i+1} \iff i \ge \lambda\),其中 \(s_\lambda\) 为 Duval 算法中第一次比较完字符串末尾时的近似 Lyndon 串.

由 Duval 算法的过程易证.

实际上 \(i\ge \lambda\) 也是 \(s_i\in \Lambda(w)\) 的必要条件,于是可以 \(\mathcal{O}(|w|)\) 求出 \(\Lambda(w)\).


引理 6:对于 \(u, v\in\Lambda(w)\),若 \(|u|<|v|\),则 \(2|u|\le |v|\),于是 \(|\Lambda(w)| = \mathcal{O}(\log w)\).

由引理 4 和引理 5,可以简单推出 \(|s_i|\ge 2|s_{i+1}|\),而满足\(|s_i|\ge 2|s_{i+1}|\) 的串只有 \(\mathcal{O}(\log|w|)\) 个,于是显然.

实际运用中往往不需要求出每个后缀是否为 Significant Suffix,只需取 \(\{s_i\big| |s_i|\ge 2|s_{i+1}|\}\) 即可.

标签:后缀,知识,ge,Lyndon,速记,cdots,引理,Lambda
From: https://www.cnblogs.com/0922-Blog/p/18218119/Lyndon

相关文章

  • 【wiki知识库】02.wiki知识库SpringBoot后端的准备
      ......
  • 【知识点】第八章-数据管理 #CDA Level 1
    本文整理了CDALevel1第八章数据管理相关的知识点,此部分为2023年新版大纲内容,作为对旧版资料的补充,来源:CDA网校官网一.数据管理的基本概念二.指标数据标准管理三.数据质量管理以上就是全部啦,下期再见,bye!......
  • 纹理:基本知识
    uv集与纹理图层的对应uv集纹理图层uv集纹理图层0色彩映射表1凹凸贴图2脏蚀贴图3镜面贴图4不透明贴图5法线贴图6自发光贴图7遮挡贴图8粗糙度贴图9金属度贴图如果不存在uv集,则为默认值对于渲染和导出,每个定义的纹理图层均需要与u......
  • WindowsCA证书服务(三)证书的基础知识
    CA证书申请流程嫖个图吧。TLS/ssl发展 1、SSL3SSL3于1995年末发布,为了弥补先前协议版本的诸多弱点,SSL3从头开始设计了一套协议,并一直沿用到了最新版本的TLS。2、TLS1.0TLS1.0于1999年1月发布,3、TLS1.1TLS1.1于2006年4月发布。4、TLS1.2TLS1.2于2008年8月发布。5、T......
  • AI大模型知识点大梳理
    文章目录AI大模型是什么AI大模型发展历程AI大模型的底层原理AI大模型解决的问题大模型的优点和不足影响个人观点AI大模型是什么AI大模型是指具有巨大参数量的深度学习模型,通常包含数十亿甚至数万亿个参数。这些模型可以通过学习大量的数据来提高预测能力,从而在自然语言......
  • 服务器硬件基础知识
    服务器硬件基础知识涵盖了多个关键组件及其功能,以下是详细的分点表示和归纳:1.中央处理器(CPU)功能:执行计算和处理数据。重要因素:核心数、频率、缓存大小。厂商:Intel、AMD等。选购指南:关注核心数量与主频,更高的核心数目能增强服务器处理多元任务的能力;更高的主频有助于加快单个......
  • 一文搞定大学生所需的计算机基础知识
    大学计算机目录大学计算机第1章计算与计算思维1.1计算及计算工具的发展1.2计算的自动化1.2.1图灵与图灵机1.2.2冯诺依曼体系结构1.2.3现代计算机的发展1.3计算机与信息社会1.4计算思维及计算思维能力培养第2章计算机系统2.1计算机中数据的表示与运算2.1.1数制及数......
  • 00023 高等数学(工本) 知识总结
    前置知识(高中部分学习的知识)导数积分指数公式空间解析几何与向量代数象限卦限点到点的距离$M1(x_{1},y_{1},z_{1})M2(x_{2},y_{2},z_{2})则\lvertM1M2\rvert=\sqrt{(x_{1}-x_{2})^2+(y_{1}-y_{2})^2+(z_{1}-z_{2})^2}$点到直线的距离......
  • FTP服务的拓展知识——基于centos7
     FTP(文件传输协议)是应用非常广泛的服务,配置简单,功能强大。在开始拓展知识的介绍之前先来简单的了解一下FTP的工作模式。FTP拥有两种连接方式管理接连模式:控制ftp服务(客户端使用随机高位端口,服务端使用21端口)数据连接模式:由客户端决定pas(关闭被动模式)在输入就启用——pa......
  • 案例一:neo4j构建简单的金融知识图谱
    参考上一个博文将所有数据导入neo4j里面并新建数据库robot在案例里面给了很多数据开始时候不知道导入那个,但是知道需要节点文件和关系文件,并且导入知识图谱数据库的文件必须有格式 最上面一行是必须有的,所以我把目录下的文件件全部点开发现只有这一部分是需要导入的中间的:ex......