DNA序列

题目链接：UOJ 494

题目大意

给你 n 个字符串，要你每个都选一段非空前缀按某种顺序拼在一起使得形成的大字符串字典序最小。

思路

假设如果知道插入的顺序，我们要怎么选前缀。
发现如果前面的 \(n-1\) 个都安排好了，那你最后一个选啥是确定的（只选一个字符）
那倒数第一个就确定了，接着看第 \(n-1\) 个那你就枚举所有的前缀跟最后一个加一下，选最小的方案。（选最小的准没错，因为不会再后面变劣）
那这样倒着贪心就能构造出字符串。

于是考虑顺序。
那你会发现直观的看我们肯定是先放第一个是 \(A\)，接着是 \(C,G,T\) 这样的。
然后如果那个数的接下来一个小于它，那其实我们应该吧它选上。
然后思考会发现其实它是最大表示串，其实就是 \(>\) 为比较的 Lyndon Word。
（因为后缀都比它大那我们把所有前缀循环展开也是前面比它大了）
那我们可以用 Lyndon 分解找到第一个串。

那你可以按这个排序来确定顺序，但是要注意的是这里的也是循环展开比较。
那因为必定不是循环串，我们可以在后面加一个很大的字符，加速上面的操作。

但是还有问题，就是这个 Lyndon Word 可能会一样。
那你考虑一样的内部如何安排顺序，那最后一个的后面可能会放一些东西。
那放啥呢？设 Lyndon Word 是 \(s\)，那你串可以表示成 \(s^k+s'\) 的一段前缀，那你就是要让 \(s'\) 字典序最小（记得也要展开，即加大字符）
那你就直接按 \(s'\) 从大到小排序即可。

代码

#include<cstdio>
#include<cstring>
#include<iostream>
#include<algorithm>

using namespace std;

const int N = 55;
struct node {
	string fir, tail, all;
}a[N];
int n;
char tmp[N];

int getr(int n, int l) {
	int x = l;
	for (int now = l + 1; now <= n; now++) {
		if (tmp[now] > tmp[x]) return now - x;
		if (tmp[x] == tmp[now]) x++;
			else x = 0;
	}
	return n;
}

bool same(int l1, int l2, int sz) {
	for (int i = 1; i <= sz; i++) if (tmp[l1 + i - 1] != tmp[l2 + i - 1]) return 0;
	return 1;
}

bool cmp(node x, node y) {
	if (x.fir != y.fir) return x.fir < y.fir;
	return x.tail > y.tail;
}

int main() {
	scanf("%d", &n);
	for (int i = 1; i <= n; i++) {
		scanf("%s", tmp); int m = strlen(tmp); tmp[m] = 'Z';
		int d = getr(m, 0), now = d;
		while (same(0, now, d)) now += d;
		a[i].fir.clear(); a[i].tail.clear();
		a[i].fir = string(tmp, tmp + d) + 'Z';
		a[i].tail = string(tmp + now, tmp + m + 1) + 'Z';
		a[i].all = string(tmp, tmp + m + 1);
//		cout << a[i].fir << endl << a[i].tail << endl;
	}
	
	sort(a + 1, a + n + 1, cmp); string ans;
	for (int i = n; i >= 1; i--) {
		string now = a[i].all[0] + ans;
		string tmp; tmp = tmp + a[i].all[0];
		for (int j = 1; j < a[i].all.size(); j++) {
			tmp = tmp + a[i].all[j]; now = min(now, tmp + ans);
		}
		ans = now;
//		cout << ans << endl;
	}
	cout << ans;
	
	return 0;
}

标签：tmp,include,DNA,前缀,int,Lyndon,494,now
From： https://www.cnblogs.com/Sakura-TJH/p/LOJ_494.html

DNA germline 变异可信度判定
2022-11-0919:38:20星期三目的平时需要核查二代DNA数据检出的胚系变异是否可信，需要反复的打开igv，核查变异位置及相关条件，才能判断变异真假程度。此过程重复聒噪，当......
易基因｜疾病研究：DNA甲基化与转录组分析联合揭示吸烟免疫相关疾病的表观遗传机制
大家好，这里是专注表观组学十余年，领跑多组学科研服务的易基因。2021年12月09日，《ClinEpigenetics》杂志发表了题为“Genome-widemethylationandexpressionanalysesre......
代码随想录day43 | 1049. 最后一块石头的重量 II 494. 目标和 474. 一和零
1049.最后一块石头的重量II题目|文章思路求剩余石头的最小重量。如果两个石头最接近总重量的平均值，那么剩余石头为最小重量。所以先求出石头的总重量的一半。1.数......
易基因｜DNA甲基化和单细胞RNA-seq联合揭示空气污染对复发性流产的表观遗传影响
大家好，这里是专注表观组学十余年，领跑多组学科研服务的易基因。2022年08月23日，《ClinEpigenetics》杂志发表了题为“Integratedsingle-cellRNA-seqandDNAmethyla......
iptables之SNAT与DNAT
一、SNAT原理与应用1、SNAT应用环境局域网主机共享单个公网IP地址接入Internet(私有IP不能在Internet中正常路由)2、SNAT原理修改数据包的源地址3、SNAT转换前提条件......
易基因｜动物发育：DNA甲基化组与转录组综合分析绒山羊胚胎期毛囊发育的调控机制
大家好，这里是专注表观组学十余年，领跑多组学科研服务的易基因。西北农林科技大学动物科技学院博士研究生王善禾和李芳为共同第一作者、王昕教授和榆林学院屈雷教授为共同通......
【XSY3905】字符串题（lyndon串，构造）
题面字符串题题解设所有长度不超过\(n\)的串的集合为\(S\)。考虑找到一种方法，能够对一个lyndon串\(A\)，直接求出\(A\)的下一个lyndon串。方法如下：先将\(A......
易基因｜综合DNA甲基化测序揭示前列腺癌死亡率的预后表观遗传生物标志物 | 文献速递
大家好，这里是专注表观组学十余年，领跑多组学科研服务的易基因。2022年09月30日，《ClinTranslMed》杂志发表了题为“Comprehensivemethylomesequencingrevealsprog......
易基因｜干货：cfDNA甲基化测序实验怎么做，看完你就知道了
大家好，这是专注表观组学十余年，领跑多组学科研服务的易基因。本期，我们讲讲cfDNA重亚硫酸盐测序(cfDNA-RBS)实验怎么做，从技术原理、建库测序流程、信息分析流程等方面详细介......
【json报错】java json expect [,actual string,pos 0,fieldName null 报错解决方法
解决方法： ......

【UOJ 494】DNA序列（贪心）（Lyndon分解）

DNA序列

题目链接：UOJ 494

题目大意

思路

代码

相关文章

赞助商

阅读排行