首页 > 其他分享 >LY1087 [ 20230217 CQYC模拟赛VIII T2 ] 记忆

LY1087 [ 20230217 CQYC模拟赛VIII T2 ] 记忆

时间:2024-01-16 15:46:02浏览次数:21  
标签:20230217 10 int LY1087 T2 long rg include define

我们来看这样一道题:

请你维护一个序列 \(a\)。

  • 1 k 将所有 \(a_i\) 变成 \(|a_i - k|\)。
  • 2 l r 求 \(\sum_{i = l} ^ {r} a_i\)。

\(n, q \le 10 ^ 5\)。

首先我们不难写出一个 \(naive\) 的代码。

#include <iostream>
#include <algorithm>
#include <cstdio>
#include <array>
#define int long long
using namespace std;

const int N = 1e5 + 5;
array <int, N> s;

signed main() {
	int n, q;
	cin >> n >> q;
	for (int i = 1; i <= n; i++)
		cin >> s[i];
	while (q--) {
		int op, x, y;
		cin >> op;
		if (op == 1) {
			cin >> x;
			for (int i = 1; i <= n; i++)
				s[i] = abs(s[i] - x);
		}
		else {
			cin >> x >> y;
			int ans = 0;
			for (int i = x; i <= y; i++)
				ans += s[i];
			cout << ans << endl;
		}
	}
	return 0;
}

这份代码跑出了 \(27.62s\) 的惊人成绩。

考虑将读入换成快读,去掉 #define int long long

#include <iostream>
#include <algorithm>
#include <cstdio>
#include <array>
#define ll long long
using namespace std;

#ifdef ONLINE_JUDGE

#define getchar() (p1 == p2 && (p2 = (p1 = buf) + fread(buf, 1, 1 << 21, stdin), p1 == p2) ? EOF : *p1++)
#define putchar(x) *(u++) = (x)
char buf[1 << 23], *p1 = buf, *p2 = buf, ubuf[1 << 23], *u = ubuf;

#endif

int read() {
	int p = 0, flg = 1;
	char c = getchar();
	while (c < '0' || c > '9') {
		if (c == '-') flg = -1;
		c = getchar();
	}
	while (c >= '0' && c <= '9') {
		p = p * 10 + c - '0';
		c = getchar();
	}
	return p * flg;
}

void write(ll x) {
	if (x < 0) {
		x = -x;
		putchar('-');
	}
	if (x > 9) {
		write(x / 10);
	}
	putchar(x % 10 + '0');
}

const int N = 1e5 + 5;
array <int, N> s;

int main() {
	int n = read(), q = read();
	for (int i = 1; i <= n; i++)
		s[i] = read();
	while (q--) {
		int op = read(), x, y;
		if (op == 1) {
			x = read();
			for (int i = 1; i <= n; i++)
				s[i] = abs(s[i] - x);
		}
		else {
			x = read(), y = read();
			ll ans = 0;
			for (int i = x; i <= y; i++)
				ans += s[i];
			write(ans), putchar(10);
		}
	}

#ifdef ONLINE_JUDGE
	fwrite(ubuf, 1, u - ubuf, stdout);
#endif
	return 0;
}

优化读入后,代码跑到了 \(26.15s\)。

加上优化参数:

#pragma GCC optimize("Ofast", "inline", "-ffast-math")
#pragma GCC target("avx,sse2,sse3,sse4,mmx")

这样就能 YCOJ 跑到 \(90pts\) 的好成绩。

考虑循环展开,一次走 \(8\) 位。

rg int it = 1, ed = (n - (n % 8));
for (; it <= ed; it += 8) {
	s[it] = abs(s[it] - x);
	s[it + 1] = abs(s[it + 1] - x);
	s[it + 2] = abs(s[it + 2] - x);
	s[it + 3] = abs(s[it + 3] - x);
	s[it + 4] = abs(s[it + 4] - x);
	s[it + 5] = abs(s[it + 5] - x);
    s[it + 6] = abs(s[it + 6] - x);
	s[it + 7] = abs(s[it + 7] - x);
}
for (; it <= n; it++)
	s[it] = abs(s[it] - x);

直接就在洛谷过了。用时:\(8.16s\)

但是在 YCOJ 上最大的点跑了 \(1.09s\)。

只超了一点点。

考虑指令集优化:


int* h;
__m256i bk[N], k;

h = ((int *) & bk) + 7;

k = _mm256_set1_epi32(-x);
for (rg int i = 1; i <= (n + 7) / 8; i++)
	bk[i] = _mm256_add_epi32(bk[i], k);
for (rg int i = 1; i <= (n + 7) / 8; i++)
	bk[i] = _mm256_abs_epi32(bk[i]);

洛谷上只跑了 126ms,直接狂暴拿到最优解,嬴!

完整代码:

#pragma GCC optimize("Ofast,no-stack-protector,unroll-loops,fast-math")
#pragma GCC target("sse,sse2,sse3,ssse3,sse4.1,sse4.2,avx,avx2,popcnt,tune=native")

#include <iostream>
#include <algorithm>
#include <cstdio>
#include <array>

#include <immintrin.h>
#include <emmintrin.h>

#define ll long long
#define il inline
#define rg register
using namespace std;

#ifdef ONLINE_JUDGE

#define getchar() (p1 == p2 && (p2 = (p1 = buf) + fread(buf, 1, 1 << 21, stdin), p1 == p2) ? EOF : *p1++)
#define putchar(x) *(u++) = (x)
char buf[1 << 23], *p1 = buf, *p2 = buf, ubuf[1 << 23], *u = ubuf;

#endif

il int read() {
	rg int p = 0, flg = 1;
	rg char c = getchar();
	while (c < '0' || c > '9') {
		if (c == '-') flg = -1;
		c = getchar();
	}
	while (c >= '0' && c <= '9') {
		p = p * 10 + c - '0';
		c = getchar();
	}
	return p * flg;
}

il void write(ll x) {
	if (x < 0) {
		x = -x;
		putchar('-');
	}
	if (x > 9) {
		write(x / 10);
	}
	putchar(x % 10 + '0');
}

const int N = 1e5 + 5;
array <int, N> s;

int* h;
__m256i bk[N], k;

int main() {
	rg int n = read(), q = read();

	h = ((int *) & bk) + 7;

	for (rg int i = 1; i <= n; i++)
		h[i] = read();


	while (q--) {
		rg int op = read(), x, y;
		if (op == 1) {
			x = read();
			k = _mm256_set1_epi32(-x);
			for (rg int i = 1; i <= (n + 7) / 8; i++)
				bk[i] = _mm256_add_epi32(bk[i], k);
			for (rg int i = 1; i <= (n + 7) / 8; i++)
				bk[i] = _mm256_abs_epi32(bk[i]);
		}
		else {
			x = read(), y = read();
			rg ll ans = 0;
			rg int it = x, ed = y - (y - x + 1) % 8;
			for (; it <= ed; it += 8) {
				ans += h[it];
				ans += h[it + 1];
				ans += h[it + 2];
				ans += h[it + 3];
				ans += h[it + 4];
				ans += h[it + 5];
				ans += h[it + 6];
				ans += h[it + 7];
			}
			for (; it <= y; it++)
				ans += h[it];
			write(ans), putchar(10);
		}
	}

#ifdef ONLINE_JUDGE
	fwrite(ubuf, 1, u - ubuf, stdout);
#endif
	return 0;
}

标签:20230217,10,int,LY1087,T2,long,rg,include,define
From: https://www.cnblogs.com/cxqghzj/p/17967821

相关文章

  • 1.15模拟赛 T2题解
    简要题意多重背包但是乘法思路暴力就直接跑背包考虑乘法能否变为加法,可以找到模数的原根,将每个数映射一下,这样乘法就变成了加法,可以直接\(\text{bitset}\)优化,但是暴力这样做还是过不了于是我们考虑二进制分组优化背包,这样复杂度貌似就对了?code#pragmaGCCoptimize("Ofast......
  • [ 20230308 CQYC省选模拟赛 T2 ] 塑料内存条
    题意给定\(n\)个不可重集,初始每个集合\(i\)有元素\(c_i\)。请你以下\(3\)种操作:1xy在集合\(x\)插入\(y\)。2xy将\(y\)集合所有数插入\(x\),并删除\(y\)集合(不影响别的集合的下标)3xy求\(x\)集合与\(y\)集合的交之和。Sol可塑性记忆。注意到前......
  • 1.11模拟赛 T2题解
    简要题意每个点有一定概率向前面的点连边,求两点之间距离的期望思路推柿子code#include<bits/stdc++.h>usingnamespacestd;#defineintlonglong#defineN1000005intn,m,u,v;constintmod=1e9+7;inta[N],sum[N],c[N],dep[N],s[N],f[N],g[N],h[N];intksm(intx......
  • 关于REACT2024挑战赛
    关于REACT2024首先,挑战赛官网如下:https://sites.google.com/cam.ac.uk/react2024/home这个挑战赛的任务是:建立一个机器学习模型,在双人交互的背景下,通过说话者的视频、音频、表情等数据,生成听者的面部反应并要保证反应的合理性(FRDistandFRCorr)、多样性(FRVar,FRDiv,andFRD......
  • 8、SpringBoot2之打包及运行
    为了演示高级启动时动态配置参数的使用,本文在SpringBoot2之配置文件的基础上进行8.1、概述普通的web项目,会被打成一个war包,然后再将war包放到tomcat的webapps目录中;当tomcat启动时,在webapps目录中的war包会自动解压,此时便可访问该web项目的资源或服务;因为......
  • Spring Boot2.x 优雅停机 Graceful Shutdown
    参考https://www.jianshu.com/p/199e419c025ehttps://blog.csdn.net/u014643282/article/details/116004816gpt注意SpringBoot还支持关闭事件监听,在监听事件内可以编写代码实现关闭前的清理工作。环境环境版本说明Windows10VSCode1.85.1Spring......
  • datavault4dbt Scalefree的dbt datavault2.0 包
    基于基于dbt的datavault2.0实现还是不少的,可以加速模型的创建,以前简单介绍的automate-dv也是一个类似的dbt包包含的maccroStagingArea(ForHashing,prejoinsandghostrecords)Hubs,Links&Satellites(allowingmultipledeltas)Non-HistorizedLinksandSatellitesMul......
  • LiveGBS流媒体平台GB/T28181常见问题-国标编号是什么设备编号和通道国标编号标记唯一
    LiveGBS国标GB28181中国标编号是什么设备编号和通道国标编号标记唯一的摄像头|视频|镜头通道1、什么是国标编号?2、国标设备ID和通道ID3、ID统一编码规则4、搭建GB28181视频直播平台1、什么是国标编号?国标GB28181对接过程中,可能有的小伙伴会疑惑编号的问题。比如设备ID、视频通道......
  • LiveGBS流媒体平台GB/T28181功能-用户管理通道权限管理关联通道支持只看已选只看未选
    LiveGBS功能用户管理通道权限管理关联通道支持只看已选只看未选添加用户备注角色1、用户管理2、添加用户3、关联通道3.1、只看已选3.2、只看未选4、自定义角色5、搭建GB28181视频直播平台1、用户管理LiveGBS支持用户管理,添加用户,及配置相关用户权限,可以添加管理员、操作员观众2、......
  • LiveGBS流媒体平台GB/T28181功能-国标级联对接海康大华宇视华为等上级平台选择通道支
    LiveGBS功能国标级联对接海康大华宇视华为等上级平台选择通道支持只看已选只看未选1、国标级联2、只看已选3、只看未选4、搭建GB28181视频直播平台1、国标级联LiveGBS可以作为下级平台,级联到第三方国标平台,详见:LiveGBS国标GB/T28181流媒体平台功能-作为下级国标平台级联到第三方......