首页 > 其他分享 >百度之星 2022 游记

百度之星 2022 游记

时间:2022-11-28 20:16:13浏览次数:47  
标签:编码 然后 2022 Error Encode 游记 字典 之星 但是

上接 CSP & NOIP 2022 游记。虽然还没有写

Day 0

上午是 NOIP 2022。出考场发现雅礼寄的有点彻底。
我以为大家都能通过 T134,甚至可能只有我不会 T2 才没 AK,结果除了蛤蛤大家都 200 左右???
有点抽象,大家也比较 emo,毕竟退役边缘。不过塞翁失马,焉知非福。
然后坐高铁去杭州了。高铁上 5 个人在 4 个车厢,一个人呆着有点无聊,加上心情不太好,基本就睡觉+看 qq,本来按道理可以干一些别的事情的。
行李太大放不到行李架上,只能放在车厢前面的一个神秘位置。晚饭是 syzf 赠送的自热米饭,一开始觉得可能还不错,吃了之后究极差评。
由于听说抵达杭州扫过场所码之后约 1h 就会黄码,然后不能入住酒店只能流落街头等核酸出来,于是必须尽快抵达酒店,但是事与愿违。
出高铁站时出示了 N 次健康码、行程码、身份证。杭州的码都不支持微信扫,必须支付宝,而尧酱和 syzf 都没有支付宝,被搞了很久。
好不容易出来了,打车去酒店的时候,我、juju 和他爸一波,尧酱和 syzf 一波。然后我们这一波去了目标酒店的一家同名酒店,和前台对话互相迷惑一段时间后发现走错了。
打车的时候我还和 juju 爸爸确认了一下是哪一个,但是他后来换了个车还是点错了
终于入住了酒店,至少不用流落街头,我们 4 个坐电梯上去的时候,电梯中途突然失重坠落了半层!!!太可怕。
每个人发了一个有真实姓名的吊牌,而且双面都有,这下不能像 NOI 一样反过来带了。
晚饭实在不行,于是大家出去点了一个麦当劳带回来。点的时候都说不太想吃,开吃之后暴风吸入,5min 消灭了。
承担了一整天的开解学弟 NOIP emo 心情工作。毕竟很有 NOIP 寄掉的经验啊 但是我知道核心问题还是只有自己才能解决。

Day 1 比赛

只有一天的比赛为什么需要用 Day 1 这种编号方式啊
百度之星开考!但是我没看到集合时间,迟到了几分钟,小寄。左边是 xiaoyaowudi,左边的左边是尧酱,前面是 huzhaoyang,右前方是 zgg。
帮 xiaoyaowudi 解决了一下考试网址问题,和他混了个脸熟(x)
听出题人讲了一堆今天题目的意义,最后还是重新看了一遍才看懂题意。题目很有意思,感觉比传闻中前两年的阴间东西好一百倍。

描述一下题意 题目背景是 AI 大模型。题意大概是给你一些数据,设计一个编码和解码策略,使得编码出来是一个 $0\sim n-1$ 之间的整数构成的序列($n$ 是题面中给定的一个常数)。你的编码序列长度越短越好。除了上传编码和解码的代码,还可以上传一个(你自己生成的)字典作为辅助文件,编码和解码的程序不能通信,但是都能读取这个只读的字典。它希望你使用的方式是用字典表示 $0~n-1$ 之间的整数和某 $n$ 个字符串的一一对应关系,这样就能用整数序列表示字符串了。
7 道题题意都是这个。但是 T1 要编码的数据是中日韩俄英文句子,T2 是神秘语言,T3 是代码,T4 是图片像素点,T5 是蛋白质分子式,然后 T6T7 下午才公布。
每题的样例是一个非常大的数据集,想让你训练你的 AI,生成出一个优秀的字典。
评分方式也很有意思,每道题分别计分,如果 $x$ 人这题交了有效提交,取 $0~100$ 分的 $x$ 等分点作为这些人在这题上的分数,然后跑出来的编码越优秀得分越高。 T123456 分别占总分的 10%,但是 T7 占 40%。

感觉颇为神秘,但是我记得初级 AI 的策略都很 simple 的。然后我就搞了个简单东西,把数据集里为 \(i\) 的子串拿出来,按出现次数排序,取前若干名放到字典里。然后对长度为 \(i=1,2,3,4\) 分别做一遍就好了。编码就直接 dp。
显然是一个 simple 无比的通用策略,本来以为会很垃圾,想着可能在 T5 上表现会好一点点。写了一百年并和题目格式斗智斗勇之后,发现在 T5 上有 96 分左右??
大受震撼,然后把这个在每一题上稍作改动都交了一遍,除了 T4 只有 80 左右,别的题都是 90 左右,然后我就 rk3 了。
果然大家都不会 AI
但是 rk1 5 题都是 100 分,看起来非常强大,我当时以为他有一个非常厉害的策略。后来才知道是利用了机制漏洞,结果被工作人员手动搞掉了
顺带一提,考试的时候虽然能看到榜,但是只能看到账号名字。大家分发到的账号名字都是什么“及时雨”“白花蛇”之类的水浒外号,完全不知道谁是谁。
发现自己得分一直在下滑,想着改进一下。然后使用了另一个策略,就是把文章中的英文字母拿出来,连续的英文字母看成一个单词,然后统计单词的出现次数,感觉比统计子串要稍微合理一点。
但是只用这个肯定不行,所以我是使用了混合策略,把这两个拼在一起。
这个本来是针对 T1T2 设计的优化策略,结果在 T1T2 上基本没有效果,但是让我 T3 得分又高了很多。
但是改变不了我的排名一直下滑的趋势,后来掉到了 rk6 的样子,感觉再这样下去要没奖了。
然后试图拯救一下我的 T4,它只剩 60 分左右了。发现可以通过数据格式忽略掉整数之外的部分。然后实现这个又实现了一百年。
到吃午饭的时间了,还是没实现完,但是人已经有点神志不清了,表现为动作迟缓、完全不知道自己在写什么、写了代码后立刻删除然后再写一遍。于是先吃饭,感觉饭菜还行。
感觉有点累的,而且这才刚过上午啊。连续打 7h 的神秘比赛还是有点需要体力的。
吃完饭发现自己掉到了 20 名左右,因为 T6T7 公布了。都是什么卷王,不用吃饭的吗。其实主要是我吃饭太慢了。但是总不能连吃饭速度都卷吧
感觉状态恢复了,把 T4 写完了,本地也过了,但是返回 Encode Error。由于我的做法重新生成一次字典或者编一次码,程序就要跑 3~4 min,调试起来比较阴间。
而且完全看不出有任何问题,破大防。然后看了眼 T6T7 题面,T6 是 01 串,T7 是前 6 道题的数据类型混在一起???
把初版通用策略应用到了 T6T7,本地也过了,但是全部 Encode Error??交了一版 Encode Error 之后感觉事情不对。把我 T5 过了的代码重新交了一遍,果然也 Encode Error 了。
在群里问了一下是为什么,说是中间加强了一次评测限制,如果编码输出的序列有行末空格或者连续的空格就会 Encode Error。原因是不做这个限制可以利用空格在不增加代价的情况下获得更多信息。
此时大概明白了榜 1 老哥是怎么做到的,又是怎么突然 5 题爆零的
然后改了改把 Encode Error 的提交都通过了,但是发现 T4 优化效果很差,T6 通用策略只有 10 分/kx
但是 T7 有 85 左右诶,进前 6 了。然后用混合策略代替了初版策略,拿了 90,又 rk3 了。
然后封榜了,还有 1h 下考。后面给 T1T4T5T6T7 试图加了些优化,除了 T6 优化了一半左右的代价,其他的都基本没任何效果。
给 T7 调参,但是调参的结果要等 5min 左右才能知道(因为要重新生成字典),非常阴间,没调出多大效果。
结束了,7h 比赛实在是有点累的。下午的什么画心心活动我也懒得参加了,回房间休息去。

Day 1 后续

比赛结束了,但是封了的榜一直没开,让人急急急急急急急急急。因为我封榜之后基本一事无成,感觉可能要凉。
晚上 6 点左右终于有榜了,发现自己 rk5,有奖了,好耶。有买键盘的理由了
据说有工作人员看到尧酱和 xiaoyaowudi 名字一样,笑了很久。然后尧酱和 xiaoyaowudi 被拉去接受采访了(
有一个晚会,7 点半开始,据说是能吃到饭的,于是大家都来了。但是因为还有嘉宾讲话、领导讲话、嘉宾访谈、颁奖等等环节,最后 9 点开了饭。
有人锐评:这种互联网公司习惯了加班,所以搞这种事情都不觉得有什么不妥的地方。这个角度我没想到啊,不过我觉得他说得很有道理。
因为是第 18 届百度之星,搞了一个巨大蛋糕出来,然后让和第一届百度之星同年出生的选手上来切蛋糕,很趣味。
hhz 见到我之后感叹,他好像都不太认识今年集训队选手,但是去年集训队认识一半左右。我说我认识的可能只有 1/5 左右。

标签:编码,然后,2022,Error,Encode,游记,字典,之星,但是
From: https://www.cnblogs.com/black-swallow/p/16931111.html

相关文章

  • NOIP2022
    NOIP2022总结考前早上主要看了点随机化和部分分写法什么的感觉有点脱离了大纲,图论那块一直不是很好也没怎么复习有点紧张,尽管不是现场赛,但是还是有点怕分数太低QA......
  • 第二周作业(2022-11-28)
    运行脚本可以显示出本机的ip地址如果ip地址中有3这个数字,那么就打印出当前的系统时间如果ip地址中不含3这个数字,就批量建立用户magedu_00,magedu_01,...magedu_100并且所......
  • NOIP 2022 VP 白给记
    NOIP2022VP白给记Day-?浙江NOIP初中生不能参加。【数据删除】你【数据删除】【数据删除】了!!Day0机房里陷入了最后的狂欢。然而NOIP是他们的,我什么也没有。......
  • 2022.11.28 省选班
    2022.11.28省选班A.[HNOI2015]落忆枫音https://loj.ac/p/2115题目背景「恒逸,你相信灵魂的存在吗?」郭恒逸和姚枫茜漫步在枫音乡的街道上。望着漫天飞舞的红枫,枫茜突......
  • 【2022-11-28】Docker部署搭建Yapi
    一、环境准备1.准备一台虚拟机\或者购买服务器2.虚拟机硬件要求2.1内存2-4G2.2CPU2核2G2.3硬盘至少20G3.系统镜像 centos7.9二、安装docker#......
  • PINO2022 意识流
    开题。T1傻逼题,T3傻逼题,冲。1h。我草我不会T2啊,这波不是寄了吗,算了先拍了T1T3再说。1h30min。T4送了52pts啊,不过好像要支持二维区域矩形求和啊,那岂......
  • 2022-11-28
    1packageit.cn.source.reflect;23importjava.lang.reflect.Constructor;4importjava.lang.reflect.Field;5importjava.lang.reflect.Method;67/*......
  • 【2022-11-28】Docker部署搭建Gitlab
    一、环境准备1.准备一台虚拟机\或者购买服务器2.虚拟机硬件要求2.1内存不得少于4G,否则启动会报502错误,可自行百度解决,将虚拟机的swap分区调整为2G大小即可2......
  • NOIP 2022 爆零记
    Day-1晚上睡觉把夜灯也关了,睡好一点有助于明天复习。Day0其实也没啥心情再复习了,功夫在平时,打板子的用处其实也不大,反正我是从来没有考前打的板子用上过的。上午在摸......
  • 如梦似幻——记XCPC2022赛年
    随着2022.11.27下午17:00的钟声敲响,我2022年的XCPC之旅也落下了帷幕。icpc济南站,rk69,生涯首银。​ICPC官方的预公布榜单本来想着今晚好好睡一觉,但是看了队长的知乎长文后......