从2024年3月7日晚上开始,水利部水文局升级了全国大江大河及大型水库日报数据查看网站,对返回的数据使用动态字体文件名的方式对部分重要指标进行了字体加密,无法拷贝和直接使用数据,必须手工输入或者通过第三方图片转文字或图片转表格技术进行收集,但正确率得不到保证。
通过分析数据规律,得到如下解密思路:
1、首先定期获取加密的原始数据并同步下载与该份数据一致的字体备用。
2、用一份加密数据,得到所有加密后的字符数组,将加密的字符使用对应的字体生成一个个的图片。
3、将生成的图片,手工将文件名改成与图片显示一致的解密后的字符,这一步很关键也比较费时间,建立索引图片。
4、依次读取已缓存的加密数据和对应的字体,得到所有加密的字符数组,然后逐个将字符与对应的字体生成图片,与索引图片对比,相似度大于0.9时即可判断该字符对应的解密汉字,建立对照关系,完成后对原始文本进行替换即可。
5、对个别加密字符生成的图片上文字空白问题,找到规律进行替换即可。
通过上述过程,解密后的内容正确率100%。可以将数据补上了,但2024/3/8~2024/3/19之间的数据由于未收集到对应的字体,就没法进行解密了,很遗憾。
以下是解密过程及结果。
标签:字符,加密,解密,字体,数据,图片 From: https://www.cnblogs.com/helper/p/18219560