一、想法

有了多种题库之后，常常会遇到大量题库无法转化到自己的 OJ 上。每次都要重新手写解析器，非常浪费时间，于是抽出了这个工具。

本工具可以将抽取好的信息自动组装成符合 HydroOJ 格式的题目并自动压缩，解决后半部分的转化工作。

二、实现

1. 准备包和相应环境

包：https://github.com/15921483570/hydrolizer

环境：在包内执行 pip install -r requirements.txt

2. 使用

只需导入本包后，按照范例，将所需信息以字典形式传入 Hydrolizer() 即可。

如需将 Hydrolizer.hpath 目录内的所有题目文件夹打包，可以直接调用 Hydrolizer.zipzip()。打包好的文件可以直接上传 HydroOJ 使用。

至于源文件的信息抽取，很遗憾，因源文件种类多样，无法统一写解析，只能根据实际情况，自行另写一个解析器以完成前半部分工作，本工具仅能实现后半部分工作。

3. 例子

import hydrolizer

fname = "testttt"
pid = 1
data_src = os.path.join('test', 'data')

d = {
    # 基本属性
    "fname": fname,  # 必填
    "data_src": data_src,  # 评测数据源文件夹路径，默认值为''，如无数据会报警告

    # 下载外部文件所需信息
    "headers": {},  # 默认值为 ''，如无数据可删除此行
    "cookies": {},  # 默认值为 {}，如无数据可删除此行
    "ignore": [],  # 屏蔽网址关键词列表, 格式为['屏蔽词1', '屏蔽词2', ...]，默认值为 []，如无数据可删除此行

    # problem.md, 文字部分会自动从 html 格式转为 Markdown
    "bg": "背景",  # 默认值为 ''，如无数据可删除此行
    "desc": "题目描述 ![](https://abc.com/123.png)",  # 默认值为 ''，如无数据会报警告，如存在外部图片链接会自动下载并整理
    "infmt": "输入格式",  # 默认值为 ''，如无数据可删除此行
    "outfmt": "输出格式",  # 默认值为 ''，如无数据可删除此行
    "trans": "题目大意",  # 默认值为 ''，如无数据可删除此行
    "samples": [['1', '2'], ['2', '3']],  # 必填，格式为：[第1组数据[输入，输出], 第2组数据[输入，输出], ...]
    # 如无样例数据会报 ValueError， 如某次输入输出均为空会报警告
    "hint": "提示",  # 默认值为 ''，如无数据可删除此行

    # problem.yaml
    "pid": f"P{pid}",  # 数字或字符串，默认值为'P1000'
    "owner": 2,  # 默认值为 2，如无特别要求可删除此行
    "title": "买笔",  # 必填，如无数据会报 ValueError
    "tags": ['选择'],  # 默认值为 None，格式为['标签1','标签2', ...]，如无特别要求可删除此行
    "difficulty": 1,  # 默认值为 0，如无特别要求可删除此行

    # ./testdata/config.yaml
    "tp": 'default',  # 题目类型，默认值为 'default'，如无特别要求可删除此行
    "tm": 1000,  # 限制时间，默认值为 1000，如无特别要求可删除此行
    "mem": 256,  # 限制内存，默认值为 256，如无特别要求可删除此行
    # 以上三项若全部为默认值，则不会生成 config.yaml 文件，评测时 oj 会自动处理
}

Hydrolizer.DEFAULT_MEMORY = 256  # 可根据题目实际情况调整默认限制内存，减少生成大量无效 config.yaml
Hydrolizer(**d)  #
Hydrolizer.zipzip()  # 打包 Hydrolizer.hpath 目录内的所有文件夹到 Hydrolizer.hpath/000.zip

三、提示

包内自带一个 test 用例，可以直接运行 __init__.py 文件查看使用效果。

标签：此行,17,删除,Python,HydroOJ,Hydrolizer,格式,默认值,数据
From： https://www.cnblogs.com/bowen404/p/18166793

Python 学习笔记
1、Python简介设计哲学：强调代码的可读性和简洁的语法（尤其是用空格缩进来定义代码块，而不是使用大括号或关键词）。应用领域：Web开发、数据科学、人工智能、科学计算、自动化脚本等。参考文档：Python简介2.基本语法解释器：Python代码可以通过Python解释器直接运行，也可以作为脚本......
【Python】Q-Learning处理CartPole-v1
上一篇配置成功gym环境后，就可以利用该环境做强化学习仿真了。这里首先用之前学习过的qlearning来处理CartPole-v1模型。CartPole-v1是一个倒立摆模型，目标是通过左右移动滑块保证倒立杆能够尽可能长时间倒立，最长步骤为500步。模型控制量是左0、右1两个。模型状态量为下面四个：......
深入理解Python多进程：从基础到实战
title:深入理解Python多进程：从基础到实战date:2024/4/2920:49:41updated:2024/4/2920:49:41categories:后端开发tags:并发编程多进程管理错误处理资源调度性能优化异步编程Python并发库引言在Python编程中，多进程是一种重要的并发编程方式，可以让我们充分......
Python 编程
第1章什么是Python?#Python——编程新手最好的选择第2章为Python做好准备#单行注释打印出单词"HelloWorld"print("HelloWorld")'''多行注释这是一条注释这也是一条注释'''print("HelloPython")第3章变量和操作符的世界3.......
Python: download file
defgetLink(url:str):""":paramurl::return:"""headers={'Accept-Language':'zh-CN,zh;q=0.9,en-CN;q=0.8,en;q=0.7,zh-TW;q=0.6','Cookie':'......
[Python急救站]基于Transformer Models模型完成GPT2的学生AIGC学习训练模型
为了AIGC的学习，我做了一个基于TransformerModels模型完成GPT2的学生AIGC学习训练模型，指在训练模型中学习编程AI。在编程之前需要准备一些文件：首先，先win+R打开运行框，输入：PowerShell后输入：pipinstall-Uhuggingface_hub下载完成后，指定我们的环境变量：$env:HF_ENDPOINT="ht......
马斯克突击访华；谷歌 Python 基础团队全数被裁；丨 RTE 开发者日报 Vol.195
开发者朋友们大家好：这里是「RTE开发者日报」，每天和大家一起看新闻、聊八卦。我们的社区编辑团队会整理分享RTE（RealTimeEngagement）领域内「有话题的新闻」、「有态度的观点」、「有意思的数据」、「有思考的文章」、「有看点的会议」，但内容仅代表编辑......
Window 安装 Python 失败 0x80070643，发生严重错误
问题现象用安装包在window安装python，会遇到没有安装成功，卸载后，再次双击安装包安装的时候，直接无法安装了。这个问题在githubissue中有提到，但是都是2022年的时，代码修复，但是在2024年，安装的时候还是遇到了这个问题。测试下来：python3.7,3.8没有这个问题，如果着急，就先安......
python使用langchain调用本地大模型
参考https://www.cnblogs.com/scarecrow-blog/p/17875127.html模型下载之前说过一次https://www.cnblogs.com/qcy-blog/p/18165717也可直接去官网，把所有文件都点一遍fromlangchainimportPromptTemplate,LLMChainimporttorchfromtransformersimportAutoTokenizer,A......
CobaltStrike 远控木马在42.194.250.177的80端口报警；奇安信网神态势感知报警（多次）
在态势感知上报毒——目的IP：42.194.250.177的80端口。报毒名称为CobaltStrike远控木马活动事件，这个情况发生在已经封禁掉源IP和目的IP的前提下，所以让人百思不得其解。然后我登上了我的kali访问了这个目的IP的80端口，嘿！您猜怎么着？!这不是明摆着，欢迎您的到来嘛！这我不就来了嘛，Dir......

HydroOJ 从入门到入土（17）批量转化其他格式题库（Python）