首页 > 其他分享 >个人项目-论文查重

个人项目-论文查重

时间:2024-09-15 12:14:51浏览次数:9  
标签:查重 10 20 计算 个人 文件 论文 Design 测试

这个作业属于哪个课程 https://edu.cnblogs.com/campus/gdgy/CSGrade22-34
这个作业要求在哪里 https://edu.cnblogs.com/campus/gdgy/CSGrade22-34/homework/13229
这个作业的目标 设计算法比较原文与抄袭版论文,计算并输出文本重复率到指定文件,并完成PSP表格。

源码链接:github

1.PSP表格

PSP2.1 Personal Software Process Stages 预估耗时(分钟) 实际耗时(分钟)
Planning 计划 5 5
· Estimate · 估计这个任务需要多少时间 5 5
Development 开发 95 80
· Analysis · 需求分析 (包括学习新技术) 20 10
· Design Spec · 生成设计文档 10 10
· Design Review · 设计复审 10 5
· Coding Standard · 代码规范 (为目前的开发制定合适的规范) 10 5
· Design · 具体设计 10 10
· Coding · 具体编码 20 20
· Code Review · 代码复审 5 5
· Test · 测试(自我测试,修改代码,提交修改) 10 15
Reporting 报告 20 20
· Test Repor · 测试报告 10 10
· Size Measurement · 计算工作量 5 5
· Postmortem & Process Improvement Plan · 事后总结, 并提出过程改进计划 5 5
合计 120 105

2.类设计

类关系图

  • FileHandler负责处理文件,进行文件读取和结果写入
  • TextPreprocessor负责对文本进行预处理,去除标点符号
  • SimilarityCalculator负责计算相似度

相似度计算逻辑

核心思路就是采用编辑距离算法来计算相似度

3.测试覆盖度及性能分析


测试的思路为构造各个不同的文件内容,然后输出其相似度

异常测试

测试在文件不存在时程序是否能够正确处理

当输入参数不为三个时,直接返回

标签:查重,10,20,计算,个人,文件,论文,Design,测试
From: https://www.cnblogs.com/knight476/p/18415130

相关文章