作业GitHub链接:GitHub链接
作业要求
项目需求
题目:论文查重
描述如下:
设计一个论文查重算法,给出一个原文文件和一个在这份原文上经过了增删改的抄袭版论文的文件,在答案文件中输出其重复率。
原文示例:今天是星期天,天气晴,今天晚上我要去看电影。
抄袭版示例:今天是周天,天气晴朗,我晚上要去看电影。
要求输入输出采用文件输入输出,规范如下:
从命令行参数给出:论文原文的文件的绝对路径。
从命令行参数给出:抄袭版论文的文件的绝对路径。
从命令行参数给出:输出的答案文件的绝对路径。
我们提供一份样例,课堂上下发,上传到班级群,使用方法是:orig.txt是原文,其他orig_add.txt等均为抄袭版论文。
注意:答案文件中输出的答案为浮点型,精确到小数点后两位
代码实现
- 敬请期待
测试
- 敬请期待
PSP表格
Planning | |||
Estimate | |||
Development | |||
Analysis | |||
Design Spec | |||
Design Review | |||
Coding Standard | |||
Design | |||
Coding | |||
Code Review | |||
Test | |||
Reporting | |||
Test Report | |||
Size Measurement | |||
Postmortem & Process Improvement Plan | |||