2.开发环境:IntelliJ IDEA Community Edition 2024.1
-
PSP表格
-
计算机模块设计与实验
类:
Main:这是唯一的类,包含了程序的入口点main方法以及用于文件处理、相似度计算和结果输出的辅助方法。
函数:
main(String[] args):程序的入口点,负责处理命令行参数,调用其他函数执行文件读取、相似度计算和结果写入。
readFile(String filePath):读取指定文件路径的文件内容,去除所有空白字符(将多个连续空白替换为一个空格),并转换为小写,然后返回文件内容的字符串表示。
calculateSimilarity(String original, String plagiarized):计算两个文本字符串的相似度。它通过比较两个文本中的单词集合来工作,返回两个集合交集大小与并集大小的比例。
writeToFile(String filePath, String content):将给定的内容写入到指定的文件路径中。
函数之间的关系:
main 方法是程序的中心,它首先验证命令行参数的正确性,然后调用 readFile 两次来获取源文件和抄袭文件的文本内容。
使用 readFile 方法获取到的文本内容,main 方法调用 calculateSimilarity 方法来计算这两个文本的相似度。
计算出的相似度结果通过 writeToFile 方法写入到指定的输出文件中。 -
性能分析
采用JProfiler分析,结果如图所示: