首页 > 其他分享 >文本相似度检测

文本相似度检测

时间:2024-03-12 20:58:11浏览次数:27  
标签:文件 20 10 检测 30 50 40 相似 文本

这个作业属于哪个课程 软件工程
这个作业要求在哪里 个人项目
这个作业的目标 写一个程序实现文本相似度检测功能,学习用github等工具管理代码,学习使用工具分析代码,测试程序
GitHub地址 https://github.com/Tamakocode/3122004794

一.需求

题目:论文查重

描述如下:

设计一个论文查重算法,给出一个原文文件和一个在这份原文上经过了增删改的抄袭版论文的文件,在答案文件中输出其重复率。

原文示例:今天是星期天,天气晴,今天晚上我要去看电影。
抄袭版示例:今天是周天,天气晴朗,我晚上要去看电影。
要求输入输出采用文件输入输出,规范如下:

从命令行参数给出:【论文原文的文件的绝对路径 】 【抄袭版论文的文件的绝对路径】 【输出的答案文件的绝对路径】

注意:答案文件中输出的答案为浮点型,精确到小数点后两位

二.计算模块接口的设计与实现过程

三.计算模块接口部分的性能

四.计算模块部分单元测试展示

单元测试覆盖率:

五.计算模块部分异常处理说明

输入参数不足时,结束程序,并提示正确的参数命令

if (args.length < 3) {
            System.out.println("无效参数输入,正确命令为:java -jar 【PlagiarismChecker.jar的绝对路径】 original.txt plagiarized.txt output.txt");
            return;
}

六. PSP表格

PSP Personal Software Process Stages 预估耗时(分钟) 实际耗时(分钟)
Planning · 计划 10 20
· Estimate · 估计这个任务需要多少时间 5 10
Development · 开发 180 200
· Analysis · 需求分析 (包括学习新技术) 30 50
· Design Spec · 生成设计文档 50 40
· Design Review · 设计复审 40 40
· Coding Standard · 代码规范 (为目前的开发制定合适的规范) 30 10
· Design · 具体设计 20 20
· Coding · 具体编码 50 60
· Code Review · 代码复审 20 20
· Test · 测试(自我测试,修改代码,提交修改) 20 30
Reporting · 报告 50 60
· Test Repor · 测试报告 20 40
· Size Measurement · 计算工作量 30 40
· Postmortem & Process Improvement Plan · 事后总结, 并提出过程改进计划 10 20
· 合计 565 700

标签:文件,20,10,检测,30,50,40,相似,文本
From: https://www.cnblogs.com/tamako563/p/18069235

相关文章

  • 艾科瑞特科技:计算机视觉-实时安全帽检测-通用版
    艾科瑞特科技:计算机视觉-实时安全帽检测-通用版关键词:目标检测、目标跟踪、图像识别、图像分类、视频分析、自然语言处理、自然语言分析、计算机视觉、人工智能、AIGC、AI、大模型、多模态大模型、API、Docker、镜像、API市场、云市场、国产软件、信创内容摘要:实时安全帽检......
  • 想做漫画的ai短视频伙伴有福了,这个ai免费网站只需要提示词,自动生成故事文本和漫画图,堪
    现在很多人都在做漫画类图文或者短视频,这点高粱seo之前也是提到的,同时也分享过一些免费生成ai漫画的网站,那么今天高粱seo再给大家分享一个非常不错的免费ai网站,只需要输入提示词,就可以一键生成漫画图。那么下面高粱seo就以实操案例给大家分享下吧。这次高粱seo以孙悟空大闹天......
  • 面试必考的 3 种类型检测方法,分享给你
    如果现在给你一个变量,你能快速检测出是哪种类型么?1.检测基本类型typeof 是一个用于检测数据类型的操作符,返回一个表示数据类型的字符串。可以用于检测数字、字符串、布尔等基本数据类型:typeof42;//"number"typeof"Hello";//"string"typeoftrue;......
  • Linux系统——AWK文本处理拓展
    目录一、分析Nginx访问日志二、文件差异对比1.实验环境2.找出b文件在a文件相同记录3.找出b文件在a文件不同记录三、合并两个文件1.生成实验环境2.将a文件合并到b文件3.将a文件相同IP的服务名合并四、将第一列合并到一行五、字符串拆分六、统计出现的次数七、获取......
  • 生成二维码及二维码添加文本及图片
      生成二维码及二维码添加文本及图片如果要输出流,也可以参考此处packagecom.myFirstSpring.test;importjava.awt.BasicStroke;importjava.awt.Color;importjava.awt.Font;importjava.awt.FontMetrics;importjava.awt.Graphics;importjava.awt.Graphics2D;impo......
  • m基于深度学习的32QAM调制解调系统相位检测和补偿算法matlab仿真
    1.算法仿真效果matlab2022a仿真结果如下:  2.算法涉及理论知识概要        随着通信技术的飞速发展,高阶调制格式如32QAM(32-QuadratureAmplitudeModulation,32进制正交幅度调制)在高速数据传输中得到了广泛应用。然而,由于信道失真、噪声干扰等因素,接收端往往面......
  • [springboot] SpringBoot启动成功后因actuator健康检测报:Redis health check failed/
    0序背景:项目中引入了spring-boot-starter-actuator健康检测模块<dependency><groupId>org.springframework.boot</groupId><artifactId>spring-boot-starter-actuator</artifactId></dependency>1问题描述确认微服务刚启动后,因K8S集群周期性定时(默认每隔1......
  • WPF RichTextBox 文本超过限定行数移除旧数据
    在使用serilog.sinks.richtextbox显示日志时,会需要移除旧的日志信息的需求,实现打码如下;根据换行符“\n”进行判断; privatevoidCheckAndRemoveText(){intnewLineCount=0;boolremoveText=false;foreach(Paragraphparagraphin_richTex......
  • DependencyCheck开源的软件组件漏洞检测工具
    DependencyCheck是一个开源的软件组件漏洞检测工具,用于帮助开发人员和安全团队发现项目中使用的第三方库中的已知漏洞。它扫描应用程序的依赖关系,包括第三方库、框架和其他组件,然后与漏洞数据库进行比较,以识别是否存在已公开披露的安全漏洞。1.主要特点包括:1.**自动化扫描:**De......
  • 批处理 检测 并修改系统屏保时间和密码最大过期时间_批处理设置屏保时间-CSDN博客
    批处理检测并修改系统屏保时间和密码最大过期时间_批处理设置屏保时间-CSDN博客 @echooffsecedit/export/cfgc:\security-check-log\temp.txtfind/i"MaximumPasswordAge"c:\security-check-log\temp.txt|find/i"=">c:\security-check-log\temp2.txtregquery......