首页 > 其他分享 >论文查重

论文查重

时间:2023-03-13 22:48:00浏览次数:31  
标签:查重 论文 30 作业 余弦 相似 夹角 向量

目录

  • 作业要求
  • PSP表格
  • 程序设计及结构
  • 算法分析
  • 测试数据

一、作业要求

这个作业属于哪个课程 软件工程
这个作业要求在哪里 https://edu.cnblogs.com/campus/gdgy/2023softwareengine/homework/12914
这个作业的目的 使用PSP表格估计程序开发所需时间,使用gitcode管理代码,学会自动测试程序并返回测试结果
GitCode链接 https://gitcode.net/weixin_51793713/3120001941-second

二、PSP表格

PSP2.1 personal Software Process Stages 预估耗时(分钟) 实际耗时(分钟)
Planning 计划 20 30
Estimate 估计这个任务需要多少时间 90 80
Development 开发 900 1020
Analysis 需求分析 80 120
Design Spec 生成设计文档 60 50
Coding Standard 代码规范 30 40
Design 具体设计 130 120
Coding 具体编码 400 520
Code Review 代码复审 30 50
Test 测试 50 80
Reporting 报告 150 130
Size Measurement 计算工作量 30 25
Postmortem & Process Improvement Plan 事后总结并提出过程改进计划 60 60
All 总计 2030 2325

三、程序设计及结构

四、算法分析
余弦距离,也称为余弦相似度,是用向量空间中两个向量夹角的余弦值作为衡量两个个体间差异的大小的度量。

余弦值越接近1,就表明夹角越接近0度,也就是两个向量越相似,这就叫"余弦相似性"。

上图两个向量a,b的夹角很小可以说a向量和b向量有很高的的相似性,极端情况下,a和b向量完全重合。如下图:

上图中:可以认为a和b向量是相等的,也即a,b向量代表的文本是完全相似的,或者说是相等的。如果a和b向量夹角较大,或者反方向。如下图:

上图中: 两个向量a,b的夹角很大可以说a向量和b向量有很低的的相似性,或者说a和b向量代表的文本基本不相似。那么是否可以用两个向量的夹角大小的函数值来计算个体的相似度呢?

向量空间余弦相似度理论就是基于上述来计算个体相似度的一种方法。下面做详细的推理过程分析。

想到余弦公式,最基本计算方法就是初中的最简单的计算公式,计算夹角的余弦定值公式为:

但是这个是只适用于直角三角形的,而在非直角三角形中,余弦定理的公式是:


在向量表示的三角形中,假设a向量是(x1, y1),b向量是(x2, y2),那么可以将余弦定理改写成下面的形式:

向量a和向量b的夹角 的余弦计算如下:

扩展,如果向量a和b不是二维而是n维,上述余弦的计算法仍然正确。假定a和b是两个n维向量,a是 ,b是 ,则a与b的夹角 的余弦等于:

五、测试数据
对比结果:




单元测试:

标签:查重,论文,30,作业,余弦,相似,夹角,向量
From: https://www.cnblogs.com/homework1219/p/17213209.html

相关文章

  • 论文解读(ToAlign)《ToAlign: Task-oriented Alignment for Unsupervised Domain Adapta
    论文信息论文标题:ToAlign:Task-orientedAlignmentforUnsupervisedDomainAdaptation论文作者:GuoqiangWei,CuilingLan,WenjunZeng,ZhizhengZhang,ZhiboChen......
  • 软件体系架构安全性战术论文
    软件体系架构安全性战术刘柏(石家庄铁道大学 河北省石家庄市 050000;)摘 要:随着软件体系结构在软件工程中的研究与应用越来越广泛,以及学术界和产业界对软件安全性认识的......
  • python: 复制英文论文时,删除掉多余的回车
     自己平时读论文时,遇到看不懂的英文长难句时会用到翻译网站,这个时候复制pdf格式的论文时总是会出现一大堆换行符,影响翻译软件的翻译结果,所以写了个python程序自动读取剪......
  • 论文笔记(一):基于特征动态对齐和细化的VI图像融合--平移鲁棒融合
    文章标题Featuredynamicalignmentandrefinementforinfrared–visibleimagefusion:TranslationrobustfusionHuafengLi,云南昆明科技大学;JunzhiZhao,云南......
  • Vineyard 论文被 SIGMOD'2023 接收,助力计算引擎之间高效数据交换
    Vineyard(CNCFsandbox项目)是脱胎于GraphScope底层存储、用于在复杂工作流中不同计算引擎之间进行高效数据交换的中间件,该工作的论文被数据库领域顶级学术会议SIGMOD......
  • 论文学习路线
    要记得扫一眼参考文献,看看从哪里来的灵感,文章的前身是哪篇两周时间内通过泛读找出自己喜欢的领域内的100篇优秀论文,非常粗略地读和找(最多看到introduction),只看顶会/牛团队/......
  • 快手POSO论文阅读
    背景我们知道,对于冷启动的用户,由于用户行为数据比较少,预估难度较大。常用的解决方案如采用泛化特征代替id类特征、用泛化特征训练一个辅助tower帮助主tower学校、元学习等......
  • [论文速览] LayoutLMv3@ Pre-training for Document AI with Unified Text and Image
    Pretitle:LayoutLMv3:Pre-trainingforDocumentAIwithUnifiedTextandImageMaskingaccepted:ACMMM2022paper:https://arxiv.org/abs/2204.08387code:htt......
  • 学术论文插图要求简介
    1.类型位图和矢量图是两种不同的图像类型,它们在存储和处理图像时使用不同的方法。以下是它们之间的详细区别:图像构成方式:位图使用像素(或图像的最小单元)来构建图像,每......
  • Faster RCNN 论文阅读
    1.网络架构VGG16网络anchors:人工放上去的RPN对anchors进行二分类,正样本,负样本RoIP:前面的框框已经圈出目标,但还不知道具体属于哪个类,它就是干这个工作的2.VGG网络V......