首页 > 其他分享 >论文查重

论文查重

时间:2023-10-11 13:12:45浏览次数:37  
标签:查重 10 论文 public 123 Test simHash SimHash

作业要求 https://edu.cnblogs.com/campus/gdgy/CSGrade21-12/homework/13014
作业所属课程 https://edu.cnblogs.com/campus/gdgy/CSGrade21-12?page=11 ----
作业目标 了解论文查重机理; Git与GitHub的链接使用;深刻体会个人开发流程 ----

一、Github地址
https://github.com/3120005145aisan/aisan3120005145
二、PSP表格记录估计及实际在程序的各个模块的开发上耗费的时间

PSP2.1 Personal Software Process Stages 预估耗时(分钟) 实际耗时(分钟)
Planning 计划 60 120
Estimate 估计这个任务需要多少时间 10 5
Development 开发 360 480
Analysis 需求分析 (包括学习新技术) 90 150
Design Spec 生成设计文档 90 120
Design Review 设计复审 10 20
Coding Standard 代码规范 (为目前的开发制定合适的规范) 20 50
Design 具体设计 60 90
Coding 具体编码 300 360
Code Review 代码复审 10 30
Test 测试(自我测试,修改代码,提交修改) 30 90
Reporting 报告 90 150
Test Report 测试报告 10 20
Size Measurement 计算工作量 10 10
Postmortem & Process Improvement Plan 事后总结, 并提出过程改进计划 10 30
Total 合计 1160 1725

三、计算模块接口的设计与实现过程
1.工程结构

2.算法原理
首先基于传统的IR方法,将文章转换为一组加权的特征值构成的向量。

·初始化一个f维的向量V,其中每一个元素初始值为0。

·对于文章的特征向量集中的每一个特征,做如下计算:

利用传统的hash算法映射到一个f-bit的签名。对于这个f- bit的签名,如果签名的第i位上为1,则对向量V中第i维加上这个特征的权值,否则对向量的第i维减去该特征的权值。

·对整个特征向量集合迭代上述运算后,根据V中每一维向量的符号来确定生成的f-bit指纹的值,如果V的第i维为正数,则生成f-bit指纹的第i维为1,否则为0。

3.程序流程图

*4.程序结果
*
四、计算模块接口部分的性能
性能分析

内存消耗

五、计算模块部分单元测试展示

点击查看代码

public class FileToStringTest {

    @Test
    public void toStringTest(){
        FileToString fileToString = new FileToString();
        fileToString.toString("");
  }
}



import org.junit.Test;
public class SimHashTest {
    SimHash simHash;
    @Test
    public void simHashTest(){
            SimHash simHash = new SimHash("123");
            simHash.simHash();
    }
    @Test
    public void hashTest(){
        SimHash simHash = new SimHash("123");
        simHash.hash("123");
    }

    @Test
    public void subByDistanceTest(){
        SimHash simHash=new SimHash("123");
        simHash.subByDistance(simHash,3);
    }


    @Test
    public void getDistanceTest(){
        SimHash simHash=new SimHash("123");
        simHash.getDistance("123","234");
    }

    @Test
    public void hammingDistanceTest(){
        SimHash simHash=new SimHash("123");
        simHash.hammingDistance(simHash);
    }




}

标签:查重,10,论文,public,123,Test,simHash,SimHash
From: https://www.cnblogs.com/aisan3120005145/p/17755110.html

相关文章

  • A Lightweight Method for Modeling Confidence in Recommendations with Learned Bet
    ALightweightMethodforModelingConfidenceinRecommendationswithLearnedBetaDistributions论文阅读笔记摘要​ 大多数推荐系统并不提供对其决策信心的指示。因此,他们不区分确定的建议和不确定的建议。现有的RecSys置信方法要么是不准确的启发式,要么是在概念上复杂,因......
  • GPT-4竟成Nature审稿人?斯坦福清华校友近5000篇论文实测,超50%结果和人类评审一致
    前言 斯坦福学者发现,GPT-4对于Nature、ICLR的论文给出的审稿意见,竟然和人类审稿人有超过50%的相似性。看来让大模型来帮我们审论文,并不是天方夜谭啊。本文转载自新智元仅用于学术分享,若侵权请联系删除欢迎关注公众号CV技术指南,专注于计算机视觉的技术总结、最新技术跟踪、经典......
  • Implicit Autoencoder for Point-Cloud Self-Supervised Representation Learning论文
    ImplicitAutoencoderforPoint-CloudSelf-SupervisedRepresentationLearning2023ICCV*SimingYan,ZhenpeiYang,HaoxiangLi,ChenSong,LiGuan,HaoKang,GangHua,QixingHuang*;ProceedingsoftheIEEE/CVFInternationalConferenceonComputerVision......
  • 论文阅读(一)—— Adding Conditional Control to Text-to-Image Diffusion Models
    ......
  • Personalized Transformer for Explainable Recommendation论文阅读笔记
    PersonalizedTransformerforExplainableRecommendation论文阅读笔记摘要​ 自然语言生成的个性化在大量任务中都起着至关重要的作用。比如可解释的推荐,评审总结和对话系统等。在这些任务中,用户和项目ID是个性化的重要标识符。虽然Transfomer拥有强大的语言建模能力,但是没有......
  • 如何读论文?
    如何读论文?以下参考李沐大佬的教学。论文结构典型的论文结构是这样的:题目摘要介绍算法实验验证结论三遍阅读法第一遍Pass1阅读重点:摘要和结论阅读步骤:先读题目和摘要,了解这篇论文在做什么,解决了什么问题。再读结论,结论通常和摘要差不多,可能有对摘要中问......
  • AlexNet论文精读
    AlexNet......
  • Rethinking Point Cloud Registration as Masking and Reconstruction论文阅读
    RethinkingPointCloudRegistrationasMaskingandReconstruction2023ICCV*GuangyanChen,MeilingWang,LiYuan,YiYang,YufengYue*;ProceedingsoftheIEEE/CVFInternationalConferenceonComputerVision(ICCV),2023,pp.17717-17727paper:Rethin......
  • 论文阅读:A Lightweight Knowledge Graph Embedding Framework for Efficient Inferenc
    ABSTRACT现存的KGE方法无法适用于大规模的图(由于存储和推理效率的限制)作者提出了一种LightKG框架:自动的推断出码本codebooks和码字codewords,为每个实体生成合适的embedding。同时,框架中包含残差模块来实现码本的多样性,并且包含连续函数来近似的实现码字的选择。为更好的提升K......
  • 2023年软考-系统架构设计师论文预测
    2023年11月4日软考-系统架构设计师论文预测:微服务:一种云原生架构方法,在单个应用中包含众多松散耦合且可单独部署的小型组件或服务层次风格:数据访问层、业务逻辑层、表示层基于架构的软件开发:ABSD有三个基础,功能拆分、架构风格、使用软件模板。它强调由商业、质量和功能需求的组合驱......