• 2024-10-26SciTech-BigDataAIML-KLD(KL散度):测度比较"两Distribution(概率分布)"的Similarity(接近度)
    KLD(Kullback-LeiblerDivergence,KL散度):测度比较两Distribution的SimilarityAI领域最重要的MeasureMethodofDistributions(分布度量方法)简写和全称:KLD(Kullback-LeiblerDivergence,KL散度)用途:测度比较两Distribution的Similarity(统计应用上,我们经常需要:
  • 2024-10-13Contrastive Learning Is Spectral Clustering On Similarity Graph
    目录概主要内容原文代码TanZ.,ZhangY.,YangJ.andYuanY.Contrastivelearningisspectralclusteringonsimilaritygraph.ICLR,2024.概本文将对比学习与谱聚类联系在一起.主要内容我们知道,一般的对比学习形如:\[\min_{\theta}\quad\mathbb{E}_{x,x^+,
  • 2024-09-14个人项目
    这个作业属于哪个课程https://edu.cnblogs.com/campus/gdgy/CSGrade22-12这个作业要求在哪里https://edu.cnblogs.com/campus/gdgy/CSGrade22-12/homework/13220这个作业的目标完整地做一次项目、掌握测试工具、掌握处理异常方法1.Github仓库中新建学号为名的文
  • 2024-09-13个人项目:论文查重
    这个作业属于哪个课程https://edu.cnblogs.com/campus/gdgy/CSGrade22-34这个作业要求在哪里https://edu.cnblogs.com/campus/gdgy/CSGrade22-34/homework/13228这个作业的目标设计一个论文查重程序,了解软件开发流程gitHub项目地址https://github.com/Abaistudy
  • 2024-09-13论文查重
    论文查重这个作业属于哪个课程软件工程这个作业要求在哪里个人项目这个作业的目标初步认识软件开发流程,独立培养开发能力,熟悉PSP记录开发过程PSPPSP2.1PersonalSoftwareProcessStages预计耗时(分钟)实际耗时(分钟)Planning计划30140·Estima
  • 2024-09-09推荐系统的基础_协同过滤(CF)
    协同过滤(CollaborativeFiltering)是一种推荐系统算法,它通过分析用户之间的相似性或者物品之间的相似性来预测用户可能感兴趣的物品。协同过滤算法主要有两种类型:1.用户基协同过滤(User-basedCollaborativeFiltering):  这种方法通过找到与目标用户兴趣相似的其他用户,然后
  • 2024-09-06《Represent, Compare, and Learn: A Similarity-Aware Framework for Class-Agnostic Counting》
    摘要论文提出了一个用于类别无关计数(Class-AgnosticCounting,CAC)的相似性感知框架。类别无关计数的目标是在给定少量示例的情况下,对查询图像中的所有实例进行计数。该框架通过联合学习表示和相似性度量来改进计数性能。作者首先提出了一个基础的双线性匹配网络(BilinearMatc
  • 2024-09-04使用bert_base_chinese实现文本语义相似度计算
    本文选择将模型下载到本地,进行离线分析计算,也可以使用在线下载,但本文略过1下载bert_base_chinese下载地址:https://huggingface.co/google-bert/bert-base-chinese/tree/main下载图上红框内的四个文件,并按照下图的目录结构放置bert-base-chinese文件夹里放2代码
  • 2024-09-03深入解析DashScope Embeddings:打造智能文本分析利器
    深入解析DashScopeEmbeddings:打造智能文本分析利器1.引言在自然语言处理(NLP)和机器学习领域,文本嵌入(TextEmbeddings)是一项核心技术,它能将文本转换为密集的向量表示,为下游任务如文本分类、相似度计算和信息检索等提供基础。本文将深入探讨DashScopeEmbeddings,这是一个强
  • 2024-09-01240826 计算电影推荐
    通过前面几天的knn相关知识,来计算电影推荐importjsonimportnumpyasnpfromeuclidean_scoreimporteuclidean_scorefrompearson_scoreimportpearson_scorefromfind_similar_usersimportfind_similar_users#为给定用户生成电影推荐defgenerate_recommendat
  • 2024-08-21考题相似度 AI 分析 API 数据接口
    考题相似度AI分析API数据接口基于AI的相似度评估,专有AI模型,包含评估详情。1.产品功能基于自有专业模型进行AI智能分析;提供详细的相似度评分和结果描述;高效的模型分析性能;全接口支持HTTPS(TLSv1.0/v1.1/v1.2/v1.3);全面兼容AppleATS;全国多节点CDN部
  • 2024-07-19SciTech-Mathematics-Probability+Statistics-Dot products, cosine similarity, text vectors
    Dotproducts,cosinesimilarity,textvectorshttps://dev.to/sayemmh/dot-products-cosine-similarity-text-vectors-2lo4SayemHoque,PostedonOct20,2022Dotproducts,cosinesimilarity,textvectorsCosinesimilarityisameasurebetweentwosingledimen
  • 2024-07-19异步2
    Optimizingcodeexecutionspeedcaninvolvevariousstrategies,suchasimprovingI/Ooperations,optimizingtheimageprocessinglogic,andleveragingparallelprocessingmoreeffectively.Belowaresomepossibleoptimizationsforthecodeyouprovided:
  • 2024-07-10数据库处理
    defstore_results_to_db(results,db_dir):#遍历每个子目录的结果forcommon_dir,datainresults.items():#跳过非字典类型的条目,如unmatched_files_A和unmatched_files_Bifnotisinstance(data,dict)orcommon_dirin('unmatched_files_A'
  • 2024-07-07python 版本对比图片
    importcv2importnumpyasnpimportosdefcalculate_black_pixels_in_sectors(image,sector):#将图像转换为二值图像_,image=cv2.threshold(image,127,255,cv2.THRESH_BINARY_INV)#获取图像尺寸height,width=image.shape#计
  • 2024-07-01colab上比较clip
    !pipinstalltorchtorchvisionftfyregex!pipinstallgit+https://github.com/openai/CLIP.gitimporttorchimportclipfromPILimportImagefromioimportBytesIOimportrequests#加载模型device="cuda"iftorch.cuda.is_available()else"
  • 2024-07-01​RAG与LLM原理及实践(7)--- Chroma query应用层策略及实现原理
    背景Chromaquery底层查询的 query思想是相同的,甚至在vectordb的世界中,都大同小异。如果你有看前面写的  RAG与LLM原理及实践(5)---Chromaquery源码分析应该比较清楚query的运作原理,说直白就是在memory或是disk中通过暴力查询比较与HNSW算法(NSW算法的变种,分层可导航
  • 2024-06-06用Python写一个用户标签分析体系
     用户标签分析体系是一个用于对用户进行分类和标注的工具,可以根据用户的行为、兴趣、喜好等特征进行分析。以下是一个简单的Python示例,使用Pandas库和NLTK库实现用户标签分析体系。 首先,确保已经安装了Pandas和NLTK库。如果没有安装,可以使用以下命令进行安装:```bashpipi
  • 2024-04-07实现基于内容的电影推荐系统—代码实现
    引言昨日在读论文的过程中讲到,要实现一种基于内容的推荐算法,那么今天他来了。今天的算法实现基于Python的pandas数据处理第三方包和机器学习第三方包sklearn,关于sklearn的详细信息可以点击这里查看,关于pandas的详细信息可以点击这里查看代码实现importpandasaspd#导入数
  • 2024-03-26jieba分词+sk-learn计算样本问题最相似的问题
    场景:输入一段内容,找到问题集中跟该内容最相似的问题importjiebafromsklearn.feature_extraction.textimportTfidfVectorizerfromsklearn.metrics.pairwiseimportcosine_similaritytemplates=["出来钓鱼了喂","王大腚爱钓鱼","格小格爱爱钓鱼",
  • 2024-03-183121002754 刘栋
    个人项目仓库地址*PSP2.1**PersonalSoftwareProcessStages**预估耗时(分钟)**实际耗时(分钟)*Planning计划3030Estimate估计这个任务需要多少时间510510Development开发6060Analysis需求分析(包括学习新技术)3030DesignSpec生成设计文档3
  • 2024-03-13个人项目
    这个作业属于哪个课程https://edu.cnblogs.com/campus/gdgy/SoftwareEngineering2024这个作业要求在哪里https://edu.cnblogs.com/campus/gdgy/SoftwareEngineering2024/homework/13136这个作业的目标完成论文查重的个人项目,包括使用PSP评估,设计模块,编写代码并进行
  • 2024-03-13作页二:个人项目
    这个作业属于哪个课程软件工程2024-广东工业大学这个作业要求在哪里软件工程2024-班级博客这个作业的目标开发个人项目,实现论文查重githubgitcode仓库地址:https://gitcode.com/wdwwdw/3122004405/tree/main计算模块接口的设计与实现过程使用hcaks对中
  • 2024-03-10PSP设计文档
    PSP为熟悉软件开发流程,个人项目使用文档记录设计文档的书写计划初步计划使用熟悉的语言进行编程,开始使用C语言进行构思,调试无果,改用面向对象语言Python进行开发开发需求分析功能需求:用户需求为比较两个文档的相似度,提供接口接受两个待处理文件,传回一个结果目标文件
  • 2024-01-18实现基于内容的电影推荐系统—代码实现
    引言昨日在读论文的过程中讲到,要实现一种基于内容的推荐算法,那么今天他来了。今天的算法实现基于Python的pandas数据处理第三方包和机器学习第三方包sklearn,关于sklearn的详细信息可以点击这里查看,关于pandas的详细信息可以点击这里查看代码实现importpandasaspd#导入数