• 2024-09-29MySQL窗口函数汇总(二)
    MySQL窗口函数详解MySQL从8.0版本开始引入了窗口函数,这是一个强大的特性,可以大大简化复杂的数据分析任务。本文将详细介绍MySQL窗口函数的概念、语法和常见用法,并结合实际应用场景进行说明。什么是窗口函数?窗口函数是一种能够对结果集中的一组行进行操作的函数。它们类似于聚合函
  • 2024-09-27MySQL窗口函数汇总
    1.窗口函数概述窗口函数是一种SQL函数,非常适合于数据分析,其最大的特点就是:输入值是从SELECT语句的结果集中的一行或者多行的"窗口"中获取的,也可以理解为窗口有大有小(行数有多有少)。通过OVER子句,窗口函数与其他的SQL函数有所区别,如果函数具有OVER子句,则它是窗口函数。如果它缺少了O
  • 2024-09-25LoRA: Low-Rank Adaptation of Large Language Models 笔记
    问题背景⼤模型通常包含数亿甚⾄数百亿个参数,对其进⾏微调需要⼤量的计算资源和存储空间。在微调过程中,直接修改预训练模型的所有参数可能会破坏模型的原始性能。存储和部署微调后的⼤模型需要⼤量存储空间,尤其是当需要在多个应⽤场景中部署不同微调版本时。许多微调⽅法会增
  • 2024-09-22MATH 524  Nonparametric Statistics
    MATH 524, Fall 2018Nonparametric StatisticsFirst assignment, due Tuesday, September 24, 2024, noon1. Let X be a random variable with cumulative distribution function F. It was shown in class that if F is continuous,then F(
  • 2024-09-16用Python做一个小游戏
    首先,我们需要定义一个类,然后创建一副牌,最后实现一些基本的功能定义扑克牌类:classCard:def__init__(self,suit,rank):self.suit=suitself.rank=rankdef__repr__(self):returnf"{self.rank}of{self.suit}"创建一副扑克牌:suits=[
  • 2024-09-13PAT 排名
    编程能力测试(PAT)由浙江大学计算机科学与技术学院组织。每次测试都会在多个地区同时进行,测试完成后,将会对成绩进行统计与合并,生成总排名。你的任务就是编写一个程序,将各地区人员的成绩合并汇总,生成最终排名。输入格式第一行包含整数 NN,表示测试将会在 NN 个地区同时进行
  • 2024-09-13GROUPBY 和开窗函数执行顺序的问题
    SELECTseller_idFROM(SELECTseller_id,RANK()OVER(ORDERBYSUM(price)DESC)ASrFROMSalesGROUPBYseller_id)sWHEREs.r=1;作者:SunnyCCCh链接:https://leetcode.cn/problems/sales-analysis-i/solutions/868818/partition-by-he-group-by-de-shi-yong-qu-n
  • 2024-09-09[NLP] TextRank 算法
    1概述:TextRank算法1.1TextRank算法:源于PageRank算法感兴趣PageRank的朋友,请转阅:[机器学习/Python]PageRank原理与实现-博客园/千千寰宇TextRank算法基于PageRank,用于为文本生成关键字、摘要、计算语句(短语或者词汇)的重要性排名,而PageRank最初是因Google搜索
  • 2024-09-07P4094 字符串
    P4094字符串简化题意给定字符串\(s\),每次询问给定两个字符串\([a,b]\)和\([c,d]\),求前串的所有子串和后串的最长公共前缀。\(n\le10^5,m\le10^5\)题解感觉其实这道题并不是特别难的,就是代码长,不折不扣的码农题。刚开始有一个错误的想法,就是主席树
  • 2024-09-05chatgpt生成的所有分析函数,感觉很好.
      好的,我会列出Hive的主要分析函数,然后创建一个表并插入10条数据来演示这些函数的效果。Hive的主要分析函数:ROW_NUMBER()RANK()DENSE_RANK()CUME_DIST()PERCENT_RANK()NTILE()LAG()LEAD()FIRST_VALUE()LAST_VALUE()现在,让我们创建一个表并插入数据: --创建
  • 2024-08-25Pytorch DDP分布式训练介绍
    近期一直在用torch的分布式训练,本文调研了目前Pytorch的分布式并行训练常使用DDP模式(DistributedDataParallell ),从基本概念,初始化启动,以及第三方的分布式训练框架展开介绍。最后以一个Bert情感分类给出完整的代码例子:torch-ddp-examples。基本概念DistributedDataParallel(DD
  • 2024-08-25HZ集训日记
    HZ集训日记室友:初始三人组ccx,gzx,QED第一位新室友ChangeBox第二位新室友Merlin\(Part\)\(1\):正经日记7.17:来之前就听说了,7.17号来的都比我大几届,其实我也是挺慌的,怕第一次住校,室友不待见之类的(可能是神奇视频看多了)。刚进校园就跟一大哥走去机房,顺便放了行李,到机房见教练
  • 2024-08-13js逆向md5加密算法获取大学排行榜,页码时间戳影响响sign
    importjsonimportrequestsfromhashlibimportmd5defget_md5(s):m=md5()m.update(s.encode())returnm.hexdigest()n="{app_id=98357f659cf8fb6001cff80f7c6b85f2&diploma_id=7&page=4&page_len=20&platform=desktop&ts=1
  • 2024-08-12【python学习】使用 jieba和 rank_bm25进行文本相似度计算
    介绍如何使用jieba分词库和rank_bm25库中的BM25Okapi算法来计算文本相似度。我们将通过一个简单的示例,展示如何实现这一过程。准备句子列表首先,我们准备一个包含多个句子的列表:sentences=["这是一个测试句子","温格高赢得了2023环法冠军","北京奥
  • 2024-08-07为什么并查集路径压缩不需要维护rank?
    在基于rank进行优化的并查集中,路径压缩确实不需要维护rank数组。这是因为路径压缩和rank优化有不同的目的和作用机制。让我们详细解释一下原因:Rank优化的目的:Rank优化的主要目的是在合并两个集合时,让较小的树成为较大的树的子树,以保持树的平衡性。这样可以避免树变得过于深,从而
  • 2024-08-05问一问神奇的ChatGPT
    Q:我们随机问\(k\)个数,取这些数的最大值\(m\),\(m\)应该不会距离\(\frac{k(k+1)}{n}\)太远的结论为什么成立?A:这个结论来自于统计学中的极值理论。具体来说,当我们从一个已知范围内随机选择一些数,并取这些数中的最大值时,这个最大值有一定的统计规律。假设我们从一个包含(\(
  • 2024-07-30后缀数组 - half
    后缀数组后缀数组可以解决有关后缀的问题废话。那么暴力做法肯定是把每个后缀全部取出来,然后按照字典序排序,但是这样复杂度是\(\Theta(n^2\logn)\)的。后缀数组可以解决以下问题:最长重复子串多个串的最长公共子串不同子串个数算法详解面对这些问题,我们需要\(3\)个数
  • 2024-07-22基础概念 | DDR的几个概念
    1:什么是RANK?答:CPU与内存之间的接口位宽是64bit,也就意味着CPU在一个时钟周期内会向内存发送或从内存读取64bit的数据。可是,单个内存颗粒的位宽仅有4bit、8bit或16bit,个别也有32bit的。因此,必须把多个颗粒并联起来,组成一个位宽为64bit的数据集合,才可以和CPU互连。生产商把64
  • 2024-07-21MySQL入门学习-SQL高级技巧.Window Function
        在MySQL中,窗口函数(WindowFunction)是一种强大的分析工具,它可以在查询结果的基础上进行更复杂的计算和分析。一、窗口函数的概念:    窗口函数可以对查询结果的每一行数据,根据指定的分区(Partition)和排序规则(Order)进行计算。它可以在同一查询中同时返回基础
  • 2024-07-21【论文阅读笔记】大模型微调——《LoRA: Low-Rank Adaptation of Large Language Models》
    论文地址:https://arxiv.org/abs/2106.09685代码地址:https://github.com/microsoft/LoRA目录IntroductionMotivationMethodExperimentsFurtherdiscusion感想IntroductionMotivationMethodExperimentsFurtherdiscusion个人认为本篇的精髓所在,能够引用5k+的原因之一感
  • 2024-07-16P5537 题解
    blog。今天在XDFZ听ljy讲的串串(?)题,瞎写写就混了个最优解,来发个题解(注意到树的形态不变,所以可以记录兄弟间的编号rank。每个点就可以表示为若干rank构成的路径,例如下图:然后将每个点的这个路径压成hash,记为\(H_i\),并丢进map里。假设从\(x\)开始,可以完全遍历完\(a_
  • 2024-07-10OI loves Algorithm——后缀数组
    最近NFLS周赛,F题需要后缀数组,我不会,光荣掉到20+名。打完后就去补习了相关知识,觉得很巧妙,就来写了一篇专栏1.后缀数组的定义后缀数组(SA)保存的是一个字符串所有后缀的排序结果,其中第SA[i]表示所有后缀中第$i$小的后缀的开头位置。与之相对的是名次数组Rank,Rank[i]
  • 2024-07-06[LeetCode] 1366. Rank Teams by Votes 通过投票对团队排名
    Inaspecialrankingsystem,eachvotergivesarankfromhighesttolowesttoallteamsparticipatinginthecompetition.Theorderingofteamsisdecidedbywhoreceivedthemostposition-onevotes.Iftwoormoreteamstieinthefirstposition,wecon
  • 2024-06-24如何利用窗口函数实现精确排名计算?
    前言SQL语句中,聚合函数在统计业务数据结果时起到了重要作用,比如计算每个业务地区的业务总数、每个班级的学生平均分以及每个分类的最大值等。然而,今天小编将为大家介绍窗口函数,与聚合函数相比,它们也是一组函数,但在使用方法和适用场景上有所不同。在本章节中,我将重点介绍窗口函数
  • 2024-06-22使用MPI 实现奇偶排序
    使用MPI实现奇偶排序0号进程获得待排序序列并输出排序好的序列使用文件进行输入输出进行性能测试与对比代码奇偶排序头文件引入#include<iostream>#include<algorithm>#include<mpi.h>#include<fstream>#include<chrono>定义规模#defineN100000000