T5
  • 2024-07-037.1模拟考试心得
    T1,一看就看出来了这道题用不到任何算法,直接模拟即可,大概花费了5分钟来读题以及打代码,结果样例WA了,再次阅读题目发现少判断了P与N的情况,然后改了,总的来讲花了10分钟作业T2,通过他给定一个区间想到了前缀和的做法,这样的时间复杂度就大大降低,轻松ACT3,T4这两道题都比较容易没什么
  • 2024-06-02(九)为分类和多项选择任务调优T5
    1、T5微调本笔记展示如何使用Huggingface的Transformers对T5模型进行微调,以解决不同的自然语言处理任务,使用了T5论文中提出的文本-文本方法。为了演示,我选择了3个非文本-文本问题,只是为了重申论文中所述的这种文本-文本框架有多广泛适用,以及如何在完全不改变模型的情况下用于不同
  • 2024-04-29【C】---- T5:天数转换成周数
    题目编写一个程序,提示用户输入天数,然后将其转换成周数和天数。通过while循环让用户重复输入天数,当用户输入一个非正值时(如0或-20),循环结束。编程#include<stdio.h>intmain(void){intdays,week,day;printf("pleaseinputdays:");scanf("%d",&days);//
  • 2024-04-04【T5中的激活函数】GLU Variants Improve Transformer
    【mT5中的激活函数】GLUVariantsImproveTransformer论文信息阅读评价AbstractIntroductionGatedLinearUnits(GLU)andVariantsExperimentsonText-to-TextTransferTransformer(T5)Conclusion论文信息名称内容论文标题GLUVariantsImprov
  • 2024-03-05numpy基础运算
    numpy基础运算importnumpyasnpt1=np.array([1,2,3,4,5])#numpy数组类型为numpy.ndarrayprint("type(np.array)=",type(t1))t2=np.array(range(6))print("t1:",t1)print("t2:",t2)#np.arange([start,]stop[,stop,],dtype=
  • 2024-01-31闲话1.31
    haosen不在的第三天,想她
  • 2024-01-22针对特定领域较小的语言模型是否与较大的模型同样有效?
    经过2023年的发展,大语言模型展示出了非常大的潜力,训练越来越大的模型成为有效性评估的一个关键指标,论文《AComparativeAnalysisofFine-TunedLLMsandFew-ShotLearningofLLMsforFinancialSentimentAnalysis》中,作者全面分析了微调大语言模型(llm)及其在金融情绪分析中
  • 2024-01-08【LLM 】7个基本的NLP模型,为ML应用程序赋能
    在上一篇文章中,我们已经解释了什么是NLP及其在现实世界中的应用。在这篇文章中,我们将继续介绍NLP应用程序中使用的一些主要深度学习模型。BERT来自变压器的双向编码器表示(BERT)由JacobDevlin在2018年的论文《BERT:用于语言理解的深度双向变压器的预训练》中首次提出。BERT模型的主
  • 2023-12-08Python:元组的定义和操作
    1、元组的定义语法:定义元组使用小括号,且使用逗号隔开各个数据元组面量(元素1,元素2,元素3,...)定义元组变量变量名称=(元素1,元素2,元素3,...)定义空元组变量名称=()变量名称=tuple()2、元组的特点元组同列表一样,可以存储多个、不同的数据类的元素(混装)元组一旦定义完
  • 2023-08-17闲话8.17
    今天摆了。上午模拟赛,开题真就绷不住了
  • 2023-08-07Telsa T4配置下用peft微调t5模型
    记录运行这个代码的过程:https://huggingface.co/docs/peft/task_guides/seq2seq-prefix-tuning环境配置虚拟环境python-Vcondacreate-npeft-practicepython=3.10.12condaactivatepeft-practice安装pytorchcondainstallpytorchtorchvisiontorchaudiopytorch-cu
  • 2023-06-132023.6.13 05.数据库索引操作
    05.数据库索引操作1.索引概述2.索引分类3.索引环境4.索引创建5.索引测试6.索引管理 1.索引概述索引就好⽐⼀本书的⽬录,它会让你更快的找到内容,显然⽬录(索引)并不是越多越好,假如这本书1000⻚,有500⻚也是⽬录,它当然效率低,⽬录是要占纸张的,⽽索引是要占磁盘空间的。 
  • 2023-04-14可用的摘要模型
    当前最流行的先进模型模型描述能否训练BART通用模型,适合做摘要任务不能预训练,可以微调PEGASUS针对摘要任务不能预训练,勉强微调?T5通用模型,适合做摘要任务大模型,做摘要任务不能微调BigBird通用模型,稀疏注意力可以预训练BigBird√Pegasus⚪
  • 2023-03-19CF855 Div3 VP 游记
    比赛链接好长时间不写博文了甚至快忘记了(今天水一发Div3游记,在Div4比赛之前。第一次VP,当然得选一个简单点的了,打了50分钟多一点。排名不错,400多。$T1$:开始时
  • 2022-11-08Mysql列的类型(数值类型、小数类型)
    #一、演示整型中的tinyint,有符号范围在-128-127,无符号范围在0-255 #if指定unsigned,则tinyint表示无符号:此时范围在0-255;CREATETABLEt1(id TINYINT);CREATE
  • 2022-11-04Sugoroku 4 (Atcoder abc275 T5) DP
    题目描述题目链接https://atcoder.jp/contests/abc275/tasks/abc275_e题意从\(0\)到\(n\)有\(n+1\)个方格,你现在在第\(0\)个格子。每次移动可以随机走\(1\)
  • 2022-11-02第四届全国大学生算法设计与编程挑战赛(秋季赛)T5.找规律
    看了题解之后发现确实比我更有规律...妙啊妙啊 我的:1#include<bits/stdc++.h>2usingnamespacestd;34longlongintn,k,m=1,p=0;//k表示增加
  • 2022-11-02CSP2020-12-T5
    星际旅行算法:线段树、离散化题意:你需要维护\(3\)维空间的\(n(1\leqn\leq10^9)\)个点,初始时这些点的三维坐标都是\(0\)。将有以下\(4\)种操作\(m(1\leqm\leq
  • 2022-10-01多线程案例 : 等待别人到达开饭
    这里我们要把别人当作一个线程。当每一个线程开启时,我们指定一个点,让他们同时到达并执行,所以使用CyclicBarrier设定一个障碍,并设置这个障碍的参数,指定规则由多少个线程同