2024.3.7 预训练

1.预训练有什么用

机器学习：偏数学（《统计学习方法》-李航）

深度学习(人工智能)的项目：大数据支持（主流）

我们首先介绍下卷积神经网络（CNN），CNN 一般用于图片分类任务，并且CNN 由多个层级结构组成，不同层学到的图像特征也不同，越浅的层学到的特征越通用（横竖撇捺），越深的层学到的特征和具体任务的关联性越强（人脸-人脸轮廓、汽车-汽车轮廓）

猫狗分类问题：100张猫狗照片--》给你一张，分出猫狗

答：无法解决，数据集太少，精度太低，但是可以用已经训练好的模型来解决

假如 ImageNet有1400w张图片，并且做好了分类标注，通过 ImageNet 数据集我们训练出一个模型 A
由于上面提到 CNN 的浅层学到的特征通用性特别强，我们可以对模型 A 做出一部分改进得到模型 B（两种方法）：
1. 冻结（Frozen）：浅层参数使用模型 A 的参数，高层参数随机初始化，浅层参数一直不变，然后利用领导给出的 30 张图片训练参数
2. 微调（Fine-Tuning）：浅层参数使用模型 A 的参数，高层参数随机初始化，然后利用领导给出的 30 张图片训练参数，但是在这里浅层参数会随着任务的训练不断发生变化

2.预训练是什么

通过一个已经训练好的模型A，去完成一个小数据量的任务B（B使用了A 的浅层参数）

任务A和任务B 相似

3.预训练怎么用

fairseq、transformers库

预训练总结

预先训练

有两个相似的任务A和B，任务A已经完成了得到了一个模型A

-—》任务B（数据量小）

用到了一个特性：CNN浅层参数通用

任务B就可以使用模型A的浅层参数，后面的参数通过任务B训练 可使用的方法：1.冻结（浅层参数不变） 2.微调（浅层参数不变）

或者

任务B（大数据）可以训练出模型B（可以使用模型A的浅层参数，节省训练时间，节省成本）

标签：训练,模型,浅层,任务,参数,CNN
From： https://www.cnblogs.com/adam-yyds/p/18062603

3/9 训练笔记
P5268[SNOI2017]一个简单的询问题解不妨把每个区间表示成\(|V|\)维向量\(b\)的形式，其中\(b[i]\)为在区间\([l,r]\)中，\(i\)出现的次数。然后我们发现要求的实际上是\(a\cdotb\)。拆一下（这里用\(g(i)\)表示\([1,i]\)的向量）：\(a\cdotb=[l_1,r_1]\cdot[l_......
代码随想录算法训练营第四天| 24. 两两交换链表中的节点 19.删除链表的倒数第N个节点
24.两两交换链表中的节点https://leetcode.cn/problems/swap-nodes-in-pairs/description/publicListNodeswapPairs(ListNodehead){if(head==null||head.next==null)returnhead;ListNoderes=head.next;ListNodepre=newListNod......
代码随想录算法训练营day17 | leetcode 110. 平衡二叉树、257. 二叉树的所有路径、404
目录题目链接：110.平衡二叉树-简单题目链接：257.二叉树的所有路径-简单题目链接：404.左叶子之和-简单题目链接：110.平衡二叉树-简单题目描述：给定一个二叉树，判断它是否是平衡二叉树示例1：输入：root=[3,9,20,null,null,15,7]输出：true示例2：输入：root=[1,2,2,3,3,null,nul......
2023牛客暑期多校训练营2 B Link with Railway Company
ProblemDescription给你一个\(n\)个节点的树状铁路网络，维护一条边每天需要花费\(c_i\)代价。现在有\(m\)条从\(a_i\)到\(b_i\)，每天的盈利为\(x_i\)，维护花费为\(y_i\)的路线可以运营。你可以选择一部分路线运营，求每日的最大收益。Input第一行输入两个整数\(n,......
3/8 训练笔记
闲话排查许久后发现：intvis[20000010]->aclonglongvis[20000010]->mle并且开了dill所以查了挺久。一个诡异的bug是：...;debug(f,g)->ac...;->wa最后发现vectorresize小了。并且不知道为什么debug一下就好了。P3702[SDOI2017]序列计数题解考虑......
代码随想录算法训练营第四十天|● 343. 整数拆分 ● 96.不同的二叉搜索树
整数拆分题目链接：343.整数拆分-力扣（LeetCode）思路：第一步想的是用递归做，intdigui(intn){if(n==1)returnn;returnmax((n/2)*(n-n/2),digui(n/2)*digui(n-n/2));}可惜的是题目并没有规定一定要分成两份，因此这个思路是不对的，但已经初窥门径。......
代码随想录算法训练营第四十天 | 96.不同的二叉搜索树，343. 整数拆分
343.整数拆分已解答中等相关标签相关企业提示给定一个正整数 n ，将其拆分为 k 个正整数的和（ k>=2 ），并使这些整数的乘积最大化。返回你可以获得的最大乘积。示例1:输入:n=2输出:1解释:2=1+1,1×1=1。......
day58 动态规划part15 代码随想录算法训练营 392. 判断子序列
题目：392.判断子序列我的感悟：理解难点：听课笔记：我的代码：通过截图：代码易错点：老师代码：扩展写法-双指针：classSolution:defisSubsequence(self,s:str,t:str)->bool:#初始化两个指针，分别指向s和t的第一个字符i,j=0,0#......
效率起飞！天翼云并行文件服务HPFS高效应对AI时代大模型训练存储挑战！
国内外AI大模型层出不穷，训练数据复杂程度更是呈指数级增加。如今，在万亿级参数时代，单个资源池已无法满足大模型训练场景中动辄PB级的数据存储量，对于企业来说，启用多个资源池构成的分布式存储势在必行。为了应对AI大模型训练对数据存储的需求，天翼云推出并行文件服务HPFS（CT-HP......
[青少年CTF训练平台]web部分题解（已完结！）
文章管理系统首先打开环境(>ω<｡人)ZZz♪♪既然要做题，就要做全面了，图上说了，既然有假flag我就先找出来：假flag：打开vmware，使用sqlmap进行处理：sqlmap-uhttp://challenge.qsnctf.com:31645/?id=1--dbs记得中间的url换成自己的看到了六个可能：{*]ctftraining[*]information......

预训练

2024.3.7 预训练

1.预训练有什么用

猫狗分类问题：100张猫狗照片--》给你一张，分出猫狗

2.预训练是什么

3.预训练怎么用

预训练总结

相关文章

赞助商

阅读排行

预训练

2024.3.7 预训练

1.预训练 有什么用

猫狗分类问题：100张猫狗照片--》给你一张，分出猫狗

2.预训练是什么

3.预训练怎么用

预训练总结

相关文章

赞助商

阅读排行

1.预训练有什么用