• 2024-08-05BMTrain类Megatron+DeepSpeed原理学习
    这一章节虽然是BMTrain,不是目前常用的Megatron+DeepSpeed,但是对于了解原理,也是很有帮助。BMTrain数据并行一般数据并行上图,把数据切为3份,每张显卡处理一部分数据,每张显卡利用得到的数据进行前向传播和反向传播,得到各自的梯度,为了让模型学到这份数据的所有知识,就需要
  • 2024-07-21TooBox也盒-图片批量裁剪器
    TooBox也盒v0.2.0版本上线,支持图片批量裁剪。在进行Lora训练时,通常需要这三种尺寸,但有时我们的素材并不符合这些规格,这时就需要进行裁剪。首先启动TooBox也盒,选择“图片裁剪”功能,然后选择包含待裁剪图片的文件夹。选定文件夹后,图片显示区域将展示该文件夹中的所有图片。
  • 2024-01-24大模型系统和应用——高效训练&模型压缩
     背景介绍预训练语言模型以每年十倍的速度增大,越大的模型往往表现出更好的性能;但为了训练这些模型耗费也越来越昂贵,训练代码变得更复杂。我们希望让训练过程变得更加简单,训练变得更高效,并且训练更加廉价。首先我们要分析GPU内存;其次理解在多张显卡之间的合作模式是怎样的
  • 2023-11-19每张标签分页
    问题:如下图每张标签分页解决:第一步:新建工作表,将数据源中的C列复制粘贴到新表的A列第二步:B3单元格输入以下公式:=IF(A3="浙江XX有限公司",B2+1,B2)第三步:B列复制后粘贴为值第四步:查找全部A3单元格中的内容 第五步:删除行第六步:删除A列第七步:在A2单元格输入任意内容
  • 2023-04-10查看SQLSERVER数据库每张表的大小
    ---SQLSERVERUSE[HealthOne]--replaceyourdbname替换你的数据库名字GOSELECTs.NameASSchemaName,t.NameASTableName,p.rowsASRowCounts,CAST(ROUND((SUM(a.used_pages)/128.00),2)ASNUMERIC(36,2))ASUsed_MB,CAST(ROUND((SUM(a.total_pages)-SUM(a.use
  • 2022-11-15mysql查询每张表有多少条记录
    mysql查询每个表有多少条记录的方法:执行【selecttable_name,table_rowsfromtableswhereTABLE_SCHEMA='数据库的名称';】语句即可。mysql查询每个表分别有多少条记
  • 2022-10-17SQL SERVER 统计每张表的大小
    建存储过程SETANSI_NULLSONGOSETQUOTED_IDENTIFIERONGO--=============================================--说明:更新查询数据库中各表的大小,结果存储到数据表
  • 2022-09-28三大范式
    为什么需要数据规范化?1)信息重复2)更新异常3)插入异常  无法正常显示信息4)删除异常 丢失有效的信息    第一范式(1NF):原子性:保证每一列不可再分  第二范式(2NF):前提:满
  • 2022-09-26mysql统计每张表的数据量
    1.每张表大概的数据量的查询方法selecttable_name,table_rowsfrominformation_schema.tableswhereTABLE_SCHEMA='数据库名称'orderbytable_rowsdesc;2.具体某张
  • 2022-08-15查询数据库中每张表的数据以及索引占用空间
    BEGIN --查询目前数据库中的用户表 DECLARE@currentTableTABLE(tableNameNVARCHAR(50)); INSERTINTO@currentTable(tableName) SELECTname FROMsy