联邦迁移学习

联邦迁移学习

时间：2024-09-10 15:53:39浏览次数：7

标签：loss 训练 nn 学习 train 联邦 import 迁移 model

Finetune（微调）和 Fixed Feature Extractor（固定特征提取器）确实有相似之处，但它们的关键区别在于模型参数的调整范围和任务的相似性。

区别：
Finetune（微调）：

所有层都参与训练：在Finetune中，预训练模型的所有层都会参与训练。虽然我们使用预训练权重进行初始化，但训练过程中会根据新任务的数据对模型参数进行更新。
适用于相似任务：Finetune 适合原始任务和新任务有较大相似性的情况。比如，如果预训练模型在 ImageNet（自然图片）上训练过，用它来处理另一个自然图片的分类任务，Finetune 的效果往往很好。

import torch
import torch.nn as nn
import torchvision.models as models
import torch.optim as optim
from torch.utils.data import DataLoader
from torchvision import datasets, transforms

# 1. 加载预训练的 ResNet50 模型
model = models.resnet50(pretrained=True)

# 2. 修改最后的全连接层，适配新任务（假设新任务有10个类别）
model.fc = nn.Linear(model.fc.in_features, 10)  # in_features 为 ResNet50 的全连接层输入维度

# 3. 定义损失函数和优化器
criterion = nn.CrossEntropyLoss()
optimizer = optim.Adam(model.parameters(), lr=0.001)

# 4. 加载数据集（例如，CIFAR-10 数据集）
transform = transforms.Compose([
    transforms.Resize((224, 224)),  # ResNet50 需要 224x224 的输入尺寸
    transforms.ToTensor(),
])

train_dataset = datasets.CIFAR10(root='./data', train=True, download=True, transform=transform)
train_loader = DataLoader(train_dataset, batch_size=32, shuffle=True)

# 5. 训练模型
model.train()  # 设置为训练模式
for epoch in range(10):  # 假设训练10个 epoch
    running_loss = 0.0
    for inputs, labels in train_loader:
        optimizer.zero_grad()  # 清除梯度
        outputs = model(inputs)  # 前向传播
        loss = criterion(outputs, labels)  # 计算损失
        loss.backward()  # 反向传播
        optimizer.step()  # 更新模型参数
        
        running_loss += loss.item()

    print(f"Epoch {epoch+1}, Loss: {running_loss/len(train_loader)}")

# 6. 模型训练完成后保存
torch.save(model.state_dict(), "finetuned_resnet50.pth")

Fixed Feature Extractor（固定特征提取器）：

仅微调最后几层：在这种方法中，预训练模型的大部分层是被冻结的，只有最后的几层（通常是全连接层）参与训练。这种方式把前几层看作一个固定的特征提取器，用来提取图片的高层次特征，而只在最后的几层上根据新任务进行训练。
适用于不同的任务：这种方法适合原始任务和新任务差异较大的情况，因为你可能只是需要使用预训练模型提取的通用特征，而不需要修改整个模型。

import torch
import torch.nn as nn
import torchvision.models as models
import torch.optim as optim

# 1. 加载预训练的 ResNet50 模型
model = models.resnet50(pretrained=True)

# 2. 冻结前几层参数，使得它们不参与训练
for param in model.parameters():
    param.requires_grad = False

# 3. 替换最后的全连接层，适应新的任务 (假设是10类分类任务)
model.fc = nn.Sequential(
    nn.Linear(model.fc.in_features, 256),  # 添加一层全连接层
    nn.ReLU(),
    nn.Dropout(0.4),
    nn.Linear(256, 10),  # 最后输出10个类别
)

# 4. 只训练新的全连接层
optimizer = optim.Adam(model.fc.parameters(), lr=0.001)

# 5. 训练模型
criterion = nn.CrossEntropyLoss()

# 假设有一个训练数据集 train_loader
for epoch in range(10):
    running_loss = 0.0
    for inputs, labels in train_loader:
        optimizer.zero_grad()  # 清除梯度
        outputs = model(inputs)  # 前向传播
        loss = criterion(outputs, labels)  # 计算损失
        loss.backward()  # 反向传播
        optimizer.step()  # 更新模型参数

        running_loss += loss.item()

    print(f"Epoch {epoch+1}, Loss: {running_loss/len(train_loader)}")

标签：loss,训练,nn,学习,train,联邦,import,迁移,model
From： https://blog.csdn.net/weixin_42595747/article/details/142073258

MySQL知识学习汇总
一、存储引擎1.InnoDB引擎 InnoDB是一种兼顾高可靠性高和高性能的通用存储引擎，在MySQL5.5之后，InnoDB是默认的MySQL存储引擎特性：1.支持外键。2.支持事务，遵循事务的ACID特性。3.行锁：MyISAM是对行加锁，锁粒度相较MyISAM引擎的表锁较细。操作时只锁定某......
SpringMVC学习笔记
本笔记基于【尚硅谷新版SSM框架全套视频教程，Spring6+SpringBoot3最新SSM企业级开发】https://www.bilibili.com/video/BV1AP411s7D7?vd_source=a91dafe0f846ad7bd19625e392cf76d8总结资料获取网址：https://www.wolai.com/v5Kuct5ZtPeVBk4NBUGBWFSpringMVC：构建高效表述层框......
【Python进阶】学习Python从入门到进阶，详细步骤，就看这一篇。文末附带项目演练！！！
详细的Python学习路线1.Python基础Python安装和环境配置：学习如何在你的操作系统上安装Python，并配置开发环境。变量和数据类型：学习如何定义变量，以及Python中的基本数据类型，如整数、浮点数、字符串等。Python数据类型运算符和表达式：学习Python中的运算符，如算术运算符、比......
34-样式迁移
类似于加了一层滤镜基于CNN的样式迁移：如下对于合成图片X，我们希望它的内容和输入的内容图片，放入同一个CNN，在某一个卷积层上，输出的与内容有关的特征能够匹配同时，，对于样式图片，我们希望合成图片X，和样式图片放入同一个CNN，在某一个卷积层上，输出的与样式有关的特征能够匹配。如果我......
AI绘画SD下载安装教程，学习AI绘画软件必看（SD怎么安装，SD安装教程，安装stable diffusion软
一、前言介绍目前市场上颇受认可的，能助力创意工作的AI绘画工具主要集中于两款。一款是广为人知的Midjourney（简称MJ），另一款则是备受瞩目的StableDiffusion（简称SD）。这两款软件的核心共同点在于，它们都是通过用户输入的关键词等信息来生成画作。MJ目前采取的是付费模式，用......
基于django+vueblockly少儿编程在线学习网站【开题报告+程序+论文】-计算机毕设
本系统（程序+源码+数据库+调试部署+开发环境）带论文文档1万字以上，文末可获取，系统界面在最后面。系统程序文件列表开题报告内容研究背景随着信息技术的飞速发展，编程教育逐渐从高等教育向基础教育渗透，成为培养未来社会创新人才的重要途径。少儿编程作为这一趋势的前沿阵地，其重......
C++学习笔记（14）
二、栈解旋异常被抛出后，从进入try语句块开始，到异常被抛出之前，这期间在栈上构造的所有对象，都会被自动析构。析构的顺序与构造的顺序相反。这一过程称为栈的解旋。也就是在执行throw前，在try执行期间构造的所有对象被自动析构后，才会进入catch匹配。在堆上构造的对象肿......
【万字文档+PPT+源码】基于springboot+vue电影推荐系统-可用于毕设-课程设计-练手学习
博主简介：......
基于springboot+vue的运动会成绩管理系统-可用于计算机毕设-课程设计-练手学习
博主简介：......
【万字文档+源码】基于springboot+vue高校学生评教系统-可用于毕设-课程设计-练手学习
博主简介：......

相关文章

赞助商

阅读排行