首页 > 其他分享 >Transformer 例子

Transformer 例子

时间:2024-02-28 11:13:32浏览次数:23  
标签:Transformer seq train 例子 sequences test data size

据说很好用,先写一个例子看看:

import torch
import torch.nn as nn
import numpy as np
import matplotlib.pyplot as plt

# 构造简单的时间序列数据集
def generate_time_series():
    time = np.arange(0, 100, 0.1)
    amplitude = np.sin(time)
    return amplitude

# 将时间序列数据转换为序列样本
def create_sequences(data, seq_length):
    sequences = []
    for i in range(len(data) - seq_length):
        seq = data[i:i + seq_length]
        label = data[i + seq_length]
        sequences.append((seq, label))
    return sequences

# 定义 Transformer 模型
class TransformerModel(nn.Module):
    def __init__(self, input_size, output_size, num_layers, heads, hidden_size):
        super(TransformerModel, self).__init__()
        self.encoder_layer = nn.TransformerEncoderLayer(d_model=input_size, nhead=heads, dim_feedforward=hidden_size)
        self.transformer_encoder = nn.TransformerEncoder(self.encoder_layer, num_layers=num_layers)
        self.decoder = nn.Linear(input_size, output_size)

    def forward(self, src):
        src = src.unsqueeze(0)  # 添加批次维度
        output = self.transformer_encoder(src)
        output = self.decoder(output[-1])  # 取最后一个时间步的输出
        return output

# 定义训练函数
def train(model, criterion, optimizer, epochs, train_loader):
    model.train()
    for epoch in range(epochs):
        running_loss = 0.0
        for inputs, labels in train_loader:
            optimizer.zero_grad()
            outputs = model(inputs.float())
            loss = criterion(outputs.squeeze(), labels.float())
            loss.backward()
            optimizer.step()
            running_loss += loss.item()
        print(f"Epoch {epoch+1}/{epochs}, Loss: {running_loss}")

# 设置随机种子,保证实验的可复现性
torch.manual_seed(0)
np.random.seed(0)

# 生成时间序列数据并创建序列样本
data = generate_time_series()
seq_length = 10
sequences = create_sequences(data, seq_length)

# 将序列样本划分为训练集和测试集
train_size = int(len(sequences) * 0.8)
train_data = sequences[:train_size]
test_data = sequences[train_size:]

# 准备训练数据加载器
train_loader = torch.utils.data.DataLoader(train_data, batch_size=32, shuffle=True)

# 定义模型和优化器
model = TransformerModel(input_size=seq_length, output_size=1, num_layers=2, heads=2, hidden_size=128)
criterion = nn.MSELoss()
optimizer = torch.optim.Adam(model.parameters(), lr=0.001)

# 训练模型
train(model, criterion, optimizer, epochs=20, train_loader=train_loader)

# 测试模型
model.eval()
# 测试所有测试数据
test_inputs = torch.tensor([test_data[i][0] for i in range(len(test_data))]).float()
with torch.no_grad():
    predicted = model(test_inputs).squeeze().numpy()

test_labels = [test_data[i][1] for i in range(len(test_data))]
# 可视化预测结果
plt.plot(predicted, label='predicted')
plt.plot(test_labels, label='test')
plt.legend()
plt.show()

  

标签:Transformer,seq,train,例子,sequences,test,data,size
From: https://www.cnblogs.com/kingkaixuan/p/18039340

相关文章

  • offline RL · RLHF · PbRL | OPPO:PbRL 场景的 offline hindsight transformer
    论文题目:BeyondReward:OfflinePreference-guidedPolicyOptimization,ICML2023,3368reject。(已经忘记当初为何加进readinglist了,可能因为abstract太炫酷了?就当作学习经验教训吧…)材料:pdf版本:https://arxiv.org/pdf/2305.16217.pdfhtml版本:https://ar5iv.labs......
  • offline RL | 读读 Decision Transformer
    论文标题:DecisionTransformer:ReinforcementLearningviaSequenceModeling,NeurIPS2021,6679poster(怎么才poster)。pdf:https://arxiv.org/pdf/2106.01345.pdfhtml:https://ar5iv.labs.arxiv.org/html/2106.01345openreview:https://openreview.net/forum?id=a7APmM4......
  • 【论文随笔】多行为序列Transformer推荐(Multi-Behavior Sequential Transformer Reco
    前言今天读的论文为一篇于2022年7月发表在第45届国际计算机学会信息检索会议(SIGIR'22)的论文,文章主要为推荐系统领域提供了一个新的视角,特别是在处理用户多行为序列数据方面,提出了一种有效的Transformer模型框架。要引用这篇论文,请使用以下格式:[1]Yuan,Enming,etal."Multi......
  • StampedLock 使用例子
    StampedLock是Java8引入的一种新的锁机制,它是ReadWriteLock的改进版,提供了更高的并发性和更好的性能。下面是一个使用StampedLock的示例:importjava.util.concurrent.locks.StampedLock;publicclassStampedLockDemo{privatedoublex,y;privatefinalSt......
  • Qt的拖拽操作例子
    本文是一个拖拽文本的例子。演示了如何把按钮的标题拖拽到文本编辑框里。Qt对拖拽的封装很好,QDrag对象简单易用。本文程序测试环境是VS2017和Qt5.9。下面是程序拖拽时的效果图,可以看出来拖拽的时候光标下方也显示了文本内容:头文件。本功能是在主窗口中实现的。下面代码里QtTest......
  • OpenCL切换显卡的例子
    在一些有多个显卡,比如一个核芯显卡和一个独立显卡的系统中使用显卡加速,OpenCL默认的设备可能不是性能更好的独立显卡。这时候可以用下述方法更换显卡,代码如下。本例在VS2015和OpenCL3.0下测试通过:conststringkernel=u8R"(kernelvoidreduceSum(globalint*num,globa......
  • Mamba详细介绍和RNN、Transformer的架构可视化对比
    Transformer体系结构已经成为大型语言模型(llm)成功的主要组成部分。为了进一步改进llm,人们正在研发可能优于Transformer体系结构的新体系结构。其中一种方法是Mamba(一种状态空间模型)。Mamba:Linear-TimeSequenceModelingwithSelectiveStateSpaces一文中提出了Mamba,我们......
  • 运行 decision transformer 遇到的问题
    简介本质上强化学习也是为了预测下一个action,那能否借用大模型的方法来实现next-action的预测。业界有多篇借用大模型的方法(transfomer)来实现这个目的。伯克利的这篇算是最为彻底和简洁。https://sites.google.com/berkeley.edu/decision-transformer transfomer官方网站......
  • python-transformers库
    python-transformers库目录python-transformers库安装测试功能和优势Transformers术语模型与分词器加载预训练模型保存模型分词器编码和解码填充Padpipelinepipeline简介pipeline原理参考资料transformers是一个用于自然语言处理(NLP)任务,如文本分类、命名实体识别,机器翻译等,提供......
  • 【译】稀疏混合专家模型的崛起: Switch Transformers
    原作: 塞缪尔·弗兰德引言:为最强大的语言模型铺平道路的核心技术 使用Dall-E生成的图像稀疏混合专家模型(MoE)已成为最新一代LLMs的核心技术,例如OpenAI的GPT-4、MistralAI的Mixtral-8x7等。简而言之,稀疏MoE是一种非常强大的技术,因为理论上,它允许我们以O(1)的......