Transformer 例子

时间：2024-02-28 11:13:32浏览次数：29

标签：Transformer seq train 例子 sequences test data size

据说很好用，先写一个例子看看：

import torch
import torch.nn as nn
import numpy as np
import matplotlib.pyplot as plt

# 构造简单的时间序列数据集
def generate_time_series():
    time = np.arange(0, 100, 0.1)
    amplitude = np.sin(time)
    return amplitude

# 将时间序列数据转换为序列样本
def create_sequences(data, seq_length):
    sequences = []
    for i in range(len(data) - seq_length):
        seq = data[i:i + seq_length]
        label = data[i + seq_length]
        sequences.append((seq, label))
    return sequences

# 定义 Transformer 模型
class TransformerModel(nn.Module):
    def __init__(self, input_size, output_size, num_layers, heads, hidden_size):
        super(TransformerModel, self).__init__()
        self.encoder_layer = nn.TransformerEncoderLayer(d_model=input_size, nhead=heads, dim_feedforward=hidden_size)
        self.transformer_encoder = nn.TransformerEncoder(self.encoder_layer, num_layers=num_layers)
        self.decoder = nn.Linear(input_size, output_size)

    def forward(self, src):
        src = src.unsqueeze(0)  # 添加批次维度
        output = self.transformer_encoder(src)
        output = self.decoder(output[-1])  # 取最后一个时间步的输出
        return output

# 定义训练函数
def train(model, criterion, optimizer, epochs, train_loader):
    model.train()
    for epoch in range(epochs):
        running_loss = 0.0
        for inputs, labels in train_loader:
            optimizer.zero_grad()
            outputs = model(inputs.float())
            loss = criterion(outputs.squeeze(), labels.float())
            loss.backward()
            optimizer.step()
            running_loss += loss.item()
        print(f"Epoch {epoch+1}/{epochs}, Loss: {running_loss}")

# 设置随机种子，保证实验的可复现性
torch.manual_seed(0)
np.random.seed(0)

# 生成时间序列数据并创建序列样本
data = generate_time_series()
seq_length = 10
sequences = create_sequences(data, seq_length)

# 将序列样本划分为训练集和测试集
train_size = int(len(sequences) * 0.8)
train_data = sequences[:train_size]
test_data = sequences[train_size:]

# 准备训练数据加载器
train_loader = torch.utils.data.DataLoader(train_data, batch_size=32, shuffle=True)

# 定义模型和优化器
model = TransformerModel(input_size=seq_length, output_size=1, num_layers=2, heads=2, hidden_size=128)
criterion = nn.MSELoss()
optimizer = torch.optim.Adam(model.parameters(), lr=0.001)

# 训练模型
train(model, criterion, optimizer, epochs=20, train_loader=train_loader)

# 测试模型
model.eval()
# 测试所有测试数据
test_inputs = torch.tensor([test_data[i][0] for i in range(len(test_data))]).float()
with torch.no_grad():
    predicted = model(test_inputs).squeeze().numpy()

test_labels = [test_data[i][1] for i in range(len(test_data))]
# 可视化预测结果
plt.plot(predicted, label='predicted')
plt.plot(test_labels, label='test')
plt.legend()
plt.show()

标签：Transformer,seq,train,例子,sequences,test,data,size
From： https://www.cnblogs.com/kingkaixuan/p/18039340

offline RL · RLHF · PbRL | OPPO：PbRL 场景的 offline hindsight transformer
论文题目：BeyondReward:OfflinePreference-guidedPolicyOptimization，ICML2023，3368reject。（已经忘记当初为何加进readinglist了，可能因为abstract太炫酷了？就当作学习经验教训吧…）材料：pdf版本：https://arxiv.org/pdf/2305.16217.pdfhtml版本：https://ar5iv.labs......
offline RL | 读读 Decision Transformer
论文标题：DecisionTransformer:ReinforcementLearningviaSequenceModeling，NeurIPS2021，6679poster（怎么才poster）。pdf：https://arxiv.org/pdf/2106.01345.pdfhtml：https://ar5iv.labs.arxiv.org/html/2106.01345openreview：https://openreview.net/forum?id=a7APmM4......
【论文随笔】多行为序列Transformer推荐(Multi-Behavior Sequential Transformer Reco
前言今天读的论文为一篇于2022年7月发表在第45届国际计算机学会信息检索会议（SIGIR'22）的论文，文章主要为推荐系统领域提供了一个新的视角，特别是在处理用户多行为序列数据方面，提出了一种有效的Transformer模型框架。要引用这篇论文，请使用以下格式：[1]Yuan,Enming,etal."Multi......
StampedLock 使用例子
StampedLock是Java8引入的一种新的锁机制，它是ReadWriteLock的改进版，提供了更高的并发性和更好的性能。下面是一个使用StampedLock的示例：importjava.util.concurrent.locks.StampedLock;publicclassStampedLockDemo{privatedoublex,y;privatefinalSt......
Qt的拖拽操作例子
本文是一个拖拽文本的例子。演示了如何把按钮的标题拖拽到文本编辑框里。Qt对拖拽的封装很好，QDrag对象简单易用。本文程序测试环境是VS2017和Qt5.9。下面是程序拖拽时的效果图，可以看出来拖拽的时候光标下方也显示了文本内容：头文件。本功能是在主窗口中实现的。下面代码里QtTest......
OpenCL切换显卡的例子
在一些有多个显卡，比如一个核芯显卡和一个独立显卡的系统中使用显卡加速，OpenCL默认的设备可能不是性能更好的独立显卡。这时候可以用下述方法更换显卡，代码如下。本例在VS2015和OpenCL3.0下测试通过：conststringkernel=u8R"(kernelvoidreduceSum(globalint*num,globa......
Mamba详细介绍和RNN、Transformer的架构可视化对比
Transformer体系结构已经成为大型语言模型(llm)成功的主要组成部分。为了进一步改进llm，人们正在研发可能优于Transformer体系结构的新体系结构。其中一种方法是Mamba（一种状态空间模型）。Mamba:Linear-TimeSequenceModelingwithSelectiveStateSpaces一文中提出了Mamba，我们......
运行 decision transformer 遇到的问题
简介本质上强化学习也是为了预测下一个action，那能否借用大模型的方法来实现next-action的预测。业界有多篇借用大模型的方法（transfomer）来实现这个目的。伯克利的这篇算是最为彻底和简洁。https://sites.google.com/berkeley.edu/decision-transformer transfomer官方网站......
python-transformers库
python-transformers库目录python-transformers库安装测试功能和优势Transformers术语模型与分词器加载预训练模型保存模型分词器编码和解码填充Padpipelinepipeline简介pipeline原理参考资料transformers是一个用于自然语言处理（NLP）任务，如文本分类、命名实体识别，机器翻译等，提供......
【译】稀疏混合专家模型的崛起： Switch Transformers
原作：塞缪尔·弗兰德引言：为最强大的语言模型铺平道路的核心技术使用Dall-E生成的图像稀疏混合专家模型(MoE)已成为最新一代LLMs的核心技术，例如OpenAI的GPT-4、MistralAI的Mixtral-8x7等。简而言之，稀疏MoE是一种非常强大的技术，因为理论上，它允许我们以O(1)的......

Transformer 例子

相关文章

赞助商

阅读排行