AI论文阅读笔记 | Timer: Generative Pre-trained Transformers Are Large Time Series Models(ICML 2024)

时间：2024-07-28 15:28:09浏览次数：20

标签：Pre Transformers 训练模型 Timer 2024 时间序列数据

一、基本信息

题目：Timer: Generative Pre-trained Transformers Are Large Time Series Models
会议：ICML 2024
原文：https://arxiv.org/abs/2402.02368
源码：https://github.com/thuml/Timer

二、基本内容

1、解决什么问题

虽然深度学习对时间序列的分析做出了显著的贡献，但在数据稀缺的真实世界场景中，深度模型可能会遇到性能瓶颈，而这些瓶颈可能由于当前基准测试中小模型的性能饱和而被掩盖。
现有的小模型缺乏大模型所展示的少样本泛化（few-shot generalization）、可扩展性（scalability）和任务通用性（task generality）。

2、怎么解决

构建了统一的时间序列数据集 （Unified Time Series Dataset ——UTSD）

本文建立了筛选高质量数据和堆叠的时间序列语料库的层次标准，通过对公开的时间序列数据集进行聚合，并对聚合后的数据进行协同处理，构建了具有层次化能力的统一时间序列数据集（UTSD)如图所示。包含7个域，10亿个时间点（UTSD-12G）,涵盖了时间序列分析的典型场景。

数据集链接：https://huggingface.co/datasets/thuml/UTSD

训练策略——单序列序列（S3）格式

采用生成式预训练方法，将单序列序列（S3）作为不同时间序列的标准语句，如下图所示。不同于自然语言，序列的幅度、频率、平稳性、数据集的变量数、序列长度等差异使得构造统一的时间序列并非易事。本文提出将异构时间序列转换为单序列序列（S3），保留了具有统一上下文长度的序列变化模式。模型观察了不同时间段、不同数据集的序列，增加了预训练的难度，使模型更关注时间变化。S3不需要时间对齐，这适用于广泛的单变量和不规则时间序列。

采用生成式的预训练目标

采用了GPT风格的生成式预训练目标，通过预测下一个时间点来进行预训练。将时间序列的预测、插补和异常检测转化为一个统一的生成式任务，允许模型学习时间序列的生成过程，从而在下游任务中展现出更好的泛化能力。

Timer（a large-scale pre-trained Time Series Transformer）的提出

基于以上几点，论文提出了Timer，采用与大语言模型类似的解码器结构，具备灵活的上下文长度和自回归生成能力。在多个数据集和多种任务中表现出色。

3、取得了什么效果

1、时间序列预测

数据集：ETT、ECL、Traffic、Weather、PEMS

SOTA: iTransformer （ICLR 2024）

实验：在不同的数据稀缺性（100%，75%，50%，25%，20%.......1%）下 ,对比了从头开始训练的Timer（虚线)和在UTSD（USTD-12G）上预训练后的Timer（实线）的性能。

结果：

Timer的性能受数据量减少的影响小于基线，随着数据数量的下降，Timer的性能均超过基线，且预训练之后的模型表现比从头训练的好。

2、插补

数据集：ETT、ECL、Traffic、Weather、PEMS

baseline: TimesNet （ICLR 2023）

实验：在数据稀缺度为5%，20%，100%的情况下，Timer在44个插补任务中表现分别优于TimesNet100%，86.4%，56.8%。

对于预训练的有效性，以插补错误减少率来表示促进作用，其中，预训练在下游样本只有5%的情况下始终产生积极影响。

3、异常检测

数据集：UCR Anomaly Archive(包含250个时间序列数据集)

baseline: TimesNet （ICLR 2023）、Anomaly Transformer（ICLR 2022）

实验：首先在训练集上训练一个预测模型，并计算预测序列和真实值之间的MSE。将置信度高于α的分段标记为异常的潜在位置。

结果：图7右侧表面，Timer优于其他两个异常检测模型。此外，图9左图显示了预训练模型的有效性。

未完待续......

标签：Pre,Transformers,训练,模型,Timer,2024,时间,序列,数据
From： https://blog.csdn.net/weixin_52531647/article/details/140707871

开车从襄阳到邓州多远，费用多少钱以及详细线路（返程）时间：2024-07-27 23:40:58
开车从襄阳到邓州多远，费用多少钱以及详细线路（返程）时间：2024-07-2723:40:58 编辑：无敌电动网自驾开车从襄阳到邓州的距离大约84.7公里，总耗时约1.6小时，路桥费大约需要30元，如果您开的是汽油车，油费大概51元，如果您开的是新能源车，电费大概在8元~ 17元之间，电费高低取决于您充电......
【教学类-70-01】20240728一个茶壶两个茶杯（果茶）
‘背景需求：用通义万相下载简笔画茶壶、茶杯茶杯，简单笔画，卡通，黑白，未着色，幼儿插图，线条画，没有背景，没有颜色，黑白漫画线条艺术:，空背景，粗轮廓，清晰的线条，矢量线。简单，大，茶壶，简单笔画，卡通，黑白，未着色，幼儿插图，线条画，没有背景，没有颜色，黑白漫画线条艺术:，空背景，粗轮廓，清晰的线条，矢量......
【教学类-70-02】20240724立体拼图（9方块6图）-N套测试（蝴蝶）
背景需求前期做了一个蝴蝶的六面图【教学类-70-01】20240724立体拼图（9方块6图）-1套测试（蝴蝶）-CSDN博客文章浏览阅读279次，点赞11次，收藏2次。【教学类-70-01】20240724立体拼图（9方块6图）-1套测试（蝴蝶）https://blog.csdn.net/reasonsummer/article/details/140669551这次......
2024牛客暑期多校训练营3
A.BridgingtheGap2题目大意：有n个人要划船过河（只有一艘船），每个人有$h_i$的体力，每次划船最少要L人，最多R人，划船要消耗船上所有人1的体力，问存不存在一种方案可以让所有人过河。思路：首先除了最后一次，前面的都需要有L人把船开回来，所以要有L人体力大于三，即可以算出一共需要\(t=\l......
2024最新一元云购源码.完美运营版.机器人自动下单.可指定中奖.一元购源码.一元夺宝源
2024年最新云购源码一元云购H5新版本新UI 完美运行版•带易支付接口机器人自动购买•可指定中奖云购演示站：yun.6323g.com/ 源码下载链接：https://pan.baidu.com/s/1UsSE3IX_um_eAEcMIBLpHA?pwd=akjd 提取码：akjd 免责声明：该资源仅供学习和研究使用，一切关于该资源......
组合数学学习笔记（一）（2024.7.3）
一、组合数1.递推式$\displaystyle\binom{n}{m}=\displaystyle\binom{n-1}{m-1}+\displaystyle\binom{n-1}{m}$证：左边相当于从$n$个数中选$m$个数，右边枚举第$n$个数选不选。如果选，就从剩下$n-1$个数中选$m-1$个；如果不选，就从剩下$n-1$个数中选$m$个。2.对称性......
2024暑假总结2
7.22——数据结构上课+做题首先讲的是树剖。树剖核心就是根据树的一些特征（如深度、最大子树），将一棵树拆分成$\log{n}$个连续的树链，使得树上问题转化为线性问题，最后再用数据结构维护区间或是直接dp之类。由于我之前就比较熟悉树剖、还写过一些题，所以听得非常轻松，但是水平还......
ECCV 2024｜是真看到了，还是以为自己看到了？多模态大模型对文本预训练知识的过度依赖该解
随着大型语言模型（LLMs）的进步，多模态大型语言模型（MLLMs）迅速发展。它们使用预训练的视觉编码器处理图像，并将图像与文本信息一同作为Token嵌入输入至LLMs，从而扩展了模型处理图像输入的对话能力。这种能力的提升为自动驾驶和医疗助手等多种潜在应用领域带来了可能性。点击访问......
布客社区未来规划 202407
一、翻译这个月FreeLearning系列教程会完全发布完毕https://wizard.blog.csdn.net/下半年安排如下：8~9月：DSAI库源码解析10月：VKDoc11月：iBooker12月：杂项25.1~2月：GeekDoc25.3月之后：题库或者问答没错，为了博客能够持续更新，所有翻译结束后我们将搜集考试和竞赛题库，整理后发不......
Scratch作品-巴黎2024奥运会
《Scratch作品-巴黎2024奥运会》是一款以巴黎2024年奥运会为主题的互动作品，专为儿童和青少年设计。通过Scratch编程语言，这个作品生动地再现了奥运会的精彩瞬间，结合了动画、声音和互动元素，让用户仿佛置身于巴黎的奥运赛场。玩家可以参与各种虚拟的奥运项目，学习奥运精神，了解各国......

AI论文阅读笔记 | Timer: Generative Pre-trained Transformers Are Large Time Series Models(ICML 2024)

一、基本信息

二、基本内容

1、解决什么问题

2、怎么解决

3、取得了什么效果

1、时间序列预测

2、插补

3、异常检测

相关文章

赞助商

阅读排行

AI论文阅读笔记 | Timer: Generative Pre-trained Transformers Are Large Time Series Models(ICML 2024)

一、基本信息

二、基本内容

1、解决什么问题

2、怎么解决

3、取得了什么效果

1、时间序列预测

2、 插补

3、 异常检测

相关文章

赞助商

阅读排行

2、插补

3、异常检测