首页 > 其他分享 >机器学习——序列模型

机器学习——序列模型

时间:2023-11-10 19:12:12浏览次数:40  
标签:机器 预测 外推法 模型 序列 数据 因果关系

在本质上,音乐、语音、文本和视频都是连续的。 如果它们的序列被我们重排,那么就会失去原有的意义。 比如,一个文本标题“狗咬人”远没有“人咬狗”那么令人惊讶,尽管组成两句话的字完全相同。

处理序列数据需要统计工具和新的深度神经网络架构。 为了简单起见,我们以 图8.1.1所示的股票价格(富时100指数)为例。

 

统计工具

自回归模型、马尔可夫模型和因果关系是统计学中的三种不同的模型。这些模型在不同的情况下被用来描述数据之间的关系。

  • 自回归模型是一种时间序列模型,它使用自身过去的数据来预测未来。这种模型假设当前数据与之前的观察数据是相关的。自回归模型通常用于预测时间序列数据,如股票价格、气温等。

  • 隐变量自回归模型则是一种潜在变量模型,它使用潜在变量来描述数据之间的关系。隐变量自回归模型通常用于建模具有状态的系统,如语音识别、自然语言处理等。
  • 马尔可夫模型是一种随机过程,它假设当前状态只与最近的少数状态相关。马尔可夫模型通常用于建模具有状态的系统,如语音识别、自然语言处理等。

  • 因果关系是指两个事件之间的因果联系。因果关系通常用于分析因果关系,如药物治疗对疾病的影响等。

这三种模型之间的联系在于它们都是用来描述数据之间的关系。自回归模型和马尔可夫模型都是用来描述数据之间的相关性,而因果关系则是用来描述数据之间的因果关系。这些模型可以相互补充,以提供更全面的数据分析。

 

内插法和外推法

 

内插法和外推法是两种不同的方法,用于在现有观测值之间进行估计和对超出已知观测范围进行预测。内插法通常用于填补数据中的缺失值,而外推法则用于预测未来的值。这两种方法在实践中的难度上差别很大,因为外推法需要对超出已知观测范围的数据进行预测,而这些数据可能会受到许多未知因素的影响,从而导致预测结果的不确定性。

 

对于所拥有的序列数据,在训练时始终要尊重其时间顺序,即最好不要基于未来的数据进行训练。这是因为在实际应用中,我们通常只能使用过去的数据来预测未来的趋势。如果我们使用未来的数据来训练模型,那么模型将无法准确地预测未来的趋势,因为它没有考虑到未来的情况。因此,我们应该始终尊重时间顺序,并使用过去的数据来预测未来的趋势。

 

 

总结

  • 内插法(在现有观测值之间进行估计)和外推法(对超出已知观测范围进行预测)在实践的难度上差别很大。因此,对于所拥有的序列数据,在训练时始终要尊重其时间顺序,即最好不要基于未来的数据进行训练。

  • 序列模型的估计需要专门的统计工具,两种较流行的选择是自回归模型和隐变量自回归模型。

  • 对于时间是向前推进的因果模型,正向估计通常比反向估计更容易。

  • 对于直到时间步t的观测序列,其在时间步t+k的预测输出是k步预测;。随着我们对预测时间k值的增加,会造成误差的快速累积和预测质量的极速下降。

标签:机器,预测,外推法,模型,序列,数据,因果关系
From: https://www.cnblogs.com/yccy/p/17824852.html

相关文章

  • 去噪扩散概率模型
    DenoisingDiffusionProbabilisticModelsNeurlPS2020https://arxiv.org/pdf/2006.11239.pdfDALLE2https://openai.com/dall-e-2/Abstract​ 我们提出了使用扩散概率模型的高质量图像合成结果,这是一类受非平衡热力学启发的潜在变量模型。我们的最佳结果是通过在加权变异......
  • NeurIPS 2023 Spotlight | 半监督与扩散模型结合,实现少标签下可控生成
    前言 本文从模型结构到训练策略,以及实验结果出发,详解了DeepMind之前提出的不需要归一化的深度学习模型NFNet。本文转载自PaperWeekly作者:游泽彬单位:中国人民大学仅用于学术分享,若侵权请联系删除欢迎关注公众号CV技术指南,专注于计算机视觉的技术总结、最新技术跟踪、经典论文......
  • 波士顿大学「鸭嘴兽-70B」登顶Hugging Face大模型排行榜!高效数据集+独特LoRA微调是关
    HuggingFace上的开源大模型排名榜又更新了,这次荣登榜一的是:鸭嘴兽(Platypus2-70B)!和现在抱脸开源榜单上大部分的模型一样,鸭嘴兽是来自波士顿大学的研究人员基于Llama2微调而来。同时,鸭嘴兽的进步就像之前所有的开源大模型那样:在提升性能的同时,使用更少的计算资源和数据。一个13B的......
  • 天才少年稚晖君智元机器人走路进场!AI模型做大脑,目标售价20万以内
    文丨Congerry在吗,抽个机器人?8月14日,前“华为天才少年”稚晖君在社交媒体官宣智元人形机器人。今天,它就来了,稚晖君正式发布智元具身智能机器人远征A1。身高175cm,体重53kg,最高步速为7km/h,全身49个自由度,整机承重80kg,单臂最大负载5kg。不仅如此,远征A1还集成了大模型,拥有智能交互、决策......
  • 模型的评估
    在机器学习中,模型评估有很多不同的指标,具体的选择通常取决于你解决的问题的性质(例如分类、回归等)以及你关心的特定性能方面。以下是一些常见的模型评估指标:分类问题指标:在二分类问题中,"正类别"通常指的是模型预测为正例的类别。在一个二分类问题中,我们通常将其中一个类别标记为......
  • Streamlit项目:基于讯飞星火认知大模型开发Web智能对话应用
    文章目录1前言2API获取3官方文档的调用代码4Streamlit网页的搭建4.1代码及效果展示4.2Streamlit相关知识点5结语1前言科大讯飞公司于2023年8月15日发布了讯飞认知大模型V2.0,这是一款集跨领域知识和语言理解能力于一体的新一代认知智能大模型。前日,博主对讯飞认知大模型......
  • GPT-4生图未解禁?CMU华人博士新作,大模型GILL能生图能检索,人人可玩
    来源|新智源 ID| AI-eraGPT-4多模态能力恐怕是要再等等了。近日,来自CMU的研究人员全新提出了一种多模态模型GILL。论文地址:https://arxiv.org/pdf/2305.17216.pdf它可以将文本或图像作为prompt,完成多模态对话。具体来说,可以实现生成文本、检索图像、生成新图像。甚至,GILL还能......
  • 千亿级、数学专用,MathGPT大模型开始公测了
    国内大模型市场又迎来了一个新的「选手」,这次是数学专用大模型。今年5月,好未来曾公布正在进行自研数学大模型的研发,命名为MathGPT。MathGPT是面向全球数学爱好者和科研机构,以解题和讲题算法为核心的数学垂直领域的大模型,也是国内首个专为数学打造的大模型。使用方式也很简单。......
  • Excel变天!微软把Python「塞」进去了,直接可搞机器学习
    喜大普奔!微软把Python弄进Excel了!搭建一个机器学习天气预测模型,在Excel里即可实现。而且无需任何设置,在单元格里输入“=PY”,就能开搞。数据清理、预测分析、可视化等等任务,都能轻松实现。还和Anaconda达成了合作。各种常见Python库都能直接用,如Matplotlib、Seaborn等。咱就是说,这回......
  • 【ROS2机器人入门到实战】生命周期节点
    3.生命周期节点写在前面当前平台文章汇总地址:ROS2机器人从入门到实战获取完整教程及配套资料代码,请关注公众号<鱼香ROS>获取教程配套机器人开发平台:两驱版|四驱版为方便交流,搭建了机器人技术问答社区:地址fishros.org.cn以前在ROS1中,节点的启动顺序无法被控制,这对整个机器人系统......