首页 > 其他分享 >大模型+电力预测?或是泡沫

大模型+电力预测?或是泡沫

时间:2024-04-19 21:44:20浏览次数:23  
标签:预测 电力 复杂 模型 或是 过程 泡沫 电价

自ChatGPT问世以后,大模型非常的火,不出意外的话,电力系统方向又打算搞事情了(灌水)。大模型+电力任重道远。最近听说了一些关于大模型+风光功率预测、负荷预测、电价预测的想法,初步分析下,个人得出结论是不可行。简单来说,如果强行使用大模型来做电力预测,本质上可能只是一厢情愿的希望大模型去预测一个噪声罢了。

为什么大模型做不了电力预测

以日前电价预测为例。日前电价的产生过程实质并不复杂。日前电价是通过各个交易单元的日前报量报价出清计算出来的值。日前电价预测之所以复杂,是因为出清过程里的信息对预测的那一方来说并不是能够全部获取的。需要预测电价的往往是参与市场的交易方,但他并不知道参与交易的风光场站的功率预测值,也不知道全国的负荷预测结果。因此,日前电价预测难的是获取有效的数据,而非过程。对于风光功率预测来说同样如此。风光功率预测通常依赖于天气预报,风光功率预测的主要难度也在于如何处理天气预报的噪声干扰,而风力发电机和光伏发电的过程也是一个对于大模型而言并不复杂的物理过程。而如果要在日前对实时电价进行预测,可能就更难了。实时电价的产生主要来源于日前承诺与实时发电的不平衡,这个不平衡量通常含有的就是大量的风光功率预测误差的成分。要预测实时电价,就好比是预测一个预测模型的误差。而一个训练良好的预测模型,产生的误差理论上是均值为0的噪声。要是误差可预测,那为什么原来的预测模型不去预测误差呢?

大模型当前的成功主要还是表现在自然语言处理和天气预测上。究其宏观的原因,还是因为这两件事情的过程足够复杂。自然语言的处理本身就是一种难以用数学和规则量化的事情,它更像是在群体社会这样的复杂系统中涌现出来的产物,自然语言处理依赖于大量的数据积累和难以量化的过程。因此自然语言处理需要用复杂系统来学习和建模。天气预报也是类似,天气本来就是一类混沌系统,天气里的物理量的变化遵循的是天气系统里的各种微分方程。天气系统里PDE本来就是一类没有解析解的问题,天气预测的复杂来源于它的混沌,因此也需要一个足够大和深的模型来表示。

诚然,在提升模型大小和深度的方向上CV和NLP都取得了一定程度的成功。但遗憾的是,风光功率预测、负荷预测、电价预测的体系并不是上述这样的复杂系统。这些预测任务虽然是复杂的,但复杂的性质却跟自然语言处理和天气预测并不一样。电力预测的复杂并不在于预测量产生过程的复杂,而是在于缺少了信息的情况下引入的噪声影响预测精度。当然,大家可能会说即便缺少数据,从时间序列预测的角度确实能够提升精度。但如果大模型没有从数据角度解决这件事情,大模型预测所利用的信息与之前的方法是一样的,那么大模型的意义就仅在于模型大了一点深了一点。模型越大一定越好吗,这个道理显然不是。大模型意味着更大的数据支撑,也取决于数据集样本。要是以为任何事情都可以力大砖飞,不去细究背后的过程,最后换来的结果只是模型记住了一切的噪声,然后过拟合罢了。说到底,电力预测的有限性,还是在数据质量中带来的难以克服的噪声上。企图通过大模型来弥补这个噪声是不现实的,并不是什么都可预测,也并不是什么都能通过更大更深的模型来预测。以一个不恰当的比喻来看,用大模型预测风光、预测电价,就像是给大模型圆周率的前N位,让它预测后面的数据。它虽然确实可能擅长时间序列预测,但并不是万能到预测随机。

除了机理上的分析,从工程的角度而言,大模型意味着大数据的支持。一个7B参数大模型,每个参数以float32方式存储,大约需要28GB的显存空间。一个28GB大小的模型,数据量该有多大合适呢?假设数据量是28GB,即便不划分训练集测试集,那么也只能找到唯一个满秩解。就好比线性回归率只有一个参数的线性模型拟合一个数据点一样滑稽。早期做LLM的公司都是或多或少有搜索引擎或是跟搜索引擎合作的,海量的数据获取和管理并不简单,更何况像电力这样大部分数据都是非公开难以获取的了。抛开数据的问题,硬件成本也是一个不菲的经费,从头训练一个大模型并不是几张3090显卡能做的。

大模型未来的方向

大模型确实很火,但如果只是像借鉴大模型的大,借鉴它的深度学习架构,最后得到的也只是一个堆起来的transformer架构罢了,并没有从一个更新的方向去改进电力预测。真正可以下手的方向,我认为还是需要从语言模型入手,借鉴当前LLM发展的优势,以语言模型作为驱动器来驱动物理过程或计算过程。换句话说,大模型+电力的目标并不应该是提升一点点精度指标类似的事情,而应该着眼于实现更多工作的自动化。就像是NLP和CV的目标并不是要在说话上比人更好听,也不是要在识别物体上比人更准,更多的是将这些难以用数学规则表示的过程建模为一个可以自动化的过程,让这些过程不再受人的精力限制。这大概也是我理解的AGI的终极目标吧,即实现充分的自动化,而不是超越于人。

结语

科学确实需要大胆想象,但不是毫无根据的臆想。当然,这丝毫不影响我们继续吹牛。毕竟项目还是可以继续吹继续做的,一个大号的深度学习也可以做各种预测。你说它是大模型,谁知道是不是呢?当然可以说有效果,但如果最后只是一个有几十GB数据量的大号的深度学习,那大模型+电力预测确实是一个天大的笑话了。

若有不对之处,欢迎探讨。

标签:预测,电力,复杂,模型,或是,过程,泡沫,电价
From: https://www.cnblogs.com/sashabanks/p/18146823

相关文章

  • 【机器学习】第二节-如何选择和评估模型
    目录一、经验误差与过拟合错误率精度误差训练误差/经验误差度量指标泛化误差欠拟合过拟合二、评估方法专家样本1.留出法(1)单次留出法(2)多次留出法2.交叉验证(1)k折交叉验证(2)留一法(3)P次k折交叉验证3.自助法三、性能度量四、偏差与方差一、经验误差与过拟合错误率分类错误样......
  • (内含福利)Meta 发布新开源模型 Llama 3;华为 Pura 70 系列一分钟售罄丨 RTE 开发者日报
     开发者朋友们大家好: 这里是「RTE开发者日报」,每天和大家一起看新闻、聊八卦。我们的社区编辑团队会整理分享RTE(RealTimeEngagement)领域内「有话题的新闻」、「有态度的观点」、「有意思的数据」、「有思考的文章」、「有看点的会议」,但内容仅代表编辑的个人观点,欢迎......
  • 【百川大模型】RediSearch在python中的应用场景
    [本文出自天外归云的博客园]RediSearch是一个非常强大的全文搜索引擎,它可以与Python一起使用,为你的应用程序提供快速的搜索能力。以下是一些使用RediSearch的场景示例:场景一:商品搜索假设你正在开发一个电子商务网站,你需要为用户提供一个搜索框,让他们能够快速找到他们想要的商品......
  • NL2SQL实践系列(2):2024最新模型实战效果(Chat2DB-GLM、书生·浦语2、InternLM2-SQL等)
    SQL实践系列(2):更多模型使用以及工业级案例NL2SQL基础系列(1):业界顶尖排行榜、权威测评数据集及LLM大模型(SpidervsBIRD)全面对比优劣分析[Text2SQL、Text2DSL]NL2SQL基础系列(2):主流大模型与微调方法精选集,Text2SQL经典算法技术回顾七年发展脉络梳理NL2SQL进阶系列(1):DB-GPT-H......
  • 用户行为分析模型实践(四)—— 留存分析模型
    作者:vivo互联网大数据团队-WuYonggang、LiXiong本文是vivo互联网大数据团队《用户行为分析模型实践》系列文章第4篇-留存分析模型。本文详细介绍了留存分析模型的概念及基本原理,并阐述了其在产品中具体实现。针对在实际使用过程问题,探索了基于ClickHouse留存分析模型实践......
  • 【高级RAG技巧】在大模型知识库问答中增强文档分割与表格提取
    前言文档分割是一项具有挑战性的任务,它是任何知识库问答系统的基础。高质量的文档分割结果对于显著提升问答效果至关重要,但是目前大多数开源库的处理能力有限。这些开源的库或者方法缺点大致可以罗列如下:只能处理文本,无法提取表格中的内容缺乏有效的分割策略,要么是一整个文档......
  • 亚马逊云集齐 Claude 3 全家桶;世界数字技术院发布大模型安全国际标准丨 RTE 开发者日
       开发者朋友们大家好: 这里是「RTE开发者日报」,每天和大家一起看新闻、聊八卦。我们的社区编辑团队会整理分享RTE(RealTimeEngagement)领域内「有话题的新闻」、「有态度的观点」、「有意思的数据」、「有思考的文章」、「有看点的会议」,但内容仅代表编......
  • 星火大模型C#调用实现
    staticClientWebSocketwebSocket0;staticCancellationTokencancellation;//应用APPID(必须为webapi类型应用,并开通星火认知大模型授权)conststringx_appid="xxxxx";//接口密钥(webapi类型应用开通星火认知大模型后,控制台--我的应用---星火认知大模型---相应服务的apik......
  • BGE M3-Embedding 模型介绍
    BGEM3-Embedding来自BAAI和中国科学技术大学,是BAAI开源的模型。相关论文在https://arxiv.org/abs/2402.03216,论文提出了一种新的embedding模型,称为M3-Embedding,它在多语言性(Multi-Linguality)、多功能性(Multi-Functionality)和多粒度性(Multi-Granularity)方面表现出色。M3-Embedding......
  • Live2D - 模型预览图
     chitose epsilon2_1   haru-01 haru-02hijikitororoert_classicvert_normalvert_swimwearryoufukuseifukushifuku小埋玉藻前伊芙加登 ......