首页 > 其他分享 >【足球走地软件】走地数据分析预测【大模型篇】走地预测软件实战分享

【足球走地软件】走地数据分析预测【大模型篇】走地预测软件实战分享

时间:2024-07-31 18:26:24浏览次数:21  
标签:走地 预测 模型 imputation response 软件 数据 id 比赛

了解什么是走地数据?

走地数据分析,在足球赛事的上下文中,是一种针对正在进行中的比赛进行实时数据分析的方法。这种方法主要用于预测比赛中的某些结果或趋势,如总进球数、比分变化、球队表现等。

在足球走地数据分析中,大小球策略是一种非常实用的投注方式。它主要预测的是一场比赛中的总进球数是否超过或低于一个预设的数值。例如,如果盘口设置为“2.5球”,那么投注“大球”意味着预测比赛的总进球数将至少为3个,而投注“小球”则意味着预测比赛的总进球数将少于或等于2个1。

之前研究过一款软件,是根据预设条件来推断比赛的结果,效果也还可以,但是入门比较高,适合资深的足球专家,有自己的一套分析思路,也是功能很强大的一款产品。
软件地址:http://lcsjfx.com/web/zqds.html
后面就想着,弄否把这个数据模型化,通过现在比较流行的AI模型去预测,效果也还可以。

下面是大概的实战流程,感兴趣可以看看。

该篇章主要讲的是以python为基础,其他技术暂时不在这里延申。

说明技术
数据采集request 库
数据清理pandas 库
模型训练pycaret 库

第一步:数据采集

这里采集的是国外比较权威的足球赛事,因为比较简单,所有没用爬虫框架,直接用request.get(),就能把数据采集下来的,这里需要获取过去5年的历史数据作为训练数据。

import requests

url = 'https://kto/lib/api/v1/overview/sport/1/live'

headers = {
    "User-Agent": "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/125.0.0.0 Safari/537.36",
    "Content-Type": "application/json",
    "Accept": "application/json",
    "path": '/kto/lib/api/v1/overview/sport/1/live'
}

response = requests.get(url=url, headers=headers)
if response.status_code == 200:
    response.encoding = 'utf-8'
    content = response.content.decode('utf-8')
    print(content)
    # 处理数据
if response.status_code != 200:
    print('---sbCorner获取结果异常---', response.status_code)

第二步:数据清洗

获取的数据包含很多无用字段,比如比赛ID,比赛时间,比赛队名等等,这些对模型没有任何意义的数据,比如清理掉。

在这里插入图片描述

# 用pandas进行数据处理
df_filtered = df_filtered.drop(columns=['match_id','match_date','league_id','home_id','away_id', 'zjq_res'])

查看清理后的数据
在这里插入图片描述

原则上这里用一下数据归一化会好一点,但是我们可以先直接把数据拿去训练看一下效果

大小球计算公式:主队比分-客队比分>盘口,及全大0,反之则全小1

# 导入pycaret分类模块和初始化设置
from pycaret.classification import *

# 初始化设置
# data: 数据集,包含特征和目标变量
# target: 目标变量的名称
# session_id: 用于重现实验结果的随机种子
s = setup(df_filtered, target='sfp_res', session_id=123)

在这里插入图片描述

# 比较基准模型

# 使用compare_models()函数比较不同的基准模型,并返回最佳模型

best = compare_models()

看模型返回最优的是GBC模型,但是预测率不高,还需要对数据进行进一步清洗

在这里插入图片描述

# 缺失值补充 简单补充
imputation_type = 'simple',
# 数值型变量补充缺失策略
numeric_imputation = 'mean', # drop,mean,median,mode,knn,int or float
# 类别型变量补充缺失策略
categorical_imputation = 'mode', # drop,mode,str

)

清洗之后再拿数据去模型比较
在这里插入图片描述

评分那么高,肯定有猫腻,检查发现,没有数据里面还有很多null的数据
在这里插入图片描述
继续清理数据


# 缺失值补充 迭代补充
imputation_type = 'iterative',
# 迭代次数
iterative_imputation_iters 5, # 当simple时忽略
# 数值型迭代策略
numeric_iterative_imputer = 'lightgbm',
#  如果 =None,则用LGBClassifier,当simple时忽略

在这里插入图片描述
拿数据预测一下,看起来还行,但是还是有点小问题,正常那么高分就无敌了,里面的数据实时数据有些是拿不到的,所以还需要再处理一下。
在这里插入图片描述

这里只是简单的用pycaret进行模型训练,实际应用中,比这个场景肯定复杂很多,
里面还涉及到球队的评分、elo、rang等,这些这里就不赘述了,有兴趣可以交流一下,后续有空再分享一下。

一个基于大模型为基础的数据分析平台,有兴趣可以自行了解。

http://lcsjfx.com/web/sjfxpt.html

在这里插入图片描述

标签:走地,预测,模型,imputation,response,软件,数据,id,比赛
From: https://blog.csdn.net/qq_38880880/article/details/140773214

相关文章

  • 软件测试工程师我不干了,做大模型去了,如何转行跟上风口?希望能帮助到你们
    软件测试工程师转行到大模型岗位,需要补充深度学习、自然语言处理(NLP)等相关知识,并掌握必要的编程技能。以下是一个详细的转型攻略:学习深度学习和NLP基础知识:理解深度学习的基本概念,如神经网络、卷积神经网络(CNN)、循环神经网络(RNN)等。学习NLP的基础知识,包括词向量、序列标......
  • AI创作商业系统软件源码(SparkAi系统) AI换脸/智能体GPTs应用/AI视频生成AI绘画/文档分
    AI创作商业系统软件源码(SparkAi系统)AI换脸/智能体GPTs应用/AI视频生成AI绘画/文档分析/GPT4.0模型支持目录一、人工智能SparkAi创作系统二、功能模块介绍系统快速体验三、系统功能模块3.1AI全模型支持/插件系统AI模型提问AI智能体文档分析多模态识图理解TTS&......
  • 北斗/GNSS高精度数据处理暨GAMIT/GLOBK v10.75软件应用
    目录第一部分、UBUNTU操作系统介绍与基本使用第二部分、GAMIT/GLOBK软件安装第三部分、数据获取与预处理第四部分、分步式“玩转”GAMIT软件第五部分、应用GAMIT+网平差软件进行高精度北斗/GNSS工程控制网数据处理与精度评估第六部分、“玩转”TRACK软件第七部分、分步......
  • 基于 ChatGPT 的聊天软件合集打包分享
     「基于ChatGPT的聊天软件合集打包」链接:https://pan.quark.cn/s/ef1f5e9c48e4BotGem(原名AMA)官网:https://botgem.com/比较简单,有指令库;支持openai/AzureChatBox项目地址:https://github.com/Bin-Huang/chatbox说明文档:https://github.com/Bin-Huang/chatbox/blob/......
  • 软件工程实践之感悟——大道至简读后感
    《大道至简——软件工程实践者的思想》这本书,如同一盏明灯,照亮了我探索软件工程道路的旅程。周爱民著所作的这本著作,不仅仅是技术的堆砌,更是思想的火花碰撞,给予我无尽的启发。在阅读这本书之前,我总是认为软件工程是庞大而复杂的。代码的编写、项目的管理、团队的协作......每一个......
  • 基于随机森林、XGBoost、lightGBM的大气污染预测可视化系统【前后端交互】
    文章目录==有需要本项目的代码或文档以及全部资源,或者部署调试可以私信博主==数据介绍系统界面展示系统登陆展示系统主界面可视化展示机器学习模型预测展示框架界面功能每文一语有需要本项目的代码或文档以及全部资源,或者部署调试可以私信博主数据介绍使用的大气......
  • 亲测有效!!![INS-32025] 所选安装与指定 Oracle 主目录中已安装的软件冲突。
    找到安装包下“\stage\cvu\cvu_prereq.xml”,复制一份,然后,打开这个xml,删除<CERTIFIED_SYSTEMS></CERTIFIED_SYSTEMS>之间的全部内容。原文件代码:<SPACE> <LOCVAR="CRS_HOME"SIZE="3.59"UNIT="GB"SEVERITY="IGNORABLE"......
  • 5 款最佳电脑照片恢复软件,助您恢复误删除的照片
    电脑可以作为存储盒来保存您美好的照片记忆。然而,病毒、格式化、删除等突发事件可能会夺走你由图片组成的记忆。我怎样才能从我的计算机恢复已删除的照片?照片恢复软件就是答案。本页列出了适用于Windows和Mac的5个最佳图片恢复程序,以帮助您安全快速地从计算机恢复丢......
  • 2024年最佳个人项目管理软件评测
    国内外主流的10款个人项目管理软件对比:PingCode、Worktile、蓝凌OA、Teambition、Tower、禅道、Asana、Trello、Monday.com、Jira。在管理日益复杂的个人项目时,找到一款能够真正符合需求的管理软件,常常是许多人面临的难题。市面上的工具琳琅满目,功能千差万别,这使得选择一款合适......
  • MBD软件开发之条件编译
    汽车行业流行平台化开发,希望通过一套软件对付一系列车型,当然这一系列车型的软件基本上一致,不同配置之间可能有很少一点差别,怎么办?C语言开发中有条件编译,同一份源代码,可以通过设置不同的参数,编译出来不同的软件,而无需编译冗余的软件。使用模型开发算法,是否也可以让模型生成的代......