首页 > 其他分享 >概率学习2(2024-5-7)

概率学习2(2024-5-7)

时间:2024-05-07 17:11:36浏览次数:17  
标签:学习 概率 变量 群组 2024 差值 众数 distribution

 

 

 

1. 数据

总体population、横截面研究cross-sectional study,周期cycle,纵向研究longtitudinal study,记录record,参与调查的人respondent、样本sample、有代表性representative、过度抽样oversampling、原始数据raw data、重编码recode、数据清洗data cleaning。

 

数据的分组——相关分组处理方法

   
 

2. 分布—— 值及出现的次数——直方图histogram——每个值的频数frequency

描述变量的最佳方法之一是列出该变量在数据集中的值,以及每个值出现的次数。这种描述称为该变量的分布distribution。

 

 

    • 集中趋势central tendency——变量值是否集中在某个值的附近?

 

    • 众数mode——是否有多个聚集点?

 

    • 展布spread——变量的变化性如何?对值在分布中扩展规模的度量。

 

    • 尾部——当偏离众数时,其概率降低多块?

 

    • 离群值outlier——是否有远离众数的极端值?

 

汇总统计量summary statistic:针对一个群组进行统计。

  均值 、平均数

  方差variance、标准差standard deviation(又称为:均方差)。

 

效应量effect size:描述两个群组之间的差异。如,

(1)使用两个群组均值的差值描述两个群组之间的差值。

(2)将群组之间的差值与群组内的变化性进行比较——统计量Cohen's d。

 

正态分布normal distribution——钟形的理想化分布,也称为高斯分布。

均匀分布uniform distribution——所有值具有相同的分布。

 

临床显著clinically significant——在实践中有意义的结果,如群组之间的差异。

 page28——对图形中一部分数据进行放大,并转换数据,以强调种种区别。

 

   
 

3. 概率质量函数

概率probability:是频数的分数表示。

概率质量函数probability mass function,PMP:将每个值映射到其概率。

   
   
   
   
   
   
   
   
   
   
   
   
   

标签:学习,概率,变量,群组,2024,差值,众数,distribution
From: https://www.cnblogs.com/yuweng1689/p/18177805

相关文章

  • YC281A [ 20240429 CQYC省选模拟赛 T1 ] 玫瑰(rose)
    题意给定数列\(A,B,C\),每次操作,你可以花\(1\)的代价将\(A_i\)或\(B_i\)或\(C_i\)增加\(1\)。求使得三个数列每个元素排名相同的最小代价。\(n\le500\)Sol很厉害的题目。首先注意到这个最优方案只和前缀最大值有关,考虑设\(f_{i,j,k}\)表示当前状态枚举到了......
  • 学习模型训练心得1
    大模型时代,多年python开发人员,多多少少得了解模型训练这块,先从学习LLaMA-Factory开启吧!!!地址:https://colab.research.google.com/drive/1d5KQtbemerlSDSxZIfAaWXhKr30QypiK?usp=sharing&pli=1#scrollTo=kbFsAE-y5so4打开按步骤登录google账号,就可以一步一步微调模型,示例中的主要......
  • 2024.5.5 模拟赛
    seq对于\(n\leq15\),枚举每个子序列然后排序计算即可。时间复杂度\(\mathcalO(2^nn\logn)\)。对于\(A_i\)互不相同,可以枚举每个元素的贡献。即若\(A_i\)满足在某一子序列中排名第\(A_i\),则有\(1\)的贡献。也就是当\(1\simA_i\)都被选择时才能有贡献。而大于\(A......
  • TheadLocal类学习
    ThreadLocal是Java中一个非常实用的线程相关的类,它提供线程本地变量,即每个线程都有自己独立的变量副本,从而避免了线程安全问题。下面我将通过几个方面来帮助你理解并学习如何使用ThreadLocal。基本概念线程局部变量:每个线程都拥有一份 ThreadLocal 变量的副本,彼此之间互......
  • 2024平航个人赛
    流量1、成功入侵网站的ip是192.168.5.214观察协议分级,发现主要是tcp的http报文为主使用统计功能,发现最多的分组是192.168.5.146,其次是192.168.5.214和192.168.5.157进行排查发现5.157的攻击者在1秒钟之内向5.146完成了所有的http请求,猜测5.157的攻击者只是实施了扫描或者......
  • 概率与期望DP
    例题1:思路:代码:例题2:思路1:代码1:思路2(复杂度更低):代码2:例题3:思路:代码:例题4:思路:......
  • 2024.5 模拟赛日志
    NOI2024数据结构选讲「广铁一中张冀飞」(20240427)多校NOI2024国赛模拟赛8(20240429)多校NOI2024国赛模拟赛9(20240430)NOI2024简单杂题选讲「金华一中毛艺婷」(20240501)多校NOI2024国赛模拟赛10(20240503)NOI2024网络流问题及其简单应用「重庆八中谢自均」(20240506)剩余7题。最小割......
  • 2024 js预编译
    1、一切未声明定义的变量(没有var)是全局变量属于window全局域2、全局声明定义的变量是全局变量属于window全局域functiontest(){vara=b=123}test()//console.log(a)//报错aisnotdefinedconsole.log(window.a)//undefinedconso......
  • 力扣741 2024.5.6
    原题网址:https://leetcode.cn/problems/cherry-pickup/description/?envType=daily-question&envId=2024-05-06个人难度评价:1800分析:自然的想到分两次dp,第一次dp后修改格点值,然后进行第二次dp。这种做法是错误的:第一次dp的过程中,每次选择都对第二次dp产生后效性。明显从左上到......
  • Python学习笔记(一)
    Python简介Python是GuidovanRossum发布于1991年的一种计算机程序设计语言。是一种动态的、面向对象的脚本语言,是一种解释型的,弱类型的高级计算机语言。需要注意的是python有2.x和3.x两个不兼容的版本,这是个历史遗留问题。python3.x将是趋势,所以这里选择的是python3.x。Python的......