首页 > 其他分享 >数据统计分析 — 正态分布

数据统计分析 — 正态分布

时间:2023-10-30 15:35:38浏览次数:28  
标签:统计分析 均数 控制线 频率 样本量 数据 正态分布

连续型随机变量的概率分布
德国的高斯
image
法国的拉普拉斯
image
回到最开始的业务场景

通过统计描述,分析师已经了解了配件A过去的日消耗量波动情况,现希望基于历史数据设定库存控制线,要求该库存量能够保证99%的使用日不会出现库存断货情况。

该怎么办呢?

控制线设置成均数可以吗?

肯定是不可以的,因为均值只是代表一般水平,换句话说,有大概一半的数据在均数以下,有一半在以上,如果把均数设置为库存控制线,最多也就只能满足50%左右的使用日不会出现库存断货情况

如果使用百分位数呢?

计算P99位置的数值,这样理论是可以的,但是百分位数对于样本量比较大的数据集才具有意义,样本量太小,实际意义不大

举个例子:零件日消耗量分布从1-100,我们随机抽取50个样本,计算P99,要求这个值要大于99%的日消耗,假设这个样本数据的最大值是80,比这个数小的是78,最终我们计算出来的是78,显然跟100差的很远,这个数据拿到实际应用中,是不满足要求的,因为样本量少造成的误差太大的缘故。

那该怎么办?
那就用到接下来要讲的内容
从频数分布到概率分布
image

那我们来分析一下
直方图/频率图的性质
直条的面积实质上就是频率(或者百分比)
面积=直条高度X宽度(组距) = 频率
因此直条的面积相加等于1
当样本量越来越大,频率(面积) 趋向概率
并且组距越来越小时,直方条的顶缩成点并且各个直方条的顶连接成一条曲线,这条曲线就是 概率密度分布曲线
概率密度的概念和固体的密度基本类似
哪个地方的概率大说明密度就大
image
这就是正态分布

标签:统计分析,均数,控制线,频率,样本量,数据,正态分布
From: https://www.cnblogs.com/vipsoft/p/17792754.html

相关文章

  • 一文详解如何从 Oracle 迁移数据到 DolphinDB
    Oracle是一个广泛使用的关系型数据库管理系统,它支持ACID事务处理,具有强大的安全性和可靠性,因此被广泛应用于各种企业级应用程序。但是,随着数据规模的增加和业务需求的变化,Oracle的一些限制和缺点也逐渐暴露出来。例如,Oracle的许可证费用昂贵,而且对于海量数据的处理能力较弱。......
  • 硬盘销毁、文件销毁、数据销毁
    硬盘销毁、文件销毁、数据销毁以及物料销毁是在信息安全领域中非常重要的环节。这些销毁过程旨在确保敏感信息不被泄露,避免不必要的风险和责任。下面将详细介绍这些销毁过程。一、硬盘销毁硬盘是计算机系统中最重要的存储设备之一,其中可能包含大量的敏感数据。为了确保硬盘中的数据......
  • 数据集成实现以及平台安装部署入门
    ETLCloud是什么?ETLCloud提供了一套工具和服务,用于将数据从不同的来源抽取(Extract)、转换(Transform)和加载(Load)到目标系统中。ETL代表了这个过程的三个主要步骤。抽取(Extract):从不同的数据源中获取数据,可以是关系型数据库、文件、Web服务或其他数据存储系统。ETLCloud提供了各种连接器......
  • PostgreSQL数据库toast表数据损坏处理
    一、pg_statistic的toast表数据损坏问题现象在安装插件的时候使用\dx元命令的时候,突然发现报了一个错误:postgres=#\dxERROR:missingchunknumber0fortoastvalue32789inpg_toast_2619根据提示来看,主表字段还留存着ToastPointer,但Toast表中已经没有对应的Chunk条目,怀疑t......
  • 京东科技埋点数据治理和平台建设实践
    导读本文核心内容聚焦为什么要埋点治理、埋点治理的方法论和实践、奇点一站式埋点管理平台的建设和创新功能。读者可以从全局角度深入了解埋点、埋点治理的整体思路和实践方法,落地的埋点工具和创新功能都有较高的实用参考价值。遵循埋点治理的方法论,本文作者团队已在实践中取得优......
  • thinkPHP链接多个数据库
    1.添加新数据库的database文件 2.在config.php中引入$db_mn=require_once('database_mn.php');'db_mn'=>$db_mn,   3.控制器调用用db()->connect()代替db() ......
  • postgresql数据库经纬度转geometry
    postgresql数据库经纬度转geometry1、在postgresql数据库中,如果字段类型是geometry,更新该字段为经纬度(坐标),可以尝试采取以下脚本:注意:108.658463代表经度34.1437代表纬度中间没有逗号updatetablesetgeom=ST_GeomFromText('POINT(108.65846334.1437)',4490)wh......
  • 恒驰服务 | 华为云数据使能专家服务offering之大数据建设
    恒驰大数据服务主要针对客户在进行智能数据迁移的过程中,存在业务停机、数据丢失、迁移周期紧张、运维成本高等问题,通过为客户提供迁移调研、方案设计、迁移实施、迁移验收等服务内容,支撑客户实现快速稳定上云,有效降低时间成本,保障客户业务不中断,实现业务稳定连续。大数据建设-适用......
  • 恒驰服务 | 华为云数据使能专家服务offering之数仓建设
    恒驰大数据服务主要针对客户在进行智能数据迁移的过程中,存在业务停机、数据丢失、迁移周期紧张、运维成本高等问题,通过为客户提供迁移调研、方案设计、迁移实施、迁移验收等服务内容,支撑客户实现快速稳定上云,有效降低时间成本,保障客户业务不中断,实现业务稳定连续。数仓建设-适用场......
  • 数据结构与算法 | 二分搜索(Binary Search)
    二分搜索(BinarySearch)文承上篇,搜索算法中除了深度优先搜索(DFS)和广度优先搜索(BFS),二分搜索(BinarySearch)也是最基础搜索算法之一。二分搜索也被称为折半搜索(Half-intervalSearch)也有说法为对数搜索算法(LogarithmicSearch),用于在已排序的数据集中查找特定元素。搜索过程从排序数......