代码编织梦想

    有些时候数据的离散程度能够让我们数据分析得出一些其他信息,理想情况下数据越集中那么效果越好。那么有没有指标来衡量?答案是有得,今天主要学习一下数据离散程度的衡量指标。

    1.极差

     极差就是对一组数据的最大值减去最小值。但是因为极差是采用两头的数据,没有考虑中间的数据,所以代表性差。

    2.四分位差

      即数据样本的上四分之一位和下四分之一位的差值,放映了数据中间50%部分的离散程度,其数值越小表明数据越集中,数值越大表明数据越离散,同时由于中位数位于四分位数之间,故四分位差也放映出中位数对于数据样本的代表程度,越小代表程度越高,越大代表程度越低。但是取四分位数据的时候会因为数据的偏向问题影响,有可能上四分位和下四分位数据值相差太大,所以做为离散程度指标也欠妥。

format,png

    3.方差

使用均值作为参照系,考虑了数据集中所有数值相对均值的偏离情况,并使用平方的方式进行求和取平均,避免正负数的相互抵消。方差是最常用的衡量数据离散情况的统计量。

format,png

      4.标准差

     方差得到的数值偏差均值取平方后的算术平均数,为了能够得到一个跟数据集中的数值同样数量级的统计量,于是就有了标准差,标准差就是对方差取开方后得到的:

format,png

基于均值和标准差就可以大致明确数据集的中心及数值在中心周围的波动情况,也可以计算正态总体的置信区间等统计量

5.平方差

方差用取平方的方式消除数值偏差的正负,平均差用绝对值的方式消除偏差的正负性。平均差可以用均值作为参考系,也可以用中位数,这里使用均值。

format,png

平均差相对标准差而言,更不易受极端值的影响,因为标准差是通过方差的平方计算而来的,但是平均差用的是绝对值,其实是一个逻辑判断的过程而并非直接计算的过程,所以标准差的计算过程更加简单直接。

        6.变异系数

 有时候因为标准差相同,我们无法判断具体那组数据更加离散,比如标准差都为4,一组数据量是1000,而另外一组数据为10,那么显然第一组数据更加平稳。所以为了避免标志差的没有具体的衡量联系,所以使用标准差与均值的比作为变异系数。当然对于均值为0的数据,变异系数也是无能为了。

format,png

参考:https://blog.csdn.net/qsir/article/details/94619194?utm_medium=distribute.pc_relevant.none-task-blog-baidulandingword-6&spm=1001.2101.3001.4242

format,png

版权声明:本文为博主原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接和本声明。 本文链接: https://blog.csdn.net/tianjingle_blog/article/details/111087765

中国企业数字化智能化研究报告 附下载地址-爱代码爱编程

数字经济时代的企业数字化转型,以数据为核心,新兴技术为手段,企业实现微 粒化的解构与智能化的重组。  中台战略是企业数字化转型的关键步骤,也是最佳落地实践。  马云认为,未来三十年是用好互联网公司的时代。阿里认为,采用数字化科技的企业,将面临指数级成长机遇。  数字化生态,云是聚合生态的基础和底座。混合云是数字化转型重要部分。  企业管理

生物信息学算法之Python实现|Rosalind刷题笔记:009 查找DNA中的motif-爱代码爱编程

在字符串中查找子串是一个常见问题。子串在字符串中可能是唯一的,比如特定的基因序列;也有可能有多个拷贝,比如基因组中的重复序列。这些重复序列可能相同,可能有微小区别。本题中重复子串完全相同,可以简单地通过 Python 的find()函数来查找,如果重复子串不完全相同并且符合某种模式,则可以用正则表达式模块re来处理。 给定: 两个 DNA 序列s和

vivado:查看各模块资源占用情况方法-爱代码爱编程

在vivado中 ,如何查看各个模块的资源占用情况呢?方法如下。 以在xilinx官方评估板VC709的microblaze的软核处理器例程为例。工程如下图模块组成。 完成Implementation后,在Flow Navigator下的IMPLMENTATION中点击Open Implemented Design,然后选择Report Ut

5个高度实用的NumPy操作-爱代码爱编程

欢迎关注 “小白玩转Python”,发现更多 “有趣” 引言 NumPy是Python使用最广泛的科学计算库。它是许多其他库(例如Pandas)的基础。NumPy使得操作大型数字数组变得非常简单和快速。因为我们可能拥有大量的数据,所以拥有像NumPy这样的超级高效的工具是非常重要的。 在本文中,我们将介绍在分析大型数组时必不可少的5个操作。

惊艳!Chrome和Edge最大威胁来了....-爱代码爱编程

现如今,浏览器在工作和学习中扮演的角色越来越重。 随之而来的问题就是浏览器变得越来越臃肿、越来越混乱。 密密麻麻的选项卡、无处不在的浏览器窗口。虽然,它举足轻重,但是与其他应用程序之间一直是隔离状态,无法与其他内容进行很好的集成在一起。 今天要介绍的这款浏览器,完全改变了这些。 下面就来开始介绍本文的主角--Sidekick。 Side

如何在 Python 中创建一个简单的神经网络-爱代码爱编程

点击上方“小白学视觉”,选择加"星标"或“置顶” 重磅干货,第一时间送达 引言 在过去的几十年里,机器学习对世界产生了巨大的影响,而且它的普及程度似乎在不断增长。最近,越来越多的人已经熟悉了机器学习的子领域,如神经网络,这是由人类大脑启发的网络。在本文中,将介绍用于一个简单神经网络的 Python 代码,该神经网络对于一个 1x3 向量,分类第

基于中台架构的新业务建设原则-爱代码爱编程

基于中台架构的新业务建设原则 数字化建设是一个长期持续的过程,在此过程中,中台能力不断沉淀、增强,产品功能越来越多,新的产品也会随着业务的不断发展逐渐增加。要让这些新的产品和功能在不断建设以满足业务发展要求的同时,还能完成中台架构持续沉淀数字资产的使命,给企业带来持续的高效业务支撑,就需要对这些新的产品建设提出一些假设原则和标准规范。 从组织人才

中国企业数字化智能化研究报告 附下载地址-爱代码爱编程

数字经济时代的企业数字化转型,以数据为核心,新兴技术为手段,企业实现微 粒化的解构与智能化的重组。  中台战略是企业数字化转型的关键步骤,也是最佳落地实践。  马云认为,未来三十年是用好互联网公司的时代。阿里认为,采用数字化科技的企业,将面临指数级成长机遇。  数字化生态,云是聚合生态的基础和底座。混合云是数字化转型重要部分。  企业管理

QQ号终于能修改了?-爱代码爱编程

一直以来,在许多网友的眼里,QQ都是作为微信的“前辈”存在的,毕竟QQ上的许多功能都领先了微信许多年。 不过这一次,微信的“微信号”功能却被QQ给抄作业了。 12月1日,腾讯QQ宣布用户可以自定义专属ID——QID。 每个ID均为全网唯一且和QQ号一对一绑定,QID可包含字母、数字(数字最多4位),用于添加好友和外显。 用户通过QQ的

读博那么辛苦,为什么还有很多人要读博士呢?-爱代码爱编程

有同学问:在某985学校就业质量报告里发现博士和硕士待遇差不多,甚至还差点,那么为什么还有很多人要读博士呢? 还是看看过来人怎么回答: 本文部分回答来源于知乎。 高赞回答一 作者:寒冰射手曹草草等 首先看图: 我见过不少人,读了博士,别人会尊称他们“xx博士”,而在读博之前,从来没人称他们“xx硕士”,说明博士社会地位还是挺高的。 1

惊艳!Chrome和Edge最大威胁来了....-爱代码爱编程

现如今,浏览器在工作和学习中扮演的角色越来越重。 随之而来的问题就是浏览器变得越来越臃肿、越来越混乱。 密密麻麻的选项卡、无处不在的浏览器窗口。虽然,它举足轻重,但是与其他应用程序之间一直是隔离状态,无法与其他内容进行很好的集成在一起。 今天要介绍的这款浏览器,完全改变了这些。 下面就来开始介绍本文的主角--Sidekick。 Side

2020,我的秋招感悟!-爱代码爱编程

  灰飞烟灭的2021年秋招基本结束了,回忆一下整个秋招过程收获颇多。 我自己是985高校中的一名”三无“人员,无论文、无比赛、无实习。只投递了关于计算机视觉方向的算法岗。最后收获了10+个offer,50W+年薪的offer。最终的选择没有选择高薪,选择了一个相对有自己时间的一份offer。 秋招的准备其实越早越好,记得研一刚入学的时候