Python漫游数学王国 | 随机变量及其分布

举报
TiAmoZhang 发表于 2023/04/24 14:12:40 2023/04/24
【摘要】 随机变量及其分布
简介: 随机变量及其分布


640.jpg


01、随机变量

有些随机实验的结果是用数值表示的,有些不是。当实验结果不是用数值表示时,很难对其进行描述和研究,所以有必要将实验结果数值化,这便是引入随机变量的初衷。

【例1】将一枚硬币抛掷三次,观察正面和反面出现的情况,样本空间是S={HHH,HHT,HTH,THH,HTT,THT,TTH,TTT}。以X记三次投掷得到正面H的总数,那么,对于样本空间S中的每一个样本点e,X都有一个数与之对应。X是定义在样本空间S上的一个实值单值函数,它的定义域是样本空间S,值域是实数集合{0,1,2,3}。这样的X称为随机变量。
代码如下:

84c2f0681f05b7d3ab6f7ad981fd4a3f.png

b04f8141841ea995e1aef3b118699034.png


运行结果如图1所示。

640.png


■ 图1


注释/

numpy.random.RandomState()是一个伪随机数生成器,和设置seed的效果是一样的。

随机变量按其取值情况可分为离散型随机变量与连续型随机变量。离散型随机变量的取值可以一一列举,连续型随机变量的取值不能一一列举。

01、离散型随机变量及其分布律

要掌握一个离散型随机变量X的统计规律,必须且只须知道X的所有可能取值以及取每个可能值的概率。本节引入 scipy的stats子模块介绍离散型随机变量。

首先引入stats,查看stats包含哪些离散型随机变量的分布,代码如下:

640.png


运行结果如图2所示。

640.png



■ 图 2


这里列出了15种离散型分布,仅介绍其中的三种——bernoulli,binom,poisson。

  1. 0-1分布

0-1分布也叫伯努利(Bernoulli)分布。设随机变量X只可能取两个值0和1,它的分布律是:


640.png


则称X服从参数为p的(0-1)分布或伯努利分布。scipy中bernoulli()对应(0-1)分布,代码如下:

640.png


运行结果如图3所示。

640.png


运行结果如图4所示。

640.png


  1. 二项分布

设X为n重伯努利实验中某事件A发生的次数,X可取k=0,1,2,…,n。若P(A)=p,则X的分布律为:

640.png

称X服从参数为n,p的二项分布。scipy中binom对应二项分布,使用方法代码如下:
640.png
运行结果如图5所示。
640.png

■ 图 5


注释/
pmf是概率质量函数。rv服从参数为5,0.3的二项分布,rv. pmf(x)返回随机变量rv取值为0,1,2,3,4,5时的概率值,与使用分布律公式算得的值是一致的,代码如下:
640.png
运行结果如图6所示。
640.png
■ 图6

【例2】某种型号电子元件的使用寿命如果超过1500小时,则为一级品。已知某一大批产品的一级品率为0.2,现在从中随机地抽查20只。问20只元件中恰有k只(k=0,1,…,10)为一级品的概率是多少?


解由题意可得,20只元件中一级品的只数服从参数为20,0.2的二项分布,所求概率代码如下:
640.png
运行结果如图7所示。

进一步,可作上述结果的图形,以便对该结果有一个直观的了解,代码如下:
640.png
运行结果如图8所示。
640.png
注释/
(1) subplots()函数返回一个包含figure和axes对象的元组,因此,使用fig,ax=plt.subplots()将元组分解为fig和ax两个变量。fig变量可用来修改figure层级的属性,ax变量中保存着子图的可操作axes对象。

(2) ax.plot(x,rv.pmf(x),'ro',ms=8,label='binom pmf')使用红色圆圈标记绘制x与rv.pmf(x),标记大小为8,标签为binom pmf。

(3) ax. vlines(x,0,rv.pmf(x),colors='g',lw=5,alpha=0.5)在x处绘制从0到rv. pmf(x)的垂直线,线条颜色为绿色,线条宽度为5,透明度为0.5。
从图形输出结果可以看到,当k增加时,相应概率先是随之增加,增大到最大值(k=4时)后单调减少。

【例3】某人进行射击,设每次射击的命中率为0.02,独立射击400次,试求至少击中两次的概率。

解代码如下:
640.png
运行结果如图9所示。
640.png
■ 图9

  1. 泊松分布

设随机变量X所有可能的取值为0,1,2,…,取各个值的概率为
640.png
其中,λ>0是常数。则称X服从参数为λ的泊松分布。scipy中poisson对应泊松分布,代码如下:

运行结果如图10所示。
640.png
■ 图 10

【例4】某公司制造一种特殊型号的微芯片,次品率达0.1%,各芯片成为次品相互独立。求在1000只产品中至少有2只次品的概率。

解由题可知,产品中的次品数服从参数为n=1000,p=0.001的二项分布,这里n很大,p很小,该二项分布可用参数为n、p的泊松分布来逼近,我们尝实验证这一结论,代码如下:
640.png
运行结果如图11所示。
640.png
■ 图 11

从输出结果可以看到,两种分布下所得概率相差无几。

【版权声明】本文为华为云社区用户原创内容,未经允许不得转载,如需转载请自行联系原作者进行授权。如果您发现本社区中有涉嫌抄袭的内容,欢迎发送邮件进行举报,并提供相关证据,一经查实,本社区将立刻删除涉嫌侵权内容,举报邮箱: cloudbbs@huaweicloud.com
  • 点赞
  • 收藏
  • 关注作者

评论(0

0/1000
抱歉,系统识别当前为高风险访问,暂不支持该操作

全部回复

上滑加载中

设置昵称

在此一键设置昵称,即可参与社区互动!

*长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。

*长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。