随机变量及其分布
1.基本概念
随机变量:定义在样本空间ΩΩ上的实值函数X(ω)X(ω)称为随机变量,用大写字母表示变量,小写字母表示取值;
分布函数:F(x)=P(X≤x)F(x)=P(X≤x)
分布函数的三条基本性质是判别某个函数是否可以构成分布函数的充要条件
(1)单调性:x1≤x2x1≤x2,则有F(x1)≤F(x2)F(x1)≤F(x2)
(2)有界性:$F(-\infty) = \lim{x\rightarrow-\infty}F(x) = 0,F(\infty)=\lim{x\rightarrow\infty}F(x)=1$
(3)右连续性:limx→x+0F(x)=F(x0)
柯西分布函数
F(x)=1π(arctanx+π2)2.离散随机变量的概率分布列
pi=P(X=xi)分布列的基本性质:非负性、正则性
分布函数:F(x)=∑x1≤xp(xi)
单点分布(退化分布):P(X=c)=1
3.连续随机变量的概率密度函数
F(x)=∫x−∞p(t)dt概率密度函数的基本性质:非负性、正则性
4.数学期望:消除随机性的重要手段
离散随机变量的数学期望
E(X)=∑ixip(xi)连续随机变量的数学期望
E(X)=∫∞−∞xp(x)dx注意,上述数学期望成立的条件为具有绝对收敛性!!!,否则则说明数学期望不存在
数学期望的性质基本定理:若随机变量X的分布用分布列p(xi)或用密度函数p(x)表示,则X的某一函数g(X)的数学期望为
离散场合:E[g(X)]=∑ig(xi)p(xi)连续场合:E[g(X)]=∫+∞−∞g(x)p(x)dx对任意的两个函数g1(x)和g2(x),有如下式子成立
E[g1(x)±g2(x)]=E[g1(x)]±E[g2(x)]5.方差与标准差
方差:VAR(X)=E(X−E(X))2
方差的性质:
Var(X)=E(X2)−[E(X)]2Var(aX+b)=a2Var(X)切比雪夫不等式
设随机变量X的数学期望和方差都存在,则对任意常数ε>0,有
P(|X−E(X)|≥ε)≤Var(X)ε2|X−E(X)|≥ε成为大偏差,根据切比雪夫不等式可以对大偏差的发生概率进行估计;
若随机变量X的方差存在,则Var(x)=0的充分必要条件是X几乎处处为某个常数a,即P(X=a)=1;
6.常用离散分布
(1)二项分布 随机变量X表示n重伯努利实验中的成功次数,用b(n,p)表示
P(X=k)=(nk)pk(1−p)n−kn=1时的特殊二项分布情形称为伯努利分布;
数学期望:np;方差:np(1−p)
(2)泊松分布 往往与计数过程相联系
P(X=k)=λkk!e−λ数学期望:λ;方差:λ
方差的计算过程
E(X2)=∑kk2λkk!e−λ=∑kkλk(k−1)!e−λ=∑k[(k−1)+1]λk(k−1)!e−λ=λ2+λVar(X)=E[X2]−E2[X]=λ2+λ−λ2=λ泊松定理:泊松分布可以作为当n比较大时的二项分布的一种近似
在n重伯努利实验中,记事件A在一次试验中发生的概率为pn,如果当n→∞时,有npn→λ,则
limn→∞(nk)pkn(1−pn)n−k=λkk!e−λ当n越大而p越小时,近似程度越好;
(3)超几何分布 从一个有限总体中进行不放回抽样;
P(X=k)=(Mk)(N−Mn−k)(Nn)数学期望:nMN;方差:nM(N−M)(N−n)N2(N−1)
超几何分布的二项近似
(Mk)(N−Mn−k)(Nn)=(nk)pk(1−p)n−k(4)几何分布 在伯努利实验序列中,如果X为事件A首次出现的试验次数
P(X=k)=(1−p)k−1p(使用逐项微分计算)数学期望:1p;方差:1−pp2
几何分布具有无记忆性:
P(X>m+n|X>m)=P(X>n)(5)负二项分布 X表示事件A第r次出现时的试验次数
P(X=k)=(k−1r−1)pr(1−p)k−r数学期望:rp;方差:r(1−p)p2
7.常用离散分布
(1)正态分布 记做N(μ,σ2)
p(x)=1√2πσe−(x−μ)22σ2μ称为位置参数, σ称为尺度参数;
标准正态分布:μ=0,σ2=1
一切正态变量都可以通过线性变换化成标准正态变量:
U=X−μσ标准化正态变量数学期望:E[X]=0;方差:Var[X]=1;
可从标准化正态变量推导出非标准变量的数学期望:E[X]=μ;方差:Var[X]=σ2;
3σ原则:如果某随机变量的取值概率近似满足下列式子,则可认为该随机变量服从正态分布;
P(μ−σ<X<μ+σ)=0.6826P(μ−2σ<X<μ+2σ)=0.9545P(μ−3σ<X<μ+3σ)=0.9973(2)均匀分布
(3)指数分布:常常用于对寿命进行估计
p(x)=λe−λx,x≥0数学期望:1λ;方差:1λ2;
指数分布具有无记忆性:
P(X>s+t|X>s)=P(X>t)某一个生产过程中,发生故障的总次数满足泊松分布,而故障的发生间隔满足指数分布
(4)伽马分布
伽马函数
Γ(α)=∫∞0xα−1e−xdx性质1:Γ(1)=1,Γ(12)=√π性质2:Γ(α+1)=αΓ(α),Γ(n+1)=n!Gamma分布 记作Ga(α,λ)
p(x)=λαΓ(α)xα−1e−λx数学期望:αλ;方差:αλ2
α=1伽马分布就是指数分布,α=n2,λ=12时的分布就是χ2分布,记作χ2(n)
(5)Beta分布
Beta函数
B(a,b)=∫10xa−1(1−x)b−1dx性质1:B(a,b)=B(b,a)性质2:B(a,b)=Γ(a)Γ(b)Γ(a+b)Beta分布 Be(a,b)
p(x)=Γ(a+b)Γ(a)Γ(b)xa−1(1−x)b−1,0<x<1数学期望aa+b,方差ab(a+b)2(a+b+1)
8.随机变量函数的分布
对于离散随机变量函数和Y为离散型变量的连续随机变量函数,直接将取值一一列出即可,此处主要讨论连续随机变量函数的分布;
g(x)为连续随机变量时:
定理一:设X为连续随机变量,其密度函数为pX(x),Y=g(x)是另一个连续随机变量。若y=g(x)严格单调,其反函数h(y)有连续导函数,则Y=g(x)的密度函数为:
pY(y)=pX[h(y)]|h′(y)|定理二:设随机变量X服从正态分布N(μ,σ2),则当a≠0时,有Y=aX+b服从N(aμ+b,a2σ2);
定理三:(对数正态分布)设随机变量X服从N(μ,σ2),则Y=eX的密度函数为:
pY(y)=1√2πσexp{−(lny−μ)22σ2}定理四:设随机变量X服从Gamma分布Ga(α,λ),则当k>0时,有Y=kX服从分布Ga(α,λ/k);
定理五:随机变量X的分布函数FX(x)为严格单增的连续函数,其反函数F−1X(y)存在,则Y=FX(X)服从(0,1)上的均匀分布U(0,1);
若使用上述定理直接求密度函数比较困难,则可以考虑直接由FY(y)=P(g(X)≤y)出发根据函数特点处理;
9.分布的其它特征数
k阶原点矩:μk=E(Xk);
k阶中心矩:νk=E(X−E(X))k
中心矩和原点矩之间的关系:$\nuk=\sum{i=0}^k\binom{k}{i}\mu_i(-\mu_1)^{k-i}$
变异系数:可消除量纲,用于比较两个随机变量的波动程度大小(前提,二阶矩存在)
Cν(X)=σ(X)E(X)分位数:xp称为下侧p分位数
F(xp)=∫xp−∞p(x)dx=p10.偏度系数和峰度系数
(1)设随机变量的三阶矩存在,则可以定义下列比值为偏度系数
βS=ν3ν3/22=E(X−E(X))3(Var(X))3/2βS描述分布偏离对称性程度的一个特征数,大于0时称为正偏(重尾在右侧),小于0称为负偏(重尾在左侧);
(2)设随机变量的四阶矩存在,则定义下列比值为峰度系数
βk=ν4ν22−3=E(X−E(X))4Var2(X)−3βk描述分布尖峭程度和尾部粗细的一个特征数;βk是相对于正态分布而言的超出量;
峰度和偏度都是描述分布形状的特征数
This is copyright.