概率论备忘

约 1189 字大约 4 分钟...

概率论备忘

Chapter 1. 概率论基础

1.1 全概率公式

E(X)=E(E(XY))E(X) = E(E(X|Y))

条件概率的期望等于原数学期望

1.2 矩母函数和特征函数

  • XX的矩母函数的定义为:

m(t)=E(etX)m(t) = E(e^{tX})

  • XX的特征函数的定义为:

f(t)=E(eitX)f(t) = E(e^{itX})

相当于随机变量的傅里叶变换

Chapter 2. 样本及样本函数的分布

2.1 样本的经验分布函数

Fn(x)=1ni=1nI{Xix}=:1ni=1nYiF_n(x) = \frac 1n \sum_{i=1}^n I_{\{X_i \le x\}} =: \frac 1n \sum_{i=1}^n Y_i

其中,Yi=I{Xix}Y_i = I_{\{X_i \le x\}}为i.i.d随机变量,其分布为B(1,p)B(1,p),其中p=P(Xix)=P(Xx)=F(x)p = P(X_i \le x) = P(X \le x) = F(x)

Fn(x)F_n(x)实际上就是根据样本观测值xix_i画出来的分布函数 根据强大数定律,样本的经验分布函数Fn(x)F_n(x)依概率收敛于总体分布函数 F(x)F(x),即当n区域无穷时,Fn(x)F_n(x)近似于F(x)F(x)

2.2 次序统计量

定义: X(i)X_{(i)}称为样本X1,X2,,XnX_1,X_2, \ldots ,X_n的第i个次序统计量,是指其被观测后,将观测值x1,x2,,xnx_1,x_2, \ldots ,x_n从小到大排列,一定处于第i个位置 样本最大值即最大次序统计量XnX_{n},样本最小值即最小次序统计量X1X_1

2.3 常用分布和分布族

2.3.1 Gamma分布

p(x;α,λ)=λαΓ(α)xα1eλx,x>0p(x;\alpha , \lambda)=\frac{\lambda ^ \alpha}{\Gamma(\alpha)} x^{\alpha - 1} e^{-\lambda x} \quad ,x>0

记为Γ(α,λ)\Gamma (\alpha, \lambda)Ga(α,λ)Ga(\alpha, \lambda),其中α>0\alpha > 0称为“形状参数”,λ>0\lambda > 0称为”尺度参数“,Γ(α)=0tα1etdt\Gamma (\alpha) = \int_0^\infty t^{\alpha -1} e^{-t} dt

常见性质

  1. Γ(x+1)=xΓ(x)\Gamma (x+1) = x \Gamma(x)Γ(n)=(n1)!\Gamma (n) = (n-1)!Γ(12)=π\Gamma (\frac 12) = \sqrt{\pi}
  2. Γ(1,λ)\Gamma (1, \lambda)为指数分布e(λ)e(\lambda)Γ(n2,12)\Gamma (\frac n2, \frac 12)即为卡方分布χ2(n)\chi ^2(n)
  3. Gamma分布的均值E(X)=αλE(X) = \frac \alpha \lambda,方差D(X)=αλ2D(X) = \frac \alpha {\lambda ^2}
  4. Gamma分布的矩母函数E(etX)=(1tλ)α,t<λE(e ^{tX}) = (1 - \frac t \lambda)^{- \alpha} \quad ,t<\lambda

特征函数φ(t)=E(eitX)=(1itλ)α\varphi (t) = E(e ^{itX}) = (1 - \frac {it} \lambda)^{- \alpha}

  1. 可加性:X1,X2X_1, X_2相互独立,XiΓ(αi,λ), i=1,2X_i \sim \Gamma(\alpha _i, \lambda), \ i=1,2,则X1+X2Γ(αi+α2,λ)X_1 + X_2 \sim \Gamma(\alpha _i + \alpha _2, \lambda)
  2. XΓ(α,λ)X \sim \Gamma(\alpha, \lambda),则Y=X/kΓ(α,kλ),k>0Y = X/k \sim \Gamma(\alpha, k\lambda)\quad ,k>0

2.3.2 Beta分布

p(x;a,b)=1B(a,b)xa1(1x)b1=Γ(a+b)Γ(a)Γ(b)xa1(1x)b1,0<x<1\begin{aligned} p(x;a , b) &=\frac 1 {B(a,b)} x^{a - 1} (1-x)^{b-1} \\ &= \frac{\Gamma(a+b)}{\Gamma(a) \Gamma(b)} x^{a - 1} (1-x)^{b-1} \quad ,0<x<1 \end{aligned} 记为Be(a,b)Be(a, b)β(a,b)\beta(a,b),其中a>0,b>0a> 0, b>0称为“形状参数”,B(a,b)=01xa1(1x)b1dx=Γ(a)Γ(b)Γ(a+b)B(a,b) = \int_0^1 x^{a -1} (1-x)^{b-1} dx = \frac{\Gamma(a) \Gamma(b)}{\Gamma(a+b)}

常见性质:

  1. β(1,1)\beta (1,1)即为(0,1)(0,1)区间上的均匀分布U(0,1)U(0,1)
  2. β(1/2,1/2)\beta (1/2,1/2)为反正弦分布,概率密度函数为:

p(x)=1πx(1x),0<x<1p(x)=\frac{1}{\pi \sqrt{x(1-x)}} \quad ,0<x<1

  1. β(1/2,3/2)\beta (1/2,3/2)为Marchenko-Pastur分布,概率密度函数为:

p(x)=2π1xx,0<x<1p(x)=\frac{2}{\pi} \sqrt{\frac {1-x} x} \quad ,0<x<1

  1. Beta分布的k阶矩E(Xk)=B(a+k,b)B(a,b)E(X^k) = \frac {B(a+k,b)}{B(a,b)},均值E(X)=aa+bE(X)=\frac a {a+b},方差D(X)=ab(a+b)2(a+b+1)D(X)= \frac {ab} {(a+b)^2(a+b+1)}

2.3.4 指数型分布族

包罗性更广的分布族,参数和变量可以分解 p(x;θ)=c(θ)exp{j=1kQj(θ)Tj(x)} h(x)p(x;\theta) = c(\theta)\exp\{\sum^k_{j=1} Q_j(\theta)T_j(x)\}\ h(x) 其中,c(θ),Qj(θ)c(\theta),Q_j(\theta)为定义在参数空间上的函数,与xx无关;h(x),Tj(x)h(x),T_j(x)θ\theta无关

常见性质:

  1. 正态分布、二项分布是指数型分布族;均匀分布不是指数型分布族
  2. 如果总体分布是指数型分布族,那么从中抽取的简单随机样本的分布族或联合分布族也是指数型分布族

2.4 充分统计量

定义: 设有一个总体分布FF,从中抽取一组样本,T=T(X1,X2,,Xn)T = T(X_1,X_2,\cdots,X_n )是样本的统计量,当给定T=tT=t时,样本的条件分布与总体分布无关,则称TT为此分布族的充分统计量;当给定T=tT=t时,样本的条件分布与未知参数θ\theta无关,则亦称TT是参数θ\theta的充分统计量

常见性质:

  1. 充分统计量的一一变换还是充分统计量
  2. 次序统计量都是充分统计量
  3. 指数型分布族的Tj(x)T_j(x)一定是充分统计量,且是极小充分统计量

2.4.1 因子分解定理(用于构造充分统计量)

定理: 总体分布FF的概率密度函数为p(x;θ)p(x;\theta),样本X=(X1,X2,,Xn)\mathbf{X}=(X_1,X_2,\cdots,X_n)的联合概率密度函数为p(x;θ)p(\mathbf{x};\theta),若T=T(X)T=T(\mathbf{X})为未知参数θ\theta的充分统计量,当且仅当 p(x;θ)=g(T(X);θ) h(x)p(\mathbf{x};\theta) = g(T(\mathbf{X}); \theta)\ h(\mathbf{x}) 其中,g(t;θ)g(t; \theta)是定义在统计量取值空间上的函数;h(x)h(\mathbf{x})θ\theta无关

Chapter 3. 点估计

3.1 点估计的优化理论

上次编辑于:
贡献者: lisenjie757
已到达文章底部,欢迎留言、表情互动~
  • 赞一个
    0
    赞一个
  • 支持下
    0
    支持下
  • 有点酷
    0
    有点酷
  • 啥玩意
    0
    啥玩意
  • 看不懂
    0
    看不懂
评论
  • 按正序
  • 按倒序
  • 按热度
Powered by Waline v2.14.9