概率论与数理统计



第一章 概率论的基本概念

条件概率

定义

A,BA, B 为两事件,且 P(A)>0P(A)>0,则在已知“事件 AA 发生”的条件下,事件 BB 发生的条件概率 P(BA)P(B|A) 定义为
P(BA)=P(AB)P(A)P(B|A)=\frac{P(AB)}{P(A)}

性质

全概公式和贝叶斯公式

全概公式

A1,A2,,AnA_{1}, A_{2}, \ldots, A_{n} 是样本空间 SS 的一个剖分,则对任意事件 BB,有
P(B)=i=1nP(Ai)P(BAi)P(B)=\sum_{i=1}^{n} P\left(A_{i}\right) P\left(B | A_{i}\right)

贝叶斯公式

A1,A2,,AnA_{1}, A_{2}, \ldots, A_{n} 是样本空间 SS 的一个剖分,如果 P(Ai)>0,i=1,2nP\left(A_{i}\right)>0, \,i=1,2 \ldots n,则对任意事件 BB,只要 P(B)>0P(B)>0,就有
P(AkB)=P(Ak)P(BAk)i=1nP(Ai)P(BAi)P\left(A_{k} | B\right)=\frac{P\left(A_{k}\right) P\left(B | A_{k}\right)}{\sum_{i=1}^{n} P\left(A_{i}\right) P\left(B | A_{i}\right)}

事件的独立性

定义

A,BA, B 是任意事件,若 P(AB)=P(A)P(B)P(A B)=P(A) P(B),则称事件 AABB 相互独立.

A1,A2,,AnA_{1}, A_{2}, \ldots, A_{n}nn 个事件,若从中任取 kk 个事件(2kn2 \leq k \leq n)都有 P(Ai1Ai2Aik)=P(Ai1)P(Ai2)P(Aik)P\left(A_{i_{1}} A_{i_{2}} \ldots A_{i_{k}}\right)=P\left(A_{i_{1}}\right) P\left(A_{i_{2}}\right)\ldots P\left(A_{i_{k}}\right),则称这 nn 个事件相互独立.

相互独立 \Rightarrow 两两独立
两两独立 \nRightarrow 相互独立

性质

  1. AABBA\overline{A}BBAAB\overline{B}A\overline{A}B\overline{B} 只要有一个独立关系成立,则其余都成立

  2. 互不相容与相互独立不能同时成立(概率为 0011 的事件除外)

    AABB 不相容 \langle \begin{array}{l}{\Rightarrow} \\ {\nLeftarrow}\end{array}\rangle AABB 不独立

    AABB 相容 \langle \begin{array}{l}{\nRightarrow} \\ {\Leftarrow}\end{array}\rangle AABB 独立

  3. 事件 AAAA 独立 \Leftrightarrow P(A)=0P(A)=0P(A)=1P(A)=1

nn 重伯努利试验

如果试验 EE 只有两个结果,AAA\overline{A},且 P(A)=p,0<p<1P(A)=p,\,0 < p < 1,则称 EE 为伯努利试验.将试验 EE 独立地重复 nn 次,看成一个试验,称为 nn 次独立重复试验,或 nn 重伯努利试验,记为 EnE^{n}
BB 表示事件 AAnn 次重复试验中出现 mm 次的事件,则
P(B)=Cnmpmqnm,m=1,2,,nP(B)=\mathrm{C}_{n}^{m} p^{m} q^{n-m},\quad m=1,2, \dots, n

第二章 随机变量及其分布

离散型随机变量及其分布

二项分布

XB(n,p)0<p<1X \sim B(n, p) \quad 0 < p < 1

分布列:
P(X=k)=Cnkpkqnk,k=0,1,2,,nP(X=k)=\mathrm{C}_{n}^{k} p^{k} q^{n-k},\quad k=0,1,2, \dots, n

n=1n=1 时称为两点分布

实际背景:nn 次独立重复试验中事件发生 kk 次的概率.

超几何分布

XH(n,M,N)nN,MNX \sim H(n, M, N) \quad n \leq N, M \leq N

分布列:
P(X=m)=CMmCNMnmCNn,m=0,1,2,nP(X=m)=\frac{\mathrm{C}_{M}^{m} \mathrm{C}_{N-M}^{n-m}}{\mathrm{C}_{N}^{n}}, \quad m=0,1,2 \ldots, n

实际背景:NN 件产品中有 MM 件次品,从中任取 nn 件,恰有 mm 件次品的概率.

泊松(Poisson)分布

XP(λ)X \sim P(\lambda)Xπ(λ)X \sim \pi(\lambda)

分布列:
P(X=k)=λkk!eλ,k=0,1,2P(X=k)=\frac{\lambda^{k}}{k !} e^{-\lambda}, \quad k=0,1,2 \ldots

泊松定理:设 XnB(n,pn)X_{n} \sim B\left(n, p_{n}\right),如果 limnnpn=λ\lim_{n \rightarrow \infty} n p_{n}=\lambda,则有
limnCnkpnk(1pn)nk=λkk!eλ,k=0,1\lim_{n \rightarrow \infty} \mathrm{C}_{n}^{k} p_{n}^{k}\left(1-p_{n}\right)^{n-k}=\frac{\lambda^{k}}{k !} e^{-\lambda}, \quad k=0,1 \ldots

nn 很大,pp1p1-p 很小时,泊松分布可以做二项分布的近似计算.

几何分布

XG(p)p>0X \sim G(p) \quad p>0

分布列:P(X=k)=p(1p)k1,k=1,2P(X=k)=p(1-p)^{k-1}, \quad k=1,2 \ldots

实际背景:独立重复试验 kk 次才成功的概率.

几何分布的无记忆性:P(X>s+tX>s)=P(X>t)P(X>s+t | X>s)=P(X>t)

随机变量的分布函数

定义

随机试验 EEXX 是其随机变量,对任意的 xRx \in R,称 F(x)=P(Xx)xRF(x)=P(X \leq x) \quad x \in R 为随机变量 XX 的分布函数.

性质

  1. F(x)F(x)xx 的右连续函数.
  2. F(x)F(x)xx 的单调不减函数.
  3. 0F(x)10 \leq F(x) \leq 1
  4. P(a<Xb)=F(b)F(a)P(a<X \leq b)=F(b)-F(a)

连续型随机变量

XX 是一个随机变量,F(x)F(x) 是它的分布函数.如果存在一个可积函数 f(x)0f(x) \geq 0,使得 F(x)F(x) 满足 F(x)=P(Xx)=xf(t)dt,xRF(x)=P(X \leq x)=\int_{-\infty}^{x} f(t) \, \mathrm{d} t, \quad x \in R 则称 XX 为连续型随机变量,f(x)f(x) 称为 XX 的密度函数.

F(x)=f(x)F^{\prime}(x)=f(x)

性质:

  1. 非负性:f(x)0f(x) \geq 0
  2. 归一性:+f(x)dx=1\int_{-\infty}^{+\infty} f(x) \, \mathrm{d} x=1
  3. dF(x)dx=f(x)\displaystyle\frac{\mathrm{d} F(x)}{\mathrm{d} x}=f(x)
  4. P(a<Xb)=abf(x)dx=F(b)F(a)P(a<X \leq b)=\int_{a}^{b} f(x) \, \mathrm{d} x=F(b)-F(a)
  5. P(X=c)f(c)ΔxP(X=c) \approx f(c) \Delta x
  6. 对任意一点CCP(X=c)=0P(X=c)=0
  7. F(x)F(x) 是连续函数

常用的连续型分布

均匀分布

XU(a,b)X \sim U(a, b)

密度函数:
f(x)={1ba,a<x<b0,其他f(x)=\begin{cases}\displaystyle\frac{1}{b-a}, \quad &a \lt x \lt b \\ 0,\quad &\text{其他}\end{cases}

分布函数:
F(x)={0,x<axaba,ax<b1,xbF(x)=\begin{cases} 0, \quad &x \lt a \\ \displaystyle\frac{x-a}{b-a}, \quad & a \leq x \lt b \\ 1, \quad & x \geq b \end{cases}

指数分布

XE(λ)X \sim E(\lambda)Xe(λ)X \sim e(\lambda)λ>0\lambda \gt 0

密度函数:
f(x)={λeλx,x>00,x0f(x)=\begin{cases} \lambda \mathrm{e}^{-\lambda x}, \quad & x \gt 0 \\ 0, \quad & x \leq 0 \end{cases}

分布函数:
F(x)={1eλx,x>00,x0F(x)=\begin{cases} 1-\mathrm{e}^{-\lambda x}, \quad & x \gt 0 \\ 0, \quad & x \leq 0 \end{cases}

指数分布无记忆性

正态分布

XN(μ,σ2)<μ<+,σ>0X \sim N(\mu, \sigma ^2) \quad -\infty \lt \mu \lt +\infty, \sigma \gt 0

密度函数:
f(x)=12πσe(xμ)22σ2<x<+f(x)=\frac{1}{\sqrt{2 \pi} \sigma} \mathrm{e}^{-\frac{(x-\mu)^{2}}{2 \sigma^{2}}} \quad -\infty < x < +\infty

分布函数:
F(x)=x12πσe(tμ)22σ2dtxRF(x)=\int_{-\infty}^{x} \frac{1}{\sqrt{2 \pi} \sigma} \mathrm{e}^{-\frac{(t-\mu)^{2}}{2 \sigma^{2}}} \, \mathrm{d} t \quad x \in R

f(x)f(x) 的性质:
f(x)f(x) 关于 μ\mu 对称,在 x=μx=\mu 处取得极大值 12πσπ\displaystyle\frac{1}{\sqrt{2 \pi}\sigma}\pi,拐点为 x=μ±σx=\mu \pm \sigma

标准正态分布 N(0,1)N(0,1)

密度函数 φ(x)\varphi(x)

分布函数 Φ(x)\varPhi(x)

Φ(x)=1Φ(x)\varPhi(-x)=1-\varPhi(x)

Φ(0)=12\varPhi(0) = \displaystyle\frac{1}{2}

定理:若 XN(μ,σ2)X \sim N(\mu, \sigma ^{2}),则 Z=XμσN(0,1)Z=\displaystyle\frac{X-\mu}{\sigma} \sim N(0,1)

随机变量函数的分布

已知 XX 的密度 f(x)f(x),求连续型随机变量 Y=g(X)Y=g(X) 的分布的一般步骤:

  1. XX 的取值范围,及 Y=g(X)Y=g(X) 确定 YY 的取值范围
  2. FY(y)=P(Yy)=P(g(X)y)=P(X(h(y)))F_{Y}(y)=P(Y \leq y)=P(g(X) \leq y)=P(X \in(h(y)))
  3. fY(y)=FY(y)f_{Y}(y)=F_{Y}^{\prime}(y)

定理:设连续型随机变量 XX 的密度函数为 fX(x)f_{X}(x)y=g(x)y=g(x) 是一个严格单调的函数,且具有一阶连续导数,则 Y=g(X)Y=g(X) 的密度函数为 fY(y)=fX(g1(y))(g1(y))f_{Y}(y)=f_{X}\left(g^{-1}(y)\right) |\left(g^{-1}(y)\right)^{\prime} |

第三章 二维随机变量及其分布

二维离散型随机变量

联合分布列

P(X=xi,Y=yj)=ΔP{(X=xi)(Y=yj)}=piji,j=1,2,P\left(X=x_{i}, Y=y_{j}\right) \stackrel{\Delta}{=} P\left\{\left(X=x_{i}\right) \cap\left(Y=y_{j}\right)\right\}=p_{i j} \quad i, j=1,2, \ldots

边际分布列

P(X=xi)=j=1P(X=xi,Y=yj)=j=1pij=pii=1,2P\left(X=x_{i}\right)=\sum_{j=1}^{\infty} P\left(X=x_{i}, Y=y_{j}\right)=\sum_{j=1}^{\infty} p_{i j}=p_{i \cdot} \quad i=1,2 \ldots

条件分布列

P(X=xiY=yj)=P(X=xi,Y=yj)P(Y=yj)=pijpji=1,2P\left(X=x_{i} | Y=y_{j}\right)=\frac{P\left(X=x_{i}, Y=y_{j}\right)}{P\left(Y=y_{j}\right)}=\frac{p_{i j}}{p_{\cdot j}} \quad i=1,2 \ldots

分布函数

联合分布函数

F(x,y)=P(Xx,Yy)=P((Xx)(Yy))xR,yRF(x, y)=P(X \leq x, Y \leq y)=P((X \leq x) \cap(Y \leq y)) \quad x \in R, y \in R

边际分布函数

FX(x)=P(Xx)=P(Xx,Y+)=F(x,+)xRF_{X}(x)=P(X \leq x)=P(X \leq x, Y \leq+\infty)=F(x,+\infty) \quad x \in R

条件分布函数

FYX(yx)=P(X=x,Yy)P(X=x)yRF_{Y | X}(y | x)=\frac{P(X=x, Y \leq y)}{P(X=x)} \quad y \in R

二维连续型随机变量

(X,Y)(X,Y) 为二维随机变量,F(x,y)F(x,y) 是它的分布函数,若存在非负函数 f(x,y)f(x,y) 使得对任意的 x,yRx, y \in RF(x,y)=P(Xx,Yy)=xyf(u,v)dvduF(x, y)=P(X \leq x, Y \leq y)=\int_{-\infty}^{x} \int_{-\infty}^{y} f(u, v) \, \mathrm{d}v \mathrm{d}u 则称 (X,Y)(X,Y) 为二维连续型随机变量,f(x,y)f(x,y)(X,Y)(X,Y) 的联合分布密度

2F(x,y)xy=f(x,y)\frac{\partial^{2} F(x, y)}{\partial x \partial y}=f(x, y)

边际分布密度
fX(x)=f(x,y)dyf_{X}(x)=\int_{-\infty}^{\infty}f(x,y)\, \mathrm{d}y
fY(xy)=f(x,y)dxf_{Y}(xy)=\int_{-\infty}^{\infty}f(x,y)\, \mathrm{d}x

条件分布密度
fXY(xy)=f(x,y)fY(y)f_{X|Y}(x | y)=\frac{f(x, y)}{f_{Y}(y)}
fYX(yx)=f(x,y)fX(x)f_{Y | X}(y | x)=\frac{f(x, y)}{f_{X}(x)}

二维均匀分布

f(x,y)={1G的面积,(x,y)G0,(x,y)Gf(x,y) = \begin{cases}\displaystyle{\frac{1}{G\text{的面积}}},\quad & (x,y)\in G \\ 0, \quad & (x,y) \notin G\end{cases}

二维指数分布 (α>0,β>0)(\alpha \gt 0, \beta \gt 0)

f(x,y)={αβe(αx+βy),x>0,y>00,其他f(x,y) = \begin{cases} \alpha \beta \mathrm{e} ^{-(\alpha x + \beta y)}, \quad & x\gt 0, y \gt 0 \\ 0, \quad & \text{其他}\end{cases}

二维正态分布

(X,Y)N(μ1,μ2,σ12,σ22,ρ)(X,Y) \sim N(\mu_{1}, \mu_{2}, \sigma_{1}^{2}, \sigma_{2}^{2}, \rho)

f(x,y)=12πσ1σ21ρ2exp{12(1ρ2)((xμ1)2σ122ρ(xμ1)(yμ2)σ1σ2+(yμ2)2σ22)}f(x, y)=\frac{1}{2 \pi \sigma_{1} \sigma_{2} \sqrt{1-\rho^{2}}} \exp \left\{-\frac{1}{2\left(1-\rho^{2}\right)}\left(\frac{\left(x-\mu_{1}\right)^{2}}{\sigma_{1}^{2}}-\frac{2 \rho\left(x-\mu_{1}\right)\left(y-\mu_{2}\right)}{\sigma_{1} \sigma_{2}}+\frac{\left(y-\mu_{2}\right)^{2}}{\sigma_{2}^{2}}\right)\right\}

(X,Y)N(μ1,μ2,σ12,σ22,ρ)(X,Y) \sim N(\mu_{1}, \mu_{2}, \sigma_{1}^{2}, \sigma_{2}^{2}, \rho),则 XN(μ1,σ12)X \sim N(\mu_{1}, \sigma_{1}^{2})YN(μ2,σ22)Y \sim N(\mu_{2}, \sigma_{2}^{2}) 且与 ρ\rho 无关

随机变量的独立性

F(x,y)F(x,y)FX(x),FY(y)F_{X}(x),F_{Y}(y) 分别是二维随机变量 (X,Y)(X,Y) 的分布函数和边际分布函数,若对所有的 x,yx,y 有:
F(x,y)=FX(x)FY(y)xR,yRF(x,y)=F_{X}(x)F_{Y}(y)\quad x\in R,y \in R
P(Xx,Yy)=P(Xx)P(Yy)P(X \leq x, Y \leq y)=P(X \leq x) P(Y \leq y),则称随机变量 XXYY 独立.

二维均匀分布:矩形域独立,圆域不独立

二维指数分布:XXYY 独立

二维正态分布:XXYY 独立 ρ=0\leftrightarrow \rho = 0

定理:设随机变量 XXYY 独立,g(x),h(y)g(x), h(y)XXYY 的函数,则 g(X)g(X)h(Y)h(Y) 也独立.

二维随机变量函数的分布

离散型

泊松分布可加性:设 XP(λ1),YP(λ2)X \sim P\left(\lambda_{1}\right), Y \sim P\left(\lambda_{2}\right)XXYY 独立,则 X+YP(λ1+λ2)X+Y \sim P\left(\lambda_{1}+\lambda_{2}\right)

二项分布可加性:设 XB(n,p),YB(m,p)X \sim B(n, p), Y \sim B(m, p)XXYY 独立,则 X+YB(m+n,p)X+Y \sim B(m+n, p)

连续型

正态分布可加性:设 XN(μ1,σ12),YN(μ2,σ22)X \sim N\left(\mu_{1}, \sigma_{1}^{2}\right), Y \sim N\left(\mu_{2}, \sigma_{2}^{2}\right)XXYY 独立,则 X±YN(μ1±μ2,σ12+σ22)X \pm Y \sim N\left(\mu_{1} \pm \mu_{2}, \sigma_{1}^{2}+\sigma_{2}^{2}\right)

极值分布

极大值分布:已知 (X,Y)(X,Y) 的分布,求 Z=max(X,Y)Z=\max (X, Y) 的分布

  1. 已知 (X,Y)(X,Y) 的分布函数 F(X,Y)F(X,Y)
    FZ(z)=P(Zz)=P(max(X,Y)z)=P(Xz,Yz)=F(z,z)F_{Z}(z)=P(Z \leq z)=P(\max (X, Y) \leq z)=P(X \leq z, Y \leq z)=F(z, z)
  2. XXYY 独立,分布函数 FX(x),FY(y)F_{X}(x), F_{Y}(y)
    FZ(z)=P(Zz)=F(z,z)=FX(z)FY(z)F_{Z}(z)=P(Z \leq z)=F(z, z)=F_{X}(z) F_{Y}(z)
  3. XXYY 独立同分布,分布函数 F(x)F(x)
    FZ(z)=P(Zz)=F(z,z)=FX(z)FY(z)={F(z)}2F_{Z}(z)=P(Z \leq z)=F(z, z)=F_{X}(z) F_{Y}(z)=\{F(z)\}^{2}

极小值分布:已知 (X,Y)(X,Y) 的分布,求 Z=min(X,Y)Z=\min (X, Y) 的分布

  1. 已知 (X,Y)(X,Y) 的分布函数 F(X,Y)F(X,Y)
    FZ(z)=P(Zz)=P(max(X,Y)z)=1P(Xz,Yz)F_{Z}(z)=P(Z \leq z)=P(\max (X, Y) \leq z)=1-P(X \geq z, Y \geq z)
  2. XXYY 独立,分布函数 FX(x),FY(y)F_{X}(x), F_{Y}(y)
    FZ(z)=P(Zz)=1P(Xz,Yz)=1P(X>z)P(Y>z)=1((1FX(z))(1FY(z)))\begin{aligned}F_{Z}(z)&= P(Z \leq z) \\ &= 1-P(X \geq z, Y \geq z) \\ &=1-P(X>z) P(Y>z) \\ &=1-((1-F_{X}(z))(1-F_{Y}(z)))\end{aligned}

第四章 随机变量的数字特征

数学期望

定义

设离散型随机变量 XX 的分布列为 P(X=xi)=pi,i=1,2P\left(X=x_{i}\right)=p_{i},\, i=1,2 \ldots,若级数 i=1xipi\displaystyle\sum_{i=1}^{\infty} x_{i} p_{i} 绝对收敛,则称 EX=i=1xipiE X=\displaystyle\sum_{i=1}^{\infty} x_{i} p_{i}XX 的数学期望(期望).若 i=1xipi\displaystyle\sum_{i=1}^{\infty}\left|x_{i}\right| p_{i} 不收敛,则称 XX 期望不存在或无穷大.

设连续型随机变量 XX 的密度函数为 f(x)f(x),若积分 +xf(x)dx\displaystyle\int_{-\infty}^{+\infty} x f(x) \, \mathrm{d} x 绝对收敛,则称 EX=+xf(x)dxE X=\displaystyle\int_{-\infty}^{+\infty} x f(x) \, \mathrm{d} xXX 的数学期望(期望).若 +xf(x)dx\displaystyle\int_{-\infty}^{+\infty} |x| f(x) \, \mathrm{d} x 不收敛,则称 XX 期望不存在或无穷大.

性质

  1. Ec=cE c = c,其中 cc 为常数
  2. E(cX)=cEXE(cX) = cEX
  3. E(aX+b)=aE(X)+bE(a X+b)=a E(X)+b
  4. E(X±Y)=EX±EYE(X \pm Y)=E X \pm E Y
  5. XXYY 独立时,有 E(XY)=E(X)E(Y)E(X Y)=E(X) E(Y)
  6. E(X)=E(1ni=1nXi)=EXE(\overline{X})=E\left(\displaystyle\frac{1}{n} \sum_{i=1}^{n} X_{i}\right)=E XX\overline{X} 为样本均数

常用分布的数学期望

  1. XB(n,p)E(X)=npX \sim B(n, p) \quad E(X)=n p
  2. XP(λ)E(X)=λX \sim P(\lambda) \quad E(X)=\lambda
  3. XG(p)E(X)=1/pX \sim G(p) \quad E(X)=1 / p
  4. XU(a,b)E(X)=a+b2X \sim U(a, b) \quad E(X)=\displaystyle\frac{a+b}{2}
  5. Xe(λ)E(X)=1λX \sim e(\lambda) \quad E(X)=\displaystyle\frac{1}{\lambda}
  6. XN(μ,σ2)E(X)=μX \sim N\left(\mu, \sigma^{2}\right) \quad E(X)=\mu

方差

定义

XX 是随机变量,若期望 E(XE(X))2E(X-E(X))^{2} 存在,则称其为 XX 的方差,记为 D(X)=E(XE(X))2D(X)=E(X-E(X))^{2}

标准差:σX=D(X)=E(XE(X))2\sigma_{X}=\sqrt{D(X)}=\sqrt{E(X-E(X))^{2}}

D(X)=E(X2)(EX)2D(X)=E(X^{2})-(E X)^{2}

性质

  1. D(c)=0D(c) = 0,其中 cc 为常数
  2. D(cX)=c2D(X)D(c X)=c^{2} D(X)
  3. D(aX+b)=a2D(X)D(a X+b)=a^{2} D(X)
  4. D(X±Y)=DX+DY±2E(XEX)(YEY)D(X \pm Y) = D X + D Y \pm 2 E(X-E X)(Y-E Y)
  5. XXYY 独立,E(XY)=E(X)E(Y)E(X Y)=E(X) E(Y),则 D(X±Y)=DX+DYD(X \pm Y) = D X + D Y
  6. D(X)=D(X)nD(\overline{X})=\displaystyle\frac{D(X)}{n}X\overline{X} 为样本均数

标准化的随机变量:X=XE(X)D(X)X^{*}=\displaystyle\frac{X-E(X)}{\sqrt{D(X)}},有 E(X)=0,D(X)=1E\left(X^{*}\right)=0, D\left(X^{*}\right)=1

常用分布的方差

  1. XB(n,p)D(X)=np(1p)X \sim B(n, p) \quad D(X)=np(1-p)
  2. XP(λ)D(X)=λX \sim P(\lambda) \quad D(X)=\lambda
  3. XG(p)D(X)=qp2X \sim G(p) \quad D(X)=\displaystyle\frac{q}{p^2}
  4. XU(a,b)D(X)=(ba)212X \sim U(a, b) \quad D(X)=\displaystyle\frac{(b-a)^{2}}{12}
  5. Xe(λ)D(X)=1λ2X \sim e(\lambda) \quad D(X)=\displaystyle\frac{1}{\lambda^{2}}
  6. XN(μ,σ2)D(X)=σ2X \sim N\left(\mu, \sigma^{2}\right) \quad D(X)=\sigma^{2}

协方差和相关系数

定义

(X,Y)(X,Y) 为二维随机变量,若 E((XEX)(YEY))E((X-E X)(Y-E Y)) 存在,则称其为随机变量 XXYY 的协方差,记为 Cov(X,Y)\operatorname{Cov}(X, Y),称 ρXY=Cov(X,Y)D(X)D(Y)\rho_{X Y}=\displaystyle\frac{\operatorname{Cov}(X, Y)}{\sqrt{D(X)} \sqrt{D(Y)}} 为随机变量 XXYY 的相关系数.

Cov(X,Y)=E(XY)E(X)E(Y)\operatorname{Cov}(X, Y)=E(X Y) - E(X)E(Y)

性质

协方差的性质:

  1. Cov(X,Y)=Cov(Y,X)\operatorname{Cov}(X, Y)=\operatorname{Cov}(Y, X)
  2. Cov(X,X)=D(X)\operatorname{Cov}(X, X)=D(X)
  3. XXYY 独立,则 Cov(X,Y)=0\operatorname{Cov}(X, Y)=0
  4. Cov(X,b)=0\operatorname{Cov}(X, b)=0
  5. Cov(aX,bY)=abCov(X,Y)\operatorname{Cov}(a X, b Y)=a b \operatorname{Cov}(X, Y)a,ba,b 为常数
  6. Cov(X1±X2,Y)=Cov(X1,Y)±Cov(X2,Y)\operatorname{Cov}\left(X_{1} \pm X_{2}, Y\right)=\operatorname{Cov}\left(X_{1}, Y\right) \pm \operatorname{Cov}\left(X_{2}, Y\right)
  7. Cov(aX+b,Y)=aCov(X,Y)+Cov(b,Y)=aCov(X,Y)\operatorname{Cov}(a X+b, Y)=a \operatorname{Cov}(X, Y)+\operatorname{Cov}(b, Y)=a \operatorname{Cov}(X, Y)
  8. D(aX+bY)=a2D(X)+b2D(Y)+2abCov(X,Y)D(a X+b Y)=a^{2} D(X)+b^{2} D(Y)+2 a b \operatorname{Cov}(X, Y)

相关系数的性质:

  1. ρXY1\left|\rho_{X Y}\right| \leq 1
  2. ρXY=1Y=aX+b\left|\rho_{X Y}\right|=1 \Leftrightarrow Y=a X+ba,ba,b 为常数,且 a0a \neq 0
  3. {ρXY=1,XY完全相关ρXY>0,XY正相关ρXY<0,XY负相关ρXY=0,XY不相关\begin{cases}\left| \rho_{X Y} \right| = 1, \quad & X \text{与} Y \text{完全相关}\\ \rho_{X Y} \gt 0, \quad & X \text{与} Y \text{正相关}\\ \rho_{X Y} \lt 0, \quad & X \text{与} Y \text{负相关}\\ \rho_{X Y} = 0, \quad & X \text{与} Y \text{不相关}\end{cases}

相关与独立

XXYY 独立 \langle \begin{array}{l}{\Rightarrow} \\ {\nLeftarrow}\end{array}\rangle XXYY 不相关

二维正态分布的相关与独立

(X,Y)N(μ1,μ2,σ12,σ22,ρ)(X, Y) \sim N\left(\mu_{1}, \mu_{2}, \sigma_{1}^{2}, \sigma_{2}^{2}, \rho\right)

Cov(X,Y)=ρσ1σ2,ρXY=ρ\operatorname{Cov}(X, Y)=\rho \sigma_{1} \sigma_{2},\quad\rho_{X Y}=\rho

其他数字特征

kk 阶原点矩:E(Xk)E(X^{k})kk 阶中心矩:E((XEX)k)E((X-E X)^{k})

协方差矩阵

第五章 大数定律和中心极限定理

一个定义

依概率收敛:Y1,Y2,YnY_{1}, Y_{2}, \dots Y_{n} \dots 是一个随机变量列,aa 是常数,如果对于任意给定的 ε>0\varepsilon>0,有:
limnP(Yna<ε)=1\lim _{n \rightarrow \infty} P\left(\left|Y_{n}-a\right|<\varepsilon\right)=1
则称随机变量列 YnY_{n} 依概率收敛于 aa,记为 YnPaY_{n} \stackrel{P}{\longrightarrow} a

三个大数定律

切比雪夫大数定律

伯努利大数定律

辛钦大数定律

X1,X2,XnX_{1}, X_{2}, \dots X_{n} \dots 是独立同分布的随机变量列,EXi=μE X_{i}=\mu 存在,构造 Xn=1ni=1nXi\overline{X}_{n}=\displaystyle\frac{1}{n} \sum_{i=1}^{n} X_{i},有 EXn=μE \overline{X}_{n}=\mu,则对 ε>0\forall \varepsilon>0,有 limnP(Xnμ<ε)=1\lim _{n \rightarrow \infty} P\left(\left|\overline{X}_{n}-\mu \right|<\varepsilon\right)=1XnPμ\overline{X}_{n} \stackrel{P}{\longrightarrow} \mu

两个中心极限定理

独立同分布的中心极限定理

X1,X2,XnX_{1}, X_{2}, \dots X_{n} \dots 是独立同分布的随机变量列,EXi=μ,DXi=σ2E X_{i}=\mu, D X_{i}=\sigma ^{2},则对任意的 xRx\in R,有limn+P(i=1nXinμnσx)=Φ(x)\lim _{n \rightarrow+\infty} P\left(\frac{\sum_{i=1}^{n} X_{i}-n \mu}{\sqrt{n} \sigma} \leq x\right)=\Phi(x)

i=1nXin+N(nμ,nσ2)\sum_{i=1}^{n} X_{i} \underset{n \rightarrow+\infty}{\sim} N\left(n \mu, n \sigma^{2}\right)

任意试验,经大量独立重复,叠加在一起,均服从正态分布

棣莫弗-拉普拉斯中心极限定理

二项分布的极限分布是正态分布

B(n,p)n+{P(λ),p,1p0,1附近N(np,np(1p)),p,1p1/2附近,在0,1附近需要n很大B(n,p)\underset{n\rightarrow +\infty}{\sim}\begin{cases}P(\lambda), \quad & p,1-p \,\text{在}\, 0,1 \, \text{附近}\\N(n p,n p (1-p)), \quad & p,1-p \,\text{在}\, 1/2 \,\text{附近,在}\, 0,1 \, \text{附近需要} \, n \, \text{很大}\end{cases}

第六章 数理统计的基本概念

统计的基本概念

总体:研究对象观察值的全体

个体:每一个观察值

样本:从总体中抽取的部分个体

简单随机样本(样本):总体中每一个个体有同等机会被抽到,每次抽取独立进行,各个体值互不影响

样本 X1,X2,XnX_{1}, X_{2}, \dots X_{n} 的联合分布

  1. 离散型:总体 XX 的分布列 P(X=xi)=pi,i=1,2,P\left(X=x_{i}\right)=p_{i}, \quad i=1,2, \dots,样本 X1,X2,XnX_{1}, X_{2}, \dots X_{n} 的联合分布列:P(X1=x1,X2=x2,Xn=xn)=i=1nP(X=xi)P\left(X_{1}=x_{1}, X_{2}=x_{2}, \dots X_{n}=x_{n}\right) = \prod_{i=1}^{n} P\left(X=x_{i}\right)
  2. 连续型:总体 XX 的分布密度 f(x)f(x),样本 X1,X2,XnX_{1}, X_{2}, \dots X_{n} 的联合分布密度:f(x1,x2,xn)=f1(x1)f2(x2)fn(xn)=i=1nf(xi)f\left(x_{1}, x_{2}, \dots x_{n}\right)=f_{1}\left(x_{1}\right) f_{2}\left(x_{2}\right) \dots f_{n}\left(x_{n}\right)=\prod_{i=1}^{n} f\left(x_{i}\right)
  3. 连续型:总体 XX 的分布函数 F(x)F(x),样本 X1,X2,XnX_{1}, X_{2}, \dots X_{n} 的联合分布密度:F(x1,x2,xn)=F1(x1)F2(x2)Fn(xn)=i=1nF(xi)F\left(x_{1}, x_{2}, \ldots x_{n}\right)=F_{1}\left(x_{1}\right) F_{2}\left(x_{2}\right) \dots F_{n}\left(x_{n}\right)=\prod_{i=1}^{n} F\left(x_{i}\right)

统计量:设 X1,X2,XnX_{1}, X_{2}, \dots X_{n} 是总体 XX 的一个样本,若 T=T(X1,X2Xn)T=T\left(X_{1}, X_{2} \dots X_{n}\right) 是样本的函数,且不含任何未知参数,则称 TT 为统计量

X1,X2,XnX_{1}, X_{2}, \dots X_{n} 是总体 XX 的一个样本,称统计量 X=1ni=1nXi\overline{X} = \frac{1}{n}\sum_{i=1}^{n}X_{i}样本均值S2=1n1i=1n(XiX)2S^{2} = \frac{1}{n-1}\sum_{i=1}^{n}(X_{i}-\overline{X})^{2}样本方差S=1n1i=1n(XiX)2S = \sqrt{\frac{1}{n-1}\sum_{i=1}^{n}(X_{i}-\overline{X})^{2}}样本标准差Ak=1ni=1nxikA_{k}=\frac{1}{n}\sum_{i=1}^{n}x_{i}^{k}样本 kk 阶原点矩X(n)=max{X1,X2,Xn}X_{(n)}=\max\{X_{1}, X_{2},\dots X_{n}\}极大次序统计量X(l)=min{X1,X2,Xn}X_{(l)}=\min\{X_{1}, X_{2},\dots X_{n}\}极小次序统计量

统计量的分布

标准正态分布

XN(μ,σ2)X \sim N(\mu, \sigma^{2})

χ2(n)\chi^{2}(n) 分布

定义

X1,X2,XnX_{1}, X_{2}, \dots X_{n} 独立同分布,XiN(0,1),i=1,2nX_{i} \sim N(0,1), i=1,2 \dots n,则 i=1nXi2χ2(n)\sum_{i=1}^{n} X_{i}^{2} \sim \chi^{2}(n)

性质
  1. 可加性:两个变量 χ2(n)\chi^{2}(n)χ2(m)\chi^{2}(m) 相互独立,则 χ2(n)+χ2(m)χ2(m+n)\chi^{2}(n)+\chi^{2}(m) \sim \chi^{2}(m+n)
  2. Xχ2(n)X \sim \chi^{2}(n),则 E(χ2(n))=n,D(χ2(n))=2nE\left(\chi^{2}(n)\right)=n, D\left(\chi^{2}(n)\right)=2 n

tt 分布

定义

XN(0,1),Yχ2(n)X \sim N(0,1), Y \sim \chi^{2}(n)XXYY 独立,则称 t=XY/nt=\frac{X}{\sqrt{Y / n}} 服从自由度为 nntt 分布,记为 t(n)t(n)

性质
  1. 关于 yy 轴对称
  2. t(n)nN(0,1)t(n) \stackrel{n \rightarrow \infty}{\longrightarrow} N(0,1)
    一般地,当 n>45n \gt 45 时认为 t(n)=N(0,1)t(n)=N(0,1)

FF 分布

定义

Xχ2(n),Yχ2(m)X \sim \chi^{2}(n), Y \sim \chi^{2}(m)XXYY 独立,则称 F=X/nY/mF=\frac{X/n}{Y/m} 服从自由度为 n,mn,mFF 分布,记为 F(n,m)F(n,m)

性质
  1. XF(n,m)X \sim F(n,m),则 1XF(m,n)\displaystyle \frac{1}{X} \sim F(m,n)
  2. tt(n)t \sim t(n),则 t2F(1,n)t^{2} \sim F(1,n)
  3. F1α(n,m)=1Fα(m,n)F_{1-\alpha}(n,m) = \displaystyle \frac{1}{F_{\alpha}(m,n)}

正态总体的抽样分布

单正态总体的抽样分布定理

设总体 XN(μ,σ2)X \sim N(\mu, \sigma^{2})X1,X2,,XnX_{1}, X_{2}, \dots, X_{n} 为总体 XX 的简单随机样本,样本均值 X=1ni=1nXi\displaystyle \overline{X} = \frac{1}{n} \sum^{n}_{i=1}X_{i},样本方差 S2=1n1i=1n(XiX)2\displaystyle S^{2}=\frac{1}{n-1}\sum^{n}_{i=1}(X_{i}-\overline{X})^{2},则有

  1. Xμσ/nN(0,1)\displaystyle \frac{\overline{X}-\mu}{\sigma / \sqrt{n}} \sim N(0,1)
  2. (n1)S2σ2χ2(n1)\displaystyle \frac{(n-1) S^{2}}{\sigma^{2}} \sim \chi^{2}(n-1),且 X\overline{X}S2S^{2} 相互独立;
  3. XμS/nt(n1)\displaystyle \frac{\overline{X}-\mu}{S / \sqrt{n}} \sim t(n-1)

双正态总体的抽样分布定理

设总体 XN(μ1,σ12)X \sim N(\mu_{1}, \sigma_{1}^{2}) 与总体 YN(μ2,σ22)Y \sim N(\mu_{2}, \sigma_{2}^{2}) 相互独立,X1,X2,,XnX_{1}, X_{2}, \dots, X_{n}Y1,Y2,,YmY_{1}, Y_{2}, \dots, Y_{m} 分别为总体 XXYY 的简单随机样本,X,Y,S12,S22\overline{X}, \overline{Y}, S_{1}^{2}, S_{2}^{2} 分别表示 XXYY 的样本均值与样本方差,则有

  1. (XY)(μ1μ2)μ12n+μ22mN(0,1)\displaystyle \frac{(\overline{X}-\overline{Y})-(\mu_{1}-\mu_{2})}{\displaystyle\sqrt{\frac{\mu_{1}^{2}}{n}+\frac{\mu_{2}^{2}}{m}}}\sim N(0,1)
  2. S12S22σ22σ12F(n1,m1)\displaystyle \frac{S_{1}^{2}}{S_{2}^{2}} \cdot \frac{\sigma_{2}^{2}}{\sigma_{1}^{2}} \sim F(n-1,m-1)
  3. σ12=σ22\sigma_{1}^{2} = \sigma_{2}^{2},则 (XY)(μ1μ2)Sω1n+1mt(n+m2)\frac{(\overline{X}-\overline{Y})-(\mu_{1}-\mu_{2})}{S_{\omega}\displaystyle\sqrt{\frac{1}{n}+\frac{1}{m}}} \sim t(n+m-2) 其中 Sω=(n1)S12+(m1)S22n+m2S_{\omega} = \sqrt{\frac{(n-1)S_{1}^{2}+(m-1)S_{2}^{2}}{n+m-2}}

抽样分布的上 α\alpha 分位点

定义 1 设随机变量 ZN(0,1)Z \sim N(0,1),若对 α(0,1)\alpha \in (0,1),实数 zαz_{\alpha} 满足 P(Z>zα)=αP(Z\gt z_{\alpha})=\alpha 则称点 zαz_{\alpha} 为标准正态分布的上 α\alpha 分位点.易知 z1α=zαz_{1-\alpha} = -z_{\alpha}

定义 2 设随机变量 χ2χ2(n)\chi^{2} \sim \chi^{2}(n),若对 α(0,1)\alpha \in (0,1),实数 χα2(n)\chi^{2}_{\alpha}(n) 满足 P(χ2>χα2(n))=αP(\chi^{2} \gt \chi^{2}_{\alpha}(n))=\alpha 则称点 χα2(n)\chi^{2}_{\alpha}(n)χ2(n)\chi^{2}(n) 的上 α\alpha 分位点.易知 P(χ2χ1α2(n))=αP(\chi^{2} \leq \chi^{2}_{1-\alpha}(n))=\alpha

定义 3 设随机变量 tt(n)t \sim t(n),若对 α(0,1)\alpha \in (0,1),实数 tα(n)t_{\alpha}(n) 满足 P(t>tα(n))=αP(t \gt t_{\alpha}(n))=\alpha 则称点 tα(n)t_{\alpha}(n)t(n)t(n) 的上 α\alpha 分位点.类似于标准正态分布,有 t1α(n)=tα(n)t_{1-\alpha}(n) = -t_{\alpha}(n)

定义 4 设随机变量 FF(n,m)F \sim F(n,m),若对 α(0,1)\alpha \in (0,1),实数 Fα(n,m)F_{\alpha}(n,m) 满足 P(F>Fα(n,m))=αP(F \gt F_{\alpha}(n,m))=\alpha 则称点 Fα(n,m)F_{\alpha}(n,m)F(n,m)F(n,m) 的上 α\alpha 分位点.利用 FF 分布的性质,容易证明 F1α(n,m)=1Fα(n,m)F_{1-\alpha}(n,m) = \frac{1}{F_{\alpha}(n,m)}

定义 5(统一定义)YY 为一个连续型随机变量,若对 α(0,1)\alpha \in (0,1),实数 YαY_{\alpha} 满足 P(Y>Yα)=αP(Y\gt Y_{\alpha})=\alpha 则称点 YαY_{\alpha}YYα\alpha 分位点.容易得到

  1. P(Y>Yα)=αP(Y\gt Y_{\alpha})=\alpha
  2. P(Y<Y1α)=αP(Y\lt Y_{1-\alpha})=\alpha
  3. P(Y<Y1α/2 或 Y>Yα/2)=αP(Y\lt Y_{1-\alpha/2} \text{ 或 } Y\gt Y_{\alpha / 2})=\alpha
  4. P(Y<Yα)=1αP(Y\lt Y_{\alpha})=1-\alpha
  5. P(Y>Y1α)=1αP(Y\gt Y_{1-\alpha})=1-\alpha
  6. P(Y1α/2<Y<Yα/2)=1αP(Y_{1-\alpha/2} \lt Y\lt Y_{\alpha/2})=1-\alpha

使用前三个等式处理假设检验问题,使用后三个等式处理区间估计问题.

第七章 参数的点估计及其优良性

设总体 XX 的分布函数 F(x;θ)F(x; \theta) 形式已知,其中含有未知参数 θ\theta.为了估计参数 θ\theta,首先从总体 XX 中抽取样本 X1,X2,,XnX_{1}, X_{2}, \dots, X_{n},然后按照一定的方法(矩估计法、极大似然估计法)构造合适的统计量 g(X1,X2,,Xn)g(X_{1}, X_{2}, \dots, X_{n}) 作为 θ\theta 的估计量,记为 θ^=g(X1,X2,,Xn)\hat{\theta}=g\left(X_{1}, X_{2}, \dots, X_{n}\right).代入样本观测值 x1,x2,,xnx_{1}, x_{2}, \dots, x_{n},即得到 θ\theta 的估计值 θ^=g(x1,x2,,xn)\hat{\theta}=g\left(x_{1}, x_{2}, \dots, x_{n}\right)

矩估计

设总体 XX 的分布函数为 F(x,θ1,θ2,,θt)F(x, \theta_{1}, \theta_{2}, \dots, \theta_{t})θ1,θ2,,θt\theta_{1}, \theta_{2}, \dots, \theta_{t} 为待估参数,X1,X2,,XnX_{1}, X_{2}, \dots, X_{n} 是样本,构造前 tt 阶样本矩 Ak=1ni=1nXik,k=1,2,,tA_{k} = \displaystyle \frac{1}{n} \sum^{n}_{i=1}X_{i}^{k},\,k=1,2,\dots,t,求出前 tt 阶总体矩 EXk,k=1,2,,tE X^{k},\,k=1,2,\dots,t(是待估参数的函数),由大数定律知,当 n+n\rightarrow +\infty 时,样本矩依概率收敛于总体矩,即 {A1A2At(由大数定律)P{EX=μ1(θ1,θ2,,θt)EX2=μ2(θ1,θ2,,θt)EXt=μ3(θ1,θ2,,θt)\begin{cases}A_{1} \\ A_{2} \\ \dots \\ A_{t} \end{cases} \xrightarrow[\text{(由大数定律)}]{P} \begin{cases}E X = \mu_{1}(\theta_{1}, \theta_{2}, \dots, \theta_{t}) \\ E X^{2} = \mu_{2}(\theta_{1}, \theta_{2}, \dots, \theta_{t}) \\ \dots \\ E X^{t} = \mu_{3}(\theta_{1}, \theta_{2}, \dots, \theta_{t}) \end{cases}Ak=EXk,k=1,2,,tA_{k} = E X^{k}, \, k=1,2,\dots,t,得 {A1=μ1(θ^1,θ^2,,θ^t)A2=μ2(θ^1,θ^2,,θ^t)At=μt(θ^1,θ^2,,θ^t)\begin{cases}A_{1} = \mu_{1}(\hat{\theta}_{1}, \hat{\theta}_{2}, \dots, \hat{\theta}_{t}) \\ A_{2} = \mu_{2}(\hat{\theta}_{1}, \hat{\theta}_{2}, \dots, \hat{\theta}_{t}) \\ \dots \\ A_{t} = \mu_{t}(\hat{\theta}_{1}, \hat{\theta}_{2}, \dots, \hat{\theta}_{t})\end{cases} 从中解出 θ^1,θ^2,,θ^t\hat{\theta}_{1}, \hat{\theta}_{2}, \dots, \hat{\theta}_{t} 即可.

关于矩估计的几个问题

  1. 大样本精确,小样本不可用;
  2. Ak=EXkA_{k}=E X^{k}Bk=E(XE(X))kB_{k}=E(X-E(X))^{k},阶数要相同;
  3. 使用前 tt 阶矩,如果有前 tt 阶矩为零,顺延
  4. 矩估计缺点:总体矩必须存在,且浪费了分布的信息.

极大似然估计

定义X1,X2,,XnX_{1}, X_{2}, \dots, X_{n} 为来自总体 XX 的简单随机样本,x1,x2,,xnx_{1}, x_{2}, \dots, x_{n} 为样本观测值.称 L(θ)=i=1np(xi,θ)L(\theta)=\prod_{i=1}^{n} p(x_{i}, \theta) 为参数 θ\theta似然函数.其中,当总体 XX 为离散型随机变量时,p(xi,θ)p(x_{i}, \theta) 表示 XX 的分布列 P(X=xi)P(X = x_{i});当总体 XX 为连续型随机变量时,p(xi,θ)p(x_{i}, \theta) 表示 XX 的密度函数 f(x)f(x)xix_{i} 处的取值.

参数 θ\theta 的似然函数 L(θ)L(\theta) 实际上就是样本 X1,X2,,XnX_{1}, X_{2}, \dots, X_{n} 恰好取观测值 x1,x2,,xnx_{1}, x_{2}, \dots, x_{n}(或其邻域)的概率.

定义L(θ)=i=1np(xi,θ)L(\theta)=\displaystyle\prod_{i=1}^{n} p(x_{i}, \theta) 为参数 θ\theta 的似然函数,若存在一个只与样本观测值 x1,x2,,xnx_{1}, x_{2}, \dots, x_{n} 有关的实数 θ^(x1,x2,,xn)\hat{\theta}(x_{1}, x_{2}, \dots, x_{n}),使得 L(θ^)=maxL(θ)L(\hat{\theta}) = \max L(\theta) 则称 θ^(x1,x2,,xn)\hat{\theta}(x_{1}, x_{2}, \dots, x_{n}) 为参数 θ\theta最大似然估计值,称 θ^(X1,X2,,Xn)\hat{\theta}(X_{1}, X_{2}, \dots, X_{n}) 为参数 θ\theta最大似然估计量

点估计优良性的评定标准

无偏性

若参数 θ\theta 的估计量 θ^=θ^(X1,X2Xn)\hat{\theta}=\hat{\theta}\left(X_{1}, X_{2} \cdots X_{n}\right) 满足 E(θ^)=θE(\hat{\theta})=\theta 则称 θ^\hat{\theta}θ\theta 的一个无偏估计量,否则就称为有偏估计量.

有效性

θ^1\hat{\theta}_{1}θ^2\hat{\theta}_{2} 都是 θ\theta 的无偏估计量,如果 D(θ^1)<D(θ^2)D\left(\hat{\theta}_{1}\right) \lt D\left(\hat{\theta}_{2}\right) 则称 θ^1\hat{\theta}_{1}θ^2\hat{\theta}_{2} 有效.

一致性(相合性)

θ^n=θ^(X1,X2,,Xn)\hat{\theta}_{n}=\hat{\theta}\left(X_{1}, X_{2}, \dots, X_{n}\right)θ\theta 的一个估计量,若对于任意的 ε>0\varepsilon \gt 0,有 limnP(θ^nθ<ε)=1\lim _{n \rightarrow \infty} P\left(\left|\hat{\theta}_{n}-\theta\right|<\varepsilon\right)=1θ^nPθ\hat{\theta}_{n} \xrightarrow{P} \theta,则称 θ^n\hat{\theta}_{n}θ\theta一致估计量(或称相合估计量

矩估计都是一致估计,极大似然估计不一定是一致估计.

第八章 参数的区间估计与假设检验

区间估计

设总体 XX 的分布函数为 F(x;θ)F(x; \theta),其中 θ\theta 为未知参数,X1,X2,,XnX_{1}, X_{2}, \dots, X_{n} 为来自总体的简单随机样本.对于给定的 a(0,1)a \in (0,1),如果由样本确定的两个统计量 T1(X1,X2,,Xn)T_{1}(X_{1}, X_{2}, \dots, X_{n})T2(X1,X2,,Xn)T_{2}(X_{1}, X_{2}, \dots, X_{n}) 满足 P(T1θT2)=1αP(T_{1} \leq \theta \leq T_{2})=1-\alpha 则称随机区间 [T1,T2][T_{1}, T_{2}] 是参数 θ\theta 的置信度(或置信水平)为 1α1-\alpha置信区间
如果统计量 T(X1,X2,,Xn)T(X_{1}, X_{2}, \dots, X_{n}) 满足 P(θT)=1α(或 P(θT)=1αP(\theta \leq T) = 1- \alpha \, \text{(或 } P(\theta \geq T) = 1- \alpha \text{)} 则称 TT 是参数 θ\theta单侧置信上限(或单侧置信下限).

求置信区间的一般步骤

  1. 确定 θ\theta 的估计量 θ^\hat{\theta}
  2. 确定 θ^\hat{\theta} 的分布
  3. 确定 θ^\hat{\theta} 分布的非小概率区间
  4. θ^\hat{\theta} 分布的非小概率区间中解出 θ\theta

假设检验

假设的基本概念

  1. 建立假设
    • 双侧检验
      原假设:H0:θ=θ0H_{0}: \theta = \theta_{0}
      备择假设:H1:θθ0H_{1}: \theta \neq \theta_{0}
    • 单侧检验
      左侧检验:H0:θ=θ0H_{0}: \theta = \theta_{0}H1:θ<θ0H_{1}: \theta \lt \theta_{0}(有充分的理由认为 θ>θ0\theta \gt \theta_{0} 一定不发生)
      右侧检验:H0:θ=θ0H_{0}: \theta = \theta_{0}H1:θ>θ0H_{1}: \theta \gt \theta_{0}(有充分的理由认为 θ<θ0\theta \lt \theta_{0} 一定不发生)
  2. 判断准则
    X1,X2,,XnX_{1}, X_{2}, \dots, X_{n} 为总体 XX 的一个样本,构造相应统计量 g(X1,X2,,Xn)g(X_{1}, X_{2}, \dots, X_{n}),将 g(X1,X2,,Xn)g(X_{1}, X_{2}, \dots, X_{n}) 的样本空间分成两部分:
    • 拒绝域(小概率事件区域):样本点落入拒绝域拒绝 H0H_{0},接受 H1H_{1}
    • 接受域(非小概率事件区域、置信区间):若样本点没落入拒绝域,则只能接受 H0H_{0}
  3. 判断的基本原理
    小概率事件原则:认为小概率事件在一次抽样试验中不会发生.

两类错误

  1. 第一类错误(弃真):当 H0H_{0} 实际上为真时,检验结果却是拒绝 H0H_{0}.犯第一类错误的概率即为显著性水平 α\alpha,即 P(拒绝 H0H0 为真)=αP(\text{拒绝 }H_{0}|H_{0}\text{ 为真})=\alpha
  2. 第二类错误(采伪):当 H0H_{0} 实际上为不真时,检验结果却是接受 H0H_{0}.犯第二类错误的概率通常记为 β\beta,即 P(接受 H0H0 不真)=βP(\text{接受 }H_{0}|H_{0}\text{ 不真})=\beta

显著性检验:控制第一类错误 α\alpha 的大小.

假设检验的基本步骤

  1. 根据实际问题建立假设,常见的四个问题:{μ 与 μ0 是否一致σ2 与 σ02 是否一致μ1 与 μ2 是否一致σ12 与 σ22 是否一致\left\{\begin{aligned} \mu \text{ 与 } \mu_{0} \text{ 是否一致} \\ \sigma^{2} \text{ 与 } \sigma_{0}^{2} \text{ 是否一致} \\ \mu_{1} \text{ 与 } \mu_{2} \text{ 是否一致} \\ \sigma_{1}^{2} \text{ 与 } \sigma_{2}^{2} \text{ 是否一致} \end{aligned}\right.
  2. 选择统计量 {Z=Xμσ/nt=XμS/nχ2=(n1)S2σ2F=S12/S22σ12/σ22\left\{ \begin{aligned} \displaystyle Z&=\frac{\overline{X}-\mu}{\sigma / \sqrt{n}} \\ \displaystyle t&=\frac{\overline{X}-\mu}{S / \sqrt{n}} \\ \displaystyle \chi^{2}&=\frac{(n-1) S^{2}}{\sigma^{2}} \\ \displaystyle F&=\frac{S_{1}^{2} / S_{2}^{2}}{\sigma_{1}^{2} / \sigma_{2}^{2}}\end{aligned}\right.
  3. 计算统计量的值
  4. 确定拒绝域
  5. 结论

常用分布表

分布 分布列或密度函数 期望 方差
二项分布
XB(n,p)X \sim B(n, p)
0<p<10 < p < 1
P(X=k)=Cnkpkqnkk=0,1,2,,nP(X=k)=\mathrm{C}_{n}^{k} p^{k} q^{n-k} \\ k=0,1,2, \ldots, n npn p np(1p)n p(1-p)
泊松分布
XP(λ)X \sim P(\lambda)Xπ(λ)X \sim \pi(\lambda)
λ>0\lambda \gt 0
P(X=k)=λkk!eλk=0,1,2,P(X=k)=\displaystyle\frac{\lambda^{k}}{k !} e^{-\lambda} \\ k=0,1,2, \ldots λ\lambda λ\lambda
几何分布
XG(p)X \sim G(p)
p>0p>0
P(X=k)=p(1p)k1k=1,2,P(X=k)=p(1-p)^{k-1} \\ k=1,2, \ldots 1p\displaystyle\frac{1}{p} 1pp2\displaystyle\frac{1-p}{p^2}
指数分布
XE(λ)X \sim E(\lambda)Xe(λ)X \sim e(\lambda)
λ>0\lambda \gt 0
f(x)={λeλx,x>00,x0f(x)=\begin{cases}\lambda \mathrm{e}^{-\lambda x}, \quad & x \gt 0 \\0, & x \leq 0\end{cases} 1λ\displaystyle\frac{1}{\lambda} 1λ2\displaystyle\frac{1}{\lambda^{2}}
正态分布
XN(μ,σ2)X \sim N(\mu, \sigma ^2)
<μ<+,σ>0-\infty \lt \mu \lt +\infty, \sigma \gt 0
f(x)=12πσexp((xμ)22σ2)<x<+f(x)=\displaystyle\frac{1}{\sqrt{2 \pi} \sigma} \exp \left(-\frac{(x-\mu)^{2}}{2 \sigma^{2}}\right) \\ -\infty < x < +\infty μ\mu σ2\sigma^{2}

© 2019 倪可塑 保留所有权利。