关于大二上学期概率论学的稀烂,期末复习知识不进脑子的那点事……

二项随机概率分布

b(x;n,p)代表事件总共发生n次,有x次成功,每次事件成功的概率是p,则事件成功的概率是多少,是Cnxpx(1p)1x

cdf (概率分布函数)

P(Xx)=B(x;n,p)=y=0xb(y;n,p)

这玩意实际运算的时候,可以查表orz..

均值和方差

对于二项分布X~Bin(n,p),均值E(x)=np,方差V(x)=np(1p),标准差σx=np(1p)

证明均值的过程:

Hypergeometric Distribution & Negative Binomial Distributions(超几何分布和负二项分布)

超几何分布

$P(X=x)=h(x;n,M,N)=\frac{出现x次的次数}{可能情况的次数}=\frac{CM^xC{N-M}^{n-x}}{C_N^n}$,表示总共N个物品,M个特定物品,抽取n次,抽到特定物品x次的概率。

期望和方差

E(x)=nMN

V(x)=(NnN1)nMN(1MN)

负二项分布

成功次数固定,实验次数不定

nb(x;r,p),表示x次失败,r次成功,单次成功概率是p,意味着x+r-1次实验之前,是r-1次成功,第x+r次必定成功

泊松分布

p(x;λ)=eλλxx!

当二项分布b(x;n,p)中n极大且p极小时,可以视为泊松分布p(x;λ)λ=np

均值和方差

都是λ

pdf(概率密度函数)

P(aXb)=abf(x)dx,也就是说,X在区间[a, b]中取某个值的概率是该区间上方和密度函数图下方的面积。f(x)的图形通常被称为密度曲线。

$P(X=c)=\intc^cf(x)dx=\lim{\varepsilon\rightarrow0}\int_{c-\varepsilon}^{c+\varepsilon}f(x)dx=0$。

P(aXb)=F(b)F(a),前提是求出概率分布函数F(x),这样可以不用积分辣,而且更直接的是:P(xa)=F(a)

如果x连续分布,概率密度函数f(x)和概率分布函数F(x)存在,且每一个x都存在一个对应的导数F’(x),则F(x)=f(x)

期望值与方差

$\mux=E(x)=\int{-\infty}^{+\infty}xf(x)dx$,

E[h(X)]=+h(x)f(x)dx,或者E[h(X)]=E(aX+b)=aE(x)+b

V(x)=E(x2)[E(x)]2

均匀分布

f(x;A,B)=1BA when AxB。另外的部分为0

正态分布

概率密度函数

f(x;μ,σ)=12πσe(xμ)2/(2σ)2

标准正态分布

f(z;0,1)=12πez2/2 <z<+

当拿到一个非标准化的正态分布时,通过找到z临界来还原标准正态分布,z=Xμσ,其中μ是期望,σ是标准差。

百分位数

这个就是一个查表的玩意,比如第67个百分位数,就在正态分布表查.6700,所对应的数就是第67个百分位数,是0.44,如果在两个中间,就取中间值。

z数

za的下标表示大于这个数的概率是a,它同时代表了100(1-a)个百分位,也叫z临界值。

指数分布

f(X;λ)={λeλx,x1\0,otherwise

均值和方差

E(X)=0xλeλxdx,这么算出来之后捏,是:

μ=1λσ2=1λ2。也就是说,无论是均值还是标准差,指数分布这俩是一样的。

概率分布函数

F(X;λ)={0,x<0\1eλx,x0

伽马函数

γ(a)=0xa1exdx

性质:

  • 对于任意a>1γ(a)=(a1)γ(a1)
  • 对于任意正整数n,γ(n)=(n1)!
  • γ(12)=π

伽马分布

就这样演变出了个新的分布:

f(x;α,β)={1βαγ(a)xα1ex/β,x0\0,otherwise

均值和方差

E(x)=αβ

V(x)=σ2=αβ2

概率分布函数

如果是标准的伽马函数,分布是这样的

F(x;a)=0xya1eyγ(a)dy

常见连续性分布的数学期望和方差

均匀分布

f(x)=1baa<=x<=b时,EX=a+b2DX=(ba)212

协方差:COV(x,y)

公式:

cov(x,y)=E(x,y)ExEy

$fx(x)=\int{-\infty}^{+\infty}f(x,y)dy$ x的范围

$fy(y)=\int{-\infty}^{+\infty}f(x,y)dx$ y的范围

E(x)=abxfx(x)dx a,b是x的范围

E(y)=abyfy(y)dy a,b概念同上

E(xy)=abcdxyf(x,y)dxdy 这是建立在x,y不独立的基础上的

E(xy)=E(x)E(y) 当x,y相互独立时期望算法

性质:

  • Cov(x,y)=Cov(y,x)
  • Cov(ax,by)=abCov(x,y)
  • Cov(x1+x2,y)=Cov(x1,y)+Cov(x2,y)
  • Cov(c,x)=0 常数和变量的协方差等于0
  • x,y独立,Cov(x,y)=0 ,但是协方差为0不能得出x,y独立

相关系数ρ

公式:

ρ=Cov(x,y)DxDy

Dx和Dy是方差,开根号就是标准差

这里有一个关于方差的公式:D(xy)=Dx+Dy2Cov(x,y)

性质:

ρ代表了线性关系的相关性,如果ρ=0则说明x,y不相关

|ρ|<1

|ρ|=1<=>xyp=1线 就是p(Y=aX+b)=1

独立和不相关

x,y独立意思是x和y之间没有关系,互不影响,而x,y不相关的意思是x和y之间没有线性关系(可能有非线性关系)

因此:

  • x,y独立意味着x,y不相关
  • x,y不相关不一定代表x,y独立

另外要想证明x,y独立,需要知道x,y独立的充要条件,即:

f(x,y)=fx(x)fy(y)

中心距与原点矩

定义:

原点矩:E(x)k 期望E(x)也叫一阶原点矩

离散:0ixikpi

连续:xkf(x)dx

中心距:E(xE(X))k

离散:(xiE(x))kpi

连续:(xE(x))kf(x)dx

  • 一阶中心距:E(xE(x))=E(x)E(x)=0
  • 二阶中心矩:E(xE(x))2 就是方差