선형대수 | 해석학 | 통계학

[통계학] Transformations and Expectations

Random variable X로 cdf Fx(x)를 모델링한다. 

이 X의 함수로 distribution of Y=g(x)를 구해보자. 

 

ex) X={1,2,3,4,5,6}이고 Y=g(x)=2X라고 하면 Y={2,4,6,8,10}이다.

g(.)는 monotone increasing이다.

 

 

ex2) X~Unif(0,2ㅠ), Y=g(x)=sin(X)이라면 X={x:0<x<2ㅠ}이고 Y={y:-1<y<1}이다.

 

cdf는 step function으로 continuous한 pdf에 대해 설명할 수 있다.

 

Theorem:

X~Fx(x), Y=g(X). X and Y are supports of rv's X and Y.

-If g(.) is monotone increasing (u<v => g(u)<g(v))

 

 

-If g(.) is monotone decreasing (u<v => g(u)>g(v)) and X is continuous

 

 

 

 

Moments & MGF(Moments Generating Function)

 

The variance of a random variable X is its second central moment,

 

 

The positive square root of Var(X) is the standard deviation of X.

 

Theorem:

Let X be a discrete random variable that can take only the values 0,1,2... Then

 

 

 

Let X be a continuous random variable that can take only nonnegative values, x>=0. Then

 

 

 

Theorem:

적률생성함수는 x의 n제곱의 기댓값으로 정의되는 EX^n(모멘트)를 생성한다. 

 

적률(Moment) = E(X^n) 

1차 적률은 x의 기댓값, 2차 적률은 x의 제곱의 기댓값이다.  

 

양변을 t로 미분하고 t자리에 0을 넣으면 n차 적률이 나온다. 

 

Theorem:

Fx(x)와 Fy(y)가 두 cdf고 모두 moments가 존재한다. 

1. 두 cdf가 같다면 = distribution이 같다.

2. 두 mgf가 같다면 = cdf가 같다 = distribution이 같다.

 

이 원리를 통해 mgf를 구하는 것이다. 

 

즉, 두 확률변수의 적률생성함수가 같다면, 둘의 확률분포가 같다.

 

 

Theorem: (Convergence of mgfs) 

distribution도 converge한다. 

continuous한 Fx(x)의 모멘트들 Mx(t) 분포의 수렴은 cdf에 수렴한다. 

 

<중심 극한 정리> 

random variable : X1~Xn

summation Xi의 분포가 standardize하면 mgf에 수렴하다고 본다. 

 

정규분포의 적률생성함수와 표본평균의 적률생성함수가 같다. 

이를 통해 표본평균과 정규분포의 분포가 같다는 것이 증명된다. 

 

결론: "표본의 크기가 무한이 크다면, 모집단의 분포와 상관없이 표본평균의 분포는 정규분포를 따른다."