[통계학] Transformations and Expectations

Random variable X로 cdf Fx(x)를 모델링한다. 

이 X의 함수로 distribution of Y=g(x)를 구해보자. 


ex) X={1,2,3,4,5,6}이고 Y=g(x)=2X라고 하면 Y={2,4,6,8,10}이다.

g(.)는 monotone increasing이다.



ex2) X~Unif(0,2ㅠ), Y=g(x)=sin(X)이라면 X={x:0<x<2ㅠ}이고 Y={y:-1<y<1}이다.


cdf는 step function으로 continuous한 pdf에 대해 설명할 수 있다.



X~Fx(x), Y=g(X). X and Y are supports of rv's X and Y.

-If g(.) is monotone increasing (u<v => g(u)<g(v))



-If g(.) is monotone decreasing (u<v => g(u)>g(v)) and X is continuous





Moments & MGF(Moments Generating Function)


The variance of a random variable X is its second central moment,



The positive square root of Var(X) is the standard deviation of X.



Let X be a discrete random variable that can take only the values 0,1,2... Then




Let X be a continuous random variable that can take only nonnegative values, x>=0. Then





적률생성함수는 x의 n제곱의 기댓값으로 정의되는 EX^n(모멘트)를 생성한다. 


적률(Moment) = E(X^n) 

1차 적률은 x의 기댓값, 2차 적률은 x의 제곱의 기댓값이다.  


양변을 t로 미분하고 t자리에 0을 넣으면 n차 적률이 나온다. 



Fx(x)와 Fy(y)가 두 cdf고 모두 moments가 존재한다. 

1. 두 cdf가 같다면 = distribution이 같다.

2. 두 mgf가 같다면 = cdf가 같다 = distribution이 같다.


이 원리를 통해 mgf를 구하는 것이다. 


즉, 두 확률변수의 적률생성함수가 같다면, 둘의 확률분포가 같다.



Theorem: (Convergence of mgfs) 

distribution도 converge한다. 

continuous한 Fx(x)의 모멘트들 Mx(t) 분포의 수렴은 cdf에 수렴한다. 


<중심 극한 정리> 

random variable : X1~Xn

summation Xi의 분포가 standardize하면 mgf에 수렴하다고 본다. 


정규분포의 적률생성함수와 표본평균의 적률생성함수가 같다. 

이를 통해 표본평균과 정규분포의 분포가 같다는 것이 증명된다. 


결론: "표본의 크기가 무한이 크다면, 모집단의 분포와 상관없이 표본평균의 분포는 정규분포를 따른다."