Random variable X로 cdf Fx(x)를 모델링한다.
이 X의 함수로 distribution of Y=g(x)를 구해보자.
ex) X={1,2,3,4,5,6}이고 Y=g(x)=2X라고 하면 Y={2,4,6,8,10}이다.
g(.)는 monotone increasing이다.
ex2) X~Unif(0,2ㅠ), Y=g(x)=sin(X)이라면 X={x:0<x<2ㅠ}이고 Y={y:-1<y<1}이다.
cdf는 step function으로 continuous한 pdf에 대해 설명할 수 있다.
Theorem:
X~Fx(x), Y=g(X). X and Y are supports of rv's X and Y.
-If g(.) is monotone increasing (u<v => g(u)<g(v))
-If g(.) is monotone decreasing (u<v => g(u)>g(v)) and X is continuous
Moments & MGF(Moments Generating Function)
The variance of a random variable X is its second central moment,
The positive square root of Var(X) is the standard deviation of X.
Theorem:
Let X be a discrete random variable that can take only the values 0,1,2... Then
Let X be a continuous random variable that can take only nonnegative values, x>=0. Then
Theorem:
적률생성함수는 x의 n제곱의 기댓값으로 정의되는 EX^n(모멘트)를 생성한다.
적률(Moment) = E(X^n)
1차 적률은 x의 기댓값, 2차 적률은 x의 제곱의 기댓값이다.
양변을 t로 미분하고 t자리에 0을 넣으면 n차 적률이 나온다.
Theorem:
Fx(x)와 Fy(y)가 두 cdf고 모두 moments가 존재한다.
1. 두 cdf가 같다면 = distribution이 같다.
2. 두 mgf가 같다면 = cdf가 같다 = distribution이 같다.
이 원리를 통해 mgf를 구하는 것이다.
즉, 두 확률변수의 적률생성함수가 같다면, 둘의 확률분포가 같다.
Theorem: (Convergence of mgfs)
distribution도 converge한다.
continuous한 Fx(x)의 모멘트들 Mx(t) 분포의 수렴은 cdf에 수렴한다.
<중심 극한 정리>
random variable : X1~Xn
summation Xi의 분포가 standardize하면 mgf에 수렴하다고 본다.
정규분포의 적률생성함수와 표본평균의 적률생성함수가 같다.
이를 통해 표본평균과 정규분포의 분포가 같다는 것이 증명된다.
결론: "표본의 크기가 무한이 크다면, 모집단의 분포와 상관없이 표본평균의 분포는 정규분포를 따른다."
'선형대수 | 해석학 | 통계학' 카테고리의 다른 글
[수리통계학]충분통계량(Sufficient Statistics) 정리 (0) | 2022.06.07 |
---|---|
[수리통계학]충분통계량(Sufficient Statistics) (0) | 2022.05.02 |
[통계학] Probability Theory (0) | 2022.03.23 |
[기초해석학] 실수의 특성 (0) | 2022.02.26 |
[선형대수/머신러닝] 머신러닝에 기초인 선형대수 정리 (0) | 2021.08.31 |