본문 바로가기
수학/통계학

이산형 분포: 이산형 확률변수, 수학적 기댓값

by Cyber_ 2024. 9. 22.

이산형 확률변수

  • 이산형(discrete type): 실수의 부분집합인 1차원 공간 S를 갖는 확률변수를 X라 하자. 공간 S는 셀 수 있는 만큼의 점들을 포함하고 있다고 하자. 즉, 유한개이거나 혹은 S의 점들이 양의 정수와 1:1 대응관계를 가진다. 그런 집합 S를 이산 점들의 집합 또는 이산(discrete) 표본공간이라고한다. 게다가, 확률변수 X는 이산형 확률변수라고 하고, X는 이산형 분포를 갖는다고 한다.
  • 확률질량함수(probability mass function): 이산형 확률변수 X에 대해, 확률 P(X = x)는 종종 f(x) 혹은 pmf라 불리운다.
  • x $ x \in S $ 에 대해 , 확률 P(X = x) = f(x) > 0 이고 S가 X와 관련된 모든 확률을 포함하고 있기 때문에, S를 X의 공간뿐만 아니라 X의 받침 혹은 지지(support)라 한다.
  • 누적분포함수(cumulative distribution function)라 하고 간단히 cdf로 표현한다.

$$ F(x) = P(X \le x), -\infty < x < \infty $$

  • cdf는 종종 확률변수 X의 분포함수(distribution fucntion)이라 한다.
  • 어떤 pmf가 공간에서 상수일 때, 분포가 그 공간에서 균일(uniform)하다고 한다.
  • 확률변수 X의 pmf f(x)의 막대그래프(bar graph)는 S에 있는 각각의 x에서, (x,0)부터 [x, f(x0)]까지 이어진 수직선
  • 만일 X가 정숫값들로 구성되면, pmf f(x)의 확률히스토그램(probability histogram)은 밑변의 길이가 1이고 높이가 f(x)인 사각형으로 표현되는데, 여기에서 각 $x \in S$가 중심이 된다. 따라서 각 사각형의 면적은 해당되는 확률 f(x)와 같고, 확률히스토그램의 총 면적은 1이다.

  • X의 pmf f(x)에서 x값에 대응되는 관측된 상대도수를 음영 히스토그램으로 표현하고 그 위에 확률 히스토그램을 겹쳤을 때 점선으로 표현된 음영 히스토그램은 상대도수 히스토그램(relative requency histogram)이다.

 

정의

정의 1
표본공간 S를 갖는 확률실험이 주어졌을 때, 각 원소 $s \in S$에 오로지 하나의 실수 X(s) = x 를 대응시키는 함수 X를 확률변수라 한다. X의 공간은 실수의 집합 {x: X(s) = x, s $\in$ S}이고, s $\in$ S는 원소 s가 집합 S에 속함을 의미한다.

정의 2
이산형 확률변수 X의 확률질량함수 f(x)는 다음의 성질을 만족하는 함수이다.
(a) f(X) > 0, $x \in S$
(b) $\sum_{x \in S} f(x) = 1$
(c) $P(X \in A) = \sum_{x \in S} f(x) , A \subset S$

수학적 기댓값

확률분포의 중요한 특징을 요약할 때 매우 중요한 개념이 수학적 기댓값이다.

 

f(x) = (4 - x)/6, x = 1,2,3

일 때

수학적 기댓값은 다음과 같이 쓸 수 있다.

 

$$ E(X) = \sum_{x=1}^{3} xf(x)$$

 

그리고 그리스 문자 $ \mu $로 표기하는데, 이는 X의 평균 혹은 X 분포의 평균이라 부른다.

정의 1
공간 S를 갖는 이산형 확률 변수 X의 pmf f(x)이고
$$\sum_{x \in S} u(x)f(x) 혹은 \sum_{S} u(x)f(x) $$
가 존재하면, 그 합을 u(X)의 수하적 기댓값 혹은 기댓값이라 하고 E[u(X)]로 표기한다. 즉 다음과 같다.
$$E[u(X)] = \sum_{x \in S} u(x)f(x)$$

정의2
수학적 기댓값 E가 존재하는 경우 다음 성질들을 만족한다.
(a) c가 상수이면, E(c) = c
(b) c가 상수이고 u가 함수이면,
$$E[c u(X)]=cE[u(X)]$$
(c) $c_1과 c_2$가 상수이고 $u_1과 u_2$가 함수이면,
$$E[c_1u_1(X) + c_2u_2(X)] = c_1E[u_1(X)] + c_2E[u_2(X)]$$

성질 (c)는 수학적 귀납법에 의해 항이 2개 이상인 경우로 확장될 수 있다. 즉, 다음과 같다

(c') $E[\sum_{i=1}^{k} c_iu_i(X))] = \sum_{i=1}^{k}c_iE[u_i(X)]$

성질 (c') 때문에 수학적 기댓값 E를 종종 선형(linear) 혹은 분배(distributive) 연산자(operator)라 부른다.

 

 

특별한 수학적 기댓값

$\mu = E(X)$를 확률변수 X의 (혹은 확률변수 X 분포의) 평균이라 부를 때, 일반적으로 확률변수 X는 공간 $S = {u_1, u_2, ..., u_k}를 갖고 f(x)가 pmf일 때, 각 점들에서 확률 $P(X = u_i) = f(u_i) > 0$을 갖는다. 물론,

 

$$ \sum_{x \in S} f(x) = 1 $$

 

이고, 확률 변수 X의 평균은 다음과 같다.

 

$$ \mu = \sum_{x \in S} xf(x) $$

 

통계학자는 종종 평균 $ \mu $에 대한 2차 적률을 계산하는 것에 관심이 있다. 거리를 제곱하기 때문에 2차 적률이라 부르고 이는 $E[(X - \mu )^2]$와 같다.

 

이런 거리들 제곰의 가중평균을 확률변수 X(혹은 그것의 분포)의 분산(variance)이라 한다. 분산의 양의 제곱근은 X의 표준편자(standard deviation)라 하고, 그리스 문자 $ \sigma $로 표기한다. 따라서 분산 $\sigma^2$을 Var(X)라 한다.

 

3차적률은 왜도라고 한다.

 

정의 
이산형 확률변수 X의 pmf는 f(x), 공간은 S라 하자. -h < t < h에 대해
$$ E(e^tX ) = \sum_{x \in S} e^tX f(x)$$
가 존재하고 유한이 되는 양수 h가 있다면, 다음과 같이 정의되는 함수를 X의(혹은 X의 분포의) 적률생성함수(moment generating function)라 한다.
이 함수는 종종 약어로 mgf라 한다.