통계 노트/기초통계

기초통계 / 확률변수의 기대값

yourhm 2022. 8. 18. 10:50

표본 평균을 떠올려보자.

 

표본 평균은 간단하게 위와 같이 쓸 수 있지만, 아래와 같이 표본에서 관측값이 차지하는 비율(=상대도수)을 사용하여 쓸 수도 있다. 왜냐하면 표본 평균은 '관측값 x 상대도수'의 합계로 나타낼 수 있다는 것을 우리는 알고 있다! 예를 들어 n이 10이라고 하면 아래와 같이 나타낼 수 있다.

 

 

 

 

✓ 지난 포스팅에서 다뤘던 상대도수 극한의 개념에 따라 n이 계속 커지면 '표본'은 결국 '모집단'이 되고, 특정 값에 대한 '비율'은 특정 값이 발생할 '확률'이 된다. 이에 따라 n이 계속 커지면 표본 평균도 모평균이 됨을 알 수 있다.

 

• 표본 → 모집단

표본에서 특정 값에 대한 비율 → 사건이 일어날 '확률'

 표본 평균 → 모평균

 

 

 

모평균 = 확률변수의 기대값

• 모평균은 확률변수에 대해 평균적으로 기대하는 값으로 표현할 수 있다.

 확률변수의 기대값(=모평균)은 확률분포(=모집단)의 무게중심을 나타낸다.

 

- 기댓값은 단순한 평균 그 이상으로 일반화된 개념. 예측/추정하려는 어떤 특정값이 아닌, 기대되는 예측치들의 평균 값.

- 즉, 기댓값은 확률적 분포 개념이 포함된 평균인 것이다. 확률변수가 나타내는 확률분포에서의 중심 경향치를 의미한다.

- 표본 평균은 이미 발생한 실험 결과 즉 표본에 대해 직접 계산할 수 있는것이고, 기댓값은 아직 발생하지 않은 즉 모집단에서의 평균을 확률로서 계산하는 것이다.

 

 

(1) 이산 확률변수의 기대값 계산

 

(2) 연속 확률변수의 기대값 계산

 

 

예시

동전을 3번 던진다. 확률 변수 X는 앞면이 나오는 횟수라고 할 때, 확률 변수 X의 기대값은?

 

 

 

 

 

 

기대값의 성질

 

[참고자료]

heejin_park 님 블로그 - 평균과 기댓값

https://infograph.tistory.com/191

 

통계의 본질 블로그 - mean, average, expected value

https://hsm-edu.tistory.com/1079

 

데이터 사이언스 스쿨 - 확률분포의 분산과 표준편차

https://datascienceschool.net/02%20mathematics/07.03%20%EB%B6%84%EC%82%B0%EA%B3%BC%20%ED%91%9C%EC%A4%80%ED%8E%B8%EC%B0%A8.html