상세 컨텐츠

본문 제목

[확률과 통계]2장. 확률변수

Computer Science/확률과 통계

by Na느님 2023. 10. 13. 14:52

본문

  • 이 포스트는 '공학인증을 위한 확률과 통계 제 4판'을 참고하여 작성되었습니다.

 

 

2.1 이산확률변수

표본공간을 이루는 개개의 관찰값(사건)을 실수로 대응시키는 함수 X를 생각할 수 있다. 이때 이 함수 X를 확률변수(random variable)이라 한다.

확률변수 X가 취하는 모든 실수들의 집합을 상태공간(state space)이라 한다.

 

상태공간이 이산적일 때 확률변수 X를 이산확률변수(discrete random variable)라 한다.

확률변수 X가 취하는 각 경우에 대한 확률을 표 또는 함수식을 이용해 나타낸 것을 확률분포(probability distribution)라 한다.

이산확률변수 X의 상태공간 안에 있는 개개의 값 x에 확률함수 p(x)를 대응시키고 나머지는 전부 0을 취한 함수를 X의 확률질량함수(probability mass function; p.m.f)라 한다.

 

 

2.2 연속확률변수

상태공간이 연속적일 때 확률변수 X를 연속확률변수(continuous random variable)라 한다.

연속확률변수 X의 상태공간 안에 있는 연속적인 값 x에 확률함수 p(x)를 대응시키고 나머지는 전부 0을 취한 함수를 X의 확률밀도함수(probability density function; p.d.f)라 한다.

 

 

2.3 기댓값

기댓값(expected value)은 다음과 같이 정의된다.

기댓값

확률변수가 취하는 값과 그 값에 대한 확률의 곱의 전체 합이다.

 

분포함수에 대하여, 값이 0.5를 만족시키는 값을 중앙값(median)이라고 하고, 가장 높은 확률을 가지는 값을 최빈값(mode)이라고 한다.

 

확률변수 X의 분포가 평균을 중심으로 밀집한 정도를 나타내는 척도를 분산(variance)이라고 한다. 분산의 공식은 다음과 같다.

분산의 정의

여기서 mu 기호는 평균 E(X)를 의미한다.

분산의 양의 제곱근표준편차(standard deviation)라고 한다.

 

임의의 확률변수 X에 대하여, 다음과 같이 정의되는 확률변수를 특별히 표준화 확률변수(standardized random variable)이라고 한다.

표준화 확률변수

이것은 정규화 개념의 핵심 개념이 된다.

 

 

 

 

 

 

 

 

 

 

 

 

 

관련글 더보기