확률분포와기대값kanggc.iptime.org/stat/chap6/chap6.pdf · 2018-10-10 · 기대값(expected...

확률분포와 기대값

기대값 (expected value : 평균)

기대값은 확률분포에서 분포의 무게중심을 말하며, 확률 값을 가중치로 하는확률변수의 가능한 값에 대한 가중평균이라고 할 수 있다. 확률변수 X 의 기대값은 E(X)로 표현하며 각각 다음과 같이 구한다

이산형 확률변수 X 의 가능한 값이 (x1, x2, … , xn) 이며,

iiPxXE1

niPxXPii

,,2,1,)( === …

일 때, X 의 기대값 E(X) 는 다음과 같음

1. 이산형 확률변수

2. 연속형 확률변수

연속형 확률변수 X 의 확률밀도함수를 f (x) 라 하면 X 의 기대값 E(X) 는 다음과 같음

dxxfxXE )()(

두 개의 주사위를 던지는 실험에서 확률변수 X를 ‘두 주사위 눈금의 합’이라고정의하면 표본공간은 다음과 같다

첫번째 / 두번째 1 2 3 4 5 6

1 (1,1) (1,2) (1,3) (1,4) (1,5) (1,6)

2 (2,1) (2,2) (2,3) (2,4) (2,5) (2,6)

3 (3,1) (3,2) (3,3) (3,4) (3,5) (3,6)

4 (4,1) (4,2) (4,3) (4,4) (4,5) (4,6)

5 (5,1) (5,2) (5,3) (5,4) (5,5) (5,6)

6 (6,1) (6,2) (6,3) (6,4) (6,5) (6,6)

예1 이산형 확률변수의 기대값 계산

X의 가능한 값은 2,3,4,5,6,7,8,9,10,11,12이며, 위 표본공간에서 X의 확률분포는다음과 같다.

X 2 3 4 5 6 7 8 9 10 11 12

확률 1/36 2/36 3/36 4/36 5/36 6/36 5/36 4/36 3/36 2/36 1/36

위 확률분포표를 이용하여 확률변수 X의 기대값을 계산해 보면 다음과 같다

기대값의 특성

X, Y 를 확률변수, a, b 를 상수라고 할 때, 기대값은 항상 다음 조건을 만족한다.

)()()(.3

)()(.2

YbEXaEbYaXE

bXaEbaXE

자체이다.그상수기댓값은상수의즉,

상수 a와 b를 제외할 때 E(X+Y)=E(X)+E(Y)가 되는데, 이는 두 확률변수의 합의기대값은 각 확률변수의 기대값의 합과 같음을 의미한다.

분산(variance)

평균이 확률분포의 무게중심인 데 비하여 분산은 확률분포의 흩어진 정도를 측정하는것으로 평균이 같은 경우에도 분산의 크기에 따라서 분포의 모양이 달라진다.

확률변수 X 의 분산(variance)은 E(X) = µ 라고 할 때, X 와 µ 의 편차의

제곱, 즉 ( X – µ )2 의 기대값으로 Var (X) 또는 σ X2 으로 표현되며,

2222 )()( XExEx

으로 구한다. 여기에서 확률변수 X 를 나타낼 필요가 없는 경우에는

σ X2 에서 X 를 없애고 σ 2 으로 표현한다. 분산의 양의 제곱근을

표준편차(standard deviation)라고 하며 σ 로 표현한다. 즉,

이다.

이산형 확률변수 X의 확률분포가 다음과 같을 때 X의 평균과 분산을 구해보자.

X 0 1 2 3

확률 1/8 3/8 3/8 1/8

5.18/138/328/318/10)( XE

38/198/348/318/10)( 2 XE

75.0)5.1(3)( 2222 XE

예2 이산형 확률변수의 분산 계산

확률변수의 X의 분산 는 다음과 같이 정의된다. X2

표준편차 는 분산의 제곱근이다.X분산의 특성

1. Var(a)=0

2. Var(aX)=a Var(X)

3. Var(X+a)=Var(X)

4. 만약 X와 Y가 독립이면 Var(X+Y)=Var(X)+Var(Y) / Var(X-Y)=Var(X)+Var(Y)

5. 만약 X와 Y가 독립이 아니면 Var(aX+bY)=a Var(X)+b Var(Y)+2abCov(X,Y)2

참고 기대 및 분산연산자를 이용한 자료의 선형변환

(1) 상수(c)를 더할 때 W=X+c

평균

분산

(2) 상수 곱했을때 W=cX

평균

분산

(3) 상수 더하고 곱했을때 W=cX + d

평균

분산

공분산 및 상관계수

주로 두 변수 사이의 관계의 밀접도를 측정하는 상관계수를 구하는 과정에서계산되는 경우가 많다.

공분산의 부호가 양수이면 두 변수들이 서로 같은 방향으로 변하고, 음수이면 두 변수들이 서로 반대 방향으로 변한다.

공분산은 두 변수의 측정단위에 따라 달라진다.

공분산(covariance)

두 확률변수의 결합분포를 알고 있는 경우에 구할 수 있는 모수

두 확률변수 X 와 Y 의 공분산(covariance)은 Cov (X, Y) 또는 σXY 로 표현하며

다음과 같이 계산한다.

))([( ]

(예: 키(X)와 몸무게(Y)의 공분산)

-측정단위( X1 (m), Y(kg)): Cov (X1, Y) =𝜎𝑥1,𝑦 = E[ 𝑋1 − 𝜇𝑥1 𝑌 − 𝜇𝑦 ]

-측정단위( X2 (cm), Y(kg)): Cov (X2, Y) =𝜎𝑥2,𝑦 = E 𝑋2 − 𝜇𝑥2 𝑌 − 𝜇𝑦

= E 100𝑋1 − 100𝜇𝑥1 𝑌 − 𝜇𝑦

= 100𝜎𝑥1,𝑦

상관관계수의 부호가 양수이면 두 변수들이 서로 같은 방향으로 변하고, 음수이면 두 변수들이 서로 반대 방향으로 변한다.

상관계수는 두 변수의 측정단위에 영향을 받지 않는다.

상관계수(correlation coefficient)

두 변수 사이의 관계의 밀접도를 측정하는 통계량

두 확률변수 X 와 Y 에 대하여 σ X2 , σY

2 을 각각의 분산이라 하고,

σXY 를 X 와 Y 의 공분산이라고 할 때, X 와 Y 의 상관계수는 ρ 로 표현한다.

① 완전 선형인 경우

왼쪽 그림과 같이 (a), (b)와 같이( X , Y ) 의 관계가 완전선형Y=a+bX (b ≠0) 인 경우에는상관계수가 r=1(b>0)또는 r=-1(b<0)으로 나타난다.

② 어느 정도 상관관계가 있는 경우

산포도의 분포 폭이 중심축으로부터 커질수록 ㅣrㅣ 값의 크기는

0에 가까워진다.

그림 (c) 와 (d) 를 비교할 때ㅣrㅣ=0.5인 경우가 ㅣrㅣ=0.7인 경우보다분포의 폭이 더 큰 것을 알 수 있다.

③ 상관관계가 없는 경우

r=0인 경우는 두 변수 사이에 선형관계가 없음을 의미한다.

그림 (e), (f)와 같이 산포도가 하나의특정한 중심축을 그릴 수 없는 경우와관계식 Y=a+bX에서 b=0인 경우가여기에 해당된다.

예 이산형 확률변수의 공분산 및 상관계수 계산

예 : 포트폴리오의 구성포트폴리오를 구성하고 있는 두 증권 X와 Y의 수익률에 대한 분포가다음의 표와 같고 투자금액을 X증권에 60%, Y증권에 40%투자할 때포트폴리오의 기대수익률과 분산 그리고 X,Y의 공분산 및 상관계수를 구하라.

-1 6 2 20 f(x)

5 0.1 0 0 0 0.1

7 0 0.4 0 0 0.4

-4 0 0 0.3 0 0.3

15 0 0 0 0.2 0.2

f(y) 0.1 0.4 0.3 0.2 1.0

두 확률변수 X와 Y가 서로 독립이면 cov(X,Y)=0이지만 cov(X,Y)=0이라고 해서반드시 X와 Y가 서로 독립인 것은 아니다.

즉, cov(X,Y)=0은 독립이기 위한 필요조건이지 충분조건은 아니다.

독립

예 다음의 결합확률분포를 이용해 위의 내용을 보여라.

Y/X -1 0 1 Y의 주변확률

-1 1/6 1/3 1/6 2/3

0 0 0 0 0

1 1/6 0 1/6 1/3

X의 주변확률 1/3 1/3 1/3 1.0

따라서, Cov(X,Y)=0이지만 X,Y는 서로 독립이 아니다.

독립성

만약에 X와 Y가 서로 독립이면 다음의 관계가 성립한다.

확률분포와기대값kanggc.iptime.org/stat/chap6/chap6.pdf · 2018-10-10 · 기대값(expected...

Documents

종합채권금융채 2.5-3Y 지수 2019. 10. 01: 채권지수 편 종목들의 평균적인 특성을 나타내는 지표로, 평균 Duration, 평균 Convexity, 평균 YTM, 평균

Semantic chap6

2014 신입사원 평균 연봉

Chap6 Random

Chap6 Student

chap6 supports_de_transmissiom

chap6-10 - Khosla

PHYSIOLOGY Chap6

S08 chap6 web

Chap6 Prosper

Pcem1 chap6

Micro Economy Chap6

Edited Chap6

Compensation management chap6

목차 - ilsoyadvisor.com · 아래 도표를 보면 지난 10년간의 평균 단백질 및 지방 함량을 볼 수 있습니다. 평균 평균 지방 단백질 2002 19.67 35.56

Chap6 photodetectors

확률변수의 기대값 , 분산 등

Week5 chap6

Chap6 Class

PowerPoint 프레젠테이션...Ⅴ. APPENDIX(진행차입형사업장현황) 진행차입형토지신탁사업현황 구 분 사업수 세대수 분양률 (평균) 공정률 (평균)