View
8
Download
0
Category
Preview:
Citation preview
확률분포와 기대값
2
기대값 (expected value : 평균)
기대값은 확률분포에서 분포의 무게중심을 말하며, 확률 값을 가중치로 하는확률변수의 가능한 값에 대한 가중평균이라고 할 수 있다. 확률변수 X 의 기대값은 E(X)로 표현하며 각각 다음과 같이 구한다
이산형 확률변수 X 의 가능한 값이 (x1, x2, … , xn) 이며,
n
i
iiPxXE1
)(
niPxXPii
,,2,1,)( === …
일 때, X 의 기대값 E(X) 는 다음과 같음
1. 이산형 확률변수
3
2. 연속형 확률변수
연속형 확률변수 X 의 확률밀도함수를 f (x) 라 하면 X 의 기대값 E(X) 는 다음과 같음
dxxfxXE )()(
4
두 개의 주사위를 던지는 실험에서 확률변수 X를 ‘두 주사위 눈금의 합’이라고정의하면 표본공간은 다음과 같다
첫번째 / 두번째 1 2 3 4 5 6
1 (1,1) (1,2) (1,3) (1,4) (1,5) (1,6)
2 (2,1) (2,2) (2,3) (2,4) (2,5) (2,6)
3 (3,1) (3,2) (3,3) (3,4) (3,5) (3,6)
4 (4,1) (4,2) (4,3) (4,4) (4,5) (4,6)
5 (5,1) (5,2) (5,3) (5,4) (5,5) (5,6)
6 (6,1) (6,2) (6,3) (6,4) (6,5) (6,6)
예1 이산형 확률변수의 기대값 계산
5
X의 가능한 값은 2,3,4,5,6,7,8,9,10,11,12이며, 위 표본공간에서 X의 확률분포는다음과 같다.
X 2 3 4 5 6 7 8 9 10 11 12
확률 1/36 2/36 3/36 4/36 5/36 6/36 5/36 4/36 3/36 2/36 1/36
6
위 확률분포표를 이용하여 확률변수 X의 기대값을 계산해 보면 다음과 같다
7
기대값의 특성
X, Y 를 확률변수, a, b 를 상수라고 할 때, 기대값은 항상 다음 조건을 만족한다.
)()()(.3
)()(.2
)(.1
YbEXaEbYaXE
bXaEbaXE
aaE
+=+
+=+
=
자체이다.그상수기댓값은상수의즉,
상수 a와 b를 제외할 때 E(X+Y)=E(X)+E(Y)가 되는데, 이는 두 확률변수의 합의기대값은 각 확률변수의 기대값의 합과 같음을 의미한다.
8
분산(variance)
평균이 확률분포의 무게중심인 데 비하여 분산은 확률분포의 흩어진 정도를 측정하는것으로 평균이 같은 경우에도 분산의 크기에 따라서 분포의 모양이 달라진다.
9
확률변수 X 의 분산(variance)은 E(X) = µ 라고 할 때, X 와 µ 의 편차의
제곱, 즉 ( X – µ )2 의 기대값으로 Var (X) 또는 σ X2 으로 표현되며,
2222 )()( XExEx
2
으로 구한다. 여기에서 확률변수 X 를 나타낼 필요가 없는 경우에는
σ X2 에서 X 를 없애고 σ 2 으로 표현한다. 분산의 양의 제곱근을
표준편차(standard deviation)라고 하며 σ 로 표현한다. 즉,
이다.
X2
10
이산형 확률변수 X의 확률분포가 다음과 같을 때 X의 평균과 분산을 구해보자.
X 0 1 2 3
확률 1/8 3/8 3/8 1/8
5.18/138/328/318/10)( XE
38/198/348/318/10)( 2 XE
75.0)5.1(3)( 2222 XE
예2 이산형 확률변수의 분산 계산
2
2
11
2
2
확률변수의 X의 분산 는 다음과 같이 정의된다. X2
표준편차 는 분산의 제곱근이다.X분산의 특성
1. Var(a)=0
2. Var(aX)=a Var(X)
3. Var(X+a)=Var(X)
4. 만약 X와 Y가 독립이면 Var(X+Y)=Var(X)+Var(Y) / Var(X-Y)=Var(X)+Var(Y)
5. 만약 X와 Y가 독립이 아니면 Var(aX+bY)=a Var(X)+b Var(Y)+2abCov(X,Y)2
12
참고 기대 및 분산연산자를 이용한 자료의 선형변환
(1) 상수(c)를 더할 때 W=X+c
평균
분산
(2) 상수 곱했을때 W=cX
평균
분산
(3) 상수 더하고 곱했을때 W=cX + d
평균
분산
공분산 및 상관계수
14
주로 두 변수 사이의 관계의 밀접도를 측정하는 상관계수를 구하는 과정에서계산되는 경우가 많다.
공분산의 부호가 양수이면 두 변수들이 서로 같은 방향으로 변하고, 음수이면 두 변수들이 서로 반대 방향으로 변한다.
공분산은 두 변수의 측정단위에 따라 달라진다.
공분산(covariance)
두 확률변수의 결합분포를 알고 있는 경우에 구할 수 있는 모수
15
두 확률변수 X 와 Y 의 공분산(covariance)은 Cov (X, Y) 또는 σXY 로 표현하며
다음과 같이 계산한다.
yx
yxxy
XYE
YXE
×
)(
))([( ]
(예: 키(X)와 몸무게(Y)의 공분산)
-측정단위( X1 (m), Y(kg)): Cov (X1, Y) =𝜎𝑥1,𝑦 = E[ 𝑋1 − 𝜇𝑥1 𝑌 − 𝜇𝑦 ]
-측정단위( X2 (cm), Y(kg)): Cov (X2, Y) =𝜎𝑥2,𝑦 = E 𝑋2 − 𝜇𝑥2 𝑌 − 𝜇𝑦
= E 100𝑋1 − 100𝜇𝑥1 𝑌 − 𝜇𝑦
= 100𝜎𝑥1,𝑦
16
상관관계수의 부호가 양수이면 두 변수들이 서로 같은 방향으로 변하고, 음수이면 두 변수들이 서로 반대 방향으로 변한다.
상관계수는 두 변수의 측정단위에 영향을 받지 않는다.
상관계수(correlation coefficient)
두 변수 사이의 관계의 밀접도를 측정하는 통계량
17
두 확률변수 X 와 Y 에 대하여 σ X2 , σY
2 을 각각의 분산이라 하고,
σXY 를 X 와 Y 의 공분산이라고 할 때, X 와 Y 의 상관계수는 ρ 로 표현한다.
YX
xy
YX
xy
22
18
① 완전 선형인 경우
왼쪽 그림과 같이 (a), (b)와 같이( X , Y ) 의 관계가 완전선형Y=a+bX (b ≠0) 인 경우에는상관계수가 r=1(b>0)또는 r=-1(b<0)으로 나타난다.
19
② 어느 정도 상관관계가 있는 경우
산포도의 분포 폭이 중심축으로부터 커질수록 ㅣrㅣ 값의 크기는
0에 가까워진다.
그림 (c) 와 (d) 를 비교할 때ㅣrㅣ=0.5인 경우가 ㅣrㅣ=0.7인 경우보다분포의 폭이 더 큰 것을 알 수 있다.
20
③ 상관관계가 없는 경우
r=0인 경우는 두 변수 사이에 선형관계가 없음을 의미한다.
그림 (e), (f)와 같이 산포도가 하나의특정한 중심축을 그릴 수 없는 경우와관계식 Y=a+bX에서 b=0인 경우가여기에 해당된다.
21
예 이산형 확률변수의 공분산 및 상관계수 계산
예 : 포트폴리오의 구성포트폴리오를 구성하고 있는 두 증권 X와 Y의 수익률에 대한 분포가다음의 표와 같고 투자금액을 X증권에 60%, Y증권에 40%투자할 때포트폴리오의 기대수익률과 분산 그리고 X,Y의 공분산 및 상관계수를 구하라.
-1 6 2 20 f(x)
5 0.1 0 0 0 0.1
7 0 0.4 0 0 0.4
-4 0 0 0.3 0 0.3
15 0 0 0 0.2 0.2
f(y) 0.1 0.4 0.3 0.2 1.0
x Y
22
23
두 확률변수 X와 Y가 서로 독립이면 cov(X,Y)=0이지만 cov(X,Y)=0이라고 해서반드시 X와 Y가 서로 독립인 것은 아니다.
즉, cov(X,Y)=0은 독립이기 위한 필요조건이지 충분조건은 아니다.
독립
cov=0
독립
24
예 다음의 결합확률분포를 이용해 위의 내용을 보여라.
Y/X -1 0 1 Y의 주변확률
-1 1/6 1/3 1/6 2/3
0 0 0 0 0
1 1/6 0 1/6 1/3
X의 주변확률 1/3 1/3 1/3 1.0
25
따라서, Cov(X,Y)=0이지만 X,Y는 서로 독립이 아니다.
26
독립성
만약에 X와 Y가 서로 독립이면 다음의 관계가 성립한다.
Recommended