9
Introductory Statistics Spring 2015 확률변수와 분포함수 확률변수 random variable 함수 function 정의 두 집합 X, Y 사이의 대응관계로 집합 X의 모든 원소들을 각각 집합 Y의 유일한 원소에 일대일 대응시키는 관계 기호 : , - y는 x의 함수 집합 X는 함수 f의 정의역(domain), 집합 Y는 함수 f의 공역(range) 확률변수 정의 확률실험 표본공간 S가 정의역, 실수(real number)가 공역인 측정 measure 함수 확률실험의 각 결과에 실수 값을 할당하는 assign 규칙 (함수) (기호) 알파벳 , 확률변수 정의 이산형 discrete 확률변수 X의 정의역 원소가 유한이거나 셀수 있는 경우 (예) 2개 주사위 눈금 합, 대전시 한 달 교통사고 건수 연속형 continuous X의 정의역 원소가 무한인 경우 (예) 대전시 기업 종사자 일년 연봉, 대전 일 강수량 y = f ( x ) f : X Y X, Y , Z ,... x = X ( s ) x = X (w), w S 한남대학교 권세혁교수 http://wolfpack.hnu.ac.kr / Page 19

확률변수 random variable - wolfpack.hnu.ac.krwolfpack.hnu.ac.kr/2015_Spring/IS/IS_확률변수_분포함수.pdf · (연습문제) (1) 이산형 이변량 확률변수의 결합확률밀도함수이다

  • Upload
    others

  • View
    2

  • Download
    0

Embed Size (px)

Citation preview

Introductory Statistics Spring 2015 확률변수와 분포함수

확률변수 random variable

함수 function 정의

•두 집합 X, Y 사이의 대응관계로 집합 X의 모든 원소들을 각각 집합 Y의 유일한 원소에 일대일 대응시키는 관계

•기호 : , - y는 x의 함수

•집합 X는 함수 f의 정의역(domain), 집합 Y는 함수 f의 공역(range)

확률변수 정의

확률실험 표본공간 S가 정의역, 실수(real number)가 공역인 측정 measure 함수

확률실험의 각 결과에 실수 값을 할당하는 assign 규칙 (함수)

•(기호) 알파벳

• ,

확률변수 정의

•이산형 discrete

확률변수 X의 정의역 원소가 유한이거나 셀수 있는 경우 (예) 2개 주사위 눈금 합, 대전시 한 달 교통사고 건수

•연속형 continuous

X의 정의역 원소가 무한인 경우 (예) 대전시 기업 종사자 일년 연봉, 대전 일 강수량

y = f (x) f :X→Y

X,Y ,Z,...

x = X(s) x = X(w),w⊂ S

한남대학교 권세혁교수 http://wolfpack.hnu.ac.kr

/ Page1 9

Introductory Statistics Spring 2015 확률변수와 분포함수

확률밀도함수 probability density/mass function, 확률분포 distribution 함수

정의

•확률변수의 값이 정의역, 각 값에 대응하는 확률 값을 공역으로 하는 규칙

•규칙은 함수, 표, 그래프임

•(기호) , -연속형, -이산

확률의 공리 axiom

(1) , 정의역 모든 값 의 확률 값은

0과 1사이이다.

(2) 표본공간의 확률 합은 1이다. .

누적 분포함수 Cumulative Dsitribution function

정의 definition

확률변수 X의 정의역의 가장 작은 값 부터 임의의 값 까지 ( 값을 포함) 확률 값을 누적시킨 함수

(기호) - (연속형), (이산형)

성질 property

(1) 는 비감소 nondecreasing 함수 ->

(2) ,

P(X = x) = P(x) = PX (x) f (x) p(x)

1≥ p(x) ≥ 0 1≥ f (x) ≥ 0 x

P(x) = 1x∑ f (x)dx = 1∫

−∞ x x

F(x) = P(X ≤ x) F(x) = f (x)dx−∞

x

∫ F(x) = P(x)−∞

x

F(x) x1 < x2 ⇒ F(x1) ≤ F(x2 )

F(−∞) = 0 F(∞) = 1

한남대학교 권세혁교수 http://wolfpack.hnu.ac.kr

/ Page2 9

Introductory Statistics Spring 2015 확률변수와 분포함수

기대값 expected value

확률실험을 무수히 많이 반복했을 때 확률변수 결과 값의 평균 long-run average

(기호) (모집단) (표본)

(관측치) -표본, -모집단

(적률) moment

(k차-평균 적률)

(k차-원점 적률)

(분산, 표준편차) 편차 제곱의 기대값, 2차 평균적률

분산의 양의 제곱근=표준편차

(관측치) -표본, 표준편차-

-모집단, 표준편차-

(분산 간편식)

(정리) 상수 c, 확률변수 x, x의 함수 g(x)

(1) , , ,

(2) , ,

연습문제

1. 이산형 확률변수 X의 확률밀도함수는 이다.

(1) 계산하시오.

(2) 계산하시오.

E(X) = xp(x) = xf (x)dx∫x∑ E(X) = µ E(X) = x

(x1, x2,..., xn )− E(X) =xi∑n

(x1, x2,..., xN )− E(X) =xi∑

N

E(X − E(X))k

E(Xk )

V (X) = E(X − E(X))2

S(X) = E(X − E(X))2

(x1, x2,..., xn )−V (X) = s2 (x) =

(xi − x )2∑

n −1s(x)

(x1, x2,..., xN )−V (X) =σ2 (x) =

(xi − µ)2∑N

σ (x)

s2 (x) =(xi − x )

2∑n −1

= 1n −1

( xi2 − nx 2 )∑

V (X) = E(X − E(X))2 = E(X 2 )− E(X)2

E(c) = c E(X + c) = E(X)+ c E(cX) = cE(X) E(g(x)) = g(x)p(x) = g(x) f (x)dx∫∑V (X + c) =V (X) V (cX) = c2V (X) V (g(x)) = E(g2 (x))− E(g(x))2

PX (x) =

1/ 2, x = 01/ 3, x = 11/ 6, x = 20,otherwise

⎨⎪⎪

⎩⎪⎪

P(X ≥1.5)

P(0 < X < 2)

한남대학교 권세혁교수 http://wolfpack.hnu.ac.kr

/ Page3 9

Introductory Statistics Spring 2015 확률변수와 분포함수

(3) 계산하시오.

(4)

2. 주사위 2개를 던졌을 때 첫 주사위 눈금과 두번째 주사위 눈금의 차이에 대한 확률밀도함수를 구하시오.

3. 50명의 학생이 기숙사에 살고 30대 주차가능하다. 학생이 차량을 가지고 있을 확률을 1/2이다. 주차공간이 충분하지 않을 확률을 구하시오.

4. P-F 시험을 연속해서 본다고 하자. 첫 시험에서 pass (fail) 확률은 1/2이다. 시험을 볼수록

능력이 높아져 k번째 시험의 실패 확률은 (k-1)번째 실패 확률의 1/2이다. .

PASS하면 시험이 종료된다.

1) ,

2) 확률밀도함수를 구하시오.

3) 시험을 2번 이상 봐야 할 확률을 구하시오.

4) 시험을 한 번 이상 보았다고 할 때 정확하게 2번 봤을 확률을 구하시오.

5. 이산형 확률변수 X의 확률밀도함수는 이다.

1) 구하시오.

2) 일 때 구하시오.

P(X ≥1.5)

P(X = 0 | X < 2)

P(Fk ) =12P(Fk−1)

P(X = k) k = 1,2,3

P(X = k)

PX (x) =

1/ 2, x = 10.3, x = 21/ 5, x = 30,otherwise

⎨⎪⎪

⎩⎪⎪

E(X),V (X),SD(X)

Y = 2 / X E(Y )

한남대학교 권세혁교수 http://wolfpack.hnu.ac.kr

/ Page4 9

Introductory Statistics Spring 2015 확률변수와 분포함수

6. (St. Petersburg Paradox) 주머니에 $1이 있고 동전을 던져 앞면이 나타나면 주머니 돈이 2배가 된다. 동전 던지기는 뒷면이 한 번 나타나면 종료되며 주머니의 돈은 상금으로 가져간다. 그러므로 게임참가자가 동전을 던져 뒷면이 첫 번째 나오면 $1, 두번째 나오면 $2, 세 번째는 $4… 받는다. 참가비가 얼마이면 게임에 참여할 것인가? 상금을 확률변수 X라 하자.

1) E(X) 구하시오.

2) 상금이 $65이상일 확률을 구하시오.

7. 확률변수 X에 대하여 을 최소화 하는 상수 a를 구하시오.

8. 주사위를 던져 나온 눈금만큼 천원을 받는다. 게임을 여기서 종료할 수 있고 상금을 받는다. 참가자가 원하면 다시 주사위를 던져 나온 눈금만큼 천원 받는다. (물론 첫 주사위 상금은 소멸된다) 상금을 최대화 하기 위한 전략을 구하시오.

9. 연속형 확률변수 X의 확률밀도함수는 이다. (c는 상수)

1) 상수 c를 구하시오.

2) CDF 구하시오.

3) 을 계산하시오.

4) 기대값을 구하시오.

10. 일 경우 을 구하시오.

E(X − a)2

fX (x) =c−4 x , x ≥ 00,otherwise

⎧⎨⎩

FX (x)

P(2 < X < 5)

fX (x) = x2 + 2 / 3, 0 ≤ x ≤1 E(Xk ),k = 1,2,3,...

한남대학교 권세혁교수 http://wolfpack.hnu.ac.kr

/ Page5 9

Introductory Statistics Spring 2015 확률변수와 분포함수

11. 연속형 확률변수 X의 누적확률밀도함수는 이다.

1) 구하시오.

2) 구하시오.

3) 구하시오.

이변량 확률변수 bivariate random variable

개념

•2개 확률변수를 동시에 고려함 - 주유소에서 시간 당 주유하기 위하여 방문하는 차량 대수(이산형 확률변수)와 매출액(연속형 확률변수), 매출 경유량(연속형)과 휘발유량(연속형

•일반적으로 동일 형태의 확률변수의 결합 - 이산형과 연속형 결합은 beyond this course

정의

(1) 결합확률밀도함수 joint PDF :

(2) 누적확률분포함수 joint CDF

(3) 확률공리 : (a) for all (b)

주변확률밀도함수 marginal PDF

이변량 결합확률밀도함수 중 하나의 확률밀도함수를 의미함

,

,

조건부 확률밀도함수 conditional PDF

한 확률변수의 값이 주어졌을 때 다른 확률변수의 PDF

FX (x) =

0, x <1x,0 < x <1/ 4x + 0.5,1 / 4 ≤ x <1/ 21, x ≥1/ 2

⎨⎪⎪

⎩⎪⎪

P(X ≤1/ 3)

P(X ≥1/ 4)

E(X),V (X),SD(X)

P(X = x,Y = y) = PXY (x, y) = fXY (x, y)

FXY (x, y) = P(X ≤ x,Y ≤ y)

f (x, y) ≥ 0 x, y f (x, y) = 1∫∫

PX (x) = PXY (x, y)y∑ PY (y) = PXY (x, y)

x∑

fX (x) = fXY (x, y)dyy∫ fY (y) = fXY (x, y)dx

x∫

한남대학교 권세혁교수 http://wolfpack.hnu.ac.kr

/ Page6 9

Introductory Statistics Spring 2015 확률변수와 분포함수

(이산형) (연속형)

독립 independence

•만약 (조건부PDF=조건부PDF), 확률변수 X, Y는 독립이다.

•두 확률변수 X, Y가 독립이면,

공분산 covariance

두 확률변수 간 선형관계 정도를 측정 (한 확률변수의 값이 증가하면 다른 확률변수의 값이 직선의 관계 속에서 변하는 정도)

(정의)

•만약 확률변수 는 서로 독립이면,

•그러므로 , 그러나 -> 는 서로 독립인 것은 아니다

상관계수

공분산의 측정 단위를 표준화 값으로 -1과 1의 값을 갖는다.

(정의)

기호 ρ (모집단) r(표본 데이터)

•양(음)의 직선관계가 완벽하면 (모든 점들이 직선에 놓임) 상관계수=1 (-1)

•일반 실험 측정형 데이터 ±0.8 이상이면 직선 관계가 높음

기대값

• 만약 ,

PY |X (y | x) =PXY (x, y)PX (x)

fY |X (y | x) =fXY (x, y)fX (x)

PY |X (y | x) = PY (y)

fXY (x, y) = fX (x) fY (y)

)()()())())(((),( YEXEXYEYEYXEXEYXCOV −=−−=

),( YX )()()( YEXEXYE =

0),( =YXCOV 0),( =YXCOV ),( YX

)()(),(),(YVXVYXCOVYXCorr =

)()()( YEXEYXE ±=±

),(2)()()( YXCOVYVXVYXV ±+=±

YX ⊥ )()()( YVXVYXV +=±

한남대학교 권세혁교수 http://wolfpack.hnu.ac.kr

/ Page7 9

Introductory Statistics Spring 2015 확률변수와 분포함수

(연습문제)

(1) 이산형 이변량 확률변수의 결합확률밀도함수이다.

1) P(X=0,Y≤1) 계산하시오.

2) 주변 PMFs of X & Y 구하시오.

3) P(Y=1|X=0) 계산하시오.

4) X와 Y는 독립인가?

5) Y=1이 주어진 경우 X의 조건부 PDF 구하시오.

6) 을 구하시오.

7) Z=(Y-2X)의 확률밀도함수를 구하시오.

8) 일 확률을 구하시오.

(2) 박스 안에는 불공정한 코인 ( ) 1개, 공정한 코인 1개가 있다. 박스에서 동전을

하나 선택하여 던졌을 때 앞면(Head)이 나타나면 X=1, 뒷면(Tail)이면 X=0으로 확률변수 X를 정의한다. 박스 안에 동전을 던져 앞면이 나타나면 Y=1, 뒷면이면 Y=0인 확률변수 Y를 정의한다.

1) 이변량 결합확률밀도함수를 구하시오

2) 확률변수 X, Y는 독립인가?

X Y 0 1 2

0 1/6 1/4 1/8

1 1/8 1/6 1/6

PX|Y (x |1)

E(X |Y = 1)

P(X = 2 | Z = 0)

P(H ) = 2 / 3

한남대학교 권세혁교수 http://wolfpack.hnu.ac.kr

/ Page8 9

Introductory Statistics Spring 2015 확률변수와 분포함수

(3) 이변량 확률밀도함수 이다.

1) 확률변수 (X, Y) 주변확률밀도함수 구하시오.

2) 서로 독립인가?

3) 계산하시오.

(4) 이변량 확률밀도함수 이다.

1) 확률변수 (X, Y) 주변확률밀도함수 구하시오.

2) 계산하시오.

3) 계산하시오.

4) 계산하시오.

5) 계산하시오.

(5) 이변량 확률밀도함수 이다.

1) 주어진 경우 확률변수 Y의 조건부 확률밀도함수 구하시오.

2) 계산하시오.

3) 계산하시오.

(6) 이변량 확률밀도함수 이다.

1) 주어진 경우 확률변수 X의 조건부 확률밀도함수 구하시오.

2) 두 확률변수 (X, Y)는 독립인가?

3) 계산하시오.

4) 을 구하시오.

(7) 이변량 확률밀도함수 이다.

1) 두 확률변수의 상관계수를 구하시오.

PXY (x, y) =12x+y

, x, y = 1,2,3,...

P(X 2 +Y 2 ≤10)

fXY (x, y) = 1/ 4x2 +1/ 6y,−1< x <1,0 < y < 2

P(X > 0,Y <1)

P(X > 0 or Y <1)

P(X > 0 |Y <1)

P(X +Y > 0)

fXY (x, y) = 1/ 2x2 + 2 / 3y,−1< x <1,0 < y <1

X = x

P(Y > 0.5 | X = x)

E(Y | X = 0)

fXY (x, y) = 6y,0 < x < y <1

Y = y

P(1 / 2 <Y < 3 / 4 | y = 1/ 2)

E(X | y)

fXY (x, y) = 2,0 < x < y <1

한남대학교 권세혁교수 http://wolfpack.hnu.ac.kr

/ Page9 9