65
1/ 65 X1(Randomness)ü U¤(Probability Model) U(Random Variable) UX 0(Expected Value)ü ˜Y UtI— 81 \mtl2017D 5 15|(|) X |t 5-1 81 |t 5-1: UtI

U À U À X (Expected Value)hosung.weebly.com/uploads/1/7/9/6/17964019/slide5-1.pdf ·  · 2018-09-073/ 65 ˝‘ —X1(Randomness)üU‘¤ (Probability Model) U‘À˘(Random Variable)

  • Upload
    others

  • View
    3

  • Download
    0

Embed Size (px)

Citation preview

Page 1: U À U À X (Expected Value)hosung.weebly.com/uploads/1/7/9/6/17964019/slide5-1.pdf ·  · 2018-09-073/ 65 ˝‘ —X1(Randomness)üU‘¤ (Probability Model) U‘À˘(Random Variable)

1/ 65

서론임의성(Randomness)과 확률모형(Probability Model)

확률변수(Random Variable)확률변수의 기대값(Expected Value)과 분산

통계학

—확률 이론 I—

손호성

한국보건사회연구원

2017년 5월 15일(월요일)

강의 슬라이드 5-1

손호성 슬라이드 5-1: 확률 이론 I

Page 2: U À U À X (Expected Value)hosung.weebly.com/uploads/1/7/9/6/17964019/slide5-1.pdf ·  · 2018-09-073/ 65 ˝‘ —X1(Randomness)üU‘¤ (Probability Model) U‘À˘(Random Variable)

2/ 65

서론임의성(Randomness)과 확률모형(Probability Model)

확률변수(Random Variable)확률변수의 기대값(Expected Value)과 분산

목차

1 서론

2 임의성(Randomness)과 확률모형(Probability Model)

3 확률변수(Random Variable)

4 확률변수의 기대값(Expected Value)과 분산

손호성 슬라이드 5-1: 확률 이론 I

Page 3: U À U À X (Expected Value)hosung.weebly.com/uploads/1/7/9/6/17964019/slide5-1.pdf ·  · 2018-09-073/ 65 ˝‘ —X1(Randomness)üU‘¤ (Probability Model) U‘À˘(Random Variable)

3/ 65

서론임의성(Randomness)과 확률모형(Probability Model)

확률변수(Random Variable)확률변수의 기대값(Expected Value)과 분산

지난 시간 복습

통계분석의 마지막 절차는 두 집단 간에 결과변수 값에 차이를 분석하는 것!

단지 차이가 존재한다고 해서 그 차이가 처리변수 때문이라고 100% 확신을갖고 말할 수 없음. Why?

=⇒ 이 관측된 차이가 내가 갖고 있는 표본에서만 관측되었을 수도 있기 때문!

그래서 이 표본에서 관측된 차이가 처리변수 때문에 발생한 것이라고 설득력

있게 말하기 위한 어떤 방안이 필요

=⇒ 추출설계(sampling design)와 통계적 추론(statistical inference)의 영역!

손호성 슬라이드 5-1: 확률 이론 I

Page 4: U À U À X (Expected Value)hosung.weebly.com/uploads/1/7/9/6/17964019/slide5-1.pdf ·  · 2018-09-073/ 65 ˝‘ —X1(Randomness)üU‘¤ (Probability Model) U‘À˘(Random Variable)

4/ 65

서론임의성(Randomness)과 확률모형(Probability Model)

확률변수(Random Variable)확률변수의 기대값(Expected Value)과 분산

지난 시간 복습

연구자가 도출한 결론을 모집단에 일반화 할 수 있기 위해서는 표본의

대표성이 중요

어떻게 하면 모집단을 잘 대표할 수 있는 표본을 추출을 할 수 있을까?

확률표본을 사용해야 함

=⇒ 무작위 표본을 추출

표본을 무작위로 추출하면 모집단을 잘 대표할 확률이 큼

이 무작위 표본을 이용해 통계적 추론을 함!

손호성 슬라이드 5-1: 확률 이론 I

Page 5: U À U À X (Expected Value)hosung.weebly.com/uploads/1/7/9/6/17964019/slide5-1.pdf ·  · 2018-09-073/ 65 ˝‘ —X1(Randomness)üU‘¤ (Probability Model) U‘À˘(Random Variable)

5/ 65

서론임의성(Randomness)과 확률모형(Probability Model)

확률변수(Random Variable)확률변수의 기대값(Expected Value)과 분산

지난 시간 복습

통계적 추론의 기본적인 아이디어:

1. 모집단에서 무작위로 표본을 추출

2. 추출한 표본을 분석

3. 이 분석한 내용을 토대로 모집단에 대한 결론을 내림

두 가지 용어

1. 모수(parameter): 모집단을 기술하는 숫자(예, µ)

2. 통계량(statistics): 표본을 기술하는 숫자(예, x̄)

=⇒ 통계적 추론이란 통계량을 계산한 후, 이 통계량을 이용해 모수를추정해 그 결론에 얼마나 신뢰성을 부여할 수 있는지를 판단하는 과정!

손호성 슬라이드 5-1: 확률 이론 I

Page 6: U À U À X (Expected Value)hosung.weebly.com/uploads/1/7/9/6/17964019/slide5-1.pdf ·  · 2018-09-073/ 65 ˝‘ —X1(Randomness)üU‘¤ (Probability Model) U‘À˘(Random Variable)

6/ 65

서론임의성(Randomness)과 확률모형(Probability Model)

확률변수(Random Variable)확률변수의 기대값(Expected Value)과 분산

지난 시간 복습

추출변이(sampling variability): 표본 통계량 간의 변이

=⇒ x̄1 6= x̄2

추출변이는 항상 존재. 그리고 변이가 적은 상황이 좋음

예를 들어 추출변이가 전혀 없는 상황을 가정: x̄1 = x̄2 = x̄3 = x̄5 = · · ·

=⇒ 이런 경우에는 어떤 표본을 내가 갖고 있든 그 표본을 토대로계산한 통계량이 모집단 모수와 비슷하다고 결론 내릴 수 있음!

손호성 슬라이드 5-1: 확률 이론 I

Page 7: U À U À X (Expected Value)hosung.weebly.com/uploads/1/7/9/6/17964019/slide5-1.pdf ·  · 2018-09-073/ 65 ˝‘ —X1(Randomness)üU‘¤ (Probability Model) U‘À˘(Random Variable)

7/ 65

서론임의성(Randomness)과 확률모형(Probability Model)

확률변수(Random Variable)확률변수의 기대값(Expected Value)과 분산

지난 시간 복습

추출변이가 있으므로 추출분포(sampling distribution)가 존재:

손호성 슬라이드 5-1: 확률 이론 I

Page 8: U À U À X (Expected Value)hosung.weebly.com/uploads/1/7/9/6/17964019/slide5-1.pdf ·  · 2018-09-073/ 65 ˝‘ —X1(Randomness)üU‘¤ (Probability Model) U‘À˘(Random Variable)

8/ 65

서론임의성(Randomness)과 확률모형(Probability Model)

확률변수(Random Variable)확률변수의 기대값(Expected Value)과 분산

지난 시간 복습

n에 크기에 따른 추출분포 모양:

손호성 슬라이드 5-1: 확률 이론 I

Page 9: U À U À X (Expected Value)hosung.weebly.com/uploads/1/7/9/6/17964019/slide5-1.pdf ·  · 2018-09-073/ 65 ˝‘ —X1(Randomness)üU‘¤ (Probability Model) U‘À˘(Random Variable)

9/ 65

서론임의성(Randomness)과 확률모형(Probability Model)

확률변수(Random Variable)확률변수의 기대값(Expected Value)과 분산

지난 시간 복습

편의(bias) vs. 변이(variability):

손호성 슬라이드 5-1: 확률 이론 I

Page 10: U À U À X (Expected Value)hosung.weebly.com/uploads/1/7/9/6/17964019/slide5-1.pdf ·  · 2018-09-073/ 65 ˝‘ —X1(Randomness)üU‘¤ (Probability Model) U‘À˘(Random Variable)

10/ 65

서론임의성(Randomness)과 확률모형(Probability Model)

확률변수(Random Variable)확률변수의 기대값(Expected Value)과 분산

확률: 서론

통계적 추론의 논리: 모집단에서 표본을 무작위로 ‘여러 번’ 추출하면추출분포(sampling distribution)의 모양, 중앙, 그리고 변이에 일정한패턴이 생김

=⇒ 우리가 갖고 있는 하나의 표본을 통해 도출한 결론이 모집단과일치하는지 안 하는지에 대한 판단을 할 수 있음

근데 위 논리, 즉 패턴이 생긴다는 것을 어떻게 확신할까?

=⇒ 연구를 할 때마다 표본을 무작위로 여러 번 추출할 수는 없음

수학적 확률이론이 위 통계적 추론의 논리가 성립함을 증명

=⇒ 확률이론이 있기에 통계학의 논리를 연구에 활용할 수 있는 것임

확률...

손호성 슬라이드 5-1: 확률 이론 I

Page 11: U À U À X (Expected Value)hosung.weebly.com/uploads/1/7/9/6/17964019/slide5-1.pdf ·  · 2018-09-073/ 65 ˝‘ —X1(Randomness)üU‘¤ (Probability Model) U‘À˘(Random Variable)

11/ 65

서론임의성(Randomness)과 확률모형(Probability Model)

확률변수(Random Variable)확률변수의 기대값(Expected Value)과 분산

임의성(Randomness)확률모형(Probability Model)확률의 규칙

확률이론의 아이디어

확률이론을 공부할 때 항상 나오는 예: 동전 던지기!

동전을 던졌을 때 앞면이 나올지 혹은 뒷면이 나올지 동전을 던지기

전에 예측할 수 있나?

=⇒ 100% 확실하게 예측은 불가능

하지만 동전을 계속해서 던진다고 한다면 동전 결과에 어떤 패턴이

드러날 것

=⇒ 이 사실이 확률이론의 아이디어!

손호성 슬라이드 5-1: 확률 이론 I

Page 12: U À U À X (Expected Value)hosung.weebly.com/uploads/1/7/9/6/17964019/slide5-1.pdf ·  · 2018-09-073/ 65 ˝‘ —X1(Randomness)üU‘¤ (Probability Model) U‘À˘(Random Variable)

12/ 65

서론임의성(Randomness)과 확률모형(Probability Model)

확률변수(Random Variable)확률변수의 기대값(Expected Value)과 분산

임의성(Randomness)확률모형(Probability Model)확률의 규칙

동전 던지기

동전 던지기의 결과:

=⇒ 확률은 어떤 것의 ‘반복을 무수히 많이 했을 때’를 기술하는 숫자!

손호성 슬라이드 5-1: 확률 이론 I

Page 13: U À U À X (Expected Value)hosung.weebly.com/uploads/1/7/9/6/17964019/slide5-1.pdf ·  · 2018-09-073/ 65 ˝‘ —X1(Randomness)üU‘¤ (Probability Model) U‘À˘(Random Variable)

13/ 65

서론임의성(Randomness)과 확률모형(Probability Model)

확률변수(Random Variable)확률변수의 기대값(Expected Value)과 분산

임의성(Randomness)확률모형(Probability Model)확률의 규칙

단어: 임의성(Random)

임의성(Random)

Definition

어떤 행위를 함으로써 나오는 결과가 어떻게 나올지는 불확실하지만

그래도 그 행위를 반복해서 수행을 하면 그 행위를 함으로써 나오는 결과

값에 어떤 특정한 패턴이 나타나게 될 때 그 결과 값을 ‘임의적(random)’인 현상이라고 함

‘임의’라는 단어는 ‘우연’과 동음이의어가 아님!

=⇒ 임의라는 단어는 어떤 행위를 무한히 반복했을 때 나타나는 결과값의 패턴을 기술할 때 사용되는 단어

손호성 슬라이드 5-1: 확률 이론 I

Page 14: U À U À X (Expected Value)hosung.weebly.com/uploads/1/7/9/6/17964019/slide5-1.pdf ·  · 2018-09-073/ 65 ˝‘ —X1(Randomness)üU‘¤ (Probability Model) U‘À˘(Random Variable)

14/ 65

서론임의성(Randomness)과 확률모형(Probability Model)

확률변수(Random Variable)확률변수의 기대값(Expected Value)과 분산

임의성(Randomness)확률모형(Probability Model)확률의 규칙

임의적인 현상의 예

동전을 던졌을 때 앞면이 나오는 비율이 전형적인 임의적인 현상:

1. 동전을 던졌을 때 앞면이 나올지 확실하게 알 수 없음

2. 하지만 동전을 무한히 반복해서 던지면 앞면이 나올 확률이 0.50으로수렴. 즉 결과 값에 어떤 패턴이 생김

아이의 성별도 임의적인 현상:

1. 임신을 했을 때 잉태된 아이가 남아인지 여아인지 확실하게 알 수 없음

2. 하지만 패턴이 있음. 미국의 CIA Fact Book에 따르면 현재 남자 대여자의 비율이 101:100이라고 함

무작위 표본의 결과 값 즉 통계량(예, x̄)도 임의적인 현상!

확률이론은 수학의 한 분야로 이러한 임의적인 현상을 연구하는 학문

손호성 슬라이드 5-1: 확률 이론 I

Page 15: U À U À X (Expected Value)hosung.weebly.com/uploads/1/7/9/6/17964019/slide5-1.pdf ·  · 2018-09-073/ 65 ˝‘ —X1(Randomness)üU‘¤ (Probability Model) U‘À˘(Random Variable)

15/ 65

서론임의성(Randomness)과 확률모형(Probability Model)

확률변수(Random Variable)확률변수의 기대값(Expected Value)과 분산

임의성(Randomness)확률모형(Probability Model)확률의 규칙

확률모형(Probability Model)

임의적인 현상을 묘사한 것을 확률모형이라고 부름

확률모형은 크게 두 가지로 이루어져 있음:

1. 어떤 행위로 인해 나타나게 되는 모든 경우의 결과 값(예, 앞면, 뒷면)

2. 각각의 결과 값이 나올 확률. 예, P (앞면)

모든 경우의 결과 값을 표본공간(sample space)라고 함

=⇒ 확률에서 사용하는 표본이라는 용어와 통계학에서 사용하는표본이라는 용어의 의미하는 바가 조금 다름

손호성 슬라이드 5-1: 확률 이론 I

Page 16: U À U À X (Expected Value)hosung.weebly.com/uploads/1/7/9/6/17964019/slide5-1.pdf ·  · 2018-09-073/ 65 ˝‘ —X1(Randomness)üU‘¤ (Probability Model) U‘À˘(Random Variable)

16/ 65

서론임의성(Randomness)과 확률모형(Probability Model)

확률변수(Random Variable)확률변수의 기대값(Expected Value)과 분산

임의성(Randomness)확률모형(Probability Model)확률의 규칙

표본공간(Sample Space): 간단한 예

Definition

임의적인 현상의 표본공간 S는 모든 가능한 결과 값의 집합을 나타냄

각각의 임의적인 현상의 표본공간을 기술하시오:

1. 동전 던지기의 결과?

=⇒ S = {앞면,뒷면}

2. 육면 주사위 던지기의 결과?

=⇒ S = {1, 2, 3, 4, 5, 6}

3. 출생 당시의 성별?

=⇒ S = {남아,여아}

4. 복지지출 예산을 늘리는 것에 대한 찬반 여부

=⇒ S = {찬성,반대}

손호성 슬라이드 5-1: 확률 이론 I

Page 17: U À U À X (Expected Value)hosung.weebly.com/uploads/1/7/9/6/17964019/slide5-1.pdf ·  · 2018-09-073/ 65 ˝‘ —X1(Randomness)üU‘¤ (Probability Model) U‘À˘(Random Variable)

17/ 65

서론임의성(Randomness)과 확률모형(Probability Model)

확률변수(Random Variable)확률변수의 기대값(Expected Value)과 분산

임의성(Randomness)확률모형(Probability Model)확률의 규칙

표본공간(Sample Space): 복잡한 예

각각의 현상이 임의적인 현상인지 판단하고 임의적인 현상이라면

표본공간을 기술하시오:

1. 무작위 표본의 통계량(평균 체중)?

=⇒ S = {x ∈ R+}

2. 2017년 우리나라 대통령의 성별?

=⇒ 임의적인 현상이 아님. 이제 대통령의 성별을 모두 알고 있음

3. 담배가격을 2배로 올리는 정책이 청소년의 흡연 여부에 미치는 효과?

=⇒ S = {상승,감소,효과 없음}

확률모형을 사용하는 것의 여러 장점 중에 하나가 유사하지 않는

것으로 보이는 서로 다른 현상을 동일한 확률모형을 이용해 묘사할 수

있다는 점

손호성 슬라이드 5-1: 확률 이론 I

Page 18: U À U À X (Expected Value)hosung.weebly.com/uploads/1/7/9/6/17964019/slide5-1.pdf ·  · 2018-09-073/ 65 ˝‘ —X1(Randomness)üU‘¤ (Probability Model) U‘À˘(Random Variable)

18/ 65

서론임의성(Randomness)과 확률모형(Probability Model)

확률변수(Random Variable)확률변수의 기대값(Expected Value)과 분산

임의성(Randomness)확률모형(Probability Model)확률의 규칙

사건(Event)

확률모형 두 가지로 이루어져 있음:

1. 어떤 행위로 인해 나타나게 되는 모든 경우의 결과 값 =⇒ 표본공간!

2. 각각의 결과 값이 나올 확률

임의적인 현상을 완전하게 묘사하기 위해서 해야할 일이 표본공간에

있는 각각의 결과 값에 확률을 부여하는 것

=⇒ 이 때 주의해야 할 점이 표본공간에 있는 각각의 결과 값에 확률을부여해야 할 뿐만 아니라 결과 값의 ‘집합’에도 확률을 부여해야 한다는점

확률이론에서 각각의 결과 값 혹은 결과 값들의 집합을 나타내는 용어:사건(event)

손호성 슬라이드 5-1: 확률 이론 I

Page 19: U À U À X (Expected Value)hosung.weebly.com/uploads/1/7/9/6/17964019/slide5-1.pdf ·  · 2018-09-073/ 65 ˝‘ —X1(Randomness)üU‘¤ (Probability Model) U‘À˘(Random Variable)

19/ 65

서론임의성(Randomness)과 확률모형(Probability Model)

확률변수(Random Variable)확률변수의 기대값(Expected Value)과 분산

임의성(Randomness)확률모형(Probability Model)확률의 규칙

사건(Event)

Definition

사건 A는 임의적인 현상의 결과 값 혹은 결과 값들의 집합을 말함. 사건은표본공간의 부분집합임

사건의 예:

1. 손호성 기업은 본사가 서울에 있고 지사가 총 네 개 도시(부산, 광주, 세종,분당)에 흩어져 있음. 손호성 기업의 신입 직원은 이 다섯 개 도시 중 한도시에 있는 근무지로 배정이 된다고 할 때, 신입 직원이 배정된 도시의이름 또한 임의적인 현상

2. 이 임의적인 현상의 표본공간은

=⇒ S = {서울,부산,광주,전주,분당}

3. 만약 어떤 신입직원이 전라도에 배정이 됐는지 알아보고 싶다고 하겠음.즉 전라도에 배정이 되는 것을 사건 A라고 할 때, 사건 A는

A ={광주, 전주}

손호성 슬라이드 5-1: 확률 이론 I

Page 20: U À U À X (Expected Value)hosung.weebly.com/uploads/1/7/9/6/17964019/slide5-1.pdf ·  · 2018-09-073/ 65 ˝‘ —X1(Randomness)üU‘¤ (Probability Model) U‘À˘(Random Variable)

20/ 65

서론임의성(Randomness)과 확률모형(Probability Model)

확률변수(Random Variable)확률변수의 기대값(Expected Value)과 분산

임의성(Randomness)확률모형(Probability Model)확률의 규칙

확률의 규칙

표본공간을 구성하고 있는 각각의 사건에 확률을 부여하면 임의적인

현상을 완전하게 묘사한 것임

그럼 어떻게 각각의 사건에 확률을 부여할까? ‘임의적으로’ 부여하면될까?

=⇒ 수학자는 ‘임의적인’ 현상을 연구하지만 ‘임의’로 하는 것을 싫어함.확률을 부여할 때는 어떤 원칙에 따라야 함

표본공간에 있는 각각의 사건에 어떤 논리적인 체계에 따라 확률을

부여할 때 지켜야할 기본적인 규칙이 있음

=⇒ 다섯 가지의 확률의 규칙에 대해서 배울 것임

손호성 슬라이드 5-1: 확률 이론 I

Page 21: U À U À X (Expected Value)hosung.weebly.com/uploads/1/7/9/6/17964019/slide5-1.pdf ·  · 2018-09-073/ 65 ˝‘ —X1(Randomness)üU‘¤ (Probability Model) U‘À˘(Random Variable)

21/ 65

서론임의성(Randomness)과 확률모형(Probability Model)

확률변수(Random Variable)확률변수의 기대값(Expected Value)과 분산

임의성(Randomness)확률모형(Probability Model)확률의 규칙

규칙 1

규칙 1: 사건 A의 확률은 다음을 만족해야 함

0 ≤ P (A) ≤ 1

만약 P (A) = 0, 사건 A는 결코 일어나지 않는다는 것

만약 P (A) = 1, 사건 A는 항상 일어난다는 것

만약 P (A) = 0.5, 사건 A가 열 번 중 다섯 번은 일어난다는 것

손호성 슬라이드 5-1: 확률 이론 I

Page 22: U À U À X (Expected Value)hosung.weebly.com/uploads/1/7/9/6/17964019/slide5-1.pdf ·  · 2018-09-073/ 65 ˝‘ —X1(Randomness)üU‘¤ (Probability Model) U‘À˘(Random Variable)

22/ 65

서론임의성(Randomness)과 확률모형(Probability Model)

확률변수(Random Variable)확률변수의 기대값(Expected Value)과 분산

임의성(Randomness)확률모형(Probability Model)확률의 규칙

규칙 2

규칙 2: 어떤 임의적인 현상의 표본공간 S = {A,B,C, ...}가 있을 때,다음을 만족해야 함

P (S) = P (A) + P (B) + P (C) + · · · = 1

규칙 2가 뜻하는 바는 표본공간에 있는 모든 사건의 확률을 더하면 1이된다는 것

동전 던지기에서 표본공간은 S = {앞면,뒷면}. 그러면 다음이 성립

P (S) = P (앞면) + P (뒷면) = 0.5 + 0.5 = 1

손호성 슬라이드 5-1: 확률 이론 I

Page 23: U À U À X (Expected Value)hosung.weebly.com/uploads/1/7/9/6/17964019/slide5-1.pdf ·  · 2018-09-073/ 65 ˝‘ —X1(Randomness)üU‘¤ (Probability Model) U‘À˘(Random Variable)

23/ 65

서론임의성(Randomness)과 확률모형(Probability Model)

확률변수(Random Variable)확률변수의 기대값(Expected Value)과 분산

임의성(Randomness)확률모형(Probability Model)확률의 규칙

규칙 3

규칙 3: 표본공간 S에 존재하는 사건 A와 사건 B가 서로 다르고 또한결코 같이 발생할 수 없으면 이 두 사건은 배반사건(disjoint event)혹은 상호 배반적(mutually exclusive)이라고 함

사건 A와 B가 상호 배반적이면 다음이 성립

P (A 혹은 B) = P (A ∪B) = P (A) + P (B)− P (A ∩B) = P (A) + P (B)

즉 두 사건이 상호 배반적이면

P (A 그리고 B) = P (A ∩B) = 0

손호성 슬라이드 5-1: 확률 이론 I

Page 24: U À U À X (Expected Value)hosung.weebly.com/uploads/1/7/9/6/17964019/slide5-1.pdf ·  · 2018-09-073/ 65 ˝‘ —X1(Randomness)üU‘¤ (Probability Model) U‘À˘(Random Variable)

24/ 65

서론임의성(Randomness)과 확률모형(Probability Model)

확률변수(Random Variable)확률변수의 기대값(Expected Value)과 분산

임의성(Randomness)확률모형(Probability Model)확률의 규칙

규칙 3: 예시

설정:

1. 손호성 기업에서 근무하고 있는 직원의 10%가 석사학위를 소지하고 있고손호성 기업에 근무하고 있는 직원 중 50%는 여성임

2. 그리고 손호성 기업에서 근무하고 있는 직원 중에 석사학위를 소지하고

있는 직원은 모두 여성임

3. 만약 손호성 기업에서 무작위로 어떤 한 직원을 추출했을 때, 이 직원이석사학위 소지자이거나 혹은 남자일 확률은 얼마나 될까?

확률을 계산하기 위해 각각의 상황을 사건화:

1. A = {석사학위 소지자}, B = {남자 직원}. 구해야 할 확률은 P (A ∪B)

2. 제시된 정보에 의하면 석사학위 소지자는 모두 여성. 즉 사건 A와 사건 B는 상호 배반적

3. 따라서 우리가 구해야 할 확률은

P (A ∪B) = P (A) + P (B)− P (A ∩B) = P (A) + P (B) = 0.1 + 0.5 = 0.6

손호성 슬라이드 5-1: 확률 이론 I

Page 25: U À U À X (Expected Value)hosung.weebly.com/uploads/1/7/9/6/17964019/slide5-1.pdf ·  · 2018-09-073/ 65 ˝‘ —X1(Randomness)üU‘¤ (Probability Model) U‘À˘(Random Variable)

25/ 65

서론임의성(Randomness)과 확률모형(Probability Model)

확률변수(Random Variable)확률변수의 기대값(Expected Value)과 분산

임의성(Randomness)확률모형(Probability Model)확률의 규칙

규칙 4

규칙 4: 어떤 사건 A의 여집합(complement)은 사건 A가 일어나지 않는사건을 말하고 이 사건을 Ac라고 표기함. 그리고 그 사건이 일어날확률은

P (Ac) = 1− P (A)

규칙 4를 수학적으로 증명:

표본공간이 n개의 사건들로 구성되어 있다고 하겠음. 즉,S = {A1, A2, ..., An−1, An}

여기서 사건 A는 A = {A1, A2, ..., Ak}라고 한다면 사건Ac = {Ak+1, Ak+2, ..., An}가 됨

P (S) = [P (A1) + · · ·+ P (Ak)] + [P (Ak+1) + · · ·+ P (An)] = 1

=⇒ P (A) + P (Ac) = 1

=⇒ P (Ac) = 1− P (A)

손호성 슬라이드 5-1: 확률 이론 I

Page 26: U À U À X (Expected Value)hosung.weebly.com/uploads/1/7/9/6/17964019/slide5-1.pdf ·  · 2018-09-073/ 65 ˝‘ —X1(Randomness)üU‘¤ (Probability Model) U‘À˘(Random Variable)

26/ 65

서론임의성(Randomness)과 확률모형(Probability Model)

확률변수(Random Variable)확률변수의 기대값(Expected Value)과 분산

임의성(Randomness)확률모형(Probability Model)확률의 규칙

규칙 4: 예시

설정:

1. 휴대폰 중고업체에 총 30개의 중고 휴대폰이 있는데 그 중에 20개는신제품과 비슷할 정도로 질이 좋고 나머지 10개는 조금 질이 떨어짐

2. 휴대폰이 고장난 김경래 선생님이 이 중고업체를 방문. 이 중고업체를운영하고 있는 손호성 사장은 김경래 선생님에게 30개의 중고 휴대폰이모두 신제품과 같다고 속임

3. 이 때, 김경래 선생님이 질이 떨어지는 중고 휴대폰을 선택하게 될 확률은무엇일까?

확률을 계산하기 위해 각각의 상황을 사건화:

1. 사건 A는 A = {새제품 같은 휴대폰}. 그러면 우리가 구해야 할 확률은

P (질 안 좋은 휴대폰) = P (Ac) = 1− P (A) = 1− (21/30) = 1− 0.7 = 0.3

2. 즉, 김경려 선생님이 질이 떨어지는 휴대폰을 선택하게 될 확률은 30%

손호성 슬라이드 5-1: 확률 이론 I

Page 27: U À U À X (Expected Value)hosung.weebly.com/uploads/1/7/9/6/17964019/slide5-1.pdf ·  · 2018-09-073/ 65 ˝‘ —X1(Randomness)üU‘¤ (Probability Model) U‘À˘(Random Variable)

27/ 65

서론임의성(Randomness)과 확률모형(Probability Model)

확률변수(Random Variable)확률변수의 기대값(Expected Value)과 분산

임의성(Randomness)확률모형(Probability Model)확률의 규칙

밴다이어그램을 이용한 확률 개념

손호성 슬라이드 5-1: 확률 이론 I

Page 28: U À U À X (Expected Value)hosung.weebly.com/uploads/1/7/9/6/17964019/slide5-1.pdf ·  · 2018-09-073/ 65 ˝‘ —X1(Randomness)üU‘¤ (Probability Model) U‘À˘(Random Variable)

28/ 65

서론임의성(Randomness)과 확률모형(Probability Model)

확률변수(Random Variable)확률변수의 기대값(Expected Value)과 분산

임의성(Randomness)확률모형(Probability Model)확률의 규칙

규칙 5

다섯 번째 규칙은 두 사건의 독립성과 관련된 내용. 두 사건의 독립성은매우 중요한 개념

우선 확률에서 두 사건의 독립성의 정의:

독립(Independence)

Definition

사건 A가 발생했다는 사실이 사건 B가 발생할 확률에 아무런 영향을 주지않을 때 ‘두 사건 A와 B는 독립(independent)이다’라고 함

손호성 슬라이드 5-1: 확률 이론 I

Page 29: U À U À X (Expected Value)hosung.weebly.com/uploads/1/7/9/6/17964019/slide5-1.pdf ·  · 2018-09-073/ 65 ˝‘ —X1(Randomness)üU‘¤ (Probability Model) U‘À˘(Random Variable)

29/ 65

서론임의성(Randomness)과 확률모형(Probability Model)

확률변수(Random Variable)확률변수의 기대값(Expected Value)과 분산

임의성(Randomness)확률모형(Probability Model)확률의 규칙

규칙 5

규칙 5: 사건 A와 B가 독립이면, 다음이 성립:

P (A 그리고 B) = P (A ∩B) = P (A)P (B)

규칙 5를 독립적인 사건의 승법 규칙이라고 함

동전 던지기가 전형적인 독립사건:

동전 두 번을 연달아 던졌을 때 첫 번째에 동전 앞면(사건 A)이나오고 그 다음에 뒷면(사건 B)이 나올 확률?

이 두 사건은 독립. Why? 처음에 앞면이 나왔다는 사실이 그 다음에뒷면이 나올 확률에 영향을 전혀 주지 않음

그래서 이 규칙 5에 따라 이 확률을 쉽게 구할 수 있음:

P (A 그리고 B) = P (A)P (B) = 0.5× 0.5 = 0.25

손호성 슬라이드 5-1: 확률 이론 I

Page 30: U À U À X (Expected Value)hosung.weebly.com/uploads/1/7/9/6/17964019/slide5-1.pdf ·  · 2018-09-073/ 65 ˝‘ —X1(Randomness)üU‘¤ (Probability Model) U‘À˘(Random Variable)

30/ 65

서론임의성(Randomness)과 확률모형(Probability Model)

확률변수(Random Variable)확률변수의 기대값(Expected Value)과 분산

임의성(Randomness)확률모형(Probability Model)확률의 규칙

종속적인 사건

두 사건이 독립이 아니면 두 사건은 종속적(dependent)이라고 함

지난 번 최소자승 회귀선을 다룰 때 설명변수를 독립변수 그리고

결과변수를 종속변수로 부르지 말 것을 제안했었음. 방금 배운 독립의정의에 따르면 연구를 할 때 독립변수가 ‘독립’인 경우 거의 없음

종속적인 사건의 예. 설정:

1. 토익 시험을 두 번 연달아 치뤘을 때, 첫 번째 토익 점수를 사건 A로 두번째 토익 점수를 사건 B라고 함. 토익 점수도 사건임. 그럼 표본공간(S)은?

2. x를 토익점수라고 했을 때, S = {0 ≤ x ≤ 990;∀x ∈ 0,Z+}이 됨

3. Z+는 양의 정수를 나타내는 표기법이고 ∀은 ‘모든’ 혹은 ‘어떤’을나타내는 수학적 표기법

=⇒ 이런 표기법들이 젠체하는 것 같지만 결코 그렇지 않음. 가독성을굉장히 높여주는 표기법! 고급 과목일수록 이런 표기법을 많이 사용하기때문에 이런 표기법에 자꾸 익숙해질 것을 권함

손호성 슬라이드 5-1: 확률 이론 I

Page 31: U À U À X (Expected Value)hosung.weebly.com/uploads/1/7/9/6/17964019/slide5-1.pdf ·  · 2018-09-073/ 65 ˝‘ —X1(Randomness)üU‘¤ (Probability Model) U‘À˘(Random Variable)

31/ 65

서론임의성(Randomness)과 확률모형(Probability Model)

확률변수(Random Variable)확률변수의 기대값(Expected Value)과 분산

임의성(Randomness)확률모형(Probability Model)확률의 규칙

종속적인 사건

방금 사례에서 사건 A(첫 번째 토익 점수)와 B(두 번째 토익 점수)는독립인가?

두 사건은 독립이 아님

토익을 한 번 치루고 나면 토익 시험에 대한 어떤 경험을 하게 되어

시험에 좀 익숙해질 것인데, 만약 첫 토익 시험에서 토익 시험 문제유형 등에 대해서 많이 배울 수 있었더라면 두 번째 토익 시험에서는 좀

더 문제를 잘 풀 확률이 높을 것임

즉 두 사건은 독립이 아니라는 것을 알 수 있음

=⇒따라서위와같은경우에는규칙 5,즉 P (A 그리고 B) 6= P (A)P (B)

손호성 슬라이드 5-1: 확률 이론 I

Page 32: U À U À X (Expected Value)hosung.weebly.com/uploads/1/7/9/6/17964019/slide5-1.pdf ·  · 2018-09-073/ 65 ˝‘ —X1(Randomness)üU‘¤ (Probability Model) U‘À˘(Random Variable)

32/ 65

서론임의성(Randomness)과 확률모형(Probability Model)

확률변수(Random Variable)확률변수의 기대값(Expected Value)과 분산

임의성(Randomness)확률모형(Probability Model)확률의 규칙

배반 사건 vs. 독립 사건

독립과 관련해서 주의해야할 것은 어떤 두 사건이 ‘독립’인 것과 ‘배반’인 것의 차이점

=⇒ 이 두 개념은 동일한 내용을 기술하는 것이 아님

어떤 두 사건 A와 B가 상호 배반적이면 두 사건 A와 B는 독립이 아님!Why?

두 사건 A와 B가 상호 배반적이면 사건 A와 B가 동시에 일어날 수없음

=⇒ 따라서 만약 사건 A가 발생했으면 사건 B가 결코 발생할 수없다는 것을 알 수 있음. 즉 두 사건은 종속적인 사건

손호성 슬라이드 5-1: 확률 이론 I

Page 33: U À U À X (Expected Value)hosung.weebly.com/uploads/1/7/9/6/17964019/slide5-1.pdf ·  · 2018-09-073/ 65 ˝‘ —X1(Randomness)üU‘¤ (Probability Model) U‘À˘(Random Variable)

33/ 65

서론임의성(Randomness)과 확률모형(Probability Model)

확률변수(Random Variable)확률변수의 기대값(Expected Value)과 분산

임의성(Randomness)확률모형(Probability Model)확률의 규칙

확률 문제 1

확률 계산이 연구와 관련해서 얼마나 중요한지를 연구자에게 일깨워주는 예:

1. 옛날에 보건소로 HIV 바이러스(AIDS의 원인)에 감염되었는지 테스트를받으러 온 사람들이 테스트의 결과를 알아보기 위해 나중에 다시

보건소에 들르지 않아서 문제가 됐던 시기가 있음

2. 그래서 테스트 결과를 몇 분만에 알려주는 고속 HIV 테스트기를 이용해서사람들의 HIV 바이러스 양성/음성 여부를 판단했는데, 문제는 모든테스트기에는 거짓양성율(false positive)이라는 한계점이 존재

=⇒ 어떤 테스트기의 거짓양성율이란 바이러스에 감염되지 않은 사람이바이러스에 감염됐다고(즉 양성이라고) 잘못 나올 확률을 말함

3. 식약청은 그 당시에 어떤 테스트기의 거짓양성율이 2%가 넘으면 그테스트기를 사용 못하게 했는데, 그 당시에 사용된 이 고속 HIV테스트기는 거짓양성율이 2%였음

4. 그럼 HIV 바이러스에 ‘감염되지 않은’ 50명의 사람들을 대상으로 이 고속HIV 테스트기를 이용해 바이러스 감염 여부를 테스트했다면 50명의 사람중 최소한 1명 이상의 사람이 양성으로 잘못 나올 확률은 얼마일까?

손호성 슬라이드 5-1: 확률 이론 I

Page 34: U À U À X (Expected Value)hosung.weebly.com/uploads/1/7/9/6/17964019/slide5-1.pdf ·  · 2018-09-073/ 65 ˝‘ —X1(Randomness)üU‘¤ (Probability Model) U‘À˘(Random Variable)

34/ 65

서론임의성(Randomness)과 확률모형(Probability Model)

확률변수(Random Variable)확률변수의 기대값(Expected Value)과 분산

임의성(Randomness)확률모형(Probability Model)확률의 규칙

확률 문제 1 답

답:

1. 우선 어떤 사람의 테스트 결과가 다른 사람의 테스트 결과에 영향을

미치지 않는다고 가정. 이 가정은 충분히 합리적인 가정

=⇒ 즉 어떤 사람의 테스트 결과를 사건이라고 생각할 수 있는데 각각의사건은 독립적이다라는 것임

2. 우리가 구해야 하는 확률은 최소한 한 명 이상이 양성으로 ‘잘못’ 나올확률

3. B = {양성으로 잘못 나옴}라고 했을 때 i라는 사람한테 B가 발생하는확률 P (Bi)는 0.02임

4. 그럼 C = {음성으로 올바로 나옴}라고 했을 때 P (Ci)는 1− 0.02 = 0.98임

손호성 슬라이드 5-1: 확률 이론 I

Page 35: U À U À X (Expected Value)hosung.weebly.com/uploads/1/7/9/6/17964019/slide5-1.pdf ·  · 2018-09-073/ 65 ˝‘ —X1(Randomness)üU‘¤ (Probability Model) U‘À˘(Random Variable)

35/ 65

서론임의성(Randomness)과 확률모형(Probability Model)

확률변수(Random Variable)확률변수의 기대값(Expected Value)과 분산

임의성(Randomness)확률모형(Probability Model)확률의 규칙

확률 문제 1 답

그럼 우리가 구해야 하는 확률은

P (한 명 이상 양성으로 잘못 나옴) = 1− P (50명의 테스트 결과 모두 음성)

= 1− P (C1 ∩ C2 ∩ C3 ∩ · · · ∩ C50)

= 1− [P (C1)× P (C2)× · · · × P (C50)]

= 1− 0.9850

= 1− 0.364

= 0.636

즉 거짓양성율이 2%인 테스트기를 사용하면 모든 사람이 HIV 바이러스가‘없음에도 불구하고’ 적어도 한 명 이상의 사람이 HIV 바이러스가 있다고오판될 확률이 63.6%나 된다는 것

=⇒ 어마어마하게 높은 확률!

이 확률에 큰 충격을 받은 식약청은 고속 HIV 테스트기 사용을 중지시킴

=⇒ 확률계산을 틀리게 했을 때 얼마나 큰 일이 일어날 수 있음

손호성 슬라이드 5-1: 확률 이론 I

Page 36: U À U À X (Expected Value)hosung.weebly.com/uploads/1/7/9/6/17964019/slide5-1.pdf ·  · 2018-09-073/ 65 ˝‘ —X1(Randomness)üU‘¤ (Probability Model) U‘À˘(Random Variable)

36/ 65

서론임의성(Randomness)과 확률모형(Probability Model)

확률변수(Random Variable)확률변수의 기대값(Expected Value)과 분산

임의성(Randomness)확률모형(Probability Model)확률의 규칙

확률 문제 2

확률 계산이 연구와 관련해서 얼마나 중요한지를 연구자에게 일깨워주는 또

다른 예:

1. 급성 유아 사망 증후군이라는 것이 있음. 아기가 갑자기 아무 이유 없이사망을 하게 됨

2. 영국의 연구 결과에 의하면 비흡연 중산층 가구에서 이 증후군으로

갑자기 유아가 사망하게 되는 확률이 1/8500이라고 계산됨

3. 어떤 한 가정에서 두 명의 유아가 연달아 이 증후군으로 사망을 하면 그

가정의 부모는 고소를 당했음. 고소를 당하게 된 이유는 다음과 같음

1

8500× 1

8500=

1

72250000≈ 0.000000014

=⇒ 즉 두 명의 유아가 연달아 이 증후군으로 사망을 하게 될 확률이 거의없기 때문에 부모가 살인을 했다고 추정을 함

위에 계산된 확률이 맞을까?

손호성 슬라이드 5-1: 확률 이론 I

Page 37: U À U À X (Expected Value)hosung.weebly.com/uploads/1/7/9/6/17964019/slide5-1.pdf ·  · 2018-09-073/ 65 ˝‘ —X1(Randomness)üU‘¤ (Probability Model) U‘À˘(Random Variable)

37/ 65

서론임의성(Randomness)과 확률모형(Probability Model)

확률변수(Random Variable)확률변수의 기대값(Expected Value)과 분산

임의성(Randomness)확률모형(Probability Model)확률의 규칙

확률 문제 2

계산된 확률 틀림!!

1. 위에서 확률을 계산할 때 두 사건 즉 첫 번째 유아가 사망하는 사건과 두

번째 유아가 사망하는 사건이 서로 독립이라고 가정

2. 두 사건이 독립인가?

3. 급성 유아 사망 증후군의 ‘원인’은 아직 안 밝혀졌음!!

4. 이 증후군의 원인에는 유전적인 요인, 환경적인 요인 등 다양한 요인이작용할 소지가 큼

=⇒ 따라서 두 사건은 결코 독립적인 사건이 아님!

이 때문에 영국 정부는 이 사실이 알려지기 전까지 유죄 판결을 받은

258명의 부모에 대한 사건을 다시 검토하였음

손호성 슬라이드 5-1: 확률 이론 I

Page 38: U À U À X (Expected Value)hosung.weebly.com/uploads/1/7/9/6/17964019/slide5-1.pdf ·  · 2018-09-073/ 65 ˝‘ —X1(Randomness)üU‘¤ (Probability Model) U‘À˘(Random Variable)

38/ 65

서론임의성(Randomness)과 확률모형(Probability Model)

확률변수(Random Variable)확률변수의 기대값(Expected Value)과 분산

확률변수(Random Variable)이산확률분포연속확률분포

확률변수(Random Variable)

표본공간을 구성하는 사건이 숫자인 경우에 대해서 다루도록 하겠음

여기서 강조하고 싶은 것은 어떤 사건이 양적(quantitative)인 경우를다룬다고 해서 질적(qualitative)인 경우를 다루지 않는다는 얘기가 아님

=⇒ 질적인 사건도 양적으로 표시할 수 있기 때문

예를 들어 모집단에서 무작위 표본을 추출한 후 각각의 사람 별로 현재

정규직인지 혹은 비정규직인지에 대한 조사를 했다고 하겠음. 즉 관심변수는 정규직 여부를 나타내는 질적인 변수

=⇒ 하지만 이 질적 변수를 양적 변수로 변환할 수 있음. 정규직이면 1이라는 숫자를 부여하고 비정규직이면 0이라는 숫자를 부여하면 이질적 변수는 1 혹은 0을 취하는 양적 변수로 변환이 됨

손호성 슬라이드 5-1: 확률 이론 I

Page 39: U À U À X (Expected Value)hosung.weebly.com/uploads/1/7/9/6/17964019/slide5-1.pdf ·  · 2018-09-073/ 65 ˝‘ —X1(Randomness)üU‘¤ (Probability Model) U‘À˘(Random Variable)

39/ 65

서론임의성(Randomness)과 확률모형(Probability Model)

확률변수(Random Variable)확률변수의 기대값(Expected Value)과 분산

확률변수(Random Variable)이산확률분포연속확률분포

확률변수(Random Variable)

통계학 및 계량경제학에서 상당히 중요한 개념인 확률변수에 대해서 공부를

해보도록 하겠음

확률변수(Random Variable)

Definition어떤 실험이나 행위를 하기 전에 변수 X가 취하는 값이 무엇인지 확실하게 예측할수 없을 때 그런 변수를 확률변수라고 함

왜 ‘random’이라는 단어를 확률이라고 번역? 아까는 임의적이라고 번역했고,통계학에서는 무작위라고 번역을 했는데 이번에는 확률

이 ‘random’이라는 단어가 의미하는 바가 워낙에 다양해서 이렇게 번역이 되는것 같음

용어에 대한 정의를 정확하게 이해하고 있으면 어떤 단어로 번역이 되든

문제가 없음. 모든 학문에서 마찬가지만 특히 통계학을 공부할 때는 항상용어에 대한 정의를 정확하게 이해하고 넘어가는 습관을 가져야 함

손호성 슬라이드 5-1: 확률 이론 I

Page 40: U À U À X (Expected Value)hosung.weebly.com/uploads/1/7/9/6/17964019/slide5-1.pdf ·  · 2018-09-073/ 65 ˝‘ —X1(Randomness)üU‘¤ (Probability Model) U‘À˘(Random Variable)

40/ 65

서론임의성(Randomness)과 확률모형(Probability Model)

확률변수(Random Variable)확률변수의 기대값(Expected Value)과 분산

확률변수(Random Variable)이산확률분포연속확률분포

확률변수(Random Variable)

예를 통해 확률변수가 무엇을 의미하는지 알아보도록 하겠음

50명의 임금근로자를 무작위로 추출하여 각각의 사람에게 현재정규직인지 혹은 비정규직인지 물어봄

변수 X는 이 50명의 표본에서 정규직인 사람의 수를 나타냄

이 변수 X는 확률변수! Why?

=⇒ 실제로 표본을 추출하기 전에는 X가 어떤 값인지 확실하게 예측할수 없기 때문

크게 두 종류의 확률변수가 존재:

1. 이산확률변수

2. 연속확률변수

손호성 슬라이드 5-1: 확률 이론 I

Page 41: U À U À X (Expected Value)hosung.weebly.com/uploads/1/7/9/6/17964019/slide5-1.pdf ·  · 2018-09-073/ 65 ˝‘ —X1(Randomness)üU‘¤ (Probability Model) U‘À˘(Random Variable)

41/ 65

서론임의성(Randomness)과 확률모형(Probability Model)

확률변수(Random Variable)확률변수의 기대값(Expected Value)과 분산

확률변수(Random Variable)이산확률분포연속확률분포

이산확률변수(Discrete Random Variable)

이산확률변수의 정의:

Definition

유한수(finite number)의 값을 취하는 확률변수를 이산확률변수(discreterandom variable)라고 함

이산확률변수의 예:

X = 5월 중 세종시에 비가 온 일수: X가 취할 수 있는 값은 0, 1, 2, ..., 30,31

X = 1,000명으로 구성된 표본에서 여성의 수: X가 취할 수 있는 값은 0,1, 2, ..., 1,000

X = n개 크기의 표본을 100번 추출했을 때 표본평균이 50 이상인 표본의개수: X가 취할 수 있는 값은 0, 1, 2, ... 100

손호성 슬라이드 5-1: 확률 이론 I

Page 42: U À U À X (Expected Value)hosung.weebly.com/uploads/1/7/9/6/17964019/slide5-1.pdf ·  · 2018-09-073/ 65 ˝‘ —X1(Randomness)üU‘¤ (Probability Model) U‘À˘(Random Variable)

42/ 65

서론임의성(Randomness)과 확률모형(Probability Model)

확률변수(Random Variable)확률변수의 기대값(Expected Value)과 분산

확률변수(Random Variable)이산확률분포연속확률분포

이산확률분포

확률모형은 두 가지로 이루어져 있다고 했음:

1. 변수 X가 취할 수 있는 값이 무엇인지

2. 그리고 각각의 값이 나올 확률이 무엇인지

어떤 확률모형이 다루고 있는 것이 이산확률변수일 때, 위 두 가지를알려주는 것이 이산확률분포(discrete probability distribution)

Definition

이산확률분포(discrete probability distribution)는 이산확률변수 X가취할 수 있는 모든 값 xi와 각각의 값이 나올 확률 P (X = xi)을 표시한 표,그림, 혹은 규칙을 말함

손호성 슬라이드 5-1: 확률 이론 I

Page 43: U À U À X (Expected Value)hosung.weebly.com/uploads/1/7/9/6/17964019/slide5-1.pdf ·  · 2018-09-073/ 65 ˝‘ —X1(Randomness)üU‘¤ (Probability Model) U‘À˘(Random Variable)

43/ 65

서론임의성(Randomness)과 확률모형(Probability Model)

확률변수(Random Variable)확률변수의 기대값(Expected Value)과 분산

확률변수(Random Variable)이산확률분포연속확률분포

이산확률분포

이산확률변수 X가 취할 수 있는 값이 네 개라고 할 때(x1, x2, x3, x4), 이X의 이산확률분포를 표로 나타내면

X가 취하는 값 x1 x2 x3 x4

확률 P (X = x1) = p1 P (X = x2) = p2 P (X = x3) = p3 P (X = x4) = p4

위 위산확률분포를 그림으로 나타내면

손호성 슬라이드 5-1: 확률 이론 I

Page 44: U À U À X (Expected Value)hosung.weebly.com/uploads/1/7/9/6/17964019/slide5-1.pdf ·  · 2018-09-073/ 65 ˝‘ —X1(Randomness)üU‘¤ (Probability Model) U‘À˘(Random Variable)

44/ 65

서론임의성(Randomness)과 확률모형(Probability Model)

확률변수(Random Variable)확률변수의 기대값(Expected Value)과 분산

확률변수(Random Variable)이산확률분포연속확률분포

이산확률분포

모든 이산확률분포는 다음의 두 규칙을 만족:

1. 0 ≤ P (X = xi) ≤ 1, ∀i

2. P (X = x1) + P (X = x2) + · · · = 1

첫 번째 규칙은 변수 X가 취할 수 있는 각각의 값이 나올 확률은 0과 1사이라는 것

그리고 두 번째 규칙은 각각의 값이 나올 확률을 모두 더하면 1이된다는 것

손호성 슬라이드 5-1: 확률 이론 I

Page 45: U À U À X (Expected Value)hosung.weebly.com/uploads/1/7/9/6/17964019/slide5-1.pdf ·  · 2018-09-073/ 65 ˝‘ —X1(Randomness)üU‘¤ (Probability Model) U‘À˘(Random Variable)

45/ 65

서론임의성(Randomness)과 확률모형(Probability Model)

확률변수(Random Variable)확률변수의 기대값(Expected Value)과 분산

확률변수(Random Variable)이산확률분포연속확률분포

이산확률분포

이산확률분포의 구체적인 예:

“통계학 강의를 하고 있는 손호성 부연구위원은 수강생들의 중간시험 성적결과를 홈페이지에 공개했는데, 분포를 보면 31%의 수강생이 A를 40%의수강생이 B를 20%의 수강생이 C를 4%의 수강생이 D를 그리고 5%의수강생이 F를 맞음”

손호성 부연구위원의 통계학 강의를 듣고 있는 수강생 중 한 명을 무작위로

뽑았을 때 이 수강생의 시험성적 X는 확률변수임. Why?

=⇒ 실제로 뽑기 전에는 수강생의 성적을 확실하게 예측할 수 없기 때문!

X는 이산확률변수. 왜냐하면 X가 취하는 값을 유한수로 표시할 수 있기 때문(A = 4, B = 3, C = 2, D = 1, F = 0)

이 이산확률변수 X의 이산확률분포는

X가 취하는 값 0 1 2 3 4

확률 0.05 0.04 0.20 0.40 0.31

손호성 슬라이드 5-1: 확률 이론 I

Page 46: U À U À X (Expected Value)hosung.weebly.com/uploads/1/7/9/6/17964019/slide5-1.pdf ·  · 2018-09-073/ 65 ˝‘ —X1(Randomness)üU‘¤ (Probability Model) U‘À˘(Random Variable)

46/ 65

서론임의성(Randomness)과 확률모형(Probability Model)

확률변수(Random Variable)확률변수의 기대값(Expected Value)과 분산

확률변수(Random Variable)이산확률분포연속확률분포

이산확률분포

X가 취하는 값 0 1 2 3 4

확률 0.05 0.04 0.20 0.40 0.31

위 표가 타당한 이산확률분포일까요?

1. 0 ≤ P (X = xi) ≤ 1 ∀i?

=⇒ 0 ≤ P (X = xi) ≤ 1, ∀i ∈ {1, 2, 3, 4}

2. P (X = x1) + P (X = x2) + · · · = 1?

=⇒ P (X = x1) + P (X = x2) + P (X = x3) + P (X = x4)

= 0.05 + 0.04 + 0.20 + 0.40 + 0.31

= 1

두 규칙을 만족하므로 타당한 이산확률분포임

손호성 슬라이드 5-1: 확률 이론 I

Page 47: U À U À X (Expected Value)hosung.weebly.com/uploads/1/7/9/6/17964019/slide5-1.pdf ·  · 2018-09-073/ 65 ˝‘ —X1(Randomness)üU‘¤ (Probability Model) U‘À˘(Random Variable)

47/ 65

서론임의성(Randomness)과 확률모형(Probability Model)

확률변수(Random Variable)확률변수의 기대값(Expected Value)과 분산

확률변수(Random Variable)이산확률분포연속확률분포

이산확률분포

X가 취하는 값 0 1 2 3 4

확률 0.05 0.04 0.20 0.40 0.31

위 이산확률분포를 그림으로 나타내면

손호성 슬라이드 5-1: 확률 이론 I

Page 48: U À U À X (Expected Value)hosung.weebly.com/uploads/1/7/9/6/17964019/slide5-1.pdf ·  · 2018-09-073/ 65 ˝‘ —X1(Randomness)üU‘¤ (Probability Model) U‘À˘(Random Variable)

48/ 65

서론임의성(Randomness)과 확률모형(Probability Model)

확률변수(Random Variable)확률변수의 기대값(Expected Value)과 분산

확률변수(Random Variable)이산확률분포연속확률분포

연속확률분포

확률변수의 두 번째 종류는 연속확률변수

Definition확률변수 X가 어떤 구간에 있는 모든 형태의 숫자(예, 정수, 유리수, 무리수 등)를취할 수 있으면 그런 확률변수를 연속확률변수(continuous random variable)라고 함

X가 어떤 구간에 있는 모든 숫자를 취할 수 있다는 것이 무슨 뜻?

예, X = 손호성 체중

창피한 얘기지만 제 체중은 95kg. 압니다. 빼야한다는 걸

암튼 누가 저한테 체중이 뭐냐고 물으면 95kg이라고 답함. 하지만 체중을 좀 더정확하게 말하면 95.33임

더 정확하게 잴 수 있음. 95.33423432. 이것보다 더 정확하게 잴 수 있음.95.334234323423434323. 끝이 안남. 즉 어떤 확률변수가 이런 값을 취할 수있을 때 그런 변수를 연속확률변수라고 함

손호성 슬라이드 5-1: 확률 이론 I

Page 49: U À U À X (Expected Value)hosung.weebly.com/uploads/1/7/9/6/17964019/slide5-1.pdf ·  · 2018-09-073/ 65 ˝‘ —X1(Randomness)üU‘¤ (Probability Model) U‘À˘(Random Variable)

49/ 65

서론임의성(Randomness)과 확률모형(Probability Model)

확률변수(Random Variable)확률변수의 기대값(Expected Value)과 분산

확률변수(Random Variable)이산확률분포연속확률분포

연속확률분포

연속확률변수에도 연속확률분포가 있음

Definition

연속확률변수의 연속확률분포(continuous probability distributions)는밀도곡선으로 표시됨. 따라서 어떤 사건이 일어날 확률은 그 사건을 구성하는 X값위의 밀도곡선의 면적

연속확률변수의 확률모형은 각각의 결과 값에 확률을 부여하지 않고 결과의

‘구간’ 값에 확률을 부여함. 달리 표현을 하면 연속확률분포에서 각각의 결과값의 확률은 0임. 수학적으로 표현하면

P (X = xi) = 0

따라서 다음 식이 성립:

P (X = xi) = 0 =⇒ P (X > xi) = P (X ≥ xi)

=⇒ 연속확률변수를 다룰 때는 >와 ≥의 구분에 상관 없이 표기

손호성 슬라이드 5-1: 확률 이론 I

Page 50: U À U À X (Expected Value)hosung.weebly.com/uploads/1/7/9/6/17964019/slide5-1.pdf ·  · 2018-09-073/ 65 ˝‘ —X1(Randomness)üU‘¤ (Probability Model) U‘À˘(Random Variable)

50/ 65

서론임의성(Randomness)과 확률모형(Probability Model)

확률변수(Random Variable)확률변수의 기대값(Expected Value)과 분산

확률변수(Random Variable)이산확률분포연속확률분포

연속확률분포의 예: 균일분포

연속확률분포의 예:

“어떤 숫자를 무작위로 생성해주는 장치가 있음. 이 장치는 어떤 결과와관련해서 0과 1사이의 구간 내에 존재하는 아무 숫자를 균일하게 생성함. 이장치를 통해 여러 번 숫자를 생성하게 될 때 나오는 연속확률분포를 균일분포

(uniform distribution)라고 하는데, 이 균일분포 하에서는 각각의 사건이나올 확률이 모두 동일”

밑에 그림이 균일분포의 밀도곡선인데 총 면적은?

손호성 슬라이드 5-1: 확률 이론 I

Page 51: U À U À X (Expected Value)hosung.weebly.com/uploads/1/7/9/6/17964019/slide5-1.pdf ·  · 2018-09-073/ 65 ˝‘ —X1(Randomness)üU‘¤ (Probability Model) U‘À˘(Random Variable)

51/ 65

서론임의성(Randomness)과 확률모형(Probability Model)

확률변수(Random Variable)확률변수의 기대값(Expected Value)과 분산

확률변수(Random Variable)이산확률분포연속확률분포

연속확률분포의 예: 균일분포

예를 들어, 숫자를 무작위로 생성해주는 이 장치가 연속확률변수 X가 갖는값으로 0.3에서 0.7 사이에 있는 숫자를 생성할 확률은?

P (0.3 ≤ X ≤ 0.7) = (0.7− 0.3)× 1

= 0.4

P (X < 0.5 or X > 0.8)는? 이 사건은 두 개의 배반 사건으로 구성되어 있음

=⇒ P (X < 0.5 or X > 0.8) = P (X < 0.5) + P (X > 0.8) = 0.5 + 0.2 = 0.7

손호성 슬라이드 5-1: 확률 이론 I

Page 52: U À U À X (Expected Value)hosung.weebly.com/uploads/1/7/9/6/17964019/slide5-1.pdf ·  · 2018-09-073/ 65 ˝‘ —X1(Randomness)üU‘¤ (Probability Model) U‘À˘(Random Variable)

52/ 65

서론임의성(Randomness)과 확률모형(Probability Model)

확률변수(Random Variable)확률변수의 기대값(Expected Value)과 분산

확률변수(Random Variable)이산확률분포연속확률분포

연속확률분포의 예: 균일분포

균일분포를 보면 왜 연속확률분포에서는 ‘구간’이 아닌 어떤 특정한 값의확률이 0이 되는지 직관적으로 알 수 있음

균일분포 하에서 P (X = 0.3)를 계산:

1. 일단 P (X = 0.3)를 계산하기 전에 P (0.29 ≤ X ≤ 0.30)을 계산하면?

P (0.29 ≤ X ≤ 0.30) = (0.30− 0.29)× 1 = 0.01

2. 이번에는 P (0.299999 ≤ X ≤ 0.30)을 계산하면?

P (0.299999 ≤ X ≤ 0.30) = (0.30− 0.299999)× 1 = 0.000001

3. 그럼 P (0.2999999999 ≤ X ≤ 0.30)?

P (0.2999999999 ≤ X ≤ 0.30) = (0.30− 0.2999999999)× 1 = 0.0000000001

=⇒ 이런 식으로 계속 하다보면 P (X = 0.3)의 확률은 0으로 수렴한다는 것을알 수 있음

손호성 슬라이드 5-1: 확률 이론 I

Page 53: U À U À X (Expected Value)hosung.weebly.com/uploads/1/7/9/6/17964019/slide5-1.pdf ·  · 2018-09-073/ 65 ˝‘ —X1(Randomness)üU‘¤ (Probability Model) U‘À˘(Random Variable)

53/ 65

서론임의성(Randomness)과 확률모형(Probability Model)

확률변수(Random Variable)확률변수의 기대값(Expected Value)과 분산

확률변수(Random Variable)이산확률분포연속확률분포

연속확률분포의 예: 정규분포

정규분포 또한 연속확률분포의 예. 확률변수라는 용어를 통해 정규분포다시 설명

연속확률변수 X가 정규분포를 따름:

X ∼ N(µ, σ)

이 연속확률변수 X를 표준화했을 때 형성되는 변수 Z도연속확률변수가 됨. 그리고 Z도 정규분포를 따름:

Z ∼ N(0, 1)

이 연속확률변수 X 혹은 Z가 어떤 구간에 있는 값을 갖을 확률을계산할 수 있음

손호성 슬라이드 5-1: 확률 이론 I

Page 54: U À U À X (Expected Value)hosung.weebly.com/uploads/1/7/9/6/17964019/slide5-1.pdf ·  · 2018-09-073/ 65 ˝‘ —X1(Randomness)üU‘¤ (Probability Model) U‘À˘(Random Variable)

54/ 65

서론임의성(Randomness)과 확률모형(Probability Model)

확률변수(Random Variable)확률변수의 기대값(Expected Value)과 분산

확률변수(Random Variable)이산확률분포연속확률분포

연속확률분포의 예: 정규분포

예:

“운전을 하면서 휴대폰으로 인터넷을 하면 굉장히 위험. 하지만 20대들은 항상 ‘좋아요’에 관심이 많아서 휴대폰을 항상 손에 쥐고 싶어함. 약 26%의 20대들이 실제로 운전을 하면서 휴대폰으로 인터넷을한다고 함”

위 예에서 모수는 p = 0.26. 물론 연구를 할 때는 이 모수 값을 모름

이러한 모집단에서 1,000명의 20대들을 무작위로 추출해서 이 표본에서운전 중에 휴대폰으로 인터넷을 하는 20대들의 비율을 계산하였고 그값을 p̂이라고 하겠음

=⇒ 즉 p̂은 통계량

연구자는 이 통계량 p̂을 갖고 모집단 p에 대한 추정을 하게 됨

손호성 슬라이드 5-1: 확률 이론 I

Page 55: U À U À X (Expected Value)hosung.weebly.com/uploads/1/7/9/6/17964019/slide5-1.pdf ·  · 2018-09-073/ 65 ˝‘ —X1(Randomness)üU‘¤ (Probability Model) U‘À˘(Random Variable)

55/ 65

서론임의성(Randomness)과 확률모형(Probability Model)

확률변수(Random Variable)확률변수의 기대값(Expected Value)과 분산

확률변수(Random Variable)이산확률분포연속확률분포

연속확률분포의 예: 정규분포

여기서 강조할 것은 p̂은 ‘확률변수’라는 사실!!

=⇒ Why?

표본을 추출하기 전에 이 p̂이 어떤 값이 나올지 모름. 어떤 표본을추출했냐에 따라 p̂ 값은 달라질 것이기 때문

자 여기서 이 통계량 p̂ ∼ N(0.26, 0.0196)라고 가정

p̂ ∼ N(0.26, 0.0196)가 무엇을 의미?

=⇒ n =1,000명인 표본을 모집단에서 여러 번 추출하고, 추출할 때마다p̂을 계산. 예를 들어 100번을 추출했다고 하면 우리에게는 100개의 p̂이있음. 이 100개의 p̂의 분포의 모양은 정규분포이고 이 100개의 평균은0.26, 그리고 표준편차는 0.0196이라는 것임!

손호성 슬라이드 5-1: 확률 이론 I

Page 56: U À U À X (Expected Value)hosung.weebly.com/uploads/1/7/9/6/17964019/slide5-1.pdf ·  · 2018-09-073/ 65 ˝‘ —X1(Randomness)üU‘¤ (Probability Model) U‘À˘(Random Variable)

56/ 65

서론임의성(Randomness)과 확률모형(Probability Model)

확률변수(Random Variable)확률변수의 기대값(Expected Value)과 분산

확률변수(Random Variable)이산확률분포연속확률분포

연속확률분포의 예: 정규분포

질문:

“어떤 한 개의 표본을 통해 구한 p̂이 실제 모집단 p와 3%p 이내로차이가 날 확률은 어떻게 될까요?”

지금까지 배운 내용을 토대로 위 확률을 계산할 수 있음

=⇒ p = 0.26이므로 P (0.23 ≤ p̂ ≤ 0.29)를 구하는 것이 문제

p̂은 확률변수이고 정규분포를 따르기 때문에 연속확률분포임. 따라서확률을 구하기 위해서는 밀도곡선 상의 면적을 구하면 됨

손호성 슬라이드 5-1: 확률 이론 I

Page 57: U À U À X (Expected Value)hosung.weebly.com/uploads/1/7/9/6/17964019/slide5-1.pdf ·  · 2018-09-073/ 65 ˝‘ —X1(Randomness)üU‘¤ (Probability Model) U‘À˘(Random Variable)

57/ 65

서론임의성(Randomness)과 확률모형(Probability Model)

확률변수(Random Variable)확률변수의 기대값(Expected Value)과 분산

확률변수(Random Variable)이산확률분포연속확률분포

연속확률분포의 예: 정규분포

손호성 슬라이드 5-1: 확률 이론 I

Page 58: U À U À X (Expected Value)hosung.weebly.com/uploads/1/7/9/6/17964019/slide5-1.pdf ·  · 2018-09-073/ 65 ˝‘ —X1(Randomness)üU‘¤ (Probability Model) U‘À˘(Random Variable)

58/ 65

서론임의성(Randomness)과 확률모형(Probability Model)

확률변수(Random Variable)확률변수의 기대값(Expected Value)과 분산

확률변수(Random Variable)이산확률분포연속확률분포

연속확률분포의 예: 정규분포

즉 다음과 같이 면적을 구할 수 있음:

P (0.23 ≤ p̂ ≤ 0.29) = P

(0.23− 0.26

0.0196≤ p̂− 0.26

0.0196≤ 0.29− 0.26

0.0196

)= P (−1.53 ≤ Z ≤ 1.53)

= 0.937− 0.063 = 0.874

즉, 어떤 한 개의 표본을 통해 구한 p̂이 실제 모집단 p와 3%p 이내로 차이가 날확률은 약 87%

이 확률을 해석해보면, 모집단에서 1,000명의 20대들을 무작위로 추출해서 그표본을 통해 구한 p̂ 값(즉 1,000명 중에서 운전할 때 휴대폰으로 인터넷을 하는20대들의 비율)이 실제 모집단 모수 값과 3%p 내로 차이가 날 확률이 87%나된다는 것임

이 확률을 근거로 ‘어떤 표본을 추출하던’ 그 표본의 통계량이 모집단 모수와비슷할 것이다라고 신뢰할 만한 합리적인 이유가 있다고 할 수 있는지?

=⇒ 이 판단을 하기 위해 나중에 통계적 추론 때 여러 가지 방법에 대해서 배울것임

손호성 슬라이드 5-1: 확률 이론 I

Page 59: U À U À X (Expected Value)hosung.weebly.com/uploads/1/7/9/6/17964019/slide5-1.pdf ·  · 2018-09-073/ 65 ˝‘ —X1(Randomness)üU‘¤ (Probability Model) U‘À˘(Random Variable)

59/ 65

서론임의성(Randomness)과 확률모형(Probability Model)

확률변수(Random Variable)확률변수의 기대값(Expected Value)과 분산

확률변수의 기대값(Expected Value)

확률변수의 분포

자료를 검토할 때 알아봐야 할 세 가지:

1. 분포의 중앙

2. 분포의 변이(산포도)

3. 분포의 모양

=⇒ 이 세 가지를 표, 그림, 그리고 수치적 지표(예, 평균, 분산 등)를통해 알아봐야 한다고 했음

마찬가지로 확률변수와 관련해서도 세 가지, 즉 확률변수의 중앙, 변이,그리고 모양을 알아야 함

손호성 슬라이드 5-1: 확률 이론 I

Page 60: U À U À X (Expected Value)hosung.weebly.com/uploads/1/7/9/6/17964019/slide5-1.pdf ·  · 2018-09-073/ 65 ˝‘ —X1(Randomness)üU‘¤ (Probability Model) U‘À˘(Random Variable)

60/ 65

서론임의성(Randomness)과 확률모형(Probability Model)

확률변수(Random Variable)확률변수의 기대값(Expected Value)과 분산

확률변수의 기대값(Expected Value)

확률변수의 기대값(Expected Value)

‘관측치’ 값들의 평균을 나타날 때, 모집단에서는 µ 그리고 표본에서는x̄라는 표기법을 사용

‘확률변수’의 평균을 나타낼 때는 ‘기대값(expected value)’이라는용어를 사용

확률변수는 어떤 임의적인(random) 현상의 결과 값. 다시 말해 뭔가확신을 갖고 어떤 결과 값이 나올지 모르는 변수가 확률변수!

이러한 확률변수의 기대값이란 무엇을 뜻하는 걸까?

=⇒ 확률변수의 기대값은 확률변수 X의 ‘확률분포’의 중앙을 나타내는지표!

확률변수 X의 기대값은 E(X)라고 표기

손호성 슬라이드 5-1: 확률 이론 I

Page 61: U À U À X (Expected Value)hosung.weebly.com/uploads/1/7/9/6/17964019/slide5-1.pdf ·  · 2018-09-073/ 65 ˝‘ —X1(Randomness)üU‘¤ (Probability Model) U‘À˘(Random Variable)

61/ 65

서론임의성(Randomness)과 확률모형(Probability Model)

확률변수(Random Variable)확률변수의 기대값(Expected Value)과 분산

확률변수의 기대값(Expected Value)

확률변수의 기대값(Expected Value)

기대값이 정확하게 무엇을 뜻하는지 좀 더 확실히 이해하기 위해서 x̄를이용해서 설명

x̄는 통계량! 이 통계량도 확률변수임. 왜냐하면 표본을 실제 추출해서그 표본의 평균을 구하기 전까지는 확실하게 그 값을 모르기 때문

x̄도 확률변수이면 x̄도 기대값이 있을 것임

=⇒ 즉 E (x̄)

질문:

“E (x̄)와 x̄의 차이점은?”

손호성 슬라이드 5-1: 확률 이론 I

Page 62: U À U À X (Expected Value)hosung.weebly.com/uploads/1/7/9/6/17964019/slide5-1.pdf ·  · 2018-09-073/ 65 ˝‘ —X1(Randomness)üU‘¤ (Probability Model) U‘À˘(Random Variable)

62/ 65

서론임의성(Randomness)과 확률모형(Probability Model)

확률변수(Random Variable)확률변수의 기대값(Expected Value)과 분산

확률변수의 기대값(Expected Value)

확률변수의 기대값(Expected Value)

“E (x̄) vs. x̄”

이 시점에서 위 두 개의 차이점을 알고 있다면 최소한 저보다는

똑똑하다는 것임!

차이점:

손호성 슬라이드 5-1: 확률 이론 I

Page 63: U À U À X (Expected Value)hosung.weebly.com/uploads/1/7/9/6/17964019/slide5-1.pdf ·  · 2018-09-073/ 65 ˝‘ —X1(Randomness)üU‘¤ (Probability Model) U‘À˘(Random Variable)

63/ 65

서론임의성(Randomness)과 확률모형(Probability Model)

확률변수(Random Variable)확률변수의 기대값(Expected Value)과 분산

확률변수의 기대값(Expected Value)

이산확률변수의 기대값

이산확률변수의 기대값의 정의:

Definition이산확률변수 X의 기대값(expected value)은 E(X)로 표기하고 이 기대값은다음과 같이 구할 수 있음

E(X) = µX =

k∑i=1

xipi

= x1p1 + x2p2 + · · ·+ xkpk

위 식에서 xi는 확률변수 X가 취할 수 있는 값이고 pi는 각각의 값이 나올 확률, 즉pi = P (X = xi)임

확률변수의 평균을 왜 기대값이라고 하냐면 우리가 표본 추출을 반복적으로

그리고 매우 여러 번 하게 됐을 때 기대할 수 있는 값이기 때문

손호성 슬라이드 5-1: 확률 이론 I

Page 64: U À U À X (Expected Value)hosung.weebly.com/uploads/1/7/9/6/17964019/slide5-1.pdf ·  · 2018-09-073/ 65 ˝‘ —X1(Randomness)üU‘¤ (Probability Model) U‘À˘(Random Variable)

64/ 65

서론임의성(Randomness)과 확률모형(Probability Model)

확률변수(Random Variable)확률변수의 기대값(Expected Value)과 분산

확률변수의 기대값(Expected Value)

연속확률변수의 기대값

연속확률변수의 기대값은?

연속확률변수의 확률분포는 밀도곡선으로 나타내기 때문에 밀도곡선의

평균이 연속확률변수의 기대값

=⇒ 직관적으로 말해 연속확률변수의 기대값은 밀도곡선을 손가락위에 올려 놨을 때 밀도곡선에 밸런스가 유지되는 지점을 말함

손호성 슬라이드 5-1: 확률 이론 I

Page 65: U À U À X (Expected Value)hosung.weebly.com/uploads/1/7/9/6/17964019/slide5-1.pdf ·  · 2018-09-073/ 65 ˝‘ —X1(Randomness)üU‘¤ (Probability Model) U‘À˘(Random Variable)

65/ 65

서론임의성(Randomness)과 확률모형(Probability Model)

확률변수(Random Variable)확률변수의 기대값(Expected Value)과 분산

확률변수의 기대값(Expected Value)

연속확률변수의 기대값

물론 연속확률변수의 기대값도 이산확률변수의 기대값을 계산할

때처럼 엄밀하게 계산할 수 있음

연속확률변수의 기대값 공식은

E(X) =

∫ b

a

xf(x)dx

=⇒ 즉 pi를 f(x)로∑을

∫로 대체한 것에 불과

왜 적분기호를 쓰냐하면 연속확률변수에서 확률은 밀도곡선의

면적으로 표시되기 때문

손호성 슬라이드 5-1: 확률 이론 I