63
สรุปสูตรคณิตศาสตร์ สถิติเบื้องต้น เรียบเรียงนาเสนอโดย ครูธีระศักดิเกิดทอง ครูประจาวิชาคณิตศาสตร์เพิ่มเติม 5 และ 6 โรงเรียนอุตรดิตถ์ดรุณี

สรุปสูตรคณิตศาสตร์ สถิติเบื้องต้น · สรุปสูตรคณิตศาสตร์ สถิติเบื้องต้น

  • Upload
    others

  • View
    11

  • Download
    0

Embed Size (px)

Citation preview

สรุปสูตรคณิตศาสตร์

สถิติเบื้องต้นเรียบเรียงน าเสนอโดยครูธีระศักดิ์ เกิดทอง

ครูประจ าวิชาคณิตศาสตร์เพิ่มเติม 5 และ 6 โรงเรียนอุตรดิตถ์ดรุณี

การวัดค่ากลางของข้อมูล

มีหลายชนิด แต่ในระดับชั้นนี้จะศึกษาเกี่ยวกับ ค่าเฉลี่ยเลขคณิต (arithmatic mean)

มัธยฐาน (median)

ฐานนิยม (mode)

ค่าเฉลี่ยของประชากร (population mean)

เมื่อ เป็นข้อมลู

N เป็นจ านวนประชากร

ค่ากลางของข้อมลู

1 2 3 ... N

N

x x x x

321 , , , .. ,. Nx x x x

1

N

ii

N

x

ค่าเฉลี่ยของตัวอย่าง (sample mean)

เมื่อ เป็นข้อมูล n เป็นจ านวนตัวอย่าง

1 2 3 ... nxx x x x

n

1 2 3, , , ..., nx x x x

ค่ากลางของข้อมลู

1

n

ii

n

x

x

ถ้าให้ เป็นความถี่ของค่าสังเกต

ค่าเฉลี่ยเลขคณิต ของข้อมูลที่แจกแจงความถี่แล้ว

1

N

i ii

xf

N

1 2 3

2

1 3

31

1

1

2 ...

...

k

k

i i

k

k

i

k

ii

f f f f

f f f

f

x

x

x

f

x

f

x

if ix

สัญลักษณ ์ เป็นอักษรกรีก เรียกว่า“capital sigma” อ่านว่า “summation”

สมบัติของ ที่ควรทราบ

ถ้า c และ d เป็นค่าคงตัว

1

1 1

(1)

(2)

i

i ii i

N

N

N

x

c c

xc c

N

สมบัติของ ที่ควรทราบ

ถ้า c และ d เป็นค่าคงตัว

1 1 1

1 1 1

(

( )

(4)

3)

)

( i i i ii i i

i i i

N N N

N N N

ii i i

x x

x x

y y

y y

(1)

สมบัติที่ส าคัญของค่าเฉลี่ยเลขคณิต

1 1

,N n

i ii i

x N x n x

(2) 1 1

0 , 0N n

i ii i

x x x

(3) น้อยที่สุด เมื่อ 2

1

N

ii

x M

น้อยที่สุด เมื่อ 2

1

n

ii

x M

M x

M

สมบัติที่ส าคัญของค่าเฉลี่ยเลขคณิต

(4) min maxx x

min maxx x x

(5) ถ้า เมื่อ i คือ 1,2,3,...,N เมื่อ a,b เป็นค่าคงตัวใด ๆ แล้ว

y x b

Y ba X

a

i iy bax

มัธยฐานจะอยู่ในต าแหน่งที่

การหาค่ามัธยฐานของข้อมูลไม่แจกแจงความถี ่

1

2

N

มี 2 ขั้น ได้แก่

(1) หาต าแหน่งที่มัธยฐานอยู่ (2) ค านวณหาค่ามัธยฐาน

การหาค่ามัธยฐานของข้อมูลไม่แจกแจงความถี่

ข้อมูลที่แจกแจงความถี่แล้ว การหามัธยฐานในกรณีนี้จะให้ค่าโดยประมาณ ถ้าข้อมูลมีผลรวมของความถี่ เป็น N

ค่ามัธยฐาน จะอยู่ในต าแหน่งที่

การหาค่ามัธยฐานของข้อมูลทีแ่จกแจงความถี่

2

N

มี 2 ขั้น ได้แก่

(1) หาต าแหน่งที่มัธยฐานอยู่ (2) ค านวณหาค่ามัธยฐาน โดยการเทียบค่า หรือโดยสูตร

การหาค่ามัธยฐานของข้อมูลทีแ่จกแจงความถี่

สูตรการหามัธยฐาน มัธยฐาน Med. 2

M e

L

f

N

L i

f

ส าหรับข้อมูลที่เรียงจากน้อยไปมาก

การหาค่ามัธยฐานของข้อมูลทีแ่จกแจงความถี่

สูตรการหามัธยฐาน (2) มัธยฐาน med. 2

M e

U

f

f

i

N

U

ส าหรับข้อมูลที่เรียงจากมากไปน้อย

การหาค่ามัธยฐานของข้อมูลทีแ่จกแจงความถี่

ฐานนิยมของข้อมูลชนิดนี้จะได้จากการดูว่าข้อมูลค่าใดมีความถี่สูงสุด หรือปรากฏบ่อยที่สุด บางข้อมูลอาจมีค่าฐานนิยมเกินกว่า 1 ค่าหรือไม่มีฐานนิยมก็ได้ถ้ามีความถี่เท่ากันหมด

การหาฐานนิยมของข้อมูลทีไ่ม่แจกแจงความถี่

การหาฐานนิยม

ถ้าเขียนเส้นโค้งความถี่ ฐานนิยม คือ ค่าของ x ที่อยู่ตรงกับจุดสูงสุดบนเส้นโค้งความถี่ ดังรูป

ฐานนิยม ข้อมูลทีแ่จกแจงความถี่แล้ว

X

ถ้าเขียนเส้นโค้งความถี่ ฐานนิยม คือ ค่าของ x ที่อยู่ตรงกับจุดสูงสุดบนเส้นโค้งความถี่ ดังรูป

ฐานนิยม ข้อมูลทีแ่จกแจงความถี่แล้ว

X X

การหาฐานนิยม อาจหาโดยสูตร ดังนี้

ฐานนิยมของข้อมูลที่แจกแจงความถี่

1

21

.d

d dM o iLd

เมื่อ L คือ ขอบล่างของชั้นที่ฐานนิยมอยู่ i คือ ความกว้างของอันตรภาคชั้นที่ฐานนิยมอยู่

คือ ผลต่างระหว่างความถี่อันตรภาคชั้นที่ฐานนิยมอยู่กับชั้นต่ ากว่า และสูงกว่า ตามล าดับ

1 2,d d

Qr rส่วน เมื่อแบ่งข้อมูลเปน็ 4 ส่วนๆกัน

Dr คือ ข้อมูลที่มีข้อมูลตัวอื่นๆที่มีค่าน้อยกว่าอยู่ r ส่วน เมื่อแบ่งข้อมูลเปน็ 10 ส่วนเท่าๆกัน

Pr คือ ข้อมูลที่มีข้อมูลตัวอื่นๆที่มีค่าน้อยกว่าอยู่ r ส่วน เมื่อแบ่งข้อมูลเปน็ 100 ส่วนเท่าๆกัน

การวัดต าแหน่งที่ของข้อมูล

ถ้าแบ่งข้อมลูที่เรียงล าดับจากน้อยไปหามากออกเป็น 4 ส่วน

เท่าๆ กัน จุดแบ่งซึ่งมี 3 จุด เรียกว่า ควอร์ไทล์ ได้แก่

ควอร์ไทล์ที่ 1 (Q1) ควอร์ไทล์ที่ 2 (Q2) และ ควอร์ไทล์ที่ 3 (Q3) เขียนแสดงได้ดังนี้

ข้อมูลมาก

1Q

2Q 3

Q

ข้อมูลเรียงจากน้อยไปหามาก

ข้อมูลน้อย

ควอร์ไทล์

เดไซล์ (Decile)

ถ้าแบ่งข้อมูลที่เรียงล าดับจากน้อยไปหามากออกเป็น 10 ส่วน เท่าๆ กัน จุดแบ่งซึ่งมี 9 จุด เรียกว่า เดไซล์ ได้แก่ D1, D2, D3,…,D9 เขียนแสดงได้ดังนี้

ข้อมลูเรียงจากน้อยไปหามาก

1D

2D 3

D4

D5

D6

D7

D8

D9

D

ข้อมูลมากข้อมูลน้อย

เปอร์เซ็นไทล์ (Percentile)

ถ้าแบ่งข้อมูลที่เรียงล าดับจากนอ้ยไปหามากออกเป็น 100 ส่วน เท่าๆ กัน จุดแบ่งซึ่งมี 99 จุด เรียกว่า เปอร์เซ็นไทล์ ได้แก่ P1 P2, P3,…,P99 เขียนแสดงได้ดังนี้

10P

20P

30P

40P

50P

60P

70P

80P

99P

90P

1P

2P

ข้อมูลเรียงจากน้อยไปหามาก

การเปรียบเทียบค่าของ P , D , Q

ข้อมูลชุดหนึ่งเรียงจากน้อยไปหามาก และสามารถอา่นค่าของต าแหน่งด้วย P , D , Q ดังน้ี

P 0 10 20 30 40 50 60 70 80 90 100

D 0 1 2 3 4 5 6 7 8 9 10

Q 0 1 2 3 4

จากแผนผัง จะได้ว่า P50 = D5 = Q2

และจะได้ว่า Q1 = P25 , Q3 = P75

1. เรยีงข้อมลูจากคา่น้อยไปหาคา่มาก

2. สรา้งความถ่ีสะสม 3. หา Percentile , Decile , Quartile จากสูตร

4

)1(

10

)1(

100

)1(

Nrr

Nrr

Nrr

xQ

xD

xP

การหา Quartile,Percentile,Decile ส าหรับข้อมูลทีแ่จกแจงความถี่ไมเ่ป็นชว่งคะแนน

การหา Q ส าหรับข้อมูลทีเ่ป็นอนัตรภาคชั้น

4r

r

L

Q

rN I

ffLQ

L Qr

Lf Qr

I Qr

f Qr

10

r

r

L

D

rN I

ffLD

L Dr

Lf Dr

I Dr

f Dr

การหา D ส าหรับข้อมูลที่เป็นอนัตรภาคชัน้

100r L

pr

rL

INP f

f

L Pr

Lf Pr

I Pr

f Pr

การหา P ส าหรับข้อมูลที่เป็นอันตรภาคชั้น

การวัดการกระจายสัมบูรณ์ ได้แก่

• พิสยั ( Range )

• ส่วนเบีย่งเบนควอรไ์ทล ์หรือ กึ่งช่วงควอร์ไทล ์(Quartile Deviationor Semi-interquartile range)

• ส่วนเบีย่งเบนเฉลี่ย (Mean Deviation or Average Deviation)

• ส่วนเบีย่งเบนมาตรฐาน(Standard Deviation)

พิสัย

พสิ = ส งสุด – สุด ง

พสิ = บบ ง รภ ช ้ ง ส งสุด – บ ง ง รภ ช ้ สุด

พิสัย = nm ax m ix x

ส่วนเบี่ยงเบนควอร์ไทล์

ด้วยวิธีค านวณหา Q.D. เช่นนี้

อาจเรียกส่วนเบี่ยงเบนควอร์ไทล์วา่กึ่งช่วงควอร์ไทล์ ( Semi - interquartile range)

3 1. .2

Q QQ D

ส่วนเบี่ยงเบนเฉลี่ยของข้อมูลที่ไม่ไดแ้จกแจงความถี่

1. .

k

ii

x x

M DN

ส่วนเบี่ยงเบนเฉลี่ยของข้อมูลทีแ่จกแจงความถี่

1. .

k

i ii

f x x

M DN

เมื่อ k เป็นจ านวนอันตรภาคชั้น fi เป็นความถี่ของอันตรภาคชั้นที่ i

xi เป็นจุดกึง่กลางของอันตรภาคชั้นที่ i

ส่วนเบี่ยงเบนมาตรฐานของข้อมูลที่ไม่ได้แจกแจงความถี่

2( )x

i

N

i 1

N

ส่วนเบี่ยงเบนมาตรฐานของประชากร หรือ อ่านว่า ซิกม่า ค านวณได้โดย

ส่วนเบี่ยงเบนมาตรฐานของข้อมูลที่ไม่ได้แจกแจงความถี่

2( )xx

i

s

n

i 1

n - 1

ส่วนเบี่ยงเบนมาตรฐานของตัวอย่าง (sample standard deviation หรือ s ) ค านวณได้โดย

ส่วนเบี่ยงเบนมาตรฐานของข้อมูลที่แจกแจงความถี่

2( )

1

k

f xi ii

N

ส่วนเบี่ยงเบนมาตรฐานของประชากรของข้อมูลที่แจกแจงความถี่

ส่วนเบี่ยงเบนมาตรฐานของข้อมูลที่แจกแจงความถี่

2

21

k

f xi ii

N

หรือ

ส่วนเบี่ยงเบนมาตรฐานของข้อมูลที่แจกแจงความถี่

2( )

1

1

k

f x xi ii

s

n

ส่วนเบี่ยงเบนมาตรฐานของตัวอย่างของข้อมูลที่แจกแจงความถี่

ส่วนเบี่ยงเบนมาตรฐานของข้อมูลที่แจกแจงความถี่

2 2

1

1

k

f x n xi ii

s

n

หรือ

ความแปรปรวนของประชากร

ความแปรปรวน คือ ส่วนเบี่ยงเบนมาตรฐานยกก าลังสอง

2

212

2

1

( )N

i i

N

i ix

N

x

N

ความแปรปรวนของข้อมูลประชากรที่ไม่แจกแจกความถี่ คือ

ความแปรปรวนของประชากร

22

212 1

( )N

i ii

N

i ii

f x

N

f x

N

ความแปรปรวนของข้อมูลประชากรที่แจกแจกความถี่ คือ

ความแปรปรวนของตัวอย่าง (sample variance)

22

12 1

(

1

)

1

n

ii

n

ii

x x

sn

x n x

n

ความแปรปรวนของข้อมูลประชากรที่ไม่แจกแจกความถี่ คือ

ความแปรปรวนของตัวอย่าง

2

2

2

11

( )

11

n

i ii

n

i ii

f x x

sn

f x n x

n

ความแปรปรวนของข้อมูลที่แจกแจกความถี่ คือ

การวัดการกระจายสัมพัทธ์ ได้แก ่ 1. สัมประสิทธ์ิของพิสัย ( coefficient of range)

2. สัมประสิทธ์ิของส่วนเบี่ยงเบนค

วอร์ไทล์ ( coefficient of quartile deviation )

3. สัมประสิทธิ์ของส่วนเบี่ยงเบน

เฉลี่ย ( coefficient of average deviation )

4. สัมประสิทธิ์ของความแปรผัน

สัมประสทิธิ์ของพิสัย =

maxx

mim nax

minmax

x

x

x

x

ส าหรับขอ้มูลไม่แจกแจงความถี่

: ข้อมูลที่มีค่าสูงสุด

: ข้อมูลที่มีค่าต่ าสุด minx

สัมประสทิธิ์ของพสิัย =

maxx

mim nax

minmax

x

x

x

x

ส าหรับข้อมูลที่แจกแจงความถี่แล้ว

: ขอบบนของอันตรภาคชั้นสูงสุด

: ขอบล่างของอันตรภาคชั้นต่ าสุด minx

สัมประสทิธิ์ของส่วนเบี่ยงเบนควอร์ไทล์

1Q

3 1

3 1

. . .Q

CQ

QD

QQ

3Q

ส าหรับขอ้มูลทั้งไม่แจกแจงและแจกแจงความถ่ีแล้ว

: ค่าควอร์ไทล์ 1 ของข้อมูล: ค่าควอร์ไทล์ 3 ของข้อมูล

. .M D

. . .. .

C M Dx

M D

x

ส าหรับข้อมูลทั้งไม่แจกแจงและแจกแจงความถี่แล้ว

: ค่าส่วนเบี่ยงเบนเฉลี่ย

: ค่าเฉลี่ยเลขคณิต

สัมประสทิธิ์ของส่วนเบี่ยงเบนเฉลี่ย

สัมประสิทธิ์ของความแปรผัน

..

..

SC

x

DV

. .S D

x

ส าหรับข้อมูลทั้งไม่แจกแจงและแจกแจงความถี่แล้ว

: ค่าส่วนเบี่ยงเบนมาตรฐาน

: ค่าเฉลีย่เลขคณิต

คะแนนมาตรฐาน (Standard score )

iiZ

S

x x

สูตรที่ใช้ในการหาคะแนนมาตรฐาน (Z - Score)

คือ คะแนนดิบ

คือ ค่าเฉลี่ยเลขคณิต

คือ ค่าส่วนเบ่ียงเบนมาตรฐาน

ix

x

S

เส้นโค้งปกติมาตรฐาน

–3 –2 –1 0 1 2 3

3x s 2x s x s x s 2x sx 3x s

3z 2z 1z 1z 2z 0z 3z

คะแนนมาตรฐาน กับ เส้นโค้งปกติ

ลักษณะเส้นโค้งปกติมาตรฐาน

เส้นโค้งปกติมาตรฐาน ( Standard normal curve )คือ เส้นโค้งปกติที่มีค่าเฉลี่ยเลขคณิตเท่ากับ 0 และ S = 1

เทคนิคการหาพื้นที่ใต้เส้นโค้งปกติมาตรฐานโดยใช้ตาราง

1 ) เส้นโค้งปกติมาตรฐาน จะมีเส้นตัง้ฉากที่ลากผ่าน z = 0 เป็นแกนสมมาตร ดังนั้น พืน้ที่ทางซีกซ้ายมอืและ พี้นที่ทางซีกขวามือจะเท่ากัน แสดงว่า พื้นที่ใต้เส้นโค้งปกตมิาตรฐานจาก z = 0 ไปยังz = - | k | จะเท่ากับพื้นที่ใต้เส้นโค้งปกติมาตรฐาน จาก z = 0 ไปยังz = | k | ดังรูป

เทคนิคการหาพื้นที่ใต้เส้นโค้งปกติมาตรฐานโดยใช้ตาราง

2) พื้นที่ใต้เสน้โค้งปกติมาตรฐานทั้งหมดมีค่าเท่ากับ 1 เสมอ

( ถ้าคิดเป็นเปอร์เซ็นต์ แล้วจะได้ 100 % นั่นเอง ) ดังรูป

เทคนิคการหาพื้นที่ใต้เส้นโค้งปกติมาตรฐานโดยใช้ตาราง

3 ) เนื่องจากเส้นโค้งปกติมาตรฐานมีลักษณะสมมาตร ท าให้ทราบว่า พื้นที่ทางซีกซ้ายมือ และ พื้นที่ทางซีกขวาจะเท่ากัน แสดงว่ามีพื้นที่

ซีกละ 0.5 ( คิดเป็นเปอร์เซ็นต์ จะมีพื้นที่ซีกละ 50 % ของพื้นที่ทั้งหมด ) ดังรูป

โดยทั่ว ๆ ไป ความสัมพนัธ์เชิงฟังก์ชันของข้อมลูท่ีประกอบด้วยตัวแปรสองตัวอาจแบ่งออกได้เป็น สอง ชนิดใหญ่ ๆ คือ

1. ความสัมพันธ์เชิงฟังก์ชันที่กราฟเป็นเส้นตรง

Y = m X + c2. ความสัมพันธ์เชิงฟังก์ชันที่กราฟไม่เป็นเส้นตรง เช่น * มีกราฟเป็นรูปพาราโบลา

** มีกราฟเป็นเอกซ์โพเนนเชียล

ความสัมพันธ์เชิงฟังก์ชันระหว่างข้อมูล

2y ax bx c

xy ab

Y = m X + c

ความสัมพนัธ์เชิงฟังก์ชนัที่กราฟเป็นเส้นตรงมีรูปสมการท่ัวไปของความสัมพันธเ์ป็น

เราจะสามารถค านวณหาสมการของเส้นตรงได้โดยอาศัยสมการปกติต่อไปนี้

...............(1)y m x cN 2

............(2)xy m x c x

ความสัมพันธ์เชิงฟังก์ชนัที่กราฟเป็นพาราโบลามีรูปสมการทั่วไปเป็น

เราจะสามารถค านวณหาสมการของเส้นตรงได้โดยอาศัยสมการปกติต่อไปนี้

2.....(1)y a x b x cN

3 2....(2)xy a x b x c x

Y = aX2+bX+c

2 4 3 2...(3)x y a x b x c x

ความสัมพนัธ์เชิงฟังก์ชนัที่กราฟเป็นเอกซ์โพเนนเชียลมีรูปสมการทั่วไปเป็น

เราจะสามารถค านวณหาสมการของเส้นตรงได้โดยอาศัยสมการปกติต่อไปนี้

log log log ......(1)y N a b x 2

log log log ...(2)x y a x b x

Y = abX หรือlog y = log a + x log b

อนุกรมเวลาข้อมูลในรูปอนุกรมเวลา คือ ข้อมูลที่แสดงความเปลี่ยนแปลงตามล าดับก่อนหลังของเวลาที่ข้อมูลนั้น ๆ เกิดขึ้น โดยปกติข้อมูลนั้น ๆ เกิดขึ้นในช่วงระยะเวลาเท่า ๆ กันก าหนดค่า x แทนข้อมูลดังนี้ 1. ถ้าจ านวนข้อมูลเป็นจ านวนคี่ จะก าหนดให้ค่า x ที่อยู่ ตรงกลางเป็น 0 เวลาที่น้อยกว่าแทนด้วย -1 , -2 , -3 , ... และเวลาที่มากกว่าแทนด้วย 1 , 2 , 3 , ... ตามล าดับ 2. ถ้าจ านวนข้อมลูเป็นจ านวนคู่ จะก าหนดให้ค่า x ที่อยู่ ตรงกลาง 2 ค่าเป็น -1 , 1 เวลาที่น้อยกว่าแทนด้วย -3 , -5 , -7 , ... และเวลาที่มากกว่าแทนด้วย 3 , 5 , 7 , ... ตามล าดับ