80
Статистические распределения и их основные характеристики

Статистические распределения и их основные характеристики

Embed Size (px)

DESCRIPTION

Статистические распределения и их основные характеристики. Различия индивидуальных значений признака у единиц совокупности называются вариацией признака. - PowerPoint PPT Presentation

Citation preview

Page 1: Статистические распределения и их основные характеристики

Статистические распределения и их основные характеристики

Page 2: Статистические распределения и их основные характеристики

Различия индивидуальных значений признака у единиц совокупности называются вариацией признака.

Она возникает в результате того, что индивидуальные значения складываются под совместным влиянием разнообразных условий (факторов), по разному сочетающихся в каждом отдельном случае.

Page 3: Статистические распределения и их основные характеристики

Вариация, которая не зависит от факторов, положенных в основу выделения групп, называется случайной вариацией.

Page 4: Статистические распределения и их основные характеристики

Изучение вариации в пределах одной группы предполагает использование следующих приемов: построение вариационного ряда (ряда

распределения); графическое изображение; исчисление основных характеристик

распределения: показателей центра распределения; показателей вариации; показателей формы распределения.

Page 5: Статистические распределения и их основные характеристики

Вариационный ряд -

групповая таблица, построенная по количественному признаку, в сказуемом которой показывается число единиц в каждой группе.

Форма построения вариационного ряда зависит от характера изменения изучаемого признака.

Он может быть построен в форме дискретного ряда или в форме интервального ряда.

Page 6: Статистические распределения и их основные характеристики

Пример 1. Распределение рабочих по тарифному разряду

Тарифный разряд

рабочего, x

Число рабочих, имеющи

х этот разряд, f

ЧастостьW

Накопленная (кумулятивная) частота,S

2 1 1/20=0,05 1

3 5 5/20=0,25 5+1=6

4 8 8/20=0,4 6+8=14

5 4 4/20=0,2 14+4=18

6 2 2/20=0,1 18+2=20

итого 20 1

Page 7: Статистические распределения и их основные характеристики

Частость расчитывается по формуле

Замена частот частостями позволяет сопоставить вариационные ряды с различным числом наблюдений.

i

ii f

fW

Page 8: Статистические распределения и их основные характеристики

Средняя квалификация работников

Т.е в среднем рабочие имеют 4 тарифный разряд

05,424851

2*64*58*45*31*2вз

i

ii

f

fxx

Page 9: Статистические распределения и их основные характеристики

Для признака, имеющего непрерывное изменение строится интервальный вариационный ряд распределения.

Определение величины интервала производится

m

xxi minmax

i min xграница верхняяmin xграница нижняя

Page 10: Статистические распределения и их основные характеристики

Показатели центра распределения.

Средняя арифметическая для дискретного ряда расчитывается по формуле средней арифметической взвешенной:

i

ii

f

fxxвз

Page 11: Статистические распределения и их основные характеристики

В интервальном ряду расчет производится по этой же формуле, но в качестве х берется середина интервала. Она определяется так

2

граница верхняяграница нижняя

Page 12: Статистические распределения и их основные характеристики

Пример 2. Распределение банков по размеру прибыли.

Размер прибыли, млн. крон, x

Середина интервала,

x'

Число банко

вf

Накоплен-ная

частота, S

3,7 - 4,6 (3,17+4,6)/2=4,15 3 3

4,6 - 5,5 (4,6+5,5/2)=5,05 4 3+4=7

5,5 - 6,4 (5,5+6,4)/2=5,95 5 7+5=12

6,4 - 7,3 (6,4+7,3)/2=6,85 6 12+6=18

7,3 - 8,1 (7,3+8,1)/2=7,7 2 18+2=20

итого - 20

Page 13: Статистические распределения и их основные характеристики

Средний размер прибыли

945,526543

2*7,76*85,65*95,54*05,53*15,4

i

ii

f

fxx

Page 14: Статистические распределения и их основные характеристики

Мода (Мо)

наиболее часто встречающееся значение признака.

В дискретном ряду - это варианта с наибольшей частотой.

В интервальном ряду сначала определяется модальный интервал, т.е. тот, который имеет наибольшую частоту, а затем расчитывают моду по формуле:

Page 15: Статистические распределения и их основные характеристики

Значение моды определяется по формуле:

)()( 11

1

MoMoMoMo

MoMoMoMo ffff

ffixMo

Page 16: Статистические распределения и их основные характеристики

В примере 1 наибольшую частоту - 8 имеет четвертый тарифный разряд, следовательно значение моды равно 4 тарифному разряду

В примере 2 модальный интервал 6,4 -7,3 так как такой уровень прибыли имеют наибольшее число банков.

58,6

2656

56*)4,63,7(4,6

Mo

Page 17: Статистические распределения и их основные характеристики

Медиана (Ме)

соответствует варианту, стоящему в середине ранжированного ряда. Положение медианы определяется ее номером:

где n - число единиц в совокупности.

2

1

nN Me

Page 18: Статистические распределения и их основные характеристики

Медиана в дискретном ряду

По накопленным частотам определяют ее численное значение в дискретном вариационном ряду.

Медиана тарифного разряда будет найдена следующим образом:

5,102

120

2

1

nN Me

Page 19: Статистические распределения и их основные характеристики

Следовательно, среднее значение 10-го и 11-го признаков будут соответствовать медиане.

По накопленным частотам находим 10-й и 11-й признаки. Их значение соответствует 4-му тарифному разряду, следовательно медиана в данном ряду равна 4.

21110 xx

M e

Page 20: Статистические распределения и их основные характеристики

Медиана в интервальном ряду

В интервальном ряду распределения по номеру медианы указывают интервал, в ктором находится медиана.

Численное значение определяется по формуле:

Me

Me

MeMe f

Sn

iXMe12

1

*

Page 21: Статистические распределения и их основные характеристики

расчитаем медиану в интервальном ряду

По накопленным частотам вышеприведенного примера определяем, что медиана находится в интервале

5,5 - 6,4 так как номер медианы

а это значение включает кумулятивная частота 12.

5,102

120

2

1

nN Me

Page 22: Статистические распределения и их основные характеристики

Тогда медиана

Таким образом, 50% банков имеют прибыль менее 6,13 млн. крон, а другие 50% - более 6,13.

13,65

72

120

*)5,54,6(5,5

eM

Page 23: Статистические распределения и их основные характеристики

Квартиль - это значения признака, которые делят ранжированный ряд на четыре равные по численности части.

Таких величин будет три:

первая квартиль(Q1),

вторая квартиль (Q2),

третья квартиль (Q3). Вторая квартиль является медианой.

Page 24: Статистические распределения и их основные характеристики

Сначала определяется положение или место квартили:

4

1nNQ1

2

1n2*

4

1nNQ2

3*4

1nNQ3

Page 25: Статистические распределения и их основные характеристики

В дискретном ряду по накопленным частотам определяют численное значение.

В интервальном ряду распределения сначала указывают интервал, в котором лежит квартиль, затем определяют ее численное значение по формуле:

Q

Q

f

Si 1Q

Q

NxQ

Page 26: Статистические распределения и их основные характеристики

Расчет первой квартили, пример 1.

Номер квартили показывает, что значение квартили находится между 5 и 6 признаком. Поскольку и 5-й и 6-й признаки имеют значение 3, то первая квартиль равна 3

Тарифный разряд

рабочего, х

Число рабочих, f

Кумулятивная частота

2 1 1

3 5 1+5 = 6

4 8 6+8 = 14

5 4 14+4 = 18

6 2 18+2 = 20

Итого 20  

25,54

120

4

1nNQ1

Page 27: Статистические распределения и их основные характеристики

Расчет первой квартили в интервальном ряду (пример 2)

Размер прибыли, млн. крон,

x

Середина интервала,

x'

Число банков

f

Накоплен-ная частота, S

3,7 - 4,6 4,15 3 3

4,6 - 5,5 5,05 4 7

5,5 - 6,4 5,95 5 12

6,4 - 7,3 6,85 6 18

7,3 - 8,1 7,7 2 20

Итого   20  

Page 28: Статистические распределения и их основные характеристики

Расчет первой квартили в интервальном ряду (пример 2) Расчитаем номер первой квартили

Значение признака находится между пятой и шестой вариантой, которые раположены во втором интервале

11,54

325,5*9,06,41

Q

25,54

1201

QN

Page 29: Статистические распределения и их основные характеристики

Показатели вариации (колеблемости) признака.

К абсолютным показателям относят: Размах колебаний; Среднее линейное отклонение; Дисперсию; Среднее квадратическое отклонение; Квартильное отклонение.

Page 30: Статистические распределения и их основные характеристики

Размах колебаний (размах вариации) представляет собой разность между

максимальным и минимальным значениями признака изучаемой совокупности:

Размах вариации зависит только от крайних значений признака, поэтому область его применения ограничена достаточно однородными совокупностями.

minmax xxR

Page 31: Статистические распределения и их основные характеристики

Точнее характеризуют вариацию признака показатели, основанные на учете колеблемости всех значений признака.

К таким показателям относят: среднее линейное отклонение, дисперсию, среднее квадратическое отклонение.

Page 32: Статистические распределения и их основные характеристики

Среднее линейное отклонение d

для несгруппированных данных расчитывается по формуле

Функция в EXCEL

AVEDEV( )

n

xxd

i

Page 33: Статистические распределения и их основные характеристики

Для n вариационного ряда:

f

fxxd

i

Page 34: Статистические распределения и их основные характеристики

Линейное отклонение в дискретном ряду d = 15/20 =0,75 (пример 1)

05,21*05,42

08*05,405,4

8,34*05,45

9,32*05,46

25,55*05,43

Тарифный разряд рабочего, х

Число рабочих, f

 

2 1  

3 5  

4 8  

5 4  

6 2  

Итого 20  15

fxxi

Page 35: Статистические распределения и их основные характеристики

Линейное отклонение в интервальном ряду d = 17,93/20=0,897 (пример 2)

Размер прибыли, млн. крон,x

Середина интервала,

x'

Число банков,

f  

3,7 - 4,6 4,15 3 

4,6 - 5,5 5,05 4  

5,5 - 6,4 5,95 5  

6,4 - 7,3 6,85 6  

7,3 - 8,1 7,7 2  

итого   20  17,93

fxxi

385,53*945,515,4

58,34*945,505,5

025,05*945,595,5

43,56*945,5855,6

51,32*945,57,7

Page 36: Статистические распределения и их основные характеристики

Дисперсия

- это средняя арифметическая квадратов отклонений каждого значения признака от общей средней.

Дисперсия обычно называется средним квадратом отклоненй.

В зависимости от исходных данных дисперсия может вычисляться по средней арифметической простой или взвешенной:

Page 37: Статистические распределения и их основные характеристики

Дисперсия простая

Функция в EXCEL VARP ( )

n

xxi

2

2

Page 38: Статистические распределения и их основные характеристики

Дисперсия взвешенная

i

ii

f

fxx2

2

Page 39: Статистические распределения и их основные характеристики

Дисперсия в дискретном ряду

Тарифный разряд рабочего, х

Число рабочих, f

   

2 1    

3 5    

4 8    

5 4    

6 2    

Итого 20    20,90

2xxi fxxi2

20,405,42 2

10,105,43 2

005,405,4 2

90,005,45 2

8,305,46 2

20,41*20,4

50,55*10,1

08*0

60,34*90,0

60,72*8,3

05,120/90,202

Page 40: Статистические распределения и их основные характеристики

Дисперсия в интервальном ряду

Размер прибыли,

млн. крон,x

Середина интер-вала, x'

Число банков

f    

3,7 - 4,6 4,15 3

4,6 - 5,5 5,05 4

5,5 - 6,4 5,95 5

6,4 - 7,3 6,85 6

7,3 - 8,1 7,7 2

итого   20   23,945

24,395,515,4 2

81,095,505,5 2

00,095,595,5 2

81,095,585,6 2

06,395,57,7 2

72,93*95,515,4 2

24,34*95,505,5 2

00,05*95,595,5 2

86,46*95,585,6 2

13,62*95,57,7 2

2xxi fxxi2

197,120/95,232

Page 41: Статистические распределения и их основные характеристики

Другой метод расчета дисперсии Дисперсия равна разности средней из

квадратов признака и квадрата средней.

222 xx

Page 42: Статистические распределения и их основные характеристики

Расчет дисперсии на примере 1. Находим среднюю из квадрата признака:

Тарифный разряд рабочего,

х

Число рабочих, f

   

2 1 2*2 = 4 4*1 = 4

3 5 3*3 = 9 9*5 = 45

4 8 4*4 = 16 16*8 = 128

5 4 5*5 = 25 25*4 = 100

6 2 6*6 = 36 36*2 = 72

Итого 20 - 349

fx 22x

Page 43: Статистические распределения и их основные характеристики

Средняя из квадратов признака

Квадрат средней величины

Дисперсия

45,1720

3492 x

05,140,1645,17222 xx

40,1605,4*05,42 x

Page 44: Статистические распределения и их основные характеристики

Среднее квадратическое отклонение стандартное отклонение (Standard

Deviation)

представляет собой корень квадратный из дисперсии

Page 45: Статистические распределения и их основные характеристики

Среднее квадратическое отклонение невзвешенное

Функция в EXCEL

STDEVP ( )

n

xxi

2)(

Page 46: Статистические распределения и их основные характеристики

Среднее квадратическое отклонение взвешенное

i

ii

f

fxx 2)(

Page 47: Статистические распределения и их основные характеристики

Среднее квадратическое отклонение Пример 1.

Пример 2.

023,105,12

094,1197,12

Page 48: Статистические распределения и их основные характеристики

Другие меры вариации: Относительные показатели вариации

Применяются для оценки интенсивности вариации и для сравнения ее в разных совокупностях.

относительный размах вариации (коэффициент осцилляции)

KR

xo *100%

Page 49: Статистические распределения и их основные характеристики

Относительное линейное отклонение (отклонение по модулю)

Коэффициент вариации

%100*x

dK o

%100x

V

Page 50: Статистические распределения и их основные характеристики

Относительный показатель квартильной вариации (относительное квартильное расстояние)

%100*2K

13

Q x

QQ

Page 51: Статистические распределения и их основные характеристики

Оценка степени интенсивности вариации возможна только для каждого отдельного признака и совокупности определенного состава.

Предположим вариация производительности труда на предприятиях Эстонии v < 10% рассматривается как слабая,10% < v < 25% -умеренная, сильная при v > 25%.

Однако, если рассматривается вариация роста взрослых людей, то при v = 4% следует говорить об очень сильной интенсивности

Page 52: Статистические распределения и их основные характеристики

Моменты распределения и показатели его формы. Центральные моменты распределения

порядка – это средние значения разных степеней отклонений отдельных величин признака от его средней арифметической величины.

Момент первого порядка равен нулю. Второй центральный момент представляет

собой дисперсию. Третий момент используется для оценки

асимметрии Четвертый – для оценки эксцесса.

Page 53: Статистические распределения и их основные характеристики

Порядок момента

Формула

по несгруппированным

данным

по сгруппированным

данным

Первый

Второй

   

n

xxi

i )(

)(

)(

jj

jjj

f

fxx

n

xxi

i )(

2

)(

)(

2

jj

jjj

f

fxx

1

2

Page 54: Статистические распределения и их основные характеристики

Порядок момента

Формула

по несгруппированным

данным

по сгруппированным

данным

Третий

Четвертый

   

3

4

n

xxi

i )(

3

)(

)(

3

jj

jjj

f

fxx

n

xxi

i )(

4

)(

)(

4

jj

jjj

f

fxx

Page 55: Статистические распределения и их основные характеристики

Показатели асимметрии

На основе момента третьего порядка можно построить коэффициент асимметрии

или показатель Пирсона

33

SA

σ

MoMo

xA

Page 56: Статистические распределения и их основные характеристики

Если А > 0, то асимметрия правосторонняя, а если А < 0, то асимметрия левосторонняя, в симметричном распределении А=0.

В EXCEL используется функция

SKEW ( ).

Page 57: Статистические распределения и их основные характеристики

Характеристика эксцесса распределения

В нормальном распределении Е = 0, поэтому, если Е > 0, то эксцесс выше нормального (островершинная кривая),

Е < 0, эксцесс ниже нормального (плосковершинная кривая).

В EXCEL используется функция

KURT ( ).

344

E

Page 58: Статистические распределения и их основные характеристики

По значению показателей асимметрии и эксцесса можно судить о близости распределения к нормальному.

Если и

то распределение можно считать нормальным

2As

as

2ex

Ex

Page 59: Статистические распределения и их основные характеристики

Средние квадратические отклонения ассиметрии и эксцесса

3312

16

nnnn

nnas

5323

124 2

nnnn

nnex

Page 60: Статистические распределения и их основные характеристики

Оценка диапазона изменения статистической переменной

По теореме Чебышева: в интервале ( - 2, +2) находится 75 %

значений, в интервале ( - 3, +3) находится 89 %

значений.

Page 61: Статистические распределения и их основные характеристики

“ правило трех сигм”:

справедливо для нормального распределения

в интервале ( - , + ) находится 68% значений,

в интервале ( - 2, +2) находится 95.4% значений,

в интервале ( - 3, +3) находится 99.7% значений.

Page 62: Статистические распределения и их основные характеристики

Закон (правило) сложения дисперсий.

- величина общей дисперсии

- межгрупповая дисперсия

- средняя внутригрупповая дисперсия

222 O2o

22

Page 63: Статистические распределения и их основные характеристики

Межгрупповая дисперсия

f

fxx

n

xx ii2

2

2

2 ;

Page 64: Статистические распределения и их основные характеристики

Средняя внутригрупповая дисперсия

f

f

nii2

22

2 ;

Page 65: Статистические распределения и их основные характеристики

Имеются следующие данные о времени простоя автомобиля под разгрузкой:

№ пункта разгрузки 1 2 3 4 5 6 7 8 9 10

Число грузчиков 3 4 4 3 3 4 4 4 3 4

Время простоя мин. 12 10 8 15 19 12 8 10 18 8

Page 66: Статистические распределения и их основные характеристики

Вспомогательная таблица для расчета общей дисперсии.

Время простоя

под разгрузкой

мин., х

Число выполнен

ных разгрузок,

f

x*f x - x0 (x-x0)2 (x-x0)

2f

8 3 24 -4 16 48

10 2 20 -2 4 8

12 2 24 0 0 0

15 1 15 3 9 9

18 1 18 6 36 36

19 1 19 7 49 49

итого 10 120 - - 150

Page 67: Статистические распределения и их основные характеристики

Среднее время простоя

Общая дисперсия

минx 1210

120

1510

1502 o

Page 68: Статистические распределения и их основные характеристики

Расчет внутригрупповой дисперсии по первой группе (число грузчиков, участвующих в разгрузке, 3 чел)

Время простоя под разгрузкой,

мин., х

Число выполнен

-ных разгрузок,

f

x*f x - x1 (x - x1)2 f

12 1 12 -4 16

15 1 15 -1 1

18 1 18 2 4

19 1 19 3 9

итого 4 64 - 30

Page 69: Статистические распределения и их основные характеристики

Дисперсия первой группы

мин 164

641 x

5,74

3021

Page 70: Статистические распределения и их основные характеристики

Расчет внутригрупповой дисперсии по второй группе (число грузчиков, участвующих в разгрузке, - 4)

Время простоя

под разгрузкой,

мин., х

Число выполненных

разгрузок, f

x*f x - x2 (x - x2)2 f

8 3 24 -1,33 5,31

10 2 20 0,67 0,90

12 1 12 2,67 7,13

итого 6 56 - 13,37

Page 71: Статистические распределения и их основные характеристики

Дисперсия второй группы

мин 33,96

562 x

23,26

37,1322

Page 72: Статистические распределения и их основные характеристики

Средняя из внутригрупповых дисперсий

3,464

6*23,24*5,72

2

i

ii

n

n

Page 73: Статистические распределения и их основные характеристики

Межгрупповая дисперсия

7,10

64

6*1233,94*1216 222

2

f

fxx i

Page 74: Статистические распределения и их основные характеристики

Общая дисперсия

0,157,103,42 o

Page 75: Статистические распределения и их основные характеристики

Пример 3. Расчет средней производительности труда рабочими предприятия

Средняя производительность труда составила 10 изделий

Произведенопродукции одним рабочим за смену, шт, x

Число рабочих

fxf

8 7 56

9 10 90

10 15 150

11 12 132

12 6 72

50 500

1050

500

f

fxx i

Page 76: Статистические распределения и их основные характеристики

Среднее линейное отклонение d = 48/50 = 0,96Произведенопродукции одним рабочим за смену, шт, x

Число рабочих

fx x x - xf

8 7 8 - 10 = -2 |8 - 10|*7 = 14

9 10 9 - 10 = -1 |9 -10|*10 =10

10 15 10 - 10 = 0 |10-10|*15 = 0

11 12 11 - 10 = 1 |11-10|*12=12

12 6 12 - 10 = 2 |12-10|*6 = 12

  50   48

Page 77: Статистические распределения и их основные характеристики

Дисперсия производительности труда = 74/50 =1,48

Произведено продукции одним рабочим, шт, х

Число рабочих

f x - x

8 7 8-10= -2 4*7 = 28

9 10 9-10= -1 1*10 = 10

10 15 10-10= 0 0

11 12 11-10= 1 1*12 = 12

12 6 12-10= 2 4*6 = 24

итого 50     74

2xxi

422

112 002

112

422

ii fxx 2

Page 78: Статистические распределения и их основные характеристики

Расчет средней из квадратов признака

2xПроизведено продукции одним рабочим, шт, х

Число рабочих

   

f

8 7 8*8=64 64*7=448

9 10 9*9=81 81*10=810

10 15 10*10=100 100*15=1500

11 12 11*11=121 121*12=1452

12 6 12*12=144 144*6=864

итого 50 510 5074

fx 2

Page 79: Статистические распределения и их основные характеристики

Средняя из квадратов признака

Квадрат средней величины

дисперсия

48,110048,101222 xx

10010*102 x

48,10150

50742 x

Page 80: Статистические распределения и их основные характеристики

Среднее квадратическое отклонение будет равно

Это означает, что отклонение от средней производительности составило 1,2 шт.

22,148,12