40
Снежана Георгиева Гочева-Илиева МАРКЕТИНГОВИ ИЗСЛЕДВАНИЯ Факултет по математика и информатика Пловдивски университет „Паисий Хилендарски“ Пловдив, 2016-2018

МАРКЕТИНГОВИ ИЗСЛЕДВАНИЯ lekciа5.pdf · С.Г.Гочева-Илиева, Лекции по МАРКЕТИНГОВИ ИЗСЛЕДВАНИЯ 6 Изчисляването

  • Upload
    others

  • View
    18

  • Download
    0

Embed Size (px)

Citation preview

Page 1: МАРКЕТИНГОВИ ИЗСЛЕДВАНИЯ lekciа5.pdf · С.Г.Гочева-Илиева, Лекции по МАРКЕТИНГОВИ ИЗСЛЕДВАНИЯ 6 Изчисляването

Снежана Георгиева Гочева-Илиева

МАРКЕТИНГОВИ ИЗСЛЕДВАНИЯ

Факултет по математика и информатика

Пловдивски университет „Паисий Хилендарски“

Пловдив, 2016-2018

Page 2: МАРКЕТИНГОВИ ИЗСЛЕДВАНИЯ lekciа5.pdf · С.Г.Гочева-Илиева, Лекции по МАРКЕТИНГОВИ ИЗСЛЕДВАНИЯ 6 Изчисляването

С.Г.Гочева-Илиева, Лекции по МАРКЕТИНГОВИ ИЗСЛЕДВАНИЯ

2

Съдържание

ЛЕКЦИЯ 5. Изследване на зависимости. Корелационен анализ.

Регресионен анализ. Процедури с SPSS. ........................................ 3 Корелационен анализ .......................................................................... 3 Корелационен анализ с SPSS ............................................................. 9 Регресионен анализ. Едномерна линейна регресия ....................... 15 Процедура за линейна регресия в SPSS ......................................... 22 Многомерна линейна регресия ........................................................ 29 Основни изисквания за валидност на РА (при ниво 0.05 ) ..... 32

Page 3: МАРКЕТИНГОВИ ИЗСЛЕДВАНИЯ lekciа5.pdf · С.Г.Гочева-Илиева, Лекции по МАРКЕТИНГОВИ ИЗСЛЕДВАНИЯ 6 Изчисляването

С.Г.Гочева-Илиева, Лекции по МАРКЕТИНГОВИ ИЗСЛЕДВАНИЯ

3

ЛЕКЦИЯ 5. Изследване на зависимости. Корелационен анализ.

Регресионен анализ. Процедури с SPSS.

Една от основните задачи на маркетинговите изследвания (МИ) е

намиране на връзка между данните, по възможност позволяваща да се

предсказват междинни и бъдещи стойности на някаква зависима

характеристика. Стандартни методи за решаване на тази задача са

корелационният и регресионният анализ.

Корелационен анализ

Нека x е представителна извадка на ГС X, a y – представителна

извадка на ГС Y.

Корелацията е метод за проверка на съществуване на евентуална

зависимост между двете генерални съвкупности X и Y. За да установим

дали има корелационна зависимост трябва да пресметнем и оценим

Page 4: МАРКЕТИНГОВИ ИЗСЛЕДВАНИЯ lekciа5.pdf · С.Г.Гочева-Илиева, Лекции по МАРКЕТИНГОВИ ИЗСЛЕДВАНИЯ 6 Изчисляването

С.Г.Гочева-Илиева, Лекции по МАРКЕТИНГОВИ ИЗСЛЕДВАНИЯ

4

корелационния коефициент за двете ГС. На практика негово

приближение е т.нар. извадков коефициент на корелация R.

Формулите за пресмятане на извадковия коефициент на корелация R

между извадките x и y са:

n

x

xxxSSx

n

i

in

i

i

n

i

i

2

1

1

2

1

2

)(

)(

,

n

y

yyySSy

n

i

in

i

i

n

i

i

2

1

1

2

1

2

)(

)(

,

n

yx

yxyyxxSSxy

n

i

i

n

i

in

i

ii

n

i

ii

))((

))(( 11

11

,

откъдето: SSxy

RSSx SSy

.

Page 5: МАРКЕТИНГОВИ ИЗСЛЕДВАНИЯ lekciа5.pdf · С.Г.Гочева-Илиева, Лекции по МАРКЕТИНГОВИ ИЗСЛЕДВАНИЯ 6 Изчисляването

С.Г.Гочева-Илиева, Лекции по МАРКЕТИНГОВИ ИЗСЛЕДВАНИЯ

5

Корелационният коефициент R е число между -1 и 1, т.е. 1 1R .

Колкото по-голяма е неговата стойност по абсолютна стойност до 1,

толкова по-силна е корелационната връзка между x и y.

Когато 0R , наличието на корелационна връзка означава, че с

нарастване на x зависимата променлива y също расте. Когато 0R с

нарастване на x променливата y намалява.

Различаваме следните степени на корелация:

|R | > 0.7 – силна корелация

0.5 < |R | ≤ 0.7 – средна корелация

0.3 < |R | ≤ 0.5 – слаба корелация

|R| < 0.3 – няма корелация

Page 6: МАРКЕТИНГОВИ ИЗСЛЕДВАНИЯ lekciа5.pdf · С.Г.Гочева-Илиева, Лекции по МАРКЕТИНГОВИ ИЗСЛЕДВАНИЯ 6 Изчисляването

С.Г.Гочева-Илиева, Лекции по МАРКЕТИНГОВИ ИЗСЛЕДВАНИЯ

6

Изчисляването на корелационния коефициент R не е достатъчно да

твърдим, че между извадките x и y има корелационна зависимост. Това

трябва да се потвърди от статистическия индекс на значимост (Sig.).

Анализът е валиден, при предположение, че изследваните генерални

съвкупности имат нормално или близко до нормалното разпределение.

Означение: Aко ГС X има нормално разпределение със средна m1 и

стандартно отклонение 1, това ще означаваме с X~N(m1,1).

Проверката за нормалност на разпределението се извършва визуално

по хистограмата на данните, по P-P графиката, с Box-plot графиката и с

някои специални тестове.

Page 7: МАРКЕТИНГОВИ ИЗСЛЕДВАНИЯ lekciа5.pdf · С.Г.Гочева-Илиева, Лекции по МАРКЕТИНГОВИ ИЗСЛЕДВАНИЯ 6 Изчисляването

С.Г.Гочева-Илиева, Лекции по МАРКЕТИНГОВИ ИЗСЛЕДВАНИЯ

7

В корелационния анализ, при предположение за нормално

разпределени ГС: X~N(m1,1), Y~N(m2,2) се разглежда хипотезата:

H0: =0, т.е. няма корелационна зависимост между X и Y.

Алтернативната хипотеза е:

H1: 0, т.е. има корелационна зависимост между X и Y.

За проверката на тези хипотези се прилага t-статистиката по

разпределението на Стюдънт. В SPSS проверката се извършва

автоматично и резултатът се обявява с т. нар. стойност t-value.

Потвърждението за статистическа валидност на корелационния

коефициент според горната хипотеза H0 (и алтернативната й хипотеза

H1) на база на извадковия корелационен коефициент R при ниво на

доверие α (най-често α = 0.05) се получва по долното правило.

Page 8: МАРКЕТИНГОВИ ИЗСЛЕДВАНИЯ lekciа5.pdf · С.Г.Гочева-Илиева, Лекции по МАРКЕТИНГОВИ ИЗСЛЕДВАНИЯ 6 Изчисляването

С.Г.Гочева-Илиева, Лекции по МАРКЕТИНГОВИ ИЗСЛЕДВАНИЯ

8

Правило за приемане или отхвърляне на H0 за корелационния

коефициент:

Ако Sig. < 0.05, то извадковият корелационен коефициент R е

статистически значим (валиден при ниво на доверие α = 0.05).

Ако Sig. ≥ 0.05, то извадковият корелационен коефициент R е

статистически незначим (невалиден при ниво на доверие α = 0.05)

Статистическата значимост на корелационния коефициент R при ниво

α = 0.05 означава, че с вероятност 95% може да се твърди, че той не е

равен на 0.

Page 9: МАРКЕТИНГОВИ ИЗСЛЕДВАНИЯ lekciа5.pdf · С.Г.Гочева-Илиева, Лекции по МАРКЕТИНГОВИ ИЗСЛЕДВАНИЯ 6 Изчисляването

С.Г.Гочева-Илиева, Лекции по МАРКЕТИНГОВИ ИЗСЛЕДВАНИЯ

9

Корелационен анализ с SPSS

Условия: Дадени са числови данни от две извадки x и y,

представители на две нормално разпределени ГС. Да се изследва има ли

зависимост между тях и да се оцени значимостта на извадковия

корелационен коефициент със степен на доверие = 5%.

Обърнете внимание, че за този анализ е необходимо данните да са

ординални или интервални (Ordinal или Scale)!

Пример 1. Работим с файла restorant.sav.

Ще проверим дали съществува корелация между променливите Обща

удовлетвореност и Качество на храната.

Page 10: МАРКЕТИНГОВИ ИЗСЛЕДВАНИЯ lekciа5.pdf · С.Г.Гочева-Илиева, Лекции по МАРКЕТИНГОВИ ИЗСЛЕДВАНИЯ 6 Изчисляването

С.Г.Гочева-Илиева, Лекции по МАРКЕТИНГОВИ ИЗСЛЕДВАНИЯ

10

Изглед на част от данните от файла restorant.sav.

Page 11: МАРКЕТИНГОВИ ИЗСЛЕДВАНИЯ lekciа5.pdf · С.Г.Гочева-Илиева, Лекции по МАРКЕТИНГОВИ ИЗСЛЕДВАНИЯ 6 Изчисляването

С.Г.Гочева-Илиева, Лекции по МАРКЕТИНГОВИ ИЗСЛЕДВАНИЯ

11

Анкетирани са 107 клиенти на ресторант, които са отговорили на

няколко въпроса с класиране от 1 до 7, както е показано на фигурата.

Фиг. Ординална (Ликертова) скала на възможните отговори с кодиране на

мненията от 1 до 7, файл restorant.sav.

Page 12: МАРКЕТИНГОВИ ИЗСЛЕДВАНИЯ lekciа5.pdf · С.Г.Гочева-Илиева, Лекции по МАРКЕТИНГОВИ ИЗСЛЕДВАНИЯ 6 Изчисляването

С.Г.Гочева-Илиева, Лекции по МАРКЕТИНГОВИ ИЗСЛЕДВАНИЯ

12

Корелационният анализ се провежда от

Analyze/Correlation/Bivariate…

Page 13: МАРКЕТИНГОВИ ИЗСЛЕДВАНИЯ lekciа5.pdf · С.Г.Гочева-Илиева, Лекции по МАРКЕТИНГОВИ ИЗСЛЕДВАНИЯ 6 Изчисляването

С.Г.Гочева-Илиева, Лекции по МАРКЕТИНГОВИ ИЗСЛЕДВАНИЯ

13

Появява се прозорец, в който от лявата част избираме променливите

Обща удовлетвореност и Качество на храната и ги пренасямe вдясно

в карето Variables, избираме пресмятане по Pearson и натискаме OK.

Page 14: МАРКЕТИНГОВИ ИЗСЛЕДВАНИЯ lekciа5.pdf · С.Г.Гочева-Илиева, Лекции по МАРКЕТИНГОВИ ИЗСЛЕДВАНИЯ 6 Изчисляването

С.Г.Гочева-Илиева, Лекции по МАРКЕТИНГОВИ ИЗСЛЕДВАНИЯ

14

За нашите данни получаваме резултата: Correlations

Обща удовлетвореност

Качество на храната

Обща удовлетвореност

Pearson Correlation 1 .574**

Sig. (2-tailed) .000

N 107 107

Качество на храната

Pearson Correlation .574** 1

Sig. (2-tailed) .000

N 107 107

**. Correlation is significant at the 0.01 level (2-tailed).

Тълкуване: Корелационният коефициент на Пирсън R е 0.574.

Т.е. има средна степен на корелация. Значимостта Sig. =0.000 <0.01,

затова корелационният коефициент е статистически значим при ниво 0.01.

Извод: Приемаме, че съществува средна корелационна зависимост между

величините: Обща удовлетвореност от ресторанта и Качество на храната.

Т.е. асоциацията е, че анкетираните са доволни в голяма степен от храната.

Page 15: МАРКЕТИНГОВИ ИЗСЛЕДВАНИЯ lekciа5.pdf · С.Г.Гочева-Илиева, Лекции по МАРКЕТИНГОВИ ИЗСЛЕДВАНИЯ 6 Изчисляването

С.Г.Гочева-Илиева, Лекции по МАРКЕТИНГОВИ ИЗСЛЕДВАНИЯ

15

Изследване за нормалност на разпределението на двете променливи.

Analize > Descriptives >

За Обща удовлетвореност: средната

стойност на извадката е Mean=5.12, а

Median=5.00. Те са почти равни,

което се признак за нормалност.

0.8273.53

. . 0.234

Skewness

Std Err Sk

, над 2.5

0.3632.5

. . 0.463

Kurtosis

Std Err Ku

За асиметрията отношението е 3.53 и

превишава 2.5 и не е напълно

удовлетворителен.

За Качество на храната

съответните резултати са по-добри.

Page 16: МАРКЕТИНГОВИ ИЗСЛЕДВАНИЯ lekciа5.pdf · С.Г.Гочева-Илиева, Лекции по МАРКЕТИНГОВИ ИЗСЛЕДВАНИЯ 6 Изчисляването

С.Г.Гочева-Илиева, Лекции по МАРКЕТИНГОВИ ИЗСЛЕДВАНИЯ

16

Построяваме графики на честотите. Хистограмите са:

И двете графики са близки до нормалните криви. Заедно с резултатите

от предната страница можем да приемем, че разпределенията на Общата

удовлетвореност и Качество на храната са близки до нормалното.

Можем да приемем получения корелационен коефициент за

статистически валиден.

Page 17: МАРКЕТИНГОВИ ИЗСЛЕДВАНИЯ lekciа5.pdf · С.Г.Гочева-Илиева, Лекции по МАРКЕТИНГОВИ ИЗСЛЕДВАНИЯ 6 Изчисляването

С.Г.Гочева-Илиева, Лекции по МАРКЕТИНГОВИ ИЗСЛЕДВАНИЯ

17

Регресионен анализ. Едномерна линейна регресия

Ако с корелацията се установи наличие на зависимост между две

ординални или интервални величини, означени с x и y , при определени

условия тя може да се търси във вида

ˆ( )y y x , 2(0, )N , (1)

където ˆ( )y x е търсена приближаваща (описваща) функция на x, а е

грешка с нормално разпределение, която се пренебрегва. И записваме

ˆ( ), 1,2,...,i iy y x i n

(Четем: „Игрек i приблизително равно на игрек шапка i“.)

Такава приближаваща функция ˆ( )y x се нарича регресия или

уравнение на регресия, а графиката й - регресионна крива.

Page 18: МАРКЕТИНГОВИ ИЗСЛЕДВАНИЯ lekciа5.pdf · С.Г.Гочева-Илиева, Лекции по МАРКЕТИНГОВИ ИЗСЛЕДВАНИЯ 6 Изчисляването

С.Г.Гочева-Илиева, Лекции по МАРКЕТИНГОВИ ИЗСЛЕДВАНИЯ

18

Модели с едномерна линейна регресия. Когато графиката на данните

прилича на отсечка, приближаващата функция в (1) се търси като

полином от първа степен (уравнение на права линия) във вида:

0 1ˆ( )y x b b x . (2)

Коефициентите 0 1,b b се наричат регресионни коефициенти и техните

оценки (estimates) се определят автоматично от SPSS.

Конкретното пресмятане на оценките на регресионните коефициенти

0 1,b b става по формулите:

11

2

1

ˆ

n

i i

i

n

i

i

x x y y

b

x x

, 0 1

ˆ ˆb y b x , (3)

където ,x y са съответно извадковите средни стойности на ,x y.

Page 19: МАРКЕТИНГОВИ ИЗСЛЕДВАНИЯ lekciа5.pdf · С.Г.Гочева-Илиева, Лекции по МАРКЕТИНГОВИ ИЗСЛЕДВАНИЯ 6 Изчисляването

С.Г.Гочева-Илиева, Лекции по МАРКЕТИНГОВИ ИЗСЛЕДВАНИЯ

19

Пример 2. Дадени са данни от две извадки x и y, представители на две

нормално разпределени ГС. Да се изследва има ли зависимост между тях

и да се оцени значимостта на извадковия корелационен коефициент със

степен на доверие = 5%. При наличие на зависимост да се построи

уравнението на линейна регресия.

x 5 4 7 10 11 8 9 11 8 9

y 30 27 38 48 59 54 42 63 52 47

Решение:

Размерът на извадката е n=10.

За корелационния коефициент подобно на Пример 1 получаваме

R=0.892, статистически валиден при ниво 5%. Следователно има

положителна корелационна зависимост (възможна асоциативна връзка)

между x и y.

Page 20: МАРКЕТИНГОВИ ИЗСЛЕДВАНИЯ lekciа5.pdf · С.Г.Гочева-Илиева, Лекции по МАРКЕТИНГОВИ ИЗСЛЕДВАНИЯ 6 Изчисляването

С.Г.Гочева-Илиева, Лекции по МАРКЕТИНГОВИ ИЗСЛЕДВАНИЯ

20

За уравнение на регресия построяваме долната таблица. Изчисляваме

средните стойности: 82/10 8.2, 460/10 46x y . Изчисляваме и

сумите и заместваме във формулите (3).

i xi yi

1 5 30 -3.2 -16 51.2 10.24

2 4 27 -4.2 -19 79.8 17.64

3 7 38 -1.2 -8 9.6 1.44

4 10 48 1.8 2 3.6 3.24

5 11 59 2.8 13 36.4 7.84

6 8 54 -0.2 8 -1.6 0.04

7 9 42 0.8 -4 -3.2 0.64

8 11 63 2.8 17 47.6 7.84

9 8 52 -0.2 6 -1.2 0.04

10 9 47 0.8 1 0.8 0.64

Суми 82 460 223 49.6

средни 8.2 46

ix x iy y 2

ix x i ix x y y

Page 21: МАРКЕТИНГОВИ ИЗСЛЕДВАНИЯ lekciа5.pdf · С.Г.Гочева-Илиева, Лекции по МАРКЕТИНГОВИ ИЗСЛЕДВАНИЯ 6 Изчисляването

С.Г.Гочева-Илиева, Лекции по МАРКЕТИНГОВИ ИЗСЛЕДВАНИЯ

21

Тогава от (3): 1

223ˆ 4.496049.6

b , 0ˆ 46 4.4960*8.2 9.1331b

Уравнението на линейна регресия е:

xxy 4960,41331,9)(ˆ .

На графиката е построена

линейната зависимост

за данните от примера.

Полученото регресионно уравнение се използва да се изчислява със

заместване приближение на y при зададено x.

Например при 6x моделът предсказва (6) 9,1331 4,4960*6 36.1091y

y = 4.496x + 9.1331R² = 0.7957

0

20

40

60

80

0 5 10 15

yi

Page 22: МАРКЕТИНГОВИ ИЗСЛЕДВАНИЯ lekciа5.pdf · С.Г.Гочева-Илиева, Лекции по МАРКЕТИНГОВИ ИЗСЛЕДВАНИЯ 6 Изчисляването

С.Г.Гочева-Илиева, Лекции по МАРКЕТИНГОВИ ИЗСЛЕДВАНИЯ

22

Процедура за едномерна линейна регресия в SPSS

За решаване на същия пример 2 с помощта на пакета SPSS набираме:

Analyze/Regression/Linear…

Page 23: МАРКЕТИНГОВИ ИЗСЛЕДВАНИЯ lekciа5.pdf · С.Г.Гочева-Илиева, Лекции по МАРКЕТИНГОВИ ИЗСЛЕДВАНИЯ 6 Изчисляването

С.Г.Гочева-Илиева, Лекции по МАРКЕТИНГОВИ ИЗСЛЕДВАНИЯ

23

1. Прехвърляме от лявата

половина вдясно y

като зависима

променлива

(Dependent)

2. Прехвърляме от лявата

половина вдясно x

като независима

променлива

(Independent, predictor)

Page 24: МАРКЕТИНГОВИ ИЗСЛЕДВАНИЯ lekciа5.pdf · С.Г.Гочева-Илиева, Лекции по МАРКЕТИНГОВИ ИЗСЛЕДВАНИЯ 6 Изчисляването

С.Г.Гочева-Илиева, Лекции по МАРКЕТИНГОВИ ИЗСЛЕДВАНИЯ

24

3. От основния прозорец Linear Regression избираме .

4. За регресионните

коефициенти

избираме Estimates

(оценки)

5. Отдясно избираме

Model Fit

(Приближение на

модела към данните)

Page 25: МАРКЕТИНГОВИ ИЗСЛЕДВАНИЯ lekciа5.pdf · С.Г.Гочева-Илиева, Лекции по МАРКЕТИНГОВИ ИЗСЛЕДВАНИЯ 6 Изчисляването

С.Г.Гочева-Илиева, Лекции по МАРКЕТИНГОВИ ИЗСЛЕДВАНИЯ

25

6. От основния прозорец Linear Regression избираме .

7. Избираме да се запомнят

предсказаните от модела

нестандартизирани

стойности (Unstandardized),

т.е. ˆ( )iy x .

Останалите елементи в

анализа оставяме по

подразбиране.

Page 26: МАРКЕТИНГОВИ ИЗСЛЕДВАНИЯ lekciа5.pdf · С.Г.Гочева-Илиева, Лекции по МАРКЕТИНГОВИ ИЗСЛЕДВАНИЯ 6 Изчисляването

С.Г.Гочева-Илиева, Лекции по МАРКЕТИНГОВИ ИЗСЛЕДВАНИЯ

26

Резултати от SPSS и тълкуване

Variables Entered/Removeda

Model Variables Entered

Variables Removed

Method

1 xb . Enter

a. Dependent Variable: y b. All requested variables entered.

Model Summaryb

Model R R Square Adjusted R Square

Std. Error of the Estimate

1 .892a .796 .770 5.672

a. Predictors: (Constant), x b. Dependent Variable: y

Enter метод в SPSS

означава

обикновена линейна

регресия.

Тук се дава корелационният коефициент, в случая

R=0.892. R Square е коефициент на детерминация

на модела или R2=0.796. Той е мярка за

качеството на модела. В случая означава, че

моделът обяснява 79.6% от данните.

Page 27: МАРКЕТИНГОВИ ИЗСЛЕДВАНИЯ lekciа5.pdf · С.Г.Гочева-Илиева, Лекции по МАРКЕТИНГОВИ ИЗСЛЕДВАНИЯ 6 Изчисляването

С.Г.Гочева-Илиева, Лекции по МАРКЕТИНГОВИ ИЗСЛЕДВАНИЯ

27

ANOVAa

Model Sum of Squares

df Mean Square

F Sig.

1

Regression 1002.601 1 1002.601 31.161 .001b

Residual 257.399 8 32.175

Total 1260.000 9

a. Dependent Variable: y b. Predictors: (Constant), x

Най-важната характеристика е коефициентът на значимост на целия

модел (Sig.), който трябва да е по-малък от избраното ниво, най-често

0.05 .

За нашите данни Sig. =0.001<0.05. Последното означава, че полученият

модел на линейна регресия е статистически приемлив (с 95% вероятност).

Page 28: МАРКЕТИНГОВИ ИЗСЛЕДВАНИЯ lekciа5.pdf · С.Г.Гочева-Илиева, Лекции по МАРКЕТИНГОВИ ИЗСЛЕДВАНИЯ 6 Изчисляването

С.Г.Гочева-Илиева, Лекции по МАРКЕТИНГОВИ ИЗСЛЕДВАНИЯ

28

Coefficientsa

Model Unstandardized Coefficients

Standardized

Coefficients

t Sig.

B Std. Error

Beta

1 (Constant) 9.133 6.844 1.335 .219

x 4.496 .805 .892 5.582 .001

a. Dependent Variable: y

Уравнението на регресия е:

( ) 9,133 4,496y x x

Аналогично се проверява значимостта

на всички коефициенти. В случая

значимостта на оценката за константата

0b е Sig.=0.219>0.05, следователно този

коефициент е незначим. Неговата

стойност не влияе на модела.

Page 29: МАРКЕТИНГОВИ ИЗСЛЕДВАНИЯ lekciа5.pdf · С.Г.Гочева-Илиева, Лекции по МАРКЕТИНГОВИ ИЗСЛЕДВАНИЯ 6 Изчисляването

С.Г.Гочева-Илиева, Лекции по МАРКЕТИНГОВИ ИЗСЛЕДВАНИЯ

29

Многомерна линейна регресия

Разгледаните примери на регресия всъщност са частен случай на

линейна регресия с една зависима и една независима променлива.

В общия случай линейността се разглежда спрямо коефициентите на

регресия, по-горе означени с 0 1 2, , ,...b b b .

Накратко ще приведем необходимите теоретични постановки за

многомерен РА.

Задачата е: Нека са известни измервания (наблюдения) за някаква

променлива величина y, зависеща от p на брой независими величини

1 2, ,... , px x x . Всяка променлива величина 1 2, , ,... , py x x x има по n на

брой наблюдения. Търсим линейна зависимост от вида

0 1 1 2 2ˆ ... p py b b x b x b x , (4)

Page 30: МАРКЕТИНГОВИ ИЗСЛЕДВАНИЯ lekciа5.pdf · С.Г.Гочева-Илиева, Лекции по МАРКЕТИНГОВИ ИЗСЛЕДВАНИЯ 6 Изчисляването

С.Г.Гочева-Илиева, Лекции по МАРКЕТИНГОВИ ИЗСЛЕДВАНИЯ

30

където 0 1 2, , ,..., pb b b b са неизвестните коефициенти на регресия.

Теоретично те се определят така, че сумата от квадратите на остатъците

i (резидиумите, residuals) да е минимална, т.е.

2 2

1 1

ˆ minn n

i i iii i

L y y

. (5)

Получените стойности на коефициентите 0 1 2, , ,..., pb b b b в (4) се

наричат оценки на регресията, а y - предсказана стойност или оценка на

зависимата изходна променлива y.

Ако стандартизираме данните с формулата x x

zs

, получаваме

стандартизиран вид на регресионното уравнение:

1 1 2 2ˆ ... p pzy z z z (4‘)

Page 31: МАРКЕТИНГОВИ ИЗСЛЕДВАНИЯ lekciа5.pdf · С.Г.Гочева-Илиева, Лекции по МАРКЕТИНГОВИ ИЗСЛЕДВАНИЯ 6 Изчисляването

С.Г.Гочева-Илиева, Лекции по МАРКЕТИНГОВИ ИЗСЛЕДВАНИЯ

31

За прилагането както на едномерен, така и многомерен регресионен

анализ (РА) се изисква изпълнението на следните основни условия:

Изходните данни трябва да имат случаен характер, да бъдат от

интервален или от относителен тип. Категориалните данни трябва

да бъдат предварително трансформирани в двоични.

Наблюденията трябва да бъдат независими.

При линейна регресия се предполага, че общата зависимост има

линеен или близък до линеен характер.

Зависимата променлива трябва да има нормално разпределение

или близко до нормалното. Желателно е същото условие да

изпълняват и всички променливи в модела.

Когато разпределението съществено се отличава от нормалното се

провежда процедура за предварителна трансформация на

променливата, с цел подобряване на разпределението към

нормалното, напр. с логаритмуване, повдигане на квадрат и др.

Page 32: МАРКЕТИНГОВИ ИЗСЛЕДВАНИЯ lekciа5.pdf · С.Г.Гочева-Илиева, Лекции по МАРКЕТИНГОВИ ИЗСЛЕДВАНИЯ 6 Изчисляването

С.Г.Гочева-Илиева, Лекции по МАРКЕТИНГОВИ ИЗСЛЕДВАНИЯ

32

Съществуват голям брой статистически тестове за валидност на

регресионния модел. Когато те са изпълнени, регресионният модел се

счита за статистически значим и пригоден за практическо използване и

прогнози.

Основни изисквания за валидност на РА (при ниво 0.05 )

Нивото на значимост Sig. на целия модел, оценяван с F

статистика (в таблица ANOVA) трябва да бъде < 0.05 или друго

избрано ниво на значимост .

Коефициентът на детерминация 2R и коефициентът на

многомерна корелация R (по абсолютна стойност) трябва да са

близки до 1 и желателно по-големи от 0.5.

Page 33: МАРКЕТИНГОВИ ИЗСЛЕДВАНИЯ lekciа5.pdf · С.Г.Гочева-Илиева, Лекции по МАРКЕТИНГОВИ ИЗСЛЕДВАНИЯ 6 Изчисляването

С.Г.Гочева-Илиева, Лекции по МАРКЕТИНГОВИ ИЗСЛЕДВАНИЯ

33

Изследването за мултиколинеарност между независимите

променливи да е приемливо (за SPSS тестът VIF < 10)

Да се направи анализ на остатъците от регресията:

разпределението на остатъците да е нормално (напр. с

хистограма, P-P, Q-Q тест, тест на Колмогоров-Смирнов, тест на

Шапиро-Уилк), разстоянията на Махалонобис и Кук да са малки,

да се изследват отдалечените точки и др.

Препоръчва се и провеждане на процедура на крос-валидация. Тя

се състои в разделяне на дадената извадка на две непресичащи се

подизвадки, наречени обучителна (тренировъчна) и тестова. С

обучителната извадка се построява и изследва нов модел. С този

модел се предсказват стойностите на зависимата променлива за

наблюденията от тестовата извадка. Ако резултатите са близки до

модела с обучителната извадка и с изходния модел, се приема че

Page 34: МАРКЕТИНГОВИ ИЗСЛЕДВАНИЯ lekciа5.pdf · С.Г.Гочева-Илиева, Лекции по МАРКЕТИНГОВИ ИЗСЛЕДВАНИЯ 6 Изчисляването

С.Г.Гочева-Илиева, Лекции по МАРКЕТИНГОВИ ИЗСЛЕДВАНИЯ

34

полученият общ модел е валиден и адекватен за използване и

формулиране на заключения.

Пример 3. С данните от файла restorant.sav от Пример 1 ще изследваме

как зависи Общото удовлетворение на клиентите от предикторите:

Качество_на_храната,

Цена,

Посрещане,

Обслужване,

Време_за_чакане.

Провеждането на регресионен анализ с SPSS става аналогично на

описания в едномерния случай начин.

От главната лента избираме:

Analyze/Regression/Linear…

В стъпка 1. въвеждаме променливите както е показано по-долу:

Page 35: МАРКЕТИНГОВИ ИЗСЛЕДВАНИЯ lekciа5.pdf · С.Г.Гочева-Илиева, Лекции по МАРКЕТИНГОВИ ИЗСЛЕДВАНИЯ 6 Изчисляването

С.Г.Гочева-Илиева, Лекции по МАРКЕТИНГОВИ ИЗСЛЕДВАНИЯ

35

Page 36: МАРКЕТИНГОВИ ИЗСЛЕДВАНИЯ lekciа5.pdf · С.Г.Гочева-Илиева, Лекции по МАРКЕТИНГОВИ ИЗСЛЕДВАНИЯ 6 Изчисляването

С.Г.Гочева-Илиева, Лекции по МАРКЕТИНГОВИ ИЗСЛЕДВАНИЯ

36

Останалите параметри избираме както в Пример 2. За да изследваме

грешките допълнително избираме от Plots следното:

Page 37: МАРКЕТИНГОВИ ИЗСЛЕДВАНИЯ lekciа5.pdf · С.Г.Гочева-Илиева, Лекции по МАРКЕТИНГОВИ ИЗСЛЕДВАНИЯ 6 Изчисляването

С.Г.Гочева-Илиева, Лекции по МАРКЕТИНГОВИ ИЗСЛЕДВАНИЯ

37

Резултати от SPSS за Пример 3

Многомерният корелационен

коефициент е R=0.758.

Коефициентът на детерминация на

модела е R2=0.575. В случая това

означава, че моделът обяснява

57.5% от данните.

(С корекция е 55.4%.)

Page 38: МАРКЕТИНГОВИ ИЗСЛЕДВАНИЯ lekciа5.pdf · С.Г.Гочева-Илиева, Лекции по МАРКЕТИНГОВИ ИЗСЛЕДВАНИЯ 6 Изчисляването

С.Г.Гочева-Илиева, Лекции по МАРКЕТИНГОВИ ИЗСЛЕДВАНИЯ

38

За нашите данни

Sig. =0.000<0.05.

т.е. моделът на линейна

регресия е статистически

приемлив (с 95%

вероятност).

Коефициенти на

модела kb от (4);

Стандартизираните

им стойности са в

колона Beta.

Значимост (Sig.) на

всички коефициенти.

Page 39: МАРКЕТИНГОВИ ИЗСЛЕДВАНИЯ lekciа5.pdf · С.Г.Гочева-Илиева, Лекции по МАРКЕТИНГОВИ ИЗСЛЕДВАНИЯ 6 Изчисляването

С.Г.Гочева-Илиева, Лекции по МАРКЕТИНГОВИ ИЗСЛЕДВАНИЯ

39

Уравнението на регресия с нестандартизирани коефициенти kb е:

0 1 1 5 5( ) ...y x b b x b x или в конкретния случай:

Обща_удовлетвореност= -0.172+0.231*Посрещане+0.265*Обслужване

+0.179*Време_за_чакане+0.442*Качество_на_храната+0.129*Цена

Стандартизираното уравнение е:

zОбща_удовлетвореност= 0.195*zПосрещане+0.205*zОбслужване

+0.175*zВреме_за_чакане+0.313*zКачество_на_храната+0.176*zЦена

От последното уравнение се вижда, че основен фактор за

удовлетвореност на клиентите на ресторанта е качеството на храната

(0.313), следван от обслужването (0.205) и посрещането (0.195). Ако се

положат усилия за подобрение на тези фактори, клиентите могат да се

увеличат.

Page 40: МАРКЕТИНГОВИ ИЗСЛЕДВАНИЯ lekciа5.pdf · С.Г.Гочева-Илиева, Лекции по МАРКЕТИНГОВИ ИЗСЛЕДВАНИЯ 6 Изчисляването

С.Г.Гочева-Илиева, Лекции по МАРКЕТИНГОВИ ИЗСЛЕДВАНИЯ

40

Проверка за валидността на проведения анализ чрез изследване на

остатъците (residuals), получени от SPSS. (N=107, т.е. k=7 групи, които

определяме така, че 2k>N).

Извод: Можем да приемем, че полученото многомерно регресионно

уравнение е валидно статистически и може да се използва за

предсказване. То обяснява събраните данни с R2=57.5%.

Разпределението на

остатъците е близко до

нормалното.

P-P графиката също е

близка до диагонала

(кумулативните вероятности

на нормалното разпределение).