10
Econometrie, anul II, 2014-2015 Facultatea de Marketing, ASE Probleme testari ipoteze statistice; Analiza dispersionala (ANOVA) 1. O firmă doreşte să se aprovizioneze cu un tip de componente electronice de la un producător care afirmă că acestea au o durată de viaţă de 100 de ore. Managerul firmei crede, însă, că în realitate durata de viaţă este mai mică şi, pentru a verifica această ipoteză se organizează o cercetare pe un eşantion selectat aleator, de 36 de componente pentru care se înregistrează durata de viaţă. În urma prelucrării datelor reiese că în medie, o astfel de componentă funcţionează 96 de ore, cu o deviaţie standard de 8 ore. Dacă se ştie că durata de viaţă este o variabilă normal distribuită, există suficiente dovezi pentru a afirma că managerul firmei are dreptate? (nivelul de semnificaţie este de 1%). 2. Un analist financiar presupune că valoarea medie a facturilor emise de firma la care lucrează este de peste 10 milioane lei/factură. Pentru a verifica această ipoteză, el selectează aleator 48 de facturi emise în ultima lună şi înregistrează valorile acestora. În urma prelucrării datelor, se obţine: = 490 i x ; 5165 2 = i x , unde x i este valoarea facturii i. Are analistul dreptate? (nivelul de încredere este de 99%). 3. Un consilier local pretinde că pompierii ajung la locul unui incendiu într-un timp mediu de 12 minute, însă un reporter suspectează că în realitate timpul de răspuns al pompierilor ar fi mai mare. Pentru examinarea acestei ipoteze, este aplicat un test pe un eşantion de 64 de situaţii de urgenţă, ce reclamau intervenţia pompierilor, înregistrându-se timpii de răspuns (de reacţie). La ce concluzie se ajunge dacă, pe baza datelor din eşantion, a reieşit că timpul mediu de răspuns al pompierilor este de 13,1 minute, cu o dispersie de 36? (nivel de semnificaţie de 2%). 6. Un reprezentant al Camerei de Comerţ locale pretinde că nivelul mediu al preţurilor de vânzare al caselor din acea zonă este de 90.000 $. Pentru a verifica această afirmaţie, un agent imobiliar înregistrează preţul de vânzare practicat în cazul a opt tranzacţii imobiliare recent efectuate: 75000$; 102000 $; 80000 $; 85000 $; 79000 $; 95000 $; 98000 $; 62000 $. Există dovezi în sprijinul acceptării afirmaţiei reprezentantului Camerei de Comerţ pentru un nivel de semnificaţie de 5%? Dar pentru un nivel de semnificaţie de 10%? 7. În urma tratamentelor clasice aplicate pacienţilor operaţi chirurgical în vederea recuperării lor, se ştie că aceştia petrec în medie 2 ore în salonul de recuperare. Un medic susţine, însă, că aplicarea unui nou tratament va conduce la micşorarea timpului de recuperare. Pentru a verifica această ipoteză, este efectuat un studiu pe 17 pacienţi operaţi chirurgical, pentru care se măsoară timpul petrecut în salonul de recuperare, în urma aplicării noului tratament postoperator (x i ). S-au obţinut următoarele rezultate: = 7 , 35 i x ; ( ) 096 , 0 2 = - x x i . Există suficiente dovezi pentru a susţine afirmaţia medicului, la un nivel de încredere de 90%?

Econometrie Set 1 - Probleme Testari Ipoteze Statistice, Analiza Dispersionala 2014-2015 (1)

Embed Size (px)

DESCRIPTION

econ sho sjhgs jsdjds

Citation preview

  • Econometrie, anul II, 2014-2015

    Facultatea de Marketing, ASE

    Probleme testari ipoteze statistice; Analiza dispersionala (ANOVA)

    1. O firm dorete s se aprovizioneze cu un tip de componente electronice de la un productor care afirm c acestea au o durat de via de 100 de ore. Managerul firmei crede, ns, c n realitate durata de via este mai mic i, pentru a verifica aceast ipotez se organizeaz o cercetare pe un eantion selectat aleator, de 36 de componente pentru care se nregistreaz durata de via. n urma prelucrrii datelor reiese c n medie, o astfel de component funcioneaz 96 de ore, cu o deviaie standard de 8 ore. Dac se tie c durata de via este o variabil normal distribuit, exist suficiente dovezi pentru a afirma c managerul firmei are dreptate? (nivelul de semnificaie este de 1%). 2. Un analist financiar presupune c valoarea medie a facturilor emise de firma la care lucreaz este de peste 10 milioane lei/factur. Pentru a verifica aceast ipotez, el selecteaz aleator 48 de facturi emise n ultima lun i nregistreaz valorile acestora. n urma prelucrrii datelor, se obine: = 490ix ; 5165

    2= ix , unde xi este

    valoarea facturii i. Are analistul dreptate? (nivelul de ncredere este de 99%). 3. Un consilier local pretinde c pompierii ajung la locul unui incendiu ntr-un timp mediu de 12 minute, ns un reporter suspecteaz c n realitate timpul de rspuns al pompierilor ar fi mai mare. Pentru examinarea acestei ipoteze, este aplicat un test pe un eantion de 64 de situaii de urgen, ce reclamau intervenia pompierilor, nregistrndu-se timpii de rspuns (de reacie). La ce concluzie se ajunge dac, pe baza datelor din eantion, a reieit c timpul mediu de rspuns al pompierilor este de 13,1 minute, cu o dispersie de 36? (nivel de semnificaie de 2%). 6. Un reprezentant al Camerei de Comer locale pretinde c nivelul mediu al preurilor de vnzare al caselor din acea zon este de 90.000 $. Pentru a verifica aceast afirmaie, un agent imobiliar nregistreaz preul de vnzare practicat n cazul a opt tranzacii imobiliare recent efectuate: 75000$; 102000 $; 80000 $; 85000 $; 79000 $; 95000 $; 98000 $; 62000 $. Exist dovezi n sprijinul acceptrii afirmaiei reprezentantului Camerei de Comer pentru un nivel de semnificaie de 5%? Dar pentru un nivel de semnificaie de 10%? 7. n urma tratamentelor clasice aplicate pacienilor operai chirurgical n vederea recuperrii lor, se tie c acetia petrec n medie 2 ore n salonul de recuperare. Un medic susine, ns, c aplicarea unui nou tratament va conduce la micorarea timpului de recuperare. Pentru a verifica aceast ipotez, este efectuat un studiu pe 17 pacieni operai chirurgical, pentru care se msoar timpul petrecut n salonul de recuperare, n urma aplicrii noului tratament postoperator (xi). S-au obinut

    urmtoarele rezultate: = 7,35ix ; ( ) 096,02

    = xxi . Exist suficiente dovezi pentru a susine afirmaia medicului, la un nivel de ncredere de 90%?

  • 2

    8. Un articol dintr-o revist susine c adolescenii se uit n medie 2 ore pe zi la televizor. Un sociolog crede ns c cifra real este mai mare i intervieveaz 18 adolsceni, nregistrnd rspunsul la ntrebarea: Cte ore privii n medie pe zi la televizor? S-au obinut rezultatele: = 4,50ix ; 8,163

    2= ix . Cine are dreptate, la

    un nivel de semnificaie de 1%?

    9. O companie productoare de avioane trebuie s se aprovizioneze cu foi (folii) de aluminiu de 0,05 inch grosime. Foliile mai subiri nu au duritatea necesar, iar cele mai groase de 0,05 inch au o greutate prea mare. O firm productoare de folii de aluminiu susine c foliile fabricate de el ntrunesc condiia de grosime cerut. Pentru a verifica aceast ipotez, compania de avioane face un studiu pe 100 de folii de aluminiu selectate aleator i gsete o grosime medie de 0,048 inch, cu o deviaie standard a grosimii de 0,01 inch. Ar trebui compania de avioane s se aprovizioneze cu folii de aluminiu de la acel productor? (nivel de semnificaie de 5%).

    10. Un productor susine c un nou tip de aparat de aer condiionat consum doar 6,5 KW pe zi. Reprezentantul unei agenii de consum crede c valoarea real a consumului zilnic este mai mare i efectueaz un studiu pe un eantion de 50 de aparate. Dac pe baza datelor din eantion a reieit c un aparat de aer condiionat consum n medie 7 KW pe zi, cu o deviaie standard de 1,4 KW, exist suficiente dovezi c ar trebui s respingem afirmaia productorului pentru un nivel de semnificaie de 5%? Dar de 1%?

    11. O companie farmaceutic susine c un medicament va produce efectul dorit dup un timp mediu de 58,4 minute. Un cercettor efectueaz un test de verificare a acestei ipoteze, pe un eantion de 250 de pacieni crora li s-a administrat medicamentul respectiv i nregistreaz timpul dup care el i-a fcut efectul. Se cunosc rezultatele

    preliminare: = 14875ix ; ( ) 171552

    = xxi . Exist suficiente dovezi pentru respingerea ipotezei companiei farmaceutice pentru un nivel de semnificaie de 10%? Dar de 2%?

    12. Patronul unei firme de prestri servicii dorete s fluidizeze servirea clienilor i, pn n prezent, el presupunea c timpul de servire a clienilor este normal distribuit, de medie 130 de minute i abatere medie ptratic 15 minute. El este de acord cu abaterea medie ptratic, dar se ndoiete de faptul c durata medie de servire a unui client este 130 minute. Pentru a studia aceast problem, nregistreaz timpii de servire pentru 100 de clieni. Timpul mediu obinut n eantion este 120 minute. Poate patronul s concluzioneze, la o probabilitate de 99%, c timpul mediu este diferit de 130 minute.

    13. ntr-o cercetare prin sondaj aleator privitoare la transportul n comun, au fost selectate 100 de persoane pentru care s-a calculat valoarea medie a biletelor cumprate ntr-o lun pentru transport n comun urban de 110 u.m, cu o abatere medie ptratic de 60 u.m. a) Testai ipoteza nul, aceea conform creia valoarea medie a biletelor cumprate ntr-o lun, n colectivitatea general, este 100

    0== u.m, cu ipoteza alternativ

    1000=> u.m, utiliznd un nivel de ncredere 1- = 0,95 (probabilitatea (1-

    )100 = 95%).

  • 3

    b) Testai ipoteza nul 1000== u.m, cu ipoteza alternativ 100

    0= u.m, cu

    aceeai probabilitate. Interpretai rezultatele. 14. Un analist financiar presupune c valoarea facturilor emise de firma la care lucreaz este, n medie, mai mare 10 mii lei/factur. Pentru a susine aceast ipotez, el selecteaz aleator 58 de facturi emise n ultima lun, pentru care nregistreaz valorile (mii lei), prelucreaz datele si obtine:

    Mean 11,15517 Standard Error 0,384832 Median 10 Mode 9 Standard Deviation 2,930791 Sample Variance 8,589534 Kurtosis -0,39551 Skewness 0,803254 Range 11 Minimum 7 Maximum 18 Sum 647 Count 58 Confidence Level(95,0%) 0,770612

    S se testeze ipoteza analistului pentru o probabilitate de garantare a rezultatelor de 99%.

    15. Un productor de imprimante pentru calculatoare personale dorete s estimeze media numrului de caractere tiprite pn cnd se consum cerneala. Costul crescut al unei astfel de anchete impune utilizarea unui eantion de volum redus. Presupunem

    c au fost testate n = 15 imprimante i s-au calculat: 13,1=x milioane caractere, sx = 0,27 milioane caractere. n ipoteza distribuiei normale a numrului de caractere n colectivitatea general:

    a) S se determine, pentru o probabilitate de 90%, intervalul de ncredere pentru numrul mediu de caractere.

    b) S se testeze ipoteza nul 00,1= milioane, cu ipoteza alternativ 00,1> milioane caractere, utiliznd o probabilitate de 90%.

    16. Valoarea medie a unei locuine aflate n imediata apropiere a unui colegiu este de 58950 unitati monetare. Se presupune ca valoarea locuinelor crete cu ct ele sunt situate mai aproape de acest colegiu. Pentru a testa aceast ipotez, au fost selectate aleatoriu 12 locuine din zona colegiului; n urma evalurii acestora, a rezultat o valoare medie de 62 460 uniti monetare, cu o abatere medie patratic de 5200 uniti monetare. Testai aceast ipotez, pentru un nivel de semnificaie de 5%, stiind ca pretul locuintelor urmeaza o distributie normala.

    17. Gradul de poluare a aerului se poate determina prin msurarea mai multor elemente, printre care i nivelul monoxidului de carbon existent n atmosfer. Un ecologist vrea s arate c oraul X are un grad ridicat de poluare a aerului, ilustrat printr-un nivel mediu al monoxidului de carbon mai mare de 3,2. Pentru a verifica

  • 4

    aceast afirmaie, au fost nregistrate nivelurile monoxidului de carbon din 12 zile consecutive, valorile gsite fiind urmtoarele: Ziua 1 2 3 4 5 6 7 8 9 10 11 12 CO 3,5 3,9 2,8 3,1 3,1 3,4 4,8 3,2 2,5 3,5 4,4 3,1

    a) calculai media i abaterea medie ptratic a nivelului de CO din aer, pentru cele 12 zile;

    b) exist suficiente dovezi pentru a respinge ipoteza ecologistului?

    18. Managerul unei firme ce ofer servicii de curierat rapid susine c timpul su mediu de expediere, ntr-un anumit perimetru, este mai mic de 6 ore. Pentru verificarea acestei afirmaii, a fost considerat un eantion aleator de 10 expedieri ale unor pachete, pentru care s-au nregistrat timpii necesari pentru expedierea acestora la destinatie (ore): 7; 3; 4; 6; 10; 5; 6; 4; 3; 8. Exista suficiente dovezi pentru a susine afirmaia managerului, pentru un nivel de semnificaie de 5% (tcritic= 1,833)?

    19. Pentru 7 magazine situate n cartierul A al unui ora si 5 magazine situate in cartierul B al aceluiasi oras, se cunosc valorile vnzrilor (mil. lei). In urma aplicarii metodei de analiza dispersionala ANOVA si a prelucrarii datelor cu Excel, s-au obtinut urmatoarele rezultate:

    ANOVA

    Source of Variation SS df MS F P-value F crit

    Between Groups . 1 . 17,96283 0,001721 4,964603

    Within Groups . . 7,891429

    Total ..

    Se cere s se determine datele lipsa si sa se interpreteze rezultatele prelucrarii. Influenteaza cartierul in care sunt amplasate magazinele variatia vanzarilor in mod semnificativ?

    20. Un cercettor face un studiu asupra unor firme, privind ansele pe care acestea le ofer tinerilor angajai de a promova repede i de a avansa n carier. Pentru aceasta el a cuprins n studiu un numr de 20 de companii productoare de tehnologie de vrf i a nregistrat timpul scurs de la angajarea iniial a unui salariat n firm pn la prima promovare a acestuia. Firmele au fost grupate dup mrime (mici, medii si mari), iar in urma aplicarii testului F de analiz dispersional rezultatele sunt: ANOVA

    Source of Variation SS df MS F P-value F crit

    Between Groups 384,3 ........ .............. ........... 0,001922 3,591531

    Within Groups .......... ......... .............

    Total 737,8 ..........

    Completati spatiile libere si testati ipoteza conform careia variaia timpului scurs pn la prima promovare este influenat semnificativ de mrimea firmei (probabilitate de 95%)?

    21. n vederea fundamentrii deciziei de nlocuire a unor utilaje din dotarea unei fabrici, managerul acesteia solicit o analiz a vechimii utilajelor i a costului de ntreinere anual al acestora. Astfel, pentru cele 20 utilaje din dotarea fabricii care sunt grupate dup vechime (ani) in 3 grupe: vechime mica (10 ani). s-a inregistrat costul de intretinere al acestora (u.m.). In urma aplicarii metodei ANOVA de analiza dispersionala, si a prelucrarii datelor cu Excel, s-au obtinut urmatoarele rezultate:

  • 5

    ANOVA

    Source of Variation S

    S d

    f M

    S F P-

    value F

    crit

    Between Groups 135 ..... ..

    0,001264

    3,591531

    Within Groups .. 6,658824

    Total 248,2 ..........

    Se cere s se determine datele lipsa si sa se interpreteze rezultatele prelucrarii.

    22. Managerul unui lan de supermarketuri dorete s deschid un nou magazin n unul din cele 4 cartiere principale ale unui oras. Unul din factorii importanti luati in considerare in luarea deciziei de amplasare este venitul mediu lunar al rezidentilor fiecarui cartier. Se selecteaz astfel un eantion de 80 gospodarii i se nregistreaz veniturile (mii lei). n urma prelucrrii datelor in Excel s-au obinut rezultatele:

    Groups Count Sum Average Variance

    Cartierul A 19 44,2 2,33 0,24 Cartierul B 24 78,3 3,26 0,33 Cartierul C 16 33,6 2,10 0,17 Cartierul D 21 57,3 2,73 0,46

    Testai, folosind testul Fisher, pentru o probabilitate de 95% (Fcritic = 2,73) dac exist diferene semnificative ntre veniturile gospodariilor, diferene generate de cartierul de reziden.

    23. Un cercetator doreste sa determine daca un nou produs software ajuta studentii sa nvete la matematica. Pentru aceasta el formeaza 3 grupe de studiu: studentii din Grupul 1 nu beneficiaza de pregatire suplimentara la matematica n afara orelor din programa universitara, studentii din Grupul 2 beneficiaza de pregatire suplimentara n cadrul consultatiilor, iar studentii din Grupul 3 se pregatesc pe baza programului tutorial pe calculator. Dupa o luna de zile de pregatire la matematica, studentii primesc un test, punctajele obtinute la test fiind prezentate in tabelul urmator: Grupul 1 - Fara pregatire suplimentara Grupul 2 - Consultatii Grupul 3 Program tutorial

    23 30 32

    22 27 30

    22 22 24

    23 23 22

    17 19 21

    18 19 20

    15 21 19

    Sa se stabileasca daca modul de pregatire la matematica a influentat rezultatele obtinute la test de catre studenti (nivel de semnificatie 5%). Rezolvati problema cu programul Excel si interpretati toate rezultatele afisate.

    24. O fabrica de produse de patiserie produce un tip de fursecuri pe care l comercializeaza ntr-un supermarket. n vederea stimularii vnzarilor, managerul supermarketului hotaraste sa schimbe locatia de amplasare a produsului timp de 15 saptamni. Astfel, produsul este mutat saptamnal n 3 locatii: la raionul de patiserie, la raionul de lactate si lnga casa de marcat, nregistrndu-se vnzarile saptamnale obtinute. n urma prelucrarii datelor s-au obtinut urmatoarele rezultate preliminare:

  • 6

    SUMMARY

    Group Count Average Variance

    Raionul de lactate 5 35,0 63,5

    Casa de marcat 5 49,0 140,5

    Raionul de patiserie 5 23,4 31,8

    Exista suficiente dovezi pentru a afirma ca locatia de expunere a produsului a influentat variatia vanzarilor? (nivel de semnificatie 5%) Completati si interpretati tabelul ANOVA:

    ANOVA

    Source of variation SS df MS F P-value F crit

    Between Groups ............. .................. .................. ................. 0,002352

    Within Groups ............ ................. ....................

    Total .................. .................

    25. Managerul unui lant de supermarketuri doreste sa deschida un nou magazin n una din cele 4 zone diferite ale unui oras mare. Unul din factorii importanti n luarea acestei decizii l constituie venitul mediu anual al gospodariilor rezidentilor din fiecare zona. ntr-un studiu preliminar, diferiti rezidenti ai celor 4 zone sunt ntrebati care este venitul mediu anual al gospodariilor din care fac parte (Y). In urma prelucrarii datelor s-au obtinut urmatoarele rezultate:

    Zona (X) Numar gospodarii i

    iy

    i

    iy2

    A 6 159 4345

    B 9 294 10464

    C 7 182 5550

    D 5 138 4134

    Exista suficiente dovezi care sa permita managerului sa concluzioneze ca exista diferente semnificative ale venitului mediu anual al gospodariilor din cele 4 zone? (nivel de semnificatie 1%). Completati si interpretati tabelele:

    SUMMARY

    Groups Count Sum Average Variance

    ANOVA

    Source of variation SS df MS F F crit

    Between Groups ............. .................. .................. .................

    Within Groups ............ ................. ....................

    Total .................. .................

    27. O agentie de ocupare a fortei de munca este interesata sa studieze care din cele 3 tipuri de anunt publicitar, publicat la rubrica de "Cereri si oferte de angajare" dintr-un ziar local este cel mai eficient. Cele 3 tipuri de anunturi (cel tiparit cu caractere mari, cel tiparit cu caractere obisnuite si cele tiparit cu caractere bold) sunt alternate aleator timp de 18 saptamni si este inregistrat numarul persoanelor care au raspuns la anunt in fiecare saptamna. Rezultatele preliminare ale prelucrarii datelor sunt:

  • 7

    Groups Count Average

    Caractere mari 7 33,43

    Caractere obisnuite 5 23,60

    Caractere bold 6 34,00

    Stiind ca numarul respondentilor inregistreaza - pe total esantion - un coeficient de variatie de 27,2%, aratati daca informatiile prezentate ofera suficiente dovezi in sprijinul ideii ca tipul de anunt influenteaza eficacitatea acestuia (masurata prin numarul mediu de respondenti), pentru un nivel de semnificatie de 1%? Completati si interpretati tabelul ANOVA. 28. n marketingul produselor destinate copiilor este deosebit de importanta realizarea unor spoturi publicitare televizate, care sa capteze atentia copiilor. n timpul vizionarii lor, o firma de cercetari in marketing vrea sa stabileasca in ce mod reclamele la diferite produse genereaza diferente in ceea ce priveste durata atentiei copiilor. Pentru aceasta 20 de copii cu vrste sub 10 ani sunt rugati sa vizioneze cte un clip publicitar de 60 de secunde, la unul din cele 3 tipuri de produse (jocuri, dulciuri si articole de imbracaminte), apoi se masoara timpul in care fiecare dintre ei urmareste atent reclama (in secunde). Din cei 20 de copii, 7 copii urmaresc o reclama la jocuri, 5 - la dulciuri si restul la imbracaminte. Rezultatele prelucrarii datelor in Excel sunt:

    ANOVA

    Source of variation SS df MS F P value F crit

    Between Groups ............. .................. 694,125 ................. 0,00023

    Within Groups ............ ................. ....................

    Total 1588,95 .................

    Completati tabelul si aratati daca exista suficiente dovezi pentru a concluziona ca tipul produsului la care se refera spoturile publicitare determina diferente semnificative in duratele atentiei cu care copiii urmaresc aceste reclame (nivel de semnificatie 5%). 29. Pentru compararea puterii de frnare a 4 tipuri de anvelope auto a fost inregistrata distanta de frnare a unui vehicol pe carosabil umed. Este testata cte o anvelopa din fiecare tip pe acelasi autovehicol. Se dau urmatoarele rezultate preliminare:

    Groups Count Variance

    Tip A 6 4,00

    Tip B 5 4,00

    Tip C 4 4,67

    Tip D 7 1,67

    Stiind ca dispersia distantei de frnare, la nivelul esantionului este de 3,636 exista suficiente dovezi pentru a afirma ca exista diferente semnificative intre distantele medii de frnare pentru cele 4 tipuri de anvelope, la un nivel de incredere de 95%?

  • 8

  • 9

    Tabel cu cuantilele superioare ale repartitiei Student

  • 10

    Cuantilele superioare ale repartitiei Fisher cu (l1, l2) grade de

    libertate, pentru nivelele de semnificatie =0,05 si =0,01