Le mie lezioni di Statistica -...

Preview:

Citation preview

Le mie lezioni di Statistica

di G. Calvi

STATISTICA

• indu'va• descri'va

cennistorici

TERMINISTATISTICI

FASIDIUN’INDAGINESTATISTICA

• DISTRIBUZIONIDIFREQUENZA

• INDICICENTRALI

• INDICIDIVARIABILITA’

RAPPRESENTAZIONIGRAFICHE: • Diagrammiabarre • Diagrammicircolari • Istogrammi • Diagrammicartesiani Distribuzionenormale

sta)s)ca:studioquanMtaMvodifenomenicolle'vista)s)caindu0va:larilevazionedeidaM,anzichésull’interapopolazione,èeseguitasuuncampione,edall’esamediquest’ulMmosidesumonoinformazioni

sta)s)cadescri0vaorganizzainmodofacil-mentedominabileidaMraccolMsull’interapopolazioneinesame

•  universo:insiemedegliindividuioggeUodell’indagine.

•  unitàsta)s)ca:ciascunodegliindividuioggeUodellaricerca.

InalcunicasinonèpossibilesoUoporretu#gliindividuiall’indaginemacisilimitaaraccogliereinformazionirelaMveadunapartedellapopola-zionedeUacampione

•  Sidiconocara:erileproprietàchesonooggeUodirilevazione.

•  IdiversimodiincuiuncaraUeresipresentaoidiversivaloricheessoassumepressoleunitàstaMsMchesonode'modalitàdelcaraUere

CARATTERI

QUANTITATIVIpossonoesseremisuraM

discreMseleloromodalitàassumonovalori

appartenenMall’insiemedeinumerinaturali

ConMnuiseleloromodalitàassumonogliinfiniMvaloricompresiin

unintervalloreale

QUALITATIVIvengonoindicaMmedianteespressioniverbali

FASIDIUN’INDAGINESTATISTICA

•  PIANIFICAZIONEDELL’INDAGINESTATISTICAOccorrestabilireinmodochiaroecompletoqualisonoirisultaMchesiintendono

oUenere;daquestafasedipendonoipassisuccessiviedirisultaMfinali.Individuareifenomenidaindagareconriferimentoalleunitàdellapopolazione

staMsMcaIndividuarel’insiemeicuielemenMsonooggeUodellaraccoltadeidaMSceglieredaqualiequanteunitàsta)s)cheoUenereinformazioniProcurarsiglistrumen)perlaraccoltadeida)(costruzionediun

quesMonario)

•  RILEVAZIONEDEIDATI•  SPOGLIODEIDATIERELATIVAELABORAZIONE•  PRESENTAZIONEDEIRISULTATI•  INTERPRETAZIONEDEIRISULTATIOTTENUTI

RAPPRESENTAZIONIGRAFICHE:obie'vo:renderequasiimmediatoilrisultatodell’indagine

•  DiagrammaaBarre•  Istogrammi•  GraficiaTorta•  DiagrammiCartesiani

DiagrammaaBarre

•  èungraficouMlizzatoperrappresentarecara:eriqualita)vioquan)ta)vidiscre);

•  consisteinunaseriedireUangoliequidistanMlacuialtezzaèproporzionaleallafrequenzacorrispondente.

Istogrammi

•  rappresentazionegraficadicara:eriquan)ta)vicon)nuiconmodalitàraggruppateinclassi.

EssoècosMtuitodaunaseriedireUangoliconMguiognunodeiqualièassociatoadunaclasseinmodotaleche:•labasedelreUangoloèpariall’ampiezzadiclasse•l’altezzadelreUangoloèparialladensitàdifrequenza•l’areadelreUangoloèpercostruzionelafrequenza(assolutaorelaMva)associataallaclasse

GraficiaTorta

Inessil’areadelcerchioesprimel’intensitàolafrequenzatotale(siainterminiassoluMchedipercentuale)

mentreise:oricircolariesprimonoleintensitàolefrequenzeesonooUenuMdividendol’angologiro(360°)inparMproporzionalialleintensitàoallefrequenzedarappresentare

DiagrammiCartesiani

•  Questarappresentazionesiavvalediunriferimentoincoordinatecartesiane

•  IlpiùfrequenteuMlizzoriguardalarappresentazionedelleserietemporali

DISTRIBUZIONIDIFREQUENZA

Sidefiniscefrequenzaassoluta(diunamodalità)ilnumerototaledivoltecheessasipresentanelladistribuzionedidaMconsideraM.

N.B.lasommadellefrequenzeassoluteèugualealn.degliindividuicheformanol’universo

Ildato:215 StudenMdell’isMtuto“Nonsonulla”sonostaMrespinMÈdiversamentesignificaMvosel’isMtutoèfrequentatoda5.340allieviosegliiscri'erano340!IldatodellafrequenzaassolutaèdipersépocosignificaMvo:

E’IMPORTANTECONFRONTARELEFREQUENZE

CONILNUMEROTOTALEDIUNITÀRILEVATE

•  Sidefiniscelafrequenzarela)vacomerapportofralasuafrequenzaassolutaedilnumerototalediunitàrilevate.

N.T.B.lasommadellefrequenzarelaMvedeveSEMPREfare1

Ingeneralesipreferisceesprimerelefrequenze

relaMveinpercentuale,perfarlobastamolMplicareper100lafrequenzarelaMva.

•  LafrequenzacumulataassolutaassociataadunamodalitàdellavariabileèdatadallasommadellefrequenzedituUelemodalitàminoriougualiadessa

ESEMPIOStudiandoilcara-erealtezzanellaclasse,calcolarelafrequenzacumulatadiperme-edirisponderealladomanda:“quan8studen8hannostaturaminoreougualea1.75?”

osservazioni

Lafrequenzacumulata:•  sipuòuMlizzaresoloseilcaraUereèordinabile•  Laprimafrequenzacumulatacoincidesempreconlafrequenzadellaprimamodalità

•  L’ulMmafrequenzacumulatacoincidesempreconilnumerocomplessivodiindividui.

modalità Frequenza assoluta Frequenza relativa Frequenza percentuale

Frequenza cumulata

INDICICENTRALI

SinteMzzanoidaMrilevaMdall’indaginestaMsMcaaUraversopochinumerisignificaMvi.•  MODA•  MEDIA•  MEDIANA

MODA

•  Sidicemodalamodalitàoilvalorecuicorrispondelamassimafrequenza.

•  Pu`oessereu)lizzataperqualunque)podivariabile,maèpocoinforma)va

MEDIAIlconceUodimediaèdeltuUofamiliare,inquantol’uomoèpernaturainclineariassumeredaMdiscordanMperpoterconcentra-rel’aUenzionesull’intensitàmediadiuncaraUereepoterpiùfacilmenteconfrontaredaMomogeneirelaMviapopolazionidiverse.•  DaMnvaloriX1,X2,...,Xn,sidicemediaaritme)ca(o

semplicementemedia)ilvalorechesioCenedividendolalorosommaperilloronumeron;indicandoconMalamediaaritmeMca,

Informulasiha:

n

xxxM n+++

=...21

OSSERVAZIONI•  lamediaaritmeMcaèsemprecompresatrailminimoedil

massimodeivaloriosservaM(internalità)•  lasommadegliscar)dallamedia`esemprepariazeroPregiedife0dellamedia+èunbuonindicatoredellatendenzacentrale+èsemplicedatraUareanaliMcamente-risenteinmisurarilevantediciòcheaccadesullecodedelladistribuzione(èpocorobusta)

casipar8colari:

•  MEDIAPONDERATA•  MEDIADIDATISUDDIVISIPERCLASSI

MEDIANALamedianaèilvalorecheoccupailpostodimezzo,quandoida8sonodispos8inordinecrescente.Inaltreparole,idaMchelaseguonosonotanMquanMquellichelaprecedono.Percalcolarelamedianabisogna:1.ordinareivaloriosservaMinordinecrescente2.prendereilvalorecentralenellagraduatoriaordinataIlmododiprocedereperilsecondopuntovariaasecondadellanumerositàdelcolle'vostudiatondispariSen`edispari,esisteununicovalorechedivideesaUamenteindueladistribuzione.Ilvalorecentraleoccupalaposizione(n+1)/2nellagraduatoriaordinata.Me=x(n+1)/2npariSenèpari,siconsideranovaloricentraliquellicheoccupanoleposizionin/2en+1/2Lamedianaèquindidatadallasemisommadeivaloricentrali

OSSERVAZIONE:L’informazionechecidàlamedianaèche:il50%dellapopolazionepresentamodalitàminoriougualiallamediana,

il50%dellapopolazionepresentamodalitàmaggioriougualiallamediana

Pregiedife0dellamediana+èunbuonindicatoredellatendenzacentrale+risentepocodici`ocheaccadesullecodedelladistribuzione

-èdifficiledatraUareanaliMcamente

CalcolarelamedianaquandoidaMsonomoltonumerosi….

•  Sicostruiscelatabelladelladistribuzionedellefrequenze(assolute);

•  SicalcolanoinparMcolarelefrequenzecumulate;

•  Consideratoilnumerondiindividui,sappiamocheperdefinizionelamedianaèilterminecentraleedèquindidatadallasemisommadelleintensitàindividuatedaidueposMcentralin/2edn/2+1(senpari)

•  Dall’intensitàindividuatadalpostocentralesendispari

INDICIDIVARIABILITA’

studente16-6-5,5-6,5-5–7studente24-8-7-5-3–9studente33-4-3-8-9-9Chevotoavrannosullapagella?Checosapossiamoosservare?

Lemedieriassumonoinununicovaloreilfenomenostudiato,

manonfornisconoalcunainformazionesullasuavariabilità.Ènecessariodefiniredeiparametricheindichino:ladispersionedeidaMovverolaloromaggioreominoreconcentrazioneaUornoaunvaloremedio.

Eciinforminoquindidellasignifica)vitàdell’indicecentraleconsiderato.

Lapiùimmediatamisuradellavariabilitàèilcampodivariazione,cioèladifferenzafrailminimoeilmassimodeivaloriosserva8.Ingenereperòilcampodivariazione,cheMenecontosoltantodeiduevaloriestremienonèinfluenzatoinalcunmododaquelliintermedi,cosMtuisceunamisuratropporozzadellavariabilità.

E’possibilecostruireunindicechesfru'almeglioilcontenutoinformaMvodeidaM?Ilgradodidispersionedellesingoleosservazionièmisuratodagliscar)UnbuonindicedidispersionedeveessereunasintesidiquestequanMtàLoscartosemplicemedioeloscartoquadraMcomediosonoindicididispersione

InmoltecircostanzesiverificachelefrequenzediundatocaraUerehannounadistribuzionenormale,ossiasidistribuisconoinmodosimmetricoedecrescenterispeUoaunvaloreMpicoalqualespeUalamassimafrequenza.L’andamentodellefrequenzeèallorarappresentatodaunacurvaacampana,deUacurvadiGauss,chehamoltepliciriscontriinfenomenireali.

SitraUadiunacurvadallaclassicaformaacampanachehaunmassimoaUornoallamediadeivalorimisuraMepuòesserepiùomenostreUaasecondadelladispersionedeivaloriaUornoallamedia;ladispersionesimisuraconladeviazionestandard:praMcamenteunadelleproprietàdellagaussianaècheil68%dellemisurazionidifferiscedallamediamenodelladeviazionestandardecheil95%menodiduedeviazionistandard:quindimaggioreèladeviazionestandard,piùlagaussianaè"aperta"epiùc'èlapossibilitàchelamedia(ilpuntopiùalto)nonsiarappresentaMvoditanMcasi.AnchenelcasodellacurvadiGaussl'areasoUesadallacurvavale1perchélasommadelleprobabilitàditu'ivaloridà1,cioèlacertezza.

Recommended