Estatística Básica - utfpr.edu.br .Estatística Descritiva • A Estatística Descritiva se preocupa

  • View
    216

  • Download
    0

Embed Size (px)

Text of Estatística Básica - utfpr.edu.br .Estatística Descritiva • A Estatística Descritiva se...

EstatsticaBsica

O que Estatstica ?OqueEstatstica?

umconjuntodemtodoseprocessosquantitativosqueservemparaestudaremedirq q posfenmenoscoletivos

Aplicaes em quase todas as reas de Aplicaesemquasetodasasreasdeconhecimentohumano,inclusiveCinciasdaComputao

O que analisar dados ?Oqueanalisardados?

Id tifi t t di Identificarcomportamentosmdios,comportamentosdiscrepantes,comparacomportamentos investigar a interdependnciacomportamentos,investigarainterdependnciaentrevariveis,revelartendncias,etc.

A partir de uma massa de dados e com auxlio deApartirdeumamassadedados,ecomauxlioderecursoscomputacionais,separaroqueessencial(estrutura)doqueeventual(rudo)

Resumir,deformaeficiente,ainformaocontidanosdadoseassimpermitirque,atravsdessse

h d d dconhecimento,asdecisessejamtomadasdeformamaisconsciente.

O que Anlise Exploratria ?OqueAnliseExploratria?

Tratasedeumconjuntodetcnicasdetratamentodedados,que,semimplicaremq pumafundamentaomatemticamaisrigorosa nos ajuda a fazer uma sondagemrigorosa,nosajudaafazerumasondageminicial,ouseja,tomarumprimeirocontatocom a informao disponvelcomainformaodisponvel

OquevemdepoisdaAnliseExploratria?

Apsaanliseexploratriaquefornecealgumaspistasarespeitodoestudo,podemosg p p ppartirparaachamadaInferncia,emquesero aplicados aos dados mtodos maisseroaplicadosaosdadosmtodosmaissofisticados,cujafundamentaomatemticaest no Clculo de ProbabilidadesestnoClculodeProbabilidades.

reas da EstatsticareasdaEstatstica

EstatsticaDescritiva Estatstica InferencialEstatsticaInferencial

Estatstica DescritivaEstatsticaDescritiva

AEstatsticaDescritivasepreocupacomaorganizao,apresentaoesintetizao deg p dados.Utilizamgrficos,tabelasemedidasdescritivas como ferramentas Utilizada nadescritivascomoferramentas.Utilizadanaetapainicialdaanlise,destinadaaobterinformaes que indicam possveis modelos ainformaesqueindicampossveismodelosaseremutilizadosnumafasefinalqueseriaachamadainfernciaestatstica

Vocabulrio bsico de estatsticaVocabulriobsicodeestatstica

Populao:Coleocompletadetodososelementosquesoobjetodenossoestudo.q j

Amostra:Subconjuntodeelementosselecionados da populao segundo regrasselecionadosdapopulaosegundoregrasbemdefinidas.

Varivel: Correspondeaumacaractersticadeum item ou de um indivduo.umitemoudeumindivduo.

VariveisVariveis

Aosefazerumestudoestatsticodeumdeterminadofatoougrupo,temsequeg p qconsiderarotipodevarivel: Variveis qualitativas; ou Variveisqualitativas;ou Variveisquantitativas

Variveis QualitativasVariveisQualitativas

Nominaloucategrica:seusvalorespossveissodiferentescategoriasnoordenadas,emgquecadaobservaopodeserclassificada.Ex: Raa nacionalidade rea de atividadesEx:Raa,nacionalidade,readeatividades.

Ordinal:seusvalorespossveissodiferentescategoriasordenadas,emquecadaobservaopodeserclassificada. p

Ex:classesocial,nveldeinstruo.

Variveis QuantitativasVariveisQuantitativas

Discreta:Seusvalorespossveissoemgeralresultadosdeumprocessodecontagem.p g

Ex:nmerodefilhos,nmerodesriesescolares cursadas com aprovao;escolarescursadascomaprovao;

Contnua:seusvalorespossveispodemserexpressosatravsdenmerosreaisevaremuma escala contnua de medioumaescalacontnuademedio

Ex:Rendamensal,peso,altura.

ExemploExemplo

Exemplo:Pesquisaantropomtrica:amostrade45mulheresidosasacimade60anos(xls)( )

DistribuiodeFrequncias TabelaseGrficos

Tabelas(Paraumavarivelqualitativa): Cadalinhacorrespondeaumvalorpossveldavarivel

Atravsdeumprocessodecontagemsoobtidososvaloresqueconstamnacolunadefrequnciadatabela.Oresultadodessacontagemchamadadefrequnciaabsoluta;

Apartirdasfrequnciasabsolutaspodemsertambmcalculadasfrequnciarelativas,usualmenteapresentadasobaformadepercentuais.

DistribuiodeFrequncias TabelaseGrficos

Grfico(Paraumavarivelqualitativa):Barras

40 00%

50,00%

60,00%

40,00%

50,00%

60,00%

20,00%

30,00%

40,00%

Ativa

Sedentria

0 00%

10,00%

20,00%

30,00%

, %

0,00%

10,00%

1

0,00%PequenoRisco

MdioRisco

GrandeRisco

DistribuiodeFrequncias TabelaseGrficos

G fi (P i l lit ti ) S t i t t Grfico(Paraumavarivelqualitativa):Setores pizzaoutorta

PequenoRisco;11,11%

Grande

Ativa;48,89%Sedent

ria;51 11%

MdioRisco;44,44%

GrandeRisco;44,44%

PequenoRisco

MdioRisco

GrandeRisco

51,11% ,

Observao sobre cada tipo de grficoObservaosobrecadatipodegrfico

O fi d t i li Ogrficodesetores,pornoimplicarumaordenaodascategorias,maisapropriadoparaas variveis qualitativas nominaisasvariveisqualitativasnominais

Ogrficodebarras,emqueascategoriasestonaturalmente ordenadas mais apropriado paranaturalmenteordenadas,maisapropriadoparaasvariveisqualitativasordinais

Para representar a distribuio de frequncia dePararepresentaradistribuiodefrequnciadeumavarivelatravsdeumgrficodesetoresimportantequeavarivelnopossuamuitas

d f l l dcategorias,poisistodificultaavisualizaodaspropores.

TabelasdeFrequnciasparavariveisquantitativas

Nocasodevariveisquantitativadiscretacomumpequenonmerodevalorespossveis(porexemplo,nmerodefilhos),aconstruodeumatabeladefrequnciasegueosmesmosmoldesdoq gquevistoparavariveisqualitativas;

Antes de mais nada necessrio dividir o seu Antesdemaisnadanecessriodividiroseuintervalodevariaoemvriossubintervalos(depreferncia todos eles com a mesma amplitude)prefernciatodoselescomamesmaamplitude).

TabelasdeFrequnciaparaVariveisQuantitativas

FaixaEtria Frequncia Percentuais

60 65 16 35,56

65 70 16 35,56

70 75 12 26,67

75 80 1 2,22

Total 45 100

20

Histograma

05

101520

65 70 75 80 MaisFreq

ncia

Freqncia

65 70 75 80 Mais

Intervalo

Grfico Ramo FolhaGrficoRamoFolha

616961716371726866697267636663636067716360696463667164706366646969646372736871726968687379

606466161636363636063606463646364646465 69 6 69 68 66 69 67 66 67 69 66 66 69 69 68 69 68 6865696696866696766676966666969686968687074771717272717170727371727375 79 7 797579779808480

Grfico Ramo FolhaGrficoRamoFolha

60 64 6 61 61 63 63 63 63 60 63 60 64 63 64 63 64 64 646064661616363636360636064636463646464656966968666967666769666669696869686870 74 7 71 71 72 72 71 71 70 72 73 71 72 737074771717272717170727371727375797798084 8 0808480

6 001133333334444 166 001133333334444166666677888899999 16701111122233 1271 180 0

ObservaoObservao

f d di idi i l d l Seaformadedividirointervalodevaloresemsubintervaloseamaneiradeescolherosramosforemasmesmas(ouequivalentes),ogrficoramofolhaeohistogramasopraticamenteamesmafigura.

Entretanto,oramofolhamaisinformativo,porqueovalornumricodecadaobservaono perdido. No caso da idade, toda anoperdido.Nocasodaidade,todaainformaonumricafoipreservada.

Medidasdecentralidadeparavariveisquantitativas

Mdi A it tin

MdiaAritmtica

Medianan

x

nxxxx ni

in

...21

MedianaSejax(1) x(2) ...x(n) osmesmosvaloresque

compemaamostra,pormdispostoemordemp , p pcrescente.

Medianadosdados:

Modad d d d l l d

central posio de observaoda par valor n se central, posio de sobservae duas das valoresdosmdia

imparnsecentral,posio deobservaoda valor Mediana(x)

Amodadosdadosaquelevalordaamostraqueocorrecommaiorfrequncia

MedidasdeDispersoparavariveisquantitativas

V i i n Varincia:1

)(1

2

2

n

xxs

n

ii

Desviopadro:

1

)(1

2

n

xxs

n

ii

Quartil: OprimeiroquartilQ1temdosdadosabaixodelee d d d i d l

1n

dosdadosacimadele. OterceiroquartilQ3temdosdadosabaixodeleedos dados acima deledosdadosacimadele

OsegundoquartilQ2aprpriamediana AdistnciainterquartildadaporDIQ=Q3 Q1q p Q Q Q

Identificaodediscrepnciaemvariveisquantitativas

Doiscritriosrecomendados: Eliminartodaobservaoqueestiverforado qintervalo

Limite inferior = ou).3;.3( SxSx

DIQQ 3 DIQQ 3Limiteinferior=ou

l

DIQQ 21

DIQQ 21

Exemplo

BOX PLOTBOXPLOT

fi tili d i t ti fi i umgrficoutilizadoparasintetizaremumamesmafiguravriasinformaesrelativasdistribuiodeumadeterminadavarivelquantitativa

I i i l t t d t l j b l Inicialmentetraadoumretngulocujabasenoqualseroapresentadososvaloresdavarivelconsiderada.

Depoissedesenhaumretngulocujabaseinferiorcorrespondeposio do primeiro quartil (Q1) e cuja base superior corresponde posiodoprimeiroquartil(Q1)ecujabasesuperiorcorrespondeposiodoterceiroquartilQ3.Aposiodamedianaindicadaporumtraohorizontalnointeriordoretngulo

Emseguidasotranadosdoissegmentosderetaverticais,emqueg g , qumdelesvaidesdeopontomdiodabaseinferiordoretnguloataposiodamenorobservaonodiscrepante,eoutrovaidesdeopontomdiodabasesuperiordoretnguloataposiodamaiorobservao no discrepanteobservaonodiscrepante.

Cadaumadasobservaesdiscrepantesexplicitada.

B Pl tBoxPlot Exemplo 6: 7 9 12 15 17 21 23 Exemplo6:791215172123Q1 =9 Q2 =15 Q3 =21

25

20

23 Max

Q3

15C1

Q2

10

7 Min

Q1

Min