View
216
Download
0
Embed Size (px)
EstatsticaBsica
O que Estatstica ?OqueEstatstica?
umconjuntodemtodoseprocessosquantitativosqueservemparaestudaremedirq q posfenmenoscoletivos
Aplicaes em quase todas as reas de Aplicaesemquasetodasasreasdeconhecimentohumano,inclusiveCinciasdaComputao
O que analisar dados ?Oqueanalisardados?
Id tifi t t di Identificarcomportamentosmdios,comportamentosdiscrepantes,comparacomportamentos investigar a interdependnciacomportamentos,investigarainterdependnciaentrevariveis,revelartendncias,etc.
A partir de uma massa de dados e com auxlio deApartirdeumamassadedados,ecomauxlioderecursoscomputacionais,separaroqueessencial(estrutura)doqueeventual(rudo)
Resumir,deformaeficiente,ainformaocontidanosdadoseassimpermitirque,atravsdessse
h d d dconhecimento,asdecisessejamtomadasdeformamaisconsciente.
O que Anlise Exploratria ?OqueAnliseExploratria?
Tratasedeumconjuntodetcnicasdetratamentodedados,que,semimplicaremq pumafundamentaomatemticamaisrigorosa nos ajuda a fazer uma sondagemrigorosa,nosajudaafazerumasondageminicial,ouseja,tomarumprimeirocontatocom a informao disponvelcomainformaodisponvel
OquevemdepoisdaAnliseExploratria?
Apsaanliseexploratriaquefornecealgumaspistasarespeitodoestudo,podemosg p p ppartirparaachamadaInferncia,emquesero aplicados aos dados mtodos maisseroaplicadosaosdadosmtodosmaissofisticados,cujafundamentaomatemticaest no Clculo de ProbabilidadesestnoClculodeProbabilidades.
reas da EstatsticareasdaEstatstica
EstatsticaDescritiva Estatstica InferencialEstatsticaInferencial
Estatstica DescritivaEstatsticaDescritiva
AEstatsticaDescritivasepreocupacomaorganizao,apresentaoesintetizao deg p dados.Utilizamgrficos,tabelasemedidasdescritivas como ferramentas Utilizada nadescritivascomoferramentas.Utilizadanaetapainicialdaanlise,destinadaaobterinformaes que indicam possveis modelos ainformaesqueindicampossveismodelosaseremutilizadosnumafasefinalqueseriaachamadainfernciaestatstica
Vocabulrio bsico de estatsticaVocabulriobsicodeestatstica
Populao:Coleocompletadetodososelementosquesoobjetodenossoestudo.q j
Amostra:Subconjuntodeelementosselecionados da populao segundo regrasselecionadosdapopulaosegundoregrasbemdefinidas.
Varivel: Correspondeaumacaractersticadeum item ou de um indivduo.umitemoudeumindivduo.
VariveisVariveis
Aosefazerumestudoestatsticodeumdeterminadofatoougrupo,temsequeg p qconsiderarotipodevarivel: Variveis qualitativas; ou Variveisqualitativas;ou Variveisquantitativas
Variveis QualitativasVariveisQualitativas
Nominaloucategrica:seusvalorespossveissodiferentescategoriasnoordenadas,emgquecadaobservaopodeserclassificada.Ex: Raa nacionalidade rea de atividadesEx:Raa,nacionalidade,readeatividades.
Ordinal:seusvalorespossveissodiferentescategoriasordenadas,emquecadaobservaopodeserclassificada. p
Ex:classesocial,nveldeinstruo.
Variveis QuantitativasVariveisQuantitativas
Discreta:Seusvalorespossveissoemgeralresultadosdeumprocessodecontagem.p g
Ex:nmerodefilhos,nmerodesriesescolares cursadas com aprovao;escolarescursadascomaprovao;
Contnua:seusvalorespossveispodemserexpressosatravsdenmerosreaisevaremuma escala contnua de medioumaescalacontnuademedio
Ex:Rendamensal,peso,altura.
ExemploExemplo
Exemplo:Pesquisaantropomtrica:amostrade45mulheresidosasacimade60anos(xls)( )
DistribuiodeFrequncias TabelaseGrficos
Tabelas(Paraumavarivelqualitativa): Cadalinhacorrespondeaumvalorpossveldavarivel
Atravsdeumprocessodecontagemsoobtidososvaloresqueconstamnacolunadefrequnciadatabela.Oresultadodessacontagemchamadadefrequnciaabsoluta;
Apartirdasfrequnciasabsolutaspodemsertambmcalculadasfrequnciarelativas,usualmenteapresentadasobaformadepercentuais.
DistribuiodeFrequncias TabelaseGrficos
Grfico(Paraumavarivelqualitativa):Barras
40 00%
50,00%
60,00%
40,00%
50,00%
60,00%
20,00%
30,00%
40,00%
Ativa
Sedentria
0 00%
10,00%
20,00%
30,00%
, %
0,00%
10,00%
1
0,00%PequenoRisco
MdioRisco
GrandeRisco
DistribuiodeFrequncias TabelaseGrficos
G fi (P i l lit ti ) S t i t t Grfico(Paraumavarivelqualitativa):Setores pizzaoutorta
PequenoRisco;11,11%
Grande
Ativa;48,89%Sedent
ria;51 11%
MdioRisco;44,44%
GrandeRisco;44,44%
PequenoRisco
MdioRisco
GrandeRisco
51,11% ,
Observao sobre cada tipo de grficoObservaosobrecadatipodegrfico
O fi d t i li Ogrficodesetores,pornoimplicarumaordenaodascategorias,maisapropriadoparaas variveis qualitativas nominaisasvariveisqualitativasnominais
Ogrficodebarras,emqueascategoriasestonaturalmente ordenadas mais apropriado paranaturalmenteordenadas,maisapropriadoparaasvariveisqualitativasordinais
Para representar a distribuio de frequncia dePararepresentaradistribuiodefrequnciadeumavarivelatravsdeumgrficodesetoresimportantequeavarivelnopossuamuitas
d f l l dcategorias,poisistodificultaavisualizaodaspropores.
TabelasdeFrequnciasparavariveisquantitativas
Nocasodevariveisquantitativadiscretacomumpequenonmerodevalorespossveis(porexemplo,nmerodefilhos),aconstruodeumatabeladefrequnciasegueosmesmosmoldesdoq gquevistoparavariveisqualitativas;
Antes de mais nada necessrio dividir o seu Antesdemaisnadanecessriodividiroseuintervalodevariaoemvriossubintervalos(depreferncia todos eles com a mesma amplitude)prefernciatodoselescomamesmaamplitude).
TabelasdeFrequnciaparaVariveisQuantitativas
FaixaEtria Frequncia Percentuais
60 65 16 35,56
65 70 16 35,56
70 75 12 26,67
75 80 1 2,22
Total 45 100
20
Histograma
05
101520
65 70 75 80 MaisFreq
ncia
Freqncia
65 70 75 80 Mais
Intervalo
Grfico Ramo FolhaGrficoRamoFolha
616961716371726866697267636663636067716360696463667164706366646969646372736871726968687379
606466161636363636063606463646364646465 69 6 69 68 66 69 67 66 67 69 66 66 69 69 68 69 68 6865696696866696766676966666969686968687074771717272717170727371727375 79 7 797579779808480
Grfico Ramo FolhaGrficoRamoFolha
60 64 6 61 61 63 63 63 63 60 63 60 64 63 64 63 64 64 646064661616363636360636064636463646464656966968666967666769666669696869686870 74 7 71 71 72 72 71 71 70 72 73 71 72 737074771717272717170727371727375797798084 8 0808480
6 001133333334444 166 001133333334444166666677888899999 16701111122233 1271 180 0
ObservaoObservao
f d di idi i l d l Seaformadedividirointervalodevaloresemsubintervaloseamaneiradeescolherosramosforemasmesmas(ouequivalentes),ogrficoramofolhaeohistogramasopraticamenteamesmafigura.
Entretanto,oramofolhamaisinformativo,porqueovalornumricodecadaobservaono perdido. No caso da idade, toda anoperdido.Nocasodaidade,todaainformaonumricafoipreservada.
Medidasdecentralidadeparavariveisquantitativas
Mdi A it tin
MdiaAritmtica
Medianan
x
nxxxx ni
in
...21
MedianaSejax(1) x(2) ...x(n) osmesmosvaloresque
compemaamostra,pormdispostoemordemp , p pcrescente.
Medianadosdados:
Modad d d d l l d
central posio de observaoda par valor n se central, posio de sobservae duas das valoresdosmdia
imparnsecentral,posio deobservaoda valor Mediana(x)
Amodadosdadosaquelevalordaamostraqueocorrecommaiorfrequncia
MedidasdeDispersoparavariveisquantitativas
V i i n Varincia:1
)(1
2
2
n
xxs
n
ii
Desviopadro:
1
)(1
2
n
xxs
n
ii
Quartil: OprimeiroquartilQ1temdosdadosabaixodelee d d d i d l
1n
dosdadosacimadele. OterceiroquartilQ3temdosdadosabaixodeleedos dados acima deledosdadosacimadele
OsegundoquartilQ2aprpriamediana AdistnciainterquartildadaporDIQ=Q3 Q1q p Q Q Q
Identificaodediscrepnciaemvariveisquantitativas
Doiscritriosrecomendados: Eliminartodaobservaoqueestiverforado qintervalo
Limite inferior = ou).3;.3( SxSx
DIQQ 3 DIQQ 3Limiteinferior=ou
l
DIQQ 21
DIQQ 21
Exemplo
BOX PLOTBOXPLOT
fi tili d i t ti fi i umgrficoutilizadoparasintetizaremumamesmafiguravriasinformaesrelativasdistribuiodeumadeterminadavarivelquantitativa
I i i l t t d t l j b l Inicialmentetraadoumretngulocujabasenoqualseroapresentadososvaloresdavarivelconsiderada.
Depoissedesenhaumretngulocujabaseinferiorcorrespondeposio do primeiro quartil (Q1) e cuja base superior corresponde posiodoprimeiroquartil(Q1)ecujabasesuperiorcorrespondeposiodoterceiroquartilQ3.Aposiodamedianaindicadaporumtraohorizontalnointeriordoretngulo
Emseguidasotranadosdoissegmentosderetaverticais,emqueg g , qumdelesvaidesdeopontomdiodabaseinferiordoretnguloataposiodamenorobservaonodiscrepante,eoutrovaidesdeopontomdiodabasesuperiordoretnguloataposiodamaiorobservao no discrepanteobservaonodiscrepante.
Cadaumadasobservaesdiscrepantesexplicitada.
B Pl tBoxPlot Exemplo 6: 7 9 12 15 17 21 23 Exemplo6:791215172123Q1 =9 Q2 =15 Q3 =21
25
20
23 Max
Q3
15C1
Q2
10
7 Min
Q1
Min