Resumão Estatística Básica

Embed Size (px)

Citation preview

Resumo Estatstica Bsica1

RESUMO ESTATSTICA BSICAContedo 1. Introduo pag. 02 2. Organizao de Dados Estatsticos pag. 03 3. Medidas de Posio pag. 14 4. Medidas de Disperso pag. 27 5. Medidas de Assimetria e Curtose pag. 32 Alexandre Jos GranzottoJulho a Outubro / 2002

Resumo Estatstica Bsica2

RESUMO - ESTATSTICA BSICA1. INTRODUOESTATSTICA: ramo da matemtica aplicada. ANTIGUIDADE: os povos j registravam o nmero de habitantes, nascimentos, bitos. Faziam "estatsticas". IDADE MDIA: as informaes eram tabuladas com finalidades tribut rias e blicas. SEC. XVI: surgem as primeiras anlises sistemticas, as primeiras tabelas e os nmeros relativos. SEC. XVIII: a estatstica com feio cientfica batizada por GODOFREDO ACHENWALL. As tabelas ficam mais completas, surgem as primeiras representa es grficas e os clculos de probabilidades. A estat stica deixa de ser uma simples tabulao de dados numricos para se tornar "O estudo de como se chegar a concluso sobre uma populao, partindo da observa o de partes dessa populao (amostra)". MTODO ESTATSTICO MTODO: um meio mais eficaz para atingir determinada meta. MTODOS CIENTFICOS: destacamos o mtodo experimental e o mtodo estatstico. MTODO EXPERIMENTAL: consiste em manter constante todas as causas,

menos uma, que sofre variao para se observar seus efeitos, caso existam. Ex: Estudos da Qumica, Fsica, etc. MTODO ESTATSTICO: diante da impossibilidade de manter as causas constantes(nas cincias sociais), admitem todas essas causas presentes variando-as, registrando essas variaes e procurando determinar, no resultado final, que influncias cabem a cada uma delas. Ex: Quais as causas que definem o pre o de uma mercadoria quando a sua oferta diminui? Seria impossvel, no momento da pesquisa, manter constantes a uniformidade dos salrios, o gosto dos consumidores, nvel geral de preos de outros produtos, etc. A ESTATSTICA uma parte da matemtica aplicada que fornece mtodos para coleta, organizao, descrio, anlise e interpretao de dados e para a utilizao dos mesmos na tomada de decises. A coleta, a organizao ,a descrio dos dados, o clculo e a interpreta o de coeficientespertencem ESTATSTICA DESCRITIVA, enquanto a anlise e a interpretao dos dados, associado a uma margem de incerteza , ficam a cargo da ESTATSTICA INDUTIVA ou INFERENCIAL, tambm chamada como a medida da incerteza ou mtodos que se fundamentam na teoria da probabilidade.

Resumo Estatstica Bsica3

.

2. ORGANIZAO DE DADOS ESTATSTICOSFASES DO MTODO ESTATSTICO 1 - DEFINIO DO PROBLEMA :Saber exatamente aquilo que se pretende pesquisar o mesmo que definir corretamente o problema. 2 - PLANEJAMENTO :Como levantar informaes ? Que dados devero ser obtidos ? Qual levantamento a ser utilizado? Censit rio? Por amostragem? E o cronograma de atividades ? Os custos envolvidos ?etc. 3 - COLETA DE DADOS: Fase operacional. o registro sistemtico de dados, com um objetivo determinado. Dados primrios: quando so publicados pela prpria pessoa ou organiza o que os haja recolhido. Ex: tabelas do censo demogrfico do IBGE. Dados secundrios: quando so publicados por outra organiza o. Ex: quando determinado jornal publica estat sticas referentes ao censo demogrfico extradas do IBGE. OBS: mais seguro trabalhar com fontes primrias. O uso da fonte secundria traz o grande risco de erros de transcri o. Coleta Direta: quando obtida diretamente da fonte. Ex: Empresa que realiza

uma pesquisa para saber a preferncia dos consumidores pela sua marca. coleta contnua: registros de nascimento, bitos, casamentos; coleta peridica: recenseamento demogrfico, censo industrial; coleta ocasional: registro de casos de dengue. Coleta Indireta: feita por dedues a partir dos elementos conseguidos pela coleta direta, por analogia, poravaliao,indcios ou proporcionalizao. 4 - APURAO DOS DADOS: Resumo dos dados atravs de sua contagem e agrupamento. a condensao e tabulao de dados. 5 - APRESENTAO DOS DADOS: H duas formas de apresentao, que no se excluem mutuamente. A apresentao tabular, ou seja uma apresentao numrica dos dados em linhas e colunas distribudas de modo ordenado, segundo regras prticas fixadas pelo Conselho Nacional de Estatstica. A apresentao grfica dos dados numricos constitui uma apresentao geomtrica permitindo uma viso rpida e clara do fenmeno. 6 - ANLISE E INTERPRETAO DOS DADOS: A ltima fase do trabalho estatstico a mais importante e delicada. Est ligada essencialmente ao clculo de medidas e coeficientes, cuja finalidade principal descrever o fenmeno (estatstica descritiva).

Resumo Estatstica Bsica4

DEFINIES BSICAS DA ESTATSTICA . FENMENO ESTATSTICO: qualquer evento que se pretenda analisar, cujo estudo seja possvel a aplicao do mtodo estatstico. So divididos em trs grupos: Fenmenos de massa ou coletivo: so aqueles que no podem ser definidos por uma simples observao. A estatstica dedicase ao estudo desses fenmenos. Ex: A natalidade na Grande Vit ria, O preo mdio da cerveja no Esprito Santo, etc. Fenmenos individuais: so aqueles que iro compor os fenmenos de massa. Ex: cada nascimento na Grande Vit ria, cada preo de cerveja no Esprito Santo, etc. Fenmenos de multido: quando as caractersticas observadas para a massa no se verificam para o particular. DADO ESTATSTICO: um dado numrico e considerado a matria-prima sobre a qual iremos aplicar os mtodos estatsticos.

POPULAO: o conjunto total de elementos portadores de, pelo menos, uma caracterstica comum. AMOSTRA: uma parcela representativa da popula o que EXAMINADA com o propsito de tirarmos concluses sobre a essa popula o. PARMETROS: So valores singulares que existem na populao e que servem para caracteriz-la. Para definirmos um parmetro devemos examinar toda a populao. Ex: Os alunos do 2 ano da FACEV tm em mdia 1,70 metros de estatura. ESTIMATIVA: um valor aproximado do parmetro e calculado com o uso da amostra. ATRIBUTO: quando os dados estatsticos apresentam um carter qualitativo, o levantamento e os estudos necessrios ao tratamento desses dados so designados genericamente de estatstica de atributo. VARIVEL: o conjunto de resultados possveis de um fenmeno. VARIVEL QUALITATIVA: Quando seu valores so expressos por atributos: sexo, cor dapele,etc. VARIVEL QUANTITATIVA: Quando os dados so de carter nitidamente quantitativo, e o conjunto dos resultados possui uma estrutura numrica, trata-se portanto da estatstica de varivel e se dividem em : VARIVEL DISCRETA OU DESCONTNUA: Seus valores so expressos geralmente atravs de nmeros inteiros no negativos. Resulta normalmente de contagens. Ex: N de alunos presentes s aulas de introduo estatstica econmica no 1 semestre de 1997: mar = 18 , abr = 30 , mai = 35 , jun = 36.

Resumo Estatstica Bsica5

VARIVEL CONTNUA: Resulta normalmente de uma mensurao, e a escala numrica de seus possveis valores corresponde ao conjunto R dos nmeros Reais, ou seja, podem assumir, teoricamente, qualquer valor entre dois limites. Ex.: Quando voc vai medir a temperatura de seu corpo com um termmetro de mercrio o que ocorre o seguinte: O filete de mercrio, ao dilatar-se, passar por todas as temperaturas intermedirias at chegar na temperatura atual do seu corpo. Exemplos . Cor dos olhos das alunas: qualitativa . ndice de liquidez nas ind strias capixabas: quantitativa contnua . Produo de caf no Brasil: quantitativa contnua . Nmero de defeitos em aparelhos de TV: quantitativa discreta . Comprimento dos pregos produzidos por uma empresa: quantitativa contnua . O ponto obtido em cada jogada de um dado: quantitativa discreta AMOSTRAGEM MTODOS PROBABILSTICOS Exige que cada elemento da popula o possua determinada probabilidade de ser selecionado. Normalmente possuem a mesma probabilidade. Assim, se N for o tamanho da popula o, a probabilidade de cada elemento ser selecionado ser 1/N.

Trata-se do mtodo que garante cientificamente a aplica o das tcnicas estatsticas de inferncias. Somente com base em amostragens probabilsticas que se podem realizar inferncias ou indues sobre a populao a partir do conhecimento da amostra. uma tcnica especial para recolher amostras, que garantem, tanto quanto possvel, o acaso na escolha. . AMOSTRAGEM CASUAL ou ALEATRIA SIMPLES o processo mais elementar e freqentemente utilizado. equivalente a um sorteio lotrico. Pode ser realizada numerando-se a populao de 1a n e sorteando-se, a seguir, por meio de um dispositivo aleat rio qualquer, x nmeros dessa seqncia, os quais correspondero aos elementos pertencentes amostra. Ex: Vamos obter uma amostra, de 10%, representativa para a pe squisa da estatura de 90 alunos de uma escola: 1 - numeramos os alunos de 1 a 90. 2 - escrevemos os nmeros dos alunos, de 1 a 90, em peda os iguais de papel, colocamos na urna e aps mistura retiramos, um a um, nove nmeros que formaro a amostra. OBS: quando o nmero de elementos da amostra muito grande, esse tipo de sorteio torna-se muito trabalhoso. Neste caso utiliza -se uma Tabela de nmeros aleatrios, construda de modo que os algarismos de 0 a 9 s o distribudos ao acaso nas linhas e colunas. . .AMOSTRAGEM PROPORCIONAL ESTRATIFICADA: Quando a populao se divide em estratos (sub-populaes), convm que o sorteio dos elementos da amostra leve em considera o tais estratos, da obtemos os elementos da amostra proporcional ao n mero de elementos desses estratos.

Resumo Estatstica Bsica6

Ex: Vamos obter uma amostra proporcional estratificada, de 10%, do exemplo anterior, supondo, que, dos 90 alunos, 54 sejam meninos e 36 sejam meninas. So portanto dois estratos (sexo masculino e sexo feminino). Logo, temos: SEXO POPULAC O 10 %AMOSTR A MASC. 54 5,4 5

FEMIN. 36 3,6 4 Total 90 9,0 9 Numeramos ento os alunos de 01 a 90, sendo 01 a 54 meninos e 55 a 90, meninas e procedemos o sorteio casual com urna ou tabela de nmeros aleatrios. . AMOSTRAGEM SISTEMTICA: Quando os elementos da popula o j se acham ordenados, no h necessidade de construir o sistema de referncia. So exemplos os pronturios mdicos de um hospital, os prdios de uma rua, etc. Nestes casos, a seleo dos elementos que constituiro a amostra pode ser feita por um sistema imposto pelo pesquisador. Ex: Suponhamos uma rua com 900 casas, das quais desejamos obter uma amostra formada por 50 casas para uma pesquisa de opini o. Podemos, neste caso, usar o seguinte procedimento: como 900/50 = 18, escolhemos por sorteio casual um nmero de 01 a 18, o qual indicaria o primeiro elemento sorteado para a amostra; os demais elementos seriam periodicamente considerados de 18 em 18. Assim, suponhamos que o nmero sorteado fosse 4 a amostra seria: 4 casa, 22 casa, 40 casa, 58 casa, 76 casa, etc. AMOSTRAGEM POR CONGLOMERADOS (ou AGRUPAMENTOS) Algumas populaes no permitem, ou tornam extremamente dif cil que se identifiquem seus elementos. No obstante isso, pode ser relativamente f cil identificar alguns subgrupos da popula o. Em tais casos, uma amostra aleatria simples desses subgrupos (conglomerados) pode se colhida, e uma contagem completa deve ser feita para o conglomerado sorteado. Agrupamentos t picos so quarteires, famlias, organizaes, agncias, edifcios etc. Ex: Num levantamento da popula o de determinada cidade, podemos dispor do mapa indicando cada quarteir o e no dispor de uma relao atualizada dos seus moradores. Pode-se, ento, colher uma amostra dos quarteires e fazer a contagem completa de todos os que residem naqueles quarteir es sorteados. MTODOS NO PROBABILSITCOS So amostragens em que h uma escolha deliberada dos elementos da amostra. No possvel generalizar os resultados das pesquisas para a popula o, pois as amostras no-probabilsticas no garantem a representatividade da popula o. AMOSTRAGEM ACIDENTAL

Trata-se de uma amostra formada por aqueles elementos que vo aparecendo, que so possveis de se obter at completar o nmero de elementos da amostra. Geralmente utilizada em pesquisas de opini o, em que os entrevistados so acidentalmente escolhidos. Ex: Pesquisas de opinio em praas pblicas, ruas de grandes cidades;

Resumo Estatstica Bsica7

AMOSTRAGEM INTENCIONAL De acordo com determinado critrio, escolhido intencionalmente um grupo de elementos que iro compor a amostra. O investigador se dirige intencionalmente a grupos de elementos dos quais deseja saber a opini o. Ex: Numa pesquisa sobre preferncia por determinado cosmtico, o pesquisador se dirige a um grande salo de beleza e entrevista as pessoas que ali se encontram. AMOSTRAGEM POR QUOTAS Um dos mtodos de amostragem mais comumente usados em levantamentos de mercadoe em prvias eleitorais. Ele abrange trs fases: 1 - classificao da populao em termos de propriedades que se sabe, ou presume, serem relevantes para a caracterstica a ser estudada; 2 - determinao da proporo da populao para cada caracterstica, com base na constituio conhecida, presumida ou estimada, da popula o; 3 - fixao de quotas para cada entrevistador a quem tocar a responsabilidade de selecionar entrevistados, de modo q ue a amostra total observada ou entrevistada contenha a proporo e cada classe tal como determinada na 2 fase. Ex: Numa pesquisa sobre o "trabalho das mulheres na atualidade", provavelmente se ter interesse em considerar: a diviso cidade e campo, a hab itao, o nmero de filhos, a idade dos filhos, a renda m dia, as faixas etrias etc. A primeira tarefa descobrir as propores (porcentagens) dessas caractersticas na populao. Imagina-se que haja 47% de homens e 53% de mulheres na populao. Logo, uma amostra de 50 pessoas dever ter 23 homens e 27 mulheres. Ent o o pesquisador receber uma "quota" para entrevistar 27 mulheres. A considerao de vrias categorias exigir uma composio amostral que atenda ao n determinado e s propores populacionais estipuladas.

. SRIES ESTATSTICAS TABELA: um quadro que resume um conjunto de dados dispostos segundo linhas e colunasde maneira sistemtica. De acordo com a Resoluo 886 do IBGE, nas casas ou clulas da tabela devemos colocar : um trao horizontal ( - ) quando o valor zero; trs pontos ( ... ) quando no temos os dados; zero ( 0 ) quando o valor muito pequeno para ser expresso pela unidade utilizada; um ponto de interroga o ( ? ) quando temos dvida quanto exatido de determinado valor. Obs: O lado direito e esquerdo de uma tabela oficial deve ser aberto. . SRIE ESTATSTICA: qualquer tabela que apresenta a distribui o de um conjunto de dados estatsticos em funo da poca, do local ou da espcie.

Resumo Estatstica Bsica8

SRIES HOMGRADAS: so aquelas em que a varivel descrita apresenta variao discreta ou descontnua. Podem ser do tipo temporal, geogrfica ou especfica. a) Srie Temporal: Identifica-se pelo carter varivel do fator cronolgico. O local e a espcie (fenmeno) so elementos fixos. Esta srie tambm chamada de histrica ou evolutiva. ABC VECULOS LTDA. Vendas no 1 bimestre de 1996 PERODO UNIDADES VENDIDAS JAN/96 20000 FEV/96 10000 TOTAL 30000 . b) Srie Geogrfica: Apresenta como elemento varivel o fator geogrfico. A poca e o fato (espcie) so elementos fixos. Tambm chamada de espacial, territorial ou de localiza o. ABC VECULOS LTDA. Vendas no 1 bimestre de 1996 FILIAIS UNIDADES VENDIDAS So Paulo 13000 Rio de Janeiro 17000 TOTAL 30000 c) Srie Especfica: O carter varivel apenas o fato ou espcie. Tambm chamada de srie categrica. ABC VECULOS LTDA. Vendas no 1 bimestre de 1996 MARCA UNIDADES VENDIDAS * FIAT 18000 GM 12000

TOTAL 30000 SRIES CONJUGADAS: Tambm chamadas de tabelas de dupla entrada . So apropriadas apresentao de duas ou mais sries de maneira conjugada, havendo duas ordens de classifica o: uma horizontal e outra vertical. O exemplo abaixo de uma srie geogrfica-temporal. ABC VECULOS LTDA. Vendas no 1 bimestre de 1996 FILIAIS Janeiro/96 Fevereiro/96 So Paulo 10000 3000 Rio de Janeiro 12000 5000 TOTAL 22000 8000

Resumo Estatstica Bsica9

GRFICOS ESTATSTICOSG So representaes visuais dos dados estatsticos que devem corresponder, mas nunca substituir as tabelas estatsticas. Caractersticas: Uso de escalas, sistema de coordenadas, simplicidade, clareza e veracidade. Grficos de informao: So grficos destinados principalmente ao p blico em geral, objetivando proporcionar uma visualizao rpida e clara. So grficos tipicamente expositivos, dispensando comentrios explicativos adicionais. As legendas podem ser omitidas, desde que as informa es desejadas estejam presentes. Grficos de anlise: So grficos que prestam-se melhor ao trabalho estatstico, fornecendo elementos teis fase de anlise dos dados, sem deixar de ser tambm informativos. Os grficos de anlise freqentemente vm acompanhados de uma tabela estat stica. Inclui-se, muitas vezes um texto explicativo, chamando a aten o do leitor para os pontos principais revelados pelo gr fico. Uso indevido de Grficos: Podem trazer uma idia falsa dos dados que esto sendo analisados, chegando mesmo a confundir o leitor. Trata -se, na realidade, de um problema de construo de escalas. . Classificao dos grficos: Diagramas, Estereogramas, Pictogramas e Cartogramas. . 1 - DIAGRAMAS: So grficos geomtricos dispostos em duas dimenses. So os mais usados na representao de sries estatsticas. Eles podem ser : 1.1- Grficos em barras horizontais. 1.2- Grficos em barras verticais ( colunas ).

Quando as legendas no so breves usa-se de preferncia os grficos em barras horizontais. Nesses grficos os retngulos tm a mesma base e as alturas so proporcionais aos respectivos dados. A ordem a ser observada a cronolgica, se a srie for histrica, e a decrescente, se for geogrfica ou categrica. 1.2- Grficos em barras compostas. 1.4- Grficos em colunas superpostas. Eles diferem dos grficos em barras ou colunas convencionais apenas pelo fato de apresentar cada barra ou coluna segmentada em partes componentes. Servem para representar comparativamente dois ou mais atributos. 1.5- Grficos em linhas ou lineares. So freqentemente usados para representa o de sries cronolgicas com um grande nmero de perodos de tempo. As linhas so mais eficientes do que as colunas, quando existem intensas flutuaes nas sries ou quando h necessidade de se representarem vrias sries em um mesmo grfico.

Resumo Estatstica Bsicarepresentamos, em um mesmo sistema de coordenadas, a varia o de dois fenmenos, a parte interna da figura formada pelos grficos desses fenmenos denominada de rea de excesso. 1.5- Grficos em setores. Este grfico construdo com base em um crculo, e empregado sempre que desejamos ressaltar a participa o do dado no total. O total representado pelo crculo, que fica dividido em tantos setores quantas s o as partes. Os setores so tais que suas reas so respectivamente proporcionais aos dados da s rie. O grfico em setores s deve ser empregado quando h , no mximo, sete dados. Obs: As sries temporais geralmente no so representadas por este tipo de grfico. . 2 - ESTEREOGRAMAS: So grficos geomtricos dispostos em trs dimenses, pois representam volume. So usados nas representaes grficas das tabelas de dupla entrada. Em alguns casos este tipo de grfico fica difcil de ser interpretado dada a pequena preciso que oferecem. . 3 - PICTOGRAMAS:10 Quando

So construdos a partir de figuras representativas da intensidade do fenmeno. Este tipo de grfico tem a vantagem de despertar a aten o do pblico leigo, pois sua forma atraente e sugestiva. Os smbolos devem ser auto-explicativos. A desvantagem dos pictogramas que apenas mostram uma viso geral do fenmeno, e no de detalhes minuciosos. Veja o exemplo abaixo: 4- CARTOGRAMAS: So ilustraes relativas a cartas geogrficas (mapas). O objetivo desse grfico o de figurar os dados estatsticos diretamente relacionados com reas geogrficas ou polticas. DISTRIBUIO DE FREQNCIA um tipo de tabela que condensa uma coleo de dados conforme as freqncias(repeties de seus valores). Tabela primitiva ou dados brutos: uma tabela ou relao de elementos que no foram numericamente organizados. difcil formarmos uma idia exata do comportamento do grupo como um todo, a partir de dados n o ordenados. Ex : 45, 41, 42, 41, 42 43, 44, 41 ,50, 46, 50, 46, 60, 54, 52, 58, 57, 58, 60, 51

Resumo Estatstica Bsica11

ROL: a tabela obtida ap s a ordenao dos dados (crescente ou decrescente). Ex : 41, 41, 41, 42, 42 43, 44, 45 ,46, 46, 50, 50, 51, 52, 54, 57, 58, 58, 60, 60 Distribuio de freqncia SEM INTERVALOS DE CLASSE: a simples condensao dos dados conforme as repeties de seu valores. Para um ROL de tamanho razovel esta distribuio de freqncia inconveniente, j que exige muito espao. Veja exemplo abaixo: Dados Freqncia 41 3 42 2 43 1 44 1 45 1 46 2 50 2 51 1 52 1 54 1 57 1 58 2 60 2 Total 20

Distribuio de freqncia COM INTERVALOS DE CLASSE:Quando o tamanho da amostra elevado, mais racional efetuar o agrupamento dos valores em vrios intervalos de classe. Classes Freqncias 41 |------- 45 7 45 |------- 49 3 49 |------- 53 4 53 |------- 57 1 57 |------- 61 5 Total 20 ELEMENTOS DE UMA DISTRIBUIO DE FREQNCIA (com intervalos de classe) CLASSE: so os intervalos de variao da varivel e simbolizada por i e o nmero total de classes simbolizada por k. Ex: na tabela anterior k = 5 e 49 |------- 53 a 3 classe, onde i = 3. LIMITES DE CLASSE: so os extremos de cada classe. O menor nmero o limite inferior de classe ( li ) e o maior nmero, limite superior de classe ( Li ). Ex: em 49 |------- 53,... l3= 49 e L3 = 53. O smbolo |------representaum intervalo fechado esquerda e aberto direita. O dado 53 do ROL no pertence a classe 3 e sim a classe 4 representada por 53 |------- 57.

Resumo Estatstica Bsica12

AMPLITUDE DO INTERVALO DE CLASSE: obtida atravs da diferena entre o limite superior e inferior da classe e simbolizada porhi = Li - li. Ex: na tabela anterior hi= 53 - 49 = 4. Obs: Na distribuio de freqncia c/ classe o hi ser igual em todas as classes. AMPLITUDE TOTAL DA DISTRIBUIO: a diferena entre o limite superior da ltima classe e o limite inferior da primeira classe. AT = L(max) - l(min). Ex: na tabela anterior AT = 61 - 41= 20. AMPLITUDE TOTAL DA AMOSTRA (ROL): a diferena entre o valor mximo e o valor mnimo da amostra (ROL). Onde AA = Xmax Xmin. Em nosso exemplo AA = 60 - 41 = 19. Obs: AT sempre ser maior que AA. PONTO MDIO DE CLASSE: o ponto que divide o intervalo de classe em duas partes iguais. .......Ex: em 49 |------- 53 o ponto mdio x3 = (53+49)/2 = 51, ou seja x3=( l3 + L3 )/2. Mtodo prtico para construo de uma Distribuio de Freqncias c/ Classe

1 - Organize os dados brutos em um ROL. 2 - Calcule a amplitude amostral AA. No nosso exmplo: AA = 60 - 41 = 19 3 - Calcule o nmero de classes atravs da "Regra de Sturges": nI nde classes 3 |-----| 5 3 6 |-----| 11 4 12 |-----| 22 5 23 |-----| 46 6 47 |-----| 90 7 91 |-----| 181 8 182 |-----| 362 9 Obs: Qualquer regra para determina o do n de classes da tabela n o nos levam a uma deciso final; esta vai depender, na realidade de um julgame nto pessoal, que deve estar ligado natureza dos dados. No nosso exemplo: n = 20 dados, ento ,a princpio, a regra sugere a ado o de 5 classes.

Resumo Estatstica Bsica13

4 - Decidido o n de classes, calcule ento a amplitude do intervalo de classe h > AA / i. No nosso exemplo: AA/i= 19/5 = 3,8 . Obs: Como h >AA/ium valor ligeiramente superior para haver folga na ltima classe. Utilizaremos ento h = 4 5 - Temos ento o menor n da amostra, o n de classes e a amplitude do intervalo. Podemos montar a tabela, com o cuidado para n o aparecer classes com freqncia= 0 (zero). No nosso exemplo: o menor n da amostra = 41 + h = 45, logo a primeira classe ser representada por ...... 41 |------- 45. As classes seguintes respeitaro o mesmo procedimento. O primeiro elemento das classes seguintes sempre sero formadas pelo ltimo elemento da classe anterior. REPRESENTAO GRFICA DE UMA DISTRIBUIO Histograma, Polgono de freqncia e Polgono de freqnciaacumulada Em todos os grficos acima utilizamos o primeiro quadrante do sistema de eixos coordenados cartesianos ortogonais. Na linha horizontal (eixo das abscissas) colocamos os valores da varivel e na linha vertical (eixo das ordenadas), as freqncias. . Histograma: formado por um conjunto de ret ngulos justapostos, cujas bases se localizam sobre o eixo horizontal, de tal modo que seus pontos m dios coincidam com os pontos mdios dos intervalos de classe. A rea de um histograma proporcional soma das freqncias simples ou absolutas.

Freqncias simples ou absoluta: so os valores que realmente representam o nmero de dados de cada classe. A soma das freq ncias simples igual ao nmero total dos dados da distribuio. Freqncias relativas: so os valores das razes entre as freqncia absolutas de cada classe e a freqncia total da distribuio. A soma das freqncias relativas igual a 1 (100 %). . Polgono de freqncia: um grfico em linha, sendo as freqncias marcadas sobre perpendiculares ao eixo horizontal, levantadas pelos pontos mdios dos intervalos de classe. Para realmente obtermos um polgono (linha fechada), devemos completar a figura, ligando os extremos da linha obtida aos pontos m dios da classe anterior primeira e da posterior ltima, da distribuio. . Polgono de freqncia acumulada: traado marcando-se as freqncias acumuladas sobre perpendiculares ao eixo horizontal, levantadas nos pontos correspondentes aos limites superiores dos intervalos de classe. Freqncia simples acumulada de uma classe: o total das freqncias de todos os valores inferiores ao limite superior do intervalo de uma determinada classe.

Resumo Estatstica Bsica14

Freqncia relativa acumulada de um classe: a freqncia acumulada da classe, dividida pela freq ncia total da distribuio. ...CLASSE........fi..... .....xi..... .....fri..... .....Fi..... ......Fri..... 50 |-------- 54 4 52 0,100 4 0,100 54 |-------- 58 9 56 0,225 13 0,325 58 |-------- 62 11 60 0,275 24 0,600 62 |-------- 66 8 64 0,200 32 0,800 66 |-------- 70 5 68 0,125 37 0,925 70 |-------- 74 3 72 0,075 40 1,000 Total 40 1,000 fi= freqncia simples; xi = ponto mdio de classe; fri= freqncia simples acumulada; Fi= freqncia relativa e Fri= freqncia relativa acumulada. Obs: uma distribuio de freqncia sem intervalos de classe representada graficamente por um diagrama onde cada valor da vari vel representado por um segmento de reta vertical e de comprimento proporcional respectiva freqncia. .

3. MEDIDAS DE POSIOIntroduo So as estatsticas que representam uma srie de dados orientando -nos quanto posio da distribuio em relao ao eixo horizontal do grfico da curva de freqncia. As medidas de posies mais importantes so as medidas de tendncia central ou promdias(verifica-se uma tendncia dos dados observados a se agruparem em torno dos valores centrais). As medidas de tendncia central mais utilizadas so: mdia aritmtica, moda e mediana. Outros promdios menos usados so as mdias: geomtrica, harmnica, quadrtica, cbica e biquadrtica. As outras medidas de posio so as separatrizes, que englobam: a prpria mediana, os decis, os quartis e os percentis. . MDIA ARITMTICA = igual ao quociente entre a soma dos valores do conjunto e o n mero total dos valores. ...... ondexi so os valores da varivel e n o nmero de valores. .

Resumo Estatstica Bsica15

Dados no-agrupados: Quando desejamos conhecer a mdia dos dados noagrupados em tabelas de freqncias, determinamos a mdia aritmtica simples. Ex: Sabendo-se que a venda diria de arroz tipo A, durante uma semana, foi de 10, 14, 13, 15, 16, 18 e 12 kilos, temos, para venda m dia diria na semana de: .= (10+14+13+15+16+18+12) / 7 = 14 kilos Desvio em relao mdia: a diferena entre cada elemento de um conjunto de valores e a mdia aritmtica, ou seja:. . di = Xi No exemplo anterior temos sete desvios: ... d1 = 10 - 14 = - 4 , ...d2 = 14 - 14 = 0, d3 = 13 - 14 = - 1 , ...d4 = 15 - 14 = 1 ,... d5 = 16 - 14 = 2 ,... d6 = 18 - 14 = 4 ...e. .. d7 = 12 - 14 = - 2. . Propriedades da mdia aritmtica 1 propriedade: A soma algbrica dos desvios em rela o mdia nula. No exemplo anterior : d1+d2+d3+d4+d5+d6+d7 = 0 2 propriedade: Somando-se (ou subtraindo-se) uma constante (c) a todos os

valores de uma varivel, a mdia do conjunto fica aumentada ( ou diminuda) dessa constante. Se no exemplo original somarmos a constante 2a cada um dos valores da varivel temos: Y = 12+16+15+17+18+20+14 / 7 = 16 kilos ou Y =.+ 2 = 14 +2 = 16 kilos 3 propriedade: Multiplicando -se (ou dividindo-se) todos os valores de uma varivel por uma constante (c), a mdia do conjunto fica multiplicada ( ou dividida) por essa constante. Se no exemplo original multiplicarmos a constante 3a cada um dos valores da varivel temos: Y = 30+42+39+45+48+54+36 / 7 = 42 kilos ou Y = x 3 = 14 x 3 = 42 kilos .

Resumo Estatstica Bsica16

Dados agrupados: Sem intervalos de classe Consideremos a distribuio relativa a 34 famlias de quatro filhos, tomando para varivel o nmero de filhos do sexo masculino. Calcularemos a quantidade m dia de meninos por famlia: N de meninos freqncia = fi 02 16 2 10 3 12 44 total 34 Como as freqncias so nmeros indicadores da intensidade de cada valor da varivel, elas funcionam como fatores de pondera o, o que nos leva a calcular a mdia aritmtica ponderada, dada pela frmula: ..xi. ..fi. ..xi.fi . 020 166 2 10 20 3 12 36 4 4 16 total 34 78 onde 78 / 34 = 2,3 meninos por famlia Com intervalos de classe Neste caso, convencionamos que todos os valores includos em um determinado intervalo de classe coincidem com o seu ponto mdio, e determinamos a mdia aritmtica ponderada por meio da f rmula: ..

ondeXi o ponto mdio da classe. Ex: Calcular a estatura mdia de bebs conforme a tabela abaixo. Estaturas (cm) freqncia = fiponto mdio = xi ..xi.fi. 50 |------------ 54 4 52 208 54 |------------ 58 9 56 504 58 |------------ 62 11 60 660 62 |------------ 66 8 64 512 66 |------------ 70 5 68 340 70 |------------ 74 3 72 216 Total 40 2.440

Resumo Estatstica Bsica17

Aplicando a frmula acima temos: 2.440 / 40.= 61. logo... = 61 cm MDIA GEOMTRICA = g a raiz n-sima do produto de todos eles. Mdia Geomtrica Simples: ou . Ex.: - Calcular a mdia geomtrica dos seguintes conjuntos de n meros:E a) { 10, 60, 360 }.: = ( 10 * 60 * 36 0) ^ (1/3) ....R: 60 b) { 2, 2, 2 }........: = (2 * 2 * 2 ^ (1/3) .. .R: 2 c) { 1, 4, 16, 64 }: = (1 * 4 * 16 * 64 ) ^(1/4) ....R: 8 . Mdia Geomtrica Ponderada : ou.. Ex - Calcular a mdia geomtrica dos valores da tabela abaixo : ...xi... ...fi... 12 34 92 27 1 Total 9 = (12 * 34 * 92 * 271) (1/9)........R: 3,8296 . MDIA HARMNICA - h o inverso da mdia aritmtica dos inversos. . Mdia Harmnica Simples:.(para dados no agrupados) ..ou . Mdia Harmnica Ponderada :(para dados agrupados em tabelas de freqncias) ..

Resumo Estatstica Bsica18

Ex.: Calcular a mdia harmnica dos valores da tabela abaixo: classes....fi.... ....xi.... ........fi/xi........ 1 |--------- 3 2 2 2/2 = 1,00 3 |--------- 5 4 4 4/4 = 1,00 5 |--------- 7 8 6 8/6 = 1,33 7 |--------- 9 4 8 4/8 = 0,50 9 |--------- 11 2 10 2/10 = 0,20

total 20 4,03 Resp: 20 / 4,03 = 4,96 OBS: A mdia harmnica no aceita valores iguais a zero como dados de uma srie. A igualdade g = h.=....s ocorrer quando todos os valores da srie forem iguais. OBS: Quando os valores da varivel no forem muito diferentes, verifica-se aproximadamente a seguinte rela o: g = ( .+ h ) /.2 Demonstraremos a relao acima com os seguintes dados: z = { 10,1 ; 10,1 ; 10,2 ; 10,4 ; 10,5 } Mdia aritmtica = 51,3 / 5 = 10,2600 Mdia geomtrica= = 10,2587 Mdia harmnica = 5 / 0,4874508 = 10,2574 Comprovando a relao: 10,2600 + 10,2574 / 2 = 10,2587 = m dia geomtrica . MODA - Mo o valor que ocorre com maior freqncia em uma srie de valores. Desse modo, o salrio modal dos empregados de uma f brica o salrio mais comum, isto , o salrio recebido pelo maior n mero de empregados dessa fbrica. . A Moda quando os dados n o esto agrupados A moda facilmente reconhecida: basta, de acordo com defini o, procurar o valor que mais se repete. Ex: Na srie { 7 , 8 , 9 , 10 , 10 , 10 , 11 , 12 } a moda igual a 10.

Resumo Estatstica Bsicasries nas quais no exista valor modal, isto , nas quais nenhum valor aparea mais vezes que outros. Ex: { 3 , 5 , 8 , 10 , 12 } no apresenta moda. A srie amodal. .Em outros casos, pode haver dois ou mais valores de concentra o. Dizemos, ento, que a srie tem dois ou mais valores modais. Ex: { 2 , 3 , 4 , 4 , 4 , 5 , 6 , 7 , 7 , 7 , 8 , 9 } apresenta duas modas : 4 e 7. A srie bimodal. . A Moda quando os dados esto agrupados a) Sem intervalos de classe: Uma vez agrupados os dados, possvel determinar imediatamente a moda: basta fixar o valor da varivel de maiorfreqncia. Ex: Qual a temperatura mais comum medida no ms abaixo: Temperaturas Freqncia 0 C 3 1 C 9 2 C 12 3 C 6 Resp: 2 C a temperatura modal, pois a de maior freqncia.19 H

. b) Com intervalos de classe: A classe que apresenta a maior freq ncia denominada classe modal. Pela definio, podemos afirmar que a moda, neste caso, o valor dominante que est compreendido entre os limites da classe modal . O mtodo mais simples para o clculo da moda consiste em tomar o ponto mdio da classe modal. Damos a esse valor a denominao de moda bruta. Mo = ( l* + L* ) / 2 ondel* = limite inferior da classe modal e L* = limite superior da classe modal. Ex: Calcule a estatura modal conforme a tabela abaixo. Classes (em cm) Freqncia 54 |------------ 58 9 58 |------------ 62 11 62 |------------ 66 8 66 |------------ 70 5 Resposta: a classe modal 58|-------- 62, pois a de maior freqncia. l* = 58 e L* = 62 Mo = (58+62) / 2 = 60 cm ( este valor estimado, pois no conhecemos o valor real da moda).

Resumo Estatstica Bsica20

. Mtodo mais elaborado pela f rmula de CZUBER: Mo = l* + (d1/(d1+d2)) x h* l* = limite inferior da classe modal .....e..... L* = limite superior da classe modal d1= freqncia da classe modal - freqncia da classe anterior da classe modal d2= freqncia da classe modal - freqncia da classe posterior da classe modal h* = amplitude da classe modal Mo = 58 + ((11-9) / ((11-9) + (11 8)) x 4 Mo = 59,6 Obs: A moda utilizada quando desejamos obter uma medida r pida e aproximada de posio ou quando a medida de posi o deva ser o valor mais tpico da distribuio. J a mdia aritmtica a medida de posio que possui a maior estabilidade. MEDIANA - Md A mediana de um conjunto de valores, dispostos segundo uma ordem ( crescente ou decrescente), o valor situado de tal forma no conjunt o que o separa em dois subconjuntos de mesmo nmero de elementos. . A mediana em dados no-agrupados Dada uma srie de valores como, por exemplo: { 5, 2, 6, 13, 9, 15, 10 } De acordo com a definio de mediana, o primeiro passo a ser dado o da ordenao (crescente ou decrescente) dos valores: { 2, 5, 6, 9, 10, 13, 15 }

O valor que divide a srie acima em duas partes iguais igual a 9, logo a Md = 9. . Mtodo prtico para o clculo da Mediana: Se a srie dada tiver nmero mpar de termos: O valor mediano ser o termo de ordem dado pela f rmula : .( n + 1 ) / 2 Ex: Calcule a mediana da srie { 1, 3, 0, 0, 2, 4, 1, 2, 5 } 1 - ordenar a srie { 0, 0, 1, 1, 2, 2, 3, 4, 5 } n = 9 logo (n + 1)/2 dado por (9+1) / 2 = 5, ou seja, o 5 elemento da srie ordenada sera mediana A mediana ser o 5 elemento = 2 . Se a srie dada tiver nmero par de termos: O valor mediano ser o termo de ordem dado pela frmula :.... .[( n/2 ) +( n/2+ 1 )] / 2 Obs: n/2 e (n/2 + 1) sero termos de ordem e devem ser substitudos pelo valor correspondente.

Resumo Estatstica Bsica21

Ex: Calcule a mediana da srie { 1, 3, 0, 0, 2, 4, 1, 3, 5, 6 } 1 - ordenar a srie { 0, 0, 1, 1, 2, 3, 3, 4, 5, 6 } n = 10 logo a f rmula ficar: [( 10/2 ) + (10/2 + 1)] / 2 [( 5 + 6)] / 2 ser na realidade (5 termo+ 6 termo) / 2 5 termo = 2 6 termo = 3 A mediana ser = (2+3) / 2 ou seja, Md = 2,5 . A mediana no exemplo ser a mdia aritmtica do 5 e 6 termos da srie. Notas: Quando o nmero de elementos da srie estatstica for mpar, haver coincidncia da mediana com um dos elementos da srie. Quando o nmero de elementos da srie estatstica for par, nunca haver coincidncia da mediana com um dos elementos da srie. A mediana ser sempre a mdia aritmtica dos 2 elementos centrais da srie. Em uma srie a mediana, a mdia e a moda no tm, necessariamente, o mesmo valor. A mediana, depende da posi o e no dos valores dos elementos na srie ordenada. Essa uma da diferenas marcantes entre mediana e mdia ( que se deixa influenciar, e muito, pelos valores extremos). Vejamos: Em { 5, 7, 10, 13, 15 } a mdia = 10 e a mediana = 10 Em { 5, 7, 10, 13, 65 } a mdia = 20 e a mediana = 10

isto , a mdia do segundo conjunto de valores maior do que a do primeiro, por influncia dos valores extremos, ao passo que a mediana permanece a mesma. A mediana em dados agrupados a) Sem intervalos de classe: Neste caso, o bastante identificar a freqnciaacumulada imediatamente superior metade da soma das freqncias. A mediana ser aquele valor da varivel que corresponde a talfreqncia acumulada. Ex.: conforme tabela abaixo: Varivel xi FreqnciafiFreqncia acumulada 022 168 2 9 17 3 13 30 4 5 35 total 35 Quando o somatrio das freqncias for mpar o valor mediano ser o termo de ordem dado pela f rmula : . Como o somatrio das freqncias = 35 a frmula ficar: ( 35+1 ) / 2 = 18 termo = 3..

Resumo Estatstica Bsicao somatrio das freqncias for par o valor mediano ser o termo de ordem dado pela frmula: Ex: Calcule Mediana da tabela abaixo: Varivel xi FreqnciafiFreqncia acumulada 12 1 1 14 2 3 15 1 4 16 2 6 17 1 7 20 1 8 total 8 Aplicando frmula acima teremos:[(8/2)+ (8/2+1)]/2 = (4 termo + 5 termo) / 2 = (15 + 16) / 2 = 15,5 b) Com intervalos de classe: Devemos seguir os seguintes passos: 1)Determinamos as freqncias acumuladas ; 2)Calculamos ; 3)Marcamos a classe correspondente freqncia acumulada imediatamente superior . Tal classe ser a classe mediana ; 4)Calculamos a Mediana pela seguinte f rmula:. M Md= l* + [( - FAA ) x h*] / f* l* = o limite inferior da classe mediana. FAA = a freqncia acumulada da classe anterior classe mediana.22 Quando

f* = a freqncia simples da classe mediana. h* = a amplitude do intervalo da classe mediana. Ex: classesfreqncia = fiFreqncia acumulada 50 |------------ 54 4 4 54 |------------ 58 9 13 58 |------------ 62 11 24 62 |------------ 66 8 32 66 |------------ 70 5 37 70 |------------ 74 3 40 total 40 = 40 / 2 =.20........... logo.a classe mediana ser 58 |---------- 62

Resumo Estatstica Bsica23

l* = 58...........FAA = 13...........f* = 11...........h* = 4 Substituindo esses valores na f rmula, obtemos: Md = 58 + [ (20 - 13) x 4] / 11 = 58 + 28/11 = 60,54 OBS: Esta mediana estimada, pois no temos os 40 valores da distribuio. Emprego da Mediana Quando desejamos obter o ponto que divide a distribui o em duas partes iguais. Quando h valores extremos que afetam de maneira acentuada a mdia aritmtica. Quando a varivel em estudo salrio. SEPARATRIZES Alm das medidas de posio que estudamos, h outras que, consideradas individualmente, no so medidas de tendncia central, mas esto ligadas mediana relativamente sua caracterstica de separar a srie em duas partes que apresentam o mesmo nmero de valores. Essas medidas - os quartis, os decis e os percentis - so, juntamente com a mediana, conhecidas pelo nome genrico de separatrizes. . QUARTIS - Q Denominamos quartis os valores de uma srie que a dividem em quatro partes iguais. Precisamos portanto de 3 quartis (Q1 , Q2 e Q3) para dividir a srie em quatro partes iguais. Obs: O quartil 2 ( Q2 ) SEMPRE SER IGUAL A MEDIANA DA SRIE. Quartis em dados no agrupados O mtodo mais prtico utilizar o princpio do clculo da mediana para os 3 quartis. Na realidade sero calculadas " 3 medianas " em uma mesma srie. Ex1: Calcule os quartis da srie: { 5, 2, 6, 9, 10, 13, 15 } - O primeiro passo a ser dado o da ordenao (crescente ou decrescente) dos valores: { 2, 5, 6, 9, 10, 13, 15 } - O valor que divide a srie acima em duas partes iguais igual a 9, logo a Md = 9 que ser= Q2 = 9

- Temos agora {2, 5, 6 }e {10, 13, 15 } como sendo os dois grupos de valores iguais proporcionados pela mediana ( quartil 2 ). Para o clculo do quartil 1 e 3 basta calcular as medianas das partes iguais provenientes da verdadeira Mediana da srie (quartil 2). Logo em { 2, 5, 6 } a mediana = 5 . Ou seja: ser o quartil 1 = Q1 = 5 em{10, 13, 15 } a mediana =13 . Ou seja: ser o quartil 3 = Q = 13

Resumo Estatstica Bsica24

Ex2: Calcule os quartis da srie: { 1, 1, 2, 3, 5, 5, 6, 7, 9, 9, 10, 13 } - A srie j est ordenada, ento calcularemos o Quartil 2 = Md = (5+6)/2 = 5,5 - O quartil 1ser a mediana da srie esquerda de Md: { 1, 1, 2, 3, 5, 5 } Q1 = (2+3)/2 = 2,5 - O quartil 3ser a mediana da srie direita de Md : {6, 7, 9, 9, 10, 13 } Q3 = (9+9)/2 = 9 Quartis para dados agrupados em classes Usamos a mesma tcnica do clculo da mediana, bastando substituir, na frmula da mediana, E fi / 2....por... k .E fi / 4 ...sendok o nmero de ordem do quartil. Assim, temos: Q1 =.l* + [(E fi / 4 - FAA ) x h*] / f* Q2 =.l* + [(2.E fi / 4 - FAA ) x h*] / f* Q3 =.l* + [(3.E fi / 4 - FAA ) x h*] / f* Ex 3 - Calcule os quartis da tabela abaixo : classesfreqncia = fiFreqncia acumulada 50 |------------ 54 4 4 54 |------------ 58 9 13 58 |------------ 62 11 24 62 |------------ 66 8 32 66 |------------ 70 5 37 70 |------------ 74 3 40 total 40 - O quartil 2 = Md, logo: = 40 / 2 =.20........... logo.a classe mediana ser 58 |---------- 62 l* = 58...........FAA = 13...........f* = 11...........h* = 4 Q2 =.l* + [(2.E fi / 4 - FAA ) x h*] / f* - Substituindo esses valores na frmula, obtemos: Md = 58 + [ (20 - 13) x 4] / 11 = 58 + 28/11 = 60,54 = Q2 - O quartil 1: E fi / 4 = 10 Q1 =.l* + [(E fi / 4 - FAA ) x h*] / f* Q1 = 54 + [ (10 - 4) x 4] / 9 = 54 + 2,66 = 56,66 = Q1

Resumo Estatstica Bsica25

. - O quartil 3 :3.E fi / 4 = 30 Q3 =.l* + [(3.E fi / 4 - FAA ) x h*] / f* Q3 = 62 + [ (30 -24) x 4] / 8 = 62 + 3 = 65 = Q3 DECIS - D

A definio dos decisobedece ao mesmo princpio dos quartis, com a modificao da porcentagem de valores que ficam aqu m e alm do decilque se pretende calcular. A frmula bsica ser : k .E fi / 10 onde k o nmero de ordem do decila ser calculado. Indicamos os decis : D1, D2, ... , D9. Deste modo precisamos de 9decis paradividirmos uma srie em 10 partes iguais. De especial interesse o quinto decil, que divide o conjunto em duas partes iguais. Assim sendo,oQUINTO DECIL IGUAL AO SEGUNDO QUARTIL, que por sua vez IGUAL MEDIANA. Para D5 temos :5.E fi / 10 = E fi / 2 Ex: Calcule o 3 decilda tabela anterior com classes. k= 3 onde 3.E fi / 10 = 3 x 40 / 10 = 12. Este resultado corresponde a 2 classe. D3 = 54 + [ (12 - 4) x 4] / 9 = 54 + 3,55 = 57,55 = D3 PERCENTIL ou CENTIL Denominamos percentis ou centiscomo sendo os noventa e nove valores que separam uma srie em 100 partes iguais. Indicamos: P1, P2, ... , P99. evidente que P50 = Md;P25 = Q1 e P75 = Q3. O clculo de um centilsegue a mesma tcnica do clculo da mediana, porm a frmula ser : k .E fi / 100 onde k o nmero de ordem do centila ser calculado. Disperso ou Variabilidade: a maior ou menor diversificao dos valores de uma varivel em torno de um valor de tend ncia central ( mdia ou mediana ) tomado como ponto de compara o. A mdia - ainda que considerada como um n mero que tem a faculdade de representar uma srie de valores - no pode, por si mesma, destacar o grau de homogeneidade ou heterogeneidade que existe entre os valores que comp em o conjunto.

Resumo Estatstica Bsicaos seguintes conjuntos de valores das variveis X, Y e Z: X = { 70, 70, 70, 70, 70 } Y = { 68, 69, 70 ,71 ,72 } Z = { 5, 15, 50, 120, 160 } - Observamos ento que os trs conjuntos apresentam a mesma mdia aritmtica = 350/5 = 70 Entretanto, fcil notar que o conjunto X mais homogneo que os conjuntos Ye Z, j que todos os valores so iguais mdia. O conjunto Y, por sua vez, mais homogneo que o conjunto Z, pois h menor diversificao entre cada um de seus valores e a mdia representativa.26 Consideremos

Conclumos ento que o conjunto X apresenta DISPERSO NULA e que o conjunto Y apresenta uma DISPERSO MENOR que o conjunto Z.

Resumo Estatstica Bsica27

4. MEDIDAS DE DISPERSO ABSOLUTAAMPLITUDE TOTAL: a nica medida de disperso que no tem na mdia o ponto de referncia. Quando os dados no esto agrupados a amplitude total a diferena entrE o maior e o menor valor observado: AT = X mximo - X mnimo. Ex: Para os valores 40, 45, 48, 62 e 70 a amplitude total ser : AT = 70 - 40 = 30 Quando os dados esto agrupados sem intervalos de classe ainda temos : AT = X mximo - X mnimo. Ex: xi fi 02 16 35 43 AT = 4 - 0 = 4 * Com intervalos de classe a AMPLITUDE TOTAL a diferena entre o limite superior da ltima classe e o limite inferior da primeira classe. Ento: AT = L mximo - l mnimo Ex: Classes fi 4|------------- 6 6 6 |------------- 8 2 8 |------------- 10 3 AT = 10 - 4 = 6 A amplitude total tem o inconveniente de s levar em conta os dois valores extremos da srie, descuidando do conjunto de valores intermedi rios. Faz-se uso da amplitude total quando se quer determinar a amplitude da temperatura em um dia , no controle de qualidade ou como uma medida de clculo rpido sem muita exatido. DESVIO QUARTIL: Tambm chamado de amplitude semi-interquatlica e baseada nos quartis. Smbolo: Dqe a Frmula: Dq = (Q3 - Q1) / 2 Observaes: 1 - O desvio quartil apresenta como vantagem o fato de ser uma medida f cil de calcular e de interpretar. Alm do mais, no afetado pelos valores extremos, grandes ou

pequenos, sendo recomendado, por conseguinte, quando entre os dados figurem valores extremos que no se consideram representativos.

Resumo Estatstica Bsica28

2- O desvio quartil dever ser usado preferencialmente quando a medida de tendncia central for a mediana. 3- Trata-se de uma medida insensvel distribuio dos itens menores que Q1, entre Q1 e Q3 e maiores que Q3. Ex: Para os valores 40, 45, 48, 62 e 70 o desvio quartil ser : Q1 = (45+40)/2 = 42,5 Q3 = (70+62)/2 = 66 Dq = (66 - 42,5) / 2 = 11,75 DESVIO MDIO ABSOLUTO - Dm Para dados brutos: a mdia aritmtica dos valores absolutos dos desvios tomados em relao a uma das seguintes medidas de tend ncia central: mdia ou mediana. para a Mdia = Dm = E | Xi - | / n para a Mediana = Dm = E | Xi - Md | / n As barras verticais indicam que so tomados os valores absolutos, prescindindo do sinal dos desvios. Ex: Calcular o desvio mdio do conjunto de nmeros { - 4 , - 3 , - 2 , 3 , 5 } = - 0, 2 e Md = - 2 Tabela auxiliar para clculo do desvio mdio Xi Xi - | Xi - | Xi - Md | Xi - Md | - 4 (- 4) - (-0,2) = -3,8 3,8 (- 4) - (-2) = - 2 2 - 3 (- 3) - (-0,2) = -2,8 2,8 (- 3) - (-2) = - 1 1 - 2 (- 2) - (-0,2) = -1,8 1,8 (- 2) - (-2) = 0 0 3 3 - (-0,2) = 3,2 3,2 3 - (-2) = 5 5 5 5 - (-0,2) = 5,2 5,2 5 - (-2) = 7 7 E = 16,8 E = 15 Pela Mdia : Dm = 16,8 / 5 = 3,36 Pela Mediana : Dm = 15 / 5 = 3

Resumo Estatstica Bsica29

DESVIO PADRO - S a medida de disperso mais geralmente empregada, pois leva em considerao a totalidade dos valores da vari vel em estudo. um indicador de variabilidade bastante estvel. O desvio padro baseia-se nos desvios em torno da mdia aritmtica e a sua frmula bsica pode ser traduzida como : a raiz quadrada da mdia aritmtica dos quadrados dos desvios e representada por S . A frmula acima empregada quando tratamos de uma populao de dados noagrupados. Ex: Calcular o desvio padro da populao representada por - 4 , -3 , -2 , 3 , 5 Xi - 4 - 0,2 - 3,8 14,44 - 3 - 0,2 - 2,8 7,84 - 2 - 0,2 - 1,8 3,24 3 - 0,2 3,2 10,24

5 - 0,2 5,2 27,04 E = 62,8 Sabemos que n = 5 e 62,8 / 5 = 12,56. A raiz quadrada de 12,56 o desvio padro = 3,54 Obs: Quando nosso interesse n o se restringe descrio dos dados mas, partindo da amostra, visamos tirar inferncias vlidas para a respectiva popula o, convm efetuar uma modificao, que consiste em usar o divisor n - 1 em lugar de n. A frmula ficar ento: Se os dados - 4 , -3 , -2 , 3 , 5 representassem uma amostra o desvio padro amostralseria a raiz quadrada de 62,8 / (5 -1) = 3,96 O desvio padro goza de algumas propriedades, dentre as quais destacamos: 1 = Somando-se (ou subtraindo-se) uma constante a todos os valores de uma varivel, o desvio padro no se altera. 2 = Multiplicando-se (ou dividindo-se) todos os valores de uma varivel por uma constante (diferente de zero), o desvio padr o fica multiplicado ( ou dividido) por essa constante.

Resumo Estatstica Bsicaos dados esto agrupados (temos a presena de freqncias) a frmula do desvio padro ficar : ou quando se trata de uma amostra Ex: Calcule o desvio padro populacional da tabela abaixo: Xi f i Xi . f i . f i 0 2 0 2,1 -2,1 4,41 8,82 1 6 6 2,1 -1,1 1,21 7,26 2 12 24 2,1 -0,1 0,01 0,12 3 7 21 2,1 0,9 0,81 5,67 4 3 12 2,1 1,9 3,61 10,83 Total 30 63 E = 32,70 - Sabemos que E fi = 30 e 32,7 / 30 = 1,09. - A raiz quadrada de 1,09 o desvio padro = 1,044 - Se considerarmos os dados como sendo de uma amostra o desvio padro seria : a raiz quadrada de 32,7 / (30 -1) = 1,062 Obs: Nas tabelas de freqnciascom intervalos de classe a frmula a ser utilizada a mesma do exemplo anterior. VARINCIA - S2 o desvio padro elevado ao quadrado. A vari ncia uma medida que tem pouca utilidade como estat stica descritiva, porm extremamente importante na inferncia estatstica e em combinaes de amostras. MEDIDAS DE DISPERSO RELATIVA Coeficiente de Variao de Pearson - CVP30 Quando

Na estatstica descritiva o desvio padro por si s tem grandes limitaes. Assim, um desvio padro de 2 unidades pode ser considerado pequeno para uma s rie de valores cujo valor mdio 200; no entanto, se a mdia for igual a 20, o mesmo no pode ser dito. Alm disso, o fato de o desvio padro ser expresso na mesma unidade dos dados limita o seu emprego quando desejamos comparar duas ou mais s ries de valores, relativamente sua disperso ou variabilidade, quando expressas em unidades diferentes.

Resumo Estatstica Bsica31

Para contornar essas dificuldades e limita es, podemos caracterizar a disperso ou variabilidade dos dados em termos relativos a seu valor m dio, medida essa denominada de CVP: Coeficiente de Variao de Pearson ( A RAZO ENTRE O DESVIO PADRO E A MDIA REFERENTES A DADOS DE UMA MESMA SRIE). CVP = (S / ) x 100 o resultado neste caso expresso em percentual, entretanto pode ser expresso tambm atravs de um fator decimal, desprezando assim o valor 100 da frmula. Ex: Tomemos os resultados das estaturas e dos pesos de um mesmo grupo de indivduos: Discriminao M D I A DESVIO PADRO ESTATURAS 175 cm 5,0 cm PESOS 68 kg 2,0 kg - Qual das medidas (Estatura ou Peso) possui maior homogeneidade ? Resposta: Teremos que calcular o CVP da Estatura e o CVP do Peso. O resultado menorser o de maior homogeneidade ( menor dispers o ou variabilidade). CVP estatura = ( 5 / 175 ) x 100 = 2,85 % CVP peso = ( 2 / 68 ) x 100 = 2,94 % . Logo, nesse grupo de indivduos, as estaturas apresentam menor gra u de disperso que os pesos. Coeficiente de Variao de Thorndike - CVT igual ao quociente entre o desvio padr o e a mediana. CVT = ( S / Md ) x 100 % Coeficiente Quartlico de Variao - CVQ Esse coeficiente definido pela seguinte express o: CVQ = [(Q3 - Q1) / (Q3 + Q1)] x 100 %. Desvio quartil Reduzido Dqr Dqr = [(Q3 - Q1) / 2Md ] x 100 %.

Resumo Estatstica Bsica32

5. MEDIDAS DE ASSIMETRIA

Introduo: Uma distribuio com classes simtrica quando : Mdia = Mediana = Moda Uma distribuio com classes : Assimtrica esquerda ou negativa quando :Mdia < Mediana < Moda Assimtrica direita ou positiva quando :Mdia > Mediana > Moda Coeficiente de assimetria: A medida anterior, por ser absoluta, apresenta a mesma deficincia do desvio padro, isto , no permite a possibilidade de compara o entre as medidas de duas distribuies. Por esse motivo, daremos preferncia ao coeficiente de assimetria de Person : As = 3 ( Mdia - Mediana ) / Desvio Padro Escalas de assimetria: | AS | < 0,15 assimetria pequena 0,15 < | AS | < 1 assimetria moderada | AS | > 1 assimetria elevada Obs: Suponhamos AS = - 0,49 a assimetria considerada moderada e negativa Suponhamos AS = 0,75 a assimetria considerada moderada e positiva MEDIDAS DE CURTOSE Introduo: Denominamos CURTOSE o grau de achatamento de uma distribui o em relao a uma distribuio padro, denominada curva normal (curva correspondente a uma distribuio terica de probabilidade). Quando a distribuio apresenta uma curva de freqncia mais fechada que a normal(ou mais aguda ou afilada em sua parte superior), ela recebe o nome de leptocrtica. Quando a distribuio apresenta uma curva de freqncia mais aberta que a normal(ou mais achatada em sua parte superior), ela recebe o nome de platicrtica.

Resumo Estatstica Bsica33

A curva normal, que a nossa base referencial, recebe o nome de mesocrtica. Coeficiente de curtose C1 = (Q3 - Q1) / 2(P90 - P10) Este coeficiente conhecido como percentlico de curtose. Relativamente a curva normal, temos: C1 = 0,263 curva mesocrtica C1 < 0,263 curva leptocrtica C1 > 0,263 curva platicrtica O coeficiente abaixo ( C2 )ser utilizado em nossas anlises: ondeS desvio padro C2 = 3 curva mesocrtica C2 > 3 curva leptocrtica C2 < 3 curva platicrtica

FIM Agradecimento: Este resumo s foi possvel graas agarimpagem realizada na WEB, mais especificamente na pagina do Prof. Paulo Cezar Ribeiro da Silva,ao qual eu externo meus agradecimentos.