Upload
dodat
View
222
Download
0
Embed Size (px)
Citation preview
Conceitos FundamentaisTabelas e Graficos
Distribuicao de FrequenciaMedidas de Posicao
Medidas de Dispersao
Calculo das Probabilidades e Estatıstica I
Eufrasio de Andrade Lima Neto
Universidade Federal da Paraıba
2017.2
Eufrasio de Andrade Lima Neto Calculo das Probabilidades e Estatıstica I
Conceitos FundamentaisTabelas e Graficos
Distribuicao de FrequenciaMedidas de Posicao
Medidas de Dispersao
Sobre mim
Prof. Dr. Eufrasio de Andrade Lima Neto. Sou lotado no Centro deCiencias Exatas e da Natureza no Departamento de Estatıstica - UFPB.
A minha sala e a de numero 10.
Meu email: [email protected].
Eufrasio de Andrade Lima Neto Calculo das Probabilidades e Estatıstica I
Conceitos FundamentaisTabelas e Graficos
Distribuicao de FrequenciaMedidas de Posicao
Medidas de Dispersao
Sobre mim
Prof. Dr. Eufrasio de Andrade Lima Neto. Sou lotado no Centro deCiencias Exatas e da Natureza no Departamento de Estatıstica - UFPB.
A minha sala e a de numero 10.
Meu email: [email protected].
Eufrasio de Andrade Lima Neto Calculo das Probabilidades e Estatıstica I
Conceitos FundamentaisTabelas e Graficos
Distribuicao de FrequenciaMedidas de Posicao
Medidas de Dispersao
Sobre mim
Prof. Dr. Eufrasio de Andrade Lima Neto. Sou lotado no Centro deCiencias Exatas e da Natureza no Departamento de Estatıstica - UFPB.
A minha sala e a de numero 10.
Meu email: [email protected].
Eufrasio de Andrade Lima Neto Calculo das Probabilidades e Estatıstica I
Conceitos FundamentaisTabelas e Graficos
Distribuicao de FrequenciaMedidas de Posicao
Medidas de Dispersao
Ementa
O curso de Calculo das Probabilidades e Estatıstica I e formado pelaseguinte ementa.
Ementa do Curso
Conceitos Fundamentais; Distribuicao de Frequencia; Tabelas e Graficos;Medidas de Posicao; Medidas de Dispersao; Introducao a Probabilidade;Variaveis Aleatorias Unidimensionais; Esperanca Matematica; DistribuicoesDiscretas; Distribuicoes Contınuas; Nocoes Elementares de Amostragem;Estimativa Estatıstica; Decisao Estatıstica; Regressao e Correlacao.
Eufrasio de Andrade Lima Neto Calculo das Probabilidades e Estatıstica I
Conceitos FundamentaisTabelas e Graficos
Distribuicao de FrequenciaMedidas de Posicao
Medidas de Dispersao
Ementa
O curso de Calculo das Probabilidades e Estatıstica I e formado pelaseguinte ementa.
Ementa do Curso
Conceitos Fundamentais; Distribuicao de Frequencia; Tabelas e Graficos;Medidas de Posicao; Medidas de Dispersao; Introducao a Probabilidade;Variaveis Aleatorias Unidimensionais; Esperanca Matematica; DistribuicoesDiscretas; Distribuicoes Contınuas; Nocoes Elementares de Amostragem;Estimativa Estatıstica; Decisao Estatıstica; Regressao e Correlacao.
Eufrasio de Andrade Lima Neto Calculo das Probabilidades e Estatıstica I
Conceitos FundamentaisTabelas e Graficos
Distribuicao de FrequenciaMedidas de Posicao
Medidas de Dispersao
Plano de Curso
O plano de curso seguira a ementa apresentada logo acima no frameanterior e esta disponıvel no SIGA Academico
Eufrasio de Andrade Lima Neto Calculo das Probabilidades e Estatıstica I
Conceitos FundamentaisTabelas e Graficos
Distribuicao de FrequenciaMedidas de Posicao
Medidas de Dispersao
Plano de Curso
Plano adotado - 1a Avaliacao
1. Conceitos Fundamentais; 2. Estatıstica, Populacao, Parametro eAmostra; 3. Distribuicao de Frequencia; 4. Tabelas e Graficos; 5. Medidasde Posicao e Dispersao; 6. Medias, Mediana e Moda (definicao epropriedades); 7. Amplitude, variancia, Desvio-Padrao e Coeficiente devariacao (definicao e propriedades); 8. Introducao a Probabilidade; 9.Modelos Matematicos (determinısticos e nao-determinısticos); 10. EspacoAmostral e Evento; 11. Probabilidade (definicao e propriedades); 12.Calculo das Probabilidades; 13. Probabilidade Condicional eIndependencia.
Eufrasio de Andrade Lima Neto Calculo das Probabilidades e Estatıstica I
Conceitos FundamentaisTabelas e Graficos
Distribuicao de FrequenciaMedidas de Posicao
Medidas de Dispersao
Plano de Curso
Plano adotado - 2a Avaliacao
14. Variaveis Aleatorias – (definicao); 15. Variaveis aleatorias (discretas econtınuas); 16. Funcao de Probabilidade e Funcao de Densidade deProbabilidade; 17. Funcao e Distribuicao Acumulada; 18. EsperancaMatematica; 19. Definicao e Propriedades da Esperanca Matematica; 20.Variancia e Desvio-Padrao (definicao e propriedades); 21. DistribuicaoDiscretas e Contınuas; 22. Distribuicao Binomial; 23. Distribuicao dePoisson; 24. Distribuicao Normal.
Eufrasio de Andrade Lima Neto Calculo das Probabilidades e Estatıstica I
Conceitos FundamentaisTabelas e Graficos
Distribuicao de FrequenciaMedidas de Posicao
Medidas de Dispersao
Plano de Curso
Plano adotado - 3a Avaliacao
25. Nocoes Elementares de Amostragem; 26. Tipos de Amostragem(probabilısticas); 27. Distribuicoes Amostrais; 28. Estimativas e DecisaoEstatıstica; 29. Estimacao de Parametros (conceitos); 30. EstimacaoPontual; 31. Estimacao por Intervalo; 32. Testes de Hipoteses; 33.Regressao e Correlacao.
Eufrasio de Andrade Lima Neto Calculo das Probabilidades e Estatıstica I
Conceitos FundamentaisTabelas e Graficos
Distribuicao de FrequenciaMedidas de Posicao
Medidas de Dispersao
Recursos utilizados
Boa parte do curso sera apoiada pelo uso de datashow o que nos ajudaraa decorrer sobre os diversos assuntos contidos na ementa desse curso, quee bastante ampla.
O quadro sera utilizado para demostrar alguns resultados, para resolucaode exemplos bem como para complementacoes em que o professor acharconveniente no momento de aula.
Todo material apresentado em sala de aula esta disponıvel emwww.de.ufpb.br/~eufrasio/CPE e/ou no SIGA Academico.
Eufrasio de Andrade Lima Neto Calculo das Probabilidades e Estatıstica I
Conceitos FundamentaisTabelas e Graficos
Distribuicao de FrequenciaMedidas de Posicao
Medidas de Dispersao
Referencias Bibliograficas
MEYER, P.L. – Probabilidade: Aplicacao a Estatıstica – Ed. LivroTecnico;
COSTA-NETO, P.L.O. - Estatıstica - Ed. Edgar Blucher;
MORETTIN, P.A . – Introducao a Estatıstica – Ed. Atlas;
HOEL, P.G. – Estatıstica Elementar – Ed. Atlas;
FONSECA, J.S. e MARTINS, G.A . – Curso de Estatıstica - Ed.Atlas.
Eufrasio de Andrade Lima Neto Calculo das Probabilidades e Estatıstica I
Conceitos FundamentaisTabelas e Graficos
Distribuicao de FrequenciaMedidas de Posicao
Medidas de Dispersao
Sobre as avaliacoes
No curso iremos considerar tres avaliacoes
As datas das avaliacoes estao disponıveis no SIGA Academico
Eufrasio de Andrade Lima Neto Calculo das Probabilidades e Estatıstica I
Conceitos FundamentaisTabelas e Graficos
Distribuicao de FrequenciaMedidas de Posicao
Medidas de Dispersao
Sobre as reposicoes
O aluno tera direto a apenas uma reposicao de uma das avaliacoes desdeque satisfeito o que rege a Resolucao Nº 16/2015 que aprova oRegulamento dos Cursos Regulares de Graduacao da UFPB.
O aluno podera repor uma prova desde que entre com pedido de reposicaojunto a coordenacao do seu curso. O coordenador de seu curso ira avaliaro pedido de reposicao com base na Resolucao Nº 16/2015 do CONSEPEe encaminhara o pedido julgado ao Departamento de Estatıstica - UFPB.
Apenas ira repor a prova quem atender os requisitos do Art. 92, 6º §.
Eufrasio de Andrade Lima Neto Calculo das Probabilidades e Estatıstica I
Burocracias, avisos e normas a parte, vamos ao queinteressa!
Conceitos FundamentaisTabelas e Graficos
Distribuicao de FrequenciaMedidas de Posicao
Medidas de Dispersao
O que e Estatıstica?
Eufrasio de Andrade Lima Neto Calculo das Probabilidades e Estatıstica I
Conceitos FundamentaisTabelas e Graficos
Distribuicao de FrequenciaMedidas de Posicao
Medidas de Dispersao
O que e Estatıstica?
Uma Ciencia;
Um metodo, quando utilizada como instrumento por outra Ciencia;
Estatıstica lida com o desenvolvimento e aplicacao de metodos paracoletar, organizar, analisar e interpretar dados de tal modo que asconclusoes baseada nos dados possam ser avaliada objetivamente pormeio de proposicoes probabilısticas;
Metodos estatısticos sao presentes na medicina, farmacologia,engenharia, ciencias sociais, fısica, economia, marketing, etc.
Eufrasio de Andrade Lima Neto Calculo das Probabilidades e Estatıstica I
Conceitos FundamentaisTabelas e Graficos
Distribuicao de FrequenciaMedidas de Posicao
Medidas de Dispersao
O que e Estatıstica?
Estatıstica
Estatıstica representa um conjunto de metodos e processosquantitativos, util estudar fenomenos aleatorios.
A Estatıstica pode ser descrita atraves da seguinte equacao:
Eufrasio de Andrade Lima Neto Calculo das Probabilidades e Estatıstica I
Conceitos FundamentaisTabelas e Graficos
Distribuicao de FrequenciaMedidas de Posicao
Medidas de Dispersao
O que e Estatıstica?
Estatıstica
Estatıstica representa um conjunto de metodos e processosquantitativos, util estudar fenomenos aleatorios.
A Estatıstica pode ser descrita atraves da seguinte equacao:
Eufrasio de Andrade Lima Neto Calculo das Probabilidades e Estatıstica I
Conceitos FundamentaisTabelas e Graficos
Distribuicao de FrequenciaMedidas de Posicao
Medidas de Dispersao
Fenomenos Aleatorios
Figure: Lancamento de dados. Figure: Cotacao do dolar.
Eufrasio de Andrade Lima Neto Calculo das Probabilidades e Estatıstica I
Conceitos FundamentaisTabelas e Graficos
Distribuicao de FrequenciaMedidas de Posicao
Medidas de Dispersao
Fenomenos Aleatorios
Figure: Catastrofe (difıcil de ser modelado).
Eufrasio de Andrade Lima Neto Calculo das Probabilidades e Estatıstica I
Conceitos FundamentaisTabelas e Graficos
Distribuicao de FrequenciaMedidas de Posicao
Medidas de Dispersao
Outros Fenomenos Aleatorios
Exemplos de Experimento Aleatorio
1 Numero de chamadas telefonicas em um Call Center entre 12h:00 e14h:00;
2 Numero de acidentes diarios em certo trecho de uma rodovia federal;
3 Numero de homicıdios, em um final de semana, na grande JoaoPessoa;
4 Crescimento do PIB (Produto Interno Bruto) do Brasil no ano atual.
Eufrasio de Andrade Lima Neto Calculo das Probabilidades e Estatıstica I
Conceitos FundamentaisTabelas e Graficos
Distribuicao de FrequenciaMedidas de Posicao
Medidas de Dispersao
O que e Estatıstica?
Esclarecimento
Mas professor, iremos conseguir, ao final do curso, dar respostas para taisproblemas? Isto e, conseguiremos estudar qualquer fenomeno aleatorio?
Resposta: A resposta e NAO.
A depender do experimento aleatorio, podera ser extremamente difıcilobter uma resposta ao problema. Nesses casos, um conhecimentoprofundo de estatıstica (muitas vezes bem acima do que e apresentadonesse curso) sera necessario.
Eufrasio de Andrade Lima Neto Calculo das Probabilidades e Estatıstica I
Conceitos FundamentaisTabelas e Graficos
Distribuicao de FrequenciaMedidas de Posicao
Medidas de Dispersao
Conceitos Basicos de Estatıstica
Objetivando o estudo quantitativo e qualitativo dos dados (ouinformacoes), obtidos nos varios campos da atividade cientıfica, aEstatıstica manipula dois conjuntos de dados fundamentais: a”populacao” e a ”amostra”.
Eufrasio de Andrade Lima Neto Calculo das Probabilidades e Estatıstica I
Conceitos FundamentaisTabelas e Graficos
Distribuicao de FrequenciaMedidas de Posicao
Medidas de Dispersao
Populacao
Populacao
E o conjunto dos seres, objetos ou informacoes que interessam ao estudode um fenomeno coletivo segundo alguma(s) caracterıstica(s).
E, portanto, um conjunto de informacoes relativas a qualquer area deinteresse, podendo, quanto ao numero de elementos, ser: finita (tamanhoN) ou infinita.
Na maioria das vezes nao e conveniente, ou mesmo possıvel, realizar olevantamento dos dados referentes a todos os elementos de umapopulacao. Portanto, analisamos parte da populacao, isto e, uma amostra.
Eufrasio de Andrade Lima Neto Calculo das Probabilidades e Estatıstica I
Conceitos FundamentaisTabelas e Graficos
Distribuicao de FrequenciaMedidas de Posicao
Medidas de Dispersao
Amostra
Geralmente, fazemos estatıstica por meio de um subconjunto de umapopulacao P de interesse. A esse subconjunto A chamaremos de amostra.Isto e, A ⊆ P.
Amostra
A amostra e uma parcela que e selecionada de uma populacao deinteresse. Tal subconjunto e selecionado de forma conveniente por meio detecnicas estatıstica.
Eufrasio de Andrade Lima Neto Calculo das Probabilidades e Estatıstica I
Conceitos FundamentaisTabelas e Graficos
Distribuicao de FrequenciaMedidas de Posicao
Medidas de Dispersao
Amostra
A beleza da estatıstica e utilizar um subconjunto da populacao e obterresposta sobre o todo.
Eufrasio de Andrade Lima Neto Calculo das Probabilidades e Estatıstica I
Conceitos FundamentaisTabelas e Graficos
Distribuicao de FrequenciaMedidas de Posicao
Medidas de Dispersao
Amostra
Eufrasio de Andrade Lima Neto Calculo das Probabilidades e Estatıstica I
Conceitos FundamentaisTabelas e Graficos
Distribuicao de FrequenciaMedidas de Posicao
Medidas de Dispersao
Por que considerar uma amostra?
Por quais motivos nao trabalhamos diretamente com P uma vez quetrabalhar com um subconjunto de P admitimos ocorrencia de alguns erros?
Duas principais respostas para esse pergunta sao:
1 Muitas vezes nao temos como obter toda a informacao de P.Exemplo: Estudar o nıvel de poluicao das aguas de um rio.
2 Geralmente e caro fazer um censo.
Eufrasio de Andrade Lima Neto Calculo das Probabilidades e Estatıstica I
Conceitos FundamentaisTabelas e Graficos
Distribuicao de FrequenciaMedidas de Posicao
Medidas de Dispersao
Amostra
Na figura anterior, temos que A = (A ∪ B ∪ C ) ⊆ P, em que A e umaamostra razoavel para se inferir a respeito de P.
Observacoes:
1 Jamais selecionamos amostras de qualquer forma. Muito emboratodo subconjunto A da populacao P e denominado de amostra,sempre estaremos interessados em um subconjunto A“representativo”, obtido por procedimentos estatısticos corretos.
2 De nada vale utilizar metodologias estatısticas sofisticadas se nao nospreocuparmos em selecionar uma amostra representativa.
Exemplo: Muitas pesquisas eleitorais apresentam resultados distorcidosdevido a falta de cuidado ao selecionar uma amostra de eleitores de umadada regiao geografica.
Eufrasio de Andrade Lima Neto Calculo das Probabilidades e Estatıstica I
Conceitos FundamentaisTabelas e Graficos
Distribuicao de FrequenciaMedidas de Posicao
Medidas de Dispersao
Conceitos Basicos de Estatıstica
Parametro
Uma caracterıstica numerica estabelecida para toda uma populacao edenominada parametro. Sao valores, geralmente desconhecidos (e queportanto tem de ser estimados), que representam certas caracterısticas dapopulacao.
Estimador
E uma funcao matematica baseada em observacoes amostrais (dados) eusada para indicar o valor de um parametro populacional desconhecido.
Estimativa
O valor numerico assumido pelo estimador numa determinada amostra edenominada estimativa.
Eufrasio de Andrade Lima Neto Calculo das Probabilidades e Estatıstica I
Conceitos FundamentaisTabelas e Graficos
Distribuicao de FrequenciaMedidas de Posicao
Medidas de Dispersao
Conceitos Basicos de Estatıstica
Exemplo
No fenomeno coletivo eleicao para prefeito de uma cidade, a populacao eo conjunto de todos os eleitores que possuem tıtulo eleitoral valido para talcidade. Um parametro e a proporcao de votos do candidato A. Umaamostra pode ser um grupo de 1200 eleitores selecionados em toda acidade. Um estimador e a proporcao de votos do candidato A obtida naamostra. O valor resultante do estimador, a proporcao amostral, e aestimativa.
Eufrasio de Andrade Lima Neto Calculo das Probabilidades e Estatıstica I
Conceitos FundamentaisTabelas e Graficos
Distribuicao de FrequenciaMedidas de Posicao
Medidas de Dispersao
Nıveis de Mensuracao
Na Estatıstica, as caracterısticas de interesse que pretendemos extrair deuma populacao tambem sao conhecidas por Variaveis.
E indispensavel, ao se analisar dados, o conhecimento do nıvel demensuracao da variavel que se pretende estudar.
O nıvel de mensuracao de uma variavel esta relacionado ainda coma tecnica estatıstica que sera utilizada. Existem dois nıveis demensuracao para uma variavel, os quais sao os seguintes:
Eufrasio de Andrade Lima Neto Calculo das Probabilidades e Estatıstica I
Conceitos FundamentaisTabelas e Graficos
Distribuicao de FrequenciaMedidas de Posicao
Medidas de Dispersao
Nıveis de Mensuracao
1 Qualitativo: O resultado e uma qualidade ou atributo e e divididoem dois tipos:
1 Nominal: Nomeia, rotula ou classifica um objeto, pessoa ou algumacaracterıstica por meio de numeros ou outros sımbolos;
2 Ordinal: As categorias mantem uma relacao de ordem.
2 Quantitativo: O resultado e um valor dado numa certa escala detempo, e e dividido em dois tipos:
1 Discreto: Assume apenas valores pertencentes a um conjuntoenumeravel;
2 Contınuo: Assume qualquer valor num certo intervalo de variacao.
Eufrasio de Andrade Lima Neto Calculo das Probabilidades e Estatıstica I
Conceitos FundamentaisTabelas e Graficos
Distribuicao de FrequenciaMedidas de Posicao
Medidas de Dispersao
Agora eu tenho uma amostra, o que fazer?
Suponhamos que temos uma amostra (um subconjunto de dados dapopulacao de interesse). De agora por diante, a nao ser que sejamencionado o contrario, consideraremos que nossas amostras saorepresentativas, ou seja, foram obtidas por procedimentos razoaveis deamostragem de modo que nao iremos fazer questionamentos sobre suaqualidade.
Eufrasio de Andrade Lima Neto Calculo das Probabilidades e Estatıstica I
Conceitos FundamentaisTabelas e Graficos
Distribuicao de FrequenciaMedidas de Posicao
Medidas de Dispersao
Agora eu tenho uma amostra, o que fazer?
Como extrair informacoes de A para responder questionamentosreferente a P?
Resposta: Por meio da inferencia estatıstica.
O que e inferencia estatıstica?
Resposta: Inferencia estatıstica e uma area muito importante daestatıstica que formaliza conceitos e metodologias estatısticas com o usoda teoria das probabilidades. Os resultados na inferencia estatıstica saoapoiados pela teoria da medida, probabilidade, analise e na propriainferencia.
Nota: Por comodidade poderemos chamas inferencia estatıstica desimplesmente inferencia.
Eufrasio de Andrade Lima Neto Calculo das Probabilidades e Estatıstica I
Conceitos FundamentaisTabelas e Graficos
Distribuicao de FrequenciaMedidas de Posicao
Medidas de Dispersao
Agora eu tenho uma amostra, o que fazer?
Pergunta do aluno cetico
Certo professor, mas eu ainda nao entendi como irei usar um sub-conjunto da populacao denotado aqui por A e obter resposta sobreo todo (sobre a populacao de interesse P)?
Resposta do professor legal
Adiantando um pouco o futuro (mas nao muito), iremos modelaros dados por meio de um modelo matematico f (·), em que f eindexado por quantidades desconhecidas (parametros). Ajustandof ao conjunto de dados, podemos inferir e responder questionamentosa respeito de P.
Eufrasio de Andrade Lima Neto Calculo das Probabilidades e Estatıstica I
Conceitos FundamentaisTabelas e Graficos
Distribuicao de FrequenciaMedidas de Posicao
Medidas de Dispersao
Conceitos Basicos de Estatıstica
O modelo f so sera bem especificado quando podermos estimar seusparametros. Utilizaremos procedimentos inferenciais para estimar taisparametros de f .
Eufrasio de Andrade Lima Neto Calculo das Probabilidades e Estatıstica I
Conceitos FundamentaisTabelas e Graficos
Distribuicao de FrequenciaMedidas de Posicao
Medidas de Dispersao
Entao, ja vamos comecar a construir modelos?
Infelizmente ainda nao , precisamos inicialmente aprender a descreverum conjunto de dados (sumarizar os dados) utilizando a estatısticadescritiva para que possamos nos apoiar em determinados aspectos denossos dados de modo a executar uma inferencia bem feita.
O que e estatıstica descritiva?
Estatıstica descritiva e um ramo da estatıstica que aplica tecnicasque objetivam descrever e sumarizar um conjunto de dados.
Eufrasio de Andrade Lima Neto Calculo das Probabilidades e Estatıstica I
Conceitos FundamentaisTabelas e Graficos
Distribuicao de FrequenciaMedidas de Posicao
Medidas de Dispersao
Estatıstica Descritiva
A estatıstica descritiva diferencia-se da estatıstica inferencial pois estaultima utiliza-se dos dados para inferir sobre a populacao.
Observacao: Ao se utilizar de tecnicas de estatıstica descritiva em umaamostra A ⊂ P, nao podemos inferir conclusoes a respeito de P.Lembre-se que as tecnicas descritivas apenas organizam, sumarizam edescrevem os dados relativos a amostra.
Eufrasio de Andrade Lima Neto Calculo das Probabilidades e Estatıstica I
Conceitos FundamentaisTabelas e Graficos
Distribuicao de FrequenciaMedidas de Posicao
Medidas de Dispersao
Estatıstica Descritiva
A Estatıstica Descritiva fornece um resumo sobre os dados de formaquantitativa ou visual.
Tabelas e Quadros podem ser utilizados para descrever as informacoespresentes em uma amostra.
Os Graficos constituem em um recurso importante para visualizar dadosestatısticos.
Alem disso, algumas medidas sao normalmente utilizadas paradescrever/resumir um conjunto de dados, sao elas as medidas detendencia central e as medidas de variabilidade ou dispersao.
Eufrasio de Andrade Lima Neto Calculo das Probabilidades e Estatıstica I
Conceitos FundamentaisTabelas e Graficos
Distribuicao de FrequenciaMedidas de Posicao
Medidas de Dispersao
Tabelas
Normas Tecnicas de Apresentacao Tabular - ABNT (2015).
Elementos Essenciais
1 Tıtulo: onde sera designado o fato observado, alem do local e daepoca em que foi registrado;
2 Cabecalho: localizado na parte superior da tabela e que especifica oconteudo das colunas;
3 Coluna Indicadora: especifica o conteudo das linhas;
4 Corpo: e o espaco compreendido entre o cabecalho e a colunaindicadora;
5 Fonte: entidade responsavel pela informacao basica.
Eufrasio de Andrade Lima Neto Calculo das Probabilidades e Estatıstica I
Conceitos FundamentaisTabelas e Graficos
Distribuicao de FrequenciaMedidas de Posicao
Medidas de Dispersao
Series Estatısticas
As series estatısticas consistem na representacao das informacoes emforma de tabelas, objetivando sintetizar os dados observados.
Uma serie estatıstica compreende dos seguintes elementos:
1 Fato: fenomeno observado;
2 Espaco: local onde o fato ocorreu;
3 Epoca: data ou tempo onde o fato foi observado.
Eufrasio de Andrade Lima Neto Calculo das Probabilidades e Estatıstica I
Conceitos FundamentaisTabelas e Graficos
Distribuicao de FrequenciaMedidas de Posicao
Medidas de Dispersao
Series Estatısticas
Tipos de Series Estatısticas
1 Historia, Cronologica ou Temporal: E aquela em que os dados saoobservados segundo a epoca de ocorrencia;
2 Geografica: Os dados sao observados segundo a localidade deocorrencia;
3 Especıfica: Os dados sao agrupados segundo a modalidade deocorrencia;
4 Mista: Trata-se de uma combinacao de um ou mais tipos de seriesdescritas anteriormente;
Eufrasio de Andrade Lima Neto Calculo das Probabilidades e Estatıstica I
Conceitos FundamentaisTabelas e Graficos
Distribuicao de FrequenciaMedidas de Posicao
Medidas de Dispersao
Tabelas
EXEMPLO - SERIE TEMPORAL
Tabela: Producao Agrıcola em Pernambuco - 1990 a 1995.
Ano Producao (em milhoes)1990 4.51991 5.31992 4.91993 5.11994 6.81995 7.1
Fonte: Dados fictıcios.
Eufrasio de Andrade Lima Neto Calculo das Probabilidades e Estatıstica I
Conceitos FundamentaisTabelas e Graficos
Distribuicao de FrequenciaMedidas de Posicao
Medidas de Dispersao
Tabelas
EXEMPLO - SERIE GEOGRAFICA
Tabela: % do PIB destinado a Educacao por paıs, em 1997.
Paıs PIB (US$ em bilhoes)EUA 2.5
BRASIL 1.0
MEXICO 7.1
JAPAO 0.8
Fonte: Dados fictıcios.
Eufrasio de Andrade Lima Neto Calculo das Probabilidades e Estatıstica I
Conceitos FundamentaisTabelas e Graficos
Distribuicao de FrequenciaMedidas de Posicao
Medidas de Dispersao
Tabelas
EXEMPLO - SERIE ESPECIFICA
Tabela: PIB por setor economico no Brasil em 2000.
Paıs PIB (R$ em milhoes)Primario 12.5
Secundario 5.8Terciario 29.1
Fonte: Dados fictıcios.
Eufrasio de Andrade Lima Neto Calculo das Probabilidades e Estatıstica I
Conceitos FundamentaisTabelas e Graficos
Distribuicao de FrequenciaMedidas de Posicao
Medidas de Dispersao
Tabelas
EXEMPLO - SERIE MISTA
Tabela: Producao Agrıcola por regiao, segundo os principais produtos - 1994
(valores em toneladas).
Regiao Produtos TotalGraos Frutas Legumes
Norte 1.5 45.2 5.0 51.7Nordeste 2.4 120.0 1.6 124.0
Centro-Oeste 10.5 10.5 4.0 25.0Sudeste 30.7 100.0 10.3 141.0Sul 12.5 75.0 15.5 103.0
Fonte: Dados fictıcios.
Eufrasio de Andrade Lima Neto Calculo das Probabilidades e Estatıstica I
Conceitos FundamentaisTabelas e Graficos
Distribuicao de FrequenciaMedidas de Posicao
Medidas de Dispersao
Graficos Estatısticos
Eufrasio de Andrade Lima Neto Calculo das Probabilidades e Estatıstica I
Conceitos FundamentaisTabelas e Graficos
Distribuicao de FrequenciaMedidas de Posicao
Medidas de Dispersao
Graficos Estatısticos
Os Graficos representam a forma mais objetiva de se apresentar dados.
Todo grafico deve conter:
Tıtulo (fato, local e epoca);
Representacao e escala dos eixos das abscissas (X) e das ordenadas(Y);
Fonte;
Legenda (quando a serie for mista)
Importante: cuidado especial na construcao das escalas dos eixos X e Y.
Eufrasio de Andrade Lima Neto Calculo das Probabilidades e Estatıstica I
Conceitos FundamentaisTabelas e Graficos
Distribuicao de FrequenciaMedidas de Posicao
Medidas de Dispersao
Graficos Estatısticos
Tipos de Graficos:
Grafico de Linha: adequado aseries temporais;
Grafico deBarras/Colunas/Setores (Pizza):adequado a series geograficas ouespecıficas.
Eufrasio de Andrade Lima Neto Calculo das Probabilidades e Estatıstica I
Conceitos FundamentaisTabelas e Graficos
Distribuicao de FrequenciaMedidas de Posicao
Medidas de Dispersao
Distribuicao de Frequencia
Quando estamos interessados em estudar um conjunto de dados e defrequente interesse organizar toda a informacao adquirida, de modo afacilitar a analise.
Organizar as informacoes ira nos ajudar a escolher quais metodologiasinferenciais poderiam vir a resolver o problema em questao.
Uma forma de se fazer essa organizacao e atraves das chamadasdistribuicoes de frequencia, que sao o arranjo de valores, individuais ou porintervalo, e suas respectivas frequencias.
Eufrasio de Andrade Lima Neto Calculo das Probabilidades e Estatıstica I
Conceitos FundamentaisTabelas e Graficos
Distribuicao de FrequenciaMedidas de Posicao
Medidas de Dispersao
Distribuicao de Frequencia
A seguir algumas definicoes de frequencias necessarias apresentam-se logoabaixo:
1 Frequencia Absoluta (Fi): numero de observacoes pertencente ai-esima classe ou ao i-esimo valor;
2 Frequencia Relativa (fi): A frequencia relativa de uma classe ouvalor e dada por fi = Fi
n , onde n e o tamanho da amostra. firepresenta o percentual de uma classe ou de um certo valor naamostra;
3 Frequencia Acumulada Crescente (Fac): E a soma das frequenciassimples (absolutas ou relativas) das classes ou dos valores anteriores.
4 Frequencia Acumulada Decrescente (Fad): E a soma dasfrequencias simples a partir de uma determinada classe ou valorindividual.
Eufrasio de Andrade Lima Neto Calculo das Probabilidades e Estatıstica I
Conceitos FundamentaisTabelas e Graficos
Distribuicao de FrequenciaMedidas de Posicao
Medidas de Dispersao
Distribuicoes de Frequencia por Valor
Exemplo: A idade dos alunos do curso de Calculo das Probabilidade eEstatıstica I da UFPB estao apresentados abaixo.
Dados: 20 - 18 - 19 - 22 - 20 - 22 - 23 - 21 - 21 - 21.
Tabela: Distribuicao de frequencias das idades.Xi Fi fi Fac Fad18 1 0.1 1 1019 1 0.1 2 920 2 0.2 4 821 3 0.3 7 622 2 0.2 9 323 1 0.1 10 1
Total 10 1Fonte: Dados fictıcios.
Eufrasio de Andrade Lima Neto Calculo das Probabilidades e Estatıstica I
Conceitos FundamentaisTabelas e Graficos
Distribuicao de FrequenciaMedidas de Posicao
Medidas de Dispersao
Distribuicoes de Frequencia por Valor
Exercıcio: Considere o numero de homicıdios ocorridos na cidade de JoaoPessoa em alguns finais de semana no ano de 2016. Construa uma tabelacom a distribuicao de frequencia relativa (fi ), frequencia acumuladacrescente (Fac) e frequencia acumulada decrescente (Fad).
Tabela: Numero de homicıdios em alguns finais de semana na cidade deJoao Pessoa, 2016.
4 3 3 0 4 7 6 8 3 0 2 0 1 73 2 1 7 6 7 8 4 9 0 1 3 8 43 2 2 0 5 5 2 1 2 9 5 7 2 20 4 5 8 7 3 2 6 3 7 4 1 0 1
Fonte: Dados Fictıcios.
Eufrasio de Andrade Lima Neto Calculo das Probabilidades e Estatıstica I
Conceitos FundamentaisTabelas e Graficos
Distribuicao de FrequenciaMedidas de Posicao
Medidas de Dispersao
Distribuicoes de Frequencia por Valor
Observacao: Para dados de natureza discreta, podemos representargraficamente a distribuicao dos dados por meio do grafico de hastes.
Eufrasio de Andrade Lima Neto Calculo das Probabilidades e Estatıstica I
Conceitos FundamentaisTabelas e Graficos
Distribuicao de FrequenciaMedidas de Posicao
Medidas de Dispersao
Grafico de Hastes
voltarEufrasio de Andrade Lima Neto Calculo das Probabilidades e Estatıstica I
Conceitos FundamentaisTabelas e Graficos
Distribuicao de FrequenciaMedidas de Posicao
Medidas de Dispersao
Distribuicao de Frequencia por Intervalo
Ao contrario da distribuicao de frequencia por valor, a distribuicao defrequencia por intervalos e utilizada para dados de uma variavelcontınua. Os dados sao agrupados nas chamadas Classes de Frequencia.
Em situacoes em que temos dados discretos, tamanho de amostra grandee elevada amplitude (diferenca entre o menor e maior valor dos dados),estaremos interessados em resumir os dados em intervalos de classes.
Eufrasio de Andrade Lima Neto Calculo das Probabilidades e Estatıstica I
Conceitos FundamentaisTabelas e Graficos
Distribuicao de FrequenciaMedidas de Posicao
Medidas de Dispersao
Distribuicao de Frequencia por Intervalo
Entao posso formar os intervalos de classes da forma que eu acharconveniente?
Resposta: NAO. Existem regras simples que ajudam a escolher o numerode classes e suas amplitudes. Tais regas permitem que a perda deinformacao nao seja excessivamente grande. Construir classes de formasubjetiva podera fazer com que a tabela seja menos informativa ou mesmoatrapalhe o pesquisador com uma sumarizacao dos dados inconveniente.
Dessa forma, precisaremos de algumas definicoes para que por meio dosdados possamos decidir sobre o numero de classes e suas amplitudes. Taisdefinicoes seguem no proximo frame.
Eufrasio de Andrade Lima Neto Calculo das Probabilidades e Estatıstica I
Conceitos FundamentaisTabelas e Graficos
Distribuicao de FrequenciaMedidas de Posicao
Medidas de Dispersao
Distribuicao de Frequencia por Intervalo
Definicoes:
1 Rol: E o arranjo dos dados brutos em ordem crescente oudecrescente;
2 Amplitude Total: E a diferenca entre o maior valor e o menor valorobservado, e sera denotada por R;
3 Numero de classes: Representa o total de classes da variavel, e seradenotado por k;
4 Amplitude da classe: E a divisao inteira entre a amplitude total e onumero de classes e sera denotada por h, onde h = R
k ;
5 Ponto Medio: E a media aritmetica entre o limite superior, denotadopor Li , e o limite inferior, denotado por Ls . O ponto medio seradenotado por Pmi , onde Pmi = Li+Ls
2 .
Eufrasio de Andrade Lima Neto Calculo das Probabilidades e Estatıstica I
Conceitos FundamentaisTabelas e Graficos
Distribuicao de FrequenciaMedidas de Posicao
Medidas de Dispersao
Determinacao do numero de classes
Nao existe uma formula exata para o calculo do numero de classes. Seja no tamanho da amostra obtida. Existem duas alternativas possıveis:
1 Para n < 50, k ≈√n;
2 Para n ≥ 50, Formula de Sturges:
k ≈ 1 + 3.322 log n,
em que o logaritmo e na base 10.
Eufrasio de Andrade Lima Neto Calculo das Probabilidades e Estatıstica I
Conceitos FundamentaisTabelas e Graficos
Distribuicao de FrequenciaMedidas de Posicao
Medidas de Dispersao
Distribuicao de Frequencia por Intervalo
Exemplo: Temperaturas em graus Celsius da cidade de Joao Pessoa nos 30 dias
de um dado mes e ano.
32.50 24.02 27.67 28.53 24.74 31.42 32.30 29.95 28.00 31.3937.13 31.83 26.62 29.77 26.80 36.49 28.09 28.18 28.03 32.2525.13 24.08 31.12 30.75 35.73 24.40 24.01 27.58 29.55 25.45
Fonte: Dados fictıcios.
Eufrasio de Andrade Lima Neto Calculo das Probabilidades e Estatıstica I
Conceitos FundamentaisTabelas e Graficos
Distribuicao de FrequenciaMedidas de Posicao
Medidas de Dispersao
Determinacao do numero de classes
1o passo: Verificar o tamanho da amostra e a amplitude total. Temos quen = 30 e R = 37.13− 24.01 = 13.12.
2o passo: Para a obtencao do numero de classes, temos quek ≈√
30 ≈ 5.477 ≈ 6.
3o passo: Calcular a amplitude das classes porh ≈ R
k = 13.126 ≈ 2.187 ≈ 2.19.
4o passo: Montar a tabela de distribuicao de frequencia:
Eufrasio de Andrade Lima Neto Calculo das Probabilidades e Estatıstica I
Conceitos FundamentaisTabelas e Graficos
Distribuicao de FrequenciaMedidas de Posicao
Medidas de Dispersao
Determinacao do numero de classes
Teremos assim a tabela abaixo com as distribuicoes de frequencias porintervalos de classes para os dados em analise.
Tabela: Distribuicao de frequencia por intervalos de classes daTemperatura em Joao Pessoa.
Temperatura (Xi) Fi fi Fac Fad24.01 |− 26.20 7 0.23 7 3026.20 |− 28.39 8 0.27 15 2328.39 |− 30.58 4 0.13 19 1530.58 |− 32.77 8 0.27 27 1132.77 |− 34.96 0 0.00 27 334.96 |− 37.15 3 0.10 30 3
Total 30 1 - -Fonte: Dados Fictıcios.Eufrasio de Andrade Lima Neto Calculo das Probabilidades e Estatıstica I
Conceitos FundamentaisTabelas e Graficos
Distribuicao de FrequenciaMedidas de Posicao
Medidas de Dispersao
Histograma
Eufrasio de Andrade Lima Neto Calculo das Probabilidades e Estatıstica I
Conceitos FundamentaisTabelas e Graficos
Distribuicao de FrequenciaMedidas de Posicao
Medidas de Dispersao
Histograma
O uso do histograma facilita o entendimento do comportamento geral doconjunto de dados.
Muitas vezes e muito mais conveniente olhar para um histograma do quetentar observar uma tabela, principalmente em situacoes em que tamos nmuito grande.
O histograma fornece informacoes sobre a distribuicao dos dados. Dessaforma, por meio dele, e possıvel extrair informacoes empıricas sobre adispersao e tendencia central dos dados.
Eufrasio de Andrade Lima Neto Calculo das Probabilidades e Estatıstica I
Conceitos FundamentaisTabelas e Graficos
Distribuicao de FrequenciaMedidas de Posicao
Medidas de Dispersao
Histograma
Eufrasio de Andrade Lima Neto Calculo das Probabilidades e Estatıstica I
Conceitos FundamentaisTabelas e Graficos
Distribuicao de FrequenciaMedidas de Posicao
Medidas de Dispersao
Histograma
Muitas vezes e conveniente construir o histograma com base nadistribuicao da frequencia relativa fi .
Observacao: Ao construir um histograma com os valores de fi , temos queo produto entre a base e altura de cada retangulo forneceaproximadamente a probabilidade de se observar uma informacao narespectiva classe do retangulo.
Exemplo: Agora, vamos construir um histograma para os dados deTemperatura em Joao Pessoa.
Eufrasio de Andrade Lima Neto Calculo das Probabilidades e Estatıstica I
Conceitos FundamentaisTabelas e Graficos
Distribuicao de FrequenciaMedidas de Posicao
Medidas de Dispersao
Medidas de Posicao
Os resumos visuais de dados sao excelentes ferramentas para obterimpressoes e ideias iniciais.
A partir dos dados tentamos extrair diversas medidas que servem paracaracterizar o conjunto de dados e indicar informacoes que, embora sejamsuperficiais, devem levadas em consideracao.
As Medidas de Posicao recebem tal denominacao pelo fato dos dadosobservados tenderem, em geral, a se concentrar em torno de valorescentrais.
Eufrasio de Andrade Lima Neto Calculo das Probabilidades e Estatıstica I
Conceitos FundamentaisTabelas e Graficos
Distribuicao de FrequenciaMedidas de Posicao
Medidas de Dispersao
Media Amostral
Definicao
Sejam x1, . . . , xn as medidas da variavel de interesse, observadas em umaamostra de tamanho n. Definimos a media amostral, denotada por x ,desta sequencia de dados por:
x =x1 + x2 + . . .+ xn
n=
∑ni=1 xin
,
em que n e o tamanho da amostra.
Eufrasio de Andrade Lima Neto Calculo das Probabilidades e Estatıstica I
Conceitos FundamentaisTabelas e Graficos
Distribuicao de FrequenciaMedidas de Posicao
Medidas de Dispersao
Media
E se os dados estao agrupados em intervalos de classes?
Resposta: Nessa situacao, ponderamos o ponto medio do intervalo declasse com a frequencia absoluta Fi .
Eufrasio de Andrade Lima Neto Calculo das Probabilidades e Estatıstica I
Conceitos FundamentaisTabelas e Graficos
Distribuicao de FrequenciaMedidas de Posicao
Medidas de Dispersao
Media
Exemplo: Alturas de alunos da disciplina CPE I.
Altura (Xi) Fi fi Fac Fad
1.55 |− 1.60 4 0.13 4 301.60 |− 1.65 5 0.17 9 261.65 |− 1.70 5 0.17 14 211.70 |− 1.75 7 0.23 21 161.75 |− 1.80 7 0.23 28 91.80 |− 1.85 2 0.07 30 2
Total 30 1
Fonte: Dados fictıcios.
Eufrasio de Andrade Lima Neto Calculo das Probabilidades e Estatıstica I
Conceitos FundamentaisTabelas e Graficos
Distribuicao de FrequenciaMedidas de Posicao
Medidas de Dispersao
Media
Para calcular a media das alturas, devemos obter o ponto medio de cadaum dos 6 intervalos de classes Pmi , isto e, basta somar o limite inferir como limite superior do intervalo de classe e dividir por 2. Assim,
Exemplo: Alturas de alunos da disciplina CPE I.
Altura (Xi) Pmi Fi fi Fac Fad
1.55 |− 1.60 1.575 4 0.13 4 301.60 |− 1.65 1.625 5 0.17 9 261.65 |− 1.70 1.675 5 0.17 14 211.70 |− 1.75 1.725 7 0.23 21 161.75 |− 1.80 1.775 7 0.23 28 91.80 |− 1.85 1.825 2 0.07 30 2
Total 30 1
Fonte: Dados fictıcios.
Eufrasio de Andrade Lima Neto Calculo das Probabilidades e Estatıstica I
Conceitos FundamentaisTabelas e Graficos
Distribuicao de FrequenciaMedidas de Posicao
Medidas de Dispersao
Media
Assim, uma estimativa para x (media amostral) e dada por
x =
∑ki=1 Fi × Pmi
n.
Logo, tem-se que no exemplo acima,
x =
∑6i=1 FiPmi
30=
4× 1.575 + 5× 1.625 + · · ·+ 2× 1.825
30≈ 1.7.
Eufrasio de Andrade Lima Neto Calculo das Probabilidades e Estatıstica I
Conceitos FundamentaisTabelas e Graficos
Distribuicao de FrequenciaMedidas de Posicao
Medidas de Dispersao
Mediana
A palavra “mediana” tem sinonimo de “metade” e a mediana amostrale o valor que divide ao meio as observacoes, quando ordenadas da menorpara maior.
Notacao: Seja x(1), . . . , x(n) uma sequencia ordenada de observacoes.Denotamos a mediana da sequencia de observacoes por x ou Md .
Definicao
A mediana amostral e obtida pela ordenacao das n observacoes da menorpara a maior (com valores repetidos incluıdos), de forma que cadaobservacao da amostra seja exibida na lista). Assim, temos que:
Eufrasio de Andrade Lima Neto Calculo das Probabilidades e Estatıstica I
Conceitos FundamentaisTabelas e Graficos
Distribuicao de FrequenciaMedidas de Posicao
Medidas de Dispersao
Mediana
Definicao
Para n ımpar: x = x( n+12 ), isto e, x sera o valor na posicao n+1
2 do
vetor de observacoes ordenado (x(1) ≤ x(2) ≤ . . . ≤ x(n)).
Para n par: x =x( n
2 )+x( n2 +1)
2 , isto e, x sera a media dos valores nasposicoes n
2 e n2 + 1 do vetor de observacoes ordenado
(x(1) ≤ x(2) ≤ . . . ≤ x(n)).
Observacao: Na verdade o ordenamento podera ser feito de formacrescente ou decrescente. Em qualquer um dos casos, a mediana nao iramudar.
Eufrasio de Andrade Lima Neto Calculo das Probabilidades e Estatıstica I
Conceitos FundamentaisTabelas e Graficos
Distribuicao de FrequenciaMedidas de Posicao
Medidas de Dispersao
Mediana
Importante
A mediana e uma medida de posicao muito importante pois ela nao einfluenciada por valores extremos. Ao contrario da mediana, temos quea media e bastante influenciada por valores extremos.
Exercıcio: Suponha que um grupo de estudantes resolveram selecionar aoacaso pessoas que trafegavam dentro da UFPB e que foram obtidasinformacoes sobre a renda dessas pessoas em salarios mınimos. As rendassao: x1 = 10, x2 = 8, x3 = 9, x4 = 8, x5 = 7, x6 = 8, x7 = 9, x8 = 10,x9 = 5, x10 = 12, x11 = 15, x12 = 8, x13 = 6, x14 = 13, x15 = 14,x16 = 60. Calcule a media amostral e mediana amostral. Qual das duasmedidas de posicao e mais coerente?
Eufrasio de Andrade Lima Neto Calculo das Probabilidades e Estatıstica I
Conceitos FundamentaisTabelas e Graficos
Distribuicao de FrequenciaMedidas de Posicao
Medidas de Dispersao
Vantagens e Desvantagens da Mediana
Vantagens:
1 A mediana nao e influenciada por valores extremos (pequenos demaisou grandes demais) de uma serie ou conjunto de dados;
2 A mediana e utilizada especialmente para distribuicoes assimetricas,mas podera ser utilizada tambem para dados com distribuicaosimetrica.
Desvantagens:
1 Suas propriedades nao sao bem compreendidas por muitas pessoas;
2 Nao e levada em consideracao na maior parte dos testes estatısticos.
Eufrasio de Andrade Lima Neto Calculo das Probabilidades e Estatıstica I
Conceitos FundamentaisTabelas e Graficos
Distribuicao de FrequenciaMedidas de Posicao
Medidas de Dispersao
Mediana para Dados Agrupados
Para as situacoes em que os dados estao apresentados por uma distribuicaode frequencia por intervalos, o calculo de x (mediana amostral) e dado por:
x = lMd +
(n2 − Facant
)h
FMd, em que
lMd e o limite inferior da classe que contem a mediana;
Facant e frequencia acumulada crescente anterior a classe que contema mediana;
h e a amplitude da classe que contem a mediana;
FMd e a frequencia da classe que contem a mediana.
Observacao: A classe que contem a mediana e a primeira classe quecontem o valor n
2 (observando a frequencia Fac).
Eufrasio de Andrade Lima Neto Calculo das Probabilidades e Estatıstica I
Conceitos FundamentaisTabelas e Graficos
Distribuicao de FrequenciaMedidas de Posicao
Medidas de Dispersao
Mediana para Dados Agrupados
Exemplo: Consideramos novamente a altura dos alunos. Com base nadistribuicao de frequencia abaixo, calcule a altura mediana.
Exemplo: Alturas de alunos da disciplina CPE I.
Altura (Xi) Fi fi Fac Fad
1.55 |− 1.60 4 0.13 4 301.60 |− 1.65 5 0.17 9 261.65 |− 1.70 5 0.17 14 211.70 |− 1.75 7 0.23 21 161.75 |− 1.80 7 0.23 28 91.80 |− 1.85 2 0.07 30 2
Total 30 1
Fonte: Dados fictıcios.
Eufrasio de Andrade Lima Neto Calculo das Probabilidades e Estatıstica I
Conceitos FundamentaisTabelas e Graficos
Distribuicao de FrequenciaMedidas de Posicao
Medidas de Dispersao
Medidas de Posicao
Exercıcio: Em uma determinada empresa da cidade de Joao Pessoa - PBforam selecionados ao acaso 40 funcionarios para serem submetidos a umteste de desempenho com notas de 0 a 100. As notas das avaliacoesrealizadas encontram-se abaixo. Construa uma tabela de distribuicao defrequencias para os dados abaixo. Calcule a media e a mediana amostralpara os dados brutos. Depois calcule a media e a mediana amostralutilizando a distribuicao de frequencia por intervalos de classes.
Eufrasio de Andrade Lima Neto Calculo das Probabilidades e Estatıstica I
Conceitos FundamentaisTabelas e Graficos
Distribuicao de FrequenciaMedidas de Posicao
Medidas de Dispersao
Medidas de Posicao
Tabela: Notas de 40 funcionarios em um teste de avaliacao de desempenho.
68 72 72 41 93 68 72 58 64 6265 70 60 52 74 59 66 83 70 4560 81 71 67 72 84 53 73 90 2767 68 83 75 65 58 77 60 100 53
Fonte: Dados fictıcios.
Eufrasio de Andrade Lima Neto Calculo das Probabilidades e Estatıstica I
Conceitos FundamentaisTabelas e Graficos
Distribuicao de FrequenciaMedidas de Posicao
Medidas de Dispersao
Moda
A moda refere-se ao valor mais frequente na distribuicao de valores e edenotada por Mo .
Para dados nao agrupados:
1 Se todos os dados apresentam a mesma frequencia, dizemos que naoha moda, ou seja, a distribuicao dos dados e amodal;
2 Se dois valores (os mais frequentes) ocorrem com a mesmafrequencia, dizemos que a distribuicao dos dados e bimodal;
3 Se mais de dois valores (os mais frequentes) ocorrem com a mesmafrequencia, dizemos que a distribuicao e multimodal.
Observacao: Assim como a media e mediana, a moda tambem e umamedida de tendencia central (medida de posicao) muito utilizada paradescrever a distribuicao dos dados.
Eufrasio de Andrade Lima Neto Calculo das Probabilidades e Estatıstica I
Conceitos FundamentaisTabelas e Graficos
Distribuicao de FrequenciaMedidas de Posicao
Medidas de Dispersao
Moda
Exemplo: Um Instituto realizou uma pesquisa para saber o numero decarros nas garagens das famılias de 10 entrevistados selecionadosaleatoriamente. Os valores foram: 0, 0, 1, 1, 1, 1, 2, 2, 3, 4. Nesse caso,tem-se que Mo = 1 (distribuicao unimodal).
Exemplo: Suponhamos o mesmo exemplo logo acima com as seguintesinformacoes: 0, 0, 0, 0, 1, 1, 1, 1, 2, 3. Nesse caso, temos umadistribuicao bimodal, em que Mo = 0 e 1.
Observacao: Aqui trataremos de moda para dados discretos.
Eufrasio de Andrade Lima Neto Calculo das Probabilidades e Estatıstica I
Conceitos FundamentaisTabelas e Graficos
Distribuicao de FrequenciaMedidas de Posicao
Medidas de Dispersao
Moda para Dados Agrupados
Uma forma de obtencao da moda para dados agrupados e dada pelaformula de Czuber:
MO = lMO+
∆1
∆1 + ∆2h, em que:
lMOe o limite inferior da classe que contem a moda;
∆1 e a diferenca entre a frequencia da classe que contem a moda e aclasse anterior;
∆2 e a diferenca entre a frequencia da classe que contem a moda e aclasse posterior;
h e a amplitude da classe que contem a moda.
Observacao: A classe modal (classe que contem a moda) e definida pelaprimeira classe com maior frequencia.
Eufrasio de Andrade Lima Neto Calculo das Probabilidades e Estatıstica I
Conceitos FundamentaisTabelas e Graficos
Distribuicao de FrequenciaMedidas de Posicao
Medidas de Dispersao
Moda para Dados Agrupados
Exemplo: Para a tabela abaixo, obtenha a moda pela formula de Czuber.
Exemplo: Alturas de alunos da disciplina CPE I.
Altura (Xi) Fi fi Fac Fad
1.55 |− 1.60 4 0.13 4 301.60 |− 1.65 5 0.17 9 261.65 |− 1.70 5 0.17 14 211.70 |− 1.75 7 0.23 21 161.75 |− 1.80 7 0.23 28 91.80 |− 1.85 2 0.07 30 2
Total 30 1
Fonte: Dados Fictıcios.
Eufrasio de Andrade Lima Neto Calculo das Probabilidades e Estatıstica I
Conceitos FundamentaisTabelas e Graficos
Distribuicao de FrequenciaMedidas de Posicao
Medidas de Dispersao
Moda para Dados Agrupados
Exercıcio: Para os dados dispostos na tabela abaixo, obtenha a moda.
Tabela: Numero de acidentes de transito, por cidade, Jan-16.
4 3 3 0 4 7 6 8 3 0 2 0 1 73 2 1 7 6 7 8 4 9 0 1 3 8 43 2 2 0 5 5 2 1 2 9 5 7 2 20 4 5 8 7 3 2 6 3 7 4 1 0 1
Fonte: Dados Fictıcios.
Eufrasio de Andrade Lima Neto Calculo das Probabilidades e Estatıstica I
Conceitos FundamentaisTabelas e Graficos
Distribuicao de FrequenciaMedidas de Posicao
Medidas de Dispersao
Medidas de Assimetria
As medidas de assimetria medem o grau de afastamento da distribuicaoem torno da media.
Eufrasio de Andrade Lima Neto Calculo das Probabilidades e Estatıstica I
Conceitos FundamentaisTabelas e Graficos
Distribuicao de FrequenciaMedidas de Posicao
Medidas de Dispersao
Medidas de Assimetria
Observacao: Em virtude da assimetria dos dados, a media amostral podeser bastante afetada de modo que seu valor nao represente bem os dados.Neste casos, medidas como a Mediana e a Moda podem produzir melhorresultados.
Eufrasio de Andrade Lima Neto Calculo das Probabilidades e Estatıstica I
Conceitos FundamentaisTabelas e Graficos
Distribuicao de FrequenciaMedidas de Posicao
Medidas de Dispersao
Medidas de Dispersao
As medidas de posicao apresentadas fornecem a informacao dos dadosapenas a nıvel pontual, sem ilustrar outros aspectos referentes a formacomo os dados estao distribuıdos na amostra.
Exemplo: Notas de tres turmas da 8a serie de uma determinada escola
Note queX turma 1 = 6; X turma 2 = 6; X turma 3 = 6
Eufrasio de Andrade Lima Neto Calculo das Probabilidades e Estatıstica I
Conceitos FundamentaisTabelas e Graficos
Distribuicao de FrequenciaMedidas de Posicao
Medidas de Dispersao
Amplitude
Uma forma simples de medir a dispersao e atraves da amplitude:
h = max(X1,X2, . . . ,Xn)−min(X1,X2, . . . ,Xn)
A utilizacao da amplitude como medida de dispersao e limitada, poisdepende apenas dos valores extremos das observacoes.
Eufrasio de Andrade Lima Neto Calculo das Probabilidades e Estatıstica I
Conceitos FundamentaisTabelas e Graficos
Distribuicao de FrequenciaMedidas de Posicao
Medidas de Dispersao
Variancia
A variancia e definida como a media aritmetica do quadrado dos desviosdefinidos por Xi − X . Dessa forma,
Para dados nao agrupados:
σ2 =
n∑i=1
(Xi − µ)2
nComo na pratica nao conhecemos toda a populacao. Logo, utilizamos avariancia amostral, dada por:
S2 =
n∑i=1
(Xi − X )2
n − 1
Eufrasio de Andrade Lima Neto Calculo das Probabilidades e Estatıstica I
Conceitos FundamentaisTabelas e Graficos
Distribuicao de FrequenciaMedidas de Posicao
Medidas de Dispersao
Variancia
Variancia para dados agrupados em intervalos:
σ2 =
k∑i=1
(Pmi − µ)2Fi
n,
Quando nao conhecemos toda a populacao, a variancia amostral nestecaso e dada por:
S2 =
k∑i=1
(Pmi − X )2Fi
n − 1
Aqui, Fi corresponde a frequencia absoluta da classe i , Pmi correspondeao ponto medio de cada classe i e k e o numero de classes.
Eufrasio de Andrade Lima Neto Calculo das Probabilidades e Estatıstica I
Conceitos FundamentaisTabelas e Graficos
Distribuicao de FrequenciaMedidas de Posicao
Medidas de Dispersao
Variancia
Exemplo: Calcule a variancia (S2) das alturas cuja distribuicao dasfrequencias por intervalos apresentam-se na tabela abaixo.
Exemplo: Alturas de alunos da disciplina CPE I.
Altura (Xi) Pi Fi fi Fac Fad
1.55 |− 1.60 1.575 4 0.13 4 301.60 |− 1.65 1.625 5 0.17 9 261.65 |− 1.70 1.675 5 0.17 14 211.70 |− 1.75 1.725 7 0.23 21 161.75 |− 1.80 1.775 7 0.23 28 91.80 |− 1.85 1.825 2 0.07 30 2
Total 30 1
Fonte: Dados fictıcios.
Eufrasio de Andrade Lima Neto Calculo das Probabilidades e Estatıstica I
Conceitos FundamentaisTabelas e Graficos
Distribuicao de FrequenciaMedidas de Posicao
Medidas de Dispersao
Desvio Padrao
O desvio padrao e outra medida do grau de variabilidade da variavel.Neste caso, esta medida possui a mesma unidade da variavel. O desviopadrao e definido como
σ =√σ2 (Desvio Padrao Populacional)
S =√S2 (Desvio Padrao Amostral)
Observacao: Na pratica, e muito comum nao conhecermos a varianciapopulacional σ2. Nesses casos, precisamos de uma estimativa de σ2 que eS2.
Importante: Ao contrario da Variancia, o Desvio-Padrao encontra-se namesma unidade de medida da Media.
Eufrasio de Andrade Lima Neto Calculo das Probabilidades e Estatıstica I
Conceitos FundamentaisTabelas e Graficos
Distribuicao de FrequenciaMedidas de Posicao
Medidas de Dispersao
Coeficiente de Variacao
Embora o desvio padrao seja a medida mais usada, ele mede a dispersaoem termos absolutos.
O coeficiente de variacao mede a dispersao em termos relativos, sendo edefinido por
C .V .(X ) =σ
µ(populacional)
c .v .(x) =S
X(amostral)
Exemplo:
Valores X S c .v .(X )
1 - 2 - 3 2 1 0.5100 - 200 - 300 200 100 0.5
Eufrasio de Andrade Lima Neto Calculo das Probabilidades e Estatıstica I
Conceitos FundamentaisTabelas e Graficos
Distribuicao de FrequenciaMedidas de Posicao
Medidas de Dispersao
FIM
Eufrasio de Andrade Lima Neto Calculo das Probabilidades e Estatıstica I