110
UNIVERSIDADE CENTRO D DEPA Esta a Prof. Msc. André L andreroch E FEDERAL DO RIO GRANDE DO N DE CIÊNCIAS EXATAS E DA TERR ARTAMENTO DE ESTATÍSTICA atística Aplicada Engenharia I Luiz Sena da Rocha [email protected] Natal / RN NORTE RA a

[Apostila] Estatística Aplicada a Engenharia I

Embed Size (px)

Citation preview

Page 1: [Apostila] Estatística Aplicada a Engenharia I

UNIVERSIDADE FEDERAL DO RIO GRANDE DO NORTE

CENTRO DE CIÊNCIAS EXATAS E DA TERRA

DEPARTAMENTO DE ESTATÍSTICA

Estatística Aplicada

a Engenharia I

Prof. Msc. André Luiz Sena da Rocha

[email protected]

UNIVERSIDADE FEDERAL DO RIO GRANDE DO NORTE

CENTRO DE CIÊNCIAS EXATAS E DA TERRA

DEPARTAMENTO DE ESTATÍSTICA

Estatística Aplicada

a Engenharia I

Prof. Msc. André Luiz Sena da Rocha

[email protected]

Natal / RN

UNIVERSIDADE FEDERAL DO RIO GRANDE DO NORTE

CENTRO DE CIÊNCIAS EXATAS E DA TERRA

Estatística Aplicada

Page 2: [Apostila] Estatística Aplicada a Engenharia I

ÍNDICE

UNIDADE I - ESTATÍSTICA DESCRITIVA ......................................................... 1

1.1 - NATUREZA E CAMPO DA ESTATÍSTICA ................................................................................................................. 1

1.2 - O MÉTODO ESTATÍSTICO ..................................................................................................................................... 1

1.3 - POPULAÇÃO, AMOSTRA E TIPOS DE VARIÁVEIS .................................................................................................. 2

1.4 - REPRESENTAÇÃO TABULAR .................................................................................................................................. 7

1.4.1 - Distribuição de Frequências ........................................................................................................................... 8

1.5 - REPRESENTAÇÃO GRÁFICA ....................................................................................................................... 16

1.5.1 - Gráfico de Setores ........................................................................................................................................ 16

1.5.2 - Gráfico de Colunas e Barras ........................................................................................................................ 17

1.5.3 - Histograma e Polígono de Frequências ........................................................................................................ 18

1.6 – MEDIDAS DE TENDÊNCIA CENTRAL................................................................................................................... 20

1.6.1 - Média Aritmética ......................................................................................................................................... 21

1.6.2 – Mediana ....................................................................................................................................................... 23

1.6.3 - Moda ............................................................................................................................................................ 27

1.6.4 – Separatrizes ................................................................................................................................................. 30

1.7 - MEDIDAS DE DISPERSÃO .................................................................................................................................... 32

1.7.1 – Variância ..................................................................................................................................................... 34

1.7.2 - Desvio Padrão .............................................................................................................................................. 36

1.7.3 - Coeficiente de Variação ............................................................................................................................... 38

1.8 - ANÁLISE EXPLORATÓRIA DE DADOS .................................................................................................................. 39

1.8.1 - Esquema dos 5-Números ............................................................................................................................. 39

1.8.2 - Box-Plot ....................................................................................................................................................... 40

UNIDADE II - PROBABILIDADE ......................................................................... 43

2.1 - EXPERIMENTOS ALEATÓRIOS ............................................................................................................................. 43

2.2 - ESPAÇO AMOSTRAL ............................................................................................................................................ 44

2.3 - EVENTOS .............................................................................................................................................................. 44

2.4 - RESULTADOS EQUIPROVÁVEIS ........................................................................................................................... 47

2.5 – DEFINIÇÕES DE PROBABILIDADE ....................................................................................................................... 48

2.6 - PROBABILIDADE CONDICIONAL ......................................................................................................................... 50

2.7 - EVENTOS INDEPENDENTES .................................................................................................................................. 53

2.8 – VARIÁVEL ALEATÓRIA UNIDIMENSIONAL ........................................................................................................ 54

2.9 - MODELOS DE PROBABILIDADE DISCRETOS ....................................................................................................... 55

2.9.1 - Distribuição de Bernoulli ............................................................................................................................. 55

2.9.2 - Distribuição Binomial .................................................................................................................................. 57

2.9.3 - Distribuição de Poisson ................................................................................................................................ 61

Page 3: [Apostila] Estatística Aplicada a Engenharia I

2.10 - PRINCIPAIS DISTRIBUIÇÕES CONTÍNUAS ......................................................................................................... 63

2.10.1 - Distribuição Uniforme ............................................................................................................................... 63

2.10.2 - Distribuição Exponencial ........................................................................................................................... 64

2.10.3 – Distribuição Normal .................................................................................................................................. 64

2.10.4 - Distribuição t de Student ............................................................................................................................ 73

UNIDADE III - INFERÊNCIA ESTATÍSTICA .................................................... 76

4.1 - DISTRIBUIÇÃO AMOSTRAL DA MÉDIA E DA PROPORÇÃO .................................................................................. 78

4.1.1 – Distribuição Amostral da Média ................................................................................................................. 78

4.1.2 – Distribuição Amostral da Proporção ........................................................................................................... 79

4.2 - ESTIMAÇÃO POR PONTO E INTERVALO ............................................................................................................... 80

4.2.1 - Estimação Pontual ........................................................................................................................................ 80

4.2.2 - Estimação Intervalar .................................................................................................................................... 80

4.2.2.1- Intervalo de confiança para a média ........................................................................................................................ 82

4.2.2.2 - Intervalo de confiança para a proporção ................................................................................................................ 86

4.3 - TESTES DE HIPÓTESES ........................................................................................................................................ 87

4.3.1 - Teste para a Média quando σ2 é conhecido .................................................................................................. 90

4.3.2 - Teste para a Média quando σ2 é desconhecido............................................................................................. 95

4.3.3 - Teste para Proporções .................................................................................................................................. 99

4.3.4 - Valor-P ...................................................................................................................................................... 101

REFERÊNCIAS

ANEXOS

ANEXO A - DISTRIBUIÇÃO NORMAL PADRÃO

TABELA B - DISTRIBUIÇÃO T DE STUDENT

Page 4: [Apostila] Estatística Aplicada a Engenharia I

EST0323– Estatística Aplicada a Engenharia I – Prof. Msc. André Luiz Sena da Rocha

[email protected]

1

UNIDADE I

ESTATÍSTICA DESCRITIVA

1.1 - Natureza e Campo da Estatística

Estatística é a ciência que diz respeito à coleta, apresentação e análise de dados quantitativos, de tal

forma que seja possível efetuar julgamentos sobre os mesmos.

Ramos da Estatística:

a) Estatística descritiva → trata da observação de fenômenos de mesma natureza, da coleta de

dados numéricos referentes a esses fenômenos, da sua organização e classificação através de

tabelas e gráficos, bem como da análise e interpretação.

b) Probabilidade estatística → utilizada para analisar situações que envolvem o acaso

(aleatoriedade).

c) Inferência estatística → estuda as características de uma população com base em dados

obtidos de amostras.

OBS: Estatística Indutiva pode ser denominada como inferência. Portanto, a estatística indutiva

estuda as características de uma população, com base em dados obtidos de amostras.

Inferência = Indução + Margem de Erro

1.2 - O Método Estatístico

A realização de uma pesquisa deve passar, necessariamente pelas fases apresentadas abaixo:

Coletas

dos

Dados

Definição

do

problema

Planejamento

Crítica

dos

Dados

Apresentação

dos dados Tabelas e Gráficos

Análise e interpretação

dos dados

→→→→ →→→→ →→→→

→→→→ →→→→

Page 5: [Apostila] Estatística Aplicada a Engenharia I

EST0323– Estatística Aplicada a Engenharia I – Prof. Msc. André Luiz Sena da Rocha

[email protected]

2

1) Definição do problema →→→→ Saber exatamente o que se pretende pesquisar, ou seja, definir

corretamente o problema.

2) Planejamento →→→→ determinar o procedimento necessário para resolver o problema, como

levantar informações sobre o assunto objeto do estudo. É importante a escolha das perguntas em

um questionário, que na medida do possível, devem ser fechadas.

O levantamento de dados pode ser de dois tipos: Censitário e Amostragem.

Outros elementos do planejamento de uma pesquisa são:

• Cronograma das atividades;

• Custos envolvidos;

• Exame das informações disponíveis;

• Delineamento da amostra.

3) Coleta de Dados →→→→ consiste na busca ou compilação dos dados. Pode ser classificado,

quanto ao tempo em:

• Contínua (inflação, desemprego, etc);

• Periódica (Censo);

• Ocasional (pesquisa de mercado, eleitoral)

4) Crítica dos dados →→→→ objetiva a eliminação de erros capazes de provocar futuros enganos.

Faz-se uma revisão crítica dos dados suprimindo os valores estranhos ao levantamento.

5) Apresentação dos dados →→→→ a organização dos dados denomina-se “Série Estatística”. Sua

apresentação pode ocorrer por meio de tabelas e gráficos.

6) Análise e Interpretação dos Dados →→→→ consiste em tirar conclusões que auxiliem o

pesquisador a resolver seu problema, descrevendo o fenômeno através do cálculo de medidas

estatísticas, especialmente as de posição e as de dispersão.

1.3 - População, Amostra e Tipos de Variáveis

Inferência Obtenção de resultados para uma população com base em observações

Estatística extraídas a partir de uma amostra retirada desta população.

Page 6: [Apostila] Estatística Aplicada a Engenharia I

EST0323– Estatística Aplicada a Engenharia I – Prof. Msc. André Luiz Sena da Rocha

[email protected]

3

POPULAÇÃO:

É o conjunto de elementos (na totalidade) que têm, em comum, uma determinada

característica. Pode ser finita, como o conjunto de alunos de uma determinada escola, ou infinita,

como o número de vezes que se pode jogar um dado.

AMOSTRA:

É qualquer subconjunto da população. A técnica de seleção desse subconjunto de elementos

é chamada de Amostragem.

Como já vimos, a inferência estatística tem como objetivo a estimação de parâmetros para uma

população tendo como base às informações extraídas através de uma amostra. Neste contexto, o

estudo dos mais diversos tipos de procedimentos de amostragem se faz necessário.

Exercício 1.1: Dentre os 3000 alunos de uma escola, selecionaram-se 30 e inquiriram-se sobre o

programa de televisão preferido. Sendo respondidos como programas preferidos “Telejornal”,

“Novelas” e “Cinema”, com 10, 12 e 8 alunos, respectivamente. Responda:

a) a população;

b) a amostra.

Exercício 1.2: Para saber a aceitação de uma nova ração canina para filhotes de médio porte, uma

empresa selecionou 200 filhotes com até 6 meses de idade de diversas raças de médio portem, e

contabilizou a engorda deles.

Indique:

a) a população;

b) a amostra;

Exercício 1.3: Para realizar um estudo sobre o tempo gasto, em segundos, por 100 atletas na corrida

dos 100 metros com obstáculos, registrou-se o tempo gasto por 16 desses atletas e obtiveram-se os

seguintes resultados:

Indique:

a) a população;

b) a amostra;

Page 7: [Apostila] Estatística Aplicada a Engenharia I

EST0323– Estatística Aplicada a Engenharia I – Prof. Msc. André Luiz Sena da Rocha

[email protected]

4

Exercício 1.4: Um aluno da UFMG do curso de “Cinema de Animação e Artes Digitais ” realizou

um sorteio dentre todas as fitas de VHS da biblioteca de sua Universidade, de 8 fitas para seu

Trabalho de Conclusão de Curso.

a) a população;

b) a amostra;

Exercício 1.5: Um aluno de Biblioteconomia da UFRN está fazendo um levantamento de todas as

Dissertações do curso de História, Geografia e Pedagogia, defendidas a partir do ano de 2000 e que

estão cadastradas no banco de dados da Biblioteca Zila Mamede. Dentre elas eles selecionou 10 de

cada curso e contabilizou as datas de defesa..

a) a população;

b) a amostra;

As técnicas de amostragem podem ser classificadas em dois grandes grupos: a amostragem

probabilística e a amostragem não probabilística.

1. Amostragem Probabilística: neste grupo encontram-se os planos amostrais que utilizam

mecanismos aleatórios de seleção dos elementos da amostra, atribuindo a cada um deles

uma probabilidade, conhecida à priori, de pertencer à amostra.

2. Amostragem Não Probabilística: neste grupo encontram-se os planos amostrais que não

utilizam mecanismos aleatórios de seleção dos elementos da amostra, e dessa forma, não

existe nenhuma probabilidade associada à seleção desses elementos.

Ambos os procedimentos têm vantagens e desvantagens. A grande vantagem das amostras

probabilísticas é medir a precisão da amostra obtida. Tais medidas já são bem mais difíceis para os

procedimentos do outro grupo. Diante disso, amostras probabilísticas são comumente utilizadas na

prática. Os tipos de planos de amostragem probabilísticos são os seguintes:

• Amostragem Aleatória Simples: cada elemento da população tem a mesma chance (ou

probabilidade) de ser selecionado. Os elementos são escolhidos através de sorteio. Para isso,

tabelas de números aleatórios são frequentemente utilizadas. Por exemplo, selecionar 5

alunos de uma turma usando a lista de chamada.

Page 8: [Apostila] Estatística Aplicada a Engenharia I

EST0323– Estatística Aplicada a Engenharia I – Prof. Msc. André Luiz Sena da Rocha

[email protected]

5

• Amostragem Estratificada: a população é dividida em estratos (ou grupos) homogêneos,

sendo selecionada uma amostra aleatória simples de cada estrato. Por exemplo, selecionar

alunos de 5ª a 8ª série de uma determinada escola. Neste caso, cada série corresponde a um

estrato, e de cada estrato uma amostra aleatória simples dos alunos é extraída, lembrando

que pra tanto seria necessário sorteio a partir da lista de chamada também.

• Amostragem Sistemática: os elementos são selecionados segundo uma regra pré-definida.

É bastante utilizada quando os elementos da população estão arranjados em uma ordem. Por

exemplo, se em uma concessionária deseja-se estimar o preço total dos seus carros a partir

de uma amostra de 10 carros selecionar possuindo para tanto uma lista dos carros em ordem

de preço do maior para o menor, ou do menor para o maior. Uma observação importante é

que, por exemplo, se os elementos escolhidos estiverem em ordem não se deve pegar os

primeiros elementos, ou os últimos, ou os do meios, deve-se percorrer elementos de cada

parte.

Exercício 1.6: Para cada uma das seguintes situações diga qual o tipo de amostragem foi utilizada.

− O conselho universitário de uma universidade deseja conhecer a opinião dos alunos e

professores sobre uma resolução a ser votada, que estabelece horários fixos para o

atendimento de alunos pelos professores. Para compor a amostra foram sorteados

aleatoriamente 10% dos alunos matriculados e 10% dos professores.

− Um treinador de uma confederação esportiva deseja dividir 20 times em dois grupos. Para o

primeiro grupo seleciona aleatoriamente 10 times, e considera os 10 restantes para o segundo

grupo.

− Uma lista de corredores de uma maratona contém 1000 nomes, numerados consecutivamente

de 1 a 1000. Iniciando-se do 5º nome, uma amostra foi composta considerando sorteados os

nomes referentes aos números 15º, 25º, 35º, 45º, 55º e assim sucessivamente até que fossem

escolhidos 100 nomes.

− Um sociólogo na Universidade de Charleston seleciona 12 homens e 12 mulheres de cada

uma de quatro turmas de educação física.

Page 9: [Apostila] Estatística Aplicada a Engenharia I

EST0323– Estatística Aplicada a Engenharia I – Prof. Msc. André Luiz Sena da Rocha

[email protected]

6

− Um treinador sorteia 6 jogadores de seu time de futebol sem mais critério s de seleção e tira

uma amostra de urina de cada um.

− O programa Planned Parenthood (Planejamento Familiar) pesquisa 500 homens e 5000

mulheres sobre seus pontos de vista sobre o uso de anticoncepcionais.

TIPOS DE VARIÁVEIS:

É condição inerente a uma população natural existir variação quanto aos atributos que lhe podem

ser estudados. Portanto, a variabilidade é uma característica comum aos dados de observação e

experimentos. Um atributo sujeito à variação é descrito em Estatística por uma variável.

Nominal

Qualitativa

Ordinal

Variável

Discreta

Quantitativa

Contínua

Variável Qualitativa: os dados podem ser distribuídos em categorias mutuamente exclusivas. Por

exemplo, sexo (masculino, feminino), cor, causa de morte, grupo sanguíneo, etc.

- Nominal: as categorias podem ser permutáveis (não existe ordem natural dos seus níveis);

Exemplo: [masculino, feminino], [sim, não], [fuma, não fuma];

- Ordinal: as categorias descrevem uma ordenação natural dos seus níveis.

Exemplo: [péssimo, ruim, regular, bom, ótimo].

Variável Quantitativa: os dados são expressos através de números. Por exemplo, idade, estatura,

peso, etc.

- Discreta: Assumem valores que podem ser associados aos números naturais ( 1, 2,3,...= ).

Dá uma ideia de contagem.

Exemplo: Número de irmãos dos 30 alunos da turma de Engenharia

[0, 1, 2, 5, 3, 4, 1, 0, 2, 3, 5, 4, 0, 1, 2, 2, 1, 0, 1, 1, 2, 0, 0, 3, 2 , 3, 4, 2, 1, 2].

Page 10: [Apostila] Estatística Aplicada a Engenharia I

EST0323– Estatística Aplicada a Engenharia I – Prof. Msc. André Luiz Sena da Rocha

[email protected]

7

- Contínua: Assume infinitos valores em um dado intervalo. Dá uma ideia de medição.

Exemplo: altura e/ou peso de animais ou de pessoas.

[1.70, 1.57, 1.80, 1.94, 1.68, 1.71]

Exercício 1. 7: Classifique com relação ao tipo de variável as seguintes informações:

• Sexo (“Masculino” ou “Feminino”);

• Tempo de uso de um HD de 1 TB (em meses completos);

• Tempo em horas para término de uma simulação num software;

• Altura de jogadores de vôlei de certo time (em metros);

• Fuma (“Sim” ou “Não”);

• Peso de vigas de concreto (em quilogramas);

• Número de filhotes de uma ninhada;

• Tolerância ao cigarro (indiferente, incomoda pouco, incomoda muito);

• Horas que gasta estudando.

• Resultado final de uma disciplina da UFRN (“Aprovado” ou “Reprovado”)

1.4 - Representação Tabular

Consiste em dispor os dados em linhas e colunas, distribuídas de modo ordenado, segundo algumas

regras práticas e obedecendo (ainda) à Resolução nº 886/66, de 26 de outubro de 1966, do Conselho

Nacional de Estatística. As tabelas devem conter:

a) Título - O quê? (fenômeno). Onde? (época). Quando? (local).

b) Cabeçalho - indica o conteúdo das colunas

c) Coluna Indicadora - especifica o conteúdo das linhas

d) Cabeçalho da coluna indicadora - indica o conteúdo da coluna indicadora

e) Corpo - caselas ou células, onde são registrados os dados.

f) Rodapé - notas e identificação da fonte de onde foram coletados os dados.

Page 11: [Apostila] Estatística Aplicada a Engenharia I

EST0323– Estatística Aplicada a Engenharia I – Prof. Msc. André Luiz Sena da Rocha

[email protected]

8

1.4.1 - Distribuição de Frequências

Tabelas com grandes números de dados são cansativas e não dão uma visão rápida e geral do

fenômeno. Dessa forma, é necessário que os dados sejam organizados em uma tabela de

distribuição de frequências. Estas podem ser simples (dados não-agrupados) ou por classes (dados

agrupados).

DISTRIBUIÇÃO DE FREQUÊNCIAS SIMPLES:

Série estatística para dados nominais, ordinais e discretos, organizados em uma tabela.

Construção de uma Distribuição de Frequências:

Para a construção de uma distribuição de frequências os seguintes componentes são necessários:

Dados Brutos: são os dados apresentados desordenadamente, da forma como foram coletados.

Exemplo 1.1: Peso (kg) de 14 blocos de concreto (dados brutos):

74 58 69 80 74 95 56 74 76 81 60 57 64 62

Rol: são os dados apresentados em ordem crescente.

Exemplo 1.1: Peso (kg) de 14 blocos de concreto (em forma de rol):

56 57 58 60 62 64 69 74 74 74 76 80 81 95

Page 12: [Apostila] Estatística Aplicada a Engenharia I

EST0323– Estatística Aplicada a Engenharia I – Prof. Msc. André Luiz Sena da Rocha

[email protected]

9

Construção de uma Distribuição de frequências simples

1. Ordenar os dados brutos em forma de rol (ordem crescente)

2. Listar todos os elementos diferentes, numa coluna de nome “X”.

3. Listar a frequência de todos os elementos diferentes numa coluna de nome "fi" ou "frequência".

4. Somar todos os elementos da coluna "fi" (total).

Exemplo 1.2: Numa pesquisa feita para detectar o número de filhos de empregados de uma

multinacional, foram encontrados os seguintes valores:

1 4 2 5 3 2 0 3 2 1 5 4 2 5 0

3 2 4 2 3 2 3 2 1 4 2 1 3 4 2

Solução:

Rol (dados em ordem crescente):

0 0 1 1 1 1 2 2 2 2 2 2 2 2 2

2 3 3 3 3 3 3 4 4 4 4 4 5 5 5

Tabela de Distribuição de Frequências:

Número de filhos por empregado de uma multinacional

Número de filhos (X) fi f i%

0 2 6,7

1 4 13,3

2 10 33,3

3 6 20

4 5 16,7

5 3 10

Total 30 100

Fonte: Dados Fictícios

Algumas considerações ou conclusões:

Qual o número de funcionários que não tem filhos? Qual o seu percentual?

Quantos funcionários têm cinco filhos e qual o seu percentual?

A maioria dos funcionários tem quantos filhos? E a minoria? Informe o percentual de ambos.

Page 13: [Apostila] Estatística Aplicada a Engenharia I

EST0323– Estatística Aplicada a Engenharia I – Prof. Msc. André Luiz Sena da Rocha

[email protected]

10

INFORMAÇÕES ADICIONAIS NUMA DISTRIBUIÇÃO DE FREQUÊNCIAS

Além das informações contidas na tabela, destaca-se outros parâmetros relevantes:

- LI = limite inferior de cada classe;

- LS = limite superior de cada classe;

- Pm = ponto médio de cada classe x = (Li + Ls) / 2;

- fi = frequência absoluta = número de ocorrências de cada classe;

- fi % = frequência percentual fi % = (fi / n) 100;

- ↓F = frequência absoluta acumulada "abaixo de";

- ↑F = frequência absoluta acumulada "acima de";

- ↓F% = frequência percentual acumulada "abaixo de";

- ↑F% = frequência percentual acumulada "acima de";

Exemplo 1.3: Veremos como fica a distribuição de frequências simples com essas informações

adicionais:

Número de filhos de empregados de uma multinacional

Nº de filhos fi f % F↓ F↑ F↓% F↑%

0 2 6,7 2 30 6,7 100

1 4 13,3 6 28 20 93,3

2 10 33,3 16 24 53,3 80

3 6 20 22 14 73,3 46,7

4 5 16,7 27 8 90 26,7

5 3 10 30 3 100 10

Total 30 100 - - - -

Fonte: Dados fictícios

Responda:

a) Quantos empregados têm até 2 filhos?

Resp: Se dá por F↓, sendo igual a 16 filhos.

b) Quantos empregados têm ao menos 4 filhos?

Resp: Se dá por F↑, sendo igual a 8 filhos.

c) Qual o percentual de empregados com no máximo 1 filho?

Resp: Se dá por F%↓, sendo igual a 93,3%.

d) Qual o percentual de empregados com no mínimo 2 filhos?

Resp: Se dá por F↑%, sendo igual a 80%.

Page 14: [Apostila] Estatística Aplicada a Engenharia I

EST0323– Estatística Aplicada a Engenharia I – Prof. Msc. André Luiz Sena da Rocha

[email protected]

11

DISTRIBUIÇÃO DE FREQUÊNCIAS POR CLASSES:

Série estatística para dados contínuos. Os números são agrupados em classes, com suas respectivas

frequências absolutas, relativas e percentuais, com o objetivo de facilitar ao analista o seu estudo.

Os seguintes componentes são utilizados apenas em distribuição de frequências em classes:

Amplitude Total (A): é a diferença entre o maior valor do rol (LS) e o menor valor (LI).

A = LS - LI

Número de Classes (c): corresponde à quantidade de classes, nas quais serão agrupados os

elementos do rol. Para determinar c, utiliza-se a fórmula de Sturges:

C = 1 + (3,33333.....) · log(n)

em que n = número de elementos do rol.

Amplitude ou Intervalo de Classe (i): geralmente utilizam-se intervalos iguais, obtidos através

da fórmula:

i = A/C

Construção de uma Distribuição de frequências por classes

a) Ordenar os dados brutos em forma de rol (ordem crescente)

b) Calcular a amplitude total: A = LS - LI

c) Calcular o número de classes e arredondar o valor final para um número inteiro utilizando a

regra e arredondamento:

C = 1 + (3,33333.....) • log(n)

d) Calcular o intervalo entre classes: i = A / C.

e) A 1º coluna será a das classes. O menor número dos dados em rol será o limite inferior da

primeira classe (“LI” da fórmula utilizada na amplitude total “A”), a partir do qual todas as

outras classes serão definidas a partir deste número, somando ele ao intervalo entre classes.

Exemplo: Para C = 5, i = 1,5 e LI = 7,4 (menor número dos dados em forma de rol).

O limite inferior da 1º classe será 7,4 e o limite superior da mesma classe será

LI + i = 7,4 + 1,5 = 8,9.

Por sua vez, o limite inferior da 2º classe será 8,9 e o superior: 8,9 + i = 8,9 + 1,5 = 10,4.

Este procedimento será realizado até termos o número “C” de classes (este previamente

calculado).

Page 15: [Apostila] Estatística Aplicada a Engenharia I

EST0323– Estatística Aplicada a Engenharia I – Prof. Msc. André Luiz Sena da Rocha

[email protected]

12

f) Para indicar o intervalo, utilizaremos o símbolo |- . Por exemplo, no caso de haver o limite

inferior 7,4 e o limite superior 8,9. Indicaremos este intervalo como : 7,4 |- 8,9.

Isso significa todos os números que estão entre 7,4 e o mais próximo possível de 8,9, porém,

caso haja um número igual ao limite superior dessa classe, este deverá ser computado apenas

na próxima classe (para o Exemplo do número 5, na 2º classe, sendo esta: 8,9 |- 10,4).

g) Uma vez definidas as classes, a tabela de frequências pode ser construída, a partir da 2º coluna

de nome “frequência” ou simplesmente “fi”, fazendo-se o processo de contagem, que consiste

em verificar a qual classe cada dado pertence.

OBS: Em algumas situações, pode-se utilizar uma distribuição de frequências por classes para

dados discretos quando todos os números ou a maioria são diferentes.

Exemplo 1.4: Construir uma distribuição de frequências para o número diário de experimentos

realizados em um laboratório durante duas semanas. [0, 2, 3 ,4 , 5, 10, 12, 7, 9, 0, 5, 13, 17, 10, 6].

Para essa situação, a mais viável será uma distribuição por classes, que deverá seguir o mesmo

procedimento, apenas com o cuidado ao calcular o intervalo entre classes (i), o mesmo deverá ser

arredondado para um número inteiro.

Exemplo 1.5: Construa de uma Distribuição de Frequências com CLASSES para os dados

referentes ao Peso (kg) de 14 blocos de concreto:

56 57 58 60 62 64 69 74 74 74 76 80 81 95

Solução:

Amplitude Total (A): A = LS – LI = 95 – 56 = 39.

Número de Classes (C): C = 1 + (3,33333.....) · log(n) = 1 + 3,333 · log (14) = 4,82 ≈ 5.

Intervalo de Classe (i): A=39 e C=5 i = A/C = 39/5 = 7,8.

Page 16: [Apostila] Estatística Aplicada a Engenharia I

EST0323– Estatística Aplicada a Engenharia I – Prof. Msc. André Luiz Sena da Rocha

[email protected]

13

Peso de blocos de concreto

Peso (kg) fi fi%

56,0 |- 63,8 5 35,71%

63,8 |- 71,6 2 14,28%

71,6 |- 79,4 4 28,58%

79,4 |- 87,2 2 14,28%

87,2 |-| 95 1 7,14%

Total 14 100%

Fonte: Dados Fictícios

Exemplo 1.6: Um determinado hospital está interessado em analisar a quantidade de creatinina (em

miligramas por 100 mililitros) encontrada na urina (de 24 horas) de seus pacientes internados com

problemas renais. Os dados são os seguintes:

1,51 1,65 1,58 1,54 1,65 1,40 1,61 1,08 1,81 1,38 1,56 1,83

1,69 1,22 1,22 1,68 1,47 1,68 1,49 1,80 1,33 1,83 1,50 1,46

1,67 1,60 1,23 1,54 1,73 1,43 2,18 1,46 1,53 1,60 1,59 1,49

1,46 1,72 1,56 1,43 1,69 1,15 1,89 1,47 2,00 1,58 1,37 1,40

1,76 1,62 1,96 1,66 1,51 1,31 2,29 1,58 2,34 1,66 1,71 1,44

1,66 1,36 1,43 1,26 1,47 1,52 1,57 1,33 1,86 1,75 1,57 1,83

1,52 1,66 1,90 1,59 1,47 1,86 1,73 1,55 1,52 1,40 1,86 2,02

Page 17: [Apostila] Estatística Aplicada a Engenharia I

EST0323– Estatística Aplicada a Engenharia I – Prof. Msc. André Luiz Sena da Rocha

[email protected]

14

Solução:

Rol (dados em ordem crescente):

1,08 1,15 1,22 1,22 1,23 1,26 1,31 1,33 1,33 1,36 1,37 1,38

1,40 1,40 1,40 1,43 1,43 1,43 1,44 1,46 1,46 1,46 1,47 1,47

1,47 1,47 1,49 1,49 1,50 1,51 1,51 1,52 1,52 1,52 1,53 1,54

1,54 1,55 1,56 1,56 1,57 1,57 1,58 1,58 1,58 1,59 1,59 1,60

1,60 1,61 1,62 1,65 1,65 1,66 1,66 1,66 1,66 1,67 1,68 1,68

1,69 1,69 1,71 1,72 1,73 1,73 1,75 1,76 1,80 1,81 1,86 1,86

1,86 1,86 1,86 1,86 1,89 1,90 1,96 2,00 2,02 2,18 2,29 2,34

Amplitude Total (dá uma ideia do campo de variação dos dados):

A = LS - LI = (2,34) - (1,08) = 1,26

Analisando-se a quantidade de creatinina encontrada na urina dos 84 pacientes verificou-se que,

ocorreu a variação de 1,26 no seu campo (de 1,08 a 2,34).

Estabelecer o Número de Classes (c):

c = 1 + (3,3333.....) · log(n) = 1 + (3,3333....) · log(84) = 7,414 c = 7

Estabelecer o Intervalo de Classe (i):

i = A / c = (1,26) / 7 = 0,18

Quantidade de creatinina (ml) encontrada na urina de 84 pacientes com problemas renais.

Classes fi f % Pm (X) ↓%f ↑%f ↓F ↑F

1,08 1,26 5 5,9 1,17 5,9 100 5 84

1,26 1,44 13 15,5 1,35 21,4 94,1 18 79

1,44 1,62 32 38,1 1,53 59,5 78,6 50 66

1,62 1,80 18 21,4 1,71 80,9 40,5 68 34

1,80 1,98 11 13,1 1,89 94,0 19,1 79 16

1,98 2,16 2 2,4 2,07 96,4 6,0 81 5

2,16 2,34 3 3,6 2,25 100 3,6 84 3

Total 84 100 - - - - -

Fonte: Dados fictícios

Page 18: [Apostila] Estatística Aplicada a Engenharia I

EST0323– Estatística Aplicada a Engenharia I – Prof. Msc. André Luiz Sena da Rocha

[email protected]

15

Observação 1: O melhor valor para representar cada classe é o ponto médio (Pm), o qual se obtém

pela fórmula:

Pm = Li + (i / 2), ou ainda, Pm = (Li + Ls) / 2

Observação 2: 1,08 |- 1,26, intervalo fechado à esquerda (pertencem a classe valores iguais ao

extremo inferior) e aberto à direita (não pertencem a classe valores iguais ao extremo superior). De

forma análoga, 2,16 |-| 2,34, intervalo fechado à esquerda e à direita.

Responda:

a) Quantos pacientes têm até 1,79 ml de creatinina?

Resp: Se dá por F↓, sendo igual a 68 pacientes.

b) Quantos pacientes têm ao menos 1,98 ml de creatinina?

Resp: Se dá por F↑, sendo igual a 5 pacientes.

c) Qual o percentual de pacientes com no máximo 1,61 ml de creatinina?

Resp: Se dá por F%↓, sendo igual a 59,5%. (mais da metade).

d) Qual o percentual de pacientes com no mínimo 1,98 ml de creatinina?

Resp: Se dá por F↑%, sendo igual a 6%.

Exercício 1.8: Na fabricação de semicondutores, o ataque químico por via úmida é frequentemente

usado para remover silicone da parte posterior das pastilhas antes da metalização. A taxa de ataque

é uma característica importante no processo. Um tipo de solução pra ataque químico foi estudada,

usando uma amostra de 50 pastilhas. As taxas observadas de ataque (10-3 mils/min) são dadas a

seguir:

2,1 4,2 2,7 28,2 9,9 9 2 6,6 3,9 1,6 14,7 9,6 16,1 8,1 8,2 20,2 6,9

4,3 3,3 1,2 4,1 18,4 0,2 6,1 13,5 7,4 0,2 8,3 0,3 1,3 14,1 1,0 2,4 2,4

16,2 8,7 24,1 1,4 8,2 5,8 1,6 3,5 12,2 18 26,7 3,7 12,3 23,1 5,6 0,4

Page 19: [Apostila] Estatística Aplicada a Engenharia I

EST0323– Estatística Aplicada a Engenharia I

1.5 - REPRESENTAÇÃO GRÁFICA

Todo o gráfico deve apresentar título (pode ser colocado tanto acima como abaixo) e escala

(crescem da esquerda para a direita e de baixo para cima). As legendas devem ser

direita ou abaixo do gráfico. A seguir vemos os principais tipos de gráficos:

1.5.1 - Gráfico de Setores

Também conhecido como Gráfico de Pizza, este grá

parte de um todo. É, então, usado um círculo de raio qualquer, com a área ou ângulo total sendo

proporcional ao total (100%) da série de dados a representar e a ár

circular sendo proporcional a cada dado da série.

Exemplo 1.7: Exemplo de um gráfico de setores

Tabela 1.1: Principais rações caninas vendidas numa certa cidade em 2010

Marca da Ração

Figura 1.1: Principais rações caninas vendidas numa certa cidade em 2010

Estatística Aplicada a Engenharia I – Prof. Msc. André Luiz Sena da Rocha

[email protected]

REPRESENTAÇÃO GRÁFICA

Todo o gráfico deve apresentar título (pode ser colocado tanto acima como abaixo) e escala

(crescem da esquerda para a direita e de baixo para cima). As legendas devem ser

direita ou abaixo do gráfico. A seguir vemos os principais tipos de gráficos:

Também conhecido como Gráfico de Pizza, este gráfico é usado quando cada valor representa uma

parte de um todo. É, então, usado um círculo de raio qualquer, com a área ou ângulo total sendo

proporcional ao total (100%) da série de dados a representar e a área ou ângulo de cada setor

circular sendo proporcional a cada dado da série.

Exemplo de um gráfico de setores

: Principais rações caninas vendidas numa certa cidade em 2010

Marca da Ração Percentual (%) Caninu’s 18 Campeão 15

Foster 24 Pedigree 43

Fonte: Dados Fictícios

: Principais rações caninas vendidas numa certa cidade em 2010

16

Todo o gráfico deve apresentar título (pode ser colocado tanto acima como abaixo) e escala

(crescem da esquerda para a direita e de baixo para cima). As legendas devem ser colocadas à

fico é usado quando cada valor representa uma

parte de um todo. É, então, usado um círculo de raio qualquer, com a área ou ângulo total sendo

ea ou ângulo de cada setor

: Principais rações caninas vendidas numa certa cidade em 2010

: Principais rações caninas vendidas numa certa cidade em 2010

Page 20: [Apostila] Estatística Aplicada a Engenharia I

EST0323– Estatística Aplicada a Engenharia I

1.5.2 - Gráfico de Colunas e Barras

As variações quantitativas da tabela são r

horizontalmente. É usado para representar qualquer tipo de série.

Exemplo 1.8: Exemplo de um Gráfico de Barras

Tabela 1.2: Principais causas de morte nos EUA em 2004

Tipo de morteAcidentes de carroÁlcool Armas de fogoCigarro Doenças InfecciosasDoenças VenéreasDrogas Obesidade Outras Total

Fonte: Ie Estatísticas, 2004.

Figura 1.

Estatística Aplicada a Engenharia I – Prof. Msc. André Luiz Sena da Rocha

[email protected]

Gráfico de Colunas e Barras

As variações quantitativas da tabela são representadas por colunas dispostas verticalmente ou

horizontalmente. É usado para representar qualquer tipo de série.

Gráfico de Barras

: Principais causas de morte nos EUA em 2004

morte Frequência Percentual (%)Acidentes de carro 856 23,70

457 12,65 Armas de fogo 985 27,27

247 6,84 Doenças Infecciosas 112 3,10 Doenças Venéreas 98 2,71

631 17,47 124 3,43 102 2,82

3612 100

Figura 1.2: Principais causas de morte nos EUA em 2004

17

epresentadas por colunas dispostas verticalmente ou

Percentual (%)

Page 21: [Apostila] Estatística Aplicada a Engenharia I

EST0323– Estatística Aplicada a Engenharia I

Exemplo 1.9: Exemplo de um Gráfico de Colunas

Figura 1.3: Principais rações caninas vendidas numa certa cidade

1.5.3 - Histograma e Polígono de Frequências

A apresentação tabular dos dados é feita através de uma distribuição de frequências. Fica

complementada com uma representação grá

de frequências são tipos de gráficos usados para representar uma distribuiç

de uma variável quantitativa contínua.

Exemplo 1.10: Exemplo de um histograma e de um polígono de frequências

Tabela 1.3: Distribuição de frequências dos preços de ovos

Preço dos ovos

47 68 68 89 89 110 110 131 131 152 Total

Fonte: GUJARATI. Basic Econometrics

Estatística Aplicada a Engenharia I – Prof. Msc. André Luiz Sena da Rocha

[email protected]

Gráfico de Colunas

Principais rações caninas vendidas numa certa cidade em 2010

Histograma e Polígono de Frequências

A apresentação tabular dos dados é feita através de uma distribuição de frequências. Fica

complementada com uma representação gráfica desses mesmos dados. O histograma e o polígono

ficos usados para representar uma distribuição de frequências simples

de uma variável quantitativa contínua.

Exemplo de um histograma e de um polígono de frequências

: Distribuição de frequências dos preços de ovos - EUA - 1990

f fr F↓ F%

19 38 19 19 38 38 9 18 47 2 4 49 1 2 50

50 100 -

Basic Econometrics. McGraw-Hill, 3a ed. 1995.

18

em 2010

A apresentação tabular dos dados é feita através de uma distribuição de frequências. Fica

fica desses mesmos dados. O histograma e o polígono

de frequências simples

F%↓

38 76 94 98

100 -

Page 22: [Apostila] Estatística Aplicada a Engenharia I

EST0323– Estatística Aplicada a Engenharia I – Prof. Msc. André Luiz Sena da Rocha

[email protected]

19

Um histograma é um conjunto de retângulos com bases sobre um eixo horizontal dividido de

acordo com os comprimentos de classes, centros nos pontos médios das classes e áreas

proporcionais ou iguais às frequências.

Um polígono de frequências é um gráfico de linha que se obtém unindo por uma poligonal

os pontos correspondentes às frequências das diversas classes, centradas nos respectivos pontos

médios. Para obter as interseções da poligonal com o eixo, cria-se em cada extremo uma classe com

frequência nula. Note que esses gráficos podem ser construídos com base nas frequências absolutas

ou relativas. O importante é que a escala nos eixos horizontal e vertical, bem como os retângulos,

sejam construídos de forma a que suas áreas espelhem a proporcionalidade dessas frequências.

Na Figura 1.10 apresentamos o histograma para a distribuição de frequências dada na Tabela

1.17, referente ao preço da dúzia de ovos nos estados americanos em 1990. Aqui cabe uma

observação sobre o histograma, que foi construído com o software free R; cada retângulo foi

construído de modo que sua área fosse exatamente igual à frequência relativa. Por exemplo, todos

os retângulos têm base 21, que é a amplitude de classe. A altura dos dois primeiros retângulos é

[área/base = 0,38 / 21 = 0,0180952], de modo que a área resultante é 0,38. Para a terceira classe,

temos que [altura = área/base = 0,18 / 21 = 0,0085714].

O ponto fundamental na interpretação de um histograma é compreender que as áreas dos

retângulos representam as frequências de cada classe. Como a variável é contínua e a frequência

dada se refere a uma classe de valores, a suposição que se faz é que essa frequência se distribui

uniformemente pela classe. Na Figura 1.10, a frequência relativa da classe 47 68 é 0,38 (ou 38%)

e ela está uniformemente distribuída pela classe, o que significa que subclasses de mesmo

comprimento teriam a mesma frequência. Por exemplo, as frequências das classes 4757,5 e

57,568 seriam ambas iguais 0,19. Já a subclasse 8995 teria uma frequência de 0,0085714 ×

(95−89) = 0,0514286. Mais uma vez, o princípio é que área = frequência. Com relação ao polígono

de frequências, a ideia é representar o comportamento “típico” de cada classe através do seu ponto

médio. Assim, o polígono de frequência está representado na Figura 1.11

Page 23: [Apostila] Estatística Aplicada a Engenharia I

EST0323– Estatística Aplicada a Engenharia I – Prof. Msc. André Luiz Sena da Rocha

[email protected]

20

HISTOGRAMA

Figura 1.4: Histograma da distribuição de frequência dos preços dos ovos nos estados

POLÍGONO DE FREQUÊNCIAS

Figura 1.5: Polígono de frequência dos preços dos ovos nos estados americanos

1.6 – Medidas de Tendência Central

Os dados quantitativos, apresentados em tabelas e gráficos, constituem a informação básica

do problema. Mas é conveniente apresentar medidas que mostrem a informação de maneira

resumida.

Page 24: [Apostila] Estatística Aplicada a Engenharia I

EST0323– Estatística Aplicada a Engenharia I – Prof. Msc. André Luiz Sena da Rocha

[email protected]

21

Medidas de Tendência Central

São medidas que tendem para o centro da distribuição e têm a capacidade de representá-la como um

todo. Dão o valor do ponto em torno do qual os dados se distribuem. As principais são: Média

Aritmética, Mediana e Moda e algumas.

1.6.1 - Média Aritmética

A média aritmética pode ser definida em dois tipos: populacional (µ ) e amostral ( X ). Nos dois

casos existem três situações quanto aos cálculos.

1. Dados apresentados em forma de rol:

A média será: rol do elementos de número

rol do elementos os todosde soma

n

xX

n

i

==∑

=1i

Exemplo 1.11: Número de tonadas a serem trocadas em 12 hotéis de Natal (50, 62, 70, 86, 60, 64,

66, 77, 58, 55, 82, 74) X =67

Análise: O número médio de tomadas para serem trocadas é de 67 por hotel.

Exercício 1.9: Um gerente de supermercado quer estudar a movimentação de pessoas em seu

estabelecimento, constata que 195, 1.002, 941, 768 e 1.283 pessoas entraram no seu

estabelecimento nos últimos cinco dias. Descubra o número médio de pessoas que entraram

diariamente neste estabelecimento nos últimos cinco dias.

2. Dados apresentados em forma de distribuição de frequência simples:

A média será:

=

==n

1ii

n

ii

f

fxX 1i

Exemplo 1.12: Número de peças com defeitos produzidas em 27 dias em certa fábrica

X 0 1 2 3 4 Total

f 2 4 10 6 5 27

Page 25: [Apostila] Estatística Aplicada a Engenharia I

EST0323– Estatística Aplicada a Engenharia I – Prof. Msc. André Luiz Sena da Rocha

[email protected]

22

2,327

(4).(5) (3).(6) (2).(10) (1).(4)(0).(2)

f

fxX

n

1ii

n

ii

=++++

==

=

=1i

Análise: Verifica-se que o número médio de peças com defeitos é de 2,3 por dia.

Exercício 1.10: As informações abaixo apresentam a idade dos usuários de drogas internos numa

clínica para tratamento. Determine a idade média dos internos.

Idade fi

17 2

18 4

19 5

20 6

21 3

22 4

23 2

Total 26

3. Dados apresentados em forma de distribuição de frequência em classes:

A média será:

=

==n

1ii

n

1iim

f

fPX

Page 26: [Apostila] Estatística Aplicada a Engenharia I

EST0323– Estatística Aplicada a Engenharia I – Prof. Msc. André Luiz Sena da Rocha

[email protected]

23

Exemplo 1.13: Nascidos vivos segundo o peso ao nascer, em kg.

Classes fi Pm

1,5 |- 2,0 3 1,75

2,0 |- 2,5 16 2,25

2,5 |- 3,0 31 2,75

3,0 |- 3,5 34 3,25

3,5 |- 4,0 11 3,75

4,0 |- 4,5 4 4,25

4,5 |-| 5,0 1 4,75

Total 100 -

3100

(4,75).(1) )(2,25).(16(1,75).(3)

f

fPX

n

1ii

n

im

=+++

==

=

= …1i

Análise: Verifica-se que o peso médio dos 100 nascidos vivos observados é 3 kg.

1.6.2 – Mediana

Valor que divide a distribuição em duas partes iguais, em relação à quantidade de elementos. Isto é,

é o valor que ocupa o centro da distribuição, de onde se conclui que 50% dos elementos ficam

abaixo dela e 50% ficam acima.

Colocados em ordem crescente, a mediana (Med ou Md) é ou valor que divide a amostra, ou

população, em duas partes iguais.

0 Med 100%

a) Variável Discreta: os dados estão dispostos em forma de rol ou em uma distribuição de

frequência simples.

Page 27: [Apostila] Estatística Aplicada a Engenharia I

EST0323– Estatística Aplicada a Engenharia I – Prof. Msc. André Luiz Sena da Rocha

[email protected]

24

Se “n” for ímpar:

Med = elemento central (de ordem 1

2

n +

)

- Exemplo 1.14: Dados em forma de rol:

Seja a amostra: 8, 10, 12, 14, 16 Med =5 1

32

+ =

elemento do rol = 12

Interpretação: o 3º elemento do rol (12) divide 50% da distribuição dos dados à direita

e à esquerda.

- Exemplo 1.15: Dados em uma distribuição de frequência simples:

Suponha a seguinte distribuição de frequência simples.

X fi ↓F

1 1 1

2 3 4

3 5 9

4 2 11

Total 11 -

n = 11 (ímpar)

Elemento mediano: [(n+1)/2]º = 6º elemento

3ª classe contém o 6º elemento Med = 3.

Se “n” for par:

Med = média aritmética dos dois elementos centrais (de ordem 2

n

e 12

n +

)

- Exemplo 1.16: Dados em forma de rol:

Seja a amostra: 8, 10, 12, 14, 16, 19

63 elemento do rol

2 2

61 1 4 elemento do rol

2 2

n

n

= =

+ = + =

Med = 3 elemento 4 elemento 12 14

132 2

Mediana+ +

= = =

Interpretação: a média do 3º e 4º elemento do rol (13) divide 50% da distribuição dos dados à

direita e à esquerda.

Page 28: [Apostila] Estatística Aplicada a Engenharia I

EST0323– Estatística Aplicada a Engenharia I – Prof. Msc. André Luiz Sena da Rocha

[email protected]

25

- Exemplo 1.17: Dados em uma distribuição de frequência simples:

Suponha a seguinte distribuição de frequência simples.

X fi ↓F

82 5 5

85 10 15

87 15 30

89 8 38

90 4 42

Total 42 -

Fonte: Dados fictícios

n = 42 (par)

Elemento mediano: (n/2)º = 21º elemento

(n/2)º + 1 = 22º elemento

3ª classe contém o 21º e o 22º elemento

Med = (87 + 87)/2 = 87

b) Variável Contínua: os dados estão agrupados em uma distribuição de frequências em classes,

então:

• 1º Passo: Organizar os dados em forma de rol (ordem crescente);

• 2º Passo: Calcular a ordem (n/2)º. Como a variável é contínua não importa se é par ou ímpar.

• 3º Passo: Através da ↓F identificar a classe que contém a mediana, isto é, a posição da

mediana.

• 4º Passo: Utilizar a fórmula:

MedMed

MedMed .i

f

FPLIMed

↓−+=

- LIMed = limite inferior da classe que contém a mediana;

- PMed = posição da mediana = 2f i /∑ = xº elemento;

- -F ↓ = frequência absoluta acumulada "abaixo de" da classe anterior à classe que contém a

mediana;

- fMe = frequência absoluta da classe que contém a mediana;

- iMe = intervalo da classe que contém a mediana;

Page 29: [Apostila] Estatística Aplicada a Engenharia I

EST0323– Estatística Aplicada a Engenharia I – Prof. Msc. André Luiz Sena da Rocha

[email protected]

26

Exemplo 1.18: Temperatura (Cº) para o derretimento de certo material eletrônico.

Temperatura fi Pm F↓

150 |- 200 35 175 35

200 |- 250 164 225 199

250 |- 300 31 275 230

300 |- 350 344 325 574

350 |- 400 112 375 686

400|- 450 32 425 718

455 |-| 500 10 475 728

Total 728 - -

Fonte: Dados fictícios

PMe = (n/2) (728/2) 364º elemento 4ª classe: [300; 350)

0MedMed Med

Med

P F 364 - 230Med LI .i 300 .(50) 319,75

f 344C

− − ↓ = + = + =

Exercício 1.11: Um determinado hospital está interessado em analisar a quantidade de creatinina

(em miligramas por 100 mililitros) encontrada na urina (de 24 horas) de seus pacientes internados

com problemas renais. Calcule a Mediana.

Quantidade de creatinina (ml) encontrada na urina de 84 pacientes com problemas renais.

Classes fi F↓

1,08 |- 1,26 5 5

1,26 |- 1,44 13 18

1,44 |- 1,62 32 50

1,62 |- 1,80 18 68

1,80 |- 1,98 11 79

1,98 |- 2,16 2 81

2,16 |-| 2,34 3 84

Total 84 -

Fonte: Dados fictícios

Page 30: [Apostila] Estatística Aplicada a Engenharia I

EST0323– Estatística Aplicada a Engenharia I – Prof. Msc. André Luiz Sena da Rocha

[email protected]

27

1.6.3 - Moda

É o valor que ocorre com maior frequência na série, ou seja, aquele que mais se repete.

Exemplo: Na série 3, 4, 5, 7, 7, 7, 9, 9 Mo = 7

SÉRIE UNIMODAL (TEM UMA ÚNICA MODA)

Exemplo: Na série 3, 5, 6, 6, 6, 7, 8 Mo = 6

SÉRIE BIMODAL (OCORREM DUAS MODAS)

Exemplo: Na série 2, 5, 5, 5, 6, 7, 9, 9, 9, 10, 10 Mo1 = 5 e Mo2 = 9

SÉRIE TRIMODAL (OCORREM TRÊS MODAS)

Exemplo: Na série 4, 4, 4, 5, 6, 7, 7, 7, 8, 9, 9, 9 Mo1 = 4, Mo2 = 7 e Mo3 = 9

SÉRIE POLIMODAL (OCORREM QUATRO OU MAIS MODAS)

Exemplo: Na série 0, 0, 1, 3, 3, 4, 7, 8, 8, 11, 12, 12, 13, 13 Mo1 = 0, Mo2 = 3, Mo3 = 8,

Mo4 = 12 e Mo5 = 13

SÉRIE AMODAL (NÃO EXISTE MODA)

Exemplo: Na série 0, 1, 3, 4, 7, 8 não existe moda

a) DADOS APRESENTADOS EM UMA DISTRIBUIÇÃO DE FREQUÊNCIA SIMPLES.

Mo = elemento que tenha maior frequência

Exemplo 1.19:

X fi

1 13

3 15

6 25

10 8

Total 61

Mo = 6

Page 31: [Apostila] Estatística Aplicada a Engenharia I

EST0323– Estatística Aplicada a Engenharia I – Prof. Msc. André Luiz Sena da Rocha

[email protected]

28

Exemplo 1.20:

Tipo de Sangue fi

O 547

A 441

B 123

AB 25

Total 1136

Mo = sangue do tipo "O"

b) DADOS APRESENTADOS EM UMA DISTRIBUIÇÃO DE FREQUÊNCIA CLASSES.

Nesse caso, a moda pode ser determinada através de quatro processos.

1. Moda Bruta (MoB)

Corresponde ao ponto médio da classe modal, ou seja, MoB = (li + ls)/2

Exemplo 1.21: Quantidade de Creatinina

Classes fi

1,08 1,26 5

1,26 1,44 13

1,44 1,62 32

1,62 1,80 18

1,80 1,98 11

1,98 2,16 2

2,16 2,34 3

Fonte: Dados fictícios

2. Moda de Pearson (MoP)

Utilizada mais especificamente, juntamente com X e Med, para mostrar o comportamento da

distribuição, em relação a concentração ou não de seus elementos.

Mo 3 Med - 2 X= ⋅ ⋅

Page 32: [Apostila] Estatística Aplicada a Engenharia I

EST0323– Estatística Aplicada a Engenharia I – Prof. Msc. André Luiz Sena da Rocha

[email protected]

29

Utiliza-se a MoP para a análise da assimetria.

a) Assimetria à esquerda: oPMMedX << (concentração à direita ou nos valores maiores);

b) Simétrica: XMedM oP == (concentração no centro);

c) Assimetria à direita: XMedM oP << (concentração à esquerda ou nos valores menores).

Exemplo 1.22: Calcule a moda de Pearson para os seguintes dados X = 1,61 e Med = 1,57.

Mo 3 Med- 2 X = 3(1,57) - 2(1,61) =1,49= ⋅ ⋅

Análise: XMedM oP << , o que indica uma assimetria à direita, isto é, uma maior concentração à

esquerda (ou em direção aos valores menores).

Exercício 1.12: Calcule a moda de pearson para a distribuição de frequências abaixo:

Quantidade (ml) encontrada numa amostra de 320 soluções utilizadas num processo químico.

Quantidade (ml) fi F↓

4,08 |- 5,44 49 49

5,44 |- 6,80 70 119

6,80 |- 8,16 142 261

8,16 |- 9,52 29 290

9,52 |-| 10,88 30 320

Total 320 -

Fonte: Dados fictícios

Page 33: [Apostila] Estatística Aplicada a Engenharia I

EST0323– Estatística Aplicada a Engenharia I – Prof. Msc. André Luiz Sena da Rocha

[email protected]

30

1.6.4 – Separatrizes

Além das medidas de posição que estudamos, há outras que, consideradas individualmente,

não são medidas de tendência central, mas estão ligadas à mediana, já que se baseiam em sua

posição na série. Essas medidas - os quartis, os percentis e os decis - são, juntamente com as

medianas, conhecidas pelo nome genérico de separatrizes.

Os quartis, decis e percentis são muito similares à mediana, uma vez que também

subdividem a distribuição de medidas de acordo com a proporção das frequências observadas.

Enquanto a mediana divide a distribuição em duas metades, os quartis dividem-se em quatro

quartos, os decis em 10 partes e os pontos percentis dividem a distribuição em 100 partes.

Mediana (Me) divide em duas partes iguais

Quartis (Q1, Q2 e Q3) dividem em quatro partes iguais

Decis (D1, D2, ..., D9) dividem em dez partes iguais

Percentis (P1, P2, ..., P99 ) dividem em cem partes iguais

São utilizadas para se conhecer, com precisão, as distribuições dos dados como um todo. As

separatrizes podem ser utilizadas tanto em dados não-agrupados (em forma de rol ou em

distribuição de frequência simples) tanto quanto em dados agrupados (distribuição de frequências

em classes).

Relação visual das separatrizes

!-------------------!-------------------!

Md

!---------!---------!---------!---------! Q1 Q2 Q3

!-----!-----!-----!-----!-----!-----!-----!-----!-----!-----! D1 D2 D3 D4 D5 D6 D7 D8 D9 !----------!----------!----------!----------!----------!----------!----------!----------!----------!----------! P10 P20 P30 P40 P50 P60 P70 P80 P90

Page 34: [Apostila] Estatística Aplicada a Engenharia I

EST0323– Estatística Aplicada a Engenharia I – Prof. Msc. André Luiz Sena da Rocha

[email protected]

31

SEPARATRIZES PARA DADOS NÃO-AGRUPADOS

Primeiro encontra-se a posição e em seguida identifica a classe para cada separatriz.

As posições são calculadas da seguinte maneira:

1 – Posição da Mediana: PMe = 2

n

2 – Posição dos Quartis: PQx = . n

4

x , x = 1, 2, 3

3 – Posição dos Decis: PDx = . n

10

x , x = 1, 2, ..., 9

4 – Posição dos Percentis: PPx = . n

100

x , x = 1, 2, ..., 99

em que:

x refere-se à determinação da separatriz (exemplo para quartil, x=1,2,3);

n refere-se ao número de elementos dos dados ou distribuição.

Exemplo 1.23: Considere o tempo (anos) de 24 máquinas utilizadas numa indústria. Calcule os

Quartis.

17 18 19 20 21 22 23 24 25 26 27 29 32

33 35 38 39 42 44 46 48 50 54 57

Calculando os quartis, temos:

1

2

3

1 246 elemento=22

4 42 24

12 elemento=294

3 2418 elemento=42

4

o

o

o

x nEq

Eq Mediana

Eq

⋅ ⋅= = =

⋅= = =

⋅= =

Em relação aos quartis, encontramos os 6º, 12º e o 18º elemento da distribuição dos dados, que

correspondem aos números 22, 29 e 42. Assim, podemos concluir que 25% das máquinas têm idade

de até 22 anos de uso, como também metade delas têm até 29 anos e 25% têm ao menos 42 anos.

25% das máquinas têm mais de 42 anos de uso na indústria.

Page 35: [Apostila] Estatística Aplicada a Engenharia I

EST0323– Estatística Aplicada a Engenharia I – Prof. Msc. André Luiz Sena da Rocha

[email protected]

32

Calculando os Decis 3, 7 e 9, temos:

3

5

9

3 24 7 8 23 247,2 23,5

10 10 2 25 24

12 elemento=2910

9 24 21 22 48 5021,6 49

10 2 2

o o

o

o o

x n elemento elementoEd

Ed Mediana

elemento elementoEd

⋅ ⋅ + += = = ≈ = =

⋅= = =

⋅ + += = ≈ = =

Em relação aos decis calculados, encontramos os 7º, 12º e o 22º elemento da distribuição dos

dados, que correspondem aos números 23,5, 29 e 49. Assim, podemos concluir que 30% das

máquinas têm até 23,5 anos de uso, como também metade delas têm até 29 anos e 90% têm ao

menos 49 anos. 10% das máquinas têm mais de 49 anos de uso na indústria.

Calculando os Percentis 30, 70 e 90, temos:

17

35

83

17 24 4 5 20 214,08 elemento 20,5

100 100 2 2

35 24 8 9 24 258,4 elemento 24,5

100 2 2

83 24 19 20 44 4619,92 elemento 45

100 2 2

o oo

o oo

o oo

x nEp

Ep

Ep

⋅ ⋅ + += = = ≈ = =

⋅ + += = ≈ = =

⋅ + += = ≈ = =

Em relação aos percentis calculados, encontramos os 4º, 8º e o 20º elemento da distribuição dos

dados, que correspondem aos números 20,5; 24,5 e 45. Assim, podemos concluir que 17% das

máquinas têm até 20,5 anos de uso, como também 35% deles têm até 24,5 anos e 65% têm ao

menos 24,5 anos. Conclui-se também que 83% têm até 45 anos de utilização na indústria e 17%

têm no mínimo 45 anos.

1.7 - Medidas De Dispersão

Utilizaremos o termo dispersão para indicar o grau de afastamento de um conjunto de

números em relação a sua média, pois ainda que consideremos a média como um número que tem a

faculdade de representar uma série de valores ela não pode por si mesma, destacar o grau de

homogeneidade ou heterogeneidade que existe entre os valores que compõem o conjunto. O nosso

Page 36: [Apostila] Estatística Aplicada a Engenharia I

EST0323– Estatística Aplicada a Engenharia I – Prof. Msc. André Luiz Sena da Rocha

[email protected]

33

objetivo é construir medidas que avaliem a representatividade da média, para isto usaremos as

medidas de dispersão.

Uma breve reflexão sobre as medidas de tendência central permite-nos concluir que elas não

são suficientes para caracterizar totalmente uma sequência numérica.

Se observarmos as seguintes sequências:

X: 70, 70, 70, 70, 70

Y: 68, 69, 70, 71, 72

Z: 1, 38, 70, 76, 165

Calculando a média aritmética de cada um desses conjuntos, obtemos:

350 70

5ix

X Xn

= ⇒ = =∑

iy 350Y 70

n 5= = =∑

iz 350Z 70

n 5= = =∑

Observamos, então, que os três conjuntos apresentam a mesma média aritmética igual a 70.

Calculando a mediana para os três, dará também o mesmo resultado, ou seja, 70. Assim,

pensaríamos que essas três variáveis são iguais, no entanto, são sequências completamente distintas

do ponto de vista da variabilidade de dados.

Na sequência X, não há variabilidade dos dados. A média 70 representa bem qualquer valor

da série. Na sequência Y, a média 70 representa bem a série, mas existem elementos da série

levemente diferenciados da média 70. Na sequência Z, existem muitos elementos bastante

diferenciados da média 70. Concluímos que a média 70 representa otimamente a sequência X,

representa razoavelmente bem a sequência Y, mas não representa bem a sequência Z.

Nosso objetivo é construir medidas que avaliem a representatividade da média. Para

isto, usaremos as medidas de dispersão.

Observe que na sequência X os dados estão totalmente concentrados sobre a média 70, não

há dispersão de dados. Na sequência Y, há forte concentração dos dados sobre a média 70, mas há

fraca dispersão de dados. Já na série Z há fraca concentração de dados em torno da média 70 e forte

dispersão de dados em relação à média 70.

As principais medidas de dispersão absolutas são: amplitude total, variância, desvio padrão e

coeficiente de variação.

Page 37: [Apostila] Estatística Aplicada a Engenharia I

EST0323– Estatística Aplicada a Engenharia I – Prof. Msc. André Luiz Sena da Rocha

[email protected]

34

1.7.1 – Variância

È a medida de dispersão mais utilizada. É definida como sendo o quociente entre a soma

dos quadrados dos desvios e o número de elementos. É classificada em dois tipos:

Variância Populacional ( 2σ ) ⇒

( ) ( )2 2

2 21i i

i

X X XX

N N Nσ

− = = −

∑ ∑∑

Variância Amostral (s2) ⇒ ( ) ( )

2 2

2 21

1 1

i i

i

X X XS X

n n n

− = = −

− −

∑ ∑∑

Exemplo 1.24: Calcule a variância da estatura do tempo em anos do funcionamento de 5 geradores

de certa indústria automobilística:

1,92 1,72 1,82 1,80 1,84

Antes de calcular a variância, é necessário calcular a média ( X ). Logo:

1,92 1,72 1,82 1,80 1,84 9,11,82

5 5X

+ + + += = =

( ) ( ) ( ) ( ) ( ) ( )

( ) ( ) ( ) ( ) ( )

22 2 2 2 2

2

2 2 2 2 2

1,92 1,82 1,72 1,82 1,82 1,82 1,80 1,82 1,84 1,82

1 5 1

0,1 0,1 0 0,02 0,02 0,01 0,01 0 0,0004 0,0004

4 40,0208

0,0052.4

iX XS

n

− − + − + − + − + −= =

− −

+ − + + − + + + + += = =

= =

Page 38: [Apostila] Estatística Aplicada a Engenharia I

EST0323– Estatística Aplicada a Engenharia I – Prof. Msc. André Luiz Sena da Rocha

[email protected]

35

Exercício 1.13: Calcule a variância do número de incisões feitas em três crianças numa cirurgia dos

membros superiores e inferiores. Comenta sobre a variabilidade.

Laboratório Corpo de prova

I II III IV

A 2,59 1,45 1,09 4,79

B 1,99 1,99 1,99 1,99

C 0,80 0,01 3,98 7,59

IMPORTANTE: Quando os dados estão dispostos em uma tabela de distribuição de frequência

(simples ou em classes), utilizam-se as seguintes fórmulas:

1º Caso – Frequência Simples

( )

⋅−⋅

−= ∑ ∑

n

fxfx

ns

ii

2

22

1

1 ( )

⋅−⋅= ∑ ∑

N

fxfx

N

ii

2

22 1σ

2º Caso – Frequência em Classes

( )

⋅−⋅

−= ∑ ∑

n

fPmfPm

ns

2

22

1

1 ( )

⋅−⋅= ∑ ∑

N

fPmfPm

N

2

22 1σ

ATENÇÃO: “Desvantagem” do uso da variância

No cálculo da variância, quando elevamos ao quadrado a diferença )x(x i −−−− , a unidade de

medida da série fica também elevada ao quadrado.

Portanto, a variância é dada sempre no quadrado da unidade de medida da série. Se os dados

são expressos em metros, a variância é expressa em metros quadrados. Em algumas situações, a

unidade de medida da variância nem faz sentido. É o caso, por exemplo, em que os dados são

expressos em litros. A variância será expressa em litros quadrados.

Logo, o valor da variância não pode ser comparado diretamente com os dados da série, ou

seja: variância não tem interpretação.

Solução: Utilizar o DESVIO PADRÃO como medida.

Page 39: [Apostila] Estatística Aplicada a Engenharia I

EST0323– Estatística Aplicada a Engenharia I – Prof. Msc. André Luiz Sena da Rocha

[email protected]

36

1.7.2 - Desvio Padrão

Medida de dispersão que apresenta as propriedades da variância e tem a mesma unidade de

medida dos dados. É a raiz quadrada da variância.

Notações:

1) Quando a sequência de dados representa uma população a variância será denotada por 2σ e o

desvio padrão correspondente por σ .

2) Quando a sequência de dados representa uma amostra a variância será denotada por 2S e o

desvio padrão correspondente por S .

Desvio Padrão Populacional (σ) ⇒ ( )2

iX X

−=∑

Desvio Padrão Amostral (s) ⇒ ( )2

1

iX XS

n

−=

OBS: Quanto maior o valor do desvio padrão significa que mais dispersos estão os elementos

em torno da média.

Exercício 1.14: Calcule o desvio-padrão do Exercício 1.13.

Interpretação do Desvio Padrão

O desvio padrão é, sem dúvida, a mais importante das medidas de dispersão.

É fundamental que o interessado consiga relacionar o valor obtido do desvio padrão com os

dados da série. Quando uma curva de frequência representativa da série é perfeitamente simétrica (

MoMdX ======== ), podemos afirmar que os intervalos:

] x ,x[ σσσσσσσσ ++++−−−− contém aproximadamente 68% dos valores da série.

]2 x ,2x[ σσσσσσσσ ++++−−−− contém aproximadamente 95% dos valores da série.

]3 x ,3x[ σσσσσσσσ ++++−−−− contém aproximadamente 99% dos valores da série.

Page 40: [Apostila] Estatística Aplicada a Engenharia I

EST0323– Estatística Aplicada a Engenharia I

OBS: Quando a distribuição não é perfeitamente simétrica, estes percentuais apresentam pequenas

variações para mais ou para menos, segundo

as três propriedades definidas acima não ocorrem com exatidão.

Exemplo 1.25: Suponha uma série com média

estes valores da seguinte forma:

1. Os valores da série estão concentrados em torno de 100.

2. O intervalo [95, 105] contém aproximadamente 68% dos valores da série.

O intervalo [90, 110] contém aproximadamente 95% dos valores da série.

O intervalo [85, 115] contém aproximadamente 99% dos valores da série.

Estatística Aplicada a Engenharia I – Prof. Msc. André Luiz Sena da Rocha

[email protected]

Quando a distribuição não é perfeitamente simétrica, estes percentuais apresentam pequenas

variações para mais ou para menos, segundo o caso. Ou seja, na presença de assimetria ou

as três propriedades definidas acima não ocorrem com exatidão.

Suponha uma série com média 100====x e desvio padrão 5====σσσσ

Os valores da série estão concentrados em torno de 100.

O intervalo [95, 105] contém aproximadamente 68% dos valores da série.

O intervalo [90, 110] contém aproximadamente 95% dos valores da série.

15] contém aproximadamente 99% dos valores da série.

37

Quando a distribuição não é perfeitamente simétrica, estes percentuais apresentam pequenas

o caso. Ou seja, na presença de assimetria ou outliers,

5 , podemos interpretar

Page 41: [Apostila] Estatística Aplicada a Engenharia I

EST0323– Estatística Aplicada a Engenharia I – Prof. Msc. André Luiz Sena da Rocha

[email protected]

38

1.7.3 - Coeficiente de Variação

Dissemos antes que, por serem as unidades do desvio-padrão as mesmas que as unidades dos

dados originais, é mais fácil entender o desvio-padrão do que a variância. No entanto, aquela

mesma propriedade torna difícil comparar a variação para valores originados de diferentes

populações, ou seja, quando as medidas de duas ou mais variáveis são expressas em unidades

diferentes como peso/altura, capacidade/comprimento, etc. Usa-se então o Coeficiente de Variação

(CV), que é uma medida relativa, que expressa o desvio padrão como uma porcentagem da média

aritmética e ele não tem unidade específica. Quanto mais próximo de zero, mais homogênea é a

distribuição. Quanto mais distante, mais dispersas.

O CV mede a dispersão em relação à média. É a razão entre o desvio padrão e a média. O

resultado obtido dessa operação é multiplicado por 100, para que o coeficiente de variação seja

dado em porcentagem.

100s

CVX

= ⋅

ANÁLISE

1. DISPERSÃO BAIXA: CV ≤ 15%

2. DISPERSÃO MÉDIA: 15% ≤ CV ≤ 30%

3. DISPERSÃO ALTA: CV ≥ 30%

OBS.: Um CV alto indica que a dispersão dos dados em torno da média é muito grande.

Exemplo 1.26: Alturas e Pesos de Homens. Usando os dados amostrais de alturas e pesos de 40

homens de uma turma de estatística, encontramos as estatísticas dadas na tabela a seguir.

Média - X Desvio padrão - S

Altura (cm) 168 7,56

Peso (kg) 72 10,98

Calcule o coeficiente de variação para altura e peso, e a seguir, compare os dois resultados.

Page 42: [Apostila] Estatística Aplicada a Engenharia I

EST0323– Estatística Aplicada a Engenharia I – Prof. Msc. André Luiz Sena da Rocha

[email protected]

39

Solução:

CV para Altura: 7,56

100 100 0,045 100 4,5%.168Altura

SCV

X= ⋅ = ⋅ = ⋅ =

CV para Peso: 10,98

100 100 0,1525 100 15,25%.72Peso

SCV

X= ⋅ = ⋅ = ⋅ =

Reparem que se fôssemos comparar apenas o desvio padrão (fazendo isso já estaríamos

errando, pois não se podem comparar desvios-padrão de populações com unidades de medição

diferentes, neste caso cm e kg), iríamos erroneamente deduzir que as duas populações tinham

variabilidade muito próximas. No entanto, ao calcular os coeficientes de variação para as duas

populações, analisa-se que a variabilidade das alturas dos homens é quase quatro vezes menos que a

variabilidade dos pesos. Isso faz sentido intuitivamente, porque vemos rotineiramente que os pesos

entre homens variam muito mais do que as alturas. Por exemplo, é muito raro ver dois homens

adultos com um deles tendo duas vezes a altura do outro, mas é muito comum ver dois homens com

um deles pesando duas vezes o peso do outro.

Exercício 1.14: Em um grupo de pacientes, foram tomadas as pulsações (batidas por minuto) e

dosadas as taxas de ácido úrico (mg/100ml). Mas médias e os desvios-padrão foram:

Variável Média - Desvio padrão - S

Pulsação 68,7 8,7

Ácido úrico 5,46 1,03

Compare a dispersão da Pulsação com as taxas de ácido úrico.

1.8 - Análise Exploratória de Dados

1.8.1 - Esquema dos 5-Números

No caso de uma distribuição com outliers, não é ideal representar um conjunto de valores

com o uso da média e do desvio-padrão, pois devido a presença de valores extremos, elas foram

afetados. Tukey (1970, 1977) sugeriu o uso de cinco medidas para analisar casos como esse, sendo

elas:

Page 43: [Apostila] Estatística Aplicada a Engenharia I

EST0323– Estatística Aplicada a Engenharia I – Prof. Msc. André Luiz Sena da Rocha

[email protected]

40

a) Limite Inferior (Li) e Limite Superior ( Ls)

b) Q1, Q2 e Q3

Forma de representação:

Notações:

a) Q3 - Q1 = Intervalo interquartil (dj)

b) Me - Li = Dispersão inferior

c) Ls - Me = Dispersão superior.

Estas cinco medidas são chamadas de estatística de ordem e são medidas resistentes de

posição de uma distribuição. Dizemos que uma medida de posição é resistente quando for pouco

afetada por mudanças de uma pequena porção dos dados. A mediana é uma medida resistente, ao

passo que a média não o é.

1.8.2 – BOX-PLOT

É a representação gráfica dos 5-números, em que são destacados o intervalo interquartil (dj)

e as observações discrepantes, ou seja: valores menores que Q dj13

2− ou maiores que Q dj3

3

2+ . (Os

pontos discrepantes são representados por um asterisco ou travessão).

O desenho esquemático (Figura abaixo) dá uma ideia da posição, dispersão, assimetria,

caudas e dados discrepantes. A posição central dos valores é dada pela mediana e a dispersão por dj.

As posições relativas de Q1, Q2 e Q3, dão uma noção da assimetria. As caudas são as linhas acima e

abaixo do retângulo (ou caixa).

Ls Q2 = Med Li Q3 Q1

Page 44: [Apostila] Estatística Aplicada a Engenharia I

EST0323– Estatística Aplicada a Engenharia I – Prof. Msc. André Luiz Sena da Rocha

[email protected]

41

(Q3 + 3/2dj) LS Q1 LI (Q1 - 3/2dj)

Q2 = Med

Q3

Desenho esquemático do Box-plot

Exemplo 1.27: Os dados abaixo são referentes ao tempo em segundos até uma reação química

realizada em 40 tubos de ensaio. Construa um Boxplot e faça uma breve descrição sobre os dados.

47,5 50 50 57,5 60 62,3 63,2 63,56 64,5 65,1 72,2 72,3 74,1 74,8

75,7 76,2 79 79,2 79,3 81,5 82,1 84 85,3 88,1 88,5 90 92,6 94,7

95,5 96 98,3 98,7 99,2 100 101,2 110 122,7 125,9 134,6 136,2

O que vamos precisar:

LI = 47,5

LS = 136,2

1

2

3

1 4010 elemento = 65,1

4 42 40

20 elemento = 81,54

3 4030 elemento = 96

4

o

o

o

x nQ

Q Mediana

Q

⋅ ⋅= = =

⋅= = =

⋅= =

dj = Q3 - Q1 = 96 – 65,1 = 30,9.

Me - Li = 81,5 – 47,5 = 34

Page 45: [Apostila] Estatística Aplicada a Engenharia I

EST0323– Estatística Aplicada a Engenharia I

Ls - Me = 136,2 – 81,5 = 54,7

Assim, podemos calcular os limites que informarão se há pontos discrepantes (

3

1

3 396 30,9 142,35

2 2

3 365,1 30,9 18,75

2 2

Q dj

Q dj

+ = + =

− = − =

Logo, não há nenhum outlier, uma vez que não existe nenhum

segundos ou com tempo inferior a

1. Podemos analisar que 25% dos

e que metade deles houve reação em

reação química acima de 81 segundos

2. Analisa-se também que 75% dos

25% delas no mínimo 96 s.

3. Chama-se atenção que a reação mais rápida

segundos.

4. Não há outliers na distribuição dos dados.

Estatística Aplicada a Engenharia I – Prof. Msc. André Luiz Sena da Rocha

[email protected]

Assim, podemos calcular os limites que informarão se há pontos discrepantes (

96 30,9 142,35

65,1 30,9 18,75

, uma vez que não existe nenhuma reação com tempo superior

tempo inferior a 18 segundos. O gráfico é representado abaixo:

Podemos analisar que 25% dos experimentos tiveram uma reação química em

houve reação em até 81 segundos. Assim como na outra

segundos.

se também que 75% dos reações ocorreram no máximo em 96 segundos

a reação mais rápida foi em 47 segundos e a mais demorada,

na distribuição dos dados.

42

Assim, podemos calcular os limites que informarão se há pontos discrepantes (outliers).

empo superior a 142

. O gráfico é representado abaixo:

experimentos tiveram uma reação química em até 65 segundos,

na outra metade, teve

segundos, assim como,

a mais demorada, de 136

Page 46: [Apostila] Estatística Aplicada a Engenharia I

EST0323– Estatística Aplicada a Engenharia I – Prof. Msc. André Luiz Sena da Rocha

[email protected]

43

UNIDADE II

PROBABILIDADE

A Teoria da probabilidade é útil para analisar situações que envolvem o acaso. Jogos de

dados e de cartas, ou o lançamento de uma moeda para o ar. As distribuições de probabilidade

incorporam a estatística descritiva e a teoria da probabilidade. Ambas formam a base da inferência

estatística. Algumas aplicações:

- Na maioria dos jogos esportivos (futebol, basquete, surfe...), até certo ponto;

- Na decisão de parar de imunizar pessoas com menos de 20 anos contra determinada doença;

- Na decisão de arriscar-se a atravessar uma rua no meio do quarteirão;

- Na engenharia, com uso na tomada de decisões, sendo aplicado principalmente conceitos de

planejamento de experimentos e amostragem;

- Todas utilizam a probabilidade consciente ou inconscientemente.

2.1 - Experimentos Aleatórios

São experimentos que ao serem repetidos nas mesmas condições não produzem sempre o mesmo

resultado, ou seja, exibem variação nos seus resultados.

Exemplo 2.1: Considere alguns exemplos de experimentos aleatórios, denotados aqui por ε.

• ε1: Tempo, em horas, até a falha de um equipamento;

• ε2: Número de itens defeituosos em uma linha de produção em um período de 24 horas;

• ε3: Ocorrência ou não da ruptura de uma viga a um peso x em toneladas;

• ε4: A sequência de caras e coroas verificada no lançamento de uma moeda 4 vezes;

• ε5: Lançamento de uma moeda até que apareça cara pela primeira vez.

Embora não sejamos capazes de afirmar qual o particular resultado deste experimento, poderemos

descrever o conjunto de todo os seus possíveis resultados.

Page 47: [Apostila] Estatística Aplicada a Engenharia I

EST0323– Estatística Aplicada a Engenharia I – Prof. Msc. André Luiz Sena da Rocha

[email protected]

44

2.2 - Espaço Amostral

Denotado por S ou Ω, é definido como o conjunto de todos os possíveis resultados de um

experimento aleatório.

Exemplo 2.2: Consideramos a seguir o espaço amostral associado a cada um dos experimentos

citados no Exemplo 2.1.

• Tempo, em horas, até a falha de um equipamento;

Ω1 = t ; t ≥ 0

• Número de itens defeituosos em uma linha de produção em um período de 24 horas;

Ω2 = 0, 1, ..., n; sendo n o número máximo de itens produzidos em 1 dia.

• Ocorrência ou não da ruptura de uma viga a um peso x em toneladas;

Ω3 = sim , não

• A sequência de caras e coroas verificada no lançamento de uma moeda 4 vezes;

Ω4 = cccc, ccck, cckc, ckcc, kccc, kkkk, kkkc, kkck, kckk, ckkk, cckk, ckck, kckc, kkcc, ckkc, kcck

• Lançamento de uma moeda até que apareça cara pela primeira vez.

Ω5 = c, kc, kkc, kkkc, kkkkc, ...

2.3 - Eventos

É um subconjunto de um espaço amostral.

Exemplo 2.3: Os eventos Ai a seguir referem-se aos espaços amostrais dados no Exemplo 2.2.

• Tempo, em horas, até a falha de um equipamento;

A1 = “ ocorre falha em menos de 3 horas ” A1 = t, t > 3;

• Número de itens defeituosos em uma linha de produção em um período de 24 horas;

A2 = “ menos de 5 itens defeituosos ” A2 = 0, 1, 2, 3, 4 ;

• Ocorrência ou não da ruptura de uma viga a um peso x em toneladas;

A3 = “ viga com ruptura” A3 = sim ;

• A sequência de caras e coroas verificada no lançamento de uma moeda 4 vezes;

A4 = “ somente caras ” A4 = cccc ;

• Lançamento de uma moeda até que apareça cara pela primeira vez.

A5 = “ apareça cara em até 3 lançamentos ” A5 = c, kc, kkc .

Page 48: [Apostila] Estatística Aplicada a Engenharia I

EST0323– Estatística Aplicada a Engenharia I

Obs: Também são eventos o próprio

conjunto vazio Ø (chamado de evento impossível

individual de Ω.

Dado que os eventos associados a um espaço amostral são por sua vez conjuntos, podemos

efetuar as operações do tipo: união, intercessão, complementação e diferença,

às respectivas operações que se realizam com os subconjuntos de qualquer conjunto abstrato, e

formar a partir destas operações, novos eventos tais como:

• ouAx:xBA ∈=∪

A ou sempre que ocorre B, e somente neste caso.

• eAx:xBA ∈=∩

ocorrem A e B simultanea

• Ac = x : x ∈ Ω, x ∉

ocorre, (e não ocorre, se A ocorre). Claramente nota

• A – B = x : x ∈ A e x

ocorre A e não ocorre B.

Estatística Aplicada a Engenharia I – Prof. Msc. André Luiz Sena da Rocha

[email protected]

Também são eventos o próprio Ω (chamado de evento certo, ou seja, sempre ocorre),

evento impossível, ou seja, nunca ocorre), ou qualquer resultado

Dado que os eventos associados a um espaço amostral são por sua vez conjuntos, podemos

união, intercessão, complementação e diferença,

às respectivas operações que se realizam com os subconjuntos de qualquer conjunto abstrato, e

formar a partir destas operações, novos eventos tais como:

Bxou ∈ , isto é: A ∪ B é o evento que ocorre sempre que ocorre

A ou sempre que ocorre B, e somente neste caso.

A B∪

Bx ∈ isto é: A ∩ B é o evento que ocorre somente quando

simultaneamente.

A B∩

A, isto é Ac é o evento contrário de A, somente ocorre se A não

ocorre, (e não ocorre, se A ocorre). Claramente nota-se que Ac ∪ A =

A e x ∉ B, isto é: (A – B) é o evento que ocorre unicamente quando

ocorre A e não ocorre B.

A-B

A B

A Ac

45

, ou seja, sempre ocorre), o

, ou qualquer resultado

Dado que os eventos associados a um espaço amostral são por sua vez conjuntos, podemos

união, intercessão, complementação e diferença, de forma semelhante

às respectivas operações que se realizam com os subconjuntos de qualquer conjunto abstrato, e

B é o evento que ocorre sempre que ocorre

B é o evento que ocorre somente quando

é o evento contrário de A, somente ocorre se A não

A = Ω.

B) é o evento que ocorre unicamente quando

Page 49: [Apostila] Estatística Aplicada a Engenharia I

EST0323– Estatística Aplicada a Engenharia I – Prof. Msc. André Luiz Sena da Rocha

[email protected]

46

Quando dois eventos são tais que, eles nunca podem ocorrer simultaneamente, neste caso se

tem que A ∩ B = ∅, eles são chamados eventos mutuamente exclusivos ou mutuamente

excludentes, (em termos de conjunto, diríamos que são conjuntos disjuntos). Seguem-se exemplos,

para melhor esclarecer do acima exposto.

Ex. 1. Uma fábrica produz processadores para computador. Da linha de produção são

retirados 03 processadores e cada um testado. Classificando como B (bom) ou D (defeituoso). Um

espaço amostral associado ao experimento é:

ΩΩΩΩ = BBB, DDD, BBD, DBB, DDB, DBD, BDD, BDB

Ex. 2. Considere o experimento que consiste em selecionar uma família aleatoriamente, em

certo distrito do Seridó, e verificar o nº de filhos que esta família já registrou. Um espaço amostral

associado a este experimento é:

ΩΩΩΩ = 0, 1, 2, 3, 4, ...

Ex. 3. Seja agora o experimento que consiste em retirar uma lâmpada de um lote e medir

seu tempo de vida antes de se queimar. Um espaço amostral pode ser:

ΩΩΩΩ = R+, isto é, ΩΩΩΩ = t : t ≥ 0

Ex. 4. Um dado é lançado e o nº que aparece na face superior é observado. Um espaço

amostral é:

ΩΩΩΩ = 0, 1, 2, 3, 4, 5, 6

Com exceção do exemplo 3, que é contínuo, todos os demais são espaços amostrais do tipo

chamado discreto. Um espaço amostral é discreto quando é formado por um conjunto contável

(finito ou infinito). Caso contrário, ele é dito contínuo.

Consideremos novamente o Ex. 1. Sejam os eventos associados a este espaço, tais como:

• A = “obter dois processadores defeituosos”. Logo, A = DDB, DBD, BDD

• B =“obter no mínimo 1 processador bom”. Logo, B=DDB, DBD, BDD, BBD, BDB, DBB,

BBB

• C = “obter no máximo 1 processador defeituoso”. Logo, C = BBB, BBD, BDB, DBB

Então poderemos ter, por exemplo, os novos eventos (resultantes das operações).

• A ∩ B = DDB, DBD, BDD = A

• A ∩ C = ∅, (portanto A e C são incompatíveis ou mutuamente exclusivos ou excludentes).

• A ∪ C = BBB, BBD, DBB, DDB, DBD, BDD, BDB

• Bc = DDD, (portanto Bc é um evento elementar).

Page 50: [Apostila] Estatística Aplicada a Engenharia I

EST0323– Estatística Aplicada a Engenharia I – Prof. Msc. André Luiz Sena da Rocha

[email protected]

47

Consideremos agora o exemplo 3 (espaço amostral contínuo), e seja A o evento dado por:

A = “o tempo de vida da lâmpada é inferior a 20 horas”. Então, A = t : 0 ≤ t < 20 e Ac = (t ≥ 20.

Naturalmente que A ∪ Ac = (t : t ≥ 0) = Ω é o evento certo. E observe que, sempre,

A∩Ac=∅, para qualquer evento A.

Obs: Vale a pena lembrar as leis de MORGAN, referente a álgebra de conjuntos:

• (A ∪ B)c = Ac ∩ Bc (o complementar da união é igual à interseção dos complementares)

• (A ∩ B)c = Ac ∪ Bc (o complementar da interseção é igual à união dos complementares)

2.4 - Resultados Equiprováveis

Muitos experimentos aleatórios sugerem que os distintos resultados de um espaço amostral

finito estejam associados, cada um deles, a um mesmo valor p, que representa a probabilidade de

sua ocorrência. Por exemplo, em um lançamento de um dado honesto se tem que o espaço amostral

finito é formado por:

ΩΩΩΩ = 1, 2, 3, 4, 5, 6

e cada ponto amostral tem a mesma probabilidade de ocorrência que será neste caso, p = 1/6.

Suponha, por exemplo, que sorteamos numa urna com n bolas numeradas, 1, 2, 3, ..., n, uma

bola ao acaso. A probabilidade de cada bola (cada ponto amostral) será 1/n. Se um evento A,

associado a este espaço é formado por K pontos, digamos A = 1, 2, ..., 10, (n>10), então se tem :

1 10( ) 10P A

n n = =

nº de elementos do evento casos favoráveis( )

nº de elementos do espaço casos possíveis

AP A = =

Ω

Page 51: [Apostila] Estatística Aplicada a Engenharia I

EST0323– Estatística Aplicada a Engenharia I – Prof. Msc. André Luiz Sena da Rocha

[email protected]

48

2.5 – Definições de Probabilidade

ABORDAGEM CLÁSSICA

Seja Ω um espaço amostral finito, formado por n eventos equiprováveis. Seja A um evento de Ω

com m destes elementos. Então a probabilidade de A é a fração

P(A) = m / n

Exemplo 2.4. Considere o lançamento de um dado “honesto”. Queremos obter a probabilidade da

ocorrência de um número par.

O espaço amostral associado é Ω = 1, 2, 3, 4, 5, 6.

Resultados de Ω disjuntos e equiprováveis. Se definimos A = “número par” = 2, 4, 6, a

probabilidade deste evento é dada por P(A) = 3/6 = 1/2.

Exemplo 2.5. Considere o lançamento de duas moedas. Queremos saber a probabilidade do evento

A=“duas caras”. Considere o espaço amostral Ω1 = “duas caras”, “duas coroas”, “uma cara e

uma coroa”.

Se usamos a definição acima com este espaço amostral, diríamos que P(A) = 1/3. Esta resposta é

falsa, pois os elementos de Ω1 não são equiprováveis. O espaço amostral equiprovável seria

Ω=cc, ck, kc, kk e como A = cc temos que P(A) = 1/4.

ABORDAGEM FREQUENTISTA

Suponha que lançamos um dado conhecido por favorecer a ocorrência do número 3.

- Os 6 eventos elementares do espaço amostral são igualmente prováveis?

o NÃO!

- Qual a probabilidade da ocorrência do número 1?

o A definição clássica não nos ajuda neste caso. Pois os eventos não são equiprováveis.

Limitações da definição clássica: Só se aplica a espaços amostrais finitos e equiprováveis. Assim,

levaram a considerar outra forma de calcular probabilidade de um evento partindo da frequência

relativa do evento ao se repetir o experimento, n vezes, sob as mesmas condições.

Page 52: [Apostila] Estatística Aplicada a Engenharia I

EST0323– Estatística Aplicada a Engenharia I

Definição: Podemos definir P(A)

repetições independentes de um experimento, com n tendendo ao in

número de vezes em que o evento A ocorreu nas n repetições independentes de um expe

dizemos então que

Na prática a probabilidade de A é aproximada pela frequência relativa do evento em um certo

número de repetições.

Exemplo 2.6. Considere uma certa

desconhecida. Para se obter essa

independentes de cada lançamento. A Tabela 1 e a Figura 1 a seguir mostram os resultados obtidos.

Figura 1: Frequência relativa de “cara”

Tabela 1: Frequência relativa de “cara”

n 10 100 200

F(A) 0,800 0,520 0,595

Estatística Aplicada a Engenharia I – Prof. Msc. André Luiz Sena da Rocha

[email protected]

P(A) como o limite da frequência relativa da ocorrência de A em n

repetições independentes de um experimento, com n tendendo ao infinito, ou seja, se #(A) é o

número de vezes em que o evento A ocorreu nas n repetições independentes de um expe

#( )( ) lim

n

AP A

n→∞=

Na prática a probabilidade de A é aproximada pela frequência relativa do evento em um certo

Considere uma certa moeda cuja probabilidade de ocorrência

essa probabilidade, esta moeda é submetida

de cada lançamento. A Tabela 1 e a Figura 1 a seguir mostram os resultados obtidos.

Figura 1: Frequência relativa de “cara”

de “cara”

300 ... 1600 1800 2000 2300

0,5000 ... 0,506 0,509 0,501 0,496

49

como o limite da frequência relativa da ocorrência de A em n

finito, ou seja, se #(A) é o

número de vezes em que o evento A ocorreu nas n repetições independentes de um experimento,

Na prática a probabilidade de A é aproximada pela frequência relativa do evento em um certo

ocorrência de “cara” é

submetida a n repetições

de cada lançamento. A Tabela 1 e a Figura 1 a seguir mostram os resultados obtidos.

2300 2600

0,496 0,499

Page 53: [Apostila] Estatística Aplicada a Engenharia I

EST0323– Estatística Aplicada a Engenharia I – Prof. Msc. André Luiz Sena da Rocha

[email protected]

50

ABORDAGEM AXIOMÁTICA

A abordagem axiomática é motivada pelas definições clássica e frequentista. Ela representa uma

proposta para dar à teoria da probabilidade uma base matemática sólida. Assim, é nesta abordagem

que se baseiam as propriedades estabelecidas daqui em diante.

Este conceito de probabilidade se estabelece a partir de uma função real P(A), definida sobre

os eventos associados a um espaço amostral, a qual faz corresponder a cada subconjunto A, de Ω

(sendo este subconjunto um evento), um nº real, tal que cumpra os seguintes axiomas:

a) 0 ≤ P(A) ≤ 1

b) P(Ω) = 1

c) Se A e B são eventos mutuamente exclusivos, isto é A ∩ B = ∅, então se tem que

P(A∪B) = P(A) + P(B).

Obs: Esta definição axiomática é mais abrangente que a regra de Laplace, dado que a definição

clássica se limita aos espaços amostrais finitos equiprováveis.

Teoremas Fundamentais do Cálculo das Probabilidades

a) Se ∅ é um conjunto vazio, então P(∅∅∅∅) = 0;

b) Sejam A e B eventos quaisquer, então P(A ∪∪∪∪ B) = P(A) + P(B) – P(A ∩∩∩∩ B);

c) Se Ac é o complementar de A, então P(Ac) = 1 – P(A);

d) Se A ⊂ B então P(A) ≤≤≤≤ P(B);

2.6 - Probabilidade Condicional

Sejam A e D, eventos quaisquer, associados a um espaço amostral sendo P(D) > 0. Muitos

problemas envolvem o cálculo da probabilidade da ocorrência de A, quando já se tem a informação

de que houve a ocorrência de D. Isto é, a probabilidade de A será calculada considerando-se a

condição de que já houve a ocorrência de D. Esta nova informação (de que D ocorreu) equivale a

restringir o espaço amostral, que agora será considerado como o conjunto dos pontos amostrais que

formam o evento D. A probabilidade de A, dentro desta condição, chama-se “probabilidade

condicional de A, dado que D ocorreu”. Na qual será escrita sob a forma: P(A / D), sendo definida

como:

Page 54: [Apostila] Estatística Aplicada a Engenharia I

EST0323– Estatística Aplicada a Engenharia I – Prof. Msc. André Luiz Sena da Rocha

[email protected]

51

)D(P

)DA(P)D/A(P

∩= , com P(D) > 0

Desta relação acima, obtemos a chamada REGRA DO PRODUTO DE PROBABILIDADE,

dada por:

P(A ∩∩∩∩ D) = P(D) · P(A / D) ou P(A ∩∩∩∩ D) = P(A) · P(D / A)

Esta regra pode ser estendida para mais de dois eventos: Sejam A1, A2, … , An eventos quaisquer

associados a Ω, então:

P(A1 ∩∩∩∩ A2 ∩∩∩∩ ... ∩∩∩∩ An) = P(A1)·P(A2/A1)·P(A3/A1 ∩∩∩∩ A2)· ...· P(An/A1 ∩∩∩∩ A2 ∩∩∩∩ … ∩∩∩∩ An-1)

Exemplo 2.7: Um par de dados “honestos” é lançado. Qual a probabilidade de ocorrer o nº 2 em

pelo menos um dos dados, se já tem a informação de que ocorreu que a soma dos nº é igual a seis?

Solução:

Sejam os eventos: A: “a soma dos dois dados é 6”

B: “ocorre o nº 2 em pelo menos um dos dados”

)A(P

)BA(P)A/B(P

∩=

# Ω = 6 x 6 = 36

A = (1,5), (2,4), (3,3), (4,2), (5,1) ⇒ # A = 5 P(A)=5/36

B = (2,1), (2,2), (2,3), (2,4), (2,5), (2,6), (1,2), (3,2), (4,2), (5,2), (6,2) ⇒ # B = 11 P(B)=11/36

A ∩ B = (2,4), (4,2) ⇒ # (A ∩ B) = 2 P(A ∩ B) = 2/36

Portanto, 2( ) 236( / )5( ) 5

36

P A BP B A

P A

∩= = = .

Exemplo 2.8: Consideremos novamente o lançamento de dois dados “honestos”. Qual a

probabilidade de ocorrer a soma igual a 6, sabendo-se que em um dos dados apareceu o nº 2”?

Solução:

Agora pede-se P(A/B). Portanto 2( ) 236( / )

11( ) 1136

P A BP A B

P B

∩= = = .

Page 55: [Apostila] Estatística Aplicada a Engenharia I

EST0323– Estatística Aplicada a Engenharia I – Prof. Msc. André Luiz Sena da Rocha

[email protected]

52

Exemplo 2.9: Para a 3ª avaliação de estatística, um professor indica os 10 primeiros capítulos do

livro adotado e diz que elaborará 10 problemas, numerados de 1 a 10, onde cada um deles será

baseado no respectivo capítulo a ser estudado (ex: problema 1 – capítulo 1, etc.) O professor avisa

que a prova constará de apenas 3 destes 10 problemas, os quais serão sorteados no início da

avaliação aleatoriamente, um após outro, entre 10 papeizinhos numerados de 1 a 10, que

corresponderão aos respectivos problemas. Um estudante, por causa da festa da padroeira, somente

estudou os 4 primeiros capítulos.

a) Qual a probabilidade de que “caia” na avaliação somente capítulos que ele tenha estudado?

b) Qual a probabilidade de que somente no 3º sorteio (a 3ª questão) “caia” exatamente um

ponto que ele não estudou?

Solução:

Sejam os eventos:

A1 = “No 1º sorteio “cai” um ponto que ele estudou”

A2 = “No 2º sorteio “cai” um ponto que ele estudou”

A3 = “No 3º sorteio “cai” um ponto que ele estudou”

B = “No 3º sorteio “cai” um ponto que ele não estudou”

a) (A1 ∩ A2 ∩ A3) = P(A1)·P(A2/A1)·P(A3/A1∩ A2) = 4/10 · 3/9 · 2/8 = 1/30

b) (A1 ∩ A2 ∩ B) = P(A1)·P(A2/A1)·P(B/A1∩ A2) = 4/10 · 3/9 · 6/8 = 1/10

Exercício 2.1: Discos de plástico de policarbonato, provenientes de um fornecedor, são analisados com relação à resistência a arranhões e a choque. Os resultados de 130 discos estão resumidos a seguir:

RESISTÊNCIA AO CHOQUE

Alta Baixa

RESISTÊNCIA A

ARRANHÕES

Alta 90 9

Baixa 16 15

Determine as seguintes probabilidades:

1) Probabilidade de o disco ter alta resistência a choque.

2) Probabilidade de o disco ter alta resistência a choque sabendo que o disco tem alta

resistência a arranhões.

3) Probabilidade de o disco ter alta resistência a arranhões.

4) Probabilidade de o disco ter alta resistência a arranhões sabendo que ele tem alta resistência

a choque.

Page 56: [Apostila] Estatística Aplicada a Engenharia I

EST0323– Estatística Aplicada a Engenharia I – Prof. Msc. André Luiz Sena da Rocha

[email protected]

53

2.7 - Eventos Independentes

Definição: Um evento A é considerado independente de um outro evento B se a probabilidade de A

é igual a probabilidade condicional de A dado B, isto é:

P(A) = P(A/B)

Naturalmente, que, se A é independente de B, B é também independente de A, desta forma:

P(B) = P(B/A)

A partir do teorema do produto podemos afirmar que se os eventos A e B são independentes então

se tem: P(A ∩∩∩∩ B) = P(A) · P(B)

Têm-se n eventos: A1, A2, … , An, diremos que eles são independentes se e somente se, eles forem

independentes dois a dois; três a três; quatro a quatro; n a n.

P(A1 ∩∩∩∩ A2) = P(A1) · P(A2)

P(A1 ∩∩∩∩ A2 ∩∩∩∩ A3) = P(A1) · P(A2) · P(A3)

P(A1 ∩∩∩∩ A2 ∩∩∩∩ A3∩∩∩∩ A4) = P(A1) · P(A2) · P(A3) · P(A4)

. . . . .

. . . . .

. . . . .

P(A1 ∩∩∩∩ A2 ∩∩∩∩ ... ∩∩∩∩ An) = P(A1) · P(A2) · ... · P(An-1) · P(An)

Exemplo 2.10: Um lote de 165 chips semicondutores contém 40 itens defeituosos. Dois deles são

selecionados, ao acaso, sem reposição.

a) Qual a probabilidade de que o primeiro chip selecionado seja defeituoso?

b) Qual a probabilidade de que o segundo chip selecionado seja defeituoso, sabendo que o

primeiro deles foi defeituoso?

c) Qual a probabilidade de que ambos sejam defeituosos?

d) Como a resposta do item (b) mudaria se os chips selecionados fossem repostos antes da

primeira seleção?

e) Caso realizássemos um sorteio com reposição de 5 chips semicondutores, qual a

probabilidade do 1º, 2º e o 5º serem defeituosos e os demais não serem defeituosos?

Page 57: [Apostila] Estatística Aplicada a Engenharia I

EST0323– Estatística Aplicada a Engenharia I – Prof. Msc. André Luiz Sena da Rocha

[email protected]

54

Solução:

Sejam os eventos:

D: O chip selecionado É defeituoso ND: O chip selecionado NÃO é defeituoso

a) P(D1) = 40/165 = 24,24%

b) P(D2|D1) = 39/164 = 23,78%

c) P(D1∩D2) = P(D1) P(D2|D1) = 0,2424 · 0,2378 = 5,76%

d) n = 2 COM Reposição Eventos independentes

P(D2|D1) = P(D2) = P(D1) = 24,24%

a) n = 5 COM Reposição P(D1∩D2 ∩ND3 ∩ND4 ∩D5)

P(D1)·P(D2|D1)·P(ND3|D1∩D2 )·P(ND4|D1∩D2 ∩ND3)·P(D5|D1∩D2 ∩ND3 ∩ND4)

Sob independência P(D1)·P(D2)·P(ND3)·P(ND4)·P(D5)

(0,2424)3 · (125/165)2 = (0,0142)·(0,5739) = 0,0081 = 0,81%

2.8 – Variável Aleatória Unidimensional

Ao descrever um espaço amostral de um experimento, não especificamos que um resultado

individual necessariamente seja um número. Por exemplo, ao descrever uma peça manufaturada,

podemos empregar apenas as categorias “defeituosa” e “não defeituosa”. Também, ao observar a

temperatura durante o período de 24 horas, podemos simplesmente registrar a curva traçada pelo

termógrafo. Contudo, em muitas situações experimentais, estaremos interessados na mensuração de

alguma coisa e no seu registro como um número. Mesmo nos casos mencionados acima, poderemos

atribuir um número a cada resultado (não numérico) do experimento. Por exemplo, poderemos

atribuir o valor 1 (um) às peças perfeitas e o valor 0 (zero) às defeituosas. Poderemos registrar a

temperatura máxima do dia, ou a temperatura mínima, ou a média das temperaturas máxima e

mínima. Consideremos um experimento aleatório ε, e seja Ω o espaço amostral associado a este

experimento.

Definição: Variável aleatória (que escrevemos de modo abreviado: v.a.) num espaço amostral Ω, é

uma função x, que associa Ω, (isto é, a cada ω ∈ Ω), um nº real, X(ω). Ver Figura abaixo.

Page 58: [Apostila] Estatística Aplicada a Engenharia I

EST0323– Estatística Aplicada a Engenharia I – Prof. Msc. André Luiz Sena da Rocha

[email protected]

55

ΩΩΩΩ X R

ω X(ω)

Como foi visto anteriormente em classificação de tipo de variáveis numéricas, as variáveis

aleatórias podem ser de dois tipos: discretas ou contínuas.

Exercício 2.2: Classifique com relação ao tipo de variável aleatória:

a) Tempo, em horas, até a falha de um equipamento;

b) Ocorrência ou não de hipertensão em um paciente;

c) Idade de pacientes de uma clínica de Pediatria;

d) Contágio ou não de uma doença;

e) Número de pessoas contagiadas com um vírus;

f) Nível de colesterol no sangue de um paciente;

A partir do estudo das variáveis aleatórias, foram definidos modelos probabilísticos (discretos e

contínuos) para as principais situações do cotidiano. Destes, estudaremos a seguir três modelos:

2.9 - Modelos de Probabilidade Discretos

Em muitos problemas teóricos e aplicados, e a primeira vista, sob diversas condições, várias

funções de probabilidade aparecem com tanta frequência que merecem ser estudadas. Nesta

Unidade, estudaremos o Modelo de Probabilidade Discreto de Bernoulli e Binomial.

2.9.1 - Distribuição de Bernoulli

Um experimento ou ensaio de Bernoulli é um experimento aleatório cujo resultado pode ser

classificado em duas categorias, chamadas de “sucesso” e “fracasso”. Uma v.a. que associa o valor

1 (com probabilidade p) à ocorrência de sucesso e o valor 0 (com probabilidade 1-p) à ocorrência de

fracasso em uma realização de um ensaio de Bernoulli é dita ter distribuição de Bernoulli.

Page 59: [Apostila] Estatística Aplicada a Engenharia I

EST0323– Estatística Aplicada a Engenharia I – Prof. Msc. André Luiz Sena da Rocha

[email protected]

56

Exemplo 2.11: Suspeita-se que uma moléstia contagiosa possa ter atingido os moradores de uma

região. Cada morador da região é classificado conforme tenha sido contagiado ou não.

Evento de interesse (Sucesso): A pessoa examinada foi contagiada.

Fracasso: A pessoa examinada NÃO foi contagiada.

Exemplo 2.11: Uma operação de enchimento tente encher embalagens de detergentes até o peso

especificado.

Evento de interesse (Sucesso): A embalagem do detergente está com o peso especificado.

Fracasso: A embalagem do detergente NÃO está com o peso especificado.

Exemplo 2.12: Dentre os portadores de um determinado vírus, foram avaliados, após a aplicação de

uma nova vacina teste, se cada um obteve cura ou não no determinado vírus.

Evento de interesse (Sucesso): O portador obteve a cura após a aplicação da nova vacina.

Fracasso: O portador do vírus NÃO obteve a cura após a aplicação da nova vacina.

A função de probabilidade da distribuição de Bernoulli é dada por:

( ) ( )11 , 0,1.

xxP X x p p x−

= = − =

em que p∈[0, 1].

Usaremos a notação X ~ Bernoulli (p). Observe que poderíamos também representar a distribuição

de X coma tabela abaixo:

X 0 1

P(X) 1 - p p

• Esperança (média) e Variância

Se X ~ Bernoulli (p) ( ) ( )11 , 0,1

xxP X x p p x−

= = − = , logo ;

pXE =)(

pqXVar =)(

Exemplo 2.13: Uma empresa de cimento têm no estoque 10 sacos que foram produzidos a 3

semanas, 20 sacos que foram produzidos a 2 semanas e 20 sacos produzidos a 3 dias. Retira-se um

saco de cimento do estoque. Seja X o evento em que o saco de cimento foi fabricado a 3 dias.

Determine a probabilidade de sucesso e fracasso.

Page 60: [Apostila] Estatística Aplicada a Engenharia I

EST0323– Estatística Aplicada a Engenharia I – Prof. Msc. André Luiz Sena da Rocha

[email protected]

57

Solução:

1, se o saco de ciemnto foi fabricado a 3 dias;

0, se o saco de ciemento NÃO foi fabricado a 3 dias.X

=

Podemos calcular a distribuição de X pela sua fórmula de distribuição de probabilidade, sendo esta

calculada abaixo:

( ) ( )11 , 0,1

xxP X x p p x−

= = − =

( )0 1 0

20 200 1 1 0,6 0,6

50 50P X

− = = − = ⋅ =

( )1 1 1

20 201 1 0, 4 1 0, 4

50 50P X

− = = − = ⋅ =

Logo, a distribuição de X pode ser representada por:

X 0 1

P(X) 0,6 0,4

Podemos calcula também a esperança e variância da v.a. X:

E(X)=p=0,4;

Var(X)=p(1-p)=0,4(1-0,4)=0,24.

2.9.2 - Distribuição Binomial

Consideremos n tentativas de um mesmo experimento aleatório. Cada tentativa admite

apenas dois resultados: fracasso com probabilidade q e sucesso com probabilidade p, p + q = 1. As

probabilidades de sucesso e fracasso são as mesmas para cada tentativa.

Seja X: nº de sucessos de n tentativas independentes. Vamos determinar a função de

probabilidades da variável X, isto é, P(X = k).

Um resultado particular (RP) seria: knk

F...FFFS...SSS−

Logo, a probabilidade de ocorrer esse resultado particular é dada por:

P(RP) = P(SSS ... SFFF ... F) = knk

q...qqp...p.p−

Considerando todas as n-úplas com k sucessos, temos:

( ) .k n knP X k p q

k−

= =

Page 61: [Apostila] Estatística Aplicada a Engenharia I

EST0323– Estatística Aplicada a Engenharia I – Prof. Msc. André Luiz Sena da Rocha

[email protected]

58

em que

X = Número de sucessos variando de 1 até n;

p = Probabilidade de sucesso em cada repetição;

1-p = Probabilidade de fracasso em cada repetição;

n = Número de repetições

A variável X tem distribuição Binomial, com parâmetros n e p, e indicaremos pela notação

X~Binomial (n, p).

• Esperança (média) e Variância

Se X ~ Binomial ( n, p ) ⇒ ( ) .k n knP X k p q

k−

= =

, logo ;

E( X ) = n·p

Var( X ) = n·p·q= n·p·(1-p)

O número esperado ou esperança de sucessos na distribuição Binomial é facilmente encontrado.

Intuitivamente, analise as duas perguntas a seguir:

- Se lançarmos uma moeda 100 vezes, qual o número esperado de caras (p=1/2)?

- Se lançarmos um dado 600 vezes, qual o número esperado de faces “5” (p=1/6)?

Solução:

1) X~Binomail (100; 0,5) E(X)=np=100·0,5=50.

Assim, se lançarmos uma moeda 100 vezes, esperamos que ocorram 50 caras. (Obs: Isso

quando estamos supondo que a moeda é honesta, ou seja, a probabilidade de cara e coroa é a

mesma, que nessa situação é igual a 1/2).

2) X~Binomail (600; 1/6) E(X)=np=600·(1/6)=100.

Assim, se lançarmos um dado 600 vezes, esperamos que o número de faces “5” ocorra 100

vezes.

Exemplo 2.14: Uma prova tem 10 questões independentes de igual pontuação. Cada questão tem 5

alternativas. Apenas uma das alternativas é a correta. Se um aluno resolve a prova respondendo a

esmo as questões, qual a probabilidade de tirar nota 6?

Page 62: [Apostila] Estatística Aplicada a Engenharia I

EST0323– Estatística Aplicada a Engenharia I – Prof. Msc. André Luiz Sena da Rocha

[email protected]

59

Solução:

X = nº de acertos. X = 0, 1, .........., 10

p = Probabilidade (acerto) = 1/5 ⇒ X~Binomial( 10, 1/5 )

( )6 10 610 1 4

6 0,0055=0,55%6 5 5

k n knP X p q

k

−− = = ⋅ = ⋅ ⋅ =

Podemos calcula também a esperança e variância da v.a. X:

E(X)=n·p=10·(1/5)=2;

Var(X)=n·p·(1-p)=10·(1/5)·(1-1/5)=10·0,2·0,8=1,6.

Exemplo 2.15: Um engenheiro químico resolveu testar oito bicos de

bunsen que acabaram de chegar de uma compra realizada para seu

laboratório. Ele selecionou aleatoriamente 5 itens, sendo desses, 4

estavam funcionando perfeitamente. Caso ele deseje analisar outros 10

bicos de bunsen que foram comprados para outro laboratório, calcule:

• A probabilidade de exatamente sete estarem funcionando

corretamente?

• Qual é a probabilidade de que até dois estejam funcionando

corretamente?

• Qual é a probabilidade de que nenhum esteja funcionando corretamente?

• Qual é a probabilidade de que metade dos bicos de bunsen estejam funcionando

corretamente?

• Qual é a probabilidade de que ao menos nove bicos de bunsen estejam funcionando

corretamente?

Soluão:

a) Seja X = nº de bicos de bunsen que estão funcionando corretamente dentre os 10 testados no

laboratório. X = 0, 1, ..., 10.

p = P( sucesso ) = P (o bico de bunsen está funcionando corretamente) = 4/5 = 0,8.

Assim, podemos definir X como: X ~ Binomial (n = 10; p = 0,8) .

Page 63: [Apostila] Estatística Aplicada a Engenharia I

EST0323– Estatística Aplicada a Engenharia I – Prof. Msc. André Luiz Sena da Rocha

[email protected]

60

( )

( )( ) ( ) ( )

7 10 7

7 3

10 4 1P 7 . .

7 5 5

10! 4 1. =

10 7 !7! 5 5

= 120 0,2097152 0,008 0,201326592=20,13%

X−

= = =

= ⋅ −

⋅ ⋅ =

( ) 410 8

5E X n p= ⋅ = ⋅ = ( ) 4 1

10 1,65 5

Var X n p q= ⋅ ⋅ = ⋅ ⋅ =

b) Nesse, a probabilidade procurada se dará por:

P(até 2 dois bicos de bunsen estão funcionando corretamente) = P(X≤2) =

= [P(X=0) + P(X=1) + P(X=2)]

Assim, temos:

( ) ( ) ( ) ( ) ( ) ( )0 10 0 10100 0,8 1 0,8 1 1 0,2 0,0000001024=0,00001%

0P X

− = = ⋅ ⋅ − = ⋅ ⋅ =

( ) ( ) ( ) ( ) ( ) ( )1 10 1 9101 0,8 1 0,8 10 0,8 0,2 0,000004096=0,0004%

1P X

− = = ⋅ ⋅ − = ⋅ ⋅ =

( ) ( ) ( ) ( ) ( ) ( )2 10 2 8102 0,8 1 0,8 45 0,64 0, 2 0,000073728=0,007%

2P X

− = = ⋅ ⋅ − = ⋅ ⋅ =

( ) ( ) ( ) ( )2 0 1 2

0,00001% 0,0004% 0,007% 0,00741%

P X P X P X P X≤ = = + = + = =

= + + =

c)

( ) ( ) ( )

( ) ( ) ( )

0 10 0

10

100 0,8 1 0,8

0

1 1 0, 2 0,0000001024=0,00001%

P X−

= = ⋅ ⋅ − =

= ⋅ ⋅ =

d) P(metade dos itens estão funcionando corretamente) = P(X=5)

( ) ( ) ( )

( ) ( ) ( )

5 10 5105 0,8 1 0,8

5

252 0,32768 0,00032 0,025690112 2,56%

P X−

= = ⋅ ⋅ − =

= ⋅ ⋅ = =

Page 64: [Apostila] Estatística Aplicada a Engenharia I

EST0323– Estatística Aplicada a Engenharia I – Prof. Msc. André Luiz Sena da Rocha

[email protected]

61

e) P(ao menos 9 bicos de bunsen estão funcionando corretamente) = P(X≥9) = [P(X=9) + P(X=10)]

( ) ( ) ( )

( ) ( ) ( )

9 10 9

1

109 0,8 1 0,8

9

10 0,134217728 0,2 0,2684=26,84%

P X−

= = ⋅ ⋅ − =

= ⋅ ⋅ =

( ) ( ) ( )

( ) ( ) ( )

10 10 101010 0,8 1 0,8

10

1 0,1073741824 1 0,1073741824=10,74%

P X−

= = ⋅ ⋅ − =

= ⋅ ⋅ =

( ) ( ) ( )9 9 10

26,84% 10,74% 37,58%

P X P X P X≥ = = + = =

= + =

Exercício 2.3: Um produto eletrônico contém 40 circuitos integrados. O fabricante declarou que 1 a

cada 50 é defeituoso. Os circuitos integrados são independentes. O produto opera somente se

houver até dois circuitos integrados defeituosos.

a) Qual a probabilidade de que o produto opere?

b) Qual a probabilidade de que o produto não opere?

2.9.3 - Distribuição de Poisson

Consideremos a probabilidade de ocorrência de sucessos em um determinado intervalo.

A probabilidade da ocorrência de um sucesso no intervalo é proporcional ao intervalo. A

probabilidade de mais de um sucesso nesse intervalo é bastante pequena com relação à

probabilidade de um sucesso.

Por exemplo: automóveis que passam numa esquina. Poderemos num determinado intervalo

de tempo anotar o nº de carros que passaram, porém, o nº de carros que deixaram de passar pela

esquina não poderá ser determinado.

Seja X o nº de sucessos no intervalo então:

!k

.e)kX(P

kλ==

λ−

• Esperança (média) e Variância

E( X ) = λ

Var( X ) = λ

Page 65: [Apostila] Estatística Aplicada a Engenharia I

EST0323– Estatística Aplicada a Engenharia I – Prof. Msc. André Luiz Sena da Rocha

[email protected]

62

Exemplo 2.16: Uma central telefônica recebe em média 5 chamadas por minuto. Suponha que as

chamadas seguem uma distribuição de Poisson. Calcule a probabilidade de:

a) Não receber chamadas em um minuto;

b) Receber no máximo duas chamadas em quatro minutos;

c) Receber duas chamadas em trinta segundos;

d) Receber cinco chamadas em trinta segundos;

e) Receber três chamadas em dois minutos.

Solução:

Letra (a):

Seja X = o número de chamadas que chegam em t minutos, com distribuição de Poisson com

parâmetro λ =5t.

( ) ( )055

5 1 5

50 0,00673

0!

eP X e

λ−

= ⋅ =

= = = =

Letra (b):

( ) ( ) ( ) ( )5 4 20

2 0 1 2 0,000000455P X P X P X P X

λ = ⋅ =

≤ = = + = + = =

( ) ( )

( ) ( )

( ) ( )

020

120

220

200

0!

201

1!

202

2!

eP X

eP X

eP X

= = =

= = =

= = =

Letra (c):

( )

( ) ( )22,5

5 0,5 2,5

2,52 0,256

2!

eP X

λ−

= ⋅ =

= = =

Page 66: [Apostila] Estatística Aplicada a Engenharia I

EST0323– Estatística Aplicada a Engenharia I – Prof. Msc. André Luiz Sena da Rocha

[email protected]

63

Letra (d):

( )

( ) ( )52,5

5 0,5 2,5

2,55 0,067

5!

eP X

λ−

= ⋅ =

= = =

Letra (e):

( ) ( )310

5 2 10

103 0,0075

3!

eP X

λ−

= ⋅ =

= = =

Exercício 2.4: O número de falhas na superfície de painéis de plástico usados no interior de

automóveis tem uma distribuição de Poisson, com uma média de 0,05 falha por pé quadrado de

painel de plástico. Considere que o interior de uma automóvel contém 10 pés quadrados de painel

plástico. Calcule:

e) Probabilidade de não haver falha na superfície do interior do automóvel.

f) Se 10 carros forem vendidos para uma companhia de aluguel de carros, qual será a

probabilidade de nenhum dos 10 carros ter qualquer falha na superfície?

g) Se 10 carros forem vendidos para uma companhia de aluguel de carros, qual será a

probabilidade de no máximo dois carros terem qualquer falha na superfície?

2.10 - Principais Distribuições Contínuas

2.10.1 - Distribuição Uniforme

Se X é uma variável aleatória contínua com função de densidade de probabilidade:

1, se ( , )

( )0, caso contrário

X a bf X b a

∈= −

Então dizemos que X tem distribuição uniforme no intervalo (a, b).

Exemplo 2.17: A dureza de uma peça de aço pode ser pensada como sendo uma variável aleatória

com distribuição uniforme no intervalo (50; 70) da escala de Rockwell. Calcular a probabilidade de

que uma peça tenha dureza entre 55 e 60.

Page 67: [Apostila] Estatística Aplicada a Engenharia I

EST0323– Estatística Aplicada a Engenharia I – Prof. Msc. André Luiz Sena da Rocha

[email protected]

64

Solução:

Definindo X = “Dureza de uma peça de aço”, temos:

1, se (50,70)

( ) 70 500, caso contrário

Xf X

∈= −

Logo:

( )60

55

601 5 155 60

5520 20 20 4

xP X dx≤ ≤ = = = =∫

• Esperança (média) e Variância

( )2

a bE X

+=

( ) ( )2

12

b aVar X

−=

Exercício 2.5: O peso líquido, em libras, de um pacote com herbicida químico é uniforme no

intervalo de 49,75 a 50,25 libras. Determine:

a) Média e variância do peso dos pacotes;

b) Probabilidade de um pacote de herbicida ter peso inferior a 50,1 libras.

2.10.2 - Distribuição Exponencial

A distribuição exponencial envolve probabilidades ao longo do tempo ou da distância entre

ocorrências num intervalo contínuo. Por exemplo, a exponencial é usada como modelo do tempo

entre falhas de equipamento elétrico, tempo entre a chegada de clientes a um supermercado, tempo

entre chamadas telefônicas, etc. Há estreita relação entre a distribuição exponencial e a de Poisson.

Na verdade, se um processo de Poisson tem média de λ ocorrências durante um intervalo, o espaço

(ou tempo, etc) entre ocorrências naquele intervalo é de 1/λ. Por exemplo, se as chamadas

telefônicas ocorrem em média à razão de 6 por hora, então o tempo médio entre as chamadas será

de 1/6 de hora, ou 10 minutos.

Uma variável aleatória X tem distribuição Exponencial de probabilidade se a sua f.d.p. é

dada por:

Page 68: [Apostila] Estatística Aplicada a Engenharia I

EST0323– Estatística Aplicada a Engenharia I – Prof. Msc. André Luiz Sena da Rocha

[email protected]

65

<

≥λ=

λ−

0xse0

0xsee)x(f

x

o gráfico da f.d.p. de X é:

0( ) | 1

0x Xe dx eλ λλ

∞ − − ∞= − =∫

Esperança (média) e Variância

( ) 1E X

λ=

( ) 2

1 Var X

λ=

Exemplo 2.18: Uma fábrica de tubos de TV determinou que a vida média dos tubos de sua

fabricação é de 800 horas de uso contínuo e segue uma distribuição exponencial. Qual a

probabilidade de que a fábrica não tenha que substituir um tubo gratuitamente, se oferece uma

garantia de 300 horas de uso?

Solução:

X: vida útil dos tubos de TV e E(X) = 800

Como ( ) 1 1 1800

800E X λ

λ λ= ⇒ = ⇒ =

Logo

18001

800 , 0( )

0 , 0

xe se xf x

se x

− ≥=

<

3001 1 800

800 800300 3/8

0

3001(0 300) ( ) 1 1 0,3127

0800x XP X e dx e e e

−− − −< < = = − = − + = − =∫

Page 69: [Apostila] Estatística Aplicada a Engenharia I

EST0323– Estatística Aplicada a Engenharia I – Prof. Msc. André Luiz Sena da Rocha

[email protected]

66

Exercício 2.6: Certo tipo de fusível tem duração de vida que segue uma distribuição exponencial

com vida média de 100 horas. Qual a probabilidade de um fusível durar mais de 150 horas?

2.10.3 – Distribuição Normal

Definição: Dizemos que a v. a. X tem distribuição normal com parâmetros µ e σ2, e+∞<µ<∞−

+∞<σ< 20 , se sua f.d.p. é dada por

22

2)x(

e.2

1)x(f σ

µ−−

πσ= , +∞<<∞− x

Gráfico: A figura abaixo ilustra uma particular curva normal, determinada por valores particulares

de µ e σ2.

Pode-se demonstrar que:

a) E(X) = µ

b) Var(X) = σ2

c) f(x) → 0 quando x → ∞±

d) µ - σ e µ + σ são pontos de inflexão de f(x);

e) x = µ é ponto de máximo de f(x), e o valor máximo é πσ 2

1 ;

f) f(x) é simétrica ao redor de x = µ, isto é, f(µ + x) = f(µ - x), para todo +∞<<∞− x

A distribuição normal, independente dos valores dos parâmetros, apresenta sempre a seguinte

relação:

Page 70: [Apostila] Estatística Aplicada a Engenharia I

EST0323– Estatística Aplicada a Engenharia I

Se X tem distribuição normal, com média

Entendendo os parâmetros da distribuição Normal:

1) A média µ informa o centro da distribuição. É um parâmetro de locação.

2) O desvio-padrão σ informa o formato da curva.

• A Normal-Padrão

Para o cálculo das probabilidades, surgem

1) Para integração de f(x), pois para o cálculo é necessário o desenvolvimento em séries;

2) Seria a elaboração de uma tabela de probabilidades, pois f(x) depende de dois parâmetros,

fato este que acarretaria um grande trabalho para tabel

se as várias combinações de

Estatística Aplicada a Engenharia I – Prof. Msc. André Luiz Sena da Rocha

[email protected]

Se X tem distribuição normal, com média µ e variância σ2, escreveremos: X~N(

Entendendo os parâmetros da distribuição Normal:

A média µ informa o centro da distribuição. É um parâmetro de locação.

informa o formato da curva.

Para o cálculo das probabilidades, surgem dois grandes problemas:

Para integração de f(x), pois para o cálculo é necessário o desenvolvimento em séries;

Seria a elaboração de uma tabela de probabilidades, pois f(x) depende de dois parâmetros,

fato este que acarretaria um grande trabalho para tabelar essas probabilidades considerando

se as várias combinações de µ e σ2.

67

X~N(µ, σ2).

A média µ informa o centro da distribuição. É um parâmetro de locação.

Para integração de f(x), pois para o cálculo é necessário o desenvolvimento em séries;

Seria a elaboração de uma tabela de probabilidades, pois f(x) depende de dois parâmetros,

ar essas probabilidades considerando-

Page 71: [Apostila] Estatística Aplicada a Engenharia I

EST0323– Estatística Aplicada a Engenharia I – Prof. Msc. André Luiz Sena da Rocha

[email protected]

68

Os problemas foram solucionados por meio de uma mudança de variável obtendo-se, assim,

a distribuição normal padronizada ou reduzida: Quando µ = 0 e σ2 = 1, temos uma normal padrão

ou reduzida, e escrevemos: N(0,1). Se X~N(µ, σ2), então a v.a. Z definida por

σ

µ−=

XZ terá uma distribuição N(0,1).

É fácil demonstrar que Z tem média 0 e variância 1. A normalidade de Z já não é imediata e não

será provada aqui. A figura abaixo ilustra a N(0,1).

Uma das propriedades associadas à distribuição normal é a sua capacidade para predizer as

probabilidades de encontrar um valor entre dois números quaisquer.

As probabilidades associadas à distribuição normal são facilmente obtidas em tabelas.

Vejamos alguns exemplos:

Com vemos na figura a seguir a área total sob a curva vale 1. Isto significa que a

probabilidade de ocorrer qualquer valor real é 1. A curva é simétrica em torno da média zero. A

probabilidade de ocorrer valer maior que zero é 0,5, mas qual seria a probabilidade de ocorrer valor

entre zero e z = 1,25 ?

Page 72: [Apostila] Estatística Aplicada a Engenharia I

EST0323– Estatística Aplicada a Engenharia I – Prof. Msc. André Luiz Sena da Rocha

[email protected]

69

Probabilidade de ocorrer valor entre zero e z=1,25

A probabilidade da ocorrência do valor entre zero e z = 1,25, corresponde à área pontilhada na

figura acima. Podemos encontrar esta probabilidade na tabela de distribuição normal (Tabela do

ANEXO A). Como usar esta tabela?

- Localizar na 1a coluna o valor 1,2

- Na 1a linha, está o valor 5.

- n0 1,2 compõe com o algarismo 5, o n0 z = 1,25.

- No cruzamento da linha 1,2 com a coluna 5 está o número 0,3944. Está é a probabilidade

(39,44%) do ocorrer valor entre zero e z= 1,25.

Page 73: [Apostila] Estatística Aplicada a Engenharia I

EST0323– Estatística Aplicada a Engenharia I – Prof. Msc. André Luiz Sena da Rocha

[email protected]

70

0 1 2 3 4 5 6

0,0 0,0000 0,0040 0,0080 0,0120 0,0160 0,0199 0,0239

0,1 0,0398 0,0438 0,0478 0,0517 0,0557 0,0596 0,0636

0,2 0,0793 0,0832 0,0871 0,0910 0,0948 0,0987 0,1026

0,3 0,1179 0,1217 0,1255 0,1293 0,1331 0,1368 0,1406

0,4 0,1554 0,1591 0,1628 0,1664 0,1700 0,1736 0,1772

0,5 0,1915 0,1950 0,1985 0,2019 0,2054 0,2088 0,2123

0,6 0,2257 0,2291 0,2324 0,2357 0,2389 0,2422 0,2454

0,7 0,2580 0,2611 0,2642 0,2673 0,2703 0,2734 0,2764

0,8 0,2881 0,2910 0,2939 0,2967 0,2995 0,3023 0,3051

0,9 0,3159 0,3186 0,3212 0,3238 0,3264 0,3289 0,3315

1,0 0,3413 0,3438 0,3461 0,3485 0,3508 0,3531 0,3554

1,1 0,3643 0,3665 0,3686 0,3708 0,3729 0,3749 0,3770

1,2 0,3849 0,3869 0,3888 0,3907 0,3925 0,3944 0,3962

1,3 0,4032 0,4049 0,4066 0,4082 0,4099 0,4115 0,4131

1,4 0,4192 0,4207 0,4222 0,4236 0,4251 0,4265 0,4279

Tabela da Distribuição Normal Padrão

Versão Reduzida (Versão completa no ANEXO A)

Exemplo 2.19: Suponhamos que o comprimento de um tubo de PVC tem distribuição normal com

média de 200cm e desvio padrão de 20 cm. Veja o gráfico desta distribuição.

Distribuição normal do comprimento de um tubo de PVC

Page 74: [Apostila] Estatística Aplicada a Engenharia I

EST0323– Estatística Aplicada a Engenharia I – Prof. Msc. André Luiz Sena da Rocha

[email protected]

71

Qual a probabilidade de um tubo apresentar comprimento entre 200 e 225 cm. Está probabilidade

corresponde a figura a seguir.

Probabilidade de taxa de colesterol entre 200 e 225

Para calcular a probabilidade associada à distribuição normal, usa - se a fórmula:

XZ

µσ−

= - µ = média; σ = desvio padrão

- X = valor pesquisado

A estatística Z (Standard score) baseia-se na curva normal. Ela mede quanto um

determinado resultado (valor) afasta-se da média em unidades de desvio-padrão. Um resultado cujo

valor coincide com a média tem escore z=0.

Como a quantidade de colesterol tem distribuição normal com média µ = 200 e desvio

padrão (σ) de 20, a variável

Z = X - 200 tem distribuição normal reduzida.

20

Nesta distribuição, a média é zero e, ao valor X = 225, corresponde:

Z = X - 200 = 1,25

20

Page 75: [Apostila] Estatística Aplicada a Engenharia I

EST0323– Estatística Aplicada a Engenharia I – Prof. Msc. André Luiz Sena da Rocha

[email protected]

72

Consultando a Tabela do ANEXO A da distribuição normal padrão, vemos que a probabilidade de

Z assumir valor entre zero e z = 1,25 é de 0,3944 ou 39,44%.

Exemplo 2.20: Referente ao Exemplo .19, qual é a probabilidade do tubo de PVC apresentar menos

do que 190 cm de comprimento. Para resolver este problema, é preciso "reduzir" o valor X = 190

para uma normal padrão. Assim, temos:

Z = 190 - 200 = - 0,50 .

20

A probabilidade de z assumir o valor menor que z = - 0,50 é igual a probabilidade de ocorrer valor

maior do que z = 0,50 (fato este pela normal ser simétrica em torno do zero). Consultando o

ANEXO A da distribuição normal reduzida, vemos que no cruzamento entre a linha e a coluna, na

primeira coluna, temos o valor 0,5 e na primeira linha o valor zero para compor o número z = 0,50,

em que está o valor 0,1915; que é a probabilidade de ocorrer valor zero e z = 0,50. Como a

probabilidade de ocorrer valor maior do que a média zero é 0,5, a probabilidade pedida é dada por:

0,5 - 0,1915 = 0,3085 ou 30,85%.

Exercício 2.7: Sabendo a quantidade de calcário por 100kg de cimento CP II – F do tipo Composto

é uma variável aleatória com distribuição normal de média µ=16 kg e desvio padrão σ=1,75 kg.

Calcule a probabilidade de numa amostra de 1000kg desse cimento apresentar de 13 a 18kg de

calcário.

Exercício 2.8: Seja Z uma variável aleatória Normal Padrão, determine:

a) P(Z = 0)

b) P(Z ≤ 0)

c) P(Z < 1,96)

d) P( Z ≤ -1,89)

e) P(Z > -1,89)

f) P(Z > -2,33)

g) P( Z ≥ 2,8)

h) P(0,16 < Z < 2,08)

i) P( -1,15 ≤ Z ≤ 2,37)

j) P( Z > 4,88)

Page 76: [Apostila] Estatística Aplicada a Engenharia I

EST0323– Estatística Aplicada a Engenharia I – Prof. Msc. André Luiz Sena da Rocha

[email protected]

73

2.10.4 - Distribuição t de Student

A Distribuição t de Student trata-se de um modelo de distribuição contínua que se assemelha

à distribuição normal padrão, N(0,1). Ela é utilizada particularmente, quando se tem amostras com

tamanhos inferiores a 30 elementos ou quando não conhecemos o desvio-padrão populacional.

Diferente da Normal que necessita apenas do nível de significância α, além do valor de α, a

distribuição t possui um parâmetro adicional chamado "grau de liberdade".

Se a distribuição de uma população é essencialmente normal (com a forma

aproximadamente de um sino), então a distribuição de

n/s

Xt

µ−= , com (n-1) graus de liberdade,

é essencialmente uma distribuição t de Student para todas as amostras de tamanho n. A

distribuição t de Student, geralmente conhecida como distribuição t, é utilizada na determinação de

valores críticos denotados por 2/tα .

A tabela da t (Tabela do ANEXO B) relaciona valores da distribuição t juntamente com

áreas denotadas por α . Os valores de 2/tα são obtidos localizando o número adequado de graus de

liberdade ((n-1) gruas de liberdade).

OBS: O número de graus de liberdade para um conjunto de dados corresponde ao número de

valores que podem variar após terem sido impostas certas restrições a todos os valores.

PROPRIEDADES IMPORTANTES DA DISTRIBUIÇÃO t DE STUDENT:

1. A distribuição t de Student tem a mesma forma geral simétrica (curva em forma de sino) que a

distribuição normal, mas reflete maior variabilidade que é esperada em pequenas amostras. Ver

Figura abaixo.

Page 77: [Apostila] Estatística Aplicada a Engenharia I

EST0323– Estatística Aplicada a Engenharia I – Prof. Msc. André Luiz Sena da Rocha

[email protected]

74

2. A distribuição t de Student tem média t = 0 (tal como a normal padronizada, com média Z = 0).

3. O desvio-padrão da distribuição t de Student varia com o tamanho da amostra, mas é superior a

1 (ao contrário da distribuição normal padronizada).

4. Na medida em que aumenta o tamanho da amostra, a distribuição t de Student se aproxima mais

e mais da distribuição normal padronizada. Para valores n > 30, as diferenças são tão pequenas

que podemos utilizar os valores críticos Z.

CONDIÇÕES PARA A UTILIZAÇÃO DA DISTRIBUIÇÃO t DE STUDENT

1. O tamanho da amostra é pequeno 30n ≤ ;

2. σ é desconhecido;

3. A população original tem distribuição essencialmente normal (como a distribuição da

população original normalmente é desconhecida, estimamos construindo um histograma dos

dados amostrais ou realizando algum teste de normalidade como o teste de Shapiro-Wilk).

GRAUS DE LIBERDADE DE UMA ESTATÍSTICA:

Sabe-se que, a variância de uma amostra deve ser calculada por

( )2

2 1

1

n

ii

x xS

n=

−=

∑.

A necessidade dessa correção esta relacionada com o número de g.l., por exemplo:

Page 78: [Apostila] Estatística Aplicada a Engenharia I

EST0323– Estatística Aplicada a Engenharia I – Prof. Msc. André Luiz Sena da Rocha

[email protected]

75

1

ni

i

xX

=

= =∑ e

( )2

2 1

n

ii

x

n

µσ =

−=∑

são estatísticas com "n" graus de liberdade, pois existem n valores xi livres que devem ser

considerados para podermos calcular o valor da estatística.

A estatística s2, por usar X ao invés de µ , tem um grau de liberdade a menos. Isso ocorre porque

para o cálculo de s2 é necessário que se tenha calculado X , ou seja, já utilizamos uma vez todo os

valores da amostra; estes estiram sendo usados pela segunda vez para o cálculo de s2.

Exercício 2.9: Com base na tabela t de Student determine o valor da distribuição nos seguinte

casos:

a) t (5; 1%)

b) t (6; 2%)

c) t (19; 5%)

d) t (21; 10%)

e) t (28; 5%)

f) t (12; 1%)

Page 79: [Apostila] Estatística Aplicada a Engenharia I

EST0323– Estatística Aplicada a Engenharia I – Prof. Msc. André Luiz Sena da Rocha

[email protected]

76

UNIDADE III

INFERÊNCIA ESTATÍSTICA

Introdução

Nas últimas unidades vimos como construir modelos probabilísticos para descrever alguns

fenômenos. Nessa parte, iremos estudar um ramo muito importante da Estatística conhecido como

Inferência Estatística, ou seja, como fazer afirmações sobre características de uma população,

baseando-se em resultados de uma mostra.

Inferência Estatística é o ramo da Estatística que refere-se ao processo de obter informações sobre

uma população a partir de resultados observados na amostra.

POPULAÇÃO (N) AMOSTRA (n)

θ θ

Inferência Estatística

POPULAÇÃO: Conjunto de indivíduos (ou objetos), tendo pelo menos uma variável comum

observável. Pode ser finita, como o conjunto de alunos de uma escola em um determinado ano, ou

infinita, como o número de vezes que se pode jogar um dado.

AMOSTRA: Qualquer subconjunto da população

A maioria das pesquisas realizadas nas mais variadas áreas do conhecimento humano são

feitas com amostras. O pesquisador, no entanto, almeja generalizar seus resultados, ou seja, saber

se o que obteve com amostras é válido para toda a população. Essa é, sem dúvida, a essência da

Page 80: [Apostila] Estatística Aplicada a Engenharia I

EST0323– Estatística Aplicada a Engenharia I – Prof. Msc. André Luiz Sena da Rocha

[email protected]

77

inferência estatística. Formalmente, a Inferência ou Estatística Indutiva é a parte da Estatística que

estuda a estimação e os testes sobre os parâmetros populacionais.

ALGUNS CONCEITOS IMPORTANTES

AMOSTRA ALEATÓRIA: Seja X uma variável populacional. Uma amostra aleatória é o

conjunto de n variáveis aleatórias independentes, ( )nxxx ,,, 21 … , extraídas de uma população,

tal que cada ix tem a mesma característica, ou distribuição da variável X.

PARÂMETRO: Medida usada para descrever uma característica da população [ ),...(),(, 2xx σσµ ].

ESTIMADOR (ESTATÍSTICA): Medida usada para descrever uma característica da amostra.

[ ),...(),(, 2xSxSX ]

ESTIMATIVA: É o valor numérico do estimador. Por exemplo, 8,17X = é uma estimativa da

média populacional µ .

ESTIMAÇÃO (Pontual e Intervalar)

INFERÊNCIA

ESTATÍSTICA

TESTES DE HIPÓTESES

(Paramétricos e Não-Paramétricos)

Page 81: [Apostila] Estatística Aplicada a Engenharia I

EST0323– Estatística Aplicada a Engenharia I – Prof. Msc. André Luiz Sena da Rocha

[email protected]

78

4.1 - Distribuição Amostral da Média e da Proporção

4.1.1 – Distribuição Amostral da Média

Sejam X uma v.a. com valor esperado µ e variância σ2 e X a média de uma amostra

aleatória de tamanho n de X. Então:

- E( X )=µ

- Var( X )=σ2/n

- A distribuição de X aproxima-se de uma distribuição normal com valor esperado µ

e variância σ2/n, quando n tende ao infinito. (Teorema Central do Limite).

Observações:

i. Como regra prática, aceita-se que para amostras com mais de 30 elementos, a

aproximação citada em (iii) já pode ser considerada boa.

ii. Se a distribuição é normal com valor esperado µ e a variância σ2, então a média

amostral baseada em uma amostra aleatória de tamanho n tem distribuição normal

com valor esperado µ e variância σ2/n, independente do tamanho da amostra.

Exemplo 3.1: A elasticidade de um polímero é afetada pela concentração de um reagente. Numa

baixa concentração, a elasticidade média verdadeira é igual a 55 e o desvio-padrão da elasticidade

igual a 16. Se retirada uma amostra de tamanho 40, qual será a probabilidade da elasticidade média

estar acima de 60?

Solução:

Temos nesse exemplo que a distribuição da média amostral X é aproximadamente N(55; 6,4).

Ou seja, ( )2 256

~ , ~ 55, ~ 55; 6, 440

X N X N X Nn

σµ

⇒ ⇒

. Assim, teremos:

( ) 55 60 5560 ( 1,98) 0,5 0,4761 0,9761

6, 4 6, 4

XP X P P Z

− −> = > = > = + =

Logo, probabilidade da média amostral estar acima de 60 é de 97,61%.

Page 82: [Apostila] Estatística Aplicada a Engenharia I

EST0323– Estatística Aplicada a Engenharia I – Prof. Msc. André Luiz Sena da Rocha

[email protected]

79

4.1.2 – Distribuição Amostral da Proporção

Consideremos uma população que tem uma proporção p de portadores de certa característica

e seja X1, X2, ..., Xn uma amostra aleatória onde Xi, 1 ≤ i ≤ n, é definida por:

1, se o i-ésimo elemento é portador da característica;

0, em caso contrário. iX

=

Temos que Xi, 1 ≤ i ≤ n, tem distribuição de Bernoulli, com E(Xi)=p e Var(X)=p(1-p). Portanto, a

distribuição da média amostral X se aproxima de uma distribuição normal, com valor esperado p e

variância p(1-p)/n, quando n tende ao infinito. (Teorema Central do Limite).

Observação: Dado que X é a proporção de elementos da amostra que são portadores da citada

característica, então costumamos fazer ˆX p= .

Exemplo 3.2: Em certa cidade, 30% dos motoristas envolvidos em acidentes fatais mostram

evidência do uso de drogas. Numa amostra de 200 acidentes fatais, qual será a probabilidade de que

mais de 25% desses motoristas tenham usado drogas?

Solução:

Definindo a variável aleatória p =proporção de motoristas que usam drogas numa amostra de 200

acidentes fatais, temos que a distribuição de p é aproximadamente N(0,30; 0,00105). Assim,

( ) ( )ˆ 0,30 0,25 0,30

ˆ 0, 25 1,54 0,93820,00105 0,00105

pP p P P Z

− −> = > = > − =

.

Logo, a probabilidade de que mais de 25% desses motoristas tenham usado drogas é de 93,82%.

Page 83: [Apostila] Estatística Aplicada a Engenharia I

EST0323– Estatística Aplicada a Engenharia I – Prof. Msc. André Luiz Sena da Rocha

[email protected]

80

4.2 - Estimação por ponto e intervalo

4.2.1 - Estimação Pontual

A partir da amostra procura-se obter um único valor aproximado de um determinado parâmetro

populacional.

Exemplo 3.3: A média amostral ( X ) é um estimador pontual da média populacional ( µ ).

Desvantagens: Por obter um único valor aproximado de um determinado parâmetro populacional,

em geral é INSUFICIENTE! Pois a estimação pontual não fornece meios diretos para aferir a

qualidade da estimativa. Alternativamente, podem-se determinar intervalos que contenham o

parâmetro populacional com uma confiança elevada. Estes são chamados de Intervalos de

Confiança, em que nesse caso, se faz necessário realizar uma Estimação Intervalar.

4.2.2 - Estimação Intervalar

A partir da amostra procura-se construir um intervalo de variação, 21ˆˆ θθθ ≤≤ , com uma

certa probabilidade de conter o verdadeiro parâmetro populacional.

1) TESTES PARAMÉTRICOS

• A hipótese é formulada com respeito ao valor de um parâmetro populacional.

2) TESTES NÃO-PARAMÉTRICOS

• A hipótese é formulada com respeito à natureza da distribuição da população.

INTERVALOS DE CONFIANÇA

É um intervalo real, centrado na estimativa pontual que deverá conter o parâmetro com

determinada probabilidade. A probabilidade de o intervalo conter o parâmetro estimado é

denominada de nível de confiança associado ao intervalo. A notação mais usual para o nível de

confiança associado ao intervalo é 1 -α ou (1 -α )%.

Page 84: [Apostila] Estatística Aplicada a Engenharia I

EST0323– Estatística Aplicada a Engenharia I – Prof. Msc. André Luiz Sena da Rocha

[email protected]

81

Assim como as estimações pontuais, os intervalos de confiança podem ser vistos como uma

técnica para se fazer inferência estatística. Ou seja, a partir de um intervalo de confiança, construído

com os elementos amostrais, pode-se inferir sobre um parâmetro populacional.

Fundamenta-se nas distribuições amostrais

θ : Parâmetro populacional

θ : Estimador de θ

A partir da distribuição de probabilidade de θ é possível construir um intervalo

21ˆˆ θθθ ≤≤ , que contém θ , e exigir que a probabilidade do intervalo seja de ( )α−1 .

O valor da probabilidade ( )α−1 que usualmente assume os valores 90%, 95%, 98%, etc.,

é denominado NÍVEL DE CONFIANÇA (quanto maior melhor), e o valor α é chamado NÍVEL

DE SIGNIFICÂNCIA (quanto menor melhor), isto é, representa o erro que se está cometendo

quando se afirma que a probabilidade do intervalo, 21ˆˆ θθθ ≤≤ , conter o verdadeiro valor do

parâmetro populacional é ( )α−1 .

VANTAGEM DO USO DE ESTIMAÇÃO INTERVALAR:

Permite uma idéia da precisão com que foi calculada a estimativa do parâmetro, pois

expressa o erro aceito ao calculá-la.

- Intervalo muito pequeno ALTA PRECISÃO DA ESTIMATIVA DO PARÂMETRO;

- Quanto maior o grau de confiança MENOR PRECISÃO DA ESTIMATIVA DO

PARÂMETRO.

Exemplo 3.4: Suponha, n = 25, 12=X e 1,2S = .

( ) ( )49.1251.11%95 <<= µIC : amplitude = 0,98

( ) ( )67.1231.11%99 <<= µIC : amplitude = 1,36

Page 85: [Apostila] Estatística Aplicada a Engenharia I

EST0323– Estatística Aplicada a Engenharia I – Prof. Msc. André Luiz Sena da Rocha

[email protected]

82

4.2.2.1- Intervalo de confiança para a média

Neste caso, existem 2 métodos para estimativa de µ através do intervalo de confiança; as

utilizações desses métodos dependem do tamanho da amostra ou do fato de ter ou não

conhecimento do valor do desvio-padrão populacional.

1° Caso: Se n ≥ 30 e a variância populacional é conhecida

1) Utiliza-se o método da distribuição normal (a variável utilizada será a Z).

2° Caso: Para amostras pequenas (n < 30) e variância populacional desconhecida

2) Utiliza-se o método da distribuição t-Student (a variável utilizada será a t).

Fatores Métodos

Distribuição Normal Distribuição t-Student

Tamanho da amostra n ≥ 30 n < 30

Variância σ2 (conhecida) S2 (desconhecida)

Variável utilizada Z T

CASO 1: INTERVALO DE CONFIANÇA PARA A MÉDIA POPULACIONAL COM A

VARIÂNCIA POPULACIONAL CONHECIDA

Seja ( )2,~ σµNX . Sabe-se que o estimador de µ , X (média amostral), tem distribuição de

probabilidade dada por:

( )nNX /,~ 2σµ , para populações infinitas

Então, ( )1,0~/

Nn

XZ

σ

µ−=

Fixando-se um nível de confiança ( )α−1 tem-se:

( ) ααα −=≤≤− 12/2/ ZZZP

Page 86: [Apostila] Estatística Aplicada a Engenharia I

EST0323– Estatística Aplicada a Engenharia I – Prof. Msc. André Luiz Sena da Rocha

[email protected]

83

ασ

µαα −=

−≤− 1

/2/2/ Z

n

XZP

ασ

µσ

αα −=

−≤−≤−− 1.. 2/2/ X

nZX

nZP

ασ

µσ

αα −=

+≤≤− 1.. 2/2/

nZX

nZXP

Exemplo 3.5: O departamento de Recursos Humanos de uma grande empresa informa que o tempo

de execução de tarefas que envolvem participação manual varia de tarefa para tarefa, mas que o

desvio padrão permanece aproximadamente constante em 3 min. Uma nova tarefa está sendo

implantada na empresa. Uma amostra aleatória do tempo de execução de 50 dessas novas tarefas

forneceu o valor médio de 15 min. Determine o intervalo de confiança de 95% para o tempo médio

de execução dessa nova tarefa.

Sabe-se que, ( )nNX /,~ 2σµ , então ( )23~ 15, 50X N ;

Como o exemplo pede um intervalo de confiança de 95%, então α=100%-95%=5%.

Pela Tabela do ANEXO A (Tabela da Normal Padrão), o valor de α/2=1,96. Então, temos :

ασ

µσ

αα −=

+≤≤− 1.. 2/2/

nZX

nZXP

3 315 1, 96. 15 1, 96. 95%

50 50P µ

− ≤ ≤ + =

( )15 0, 8316 15 0, 8316 95%P µ− ≤ ≤ + =

Page 87: [Apostila] Estatística Aplicada a Engenharia I

EST0323– Estatística Aplicada a Engenharia I – Prof. Msc. André Luiz Sena da Rocha

[email protected]

84

( )14,1684 15, 8316 95%P µ≤ ≤ =

[ ]5% 14,1684; 15, 8316ICα = =

Interpretação: Podemos afirmar, a um nível de 95% de confiança, que o intervalo [14,16; 15,83]

contém a verdadeira média. Logo, se realizássemos esse procedimento 100 vezes, por exemplo,

espera-se que 95 dos intervalos calculados contenham o verdadeiro valor do parâmetro estimado.

CASO 2: INTERVALO DE CONFIANÇA PARA A MÉDIA POPULACIONAL COM A

VARIÂNCIA POPULACIONAL DESCONHECIDA

Estimar σ com base na amostra, S.

Como S é uma variável aleatória, a substituição só é verificada para amostras grandes

(n ≥ 30) σ≅S

S é um estimador viesado para σ , mas aumentando o tamanho da amostra o viés tende a

desaparecer; portanto o IC para µ pode ser construído.

Quanto menor a amostra mais necessária se torna a introdução de uma correção: t(n-1) ao

invés de Z.

Sabe-se que, ( )nNX /,~ 2σµ e ( )1,0~/

Nn

XZ

σµ−

=

Então, nS

Xtn

/1

µ−=−

( ) ααα −=≤≤− 12/2/ tttP

αµ

αα −=

−≤− 1

/2/2/ t

nS

XtP

αµ αα −=

−≤−≤−− 1.. 2/2/ X

n

StX

n

StP

Page 88: [Apostila] Estatística Aplicada a Engenharia I

EST0323– Estatística Aplicada a Engenharia I – Prof. Msc. André Luiz Sena da Rocha

[email protected]

85

αµ αα −=

+≤≤− 1.. 2/2/

n

StX

n

StXP

OBS: Quanto menor o tamanho da amostra, mais necessário se torna a introdução de uma correção,

a qual consiste em usar a variável t-Student (t(n-1)) ao invés de usar a variável Z.

Exemplo 3.6: Uma amostra de 25 peças de laminado usado na fabricação de placas de circuito foi

selecionada, e a quantidade de deformação (in.) sob condições específicas foi determinada para

cada peça, resultando em uma deformação média amostral de 0,0635 in. E um desvio-padrão

amostral de 0,0065 in. Construa um intervalo de confiança para a média ao nível de 99%.

Solução:

Média amostral: 0,0635 .X in=

Desvio padrão amostral: 0,0065 .S in=

Variável: t(n-1) = t(24; 1%/2) = 2,7969

αµ αα −=

+≤≤− 1.. 2/2/

n

StX

n

StXP

( ) ( )0, 0065 0, 00650, 0635 2, 7969 . 0, 0635 2, 7969 . 99%

25 25P µ

− ≤ ≤ + =

( )0, 0598 0, 0671 99%P µ≤ ≤ =

[ ]1% 0, 0598; 0, 0671ICα = =

Interpretação: Podemos afirmar, a um nível de 99% de confiança, que o intervalo [0,0598; 0,0671]

contém a verdadeira média; A precisão dessa estimativa nos permite afirmar, com 99% de certeza,

de que não estamos errando por mais de 0,00365 ([0,0671 - 0,0598] / 2) nessa estimação. Logo, se

realizássemos esse procedimento 100 vezes, por exemplo, espera-se que 99 dos intervalos

calculados contenham o verdadeiro valor do parâmetro estimado. Ou seja, espera-se a um nível de

99% de confiança, que a deformação média, medida em “in.”, nas placas de circuito seja entre

0,0671 in. a 0,0598 in.

Page 89: [Apostila] Estatística Aplicada a Engenharia I

EST0323– Estatística Aplicada a Engenharia I – Prof. Msc. André Luiz Sena da Rocha

[email protected]

86

Exercício 3.1: Após analisar o teor alcoólico de 52 amostras de sangue de pessoas que estavam

numa festa, um químico obteve através do software R uma média de 3,9% de C2H5OH e um desvio-

padrão de 5,78% de C2H5OH.

a) Calcule um intervalo de 95% de confiança para o percentual médio de C2H5OH para as

pessoas que beberam nessa festa. Interprete os resultados.

b) Com 99% de confiança, o intervalo para o percentual médio de C2H5OH é de [1,76% ;

6,04%]. Por que é diferente do intervalo da letra (a)?

4.2.2.2 - Intervalo de confiança para a proporção

Sabendo que a distribuição amostral da proporção é: ( )ˆ ~ , pqp N p n e

ˆk

pn

≈.

Quando n for grande, n ≥ 30 a distribuição binomial se aproxima da Normal, então:

( )ˆ

~ 0,1/

p pZ N

pq n

−=

Fixando-se um nível de confiança ( )α−1 tem-se:

( ) ( )/ 2 / 2

ˆ ˆ ˆ ˆˆ ˆ. . 1

p q p qP p Z p p Z

n nα α α − ≤ ≤ + = −

Exemplo 3.7: Uma pesquisa recente efetuada com 300 habitantes de uma grande cidade revelou

que 128 pessoas apresentavam insuficiência respiratória. Determine um intervalo de confiança de

90% para a proporção de habitantes dessa cidade que apresentaram insuficiência respiratória.

Solução:

n=300 & k=128;

Logo, temos que a proporção das pessoas que apresentavam insuficiência respiratória é de

128ˆ 0, 4267

300p = = ou 42,67%. Assim, teremos para o cálculo do intervalo de confiança:

Page 90: [Apostila] Estatística Aplicada a Engenharia I

EST0323– Estatística Aplicada a Engenharia I – Prof. Msc. André Luiz Sena da Rocha

[email protected]

87

( ) ( )

( ) ( ) ( ) ( )

( )( )

/ 2 / 2

10%

ˆ ˆ ˆ ˆˆ ˆ. . . . 1

0, 4267 0, 5733 0, 4267 0, 5733. . 0, 4267 1, 645. 0, 4267 1, 645. 90%

300 300

. . 0, 4267 0, 0285 0, 4267 0, 0285 90%

. . 0, 3982 0, 4552 90%

0, 3982

p q p qI C p Z p p Z

n n

I C p

I C p

I C p

IC

α α

α

α

=

= − ≤ ≤ + = −

⋅ ⋅ = − ≤ ≤ + =

= − ≤ ≤ + =

= ≤ ≤ =

= [ ]; 0, 4552

Interpretação: Podemos afirmar, a um nível de 90% de confiança, que o intervalo [0,3982; 0,4552]

contém o valor verdadeira da proporção populacional. Logo, se realizássemos esse procedimento

100 vezes, por exemplo, espera-se que 90 dos intervalos calculados contenham o verdadeiro valor

do parâmetro estimado. Ou seja, com 10% de significância, o percentual de habitantes com

insuficiência respiratória será entre 39,82% a 45,52%.

Exercício 3.2: Um artigo em Fortune (21/09/1992) afirma que aproximadamente metade de todos

os engenheiros químicos continua seus estudos acadêmicos além do grau de bacharelado, recebendo

no final o grau de mestre ou doutor. Dados de um artigo em Engineering Hozizons indicaram que

117 de 484 novos engenheiros químicos graduados estavam planejando fazer uma pós-graduação.

Calcule um intervalo com 99% de confiança a cerca da proporção de engenheiros químicos que

continuam seus estudos além da graduação. Interprete os resultados.

4.3 - Testes de Hipóteses

Suponha que numa determinada região, o peso de crianças aos 12 anos, seja modulado pela

distribuição normal, tal que X ~N (48, 16). Um pesquisador da área médica desconfia que devido a

mudanças nos hábitos alimentares, o peso médio seja maior. Para tentar comprovar sua suposição o

pesquisador seleciona, por processo aleatório, uma amostra de 100 crianças dessa população,

obtendo como peso amostral x = 51,3 kg. Será que ele tem razão? A resposta deve ser analisada

cuidadosamente e uma decisão mais segura só é possível depois de submeter seus dados a um teste

estatístico, também conhecido como teste de hipóteses que estará sujeito a uma regra de decisão.

Regra de decisão que permite aceitar ou rejeitar uma hipótese, decisão esta que é tomada em

função dos valores amostrais. Em outras palavras, formula-se uma hipótese quanto ao valor do

Page 91: [Apostila] Estatística Aplicada a Engenharia I

EST0323– Estatística Aplicada a Engenharia I

parâmetro populacional, e pelos elementos amostrais faz

da hipótese nula (H0).

HIPÓTESE ESTATÍSTICA

Suposição quanto ao valor de um parâmetro ou quanto à natureza da distribuição de uma

probabilidade de uma variável populacional.

TIPOS DE HIPÓTESES

0H : é aquela que será testada, sendo sempre contrária ao resultado do experimento amostral;

hipótese nula. É formulada com base nos dados populacionais.

1H : é qualquer hipótese diferente da hipótese nula, sendo sempre a favor do resultado do

experimento amostral; hipótese alternativa.

OBS: a aceitação de H0 implica na rejeição de

REGIÃO DE REJEIÇÃO E TIPOS DE TESTES

É uma região da Distribuição Amostral, definida de modo que seja igual a

H0. O tamanho da região de rejeição é expresso por

distribuição amostral. A localização da R.C. (região

indica o sentido da diferença, usa

Exemplo: H0: µ = µ0

H1: µ > µ0

Região de Rejeição (RR) e de Aceitação (RA) da Hipótese Nula

Observe que essas duas regiões diferem entre si em localização, mas não em tamanho.

Estatística Aplicada a Engenharia I – Prof. Msc. André Luiz Sena da Rocha

[email protected]

parâmetro populacional, e pelos elementos amostrais faz-se um teste que indicará a rejeição, ou não,

Suposição quanto ao valor de um parâmetro ou quanto à natureza da distribuição de uma

lidade de uma variável populacional.

: é aquela que será testada, sendo sempre contrária ao resultado do experimento amostral;

hipótese nula. É formulada com base nos dados populacionais.

: é qualquer hipótese diferente da hipótese nula, sendo sempre a favor do resultado do

experimento amostral; hipótese alternativa.

implica na rejeição de H1, e a rejeição de H0 implica na aceitação de

IPOS DE TESTES

É uma região da Distribuição Amostral, definida de modo que seja igual a α

. O tamanho da região de rejeição é expresso por α, e está localizada nas extremidades da

distribuição amostral. A localização da R.C. (região crítica) está afetada pela natureza de H

indica o sentido da diferença, usa-se um teste unilateral, caso contrário, usa-se bilateral.

Região de Rejeição (RR) e de Aceitação (RA) da Hipótese Nula

as duas regiões diferem entre si em localização, mas não em tamanho.

88

se um teste que indicará a rejeição, ou não,

Suposição quanto ao valor de um parâmetro ou quanto à natureza da distribuição de uma

: é aquela que será testada, sendo sempre contrária ao resultado do experimento amostral;

: é qualquer hipótese diferente da hipótese nula, sendo sempre a favor do resultado do

implica na aceitação de H1.

α, a probabilidade sob

á localizada nas extremidades da

crítica) está afetada pela natureza de H1. Se H1

se bilateral.

Região de Rejeição (RR) e de Aceitação (RA) da Hipótese Nula

as duas regiões diferem entre si em localização, mas não em tamanho.

Page 92: [Apostila] Estatística Aplicada a Engenharia I

EST0323– Estatística Aplicada a Engenharia I – Prof. Msc. André Luiz Sena da Rocha

[email protected]

89

Regra de Decisão

Se o teste estatístico acusar um valor na região de rejeição de H0. Quando a probabilidade associada

a um valor observado de um teste estatístico é menor ou igual do que o valor previamente

determinado de α, concluímos que H0 é falsa, tal valor observado é chamado "significativo". H0 é

rejeitada sempre que ocorre um valor "significativo".

TIPOS DE ERROS:

1 Erro Tipo I (α): P(rejeitar H0 | H0 é verdadeira) Probabilidade de rejeitar H0 dado que H0 é

verdadeira.

2 Erro Tipo II (β): P(aceitar H0 | H0 é falsa) Probabilidade de aceitar H0 dado que H0 é falsa.

Realidade

Decisão

Aceitar 0H Rejeitar 0H

0H é verdadeira Decisão Correta ( )α−1 Erro Tipo I ( )α

0H é falsa Erro Tipo II ( )β Decisão Correta ( )β−1

ERRO TIPO I ⇒ cometido quando rejeitamos H0 , quando na verdade, ela é verdadeira. Esse tipo

de erro é o mais importante a ser evitado. A probabilidade de se cometer um erro tipo I é o que se

chama de nível de significância de um teste. α =P(erro tipo I).

ERRO TIPO II ⇒ cometido quando não rejeitamos H0, quando na verdade ela é falsa.

Deseja-se: reduzir ao mínimo as probabilidades dos erros.

TAREFA DIFÍCIL: para uma amostra de tamanho n a probabilidade de se incorrer em um erro tipo

II aumenta à medida que diminui a probabilidade do erro tipo I (vice-versa).

REDUÇÃO SIMULTÂNEA AUMENTO DO

DOS ERROS TAMANHO DE n

PROCEDIMENTO PARA CONSTRUÇÃO DO TESTE DE HIPÓTESE:

1. Estabelecer as hipóteses de nulidade 0H e alternativa 1H ;

Page 93: [Apostila] Estatística Aplicada a Engenharia I

EST0323– Estatística Aplicada a Engenharia I – Prof. Msc. André Luiz Sena da Rocha

[email protected]

90

2. Escolhe um nível de significância α , em geral, usa-se: 0,05; 0,01 ou 0,001;

3. Selecionar uma estatística apropriada e determinar as RA e RC para 0H , com o auxílio das

tabelas estatísticas, considerando α e a variável do teste.

4. Com os elementos amostrais, calcular o valor da variável do teste.

5. Concluir pela aceitação ou rejeição de 0H pela comparação do valor obtido no 4º passo

com RA e RC, ou seja, rejeitar Ho sempre que a estatística calculada pertencer à região

crítica, caso contrário, não rejeitar.

TESTES PARAMÉTRICOS

4.3.1 - Teste para a Média quando σ2 é conhecido

Quando queremos realizar um teste de hipótese para a média populacional, se conhecemos o valor

do desvio-padrão da população, teremos como base para a estatística do teste a distribuição normal.

É muito comum situações em que necessitamos estudar um determinado parâmetro ou característica

de certa população. No entanto, esse procedimento pode levar muito tempo e/ou necessitar de

recursos financeiros muito altos.

Assim, uma possível solução, seria estimar o resultado da característica de interesse da população

(com um nível (1-α) de certeza), extraindo uma amostra de tamanho n, e, utilizando o desvio-padrão

da população na estimação. A figura abaixo ilustra o procedimento proposto.

Page 94: [Apostila] Estatística Aplicada a Engenharia I

EST0323– Estatística Aplicada a Engenharia I – Prof. Msc. André Luiz Sena da Rocha

[email protected]

91

REQUISITOS PARA O TESTE:

• A amostra é uma amostra aleatória simples;

• O valor do desvio-padrão populacional σ é CONhecido;

• Pelo menos uma das condições seguintes é verdadeira:

o A população é normalmente distribuída;

o O tamanho da amostra é superior a 30, ou seja, n>30. (TCL)

O procedimento para a realização desse teste de hipóteses pode ser resumido nos seguintes passos:

1. Enunciar as hipóteses:

( )( )( )

0 0

0

1 0

0

:

( ) Teste Bilateral 2: ( ) Teste Unilateral

( ) Teste Unilateral

H

a

H b

c

µ µ

αµ µ

µ µ α

µ µ α

=

> <

Em que o verdadeiro valor de µ é µ0.

2. Determinar a distribuição de X , e, a estatística de teste.

2

2~ , ~ (0,1)

XX N Z N

n

n

σ µµ

σ

−⇒ =

A estatística de teste é uma estatística amostral, usada para tomar uma decisão em relação à

hipótese nula.

Page 95: [Apostila] Estatística Aplicada a Engenharia I

EST0323– Estatística Aplicada a Engenharia I – Prof. Msc. André Luiz Sena da Rocha

[email protected]

92

3. Fixar o nível de significância α . (normalmente é utilizado α = 5%).

4. Determinar a Região de Aceitação e a Região de Rejeição através da tabela Z –

Normal-Padrão. (É necessário ter fixado o valor de α).

5. Calcular a variável do teste cal

XZ

n

µσ−

=

6. Conclusões

1. Se –Zα/2 < Z

Calc < Zα/2

, não rejeita H0 Teste Bilateral

2. Se ZCalc

> Zα, rejeita-se H0

Teste Unilateral

3. Se ZCalc

< Zα, rejeita-se H0

Teste Unilateral

Exemplo 3.8: Em indivíduos sadios, a taxa de fósforo no sangue tem distribuição aproximadamente

normal com média µ = 3 mg/100cc e desvio-padrão σ = 0,6mg/100cc. Com o objetivo de saber se

no artritismo essa taxa média aumentou, um pesquisador tomou uma amostra de 36 doentes e testou

sua hipótese ao nível de 5% de significância. Observou-se na amostra a média X = 3,12mg/100cc.

Solução:

As hipóteses serão as seguintes

H0: µ = 3,0

H1: µ > 3,0 (teste unilateral)

OU

H0: A taxa de fósforo no sangue de pessoas com artritismo é igual a 3,0mg/100cc.

H1: A taxa de fósforo no sangue de pessoas com artritismo é maior que 3,0mg/100cc.

Usaremos α = 0, 05. A estatística a ser utilizada será:

2

3,12 3,0 0,121,2

0,6 0,136

Calc

XZ

n

µ

σ

− −= = = =

Page 96: [Apostila] Estatística Aplicada a Engenharia I

EST0323– Estatística Aplicada a Engenharia I – Prof. Msc. André Luiz Sena da Rocha

[email protected]

93

Após termos calculado a estatística do teste, vamos agora encontrar a probabilidade na tabela de

distribuição Normal-Padrão (Tabela do ANEXO A). Lembre-se que como o teste é unilateral, o

valor de α será igual a 5%, e não a 2,5%.

Logo, como a tabela da distribuição normal nos dá de 0 até +∞ (50% da área total, ou probabilidade

igual a 0,5), temos que:

50% - α = 50% - 5% = 45% = 0,45 Z = 1,645.

Como na tabela não encontramos um valor exato de 0,45. O mais próximo dessa probabilidade são

dois valores de P(Z < 1,64) = 0,4495 e P(Z < 1,65) = 0,4505. Repare que para Z=1,64 e Z=1,65, um

é menor e outro é maior, respectivamente, que 0,45 na mesma proporção. Assim, faz-se necessário

realizar uma interpolação apenas realizando uma média aritmética de ambos os valores de Z, tendo

assim: P(Z < 1,645) ≈ 0,445.

( ) ( )1,64 1,650, 45 1,645 1,645 0, 45.

2P Z x x P Z

+< = ⇒ = = ⇒ < ≈

Page 97: [Apostila] Estatística Aplicada a Engenharia I

EST0323– Estatística Aplicada a Engenharia I

Conclusão: Como ZCalc ≤ Zα , ou seja, 1,2

rejeitaremos a hipótese nula de que a taxa de fósforo no sangue de pessoas com artritismo seja igual

a 3,0mg/100cc.

Exercício 3.3: Em indivíduos normais, o consumo renal médio de oxigênio é de 12 cm

desvio-padrão de 2,3 cm3/min. Um pesquisador interessado em s

selecionou uma amostra de 28 pessoas sadias e obteve um consumo renal médio de oxigênio de

13,45 cm3/min. Teste a um nível de 5% se realmente ocorre o que o pesquisador averiguou

as hipóteses e interprete.

Estatística Aplicada a Engenharia I – Prof. Msc. André Luiz Sena da Rocha

[email protected]

, ou seja, 1,2 ≤ 1,645. Então, a um nível de significância de 5%, não

hipótese nula de que a taxa de fósforo no sangue de pessoas com artritismo seja igual

Em indivíduos normais, o consumo renal médio de oxigênio é de 12 cm

/min. Um pesquisador interessado em saber se isso realmente ocorre,

selecionou uma amostra de 28 pessoas sadias e obteve um consumo renal médio de oxigênio de

Teste a um nível de 5% se realmente ocorre o que o pesquisador averiguou

94

ão, a um nível de significância de 5%, não

hipótese nula de que a taxa de fósforo no sangue de pessoas com artritismo seja igual

Em indivíduos normais, o consumo renal médio de oxigênio é de 12 cm3/min com

aber se isso realmente ocorre,

selecionou uma amostra de 28 pessoas sadias e obteve um consumo renal médio de oxigênio de

Teste a um nível de 5% se realmente ocorre o que o pesquisador averiguou. Defina

Page 98: [Apostila] Estatística Aplicada a Engenharia I

EST0323– Estatística Aplicada a Engenharia I

4.3.2 - Teste para a Média quando

Quando queremos realizar um teste de hipótese para a média populacional, se conhecemos o valor

do desvio-padrão da população, teremos como base para a estatística do teste a distribuição normal.

No entanto, quando desconhecemos o desvio

tomamos como base a distribuição

REQUISITOS PARA O TESTE:

a) A amostra é uma amostra aleatória simples;

b) O valor do desvio-padrão populacional

c) Pelo menos uma das condições seguintes é verdadeira:

a. A população é normalmente distribuída;

b. O tamanho da amostra é superior a 30, ou seja, n>30. (TCL)

Neste caso, como não conhecemos

Para a construção das hipóteses a serem analisadas, a região de rejeição será baseada numa

estatística de teste com base na distribuição

Assim, para realizar o teste, devemos seguir os seguintes procedimentos:

Estatística Aplicada a Engenharia I – Prof. Msc. André Luiz Sena da Rocha

[email protected]

Teste para a Média quando σ2 é desconhecido

Quando queremos realizar um teste de hipótese para a média populacional, se conhecemos o valor

padrão da população, teremos como base para a estatística do teste a distribuição normal.

uando desconhecemos o desvio-padrão populacional, que é o que ocorre na prática,

tomamos como base a distribuição t de Student.

REQUISITOS PARA O TESTE:

A amostra é uma amostra aleatória simples;

padrão populacional σ é DESconhecido;

Pelo menos uma das condições seguintes é verdadeira:

A população é normalmente distribuída;

O tamanho da amostra é superior a 30, ou seja, n>30. (TCL)

Neste caso, como não conhecemos σ2, precisamos calcular a estimativa S

2 a partir de uma amostra.

construção das hipóteses a serem analisadas, a região de rejeição será baseada numa

estatística de teste com base na distribuição t de Student:

12~ ~ n

XT t

S

n

µ−

Assim, para realizar o teste, devemos seguir os seguintes procedimentos:

95

Quando queremos realizar um teste de hipótese para a média populacional, se conhecemos o valor

padrão da população, teremos como base para a estatística do teste a distribuição normal.

padrão populacional, que é o que ocorre na prática,

a partir de uma amostra.

construção das hipóteses a serem analisadas, a região de rejeição será baseada numa

Page 99: [Apostila] Estatística Aplicada a Engenharia I

EST0323– Estatística Aplicada a Engenharia I – Prof. Msc. André Luiz Sena da Rocha

[email protected]

96

a) Enunciar as hipóteses:

( )( )( )

0 0

0

1 0

0

:

( ) Teste Bilateral 2: ( ) Teste Unilateral

( ) Teste Unilateral

H

a

H b

c

µ µ

αµ µ

µ µ α

µ µ α

=

> <

b) Fixar o nível de significância α . Admitindo 2σ desconhecida, a variável do teste será

( )1−nt .

c) Determinar RA e RC através da tabela t.

d) Calcular a variável do teste /cal

XT

S n

µ−=

e) Conclusões

4. Se –tα/2 < T

Calc < tα/2

, não rejeita H0 Teste Bilateral

5. Se TCalc

> tα, rejeita-se H0

Teste Unilateral

6. Se TCalc

< tα, rejeita-se H0

Teste Unilateral

Exemplo 3.9: A tolerância de dieta diária de zinco recomendada entre homens com mais de 50 anos

é 15mg/dia. O artigo “Nutrient Intakes and Dietary Patterns of Older Americans: A National

Study” (J. Gerontology, 1992, pg. 145-150) relata sobre ingestão uma média de 17,3 mg/dia e

desvio-padrão de 6,43 mg/dia para uma amostra de 88 homens com mais de 50 anos.

Esses dados, a um nível de 5% de significância, indicam que a ingestão de zinco diária média na

população dos homens com mais de 50 anos está na tolerância permitida? Defina as hipóteses e

interprete.

Solução:

As hipóteses serão as seguintes

H0: µ = 15 mg/dia

H1: µ ≠ 15 mg/dia (teste bilateral)

Page 100: [Apostila] Estatística Aplicada a Engenharia I

EST0323– Estatística Aplicada a Engenharia I – Prof. Msc. André Luiz Sena da Rocha

[email protected]

97

OU

H0: Os homens com + de 50 anos estão com a tolerância de dieta diária de zinco recomendada.

H1: Os homens com + de 50 anos NÃO estão com a tolerância de dieta diária de zinco recomendada.

Usaremos α = 0, 05. A estatística a ser utilizada será:

2

15 17,3 2,33,3557

6,43 0,685488

Calc

XT

S

n

µ− − −= = = = −

Os graus de liberdade (g.l.) para o teste “t” de Student serão obtidos da seguinte forma:

g.l. = n – 1 = 88 – 1 = 87

Após termos calculado a estatística do teste e o número de g.l., vamos agora encontrar a

probabilidade na tabela de distribuição t-Studentl (Tabela do ANEXO B). Como usar esta tabela?

- Localizar o valor correspondente de α (lembrando que se for um teste bilateral, então

será α/2); Logo, para α=5%, devemos procurar nesse exemplo, o valor 2,5% na tabela;

- Localizar o valor correspondente de φ (g.l. = n - 1); Nesse caso temos que g.l.=88-1=87;

- No cruzamento da linha com (φ = 87) com a coluna (α = 2,5%), por ser um teste

bilateral, então α/2, está o número 1,9876.

Page 101: [Apostila] Estatística Aplicada a Engenharia I

EST0323– Estatística Aplicada a Engenharia I

α

φ

81

82

83

84

85

86

87

88

89

90

Conclusão: Como TCalc ≤ -tα/2 , ou seja,

5%, rejeitaremos a hipótese nula, assim,

tolerância de dieta diária de zinco recomendada.

Estatística Aplicada a Engenharia I – Prof. Msc. André Luiz Sena da Rocha

[email protected]

25% 10% 5% 2,5%

0,6775 1,2921 1,6639 1,9897

0,6775 1,2920 1,6636 1,9893

0,6775 1,2918 1,6634 1,9890

0,6774 1,2917 1,6632 1,9886

0,6774 1,2916 1,6630 1,9883

0,6774 1,2915 1,6628 1,9879

0,6773 1,2914 1,6626 1,9876

0,6773 1,2912 1,6624 1,9873

0,6773 1,2911 1,6622 1,9870

0,6772 1,2910 1,6620 1,9867

, ou seja, -3,3557 < -1,9876. Então, a um nível de

nula, assim, os homens com + de 50 anos

tolerância de dieta diária de zinco recomendada.

98

. Então, a um nível de significância de

os homens com + de 50 anos NÃO estão com a

Page 102: [Apostila] Estatística Aplicada a Engenharia I

EST0323– Estatística Aplicada a Engenharia I – Prof. Msc. André Luiz Sena da Rocha

[email protected]

99

Exercício 3.4: Uma companhia de produtos para o consumidor está formulando um xampu novo e

está interessado na altura (em milímetros) da espuma. A altura da espuma tem distribuição

aproximadamente normal com S = 20 mm. A companhia analisou 10 frascos de xampu e obteve

uma altura média de 175 mm, diferente da esperada pelos engenheiros, de 179 mm. Usando esses

resultados, a companhia pode assumir que seu xampu alcança a altura média menor que a estimada

pelos engenheiros? Faça um teste de hipóteses para comprovar sua teoria.

4.3.3 - Teste para Proporções

1. Enunciar as hipóteses:

<

>

=

)(

)(

)(

:

:

0

0

0

1

00

cpp

bpp

app

H

ppH

2. Fixar o nível de significância α . A variável escolhida é Z, normal padrão.

3. Determinar RA e RC através da tabela da distribuição normal padrão.

Calcular a variável do teste 0

0 0

ˆ

/cal

p pZ

p q n

−=

4. Conclusões

a) Se –Zα/2 < ZCalc < Zα/2, não rejeita H0

b) Se ZCalc

> Zα/2, rejeita-se H

0

c) Se ZCalc

< -Zα/2, rejeita-se H

0

Exemplo 3.10: Um pesquisador afirma que a fração de circuitos integrados defeituosos produzidos

em um processo de fotolitografia (técnica utilizada na confecção de circuitos integrados) é igual a

5%. Uma amostra de 300 circuitos é testada, encontrando 13 defeituosos. Teste ao nível de

significância de 1%, se o pesquisador está correto. Defina as hipóteses e Interprete.

Solução:

0 0,05p = , 300n = , k = 13, 0,05α = e ˆ 13/ 300 0,04p = =

Page 103: [Apostila] Estatística Aplicada a Engenharia I

EST0323– Estatística Aplicada a Engenharia I

1. Enunciar as hipóteses

0

1

: 0 , 05

: 0, 05

H p

H p

=

2. 05.0=α

Variável: (5% 2,5%2 2

Z Z Zα = = =

4. Calcular a estatística do teste:

0

0 0

ˆ

/cal

p pZ

p q n

−= = = = −

4. Determinar RA e RC:

5. Conclusão:

Como -ZTab < ZCal < +ZTab 1,96 <

significância, concluí-se que a fração d

processo de fotolitografia é igual a 5%.

Estatística Aplicada a Engenharia I – Prof. Msc. André Luiz Sena da Rocha

[email protected]

)2,5% 1,96= = = .

Calcular a estatística do teste:

( )( )0, 04 0, 05 0, 01

0, 0125/ 0, 05 0,95 / 300p q n

− −= = = = −

1,96 < -0,8 < 1,96; NÃO rejeita H0, ou seja, com 5% de

se que a fração de circuitos integrados defeituosos produzidos em um

processo de fotolitografia é igual a 5%.

100

0, 04 0, 05 0, 010,8

0, 0125= = = = −

, ou seja, com 5% de

e circuitos integrados defeituosos produzidos em um

Page 104: [Apostila] Estatística Aplicada a Engenharia I

EST0323– Estatística Aplicada a Engenharia I – Prof. Msc. André Luiz Sena da Rocha

[email protected]

101

Exercício 3.5: Uma máquina foi regulada para fabricar placas de 5 mm de espessura. No entanto,

após uma inspeção de rotina, o técnico informou ao seu dono que ela está produzindo 4% das placas

com defeitos. Assim, foi retirada uma amostra de 40 placas, identificando apenas 2 com defeito.

Teste a um nível de 99% de confiança se a máquina está produzindo um percentual de peças com

defeito acima do que o técnico informou. Defina as hipóteses e interprete.

4.3.4 - Valor-P

A seção anterior sobre teste de hipóteses mostrou que se pode rejeitar ou não uma hipótese usando

um nível de significância α, um valor crítico e uma correspondente região de rejeição, que é a

abordagem clássica. A seguir, será apresentada uma outra maneira equivalente, bastante comum e

abordada na maioria dos softwares estatísticos e na literatura científica, de se obter o mesmo

resultado final.

Definição: O valor-p é a chance de encontrar o valor observado na amostra ou valores mais

extremos, assumindo que a hipótese nula, H0, é verdadeira.

Observação 1: No caso do uso do valor-p, não precisamos mais calcular uma estatística do teste e

compará-la com um valor tabela da distribuição de referência (normal, t-student, F, qui-quadrado,

etc). Basta compararmos o resultado do valor-p diretamente com o nível de significância α.

Observação 2: Quanto menor for o valor-p, mais forte será a evidência fornecida pela amostra

contra H0. Por outro lado, quanto maior for o valor-p, menor será a evidência contra H0.

Relação entre valor-p e α

a) Se valor-p ≤ α rejeita-se H0 e os dados SÃO estatisticamente significantes.

b) Se valor-p > α não se rejeita H0 e os dados NÃO SÃO estatisticamente significantes.

Page 105: [Apostila] Estatística Aplicada a Engenharia I

EST0323– Estatística Aplicada a Engenharia I – Prof. Msc. André Luiz Sena da Rocha

[email protected]

102

Exemplo 3.11: Um pesquisador deseja determinar o efeito da taxa de escoamento de C2F6 sobre a

uniformidade do ataque químico em uma pastilha de silicone usada na fabricação de um circuito

integrado. Três taxas de escoamento são usadas no experimento e a uniformidade (em porcentagem)

resultante, para seis pastilhas de silicone para cada taxa de escoamento. O experimento foi

completamente aleatorizado.

HIPÓTESES TESTADAS:

H0: Não há diferença na resposta entre as taxas de escoamento de C2F6;

H1: Há diferença na resposta entre pelo menos duas das taxas de escoamento de C2F6.

Para uma valor-P = 0,0533, rejeita-se H0 (α=5%)?

Solução:

Não rejeita H0, pois Valor-p > α.

Exemplo 3.12: Um pesquisador deseja testar a resistência do concreto à compressão. Ele deseja

investigar quatro técnicas diferentes de mistura. O experimento foi completamente aleatorizado.

HIPÓTESES TESTADAS:

H0: Não há diferença na resposta entre as diferentes técnicas de mistura;

H1: Há diferença na resposta entre pelo menos duas das diferentes técnicas de mistura.

a) Para uma valor-P = 0,000488, rejeita-se H0 (α=5%)?

Solução:

Rejeita H0, pois Valor-p < α.

b) E se fosse testar com α=1%? Rejeita H0 ?

Solução:

Rejeita H0, pois Valor-p < α 0,0488% < 1%.

c) Nesse caso, os dados são ESTATISTICAMENTE SIGNIFICANTES? Justifique.

Solução:

São! Porque rejeitou H0.(Hipótese Nula)

Page 106: [Apostila] Estatística Aplicada a Engenharia I

EST0323– Estatística Aplicada a Engenharia I – Prof. Msc. André Luiz Sena da Rocha

[email protected]

103

Exemplo 3.13: Um experimento foi feito para determinar se quatro temperaturas específicas de

queima afetam a densidade de um certo tipo de tijolo. Utilizando 4 tijolos para cada temperatura

específica, foi determinada a densidade para o tipo de tijolo de acordo com a variação das

temperaturas. O experimento foi completamente aleatorizado.

HIPÓTESES TESTADAS:

H0: Não há diferença na densidade do tipo de tijolo variando as temperaturas;

H1:Há diferença na densidade do tipo de tijolo em pelo menos duas das temperaturas.

a) Para um valor-P = 0,0000125, rejeita-se H0 (α=1%)?

Solução:

Rejeita H0, pois Valor-p < α.

b) E se fosse testar com α=5%? Rejeita H0 ?

Solução:

Rejeita H0, pois Valor-p < α 0,0488% < 1%.

c) Nesse caso, os dados são ESTATISTICAMENTE SIGNIFICANTES? Justifique.

Solução:

São! Porque rejeitou H0.(Hipótese Nula)

Page 107: [Apostila] Estatística Aplicada a Engenharia I

EST0323– Estatística Aplicada a Engenharia I – Prof. Msc. André Luiz Sena da Rocha

[email protected]

104

REFERÊNCIAS

1. AZEVEDO, P. R. M. Introdução à Estatística. Rio Grande do Norte: EDUFRN, 2005.

2. BUSSAB, W. O. e MORETIN, P. A. Estatística Básica. 5. ed. São Paulo: Atual, 2006.

3. VIEIRA, S. Introdução à Bioestatística. 3. Ed. Rio de Janeiro: Campus, 1980.

4. DANTAS, C. A. B. Probabilidade: um curso introdutório. 2. ed. 1. reimpressão - São

Paulo: Editora da Universidade de São Paulo, 2004.

5. MEYER, P. L. Probabilidade: aplicações à estatística. 2. ed. - Rio de Janeiro: Livros técnicos

e científicos editora S. A., 1983.

6. MONTGOMERY, D.C. e RUNGER, G. C. Estatística Aplicada e Probabilidade para

Engenheiros. 4. ed. Rio de Janeiro: LTC, 2009.

7. MORETTIN, P. A. & BUSSAB, W. de O. Estatística Básica. 5. Ed. São Paulo: SARAIVA,

2002.

8. PINHO, A. L. S. & SPYRIDES, M. H. C. Métodos Estatísticos I. Natal: UFRN, 2011.

(Notas de Aula).

9. SILVA, Francisco de Assis Medeiros da. Estatística Aplicada à Administração. Natal: UFRN,

2004. (Notas de Aula).

10. TRIOLA, M. F. Introdução à Estatística. 10.ed. LTC, 2008.

11. WERKEMA, M. C. C. Como estabelecer conclusões com confiança: entendendo inferência

estatística. Série Ferramentas de Qualidade.

Page 108: [Apostila] Estatística Aplicada a Engenharia I

EST0323– Estatística Aplicada a Engenharia I – Prof. Msc. André Luiz Sena da Rocha

[email protected]

105

ANEXOS

TABELA A - DISTRIBUIÇÃO NORMAL PADRÃO

TABELA B – DISTRIBUIÇÃO T DE STUDENT

Page 109: [Apostila] Estatística Aplicada a Engenharia I

EST0323– Estatística Aplicada a Engenharia I

ANEXO A - Distribuição Normal Padrã

zc 0,00 0,01 0,02

0,0 0,0000 0,0040 0,0080 0,1 0,0398 0,0438 0,0478 0,2 0,0793 0,0832 0,0871 0,3 0,1179 0,1217 0,1255 0,4 0,1554 0,1591 0,1628

0,5 0,1915 0,1950 0,1985 0,6 0,2257 0,2291 0,2324 0,7 0,2580 0,2611 0,2642 0,8 0,2881 0,2910 0,2939 0,9 0,3159 0,3186 0,3212

1,0 0,3413 0,3438 0,3461 1,1 0,3643 0,3665 0,3686 1,2 0,3849 0,3869 0,3888 1,3 0,4032 0,4049 0,4066 1,4 0,4192 0,4207 0,4222

1,5 0,4332 0,4345 0,4357 1,6 0,4452 0,4463 0,4474 1,7 0,4554 0,4564 0,4573 1,8 0,4641 0,4649 0,4656 1,9 0,4713 0,4719 0,4726

2,0 0,4772 0,4778 0,4783 2,1 0,4821 0,4826 0,4830 2,2 0,4861 0,4864 0,4868 2,3 0,4893 0,4896 0,4898 2,4 0,4918 0,4920 0,4922

2,5 0,4938 0,4940 0,4941 2,6 0,4953 0,4955 0,4956 2,7 0,4965 0,4966 0,4967 2,8 0,4974 0,4975 0,4976 2,9 0,4981 0,4982 0,4982 3,0 0,4987 0,4987 0,4987 3,10 ou + 0,4999

NOTA: Para valores de Z acima de 3,09, use 0,4999 como área. * Use esses valores comuns resultantes

Escore z Área 1,645 0,4500 2,575 0,4950

Estatística Aplicada a Engenharia I – Prof. Msc. André Luiz Sena da Rocha

[email protected]

Distribuição Normal Padrão Z~N(0,1)

P(0 ≤ Z ≤ zc)

0,02 0,03 0,04 0,05 0,06 0,07

0,0080 0,0120 0,0160 0,0199 0,0239 0,0279 0,0478 0,0517 0,0557 0,0596 0,0636 0,0675 0,0871 0,0910 0,0948 0,0987 0,1026 0,1064 0,1255 0,1293 0,1331 0,1368 0,1406 0,1443 0,1628 0,1664 0,1700 0,1736 0,1772 0,1808

0,1985 0,2019 0,2054 0,2088 0,2123 0,2157 0,2324 0,2357 0,2389 0,2422 0,2454 0,2486 0,2642 0,2673 0,2704 0,2734 0,2764 0,2794 0,2939 0,2967 0,2995 0,3023 0,3051 0,3078 0,3212 0,3238 0,3264 0,3289 0,3315 0,3340

0,3461 0,3485 0,3508 0,3531 0,3554 0,3577 0,3686 0,3708 0,3729 0,3749 0,3770 0,3790 0,3888 0,3907 0,3925 0,3944 0,3962 0,3980 0,4066 0,4082 0,4099 0,4115 0,4131 0,4147 0,4222 0,4236 0,4251 0,4265 0,4279 0,4292

0,4357 0,4370 0,4382 0,4394 0,4406 0,4418 0,4474 0,4484 0,4495 *0,4505 0,4515 0,4525 0,4573 0,4582 0,4591 0,4599 0,4608 0,4616 0,4656 0,4664 0,4671 0,4678 0,4686 0,4693 0,4726 0,4732 0,4738 0,4744 0,4750 0,4756

0,4783 0,4788 0,4793 0,4798 0,4803 0,4808 0,4830 0,4834 0,4838 0,4842 0,4846 0,4850 0,4868 0,4871 0,4875 0,4878 0,4881 0,4884 0,4898 0,4901 0,4904 0,4906 0,4909 0,4911 0,4922 0,4925 0,4927 0,4929 0,4931 0,4932

0,4941 0,4943 0,4945 0,4946 0,4948 0,4949 0,4956 0,4957 0,4959 0,4960 0,4961 0,4962 0,4967 0,4968 0,4969 0,4970 0,4971 0,4972 0,4976 0,4977 0,4977 0,4978 0,4979 0,4979 0,4982 0,4983 0,4984 0,4984 0,4985 0,4985

0,4987 0,4988 0,4988 0,4989 0,4989 0,4989

NOTA: Para valores de Z acima de 3,09, use 0,4999 como

* Use esses valores comuns resultantes de interpolação:

106

0,08 0,09

0,0319 0,0359 0,0714 0,0753 0,1103 0,1141 0,1480 0,1517 0,1844 0,1879

0,2190 0,2224 0,2517 0,2549 0,2823 0,2852 0,3106 0,3133 0,3365 0,3389

0,3599 0,3621 0,3810 0,3830 0,3997 0,4015 0,4162 0,4177 0,4306 0,4319

0,4429 0,4441 0,4535 0,4545 0,4625 0,4633 0,4699 0,4706 0,4761 0,4767

0,4812 0,4817 0,4854 0,4857 0,4887 0,4890 0,4913 0,4916 0,4934 0,4936

*0,4951 0,4952 0,4963 0,4964 0,4973 0,4974 0,4980 0,4981 0,4986 0,4986

0,4990 0,4990

Page 110: [Apostila] Estatística Aplicada a Engenharia I

EST0323– Estatística Aplicada a Engenharia I

TABELA B - Distribuição t de Student (Unicaudal e Bicaudal)

αααα

25% 10% 5% 2,5% ϕϕϕϕ

1 1,0000 3,0777 6,3138 12,7062

2 0,8165 1,8856 2,9200 4,3027

3 0,7649 1,6377 2,3534 3,1824

4 0,7407 1,5332 2,1318 2,7764

5 0,7267 1,4759 2,0150 2,5706 6 0,7176 1,4398 1,9432 2,4469

7 0,7111 1,4149 1,8946 2,3646

8 0,7064 1,3968 1,8595 2,3060

9 0,7027 1,3830 1,8331 2,2622

10 0,6998 1,3722 1,8125 2,2281 11 0,6974 1,3634 1,7959 2,2010

12 0,6955 1,3562 1,7823 2,1788

13 0,6938 1,3502 1,7709 2,1604

14 0,6924 1,3450 1,7613 2,1448

15 0,6912 1,3406 1,7531 2,1315 16 0,6901 1,3368 1,7459 2,1199

17 0,6892 1,3334 1,7396 2,1098

18 0,6884 1,3304 1,7341 2,1009

19 0,6876 1,3277 1,7291 2,0930

20 0,6870 1,3253 1,7247 2,0860 21 0,6864 1,3232 1,7207 2,0796

22 0,6858 1,3212 1,7171 2,0739

23 0,6853 1,3195 1,7139 2,0687

24 0,6848 1,3178 1,7109 2,0639

25 0,6844 1,3163 1,7081 2,0595 26 0,6840 1,3150 1,7056 2,0555

27 0,6837 1,3137 1,7033 2,0518

28 0,6834 1,3125 1,7011 2,0484

29 0,6830 1,3114 1,6991 2,0452

30 0,6828 1,3104 1,6973 2,0423 31 0,6825 1,3095 1,6955 2,0395

32 0,6822 1,3086 1,6939 2,0369

33 0,6820 1,3077 1,6924 2,0345

34 0,6818 1,3070 1,6909 2,0322

35 0,6816 1,3062 1,6896 2,0301 36 0,6814 1,3055 1,6883 2,0281

37 0,6812 1,3049 1,6871 2,0262

38 0,6810 1,3042 1,6860 2,0244

39 0,6808 1,3036 1,6849 2,0227

40 0,6807 1,3031 1,6839 2,0211 41 0,6805 1,3025 1,6829 2,0195

42 0,6804 1,3020 1,6820 2,0181

43 0,6802 1,3016 1,6811 2,0167

44 0,6801 1,3011 1,6802 2,0154

45 0,6800 1,3006 1,6794 2,0141

Estatística Aplicada a Engenharia I – Prof. Msc. André Luiz Sena da Rocha

[email protected]

Distribuição t de Student (Unicaudal e Bicaudal)

ϕ = graus de liberdade

1% 0,5% αααα

25% 10% 5% 2,5% ϕϕϕϕ

31,8207 63,6574 46 0,6799 1,3002 1,6787 2,0129

6,9646 9,9248 47 0,6797 1,2998 1,6779 2,0117

4,5407 5,8409 48 0,6796 1,2994 1,6772 2,0106

3,7469 4,6041 49 0,6795 1,2991 1,6766 2,0096

3,3649 4,0322 50 0,6794 1,2987 1,6759 2,0086

3,1427 3,7074 51 0,6793 1,2984 1,6753 2,0076

2,9980 3,4995 52 0,6792 1,2980 1,6747 2,0066

2,8965 3,3554 53 0,6791 1,2977 1,6741 2,00

2,8214 3,2498 54 0,6791 1,2974 1,6736 2,0049

2,7638 3,1693 55 0,6790 1,2971 1,6730 2,0040

2,7181 3,1058 56 0,6789 1,2969 1,6725 2,0032

2,6810 3,0545 57 0,6788 1,2966 1,6720 2,0025

2,6503 3,0123 58 0,6787 1,2963 1,6716 2,0017

2,6245 2,9768 59 0,6787 1,2961 1,6711 2,0010

2,6025 2,9467 60 0,6786 1,2958 1,6706 2,0003

2,5835 2,9208 61 0,6785 1,2956 1,6702 1,9996

2,5669 2,8982 62 0,6785 1,2954 1,6698 1,9990

2,5524 2,8784 63 0,6784 1,2951 1,6694 1,9983

2,5395 2,8609 64 0,6783 1,2949 1,6690 1,9977

2,5280 2,8453 65 0,6783 1,2947 1,6686 1,9971

2,5177 2,8314 66 0,6782 1,2945 1,6683 1,9966

2,5083 2,8188 67 0,6782 1,2943 1,6679 1,9960

2,4999 2,8073 68 0,6781 1,2941 1,6676 1,9955

2,4922 2,7969 69 0,6781 1,2939 1,6672 1,9949

2,4851 2,7874 70 0,6780 1,2938 1,6669 1,9944

2,4786 2,7787 71 0,6780 1,2936 1,6666 1,9939

2,4727 2,7707 72 0,6779 1,2934 1,6663 1,9935

2,4671 2,7633 73 0,6779 1,2933 1,6660 1,9930

2,4620 2,7564 74 0,6778 1,2931 1,6657 1,9925

2,4573 2,7500 75 0,6778 1,2929 1,6654 1,9921

2,4528 2,7440 76 0,6777 1,2928 1,6652 1,9917

2,4487 2,7385 77 0,6777 1,2926 1,6649 1,9913

2,4448 2,7333 78 0,6776 1,2925 1,6646 1,9908

2,4411 2,7284 79 0,6776 1,2924 1,6644 1,9905

2,4377 2,7238 80 0,6776 1,2922 1,6641 1,9901

2,4345 2,7195 81 0,6775 1,2921 1,6639 1,9897

2,4314 2,7154 82 0,6775 1,2920 1,6636 1,9893

2,4286 2,7116 83 0,6775 1,2918 1,6634 1,9890

2,4258 2,7079 84 0,6774 1,2917 1,6632 1,9886

2,4233 2,7045 85 0,6774 1,2916 1,6630 1,9883

2,4208 2,7012 86 0,6774 1,2915 1,6628 1,9879

2,4185 2,6981 87 0,6773 1,2914 1,6626 1,9876

2,4163 2,6951 88 0,6773 1,2912 1,6624 1,9873

2,4141 2,6923 89 0,6773 1,2911 1,6622 1,9870

2,4121 2,6896 90 0,6772 1,2910 1,6620 1,9867 100 0,677 1,290 1,660 1,984

120 0,677 1,289 1,658 1,980

∞∞∞∞ 0,674 1,282 1,645 1,960

107

2,5% 1% 0,5%

2,0129 2,4102 2,6870

2,0117 2,4083 2,6846

2,0106 2,4066 2,6822

2,0096 2,4049 2,6800

2,0086 2,4033 2,6778

2,0076 2,4017 2,6757

2,0066 2,4002 2,6737

2,0057 2,3988 2,6718

2,0049 2,3974 2,6700

2,0040 2,3961 2,6682

2,0032 2,3948 2,6665

2,0025 2,3936 2,6649

2,0017 2,3924 2,6633

2,0010 2,3912 2,6618

2,0003 2,3901 2,6603

1,9996 2,3890 2,6589

1,9990 2,3880 2,6575

1,9983 2,3870 2,6561

1,9977 2,3860 2,6549

1,9971 2,3851 2,6536

1,9966 2,3842 2,6524

1,9960 2,3833 2,6512

1,9955 2,3824 2,6501

1,9949 2,3816 2,6490

1,9944 2,3808 2,6479

1,9939 2,3800 2,6469

1,9935 2,3793 2,6459

1,9930 2,3785 2,6449

1,9925 2,3778 2,6439

1,9921 2,3771 2,6430

,9917 2,3764 2,6421

1,9913 2,3758 2,6412

1,9908 2,3751 2,6403

1,9905 2,3745 2,6395

1,9901 2,3739 2,6387

1,9897 2,3733 2,6379

1,9893 2,3727 2,6371

1,9890 2,3721 2,6364

1,9886 2,3716 2,6356

1,9883 2,3710 2,6349

1,9879 2,3705 2,6342

1,9876 2,3700 2,6335

1,9873 2,3695 2,6329

1,9870 2,3690 2,6322

1,9867 2,3685 2,6316

1,984 2,364 2,626

1,980 2,358 2,617

1,960 2,326 2,576