Upload
emlyn
View
89
Download
0
Embed Size (px)
DESCRIPTION
Estatística Descritiva. SUMARIZANDO DADOS MENSURADOS. Medidas de tendência centra: média, mediana, moda. Separatrizes: quartis, decis percentis Medidas de dispersão: variância, desvio padrão, coeficiente de variação. Média aritmética. Mediana. - PowerPoint PPT Presentation
Citation preview
Estatística DescritivaEstatística Descritiva
SUMARIZANDO DADOS MENSURADOSSUMARIZANDO DADOS MENSURADOS
Medidas de tendência centra: média, mediana, moda.
Separatrizes: quartis, decis percentis
Medidas de dispersão: variância, desvio padrão, coeficiente de variação.
Média aritméticaMédia aritmética
NXnXXX ...321 .
NX
N
XjN
j 1X
MedianaMediana
É o valor central ou a média aritmética dos dois valores centrais.
Mediana
cfmediana
fN
L
121
Em que:L1 = limite inferior da classe mediana (isto é, da classe que contém a mediana);N = número de itens dos dados (isto é, freqüência total);(f)1 = soma de todas as freqüências das classes inferiores à mediana;fmediana = freqüência da classe mediana;c = amplitude do intervalo da classe mediana.
ModaModa
É o valor que ocorre com a maior freqüência, ou seja, é o valor mais comum. A moda pode não existir e, mesmo que exista, pode não ser única.
.21
11 cLModa
Em que:L1 = limite inferior da classe modal (isto é, a que contém a moda);1 = excesso da freqüência modal sobre a da classe imediatamente inferior;2 = excesso da freqüência modal sobre a da classe imediatamente superior;c = amplitude do intervalo da classe modal.
Quartis, decis e percentisQuartis, decis e percentis
De maneira geral, os quartis,
decis e percentis e outros valores obtidos mediante subdivisões dos dados em partes iguais são denominados quantis.
Variância, desvio padrãoVariância, desvio padrão
N
XXjs
N
j
1
2
Para as distribuições normaisPara as distribuições normais
(a) 68,27% dos casos estão incluídos entre X -s e X + s (isto é, um desvio padrão de cada lado da média);(b) 95,45% dos casos estão incluídos entre X - 2s e X + 2s (isto é, dois desvios padrões de cada lado da média);(c) 99,73% dos casos estão incluídos entre X - 3s e X + 3s (isto é, três desvios padrões de cada lado da média).
Se a dipersão absoluta é o desvio padrão s e média é a aritmética X, a dispersão relativa é denominada coeficiente de variação ou de dispersão.
.XsVoedeVariaçãCoeficient
A arte de representar dadosA arte de representar dados
Mas por que usar gráficos?Mas por que usar gráficos?
Uma imagem vale mais que ...Ganho considerável de tempo para o
leitorA informação fica mais concisaAtrai mais a atenção
Com o quê estamos lidando?Com o quê estamos lidando? Variáveis qualitativas ou quantitativas. Qualitativas– são caracterizadas por estados, níveis
ou categorias– ordenadas e não ordenadas
Quantitativas– níveis expressos numericamente– discretas ou contínuas
Preparando os GráficosPreparando os Gráficos
Diretrizes gerais, não regras
Preparando os gráficosPreparando os gráficos
Requerer mínimo esforço do leitor– Nível de esforço para ler e entender o
gráfico– Ex: direct labeling vs. legend box
B A
C
Número de usuários
Tempo deResposta
ABC
Número de usuários
Tempo deResposta
Preparando os gráficos (cont.)Preparando os gráficos (cont.)
Maximizar informação– O gráfico deve ser auto-explicativo– Eixos devem ser informativos
Usar práticas usualmente aceitas– Exs: origem em (0,0); escala cresce da
esquerda pra direita; escalas lineares...
Preparando os gráficos (cont.)Preparando os gráficos (cont.)
Evitar ambigüidades– Identificar todos os elementos do
gráfico(eixos, escala, origem, curvas individuais...)
Minimizar tinta
Dia da semana
Disponibilidade
1
1 2 3 4 5Dia da semana
Indisponibilidade
0.1
1 2 3 4 5
Preparando os gráficos (cont.)Preparando os gráficos (cont.) Os eixos de coordenadas são mostrados e
rotulados? As escalas e divisões são mostradas em ambos os
eixos? O número de curvas é razoável? Todos os gráficos usam a mesma escala? As unidades de medida são indicadas? O gráfico usa as convenções de representação? Não existem curvas, símbolos, ou textos que
podem ser removidos sem afetar a informação?
Erros ComunsErros Comuns
Como falhar apresentando resultados
Erros comunsErros comuns Apresentar muitas alternativas num único
gráfico Apresentar muitas “imagens” num único
gráfico Informações “não interessantes” Selecionar variação de escala imprópria
Erros comuns (cont.)Erros comuns (cont.)
Uso de símbolos ao invés de texto
=1 =3
=2
l
R
(a)Símbolos
1 job/seg 3 jobs/seg
2 jobs/seg
Taxa de chegada
ResponseTime
(b)Palavras Chave
Erros comuns (cont.)Erros comuns (cont.)
Usar gráficos de linha ao invés de coluna
Tipo da CPU
MIPS
8000 8100 8200 8300
Levando VantagemLevando Vantagem
“Jogando” com as imagens
Levando vantagemLevando vantagem
Usando origens diferentes de (0,0) para enfatizar diferenças
5200
0
MINE
YOURS
2610
2600
MINE
YOURS
Levando vantagem (cont.)Levando vantagem (cont.)
Usando duas curvas diferentes num mesmo gráfico para enfatizar o contraste
Número de Usuários
VazãoTempo de Resposta
Levando vantagem (cont.)Levando vantagem (cont.)
Plotar quantidades aleatórias sem indicar intervalos de confiança
MINE
YOURS
MINE
YOURS
(a) Com intervalo de confiança (a) Sem intervalo de confiança
Levando vantagem (cont.)Levando vantagem (cont.)
Figuras modificadas em escala pela altura
MINEYOURS
Levando vantagem (cont.)Levando vantagem (cont.)
Escolha “errada” do tamanho das células num histograma
Frequência
Tempo de Resposta
[0,2]0
4
6
8
10
12
[2,4] [4,6] [6,8] [8,10] [10,12]
2
Frequência
Tempo de Resposta
[0,6]0
6
9
12
15
18
[6,12]
3
Levando vantagem (cont.)Levando vantagem (cont.)
Usar escalas quebradas em gráficos de coluna
Tempo deResposta
Sistema
A0
4
6
8
10
12
B C D E F
2
Tempo deResposta
9
10
11
12
Sistema
A0 B C D E F
Gráficos de GanttGráficos de Gantt Usado para exibir a duração relativa de
qualquer número de condições booleanas. Cada condição é mostrada como um
conjunto de segmentos de reta horizontais
Os segmentos de reta são arranjados de forma que a sobreposição das retas representa a sobreposição das condições
Gráficos de Gantt (cont.)Gráficos de Gantt (cont.)
0% 20% 40% 60% 80% 100%
CPU
Canal de I/O
Rede
60
20 20
30 10 5 15
Gráficos de KiviatGráficos de Kiviat
Auxilia no reconhecimento de problemas de performance
Gráfico circular em que as métricas são plotadas sobre retas radiais
Parâmetros: 50% HB, 50% LB Devido a essa configuração, o gráfico
ideal é uma estrela!
Gráficos de Kiviat (cont.)Gráficos de Kiviat (cont.)CPUbusy90%CPU only
busy10%
CPU/Channeloverlap
80%
CPU inproblem state
80%
CPU insupervisor state
10%
CPUwait10%
Channel onlybusy10% Any Channel
busy90%
O gráfico idealpara um sistema balanceado
Gráficos de Kiviat (cont.)Gráficos de Kiviat (cont.)CPUbusy90%CPU only
busy10%
CPU/Channeloverlap
80%
CPU inproblem state
80%
CPU insupervisor state
10%
CPUwait10%
Channel onlybusy10% Any Channel
busy90%
Exemplo de umsistema comproblemas de balançeamento
Mas e se tudo isso nãoMas e se tudo isso nãofuncionar para convencer osfuncionar para convencer os
decision makersdecision makers??
Rejeitando uma análiseRejeitando uma análise O problema precisa de mais análise A carga do sistema precisa ser melhor
entendida “Isso vai aumentar a complexidade e o
custo” Isso vai violar o IEEE, ANSI, CCITT, ou
qualquer outro padrão ... ... ...