Introdução à Estatística Básica Com r

Embed Size (px)

Citation preview

  • 7/25/2019 Introduo Estatstica Bsica Com r

    1/124

    CURSO DE PS-GRADUAO LATO SENSU(ESPECIALIZAO) A DISTNCIA

    GESTO DE EMPRESAS COM NFASE EM QUALIDADE

    INTRODUO ESTATSTICA BSICA COM R

    Eric Batista FerreiraMarcelo Silva de Oliveira

    Universidade Federal de Lavras - UFLAFundao de Apoio ao Ensino, Pesquisa e Extenso - FAEPE

    Lavras - MG2008

  • 7/25/2019 Introduo Estatstica Bsica Com r

    2/124

    ii EDITORA - UFLA/FAEPE - Gesto de empresas com nfase em qualidade

    ParceriaUniversidade Federal de Lavras - UFLAFundao de Apoio ao Ensino, Pesquisa e Extenso - FAEPE

    ReitorAntnio Nazareno Guimares Mendes

    Vice-ReitorElias Tadeu Fialho

    Diretor da EditoraMarco Antnio Rezende Alvarenga

    Pr-Reitor de Ps-GraduaoJoel Augusto Muniz

    Pr-Reitor Adjunto de Ps-Graduao Lato SensuMarcelo Silva de Oliveira

    Coordenador do CursoDaniel Carvalho de Rezende

    Presidente do Conselho Deliberativo da FAEPELuiz Antnio Lima

    EditoraoCentro de Editorao/FAEPE

    ImpressoGrfica Universitria/UFLA

    Ficha Catalogrfica Preparada pela Diviso de Processos Tcnicos daBiblioteca Central da UFLA

    Ferreira, Eric Batista; Oliveira, Marcelo Silva deIntroduo Estatstica Bsica com R / Eric Batista Ferreira.Marcelo Silva de Oliveira. Lavras : UFLA/FAEPE, 2008, 1Edio.

    124 p. : il. - Curso de Ps-Graduao Lato Sensu (Especializao)a Distncia - Gesto de Empresas com nfase em Qualidade.

    Bibliografia.

    1. Qualidade. 2. Gesto. 3. Mtodo estatstico. i. Ferreira, E. B.;

    Oliveira, M. S. de. ii. Universidade Federal de Lavras. iii. Fundao deApoio ao Ensino, Pesquisa e Extenso. iv. Ttulo.CDD-658

    Nenhuma parte dessa publicao pode ser reproduzida, por qualquer meio ou forma, sem aprvia autorizao da FAEPE.

  • 7/25/2019 Introduo Estatstica Bsica Com r

    3/124

    Sumrio

    LISTA DE TABELAS vi

    LISTA DE FIGURAS viii

    1 INTRODUO 11.1 Introduo ao R . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1

    1.1.1 Baixando e instalando . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11.1.2 Iniciando o R . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21.1.3 Objetos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21.1.4 Lendo arquivos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 81.1.5 Funes bsicas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 81.1.6 Pedindo ajuda . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9

    1.2 Alguns conceitos importantes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 101.3 Principais aplicaes da Estatstica . . . . . . . . . . . . . . . . . . . . . . . . . . 121.4 Bibliografia consultada e recomendada . . . . . . . . . . . . . . . . . . . . . . . . 14

    2 TCNICAS DE SOMATRIO 15

    3 ESTATSTICA DESCRITIVA 193.1 Introduo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 193.2 Variveis qualitativas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 203.3 Variveis quantitativas discretas . . . . . . . . . . . . . . . . . . . . . . . . . . . . 233.4 Variveis quantitativas contnuas . . . . . . . . . . . . . . . . . . . . . . . . . . . 253.5 Medidas de posio . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 30

    3.5.1 Mdia (Me) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 303.5.2 Mediana (Md) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 323.5.3 Moda (Mo) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 34

    3.6 Medidas de disperso . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 36

    3.6.1 Amplitude (A) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 363.6.2 Varincia e Desvio Padro . . . . . . . . . . . . . . . . . . . . . . . . . . . 373.6.3 Coeficiente de Variao (CV) . . . . . . . . . . . . . . . . . . . . . . . . . 40

    4 PROBABILIDADE 434.1 Distribuies de probabilidade discretas . . . . . . . . . . . . . . . . . . . . . . . . 47

    4.1.1 Distribuio Binomial . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 484.1.2 Distribuio Poisson . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 49

  • 7/25/2019 Introduo Estatstica Bsica Com r

    4/124

    iv EDITORA - UFLA/FAEPE - Gesto de empresas com nfase em qualidade

    4.2 Distribuies de probabilidades contnuas . . . . . . . . . . . . . . . . . . . . . . . 504.2.1 Distribuio Normal de probabilidades . . . . . . . . . . . . . . . . . . . . 514.2.2 Outras distribuies contnuas . . . . . . . . . . . . . . . . . . . . . . . . . 57

    5 AMOSTRAGEM 59

    5.1 Amostragens no-aleatrias . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 595.2 Amostragens aleatrias . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 605.2.1 Amostragem aleatria simples (AAS) . . . . . . . . . . . . . . . . . . . . . 605.2.2 Amostragem aleatria estratificada (AAE) . . . . . . . . . . . . . . . . . . 605.2.3 Amostragem aleatria por conglomerado (AAC) . . . . . . . . . . . . . . . 615.2.4 Amostragem aleatria sistemtica (AS) . . . . . . . . . . . . . . . . . . . . 61

    6 INFERNCIA ESTATSTICA 636.1 Distribuio de amostragem . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 63

    6.1.1 Distribuio de funes da mdia amostral (populaes normais) . . . . . . 636.2 Estimao . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 66

    6.2.1 Estimao por ponto . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 666.2.2 Estimao por intervalo . . . . . . . . . . . . . . . . . . . . . . . . . . . . 66

    6.3 Testes de hipteses . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 706.3.1 Teste de homogeneidade de Varincias (teste F): . . . . . . . . . . . . . . . 706.3.2 Teste sobre (populaes infinitas) . . . . . . . . . . . . . . . . . . . . . . 726.3.3 Teste sobre propores (p) . . . . . . . . . . . . . . . . . . . . . . . . . . . 74

    7 CORRELAO E REGRESSO 757.1 Correlao . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 75

    7.1.1 Coeficiente de correlao linear (rou) . . . . . . . . . . . . . . . . . . . . 757.1.2 Coeficiente de determinao (r2 ou2) . . . . . . . . . . . . . . . . . . . . 75

    7.2 Regresso . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 777.2.1 Regresso Linear Simples . . . . . . . . . . . . . . . . . . . . . . . . . . . . 777.2.2 Regresso Mltipla . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 84

    8 APNDICE A: EXERCCIOS PROPOSTOS 85

    9 APNDICE B: TABELAS 101

  • 7/25/2019 Introduo Estatstica Bsica Com r

    5/124

    Lista de Tabelas

    3.1 Distribuio de freqncias absolutas (f a), relativa (f r) e percentual (f p) da ati-vidade em propriedades de uma regio. . . . . . . . . . . . . . . . . . . . . . . . . 20

    3.2 Distribuio de freqncias absolutas (f a), relativa (f r) e percentual (f p) do n-mero de filhos por casal de uma cidade. . . . . . . . . . . . . . . . . . . . . . . . . 23

    3.3 Distribuio de freqncias absoluta (f a), relativa (f r) e percentual (f p) do pesoobservado em potinhos de canela em p. . . . . . . . . . . . . . . . . . . . . . . . 27

    3.4 Freqncias absolutas acumuladas abaixo (Fa) e acima de (Fa). . . . . . . . . . 295.1 Diferenas bsicas entre a amostragem aleatria estratificada (AAE) e a amostra-

    gem aleatria por conglomerado (AAC). . . . . . . . . . . . . . . . . . . . . . . . 61

    6.1 Representao tabular dos resultados possveis em um teste de hipteses e os errose acertos que eles acarretam. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 72

    7.1 Volume de polpa (cm3), volume de gua (cm3) e teor de clcio (mg/100ml) em20cocos verdes. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 80

    7.2 Tabela auxilar para clculo dos coeficientes do modelo linear. . . . . . . . . . . . . 82

    8.1 Distribuio de freqncia de rendas familiares de100 entrevistados, em Lavras, MG. 878.2 Distribuio de freqncias das mdias dirias de produo de leite no perodo de

    lactao de 201 vacas da raa holandesa, de um rebanho pertencente ao Ncleo deCriadores de Gado Holands do Sul de Minas Gerais. Lavras, 1992. . . . . . . . . 88

    9.1 Probabilidades () da distribuio normal padro N(0, 1)para valores do quantilZt padronizado de acordo com o seguinte evento: P(0< Z < Zt) =. . . . . . . . 102

    9.2 Probabilidades () da distribuio normal padro N(0, 1)para valores do quantilZtpadronizado de acordo com o seguinte evento: P(Z > Zt) =. . . . . . . . . . 103

    9.3 Quantis superiores da distribuio de qui-quadrado (2)com graus de liberdade

    e para diferentes valores da probabilidade () de acordo com o seguinte evento:P(2 > 2) =. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 104

    9.4 Quantis superiores da distribuio de qui-quadrado (2)com graus de liberdadee para diferentes valores da probabilidade () de acordo com o seguinte evento:P(2 > 2) =. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 105

    9.5 Quantis superiores da distribuio de F (F0,10)com 1graus de liberdade do nume-rador e 2 graus de liberdade do denominador, valor da probabilidade ()de 10%de acordo com o seguinte evento:P(F > F0,10) = 0, 10. . . . . . . . . . . . . . . . 106

  • 7/25/2019 Introduo Estatstica Bsica Com r

    6/124

    vi EDITORA - UFLA/FAEPE - Gesto de empresas com nfase em qualidade

    9.6 Quantis superiores da distribuio de F (F0,10)com 1graus de liberdade do nume-rador e 2 graus de liberdade do denominador, valor da probabilidade ()de 10%de acordo com o seguinte evento: P(F > F0,10) = 0, 10. . . . . . . . . . . . . . . . 107

    9.7 Quantis superiores da distribuio de F (F0,05)com 1graus de liberdade do nume-rador e2graus de liberdade do denominador valor da probabilidade ()de 5% de

    acordo com o seguinte evento: P(F > F0,05) = 0, 05. . . . . . . . . . . . . . . . . . 1089.8 Quantis superiores da distribuio de F (F0,05)com 1graus de liberdade do nume-

    rador e 2 graus de liberdade do denominador, valor da probabilidade () de 5%de acordo com o seguinte evento: P(F > F0,05) = 0, 05. . . . . . . . . . . . . . . . 109

    9.9 Quantis superiores da distribuio de F (F0,025)com1graus de liberdade do nume-rador e 2 graus de liberdade do denominador valor da probabilidade ()de 2,5%de acordo com o seguinte evento: P(F > F0,025) = 0, 025. . . . . . . . . . . . . . . 110

    9.10 Quantis superiores da distribuio de F (F0,025)com1graus de liberdade do nume-rador e 2 graus de liberdade do denominador valor da probabilidade ()de 2,5%de acordo com o seguinte evento: P(F > F0,025) = 0, 025. . . . . . . . . . . . . . . 111

    9.11 Quantis superiores da distribuio de F (F0,01)com 1graus de liberdade do nume-rador e2graus de liberdade do denominador valor da probabilidade ()de 1% deacordo com o seguinte evento: P(F > F0,01) = 0, 01. . . . . . . . . . . . . . . . . . 112

    9.12 Quantis superiores da distribuio de F (F0,01)com 1graus de liberdade do nume-rador e2graus de liberdade do denominador valor da probabilidade ()de 1% deacordo com o seguinte evento:P(F > F0,01) = 0, 01. . . . . . . . . . . . . . . . . . 113

    9.13 Quantis superiores da distribuio de F (F0,005)com1graus de liberdade do nume-rador e 2 graus de liberdade do denominador valor da probabilidade ()de 0,5%de acordo com o seguinte evento:P(F > F0,005) = 0, 005. . . . . . . . . . . . . . . 114

    9.14 Quantis superiores da distribuio de F (F0,005)com1graus de liberdade do nume-rador e 2 graus de liberdade do denominador valor da probabilidade ()de 0,5%

    de acordo com o seguinte evento:P(F > F0,005) = 0, 005. . . . . . . . . . . . . . . 1159.15 Quantis superiores da distribuio t de Student (t) com graus de liberdadee para diferentes valores da probabilidade () de acordo com o seguinte evento:P(t > t) =. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 116

  • 7/25/2019 Introduo Estatstica Bsica Com r

    7/124

    Lista de Figuras

    1.1 Tela inicial do R em ambiente Windows. . . . . . . . . . . . . . . . . . . . . . . . 31.2 Mensagem ao tentar sair do R, em ambiente Windows. . . . . . . . . . . . . . . . 31.3 Esquema de um objeto. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 41.4 Grfico ilustrativo do comportamento do peso de sunos (kg) em funo de sua

    ingesta diria de rao ao longo do perodo de engorda. . . . . . . . . . . . . . . . 13

    2.1 Esquema ilustrativo dos elementos tpicos de um somatrio. . . . . . . . . . . . . 15

    3.1 (a) Grfico de colunas das principais atividades em propriedades rurais. (b) Grficode barras da mesma situao. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21

    3.2 Setograma ou grfico de pizza. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 223.3 (a) grfico de linhas da varivel nmero de filhos por casal. (b) grfico de colunas

    da mesma varivel. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 253.4 (a) Histograma do peso de potinhos de canela em p em uma linha de produo.

    (b) O mesmo histograma com polgono de freqncia. . . . . . . . . . . . . . . . . 283.5 Ogivas representando as freqncias absolutas acumuladasacima dee abaixo dee

    seu respectivo cdigo em R. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 303.6 Histograma ilustraando geometricamente mtodo de Czuber. . . . . . . . . . . . . 34

    4.1 Simulao do lanamento de uma moeda honesta500vezes, comportamento de suafreqncia relativa. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 44

    4.2 Esquema da integral de uma funo densidade de probabilidade. . . . . . . . . . . 464.3 Esquema da generalizao terica de histogramas para funes densidade de pro-

    babilidade, quando n . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 504.4 Esquema destacando a area acima de 100km/h em uma distribuio de media

    60km/he varincia 400(km/h)2. . . . . . . . . . . . . . . . . . . . . . . . . . . . . 524.5 Esquema destacando a area entre 40 e 100km/h em uma distribuio de media

    60km/he varincia 400(km/h)2. . . . . . . . . . . . . . . . . . . . . . . . . . . . . 544.6 Esquema destacando o intervalo que contem90% dos veculos em uma distribuio

    de media 60km/he varincia400(km/h)2. . . . . . . . . . . . . . . . . . . . . . . 55

    6.1 Demonstrao da curva Normal (linha cheira) padro e da curva t com 5 (linhatracejada) e 30 (linha pontilhada) graus de liberdade. . . . . . . . . . . . . . . . . 65

    6.2 Distribuio F de probabilidade ressaltando a regio de aceitao de um teste dehomogeneidade de varincias (de 1 at um Fc qualquer). . . . . . . . . . . . . . . 70

  • 7/25/2019 Introduo Estatstica Bsica Com r

    8/124

    viii EDITORA - UFLA/FAEPE - Gesto de empresas com nfase em qualidade

    6.3 (a) Ilustrao do teste unilateral superior. (b) Ilustrao do teste bilateral. A areahachurada representa a regio de rejeio do teste. . . . . . . . . . . . . . . . . . . 73

    7.1 Representao de possveis retas (pontilhadas) e aquela estimada por quadradosmnimos (linha cheia) em uma massa de dados fictcia. . . . . . . . . . . . . . . . 79

    7.2 Diagrama de disperso entre a varivel independente volume de gua de coco e avarivel dependente volume de polpa de coco. . . . . . . . . . . . . . . . . . . . . 817.3 Reta de regresso estimada e pontos amostrais. . . . . . . . . . . . . . . . . . . . 83

  • 7/25/2019 Introduo Estatstica Bsica Com r

    9/124

    1INTRODUO

    1.1 Introduo ao R

    R uma linguagem e ambiente para computao estatstica e grfica. um projeto GNUsimilar linguagem e ambiente S desenvolvida no Bell Laboratoriespor John Chambers e colabo-

    radores.O software disponibiliza uma grande variedade de mtodos estatsticos (modelagem linear e

    no-linear, testes estatsticos clssicos, sries temporais, classificao, mtodos multivariados, etc)e tcnicas grficas. Um dos pontos fortes do R a facilidade com que grficos bem delineados ede alta qualidade para impresso podem ser produzidos com possibilidade de incluso de frmulase smbolos matemticos quando necessrio.

    Ele se presta a diversas funes, desde uma calculadora cientfica, passando pela integrao ederivao de funes matemticas, at a realizao de complexas anlises estatsticas.

    Alm disso, o R tambm apresenta uma srie de recursos grficos que permitem a descriodetalhada de todos os aspectos que se pode querer personalizar em um grfico, como cor, tipo etamanho de letra, smbolos, ttulos e sub-ttulos, pontos, linhas, legendas, planos de fundo e muitomais.

    1.1.1 Baixando e instalandoO R disponibilizado sob os termos da GNU General Public License da Free Software Foun-

    dation na forma de cdigo aberto. Ele pode ser compilado e roda em um grande nmero deplataformas UNIX e similares (incluindo FreeBSD e Linux). Tambm pode ser compilado e rodaem Windows 9x/NT/2000 e MacOS.

    O download do R gratuito de qualquer espelho do site www.r-project.org. Aps entrar nessesite, clique emCRAN, logo abaixo da palavraDownload. Em seguida, escolha um espelho perto de

  • 7/25/2019 Introduo Estatstica Bsica Com r

    10/124

    2 EDITORA - UFLA/FAEPE - Gesto de empresas com nfase em qualidade

    voc, por exemplo, o espelho da Universidade Federal do Paran: http://cran.br.r-project.org/.Agora escolha seu sistema operacional, por exemplo, Windows (95 and later). Aqui voc optaentre baixar o conjunto de pacotes bsicos ou os pacotes contribudos. Supondo que voc estbaixando o R pela primeira vez, escolha a opo base. Nesta pgina o CRAN lhe apresentauma srie de opes como o readme, changes, etc. Escolha o arquivo executvel, por exemplo,

    R-2.7.0-win32.exe. Pronto! s baixar e executar.A instalao do R muito fcil e autodirecionada. Nas verses mais recentes possvel,

    inclusive, selecionar o idioma Portugus (Brasil) para as barras de menus e mensagens de erro.Porm, vale notar que, pelo menos at a verso 2.7.0, os nomes das funes, dos atributos e oshelps, continuam em Ingls.

    A cada ano, duas verses do R so disponibilizadas no CRAN, pelo menos, uma a cada se-mestre. Alm disso, sempre existem duas verses disponveis concomitantemente, uma verso alfa(revisada) e uma verso beta (no revisada, mas mais recente).

    1.1.2 Iniciando o R

    Uma vez que voc chama o R, em ambiente Windows, sua tela aberta com uma barra demenu, algumas mensagens bsicas e umpromptvermelho (Figura1.1).

    As informaes bsicas se referem ao registro do R, s suas regras de distribuio, seus co-laboradores, como citar o R, como pedir uma demonstrao, como pedir ajuda e como sair doR.

    A barra de menu traz diversos botes de atalho para a manipulao de arquivos, pacotes,ajudas, etc. O que se v na Figura1.1, frente do sinal de maior que em vermelho, o prompt.Oprompt herdado de linguagens como o MS-DOS e indica o ponto onde se deve inserir as linhasde comando. Lembre-se: tudo o que voc disser ao R ficar impresso na tela na cor vermelha etudo que o R lhe responder ficar impresso em azul.

    Ao tentar sair do R, pela barra de menu ou pelo comando q(), mostrada uma mensagemperguntando se o usurio deseja salvar a rea de trabalho, ou seja, se os objetos atribudos devempermanecer com os mesmo valores ou se tudo que foi feito deve ser ignorado (Figura1.4). Quandose inicia novamente o R, aps ter salvo a rea de trabalho, os objetos anteriormente criados socarregados automaticamente. Aconselha-se que toda a informao desejada seja gravada em outrotipo de arquivo e a rea de trabalho seja raramente salva. Isso evitar confuses quanto ao valorde objetos ao se fazer uma conta.

    1.1.3 Objetos

    Mais que um software que realiza anlises estatsticas, R um ambiente e uma linguagem deprogramao orientada a objeto. Nele, nmeros, vetores, matrizes, arrays, data framese listaspodem ficar armazenados em objetos (Figura1.3). Pode-se entender objeto como uma caixinhaonde voc pode guardar o que quiser. A partir da todas as operaes matemticas podem serfeitas usando esses objetos. Isso torna as coisas mais simples.

    Para criar um objeto s atribuir um valor a um nome, ou seja, quando se coloca um valordentro de um objeto, este passa a existir automaticamente. Uma atribuio pode ser feita, ba-sicamente, de duas maneiras, usando o sinal de =ou usando uma seta formada pela juno dos

  • 7/25/2019 Introduo Estatstica Bsica Com r

    11/124

    INTRODUO 3

    Figura 1.1: Tela inicial do R em ambiente Windows.

    Figura 1.2: Mensagem ao tentar sair do R, em ambiente Windows.

  • 7/25/2019 Introduo Estatstica Bsica Com r

    12/124

    4 EDITORA - UFLA/FAEPE - Gesto de empresas com nfase em qualidade

    NNoommee

    Nmero

    Vetor

    Matriz

    Array

    Lista

    Data frameObjeto

    Figura 1.3: Esquema de um objeto.

    sinais demenor quee menos a x a|[1] 2

    Uma vez criados, os objetos podem ser usados em contas, equaes, funes, sistemas etc.|> a+x #soma|[1] 7|> a-x #subtrao|[1] -3|> a*x #produtos de escales|[1] 10|> a/x #diviso

  • 7/25/2019 Introduo Estatstica Bsica Com r

    13/124

    INTRODUO 5

    |[1] 0.4|> a^x #potenciao|[1] 32

    O resultado de uma conta, por sua vez, pode ser guardado dentro de um terceiro objeto.

    | > c c|[1] 64

    (b) Vetor: O vetor da linguagem R tem um significado um pouco diferente que o vetor da Ma-temtica. Para o R, um vetor qualquer conjunto unidimensional de valores. Esses valorespodem ser nmeros, strings(palavras) ou valores lgicos (F para falso e T para verdadeiro).Em outras palavras, para o R, o vetor tem um significado mais amplo que para a Matemtica.

    Para se atribuir um conjunto de valores a um objeto pode-se usar o comando c(), onde osvalores vm separados por vrgulas, dentro dos parnteses.

    |> d d|[1] 5.0 8.0 12.0 3.5 9.0 1.0

    possvel se referir especificamente a uma posio do vetor. Imagine que se deseje saber qualo valor que ocupa a quarta posio do vetor d. Essa referncia feita enter colchetes, aps onome do objeto. |> d[4] #4a posicao do vetor d|[1] 3.5

    (c) Matriz: Uma matriz atribuda a um objeto pela funo matrix(). Essa funo tem comoargumentos o conjunto de dados, o nmero de linhas e o nmero de colunas da matriz, nessaordem. Note que o conjunto de dados deve ser escrito na ordem das colunas, ou seja, como seas colunas estivessem enfileiradas, umas sobre as outras. Observe o exemplo.

    |> e e| [,1] [,2] [,3]|[1,] 5 12.0 9|[2,] 8 3.5 1

    Nas matrizes tambm possvel referenciar uma linha, uma coluna ou um elemento. Nova-mente deve-se usar nmeros entre colchetes, porm respeitando a ordem: primeira posio serefere a linha e segunda posio se refere a coluna.

    |> e[2,] #linha 2 da matriz e|[1,] 8 3.5 1|> e[,3] #coluna 3 da matriz e

  • 7/25/2019 Introduo Estatstica Bsica Com r

    14/124

    6 EDITORA - UFLA/FAEPE - Gesto de empresas com nfase em qualidade

    | [1] 9 1|> e[1,3] #elemento da linha 1, coluna 3|[1] 9

    (d) Array: Esse termo em Ingls no possui traduo adequada. Ele representa uma hiperma-triz, ou seja, um conjunto de nmeros arranjados em mais de 2 dimenses. Quando tem 3dimenses, um array pode ser entendido como um conjunto de matrizes de mesma dimenso.

    Aqui, a referncia a linhas e colunas a mesma das matrizes, e a terceira posio dos colchetesse refere ao valor de interesse na terceira dimenso.

    O comando usado o array(). Uma forma de atribuir um array a um objeto inserir umarray de zeros (nas dimenses desejadas) e depois preenche-lo com os valores adequados. Outraopo fazer um vetor que respeite a ordem: por coluna, por matriz; e usa-lo j na construodo array.

    A primeira posio da funo array() se refere aos argumentos das matrizes e a segundaposio se refere s dimenses do mesmo.

    |> f f[,,1] f[,,2] f f|, , 1

    || [,1] [,2]|[1,] 1 3|[2,] 2 4||, , 2|| [,1] [,2]|[1,] 5 7|[2,] 6 8

    Analogamente, pode-se perguntar qual o valor que ocupa a primeira linha, da segundacoluna, da segunda matriz, do objeto f.

    | > f[1,2,2]|[1] 7

    (e) Data frame: Essa estrutura de dados uma espcie de tabela, de estrutura bidimensional de

  • 7/25/2019 Introduo Estatstica Bsica Com r

    15/124

    INTRODUO 7

    dados. Podem fazer parte de um mesmo data frame nmeros estrings. Alm disso, podemser dados nomes s colunas. Sua funo data.frame(). Veja o exemplo.

    |> g g| Marca Preo| 1 Wolks 32000|2 Fiat 28000|3 Ford 29500

    (f) Lista: Uma lista um conjunto de objetos de tamanhos e naturezas diferentes. Ela regidapela funolist(). Essa a estrutura mais geral da linguagem R. Suas posies so designadaspor nmeros entre dois parnteses [[ ]]. Considere o exemplo de lista que contm um nmerona primeira posio, uma matriz na segunda, uma palavra na terceira e um vetor na quarta.

    |> h h|[[1]]|[1] 3||[[2]]| [,1] [,2]|[1,] 1 3|[2,] 2 4||[[3]]

    |[1] "lista"||[[4]]| [1] 5 6 7 8

    Suponha que se deseje saber o terceiro elemento do vetor que est alocado na posio quartaposio da lista h.

    |> h[[4]][3]|[1] 7

  • 7/25/2019 Introduo Estatstica Bsica Com r

    16/124

    8 EDITORA - UFLA/FAEPE - Gesto de empresas com nfase em qualidade

    1.1.4 Lendo arquivos

    A maneira mais fcil de inserir dados em objetos no R a leitura de arquivos. O R pode lerarquivos de estruturas simples como as extenses .txt e .r. Tambm possvel importar outrostipos de arquivos mais complexos, como os .xls, mas os procedimentos de importao no so

    triviais, e no sero tratados aqui. O que se aconselha, quando se tem um arquivo .xls, salva-locomo.txte fazer a leitura normalmente.Vale lembrar que, quando se salva uma rea de trabalho, apenas os valores dos objetos so

    guardados. Todos os comandos dados e todos os resultados no armazenados em objetos soperdidos.

    Por esses motivos, fortemente recomendado que se trabalhe ao R em associao a um editorde texto da sua preferncia. Alguns editores de texto muito teis so: o scriptdo R, o Bloco denotas do Windows, o Tinn-R, o WinEdt e o Emacs. Esses editores so usados tanto para elaboraros arquivos de dados que sero lidos pelo R, quanto para armazenar rotinas (conjuntos de linhasde comando) para a repetio futura da anlise.

    Para ler um arquivo no R, a funo mais usada a read.table(). Essa funo l o arquivo e

    o armazena (se desejado) na forma de data frame em um objeto. O primeiro argumento dessafuno se refere ao nome do arquivo a ser lido. Esse argumento deve vir entre aspas. Entretanto,o endereo desse arquivo tambm deve ser passado ao R. Para isso, tem-se duas opes: (1) Nabarra de menu, boto Arquivo, mudar diretrio para o lugar onde se encontra o arquivo; (2)Escrever todo o endereo do arquivo dentro do primeiro argumento da funo read.table(). Osegundo argumento dessa funo se refere ao cabealho (nome) das colunas de dados contidas noarquivo. Se as colunas tiverem cabealho (header), ento deve-se digitar h=TRUE, caso contrrio,h=FALSE.

    Exemplos de comando de leitura de arquivo quando se muda o diretrio de leitura para o lugaronde o arquivo est armazenado, e quando o endereo informado na funo.

    |> read.table(nome.txt,h=TRUE)|> read.table(C:\\Meus Documentos\\nome.txt,h=TRUE)

    1.1.5 Funes bsicas

    Aqui so apresentadas algumas funes de uso constante, pertencentes aos pacotes bsicos doR:

    sum(x): soma todos os elementos de um objeto x.

    length(x): retorna o comprimento de um objeto x.

    rep(x,n): repete o nmero x, n vezes.

    seq(a,b,by=c):gera uma seqncia de nmeros contidos entre ae b, distantescunidades um dooutro.

    table(x): retorna uma tabela com as freqncias absolutas de ocorrncia da cada elemento de x.

  • 7/25/2019 Introduo Estatstica Bsica Com r

    17/124

    INTRODUO 9

    1.1.6 Pedindo ajuda

    O jeito mais fcil de se aprender a usar R consultando constantemente seus tpicos de ajuda.Existem basicamente quatro tipos de ajuda no R:

    (a) help(funo()): Essa ajuda deve ser solicitada quando se sabe da existncia de uma funo(sabe-se seu nome exato), mas existe dvidas em como us-la. Se o pacote que contm essafuno estiver instalado e carregado, ser aberta a documentao da mesma para esclareci-mentos.

    (b) help.search( ): Quando se deseja investigar a existncia de uma funo, essa a juda recebeuma palavra-chave (em Ingls) e retorna todas aquelas funes que contm aquela palavraem sua documentao. A busca feita nos pacotes existentes no computador em questo, ouseja, se uma busca no retornar nenhum resultado adequado, no significa que a funo noexista. Significa que ela no existe, pelo menos, em seu computador.

    (c) Ajuda Html: Essa ajuda pode ser chamada pela barra de menu, no boto Ajuda (Help).Quando acionada, ela abre um documento em html que contm diversas informaes sobreo R, sua linguagem, suas funes bsicas, seus pacotes, seus autores, sua licena, perguntasmais freqentes etc.

    (d) RSiteSearch( ): Quando conectado internet, essa ajuda faz a busca de uma palavra-chaveem todas as pginas da internet relacionadas com o R, principalmente aquelas pginas publi-cadas com as perguntas e respostas das listas de discusses do R. Existem diversos tipos delistas de discusses que podem ser encontradas na pgina do R. Nelas so tiradas dvidas maisgrave, so dadas sugestes para as novas verses do R, so desvendados e descoberto pequenoserros de programao etc. Elas colocam os usurios do R em contato com os estatsticos quefazem e mantm o R.

    Quando se deseja saber informaes acerca de uma dada funo existente deve-se digitarhelp("funo")ou, simplesmente, ?funo(). Caso se deseje saber se um tpico possui funo no R, o comandodeve ser: help.search("tpico").

  • 7/25/2019 Introduo Estatstica Bsica Com r

    18/124

    10 EDITORA - UFLA/FAEPE - Gesto de empresas com nfase em qualidade

    1.2 Alguns conceitos importantes

    Estatstica conjunto de tcnicas para a coleta, organizao, anlise e interpretao de dados,para a descrio de populaes.

    Dado em Estatstica, dado o valor assumido por uma varivel aleatria em um dado experi-mento.

    Populao o todo que se quer descrever. Conjunto de elementos com caractersticas em co-mum.Ex.: Deseja-se saber o teor mdio de acar (graus Brix) de uma determinada variedade delaranja.

    CLASSIFICAES DE UMA POPULAO

    Finita (ou real): fixa no tempo.Ex: Conjunto de rvores em um talho.

    Infinita (ou conceitual): engloba elementos no existentes.Ex: Plantas da cultivar cariocaque (existiram, existem ou viro a existir).

    Espao amostral o conjunto de todos os resultados possveis de serem observados num dadofenmeno, ou seja, todos os resultados possveis de um experimento. Representado simboli-camente pela letra grega Omega maiscula .Ex: = {cara, coroa}.

    Varivel aleatria a funo que associa um valor na reta real a cada ponto do espao amostral.

  • 7/25/2019 Introduo Estatstica Bsica Com r

    19/124

    INTRODUO 11

    Ex.: No lanamento de um dado honesto, o espao amostral composto por suas seisdiferentes faces. A cada uma delas est associado um nmero natural de 1 a 6. Suponha que a

    varivel aleatria Xdescreve o resultado desse lanamento e o dado cai com face virada paracima. Nesse caso associamos um valor a este evento, ou seja, x= 4.

    Amostra o subconjunto com n elementos da populao.

    Censo a observao exaustiva de todos os N elementos da populao.

    Evento cada possvel resultado em um experimento. Ex: A face cara cair voltada para cimano lanamento de uma moeda honesta.

    Estatstica experimental tem por objetivo comparar mais de duas populaes simultaneamente(tratamentos).

    TIPOS DE VARIVEISQUALITATIVAS

    So aquelas variveis que indicam qualidades, atributos, caractersticas no numricas de formageral.

    (a) Qualitativas nominais:So aquelas que no permitem uma ordenao natural.Ex: O conjunto de espcies: Cedro, Cassia e Ip.

    (b) Qualitativas ordinais:Por sua vez, so aquelas que admitem uma ordenao natural.Ex: O ciclo de uma cultura: precoce, mdio e tardio.

    QUANTITATIVAS

    Resumem-se a medidas, pesagens ou contagens.

    (a) Quantitativas discretas:So representadas pelas contagens.Ex: Nde espigas por planta de milho.

    (b) Quantitativas contnuas:So representadas pelas medies ou pesagens (R)Ex: Produtividade (t/ha).

  • 7/25/2019 Introduo Estatstica Bsica Com r

    20/124

    12 EDITORA - UFLA/FAEPE - Gesto de empresas com nfase em qualidade

    1.3 Principais aplicaes da Estatstica

    (a) Pesquisa cientfica:A Estatstica, em muitos momentos, confunde-se com o prprio conceito de fazer cincia1. Elatem o objetivo de administrar a incerteza acerca de um fenmeno, permitindo uma melhor

    compreenso do ambiente em que vivemos e permitindo a tomada de decises e a realizaode previses.

    (b) Processos produtivos:A Estatstica usada diariamente no controle de processos produtivos empresariais por meiodo Controle de Qualidade.

    Determinsticos Principalmente usados na Fsica, Qumica e Matemtica. Asrelaes so exatas, ou seja, possveis variaes casuais sodesprezadas.Ex.: 6CO2+ 6H2OC6H12O6+ 6O2

    ModelosProbabilsticos As variaes naturais no so desprezadas e so descritas por

    meio de um componente probabilstico.Ex.: Peso de sunos em funo da quantidade de rao inge-rida ao longo de sua engorda (Figura1.4).

    (c) Levantamentos em geral:Um dos usos mais populares da Estatstica se d em censos demogrficos, pesquisas eleitorais,porm h outros levantamentos importantes para a sociedade como as pesquisas de mercado,os inventrios florestais, etc.

    Este grfico foi feito no R. Quer saber como? D uma olha na rotina.

    x

  • 7/25/2019 Introduo Estatstica Bsica Com r

    21/124

    INTRODUO 13

    0 5 10 15 20 25 30

    0

    100

    200

    300

    400

    500

    600

    Ingesta de rao (kg/dia)

    Peso

    (kg)

    Figura 1.4: Grfico ilustrativo do comportamento do peso de sunos (kg) em funo de sua ingestadiria de rao ao longo do perodo de engorda.

    DIAGRAMA DA ESTATSTICA

  • 7/25/2019 Introduo Estatstica Bsica Com r

    22/124

    14 EDITORA - UFLA/FAEPE - Gesto de empresas com nfase em qualidade

    1.4 Bibliografia consultada e recomendada

    Bussab, W.O.; Morettin, P.A. Estatstica bsica. 1987. Atual.

    Cochram, W.G. Tcnicas de amostragem. 1965. Fundo de Cultura.

    Ferreira, D. F. Estatstica bsica. Editora UFLA, Lavras, 2005. 676p.

    Meyer, P. Probabilidade: aplicaes estatstica. 1983. LTC.

    Oliveira, M.S.; Bearzoti, E.; Vilas Boas, F.L.; Nogueira, D.A.; Nicolau, L.A. Introduo Estatstica. DEX/UFLA, Lavras, 2005. 329p.

    Stevenson, W.J. Estatstica aplicada Administrao. 1981. Harper & Row.

    Spiegel, M.R. Estatstica. 1993. McGraw Hill.

    Werkema, M.C.C. Srie Ferramentas de Qualidade Total. Vrios volumes. Fundao Chris-tiano Otoni. UFMG.

    http://www.est.ufpr.br/paulojus/ http://wikipedia.org/

  • 7/25/2019 Introduo Estatstica Bsica Com r

    23/124

    2TCNICAS DE SOMATRIO

    Notao: Esta a letra grega sigma maiscula: .Objetivo: O somatrio (ou a somatria) tem por objetivo simplificar a notao de uma soma

    de termos, ou seja, de um polinmio.

    Figura 2.1: Esquema ilustrativo dos elementos tpicos de um somatrio.

    Ex1: 4 + 4 + 4 =3

    i=1

    4.

    Ex2: y1+ y2+ y3+ y4=4

    i=1

    yi.

    Ex3: (x1+ y1)2 + (x2+ y2)2 + ... + (xk+ yy)2 =k

    i=1(xi+ yi)

    2.

    Ex4: Seja A={a1, a2, a3, a4, a5}um conjunto de dados. Ento o somatrio dos elementos deApode ser escrito como: a1+ a2+ a3+ a4+ a5 =

    5i=1

    ai.

  • 7/25/2019 Introduo Estatstica Bsica Com r

    24/124

    16 EDITORA - UFLA/FAEPE - Gesto de empresas com nfase em qualidade

    PROPRIEDADES DOS SOMATRIOS

    1) Seja a uma constante e X uma varivel aleatria, ento

    n

    i=1

    axi = an

    i=1

    xi. (2.1)

    Demonstrao:

    ni=1

    axi= ax1+ ax2+ . . .+ axn= a(x1+ x2+ . . .+ xn) =ani=1

    xi.

    Ex5:3

    i=1

    2yi = 2y1+ 2y2+ 2y3 = 2(y1+ y2+ y3) = 23

    i=1

    yi.

    2) Sejam X e Y variveis aleatrias, ento

    ni=1

    xiyi=

    ni=1

    xi

    ni=1

    yi

    . (2.2)

    Demonstrao:

    ni=1

    xiyi=

    ni=1

    xi

    ni=1

    yi

    x1y1+ x2y2+ . . .+ xnyn= (x1+ x2+ . . .+ xn) (y1+ y2+ . . .+ yn)x1y1+ x2y2+ . . .+ xnyn=x1y1+ x1y2+ . . .+ x1yn+ . . .+ x2y1+ x2y2+

    + . . .+ x2yn+ . . .+ xny1+ xny2+ + xnynEx6:

    2i=1

    2xi3yi=

    2i=1

    2xi

    2i=1

    3yi

    2x13y1+ 2x23y2= (2x1+ 2x2) (3y1+ 3y2)2x13y1+ 2x23y2

    = 2x13y1+ 2x23y1+ 2x13y2+ 2x23y2.

  • 7/25/2019 Introduo Estatstica Bsica Com r

    25/124

    TCNICAS DE SOMATRIO 17

    3) Sejama e bconstantes e XeYvariveis aleatrias, ento

    ni=1

    axi byi= ani=1

    xi bni=1

    yi. (2.3)

    Demonstrao:ni=1

    axi+ byi= ax1+ ax2+ . . .+ axn+ by1+ by2+ . . .+ byn

    =a(x1+ x2+ . . .+ xn) + b(y1+ y2+ . . .+ yn)

    =a

    ni=1

    xi+ b

    ni=1

    yi.

    Ex7:

    2i=1

    3xi+ 4yi = 3x1+ 3x2+ 4y1+ 4y2

    = 3(x1+ x2) + 4(y1+ y2)

    = 32

    i=1

    xi+ 42

    i=1

    yi.

    4) Seja k uma constante, ento

    ni=1

    k= nk (2.4)

    Demonstrao:

    ni=1

    k= k+ k+ . . .+ k

    n=nk. Ou ento,

    ni=1

    k= kni=1

    1

    =k(1 + 1 +. . .+ 1 n

    ) =nk.

    Ex7:4

    i=1

    5 = 5 + 5 + . . .+ 5 4

    = 4 5 = 20.

  • 7/25/2019 Introduo Estatstica Bsica Com r

    26/124

    18 EDITORA - UFLA/FAEPE - Gesto de empresas com nfase em qualidade

    O R possui uma funo bsica chamada sum(). Essa funo faz a soma de todos oselementos de um objeto que for seu argumento: sum(objeto). Por exemplo:

    x

  • 7/25/2019 Introduo Estatstica Bsica Com r

    27/124

    3

    ESTATSTICA DESCRITIVA

    3.1 Introduo

    Um bom trabalho de coleta de dados experimentais pode render uma massa de dados confivel,porm desordenados, isto , brutos. Na sua forma bruta os dados no querem dizer muita coisa,isto , no so consideradosinformao. Por isso, o objetivo da Estatstica Descritiva apresentaruma srie de tcnicas de descrio de dados vlidas para censos e amostras.

    ALGUMAS DEFINIES PERTINENTES

    Freqncia de forma geral, indica com que freqncia determinado valor (ou intervalo de valo-res) ocorre na massa de dados.

    Distribuio de freqncia a funo que associa valores da varivel com suas freqncias de

    ocorrncia.

    Tipos de freqncia

    (a) Freqncia absoluta (fa): representa o nmero de vezes que um valor (ou intervalo) ocorre nosdados.

    (b) Freqncia relativa (fr): representa, em forma decimal, a proporo de ocorrncias de umvalor em relao ao tamanho da massa de dados,

    f r=f a

    n. (3.1)

    (c) Freqncia percentual (fp): representa, em forma percentual, a proporo de ocorrncias deum valor em relao ao tamanho da massa de dados,

    f p= f r 100. (3.2)

  • 7/25/2019 Introduo Estatstica Bsica Com r

    28/124

    20 EDITORA - UFLA/FAEPE - Gesto de empresas com nfase em qualidade

    3.2 Variveis qualitativas

    Experimentos ou pesquisas que possuem como foco variveis qualitativas podem ser descritos(resumidos) por meio de distribuies de freqncia e suas representaes grficas. A seguir, umexemplo ilustra o procedimento.

    Ex.: Um engenheiro agrnomo faz um levantamento das principais atividades agrcolas em umaamostra contendo 20 propriedades de certa regio. O croquis a seguir representa esquematicamenteo resultado da pesquisa.

    C L L C S LA C C L MC M So M L C C M C L

    Massa de dados: amostra.

    Populao: finita: conjunto de todas as propriedades rurais desta regio que atualmenteapresentam atividades agrcolas.

    Varivel aleatria: qualitativa nominal: atividade agrcola. Valores assumidos pela varivel aleatria na pesquisa: caf (C), leite (L), silvicultura (S),

    milho (M), soja (So), laranja (LA).

    Distribuio de freqncia:

    Tabela 3.1: Distribuio de freqncias absolutas (f a), relativa (f r) e percentual (f p) da atividadeem propriedades de uma regio.

    Atividade f a f r f p(%)Caf 8 0,40 40,00Leite 5 0,25 25,00Milho 4 0,20 20,00

    Outras 3 0,15 15,00Total 20 1,00 100,00

    Fonte: Dados fictcios.

    Nota: classes pouco freqentes podem ser agrupadas em uma categoria outras, em ltimolugar.

  • 7/25/2019 Introduo Estatstica Bsica Com r

    29/124

    ESTATSTICA DESCRITIVA 21

    Pode-se facilmente fazer uma distribuio de freqncias no R compondo-se um objeto(df) de forma conveniente. No exemplo:

    at

  • 7/25/2019 Introduo Estatstica Bsica Com r

    30/124

    22 EDITORA - UFLA/FAEPE - Gesto de empresas com nfase em qualidade

    Reproduza em seu computador a rotina do grfico de barras. . .

    gc

  • 7/25/2019 Introduo Estatstica Bsica Com r

    31/124

    ESTATSTICA DESCRITIVA 23

    Confira como fazer um setograma no R:

    pie(df[1:4,2], col = gray(seq(0.4,1.0, length=4)), radius = 1.05)

    A funo pieexige como argumento um objeto contendo nmeros decimais que somem1, ou seja, freqncias relativas.

    3.3 Variveis quantitativas discretas

    Variveis quantitativas discretas podem ser vistas como casos particulares de variveis quan-titativas contnuas. Pode-se tratar uma massa de dados de variveis quantitativas discretas comose fosse de variveis qualitativas, ou seja, cada valor assumido pela varivel pode ser visto comouma classe. Porm, quando a varivel, apesar de assumir valores discretos, puder assumir uma

    quantidade muito grande de valores, ela pode ser tratada como uma varivel quantitativa cont-nua, ou seja, construindo-se classes. Os procedimentos indicados para a manipulao de variveisquantitativas contnuas sero apresentados a seguir.

    A representao grfica das variveis quantitativas discretas se d de forma semelhante a dasqualitativas ordinais.

    Veja o seguinte exemplo real: uma pesquisa da Secretaria de Sade Pblica de um municpioinvestigou o nmero de filhos por casal. A seguir est apresentada uma parte dos resultadosobtidos:

    3 4 3 1 3 2 1 1 2 2 4 4 1 3 2 2 4 4 3 31 0 2 1 3 2 2 4 2 1 1 4 1 0 1 3 3 0 3 3

    A Tabela3.2 apresenta a distribuio de freqncia do nmero de filhos por casal em umdeterminado municpio.

    Tabela 3.2: Distribuio de freqncias absolutas (f a), relativa (f r) e percentual (f p) do nmerode filhos por casal de uma cidade.

    Classes fa f r f p(%)0 3 0,075 7,501 10 0,250 25,00

    2 9 0,225 22,503 11 0,275 27,504 7 0,175 17,50

    Total 40 1,000 100,00

    Fonte: Dados fictcios.

  • 7/25/2019 Introduo Estatstica Bsica Com r

    32/124

    24 EDITORA - UFLA/FAEPE - Gesto de empresas com nfase em qualidade

    De forma semelhante, pode-se fazer uma distribuio de freqncias no R compondo-seum objeto (df). No exemplo:

    filhos

  • 7/25/2019 Introduo Estatstica Bsica Com r

    33/124

    ESTATSTICA DESCRITIVA 25

    1 2 3 4 5

    0.

    10

    0.

    15

    0.2

    0

    0.2

    5

    Nmero de filhos

    fr

    0 1 2 3 4

    Nmero de filhos

    fr

    0.0

    0

    0.0

    5

    0.1

    0

    0.1

    5

    0.

    20

    0.2

    5

    (a)(b)

    Figura 3.3: (a) grfico de linhas da varivel nmero de filhos por casal. (b) grfico de colunas damesma varivel.

    3.4 Variveis quantitativas contnuas

    Aqui se descreve uma seqncia de passos indicados para a construo de uma distribuiode freqncias para variveis quantitativas contnuas. No entanto, importante ressaltar queessa apenas uma de uma infinidade de maneira que se poderia construir uma distribuio defreqncia eficiente e compreensvel. Portanto, na literatura especializada facilmente pode-seencontrar diferentes sugestes de procedimento.

    (1) Determinar o nmero de classes (k):

    Critrio emprico Critrio de Scott (1979)

    k

    n, se n 100

    k1 + An1/3

    3, 495

    n: nmero de elementos da amostra.

    (2) Clculo da Amplitude Total (A):

    A= M V O

    mvo, (3.3)

    em que M V O o maior valor observado; e mvo o menor valor observado.

    (3) Clculo da amplitude de classe (c):Sejam as seguintes frmulas, se a massa de dados em questo se tratar de censos

    c=A

    k (3.4)

  • 7/25/2019 Introduo Estatstica Bsica Com r

    34/124

    26 EDITORA - UFLA/FAEPE - Gesto de empresas com nfase em qualidade

    ou amostras

    c= A

    k 1 . (3.5)

    (4) Limite inferior da primeira classe (LI1):

    Em censos:LI1 = mvo (3.6)

    ou amostrasLI1 = mvo c

    2. (3.7)

    (5) Demais limites:LSi = LIi+ c (3.8)

    eLSi = LIi+1, (3.9)

    para todoi = 1, . . . , k.

    Para ilustrar a seqncia de passos descrita, considere o seguinte exemplo: Em uma linha deenvasamento de potinhos de canela em p, a especificao ench-los com 50g do produto. Sea envasadora colocar mais que o especificado, a empresa estar sendo lesada. Caso contrrio,

    o consumidor ser enganado. Por isso, conveniente fazer o acompanhamento dos potinhosenvasados. Coletou-se uma amostra de 50 potinhos dessa linha de produo, que aqui so dispostosem ordem crescente, em g.

    45,2 45,3 45,4 45,7 45,9 46,1 46,1 46,2 46,5 46,6 46,9 47,9 48,1 48,1 48,348,5 48,8 48,8 49,1 49,2 49,3 49,7 49,8 49,9 50,1 50,2 50,3 50,4 50,5 50,550,5 50,6 50,8 51,0 51,1 51,4 51,6 51,6 51,7 51,9 52,5 52,7 52,8 53,0 54,955,0 55,2 55,3 55,7 55,7

    Portanto,

    (1)n

  • 7/25/2019 Introduo Estatstica Bsica Com r

    35/124

    ESTATSTICA DESCRITIVA 27

    Tabela 3.3: Distribuio de freqncias absoluta (f a), relativa (f r) e percentual (f p) do pesoobservado em potinhos de canela em p.

    Classes f a f r f p(%)[44, 33;46, 08) 5 0,10 10,0[46, 08;47, 83) 6 0,12 12,00[47, 83;49, 58) 10 0,20 20,00[49, 58;51, 33) 14 0,28 28,00[51, 33;53, 08) 9 0,18 18,00[53, 08;54, 83) 0 0,00 00,00[54, 83;56, 58) 6 0,12 12,00

    Total 50 1,000 100,00

    Fonte: Dados fictcios.

    Veja como construir uma distribuio de freqncias de uma varivel quantitativa contnua:

    canela

  • 7/25/2019 Introduo Estatstica Bsica Com r

    36/124

    28 EDITORA - UFLA/FAEPE - Gesto de empresas com nfase em qualidade

    Densidades de freqncia so razes entre as freqncias de ocorrncia e as amplitudes de classe.Elas traduzemo que realmente acontece nas classes quando elas possuem amplitudes diferentes,

    df ii=fici

    , (3.10)

    comi variando da classe 1 classe k .Podem ser calculadas densidades de freqncia absolutas, relativas ou percentuais, de acordo

    com o interesse, dividindo-se as respectivas freqncias pelas amplitudes. Contudo, aconselha-se ouso das densidades de freqncia relativas (dfr), pois no histograma, quando a altura das colunasrepresenta a dfr, a rea corresponde freqncia relativa ou probabilidade.

    Nota: Aconselha-se evitar construir classes vazias, pois elas so pouco informativas. No exem-plo da canela em p, as classes 6 e 7 podem ser fundidas em uma s classe. Dessa forma, afreqncia relativa passa a valer 0,12 e a amplitude de classe vale 3,5g. Ento, por exemplo,calculando-se a dfr, tem-se

    df r6=0, 00 + 0, 12

    3, 5

    = 0, 0343.

    Dessa maneira pode-se construir o histograma referente ao exemplo (Figura3.4).Outro dispositivo visual comumente usado o polgono de freqncia. O polgono de freqncia

    nada mais do que a unio, por meio de segmentos de reta, dos pontos mdios das classes (Figura3.4).

    Podem ser teis tambm as freqncias absolutas acumuladas para cima(ouacima de) eparabaixo(ouabaixo de). Podendo informar, por exemplo, quantos potinhos de canela em p contmmenos de 48g. Uma tabela pode ser construda para demonstrar essas freqncias explicitando-seos limites das classes e quantos elementos da amostra se encontram abaixo ou acima daquele valor(Tabela3.4). Os dispositivos grficos usados para represent-las chamam-se ogivas(Figura3.5).

    Canela em p (g)

    Dfr

    44 46 48 50 52 54 56

    0

    .00

    0.0

    5

    0.1

    0

    0.1

    5

    Canela em p (g)

    Dfr

    44 46 48 50 52 54 56

    0

    .00

    0.0

    5

    0.1

    0

    0.1

    5

    (a) (b)

    Figura 3.4: (a) Histograma do peso de potinhos de canela em p em uma linha de produo. (b)O mesmo histograma com polgono de freqncia.

  • 7/25/2019 Introduo Estatstica Bsica Com r

    37/124

    ESTATSTICA DESCRITIVA 29

    Tabela 3.4: Freqncias absolutas acumuladas abaixo (Fa) e acima de (Fa).

    Limite de classe (g) Fa Fa44,33 0 5046,08 5 4547,83 11 3949,58 21 2951,33 35 1553,08 44 654,83 44 656,58 50 0

    Fonte: Dados fictcios.

    A rotina para construir histogramas usa a funo hist() do R. Nela atributos como adensidade de freqncia relativa e cores das colunas pode ser facilmente modificados. Figura3.4(a):

    h

  • 7/25/2019 Introduo Estatstica Bsica Com r

    38/124

    30 EDITORA - UFLA/FAEPE - Gesto de empresas com nfase em qualidade

    44 46 48 50 52 54 56

    0

    10

    20

    3

    0

    40

    50

    Canela em p (g)

    Freqnciaacum

    ulada

    Figura 3.5: Ogivas representando as freqncias absolutas acumuladas acima deeabaixo dee seurespectivo cdigo em R.

    3.5 Medidas de posio

    Quando se tratam de variveis quantitativas, os dados podem ser resumidos sob a forma dedistribuies de freqnciaou pormedidas descritivas. Medidas descritivas so formas de, em umnico nmero, tentar expressar a informao trazida pelos dados.

    As duas categorias de medidas descritivas so: medidas de posio e medidas de disperso.

    As medidas de posio indicam a posio global dos dados na escala de valores possveis.

    3.5.1 Mdia (Me)

    Outras notaes que voc pode encontrar so: , r e Y.

    Dados no agrupados Dados agrupados

    Y =ni=1

    Yin

    Y =ki=1

    f rimi

    sendomi o ponto central da classe i,

    mi=LSi+ LIi

    2 . (3.11)

  • 7/25/2019 Introduo Estatstica Bsica Com r

    39/124

    ESTATSTICA DESCRITIVA 31

    PROPRIEDADES DA MDIA

    SejamXe Yvariveis aleatrias e k uma constante.

    (1) Se X=Y + k, ento X= Y + k.

    Demonstrao:

    X=

    ni=1 Xi

    n

    =x1+ x2+ . . .+ xn

    n

    =(y1+ k) + (y2+ k) + . . .+ (yn+ k)

    n

    =(y1+ y2+ . . .+ yn) + (k+ . . .+ k)

    n

    =(y1+ y2+ . . .+ yn) + nk

    n

    =

    ni=1 Yin

    + k

    = Y + k

    (2) Se X=Y k, ento X= Y k

    Demonstrao:

    X=n

    i=1 Xin

    =x1+ x2+ . . .+ xn

    n

    =(y1k) + (y2k) +. . .+ (ynk)

    n

    =y1+ y2+ . . .+ yn

    n k

    =

    ni=1 Yin

    k

    = Y k

  • 7/25/2019 Introduo Estatstica Bsica Com r

    40/124

    32 EDITORA - UFLA/FAEPE - Gesto de empresas com nfase em qualidade

    (3) Sejaei= yi yo i-simo desvio, ento, para i = 1, . . . , n,n

    i=1 ei= 0.

    Demonstrao:

    n

    i=1 ei=

    n

    i=1 (yi y)

    =ni=1

    yi ni=1

    y

    =ni=1

    yi ni=1

    ni=1

    yin

    =ni=1

    yi nni=1

    yin

    =

    ni=1

    yi ni=1

    yi = 0

    3.5.2 Mediana (Md)

    aquele elemento que ocupa a posio central, ou seja, divide a massa de dados em duaspartes iguais.

    Dados no agrupados (porm, ordenados) Dados agrupados

    Md(Y) = yn+1

    2, se n mpar

    yn2+yn

    2+1

    2 , se n par

    o valor que separa a rea do grfico emduas partes iguais.2

    Ex.: Y ={3, 5, 6, 8, 9} M d(Y) = 6 e y= 6, 2

    PROPRIEDADES DA MEDIANA

    (1) Se X=Y + k, ento, M d(X) =M d(Y) +k.

    Demonstrao:

    Se n mpar:

    Md(X) =x n+12

    =y n+12

    + k

    =M d(Y) +k

  • 7/25/2019 Introduo Estatstica Bsica Com r

    41/124

    ESTATSTICA DESCRITIVA 33

    Se n par:

    Md(X) =yn

    2+ yn

    2+1

    2

    =xn

    2+ k+ xn

    2+1+ k

    2=

    xn2

    + xn2+1+ 2k

    2

    =xn

    2+ xn

    2+1

    2 + k

    =M d(Y) +k

    (2) Se X=Y k, ento, M d(X) =M d(Y) k.

    Demonstrao:

    Se n mpar:

    Md(X) =x n+12

    =y n+12

    k=M d(Y) k

    Se n par:

    Md(X) = yn

    2 + yn

    2+1

    2

    =

    xn

    2 k + xn

    2+1 k

    2

    =xn

    2+ xn

    2+1

    2 k

    =M d(Y) k

  • 7/25/2019 Introduo Estatstica Bsica Com r

    42/124

    34 EDITORA - UFLA/FAEPE - Gesto de empresas com nfase em qualidade

    3.5.3 Moda (Mo)

    valor mais freqente, aquele que mais se repete.

    Variveis discretas Variveis contnuasVerifica-se o valor que mais se repete. Aconselha-se trabalhar com dados agrupa-

    dos, pelo mtodo de Czuber.

    MTODO DE CZUBER

    O mtodo de Czuber permite encontrar-se a moda em dados agrupados. Como era de seesperar, a moda estar contida na classe mais freqente ou, no histograma, a coluna mais alta.Essa classe recebe o nome de classe modal. Dentro da classe modal a moda se situar mais prximoquela classe adjacente que for mais consecutivamente mais alta. Analise a frmula e entenda sualgica no histograma ilustrativo da Figura3.6.

    Mo(Y) =LIM+ 1

    1+ 2 cM, (3.12)

    sendo1= Df rM Df rM1e 1 = Df rM Df rM+1.

    Em que LIM o limite inferior da classe modal; Df rM a densidade de freqncia relativa daclasse modal;Df rM1 a densidade de freqncia relativa da classe anterior modal; Df rM adensidade de freqncia relativa da classe posterior modal; cM: amplitude da classe modal.

    Varivel

    dfr

    44 46 48 50 52 54 56

    0.

    00

    0.

    05

    0.

    10

    0.

    15

    Figura 3.6: Histograma ilustraando geometricamente mtodo de Czuber.

  • 7/25/2019 Introduo Estatstica Bsica Com r

    43/124

    ESTATSTICA DESCRITIVA 35

    Esta a rotina usada para fazer o grfico da Figura3.6:

    h Mo

  • 7/25/2019 Introduo Estatstica Bsica Com r

    44/124

    36 EDITORA - UFLA/FAEPE - Gesto de empresas com nfase em qualidade

    3.6 Medidas de disperso

    As medidas de disperso indicam quanto os dados variam.Considere o seguinte exemplo: Imagine trs situaes distintas em que certa varivel X

    medida em quatro observaes (quatro elementos em cada amostra). Os trs conjuntos de dados

    resultantes esto explicitados na tabela a seguir. Caso voc aplique nesses conjuntos de dados asmedidas de posio conhecidas at o momento, o resultado ser exatamente o mesmo, sugerindoque as trs massas de dados so iguais. Mas isso claramente no verdade! O que fazer?

    Observao I II III1 100 80 102 100 100 1003 100 100 1004 100 120 190x 100 100 100

    Md(x) 100 100 100

    Mo(x) 100 100 100Fica claro que as medidas de posio, por si s, no so suficientes para descrever um conjunto

    de dados. No exemplo, os trs conjuntos de dados diferem quanto variabilidade. Por exemplo, oconjunto III varia muito mais que os outros dois. A est evidenciada a importncia das medidasde disperso ou variabilidade.

    3.6.1 Amplitude (A)

    Amplitude total (ou simplesmente Amplitude), como j mencionando na construo de histo-gramas, o intervalo total de variao dos dados.

    A= M V O mvo

    No exemplo,

    I II IIIAmplitude 100 100 = 0 120 80 = 40 190 10 = 180

    Os conjuntos j comeam a mostrar suas diferenas. Mas h uma desvantagem: amplitudess podem ser comparadas se os conjuntos tiverem o mesmo nmero de dados. intuitivo que sedois conjuntos apresentam nmeros de elementos diferentes, o conjunto maior tem mais chancede ter uma amplitude tambm maior. Nesse caso, a diferena entre as amplitudes dos conjuntos

    refletiria a diferena no nmero de elementos e no a variabilidade dos dados.Alm disso, essa uma medida de disperso limitada, pois s leva em conta valores os extremos.Considere agora os conjuntos de dados:

    I 5 15 15 15 40 AI= 35II 5 10 20 30 40 AII= 35

    Os conjuntos so diferentes, apresentam variabilidades diferentes, porm a amplitude no con-seguiu detectar esse fato.

  • 7/25/2019 Introduo Estatstica Bsica Com r

    45/124

    ESTATSTICA DESCRITIVA 37

    PROPRIEDADES DA AMPLITUDE

    (1) Se X=Y + k, ento,A(X) =A(Y).

    Demonstrao:

    A(X) =M V Ox mvox= (MV Oy+ k) (mvoy+ k)=M V Oy mvoy =A(Y)

    (2) Se X=Y k, ento, A(X) =A(Y) k.

    Demonstrao:

    A(X) =M V Ox mvox= (MV Oy k) (mvoy k)= (MV Oy mvoy) k=A(Y) k

    3.6.2 Varincia e Desvio Padro

    A varincia e o desvio padro so as duas medidas de disperso mais usadas. Elas so grandezasproporcionais, por isso sero tratadas em um mesmo tpico.

    Ambas se valem de todas as observaes para calcular suas quantidades e se baseiam no desvioem relao mdia

    ei= yi y.

    VARINCIA

    Notao: normalmente, a varincia da populao designada pela letra grega sigma minsculoao quadrado (2 ); e a varincia da amostra, pela letraS2 (quando se tratar da varivel aleatria)e s2 (quando se tratar de uma estimativa deS2).

    Se X uma varivel aleatria V(X)tambm denota a Varincia de X.

    Censos Amostras Dados agrupados

    2 =

    ni=1

    e2i

    N S2 =

    ni=1

    e2i

    n 1 2 =

    ki=1

    f ri(mi y)2

    Sendomio ponto mdio da classe i (i = 1, 2, . . . , k).No exemplo,

  • 7/25/2019 Introduo Estatstica Bsica Com r

    46/124

    38 EDITORA - UFLA/FAEPE - Gesto de empresas com nfase em qualidade

    I II IIIVarincia 0 266,67 5400

    Nesse caso, a varincia identificou a diferena na variabilidade dos conjuntos, porm seu valorabsoluto no interpretvel praticamente porque ela se expressa no quadrado da unidade dos

    dados. Por exemplo, o peso de um grupo de bovinos alimentados com certa rao varia 266, 67kg2

    .(!!??)

    PROPRIEDADES DA VARINCIA

    (1) Se X=Y + k, ento, V(X) =V(Y).

    Demonstrao:

    V(X) = ni=1 e

    2i

    n

    1

    =

    ni=1(xi x)2

    n 1=

    ni=1(yi+ k (y+ k))2

    n 1=

    ni=1(yi y)2

    n 1 =V(Y)

    (2) Se X=Y k, ento,V(X) =V(Y) k2.

    Demonstrao:

    V(X) =

    ni=1 e

    2i

    n 1=

    ni=1(xi x)2

    n 1=

    ni=1(yi k (y k))2

    n 1=

    ni=1((yi y) k)2

    n

    1

    =ni=1(yi y)2

    n 1 k2

    =V(Y) k2

  • 7/25/2019 Introduo Estatstica Bsica Com r

    47/124

    ESTATSTICA DESCRITIVA 39

    DESVIO PADRO

    Notao: O desvio padro recebe a mesma notao que a varincia, porm sem o quadrado,ou seja, o desvio padro da populao designado por ; e o desvio padro da amostra, por S(varivel aleatria) ou s (estimativa de S).

    Se X uma varivel aleatria DP(X)tambm denota o Desvio Padro de X.Censos Amostras=

    2 S=

    S2

    No exemplo,

    I II IIIDesvio Padro 0 16,33 73,48

    Alm de utilizar todos os dados para computar sua medida de variabilidade, o desvio padroainda retorna um valor expresso na unidade dos dados, o que o torna mais facilmente interpretvel.

    Por exemplo, quando se diz que o peso de bovinos alimentados com certa rao costuma variar16,33kg ao redor da sua mdia de peso, o leitor consegue ter uma idia prtica da variao.

    PROPRIEDADES DO DESVIO PADRO

    (1) Se X=Y + k, ento,DP(X) =DP(Y).

    Demonstrao:

    DP(X) = V(X)=

    V(Y)

    =DP(Y)

    (2) Se X=Y k, ento, DP(X) =DP(Y) k.

    Demonstrao:

    DP(X) =

    V(X)

    = V(Y) k2=DP(Y) k

  • 7/25/2019 Introduo Estatstica Bsica Com r

    48/124

    40 EDITORA - UFLA/FAEPE - Gesto de empresas com nfase em qualidade

    3.6.3 Coeficiente de Variao (CV)

    O Coeficiente de variao uma medida de variabilidade padronizada, ou seja, expressa per-centualmente a variao dos dados em relao mdia.

    Censos AmostrasCV(%) =

    CV(%) =

    S

    X

    Sua grande vantagem permitir a comparao de grandezas diferentes, que esto em unidadesdiferentes (por exemplo: o que mais varivel, o ganho de peso de sunos ou a altura de plantasde milho?).

    Por outro lado, ele possui srias restries de uso e inspira cuidados. Primeiro, quando amdia da varivel aleatria em questo tende a zero, o C Vtende ao infinito (o que no faz sentidoprtico). Segundo, de acordo com as propriedades da mdia a do desvio padro, a adio deuma constante s observaes altera a mdia da nova varivel aleatria, mas no altera seu desvio

    padro, ou seja, por meio de algumas transformaes de variveis o C Vpode ser criminosamentemanipulado.No exemplo,

    I II IIICV(%) 0 16,33 73,48

    Nesse caso a interpretao se torna ainda mais imediata, porm no podemos nos esquecer dasressalvas feitas anteriormente.

    PROPRIEDADES DO COEFICIENTE DE VARIAO

    (1) Se X=Y + k, ento,

    CV(X)< CV(Y), se k >0CV(X)> CV(Y), se k 0, ento DP(Y)

    Y + k 0.

    (ii) P() = 1.(iii) Sejam A1, A2, A3, . . . eventos disjunto pertencentes a(interseco nula), ento P(A1 A2 A3

    P(A1) +P(A2) +P(A3) +. . ..

    3No sentido mais amplo da palavra

  • 7/25/2019 Introduo Estatstica Bsica Com r

    54/124

    46 EDITORA - UFLA/FAEPE - Gesto de empresas com nfase em qualidade

    PROPRIEDADES DERIVADAS DOS AXIOMAS

    (i) P

    A

    = 1 P(A).

    (ii) P() = 0.

    (iii) P(A B) =P(A) + P(B) P(A B).

    (iv) 0P(A)1.

    FUNO DENSIDADE DE PROBABILIDADE

    Funo densidade de probabilidade (fdp) a funo que descreve a probabilidade de umavarivel aleatria associada a uma populao infinita, onde a rea representa a probabilidade e a

    altura, a densidade de probabilidade.

    PROPRIEDADES DA FDP

    (i) A rea total abaixo da curva igual a 1, +

    f(x)dx= 1.

    4 2 0 2 4

    0.

    0

    0.

    1

    0.

    2

    0.

    3

    0

    .4

    x

    fdp(x)

    Figura 4.2: Esquema da integral de uma funo densidade de probabilidade.

  • 7/25/2019 Introduo Estatstica Bsica Com r

    55/124

    PROBABILIDADE 47

    A rotina a seguir mostra como foi feita a Figura4.2.

    x

  • 7/25/2019 Introduo Estatstica Bsica Com r

    56/124

    48 EDITORA - UFLA/FAEPE - Gesto de empresas com nfase em qualidade

    4.1.1 Distribuio Binomial

    A distribuio Binomial de probabilidades uma distribuio discreta que se caracteriza pelaseguinte funo densidade:

    P[X=x] =Cn,xp

    x

    q

    n

    x

    , (4.4)em que,

    Cn,x= n!

    x!(n x)! . (4.5)

    Os parmetros da Binomial so: n(nmero de eventos) e p (probabilidade de sucesso). qno considerado um parmetro porque ele funo de p, q= 1 p.

    A Binomial possui quatro caractersticas marcantes:

    (a) Ser uma soma de ensaios de Bernoulli, ou seja, de ensaios que possuem apenas dois resultadospossveis (sucesso ou fracasso).

    (b) As realizaes desses ensaios so eventos independentes.

    (c) A probabilidade de sucesso (p) constante ao longo dos ensaios.

    (d) O nmero de ensaios finito.

    A esperana matemtica (mdia) e a varincia da distribuio Binomial so funes de seusdois parmetros,n e p, a saber:

    E[X] =np; (4.6)

    2X=V(X) =npq. (4.7)

    Exemplo: Em uma ninhada de aves, nove ovos foram chocados. Qual a probabilidade denascerem sete machos?

    Sabe-se que a probabilidade de um filhote ser macho 50% (p= 0, 5); o nmero de ovos nessaninhada 9(n= 9); e a varivel aleatria (X), desse experimento, representa o nmero de filhotesmachos. Alm disso, queremos descobrir a probabilidade dessa varivel assumir o valor sete, ouseja, nascerem sete machos nessa ninhada (x= 7); ento

    P[X= 7] =C9,7p7q97 = 36

    0, 57

    0, 52

    =7%.

  • 7/25/2019 Introduo Estatstica Bsica Com r

    57/124

    PROBABILIDADE 49

    4.1.2 Distribuio Poisson

    Distribuio discreta de probabilidades caracterizada pela seguinte funo densidade de pro-babilidade:

    P[X=x] =ex

    x! . (4.8)Neste curso, a distribuio de Poisson ser usada apenas como uma aproximao a distribuio

    Binomial, quando n muito grande e p muito pequeno. Portanto, vale ressaltar que, alm dascaractersticas da distribuio Binomial, a Poisson apresenta as seguintes particularidades:

    (a) Pode descrever eventos raros.

    (b) A varivel discreta assume apenas valores inteiros positivos (X= 0, 1, . . .).

    (c) n >50 e p

  • 7/25/2019 Introduo Estatstica Bsica Com r

    58/124

    50 EDITORA - UFLA/FAEPE - Gesto de empresas com nfase em qualidade

    4.2 Distribuies de probabilidades contnuas

    Pode-se entender distribuies contnuas de probabilidade como generalizaes de histogramasconstrudos para grandes tamanhos amostrais (n ).

    -3 -2 -1 0 1 2 3

    0.0

    0.1

    0.2

    0.3

    0.4

    0.

    5

    -3 -2 -1 0 1 2 3

    0.0

    0.1

    0.2

    0.

    3

    0.4

    -4 -2 0 2 4

    0.

    0

    0.1

    0.2

    0.

    3

    0.4

    -4 -2 0 2 4

    0.

    0

    0.

    1

    0.

    2

    0.3

    0.4

    Figura 4.3: Esquema da generalizao terica de histogramas para funes densidade de probabi-lidade, quando n .

  • 7/25/2019 Introduo Estatstica Bsica Com r

    59/124

    PROBABILIDADE 51

    Veja a rotina utilizada para a construo dos grficos da Figura4.3.

    x1

  • 7/25/2019 Introduo Estatstica Bsica Com r

    60/124

    52 EDITORA - UFLA/FAEPE - Gesto de empresas com nfase em qualidade

    PROPRIEDADES DA DISTRIBUIO NORMAL

    (1) simtrica.

    (2) Tem forma de sino.

    (3) Est definida dea +, com caudas assintticas ao eixo X.

    (4) Apresenta a particularidade: Me= M o= M d.

    (5) Dois parmetros: De forma: 2 e de locao .

    Exemplo: A velocidade de veculos em uma rodovia segue uma distribuio Normal com mdia60km/he varincia 400(km/h)2.

    (a) Qual a probabilidade de um veculo ser flagrado a mais de 100km/h?Soluo:

    100

    f(x)dx=

    100

    1

    20

    2e

    1

    2

    x 60

    20

    2dx.

    Essa integral no trivial!

    0 50 100 150

    0.

    000

    0.

    005

    0.

    010

    0.

    01

    5

    0.

    020

    Velocidade (km/h)

    fdp(x)

    Figura 4.4: Esquema destacando a area acima de100km/hem uma distribuio de media60km/he varincia400(km/h)2.

  • 7/25/2019 Introduo Estatstica Bsica Com r

    61/124

    PROBABILIDADE 53

    Veja a rotina utilizada para fazer a Figura4.4.

    x

  • 7/25/2019 Introduo Estatstica Bsica Com r

    62/124

    54 EDITORA - UFLA/FAEPE - Gesto de empresas com nfase em qualidade

    Da, z= 100 60

    20 = 2 e utilizando a Tabela9.2do Apndice??, temos que P(X >100) =

    P(Z >2) = 0, 5 0, 4772 = 0, 0228 = 2, 28%.

    (b) E qual a chance de um automvel estar trafegando entre 40 e 70km/h?

    0 50 100 150

    0.

    000

    0.

    005

    0.

    010

    0.

    015

    0.

    020

    Velocidade (km/h)

    fdp(x)

    Figura 4.5: Esquema destacando a area entre 40e100km/hem uma distribuio de media60km/he varincia400(km/h)2.

    Veja a rotina utilizada para fazer a Figura4.5.

    x

  • 7/25/2019 Introduo Estatstica Bsica Com r

    63/124

    PROBABILIDADE 55

    Aqui, devemos transformar dois pontos: z1 =40 60

    20 =1e z2= 70 60

    20 = 0, 5. E olhando

    na tabela: P(40< X

  • 7/25/2019 Introduo Estatstica Bsica Com r

    64/124

    56 EDITORA - UFLA/FAEPE - Gesto de empresas com nfase em qualidade

    Veja a rotina utilizada para fazer a Figura4.6.

    x

  • 7/25/2019 Introduo Estatstica Bsica Com r

    65/124

    PROBABILIDADE 57

    APROXIMAO DA POISSON NORMAL

    Em situao semelhante, porm, dessa vez se tratando de uma varivel Poisson, uma mdiamuito grande,

    >15,

    tambm podemos aproximar uma distribuio Normal seguindo as transformaes:

    = e 2 =.

    Exemplo: Suponha que a mdia de chuvas fracas por ano em certa regio seja de = 30 .Qual a probabilidade de ocorrerem mais de 45 chuvas desse tipo no prximo ano?

    = = 2 = 30

    = 5, 48chuvas fracasz=

    45 305, 8

    = 2, 74

    P(X

  • 7/25/2019 Introduo Estatstica Bsica Com r

    66/124

    58 EDITORA - UFLA/FAEPE - Gesto de empresas com nfase em qualidade

  • 7/25/2019 Introduo Estatstica Bsica Com r

    67/124

  • 7/25/2019 Introduo Estatstica Bsica Com r

    68/124

    60 EDITORA - UFLA/FAEPE - Gesto de empresas com nfase em qualidade

    5.2 Amostragens aleatrias

    5.2.1 Amostragem aleatria simples (AAS)

    Deve ser realizada em populaes estritamente homogneas.

    Ela se caracteriza pelo sorteio de n elementos de uma populao.

    Pode ser feita com ou sem reposio dos elementos amostrados populao.

    SORTEIO

    (a) Tabelas de nmeros aleatrios: 0 a 99.999;

    (b) Calculadoras: Tecla RANN (tamanho da populao);(c) Softwares estatsticos.

    INCONVENIENTES

    Populaes estritamente homogneas so pouco comuns.

    muito trabalhosa em populaes grandes, porque todos os elementos devem ser numerados(ou, pelo menos, identificados), e impossvel em populaes infinitas.

    MODELO ESTATSTICO

    Yi= + ei, (5.1)em que Yi a observao do indivduo i da amostra; a mdia da populao; e ei o desvioaleatrio referente ao indivduoi.

    5.2.2 Amostragem aleatria estratificada (AAE)

    utilizada em populaes heterogneas.

    Deve-se dividir a populao em estratos homogneos (dentro), mas diferentes entre si. Dasorteiam-se elementos de cada estrato proporcionalmente a seu tamanho.

    MODELO ESTATSTICO

    Yij = + ti+ eij (5.2)

    em queYij o valor do indivduoj do estratoi; a mdia populacional; ti o efeito do estratoi; ei o efeito aleatrio (desvio) do indivduo j do estrato i.

    Obs.: Mdia do estrato i: i= + ti.

  • 7/25/2019 Introduo Estatstica Bsica Com r

    69/124

    AMOSTRAGEM 61

    5.2.3 Amostragem aleatria por conglomerado (AAC)

    Conglomerado subdiviso da populao objetivando economia de recursos, pois somente algunssero sorteados.

    Principal objetivo: economia de tempo e recursos.

    H homogeneidade entreconglomerados e espera-se que a variabilidade de populao estejarepresentada dentro de cada um deles.

    Exemplo: Em uma pesquisa dentre os domiclios de Lavras, se uma AAS fosse feita, provavel-mente os sorteados ficariam muito espalhados, sendo difcil de serem observados. Da sorteia-se7bairros e 10 domiclios por bairro para facilitar o processo.

    MODELO ESTATSTICO

    Yij = + ci+ eij , (5.3)

    em que Yij o valor do indivduo j do conglomerado i; a mdia populacional; ti o efeito(aleatrio) do conglomerado i; ei o efeito aleatrio (desvio) do indivduo jdo conglomerado i.

    Tabela 5.1: Diferenas bsicas entre a amostragem aleatria estratificada (AAE) e a amostragemaleatria por conglomerado (AAC).

    AAE AAC

    Todo estado observado Alguns conglomerados so sorteadosEfeito fixo Efeito aleatrioEstratos so diferentes entre si Conglomerados so semelhantes entre siObjetivo: > representatividade Objetivo: < custo

    5.2.4 Amostragem aleatria sistemtica (AS)

    utilizada em situaes em que elementos da populao esto dispostos em srie.

    Apenas o 1elemento sorteado, os demais so tomados sistematicamente, e se distanciamdistantes um passo de amostragem(k).

    Objetivo: facilitar o processo.

  • 7/25/2019 Introduo Estatstica Bsica Com r

    70/124

    62 EDITORA - UFLA/FAEPE - Gesto de empresas com nfase em qualidade

    POPULAES FINITAS

    (a) Defini-se o passo de amostragem: k=N

    n.

    (b) Sorteia-se o primeiro elemento dentre os k primeiros.

    (c) Tornam-se os demais de kemk .

    POPULAES MUITO GRANDES OU INFINITAS

    (a) Toma-se o 1 elemento a esmo.

    (b) Tomam-se os demais elementos de maneira igualmente espaada.

    MODELO ESTATISTICO1

    Yi = + ui, (5.4)

    em que

    ui= uij+ ei. (5.5)

    Geralmente admiti-se (parmetro de auto correlao2) igual a zero, da,

    Yi= + ei. (5.6)

    1Um dos modelos possveis.2Note que, quando = 0, o modelo estatstico igual ao da amostragem aleatria simples.

  • 7/25/2019 Introduo Estatstica Bsica Com r

    71/124

    6

    INFERNCIA ESTATSTICA

    Inferncia o conjunto de tcnicas que generalizam informaes amostrais para toda a popula-o.

    Grandes reas Estimao (Intervalos de confiana) e Deciso (Testes de hipteses).

    TEOREMA CENTRAL DO LIMITE

    Seja uma populao qualquer com mdia e varincia a 2. Se infinitas amostras de ta-manho n so coletadas dessa populao, ento as mdias (X) das amostras tero distribuio

    aproximadamente Normal com mdia e varincia 2

    n, medida que n tende ao infinito.

    6.1 Distribuio de amostragem

    Definio: E a distribuio de probabilidade de estimadores ou f() ao longo de infinitasamostras aleatrias.

    6.1.1 Distribuio de funes da mdia amostral (populaes normais)

    Sabemos que seXtem distribuio Normal,Z=X

    tem distribuio Normal padronizada,

    N(0, 1). Agora, como saber qual a distribuio da mdia X?SeX

    N(, 2), ento as seguintes afirmaces se verificam:

    (I)

    XN(n,n); e

    (II)

    X

    n N

    ,

    2

    n

    ; portanto

    (III) XN

    ,2

    n

  • 7/25/2019 Introduo Estatstica Bsica Com r

    72/124

    64 EDITORA - UFLA/FAEPE - Gesto de empresas com nfase em qualidade

    Se padronizarmos a mdia, ou seja, subtrairmos da mdia populacional e dividirmos por seudesvio padro, conseguimos encontrar a quantidade que segue uma Normal padro:

    f(X) =Z=X

    n

    N(0, 1). (6.1)

    Mas como geralmente desconhecido, tem-se que utilizar uma quantidade que mais seassemelhe. Essa quantidade o seu estimador,S. Porm, quando substitumos por S, devemospagar um preo. A nova quantidade no segue mais uma distribuio Normal padro (Z), masuma aproximao da Normal padro, a distribuio t de Student, com n 1 graus de liberdade,tn1.

    f(X) =X

    Sn

    tn1 (6.2)

    Graus de liberdade: O nmero de graus de liberdade para um conjunto de dados correspondeao nmero de valores que podem variar aps terem sido impostas certas restries a todosos valores.

    A distribuio t de Student uma distribuio de probabilidades muito parecida com a dis-tribuio Normal padro. Ela simtrica, tem forma de sino, centrada em zero, mas maislarga e sua forma varia em funo do tamanho da amostra (n). Quanto maior a amostra maisa distribuio t se assemelha a uma distribuio z, ou seja,

    n

    , tn

    1

    N(0, 1).

    PROPRIEDADES IMPORTANTES DA DISTRIBUIO T DE STUDENT1

    (1) A distribuio t de Student diferente, conforme o tamanho da amostra.

    (2) Ela tem a mesma forma geral simtrica (forma de sino) que a distribuio Normal, mas refletea maior variabilidade (com distribuies mais amplas) que esperada em pequenas amostras.

    (3) Tem mdia t = 0.

    (4) O desvio padro da distribuio t de Student varia com o tamanho da amostra, mas superiora 1.

    (5) Na medida em que aumenta o tamanho n da amostra, a distribuio t de Student se aproximamais e mais da distribuio Normal padronizada. Para valores n >30, as diferenas so topequenas que podemos utilizar os valores crticos Z em lugar de valores crticos t.

    1Adaptado de Triola, 1999.

  • 7/25/2019 Introduo Estatstica Bsica Com r

    73/124

    INFERNCIA ESTATSTICA 65

    4 2 0 2 4

    0.

    0

    0.

    1

    0.

    2

    0.

    3

    0.

    4

    Figura 6.1: Demonstrao da curva Normal (linha cheira) padro e da curva t com 5 (linhatracejada) e 30 (linha pontilhada) graus de liberdade.

    Veja a rotina utilizada para fazer a Figura6.1.

    x

  • 7/25/2019 Introduo Estatstica Bsica Com r

    74/124

    66 EDITORA - UFLA/FAEPE - Gesto de empresas com nfase em qualidade

    6.2 Estimao

    6.2.1 Estimao por ponto

    a obteno de uma estimativa do valor paramtrico com base em informaes vindas da

    amostra.Estimadores mais comuns:

    = X=

    i Xin

    2 =

    i(Xi X)2

    n 1p=

    x

    n,x= nmero de sucessos

    1

    2= 1

    2= X1

    X2

    . . .

    6.2.2 Estimao por intervalo

    Intervalo de confiana (IC): o intervalo que contm o parmetro real com1de confiana.Confiana: = 1 Significncia:

    A maioria dos intervalos de confiana segue a seguinte forma geral:

    IC() = q/2EP (6.3)

    em que a confiana associada ao intervalo; uma funo qualquer do parmetro de interesse; o estimador desse parmetro; q/2 um quantil de uma distribuio associada ao estimador e;EP o erro padro do estimador.

  • 7/25/2019 Introduo Estatstica Bsica Com r

    75/124

    INFERNCIA ESTATSTICA 67

    IC para a media ()

    2 CONHECIDO

    Z=X

    n

    N(0, 1) (6.4)

    Ento, podemos deduzir o intervalo de confiana para a mdia:

    P[z < Z < z] =

    P

    z/2 < X

    n

    < z/2

    =

    P

    z/2

    n< X < z/2

    n

    =

    PX z/2 n X z/2 n

    =

    P

    X z/2

    n

  • 7/25/2019 Introduo Estatstica Bsica Com r

    76/124

    68 EDITORA - UFLA/FAEPE - Gesto de empresas com nfase em qualidade

    IC para proporo (p)

    Existem diversas aproximaes mais precisas, porm muito mais trabalhosas. Por isso podemosutilizar a aproximao binomial normal.

    Este procedimentono recomendado quando

    np5 ou n(1 p)5.

    Se X binomial e n grande

    XN(np,npq)X

    nN

    p,

    pq

    n

    pN

    p,

    pq

    n

    A partir da fica fcil enxergar que

    IC(p) =

    p z/2

    pq

    n

    IC para a diferena entre duas medias (1 2)VARINCIAS CONHECIDAS

    Se uma varivel aleatria

    X1N(1, 2

    1), ento X1N1,

    2

    n1 .E se outra varivel

    X2N(2, 22), ento X2N

    2,22n2

    .

    Da,

    (X1 X2)N

    1 2,21

    n1+

    22n2

    .

    Contudo, as varincias consideradas conhecidas podem ser iguais ou diferentes.

    21=22

    IC(1 2) =(X1 X2) z/2

    21n1

    +22n2

    .

  • 7/25/2019 Introduo Estatstica Bsica Com r

    77/124

    INFERNCIA ESTATSTICA 69

    21 =22 =

    2

    IC(1 2) =

    (X1 X2) z/2

    2

    1

    n1+

    1

    n2

    .

    VARINCIAS DESCONHECIDAS

    No caso em que no so conhecidas as varincias populacionais, a tendncia natural utilizarseus estimadores. S2 o estimador de 2, porm a distribuio de X1 X2 no mais normal,mas sim uma t.

    E mesmo quando as varincias populacionais so desconhecidas, deve-se decidir por considera-las iguais ou diferentes.

    21=22

    IC(1 2) =(X1 X2) t/2

    S21n1

    +S22n2

    .

    Em que os graus de liberdade de tso dados por

    =

    S21

    n1+

    S22

    n2

    2S21

    n1

    2

    n11 +

    S22

    n2

    2

    n21

    .

    21 =22 =

    2

    IC(1 2) =

    (X1 X2) t/2

    S2p

    1

    n1+

    1

    n2

    .

    Em que

    Sp=(n1 1)S21 + (n2 1)S22

    n1+ n2 2e os graus de liberdade sao dados por

    =n1+ n2 2.

  • 7/25/2019 Introduo Estatstica Bsica Com r

    78/124

    70 EDITORA - UFLA/FAEPE - Gesto de empresas com nfase em qualidade

    6.3 Testes de hipteses

    Teste de hiptese: uma ferramenta que permite testar se um valor pertinente de ser o valorreal de parmetro em questo.

    6.3.1 Teste de homogeneidade de Varincias (teste F):

    Estatstica de teste: Fc = S2maiorS2menor

    1, em que Fc uma varivel aleatria que segue umadistribuioFde probabilidades com graus de liberdade1 = n1 1e 2= n2 1, ou seja,

    FcF(1, 2) =F[(n1 1), (n2 2)].

    DISTRIBUIO F DE PROBABILIDADES

    0 1 2 3 4 5 6 7

    0.0

    0.2

    0.4

    0.6

    X

    f(X)

    Figura 6.2: Distribuio F de probabilidade ressaltando a regio de aceitao de um teste dehomogeneidade de varincias (de 1 at um Fc qualquer).

  • 7/25/2019 Introduo Estatstica Bsica Com r

    79/124

    INFERNCIA ESTATSTICA 71

    Veja a rotina utilizada para fazer a Figura6.2.

    x

  • 7/25/2019 Introduo Estatstica Bsica Com r

    80/124

    72 EDITORA - UFLA/FAEPE - Gesto de empresas com nfase em qualidade

    Tabela 6.1: Representao tabular dos resultados possveis em um teste de hipteses e os erros eacertos que eles acarretam.

    VerdadeH0 verdadeira H0 falsa

    Deciso Aceita-se H0 Ok! Erro tipo IIRejeita-se H0 Erro tipo I Ok!

    6.3.2 Teste sobre (populaes infinitas)

    2 DESCONHECIDO

    Estatstica de teste: tc=X 0S/

    n

    .

    As hipteses consideradas nesse teste so:

    H0: = 0H1: =0 ,ou ainda,

    H0: = 0H1: > 0 ou < 0

    .

    Teste bilateral: t/2 < tc< t/2, Aceita-se H0Caso contrrio, Rejeita-seH0

    .

    Teste unilateral superior tc < t, Aceita-se H0

    Caso contrrio, Rejeita-seH0,

    e teste unilateral inferior tc >t, Aceita-se H0

    Caso contrrio, Rejeita-seH0

  • 7/25/2019 Introduo Estatstica Bsica Com r

    81/124

    INFERNCIA ESTATSTICA 73

    4 2 0 2 4

    0.

    0

    0.

    1

    0.

    2

    0.

    3

    0.

    4

    4 2 0 2 4

    0.

    0

    0.

    1

    0.

    2

    0.

    3

    0.

    4

    (a) (b)

    Figura 6.3: (a) Ilustrao do teste unilateral superior. (b) Ilustrao do teste bilateral. A areahachurada representa a regio de rejeio do teste.

    Veja como fazer as Figura6.3 (a)...

    x

  • 7/25/2019 Introduo Estatstica Bsica Com r

    82/124

    74 EDITORA - UFLA/FAEPE - Gesto de empresas com nfase em qualidade

    6.3.3 Teste sobre propores (p)

    Estatstica de teste: zc= p p

    pq

    n

    As hipteses consideradas nesse teste so: H0: p= p0H1: p=p0 ,

    ou ainda, H0 : p= p0H1 : p > p0 ou p < p0

    .

    Teste bilateral: z/2< zc< z/2, Aceita-se H0Caso contrrio, Rejeita-seH0

    .

    Teste unilateral superior zc < z, Aceita-se H0

    Caso contrrio, Rejeita-seH0,

    e teste unilateral inferior zc>z, Aceita-se H0

    Caso contrrio, Rejeita-seH0.

  • 7/25/2019 Introduo Estatstica Bsica Com r

    83/124

    7

    CORRELAO E REGRESSO

    Correlao: mede o grau de relacionamento entre duas ou mais variveis.

    Regresso: o estudo que busca ajustar uma equao a um conjunto de dados de forma que arelao entre variveis possa ser descrita matematicamente.

    7.1 Correlao

    7.1.1 Coeficiente de correlao linear (r ou )

    Mede a correlao de duas variveis.

    =

    n

    i=1

    XiYi

    n

    i=1Xi

    n

    i=1Yi

    n

    ni=1

    X2i

    ni=1

    Xi

    2n

    ni=1

    Y2i

    ni=1

    Yi

    2n

    (7.1)

    7.1.2 Coeficiente de determinao (r2 ou 2)

    Indica, percentualmente, quanto da variao da varivel dependente (Y) que explicada pelomodelo de regresso. Note que, no caso da Regresso Linear Simples, o modelo em questo areta.

    2 =Variao explicada pelo modelo

    Variao total (7.2)

  • 7/25/2019 Introduo Estatstica Bsica Com r

    84/124

    76 EDITORA - UFLA/FAEPE - Gesto de empresas com nfase em qualidade

    Vamos nos ater ao caso em que nosso modelo uma reta, ou seja, estamos lidando comRegresso Linear. Nesse caso particular o coeficiente de determinao se torna

    2 =Variao explicada pela reta

    Variao total =

    SQRLSQT

    , (7.3)

    em queSQRLsignifica Soma de Quadros de Regresso Linear,SQTsignifica Soma de QuadradosTotal e essas quantidades sao calculadas pelas expresses

    SQRL=

    ni=1

    XiYi

    ni=1

    Xi

    ni=1

    Yi

    n

    ni=1

    X2i

    n

    i=1 X

    i2

    n

    (7.4)

    SQT =

    ni=1

    Yi

    2n

    (7.5)

    A diferena entre a variao total e a variao explicada pela reta de regresso chamada de

    desvio, e pode ser calculada pela Soma de Quadrados de Desvios (SQD)SQD = SQT SQRL. (7.6)

    Alm de estimar os coeficientes da reta de regresso possvel testar se eles so significativos.Por exemplo, pode-se testar se o coeficiente 1 estatisticamente igual a zero ou no. Se forconsiderado igual a zero, ou seja, se aceita-se H0nesse teste, isso significa que apenas a constante0seria suficiente para explicar os dados, Yno varia com a variao de X. Por outro lado, se 1for considerado significativo, esse um bom indicativo a favor do modelo estimado.

    O seguinte teste pode ser feito o seguinte teste Fpara o ajuste de uma regresso linear.

    HIPTESES

    H0: 1 = 0H1: 1= 0 > ou

  • 7/25/2019 Introduo Estatstica Bsica Com r

    85/124

    CORRELAO E REGRESSO 77

    ESTATSTICA DE TESTE

    Fc=SQRL

    S2 ,

    em queS2 =

    SQD

    n 2 .

    TESTE

    Fc < F(, 1, 2), Aceita-se H0Fc > F(, 1, 2), Rejeita-seH0

    ,

    em que F(, 1, 2) o valor tabelado para a distribuio F com 1 e 2 graus de liberdade, e100%de probabilidade.

    7.2 Regresso

    Um estudo de regresso busca essencialmente associar uma varivel Y(denominada varivel-resposta) a um conjunto de outraspvariveisX1, X2, . . . , X p(denominadas covariveis ou variveisexplicadoras). Esta associao segundo uma forma funcional do tipo

    Y =f(X1, X2, . . . , X p),onde a funo fpode ser, princpio, qualquer uma. Quando fassume a forma funcional

    linear (isto , f uma combinao linear das covariveis

    f(X1, X2, . . . , X p) =0+ 1X1+ 2X2+ . . .+ pXp,

    em que os coeficientes i (i= 1, 2, . . . , p) so nmeros fixos chamados parmetros), a regresso chamada linear, caso contrrio, uma regresso no-linear. Numa regresso linear, quando p = 1denominamos o estudo como regresso linear simples, caso contrrio, denominamos regresso linearmltipla.

    7.2.1 Regresso Linear Simples

    Explica, por meio de uma reta, a relao entre duas variveis.

    MODELO ESTATSTICO

    Yi= 0+ 1X1i+ ei, (7.7)

  • 7/25/2019 Introduo Estatstica Bsica Com r

    86/124

    78 EDITORA - UFLA/FAEPE - Gesto de empresas com nfase em qualidade

    em que Yi o valor da varivel Ypara o indivduo i; 0 o intercepto; 1 o coeficiente linear;X1i o valor da (co)varivel Xpara o indivduo i;ei o erro aleatrio associado ao indivduo i.

    ESPERANA MATEMTICA

    E[Yi] =0+ 1X1i (7.8)

    ESTIMAO DE PARMETROS POR MEIO DO MTODO DOS QUADRADOS MNIMOS

    Existem diversos mtodos que permitem estimar os parmetros de interesse no contexto deRegresso Linear Simp