Estatistica: introducao a teoria de decisao

Capıtulo 10

Introducao a Teoria de

Decisao

10.1 Introducao

Na situacao geral de decisao temos varias alternativas bem definidas e procu-ramos pela melhor acao dado o problema que temos em maos. Alem dissoestamos em uma situacao de incerteza e algumas das informacoes importantespara a decisao sao desconhecidas.Dependendo do contexto algumas das decisoestomadas terao mais merito. Este merito pode ser medido quantitativamente erecebe a denominacao de utilidade. Embora o verdadeiro contexto encontradoapos decidida a acao seja desconhecido e possıvel coletar informacao que per-mita enumerar as possibilidades. A teoria de decisao permite combinar estainformacao probabilıstica e emprega-la na escolha do melhor curso de acao.No que segue ilustraremos a teoria de decisao em acao utilizando um exemplosimples.

10.2 Problema de Decisao

Suponhamos que nos sejamos o fabricante de uma linha de relogios de pulsobaratos que e vendida por uma cadeia de lojas de departamento e supermer-cados. Nos nao oferecemos garantias contra defeitos aos clientes. No entanto,como uma forma alternativa de compensacao efetuamos a manutencao de qual-quer relogio apenas uma vez mediante ao pagamento de uma pequena taxa.Ao encontrarem algum defeito os consumidores devem devolver o relogio pa-gando uma pequena quantia e fornecendo uma explicacao do defeito. Nos entaonao realizamos nenhum trabalho de manutencao detalhado, apenas ou repo-mos o mecanismo completo, ou executamos a limpeza ou ambos. O servicode manutencao e oferecido como uma forma de relacoes publicas nao havendointencoes comerciais. Obviamente, e desejavel manter os custos desse servico

87

88 CAPITULO 10. INTRODUCAO A TEORIA DE DECISAO

no patamar mais baixo possıvel, sujeito a avaliacao de quanto desejamos gastarpelas vantagens promocionais proporcionadas pelo esquema.

Para cada relogio precisamos tomar a decisao de reposicao do mecanismoou simples limpeza. Gostarıamos de ser capazes de remediar o problema, sepossıvel, pela alternativa mais barata, a saber, a simples limpeza. Precisamos as-sim determinar uma estrategia de decisao entre as duas alternativas manutencaoou limpeza. Precisamos tambem determinar a taxa que cobraremos pelo servico.Esta situacao pode ser organizada utilizando a teoria de decisao. Considere-mos o que ocorre quando um relogio chega para manutencao. Inicialmente saopossıveis duas acoes denotadas a1 e a2:

• a1: limpe o relogio primeiro;

• a2: reponha o mecanismo imediatamente.

O conjunto de possıveis acoes e denominado o espaco de acoes e denotadoA = a1, a2. Por simplicidade, suponhamos que so ha dois tipos de defeitos:1. poeira entrou no mecanismo; 2. ha um problema mecanico. Estas sao ascircunstancias que sao desconehcidas por nos quando temos que tomar umadecisao. Estas circunstancias podem ser vistas como “estados da natureza”,atribuindo sımbolos:

• θ1: poeira no mecanismo;

• θ2: problema mecanico.

Em analogia ao espaco das acoes introduzimos tambem o espaco dos estadosΩ = θ1, θ2. Equivalentemente, podemos imaginar o espaco dos estados comoum espaco de parametros com o parametro θ apresentando dois valores θ1 e θ2.

Claramente, acoes diferentes levarao a consequencias distintas, dependendodo estado da natureza. Por exemplo, se o mecanismo estiver quebrado (estadoθ2) nao adiantara apenas efetuar a limpeza (acao a1). Suponha que o custoda limpeza seja 2 (a unidade monetaria nao importa) e que a reposicao custe5. Podemos entao construir uma tabela que expresse os custos L(ai, θj) decada acao ai sob cada uma das circunstancias desconhecidas θj . No nosso casoteremos a tabela abaixo.

L(ai, θj) θ1 θ2

a1 2 7a2 5 5

Note que a limpeza (a1) no caso de um relogio com mecanismo quebrado (θ2)tem por consequencia os custos da limpeza (2) e da manutencao (5).

Se soubessemos o estado da natureza para qualquer relogio que chegassea fabrica o problema de decisao seria trivial: se θ1 (relogio sujo) entao a1

(limpeza), se θ2 (mecanismo quebrado) entao a2 (reposicao). No entanto, sosaberemos o estado da natureza apos tomarmos a decisao. O que devemosfazer entao?

10.2. PROBLEMA DE DECISAO 89

Suponha que, embora θ nao seja conhecido para um relogio particular, aexperiencia nos mostra que cerca de 30% deles apresenta problemas mecanicos.Dessa forma, temos uma probabilidade a priori π(θ2) = 0, 3 e, portanto, π(θ1) =0, 7. Esta informacao nos e muito util, pois com ela podemos determinar o customedio de tomarmos sempre a acao a1 ou sempre a acao a2:

〈L(a1, θ)〉θ = 2 × 0, 7 + 7 × 0, 3 = 3, 5

〈L(a2, θ)〉θ = 5 × 0, 7 + 5 × 0, 3 = 5, 0

Assim sendo, no longo prazo seria mais barato executar primeiro a limpeza detodos os relogios que chegassem a fabrica.

Note que a estrategia mudaria se a probabilidade a priori fosse diferente.Por exemplo, se 70% dos relogios recebidos tivessem problemas mecanicos (θ2)terıamos: 〈L(a1, θ)〉θ = 5, 5 e 〈L(a2, θ)〉θ = 5, 0. A estrategia mais barata nolongo prazo seria entao executar a manutencao em todos os relogios que fossemdevolvidos a fabrica.

A informacao que temos sobre os estados da natureza na forma da proba-bilidade a priori π(θ) nos permite escolher uma acao com a garantia de que emmedia minimizaremos o gasto incorrido. E claro que seria muito azar se, por ex-emplo, escolhecemos a acao a2 e um numero enorme de relogios com poerira nomecanismo aparecesse de uma vez. No entanto, devemos lembrar que a teoria dedecisao se aplica em media. Com a tabela de custos acima podemos determinaruma distribuicao a priori neutra, caracterizada por custos iguais seja qual for aacao escolhida. Assim terıamos:

〈L(a1, θ)〉θ = 〈L(a2, θ)〉θ2π(θ1) + 7[1 − π(θ1)] = 5π(θ1) + 5[1 − π(θ1)]

π(θ1) = 0, 4

Se o prior for neutro teremos custos iguais ( 〈L(a1, θ)〉θ = 〈L(a2, θ)〉θ = 5, 0 )nao importando a acao de nossa escolha.

Compliquemos um pouco mais nosso modelo de decisao. Alem da informacaosobre a probabilidade de cada um dos estados da natureza, ha tambem in-formacao adicional nas reclamacoes dos consumidores. Suponha que estes dadospossam ser divididos em tres categorias: o relogio parou de funcionar completa-mente, o relogio apresenta um comportamento erratico, o relogio funciona porum perıodo depois para. Esta informacao esta disponıvel para cada relogio, as-sim para cada relogio temos uma observacao x apresentando uma das seguintesformas:

• x1: relogio parou completamente;

• x2: relogio apresenta comportamento erratico;

• x3: relogio apenas funciona por um perıodo limitado.

Esta informacao adicional pode dar alguma indicacao sobre o estado da na-tureza. O que temos aqui e uma funcao de verossimilhanca do tipo que ja en-contramos quando discutimos a inferencia bayesiana, temos uma funcao p(x | θ)


que nos dara a probabilidade da reclamacao x dado o estado do sistema θ. Averossimilhanca, em princıpio, seria determinada a partir de nossos registroshistoricos sobre o processo inteiro, da reclamacao a manutencao. Como temosum numero discreto de estados e de tipos de reclamacao, podemos construiruma tabela contendo os valores assumidos pela funcao de verossimilhanca.

p(x | θ) x1 x2 x3

θ1 0, 1 0, 4 0, 5θ2 0, 7 0, 2 0, 1

Poderıamos agora utilizar, ao inves da probabilidade a priori, a observacao diretapara nossa tomada de decisao. Uma regra de decisao e uma funcao δ(x) quedetermina uma acao a ser tomada caso observemos x. O objetivo principal dateoria de decisao e a obtencao de regras de decisao. Na tabela abaixo listamostodas as regras de decisao (ou estrategias) possıveis:

δ1 δ2 δ3 δ4 δ5 δ6 δ7 δ8

x1 a1 a1 a1 a1 a2 a2 a2 a2

x2 a1 a1 a2 a2 a1 a1 a2 a2

x3 a1 a2 a1 a2 a1 a2 a1 a2

10.3 Regras de Decisao

Como poderıamos determinar uma regra de decisao δ(x) otima? Note que senos basearmos apenas na verossimilhanca teremos que x1 da suporte a θ2, quex2 da suporte a θ1 e que x3 da suporte a θ1.,assim deverıamos escolher δ5 =(a2, a1, a1). Note que δ4 parece uma pessima escolha pois provocara custosmaximos em todas as alternativas! Ja δ1 e δ8 simplesmente ignoram os dadose decidem sempre da mesma maneira. Perceba que, embora a verossimilhancaindique que, observado x1, θ2 e mais provavel isto nao implica de forma algumaque devemos decidir como se θ2 ocorresse o tempo todo. Tudo dependera docusto medio considerando cada um dos possıveis estados da natureza θ1 e θ2.Para classificarmos as estrategias possıveis levando em conta este custo mediodefinimos o risco da estrategia:

R(δ, θ) =∑

x

L[δ(x), θ]p(x | θ). (10.1)

O risco expressa o custo medio da regra de decisao δ(x) dado um particularestado da natureza θ que e apoiado pela evidencia fornecida pelo dado x. As-sim podemos calcular a funcao risco de cada uma das estrategias possıveis.Porexemplo:

R(δ5, θ1) = L[a2, θ1]p(x1 | θ1) + L[a1, θ1]p(x2 | θ1) + L[a1, θ1]p(x3 | θ1)

= 5 × 0, 1 + 2 × 0, 4 + 2 × 0, 5

= 2, 3

10.3. REGRAS DE DECISAO 91

0 1 2 3 4 5 60

1

2

3

4

5

6

7

8

9

Ri,1

Ri,2

δ4

δ2

δ8

δ1

δ5 δ

7

δ6

δ3

0,7Ri,1

+0,3Ri,2

=3,29

0,7Ri,1

+0,3Ri,2

=2

Figura 10.1: Riscos das diferentes estrategias.

R(δ, θ) δ1 δ2 δ3 δ4 δ5 δ6 δ7 δ8

θ1 2, 0 3, 5 3, 2 4, 7 2, 3 3, 8 3, 5 5, 0θ2 7, 0 6, 8 6, 6 6, 4 5, 6 5, 4 5, 4 5, 0

Podemos agora comparar as varias estrategias segundo seus riscos em cadaestado da natureza. Em geral nenhuma estrategia vai ser uniformemente menosarriscada nos dois estados (o que seria o ideal). A figura mostra os riscos decada estrategia de forma grafica.

Note que a escolha da melhor estrategia nao e completamente evidente. Aestrategia δ1 e a menos arriscada no estado θ1, ja a estrategia δ8 e a menosarriscada no estado θ2. Uma possibilidade conservadora de escolha e optarpela estrategia cujo maior custo (ou risco) e o menor possıvel. Se olharmospara as estrategias veremos que δ8 e aquela com o menor pior risco (no caso5, 0). Esta forma conservadora de escolha surgiu no contexto da teoria dosjogos e e conhecida como princıpio minimax. A estrategia δ8 cosnsiste emrepor os mecanismos em todas as situacoes, nao importando a dindicacao docliente sobre a natureza do defeito. Melhor do que o excessivamente pessimistaprincıpio minimax e utilizarmos novamente a informacao disponıvel sobre aincidencia de cada tipo de defeito, ou seja, a distribuicao a priori. Dada certadistribuicao a priori podemos calcular o risco medio, tambem conhecido comorisco bayesiano, definido como:

r(δ, π) = R(δ, θ1)π(θ1) + R(δ, θ2)π(θ2). (10.2)

Podemos entao optar por aquela estrategia commenor risco bayesiano. Se uti-lizarmos o a priori π(θ2) = 0, 3 e π(θ1) = 0, 7 mencionado na secao anteriortemos que:

r = 0, 7Ri,1 + 0, 3Ri,2 (10.3)

ira definir uma famılia de retas. O valor do risco crescendo a medida que estasretas se deslocam para a direita. Aquela estrategia que primeiro for cruzada pela


reta sera a regra de decisao de Bayes, ou seja, sera a regra de decisao queminimiza o risco medio dada a distribuicao a priori. No nosso caso esta regrae δ5 que define que devemos tomar nota das reclamacoes dos consumidores elimpar primeiro os relogios, a menos que o consumidor tenha declarado que orelogio parou totalmente.

10.4 Referencias

O livro que utilizamos na composicao deste capıtulo e:

• Barnett, V., Comparative Statistical Inference, John Wiley & Sons, 1973.

Education

Estatistica: introducao a teoria de decisao