Upload
renato-vicente
View
1.295
Download
2
Embed Size (px)
Citation preview
Capıtulo 10
Introducao a Teoria de
Decisao
10.1 Introducao
Na situacao geral de decisao temos varias alternativas bem definidas e procu-ramos pela melhor acao dado o problema que temos em maos. Alem dissoestamos em uma situacao de incerteza e algumas das informacoes importantespara a decisao sao desconhecidas.Dependendo do contexto algumas das decisoestomadas terao mais merito. Este merito pode ser medido quantitativamente erecebe a denominacao de utilidade. Embora o verdadeiro contexto encontradoapos decidida a acao seja desconhecido e possıvel coletar informacao que per-mita enumerar as possibilidades. A teoria de decisao permite combinar estainformacao probabilıstica e emprega-la na escolha do melhor curso de acao.No que segue ilustraremos a teoria de decisao em acao utilizando um exemplosimples.
10.2 Problema de Decisao
Suponhamos que nos sejamos o fabricante de uma linha de relogios de pulsobaratos que e vendida por uma cadeia de lojas de departamento e supermer-cados. Nos nao oferecemos garantias contra defeitos aos clientes. No entanto,como uma forma alternativa de compensacao efetuamos a manutencao de qual-quer relogio apenas uma vez mediante ao pagamento de uma pequena taxa.Ao encontrarem algum defeito os consumidores devem devolver o relogio pa-gando uma pequena quantia e fornecendo uma explicacao do defeito. Nos entaonao realizamos nenhum trabalho de manutencao detalhado, apenas ou repo-mos o mecanismo completo, ou executamos a limpeza ou ambos. O servicode manutencao e oferecido como uma forma de relacoes publicas nao havendointencoes comerciais. Obviamente, e desejavel manter os custos desse servico
87
88 CAPITULO 10. INTRODUCAO A TEORIA DE DECISAO
no patamar mais baixo possıvel, sujeito a avaliacao de quanto desejamos gastarpelas vantagens promocionais proporcionadas pelo esquema.
Para cada relogio precisamos tomar a decisao de reposicao do mecanismoou simples limpeza. Gostarıamos de ser capazes de remediar o problema, sepossıvel, pela alternativa mais barata, a saber, a simples limpeza. Precisamos as-sim determinar uma estrategia de decisao entre as duas alternativas manutencaoou limpeza. Precisamos tambem determinar a taxa que cobraremos pelo servico.Esta situacao pode ser organizada utilizando a teoria de decisao. Considere-mos o que ocorre quando um relogio chega para manutencao. Inicialmente saopossıveis duas acoes denotadas a1 e a2:
• a1: limpe o relogio primeiro;
• a2: reponha o mecanismo imediatamente.
O conjunto de possıveis acoes e denominado o espaco de acoes e denotadoA = a1, a2. Por simplicidade, suponhamos que so ha dois tipos de defeitos:1. poeira entrou no mecanismo; 2. ha um problema mecanico. Estas sao ascircunstancias que sao desconehcidas por nos quando temos que tomar umadecisao. Estas circunstancias podem ser vistas como “estados da natureza”,atribuindo sımbolos:
• θ1: poeira no mecanismo;
• θ2: problema mecanico.
Em analogia ao espaco das acoes introduzimos tambem o espaco dos estadosΩ = θ1, θ2. Equivalentemente, podemos imaginar o espaco dos estados comoum espaco de parametros com o parametro θ apresentando dois valores θ1 e θ2.
Claramente, acoes diferentes levarao a consequencias distintas, dependendodo estado da natureza. Por exemplo, se o mecanismo estiver quebrado (estadoθ2) nao adiantara apenas efetuar a limpeza (acao a1). Suponha que o custoda limpeza seja 2 (a unidade monetaria nao importa) e que a reposicao custe5. Podemos entao construir uma tabela que expresse os custos L(ai, θj) decada acao ai sob cada uma das circunstancias desconhecidas θj . No nosso casoteremos a tabela abaixo.
L(ai, θj) θ1 θ2
a1 2 7a2 5 5
Note que a limpeza (a1) no caso de um relogio com mecanismo quebrado (θ2)tem por consequencia os custos da limpeza (2) e da manutencao (5).
Se soubessemos o estado da natureza para qualquer relogio que chegassea fabrica o problema de decisao seria trivial: se θ1 (relogio sujo) entao a1
(limpeza), se θ2 (mecanismo quebrado) entao a2 (reposicao). No entanto, sosaberemos o estado da natureza apos tomarmos a decisao. O que devemosfazer entao?
10.2. PROBLEMA DE DECISAO 89
Suponha que, embora θ nao seja conhecido para um relogio particular, aexperiencia nos mostra que cerca de 30% deles apresenta problemas mecanicos.Dessa forma, temos uma probabilidade a priori π(θ2) = 0, 3 e, portanto, π(θ1) =0, 7. Esta informacao nos e muito util, pois com ela podemos determinar o customedio de tomarmos sempre a acao a1 ou sempre a acao a2:
〈L(a1, θ)〉θ = 2 × 0, 7 + 7 × 0, 3 = 3, 5
〈L(a2, θ)〉θ = 5 × 0, 7 + 5 × 0, 3 = 5, 0
Assim sendo, no longo prazo seria mais barato executar primeiro a limpeza detodos os relogios que chegassem a fabrica.
Note que a estrategia mudaria se a probabilidade a priori fosse diferente.Por exemplo, se 70% dos relogios recebidos tivessem problemas mecanicos (θ2)terıamos: 〈L(a1, θ)〉θ = 5, 5 e 〈L(a2, θ)〉θ = 5, 0. A estrategia mais barata nolongo prazo seria entao executar a manutencao em todos os relogios que fossemdevolvidos a fabrica.
A informacao que temos sobre os estados da natureza na forma da proba-bilidade a priori π(θ) nos permite escolher uma acao com a garantia de que emmedia minimizaremos o gasto incorrido. E claro que seria muito azar se, por ex-emplo, escolhecemos a acao a2 e um numero enorme de relogios com poerira nomecanismo aparecesse de uma vez. No entanto, devemos lembrar que a teoria dedecisao se aplica em media. Com a tabela de custos acima podemos determinaruma distribuicao a priori neutra, caracterizada por custos iguais seja qual for aacao escolhida. Assim terıamos:
〈L(a1, θ)〉θ = 〈L(a2, θ)〉θ2π(θ1) + 7[1 − π(θ1)] = 5π(θ1) + 5[1 − π(θ1)]
π(θ1) = 0, 4
Se o prior for neutro teremos custos iguais ( 〈L(a1, θ)〉θ = 〈L(a2, θ)〉θ = 5, 0 )nao importando a acao de nossa escolha.
Compliquemos um pouco mais nosso modelo de decisao. Alem da informacaosobre a probabilidade de cada um dos estados da natureza, ha tambem in-formacao adicional nas reclamacoes dos consumidores. Suponha que estes dadospossam ser divididos em tres categorias: o relogio parou de funcionar completa-mente, o relogio apresenta um comportamento erratico, o relogio funciona porum perıodo depois para. Esta informacao esta disponıvel para cada relogio, as-sim para cada relogio temos uma observacao x apresentando uma das seguintesformas:
• x1: relogio parou completamente;
• x2: relogio apresenta comportamento erratico;
• x3: relogio apenas funciona por um perıodo limitado.
Esta informacao adicional pode dar alguma indicacao sobre o estado da na-tureza. O que temos aqui e uma funcao de verossimilhanca do tipo que ja en-contramos quando discutimos a inferencia bayesiana, temos uma funcao p(x | θ)
90 CAPITULO 10. INTRODUCAO A TEORIA DE DECISAO
que nos dara a probabilidade da reclamacao x dado o estado do sistema θ. Averossimilhanca, em princıpio, seria determinada a partir de nossos registroshistoricos sobre o processo inteiro, da reclamacao a manutencao. Como temosum numero discreto de estados e de tipos de reclamacao, podemos construiruma tabela contendo os valores assumidos pela funcao de verossimilhanca.
p(x | θ) x1 x2 x3
θ1 0, 1 0, 4 0, 5θ2 0, 7 0, 2 0, 1
Poderıamos agora utilizar, ao inves da probabilidade a priori, a observacao diretapara nossa tomada de decisao. Uma regra de decisao e uma funcao δ(x) quedetermina uma acao a ser tomada caso observemos x. O objetivo principal dateoria de decisao e a obtencao de regras de decisao. Na tabela abaixo listamostodas as regras de decisao (ou estrategias) possıveis:
δ1 δ2 δ3 δ4 δ5 δ6 δ7 δ8
x1 a1 a1 a1 a1 a2 a2 a2 a2
x2 a1 a1 a2 a2 a1 a1 a2 a2
x3 a1 a2 a1 a2 a1 a2 a1 a2
10.3 Regras de Decisao
Como poderıamos determinar uma regra de decisao δ(x) otima? Note que senos basearmos apenas na verossimilhanca teremos que x1 da suporte a θ2, quex2 da suporte a θ1 e que x3 da suporte a θ1.,assim deverıamos escolher δ5 =(a2, a1, a1). Note que δ4 parece uma pessima escolha pois provocara custosmaximos em todas as alternativas! Ja δ1 e δ8 simplesmente ignoram os dadose decidem sempre da mesma maneira. Perceba que, embora a verossimilhancaindique que, observado x1, θ2 e mais provavel isto nao implica de forma algumaque devemos decidir como se θ2 ocorresse o tempo todo. Tudo dependera docusto medio considerando cada um dos possıveis estados da natureza θ1 e θ2.Para classificarmos as estrategias possıveis levando em conta este custo mediodefinimos o risco da estrategia:
R(δ, θ) =∑
x
L[δ(x), θ]p(x | θ). (10.1)
O risco expressa o custo medio da regra de decisao δ(x) dado um particularestado da natureza θ que e apoiado pela evidencia fornecida pelo dado x. As-sim podemos calcular a funcao risco de cada uma das estrategias possıveis.Porexemplo:
R(δ5, θ1) = L[a2, θ1]p(x1 | θ1) + L[a1, θ1]p(x2 | θ1) + L[a1, θ1]p(x3 | θ1)
= 5 × 0, 1 + 2 × 0, 4 + 2 × 0, 5
= 2, 3
10.3. REGRAS DE DECISAO 91
0 1 2 3 4 5 60
1
2
3
4
5
6
7
8
9
Ri,1
Ri,2
δ4
δ2
δ8
δ1
δ5 δ
7
δ6
δ3
0,7Ri,1
+0,3Ri,2
=3,29
0,7Ri,1
+0,3Ri,2
=2
Figura 10.1: Riscos das diferentes estrategias.
R(δ, θ) δ1 δ2 δ3 δ4 δ5 δ6 δ7 δ8
θ1 2, 0 3, 5 3, 2 4, 7 2, 3 3, 8 3, 5 5, 0θ2 7, 0 6, 8 6, 6 6, 4 5, 6 5, 4 5, 4 5, 0
Podemos agora comparar as varias estrategias segundo seus riscos em cadaestado da natureza. Em geral nenhuma estrategia vai ser uniformemente menosarriscada nos dois estados (o que seria o ideal). A figura mostra os riscos decada estrategia de forma grafica.
Note que a escolha da melhor estrategia nao e completamente evidente. Aestrategia δ1 e a menos arriscada no estado θ1, ja a estrategia δ8 e a menosarriscada no estado θ2. Uma possibilidade conservadora de escolha e optarpela estrategia cujo maior custo (ou risco) e o menor possıvel. Se olharmospara as estrategias veremos que δ8 e aquela com o menor pior risco (no caso5, 0). Esta forma conservadora de escolha surgiu no contexto da teoria dosjogos e e conhecida como princıpio minimax. A estrategia δ8 cosnsiste emrepor os mecanismos em todas as situacoes, nao importando a dindicacao docliente sobre a natureza do defeito. Melhor do que o excessivamente pessimistaprincıpio minimax e utilizarmos novamente a informacao disponıvel sobre aincidencia de cada tipo de defeito, ou seja, a distribuicao a priori. Dada certadistribuicao a priori podemos calcular o risco medio, tambem conhecido comorisco bayesiano, definido como:
r(δ, π) = R(δ, θ1)π(θ1) + R(δ, θ2)π(θ2). (10.2)
Podemos entao optar por aquela estrategia commenor risco bayesiano. Se uti-lizarmos o a priori π(θ2) = 0, 3 e π(θ1) = 0, 7 mencionado na secao anteriortemos que:
r = 0, 7Ri,1 + 0, 3Ri,2 (10.3)
ira definir uma famılia de retas. O valor do risco crescendo a medida que estasretas se deslocam para a direita. Aquela estrategia que primeiro for cruzada pela
92 CAPITULO 10. INTRODUCAO A TEORIA DE DECISAO
reta sera a regra de decisao de Bayes, ou seja, sera a regra de decisao queminimiza o risco medio dada a distribuicao a priori. No nosso caso esta regrae δ5 que define que devemos tomar nota das reclamacoes dos consumidores elimpar primeiro os relogios, a menos que o consumidor tenha declarado que orelogio parou totalmente.
10.4 Referencias
O livro que utilizamos na composicao deste capıtulo e:
• Barnett, V., Comparative Statistical Inference, John Wiley & Sons, 1973.