IA - Aula 04 - Agentes parte 2

Preview:

Citation preview

Inteligência ArtificialAula 04 – Agentes, parte 2

Prof. Andrei de A. Formiga

Construindo Agentes Racionais

Já sabemos o que significa ser racional Medidas de desempenho Conhecimento do ambiente Percepção Ações

Sabemos (em princípio) como projetar um agente Preencher a tabela da função do agente

O que é um Agente Racional?

Para cada seqüência perceptiva possível, um agente racional deve selecionar uma ação cujo resultado esperado é maximizar sua medida de desempenho, dada a evidência fornecida pela seqüência perceptiva e pelo conhecimento prévio do agente sobre seu ambiente.

Construindo Agentes Racionais

Construir um agente que chega ao melhor resultado

= Preencher a tabela da função do agente para

atingir a melhor medida de desempenho

Método prático para criar agentes? Qual a dificuldade de criar um agente?

Dificuldade das Tarefas

Existem agentes mais ”difíceis” que outros?

Por exemplo: Mundo do aspirador Motorista de taxi Cálculo de troco Jogador de futebol Jogador de xadrez

Dificuldade das Tarefas

Tarefas não são criadas iguais

Como caracterizar os problemas?

Como antecipar dificuldades?

O Ambiente da Tarefa

Agrupa informações sobre o problema Quatro componentes:

Medidas de desempenho Ambiente Percepção Ações

Descrição PEAS

PEAS

Performance Measure

Environment

Actuators

Sensors

Exemplo: Motorista de Taxi

Desempenho? Chegar no destino Minimizar consumo Minimizar desgaste do carro Minimizar tempo de viagem Minimizar infrações Maximizar conforto Maximizar lucro

Exemplo: Motorista de Taxi

Ambiente? Ruas, avenidas, estradas Tráfego, pedestres, carros Animais, obras, policiais Poças, buracos Passageiros Outros: neve, chuva, vento...

Exemplo: Motorista de Taxi

Atuadores Acelerador Freios Direção Comunicação com o passageiro Comunicação com outros veículos

Exemplo: Motorista de Taxi

Sensores Visão (câmeras) Velocímetro Odômetro Outros

Acelerômetro Sensores do sistema GPS

PEAS do Motorista de Taxi

Tipo do Agente Medidas deDesempenho

Ambiente Atuadores Sensores

Motorista de Taxi Viagens seguras,rápidas, corretas,confortáveis;maximizar lucros.

Ruas, avenidas,estradas, outroscarros, pedestres,passageiros.

Direção,acelerador, freio,buzina, tela. 

Câmeras, sonar,velocímetro,odômetro, GPS,acelerômetro,sensores demotor, teclado. 

Outros Exemplos

Tipo do Agente Medidas deDesempenho

Ambiente Atuadores Sensores

Sistema deDiagnóstico Médico

Paciente saudável;minimizar custos eprocessos. 

Paciente, hospital,equipe.

Perguntas, exames,diagnósticos,tratamentos.

Sintomas, históricomédico, respostas. 

Analisador deImagens de Satélite

Categorização corretade imagens

Conexão com satélite. Apresentarcategorização.

Arrays de pixels(imagens). 

Robô de linha deprodução

Porcentagem de peçascolocadascorretamente.

Esteira com peças;receptáculos. 

Braço e mãomecânicos. 

Câmera, sensores dobraço e mão. 

Controlador derefinaria

Maximizar pureza,saída, segurança.

Refinaria, operadores. Válvulas, tubos,aquecedores, displays.

Temperatura, pressão,sensores químicos.

Tutor interativo deportuguês

Maximizar notas doaluno. 

Conjunto de alunos,instituição de ensino. 

Exercícios, sugestões,correções.

Teclado. 

Ambientes Artificiais e Reais

Ambientes reais podem ser simples Inspeção de peças em uma esteira

Ambientes artificiais podem ser complexos Piloto para simulador de vôo Detecção de fraudes na internet

Propriedades dos Problemas

Totalmente x Parcialmente observável Determinístico x Estocástico Episódico x Sequencial Estático x Dinâmico Discreto x Contínuo Agente único x Multi-agentes

Observabilidade

Totalmente observável: sensores do agente reportam todas as informações sobre o estado do ambiente Como definir ”todas”? Relevância ⇒ Desempenho

Parcialmente observável: nem todas as informações do estado estão disponíveis Sensores imprecisos; falta informação

Determinístico x Estocástico

Determinístico: o próximo estado do ambiente é completamente determinado pelo estado atual e a ação do agente Determinismo + observabilidade total: previsível

Estocástico: Incerteza sobre o estado futuro do ambiente, mesmo tendo informações atuais Observabilidade parcial e não-determinismo Estratégico: Determinístico, exceto pelas ações de

outros agentes

Episódico x Sequencial

Episódico: Tarefa se repete em episódios independentes Desnecessário manter memória entre episódios Sem distinção curto x longo prazo Ex.: Classificação

Sequencial: Tarefa se desenrola em episódios não independentes Ações podem ter consequências de longo prazo

Estático x Dinâmico

Dinâmico: Ambiente pode mudar enquanto agente ”pensa” Não decidir é o mesmo que fazer nada

Estático: Ambiente só muda após alguma ação Tempo é praticamente irrelevante

Semi-dinâmico: Ambiente estático, mas desempenho pode piorar com o tempo

Discreto x Contínuo

Aplicada a Estado Tempo Ações Perceptos

Quantidades contínuas x discretas

Agente único x Multi-agentes

Agente único: apenas um agente atuando no ambiente

Multi-agentes: vários agentes atuando Quando considerar uma entidade como agente? Dependência de desempenho Ambientes competitivos x cooperativos

Exemplos

Ambiente Observ. Detem. Episódico Estático Discreto Agentes

Palavras cruzadas Total Determ. Seq. Est. Disc. Único

Xadrez c/ relógio Total Estrat. Seq. Semi Disc. Multi

Poker Parcial Estrat. Seq. Est. Disc. Multi

Gamão Total Estoc. Seq. Est. Disc. Multi

Motorista de Táxi Parcial Estoc. Seq. Dinâmico Cont. Multi

Diagnóstico médico Parcial Estoc. Seq. Dinâmico Cont. Único

Análise de imagens Total Determ. Epis. Semi Cont. Único

Robô de montagem Parcial Estoc. Epis. Dinâmico Cont. Único

Controlador refinaria Parcial Estoc. Seq. Dinâmico Cont. Único

Tutor de português Parcial Estoc. Seq. Dinâmico Disc. Multi

Classificação de Problemas

Combinação mais difícil: Parcialmente observável Estocástico Sequencial Dinâmico Contínuo Multi-agentes

Classificação de Problemas

Nem sempre simples ou precisa Classificação de imagens: semi-estática? Xadrez: Totalmente observável? Diagnóstico médico: agente único? episódico? Torneio de xadrez: episódico x sequencial