COMPORTAMENTO VERBALMENTE CONTROLADO E AUTOCONTROLE: UMA ANÁLISE DO EFEITO DE RESPOSTAS VERBAIS ACOMPANHADAS POR ESTÍMULOS COM FUNÇÃO AVERSIVA OU POSITIVA SOBRE O COMPORTAMENTO

1

PONTIFÍCIA UNIVERSIDADE CATÓLICA DE SÃO PAULO (PUC-SP)

SECRETARIA DE CIÊNCIAS HUMANAS E DA SAÚDE

DEPARTAMENTO DE PSICOLOGIA

COMPORTAMENTO VERBALMENTE CONTROLADO E AUTOCONTROLE: UMA

ANÁLISE DO EFEITO DE RESPOSTAS VERBAIS ACOMPANHADAS POR

ESTÍMULOS COM FUNÇÃO AVERSIVA OU POSITIVA SOBRE O

COMPORTAMENTO DE ESCOLHA. SUB PROJETO 1

BOLSISTA: LUNA PEREIRA GIMENEZ

ORIENTADORA: PAOLA E. DE M. ALMEIDA

SÃO PAULO

2

AGOSTO – 2014

PONTIFÍCIA UNIVERSIDADE CATÓLICA DE SÃO PAULO (PUC-SP)

SECRETARIA DE CIÊNCIAS HUMANAS E DA SAÚDE

DEPARTAMENTO DE PSICOLOGIA



ESTÍMULOS COM FUNÇÃO AVERSIVA OU POSITIVA SOBRE O


BOLSISTA: LUNA PEREIRA GIMENEZ

ORIENTADORA: PAOLA E. DE M. ALMEIDA

3

SÃO PAULO

AGOSTO – 2014



ESTÍMULOS COM FUNÇÃO AVERSIVA OU DISCRIMINATIVA SOBRE O


Relatório Final de Pesquisa

Programa Institucional de Bolsas Iniciação Científica

Vigência agosto/2013 a julho/2014

PIBIC/CEPE

4

SÃO PAULO

AGOSTO - 2014

Sumário

INTRODUÇÃO.....................................................5

MÉTODO........................................................11Fase 1- Instalação de um padrão de preferência por reforçadores menores e mais prováveis, em uma situação de escolha concorrente.........................................12

Fase 2 – Estabelecimento do valor aversivo e positivo para dois estímulos via condicionamento respondente..............14

Fase 3 – Apresentação de descrições verbais acompanhadas por estímulos com função aversiva ou positiva...................15

RESULTADOS E DISCUSSÃO........................................161) ESTABELECIMENTO DO PADRÃO DE PREFERÊNCIA ENTRE O REFORÇADOR MENOR EMAIS PROVÁVEL, E O REFORÇADOR MAIOR MENOS PROVÁVEL:...............162) ESTABELECIMENTO DO VALOR AVERSIVO E POSITIVO PARA VEG E VOJ VIA CONDICIONAMENTO.............................................223) EFEITOS PRODUZIDOS PELA APRESENTAÇÃO DAS DIFERENTES DESCRIÇÕES VERBAIS (VEG E VOJ) NA REVERSÃO OU NÃO DO PADRÃO DE PREFERÊNCIA:......27

CONCLUSÃO.....................................................39

REFERÊNCIAS BIBLIOGRÁFICAS:...................................44

5

RESUMO

O presente trabalho pretendeu avaliar o efeito de descrições

verbais com função aversiva ou positiva sobre o comportamento de

escolha de três participantes adultos em uma tarefa de

computador. Para tanto, um delineamento de escolhas concorrentes

foi planejado, sendo observado o padrão de preferência de cada

participante entre as alternativas de reforçamento menor e mais

provável ou maior e menos provável, durante uma atividade no

computador. Estabelecida a preferência dos participantes, dois

estímulos (pseudopalavras “VEG e VOJ”) foram apresentados

durante condições de perda ou ganhos de reforços, em uma tarefa

em que os os participantes foram convidados a montar um quebra-

cabeça, a partir de respostas de pressão às teclas do

computador. Na presença do estímulo VEG, respostas a uma das

teclas levava ao aparecimento das imagens do quebra-cabeça no

centro da tela, e ao acréscimo de pontos em um contador

localizado acima da imagem. Na presença do estímulo VOJ,

6

respostas de pressão levava à perda de pontos e de peças. Cada

condição de apresentação dos dois estímulos aconteceu por dez

vezes, de forma randômica por 10 segundos cada. Após a quinta

tentativa de apresentação, uma mensagem aparecia na tela,

avisando ao participante que, caso quisessem, poderiam apertar a

barra de espaços, para mudar de tela, encerrando a tentativa.

Após isto as diferentes descrições verbais VEG e VOJ foram

apresentadas antes de cada escolha, assim como na Fase 1, o que

permitiu avaliar seu efeito sobre a reversão (ou não) do padrão

de preferência antes estabelecido. Os resultados encontrados

parecem indicar que o valor positivo ou aversivo do estímulo

verbal não foi suficiente para que os participantes seguissem a

instrução. Para os três participantes as pseudopalavras

pareceram exercer controle sobre o responder nas primeiras

tentativas de escolha da Fase 3 (que verificaria o controle dos

estímulos verbais), mas nas próximas tentativas, ao longo das

subfases, o responder deste dois participantes voltou a ficar

sob controle das contingências e da maneira de responder

anteriormente estabelecida na Fase 1. Assim, os resultados

demonstram que os participantes parecem estar sobre controle da

magnitude do reforçador (escolha pelo reforçador maior e menos

provável), ou da probabilidade do ganho dos pontos (reforçador

menor e mais provável), de acordo com os padrões de preferência

estabelecidos anteriormente.

Palavras chave: autocontrole, descrições verbais.

7

INTRODUÇÃO

O presente trabalho pretendeu avaliar o efeito de

descrições verbais com função aversiva ou positiva sobre o

comportamento de escolha de três participantes adultos.

Durante o experimento foi avaliada a preferência dos

participantes entre alternativas do reforço menor e mais

provável e maior e menos provável, tendo sido planejados

ajustes que favoreceriam a escolha menor e mais provável,

tradicionalmente nomeada como uma escolha impulsiva.

O estudo aqui proposto foi elaborado inicialmente a

partir do referencial teórico skinneriano acerca do

autocontrole, brevemente retomado a seguir.

Para Skinner (1953), um homem se controla precisamente

como controlaria o comportamento de qualquer outro através

da manipulação de variáveis das quais o comportamento é

função. Ou seja, seu comportamento é um objeto próprio de

análise e as variáveis que o individuo utiliza na

manipulação de seu comportamento nem sempre são acessíveis

aos outros. Assim, o comportamento de autocontrole é aquele

capaz de alterar a probabilidade de ocorrência de uma

resposta com consequências conflitantes.

O motivo pelo qual um indivíduo vem a controlar parte

de seu próprio comportamento é determinando pelas

consequências conflitantes produzidas por uma resposta, ou

seja, quando uma mesma resposta leva tanto a reforço

positivo ou negativo, como pode levar a punição, definida

8

pela retirada de reforçadores positivos ou apresentação de

estímulos aversivos.

De acordo com Skinner (1974/2006), para que um

determinado estímulo seja considerado aversivo, é

necessário que sua remoção tenha características

reforçadoras. Os estímulos aversivos eliciam no organismo

várias reações fisiológicas que podem ser sentidas ou

introspectivamente observadas, e que podem ser bastante

perturbadoras e incluem predisposição para fugir. Nos casos

em que uma resposta que vem sendo reforçada for seguida

também pela apresentação de um aversivo, as emoções

eliciadas pelo estímulo aversivo tornam incompatível a

manutenção da resposta que produziria a consequência

reforçadora, suprimindo-a temporariamente.

Assim, o primeiro efeito da punição consiste na

eliciação de comportamentos incompatíveis com a resposta

que está sendo punida, sendo este primeiro efeito imediato,

ou seja, acaba por impedir a ocorrência da resposta naquele

exato momento. O segundo efeito pode ser observado no

futuro, mesmo que a resposta não esteja sendo punida

diretamente naquele momento. Neste caso, ocorre de os

estímulos aversivos condicionados na ocasião passada de

punição estarem agora controlando a resposta. Isso porque,

quando um comportamento é punido, qualquer estimulo que

estivesse presente na ocasião da punição, torna-se um

aversivo condicionado, dado o pareamento direto com a

punição. Desta forma, a tendência ao comportamento punido

ou outros estímulos do ambiente que também podem ter sido

9

pareados com a punição no passado passam também a evocar

aqueles estados incompatíveis com a resposta punida. Um

terceiro efeito da punição consiste em que, qualquer

comportamento que reduza o contato com os estímulos

aversivos condicionados será reforçado. Assim, o terceiro

efeito é o estabelecimento de condições aversivas que serão

evitadas por comportamentos de “fazer alguma outra coisa”

(Skinner, 1953).

Dessa forma, o conceito de punição é importante para a

compreensão do autocontrole. Isso ocorre seja pela

eliciação de respostas incompatíveis com a resposta

anteriormente punida, seja pelo efeito enfraquecedor dos

estímulos aversivos condicionados e das respostas

emocionais, que provém de uma história punitiva anterior,

ou porque os mesmos estímulos adquirem função de

reforçadores negativos, por aumentarem a probabilidade de

uma resposta de fuga, levando à redução da condição

aversiva. Portanto, o comportamento de autocontrole ocorre

para evitar as sensações desagradáveis que são eliciadas

quando uma resposta cuja classe de respostas tem um

histórico de punição quando emitidas.

Por exemplo, um sujeito que acorda tarde, porém sempre

que isso acontece e chega atrasado ao trabalho é

repreendido por seu chefe e tem o horário de descanso

reduzido. Quando este sujeito acorda cedo e tem vontade de

dormir mais, ele está diante de um conflito, pois o

comportamento de dormir mais pode gerar reforçadores

(positivos ou negativos), bem como gerar a apresentação de

10

uma punição futura (positiva ou negativa). Desta forma, a

punição estará relacionada com o comportamento de

autocontrole no caso do sujeito fazer alguma outra coisa

que não seja dormir, por exemplo, emitir uma regra para si

próprio como: “Levante-se!”. Ele seguiria esta regra, pois

quando estiver diante da escolha com uma possibilidade de

continuar dormindo, estímulos aversivos condicionados são

eliciados, causando um desconforto incompatível com a ação

de continuar dormindo. Assim, o fazer alguma outra coisa

seria uma resposta de fuga aos estímulos aversivos

condicionados.

Neste caso, a declaração de uma resposta verbal pode

controlar a probabilidade de uma segunda resposta, se esta

adquire uma função aversiva por pareamento com punição pelo

comportamento de desobedecer à instrução. Porém, este

pareamento precisa ser mantido para que seu valor aversivo

não se perca, perdendo também a função de resposta

controladora.

Tendo em vista a emissão desta resposta controladora

de instrução verbal, o individuo emite um dos

comportamentos que podemos chamar de autocontrole. As

variáveis utilizadas pelo sujeito, tais como a apresentação

da estimulação verbal nem sempre são acessíveis e visíveis

para os outros. Outras variáveis podem também ser

manipuladas com objetivo de aumentar a probabilidade da

emissão das respostas que compitam com a resposta que se

deseja controlar, como também para reduzir o valor

11

reforçador das consequências destas respostas, diminuindo

assim, sua probabilidade de emissão.

Sobre estas variáveis controladoras, o estudo de

Mallot e Braam (1990) teve como objetivo, investigar se

descrições verbais controlariam diferencialmente as

respostas não verbais, a depender das contingências. Foram

selecionadas cinco crianças que apresentavam alta

porcentagem de colaboração com os pedidos da professora em

completar tarefas de higiene. As regras apresentadas pelo

experimentador solicitavam que a criança emitisse um

determinado comportamento, como por exemplo, recolher os

brinquedos. Foram apresentadas quatro condições, cada uma

com um tipo diferente de regra apresentada. Foi avaliado o

controle exercido pelas diferentes condições (“pedidos”,

“reforçamento”, “sem apresentação de prazo + reforço

atrasado” e “apresentação de prazo + reforço atrasado”), a

partir da subordinação das crianças às solicitações

apresentadas em cada uma dessas quatro condições.

A hipótese dos autores é de que a descrição dos prazos

potencializaria os efeitos aversivos gerados pela

apresentação da regra, favorecendo a emissão de

comportamentos de acordo com a regra. Para os autores, os

resultados mostram que o controle por regras que descrevam

contingências diretas teria sido estabelecido antes do

estudo, pela história de seguimento de regras de cada

participante. Para os autores os dados do estudo parecem

indicar que as respostas dos participantes estavam sob

controle estrito das condições de reforçamento descritas, e

12

não do controle generalizado das regras, estabelecido

previamente. Porém, a declaração de prazos para finalizar a

tarefa pareceu aumentar o controle das regras que

anunciavam consequências atrasadas.

Foi possível tirar duas conclusões deste estudo. A

descrição de reforços atrasados ou ausência de reforço

parece ter enfraquecido o controle pela regra, e, a

inclusão de prazos (resposta verbal) parece maximizar o

controle da regra que descreve contingências indiretas

envolvendo atraso de reforço. Isto ocorre porque a inclusão

de prazos pode ser entendida como a manipulação de

respostas autoclíticas de mando, alterando a reação do

ouvinte diante das solicitações.

O estudo de Almeida e Hubner (2009) pretende

contribuir com a discussão sobre as condições que afetam a

probabilidade de controle verbal sobre o comportamento não

verbal, investigando se a inclusão de operantes

autoclíticos poderia favorecer este controle.

Para tanto, as autoras analisaram o efeito de

operantes verbais autoclíticos sobre o comportamento de

escolha, avaliando uma possível reversão do padrão de

preferência dos participantes (receber reforço maior a

longo prazo ou reforço menor a curto prazo), diante de/após

apresentação de diferentes declarações verbais. As opções

de escolha para os participantes eram concorrentes, sendo

primeiro observado o padrão de escolha dos participantes e,

então, introduzidas as descrições verbais específicas.

13

Durante esta fase foi também avaliado se a emissão de

autoclíticos alterava o controle pela descrição, que

qualificava como “pior”, por exemplo, a preferência do

participante estabelecida no inicio do experimento. Os

resultados apontam que neste estudo a presença de

autocliticos acompanhando as descrições verbais não foram

suficientes para a reversão do padrão de preferência dos

participantes. No entanto, foi observado o aumento no tempo

para emissão da resposta diante de descrições acompanhadas

por operantes verbas autoclíticos.

Algumas hipóteses foram levantadas para interpretar os

resultados deste estudo, como por exemplo, o histórico de

reforçamento anterior para o comportamento de seguir regras

dos participantes, de forma que, notou-se uma importância

em estabelecer previamente uma função aversiva ou

reforçadora para os autocliticos, pois as qualidades “pior”

e “melhor” podem controlar de maneira diferente as

respostas, dada as diferentes histórias que estabeleceram

seu valor positivo ou negativo para casa participante.

Com relação ao presente trabalho, o estabelecimento

prévio do valor aversivo e postivo de determinados

estímulos foi garantido durante uma das fases

experimentais, de maneira que pudemos assim, ter controle

sobre essa variável, isolando os efeitos da história prévia

dos participantes com as palavras que qualificavam as

escolhas.

14

Desta forma, o presente estudo foi baseado no estudo

de Almeida e Hubner (2009), no sentido de que diferentes

descrições verbais também foram manipuladas a fim de

avaliar a reversão ou não da preferência sobre a quantidade

e probabilidade do reforço por parte dos participantes, ou

seja, se os participantes passam a preferir uma

probabilidade menor para a obtenção de um maior numero de

pontos. Porém, foi feita a mudança com relação aos

parâmetros dos reforçadores planejados, pois na tese das

autoras, estes eram controlados pelo tempo (atrasado ou

imediato) e no presente estudo, será a probabilidade (mais

ou menos provável) bem como a magnitude (mais pontos ou

menos pontos) que irão compor as combinações presentes nas

diferentes escolhas.

A alteração planejada levou em consideração o estudo

de Matos (2013), que teve como objetivo avaliar o efeito da

manipulação dos parâmetros de atraso e probabilidade do

reforço sobre as escolhas em esquemas concorrentes simples

e encadeados e se esses efeitos sugiririam semelhanças

entre esses dois parâmetros.

Matos (2013) avaliou também os efeitos de diferentes

esquemas de reforçamento sobre as escolhas de três

participantes que eram feitas em esquemas concorrentes

simples, sendo uma alternativa composta por reforço maior e

menos provável e a outra por reforço menor e mais provável.

Nas condições de seleção, os três participantes preferiram

o reforçador com menor magnitude e maior probabilidade

inicialmente. Durante o esquema FR/FR do experimento, foi

15

estabelecido o padrão de resposta sob controle do reforço

maior e menos provável (considerado comportamento de

autocontrole), porém, nas condições SigFR (a diferença

entre FR para SigFR é que após a penúltima resposta de

clicar sobre um dos quadrados, eles eram desativados por um

segundo, e a tela ficava escura durante este período e os

cliques não tinham quaisquer efeitos) e FI, a escolha maior

entre os participante foi no componente menos e mais

provável (comportamento impulsivo).

Assim, com base neste estudo de Matos, foi decidido

utilizar o esquema FI/FI em nosso experimento, a fim de

garantir a preferencia pelo reforçador menor e mais

provável na fase inicial do experimento, ou seja, favorecer

o padrão nomeado como impulsivo de responder, e observar

uma possível reversão para o padrão de comportamento de

autocontrole.

SUBPROJETO 1: COMPORTAMENTO VERBALMENTE CONTROLADO E

AUTOCONTROLE: UMA ANÁLISE DO EFEITO DE RESPOSTAS VERBAIS

ACOMPANHADAS POR ESTÍMULOS COM FUNÇÃO AVERSIVA OU

DISCRIMINATIVA SOBRE O COMPORTAMENTO DE ESCOLHA.

MÉTODO

16

Participantes

Participaram do estudo três adultos, selecionados

entre estudantes de uma universidade privada da cidade de

São Paulo. Os participantes foram considerados leitores

fluentes, com conhecimento prévio no uso de computador. Os

participantes assinaram um termo de consentimento livre e

esclarecido, que identificava os objetivos da pesquisa e

garantiam a possibilidade de desistência a qualquer momento

do estudo.

Ao final da pesquisa, os participantes receberam um

brinde por sua participação, sendo o valor determinado pelo

total de pontos obtidos por seu desempenho no jogo de

computador.

Material e local de coleta:

Foi utilizado um computador notebook, equipado com

programa especialmente delineado para o estudo (Woeltz,

2014) com possibilidade de apresentar instruções escritas,

dispor arranjos de estímulos, e registrar o desempenho dos

participantes. Quatro adesivos de cores diferentes

(vermelho, verde, azul e laranja) foram colados às teclas

do computador, indicando aos participantes quais as teclas

deveriam ser acionadas durante o jogo.

Sala com mesa e cadeira, para o participante realizar

a tarefa e termo de consentimento livre e esclarecido.

17

Procedimento:

O procedimento de coleta de dados foi dividido em três

fases principais, com suas respectivas sub-fases:

Fase 1- Instalação de um padrão de preferência por

reforçadores menores e mais prováveis, em uma situação de

escolha concorrente.

O objetivo desta fase foi estabelecer a preferência do

participante pela alternativa de reforço menor e mais

provável, disponível em uma tarefa de escolha entre o

reforço menor e mais provável ou maior e menos provável em

esquema de FI/FI, sendo utilizado o FI de 2 segundos.

Instruções acerca das contingências programadas para as

diferentes respostas de escolha foram apresentadas aos

participantes via computador.

Durante a atividade, dois quadrados de diferentes

cores foram dispostos à esquerda e à direita da tela do

computador. Entre eles, a mensagem “Escolha entre vermelho

(laranja) ou verde (azul)” foi apresentada, sendo

considerada como resposta de escolha a pressão da tecla de

cor respectiva no teclado do computador. Na Subfase 1.1,

quadrados de cor vermelha e verde surgiram na tela, e

respostas de pressão à tecla de cor vermelha foram seguidas

pela apresentação de reforço menor e mais provável com 95%

de probabilidade de acesso ao reforçador (2 pontos) ; e

respostas na tecla verde foram seguidas pela apresentação

18

de reforço maior e menos provável com 28% de probabilidade

de acesso ao reforçador (8 pontos). Na subfase 1.2, a única

modificação planejada foi nas cores dos quadrados e teclas,

que passaram a ser de cor laranja (reforçador menor e mais

provável) e azul (reforçador maior e menos provável). A

mudança de cores nas duas condições foi planejada a fim de

garantir que as respostas motoras permanecessem sob

controle dos estímulos visuais, aumentando a probabilidade

do participante atentar para instruções e demais mudanças

na tela, previstas nas condições posteriores.

Em cada uma das Subfases 1 e 2, a tarefa foi iniciada

com oito tentativas de escolha-forçada. Nestas tentativas,

a tela do computador apresentava os dois quadrados de

diferentes cores e a mensagem de escolha, mas apenas uma

das teclas do teclado estava em funcionamento. O objetivo

desta manipulação foi garantir que o participante tinha

contato com as contingências programadas nas duas teclas,

antes do início das tentativas de escolhas-livres. Após o

encerramento das tentativas de escolha-forçada, os

contadores eram zerados e a tela escurecida. Uma pressão

na barra de espaço indicava que o participante estava

pronto para iniciar as tentativas de escolha-livre. A

partir de então, a escolha por uma das teclas do par em

funcionamento foi seguida pela soma de pontos no contador

de cor respectiva, que apresentava o total de pontos

obtidos na sessão. Após a emissão da resposta de escolha,

os dígitos foram apresentados na parte de cima dos

contadores, acompanhados por um bip. Os dígitos

19

sobrepuseram-se uns aos outros, em intervalos de 500ms,

ficando coloridos e visíveis ao participante por 2s, antes

de serem somados ao total obtido nas tentativas anteriores.

O intervalo entre tentativas foi de 2s, independente da

escolha anterior.

Para o encerramento das fases, um critério de

preferencia foi estipulado a partir da escolha por uma das

alternativas de reforço em 75% das oportunidades

apresentadas, em um bloco de 20 tentativas. O máximo de

quatro blocos foi previsto para que o participante alcance

o critério de preferência, e as fases encerradas. Caso o

índice de preferencia não tivesse sido atingido após dois

blocos, um ajuste no esquema do reforço foi programado ao

início do terceiro bloco a fim de favorecer a direção da

escolha por reforçadores menores e mais prováveis. Assim,

um ajuste nos parâmetros do reforço foi programado ao

início do terceiro bloco, a fim de favorecer a escolha na

direção do reforço menor e mais provável. O reajuste

implicava em: o participante passar a receber 3 pontos (ao

invés de 2) a cada escolha/pressão na tecla correspondente

ao reforço menor e mais provável, mantendo-se a

probabilidade de 95% de chance de acesso ao reforçador. Ao

mesmo tempo, continuaria recebendo 8 pontos caso opte pela

escolha do reforçador maior e menos provável. No entanto,

passará a ter a 20% de probabilidade (não mais 28%) de

acesso ao reforçador.

Caso o critério não fosse atingido após o total de

quatro blocos, o participante seria desligado do estudo,

20

não prosseguindo para as fases posteriores. Quando

necessário o ajuste, os parâmetros definidos na Fase 1.1

foram mantidos na Fase 1.2, desde o início do primeiro

bloco.

Ao final de cada Subfase, o participante chamava o

pesquisador, que conferia os pontos obtidos. O

participante, então, recebe um recibo e era convidado a

participar das próximas Fases do estudo.

Fase 2 – Estabelecimento do valor aversivo e positivo para

dois estímulos via condicionamento respondente.

Nesta fase, dois estímulos compostos por

pseudopalavras “VEG e VOJ” foram apresentados durante

condições de perda ou ganhos de reforços, em uma tarefa de

computador.

Os participantes foram convidados a montar um quebra-

cabeça, a partir de respostas de pressão às teclas do

computador.

Na presença do estímulo VEG, respostas a uma das

teclas levava ao aparecimento das imagens do quebra-cabeça

no centro da tela, e ao acréscimo de pontos em um contador

localizado acima da imagem. Na presença do estímulo VOJ,

respostas de pressão leva a perda de pontos e de 3 peças do

quebra cabeça. Cada condição de apresentação dos dois

estímulos ocorreu por dez vezes, de forma randômica por 10

segundos cada.

21

Após a quinta tentativa de apresentação de casa uma

das condições de est[imulo, uma mensagem aparecia na tela,

avisando ao participante que, caso quisesse, poderia

apertar a barra de espaços, para mudar de tela, encerrando

a tentativa. O objetivo de tal manipulação foi avaliar se a

pseudopalavra VOJ poderia ser um estímulo que tivesse

adquirido função aversiva, já que uma resposta de

fuga/esquiva seria provável nesta condição. O mesmo não

seria esperado no caso de VEG, o que levaria o participante

a não emitir respostas de fuga/esquiva diante de sua

apresentação.

Fase 3 – Apresentação de descrições verbais acompanhadas

por estímulos com função aversiva ou positiva.

Nesta fase, os participantes foram submetidos às

mesmas contingências de escolhas concorrentes descritas na

Fase 1. No entanto, diferentes descrições verbais foram

apresentadas antes de cada escolha, o que permitiu avaliar

seu efeito sobre a reversão (ou não) do padrão de

preferência antes estabelecido.

Para todos os participantes, nas dez tentativas

iniciais desta fase não houve apresentação de qualquer tipo

de descrição acerca das respostas de escolha. Tal

manipulação pretendeu avaliar a estabilidade do padrão de

preferência estabelecido na Fase 1, o que permitiu

esclarecer se possíveis mudanças neste padrão seriam, de

fato, decorrentes da introdução das diferentes descrições.

A partir de então, vinte novas tentativas foram

22

sequencialmente apresentadas, sendo antecedidas por uma

descrição acompanhada por um estímulo VEG ou VOJ,

relacionadas com condições de reforçamento positivo ou

punição durante a Fase 2, o que teria permitido a aquisição

de uma função positiva ou aversiva os estímulos, via

condicionamento respondente. As descrições acompanhadas

pelas pseudopalavras VEG e VOJ foram, assim, posicionadas

acima de um dos quadrados coloridos dispostos na tela do

computador, de forma para o participante que inicialmente

demonstrou preferencia pela escolha de reforçamento menor e

mais provável, a seguinte descrição verbal aparecia sobre o

quadrado de escolha por reforçamento maior e menos provável

“Escolher aqui é...VEG (estímulo que teria adquirido valor

eliciador positivo e de provável estímulo discriminativo a

partir da história de condicionamento na fase anterior). De

forma contrária, a seguinte descrição verbal aparecia sobre

a quadrado respectivo à preferência inicial estabelecida “

Escolher aqui é... VOJ” (estímulo que teria adquirido valor

aversivo a partir da história de condicionamento na fase

anterior).

Todas as condições descritas foram apresentadas em uma

única sessão. Terminada a sessão, os participantes foram

avisados pelo computador do encerramento do estudo,

recebendo do pesquisador o recibo do brinde a ser recebido

após a sessão.

23

RESULTADOS E DISCUSSÃO

Os resultados agora apresentados serão discutidos de

acordo com os seguintes aspectos: estabelecimento do padrão

de preferência dos participantes entre as alternativas de

reforçamento menor e mais provável ou reforçamento maior e

menos provável; aquisição de diferentes funções (aversiva e

positiva) na apresentação de estímulos verbais (VEJ e VOJ);

e os efeitos produzidos pela apresentação das diferentes

descrições verbais acompanhadas por estas pseudopalavras na

reversão ou não do padrão de preferência inicial.

1) ESTABELECIMENTO DO PADRÃO DE PREFERÊNCIA ENTRE O REFORÇADOR

MENOR E MAIS PROVÁVEL, E O REFORÇADOR MAIOR MENOS PROVÁVEL:

O objetivo desta fase foi estabelecer a preferência do

participante pela alternativa de reforço menor e mais

provável, disponível em uma tarefa de escolha entre o

reforço menor e mais provável ou maior e menos provável.

Os resultados encontrados revelam que, os três

participantes alcançaram o critério de estabilidade

definido para caracterizar a preferência pela escolha do

reforçador menor e mais provável na Fase 1, ou seja,

atingiram o índice de 75% de escolhas por esta alternativa

de reforço a longo das tentativas disponíveis na Fase 1.

Os gráficos abaixo representam o desempenho dos

participantes ao longo da Fase 1 e correspondem às

respostas emitidas nos diferentes blocos de 20 tentativas

cada. A área cinza do gráfico indica as respostas de

escolha do participante pelo reforçador menor e mais

24

provável. Os triângulos indicam as respostas emitidas que

obtiveram pontos como consequência, dadas as diferentes

probabilidades de obtenção de reforço programadas pelo

experimentador.

Para P1, das 20 tentativas de escolha disponíveis no

primeiro bloco, como demonstrado na Figura 1, 100% delas

ocorreram no quadrado vermelho, ou seja, reforçador menor e

mais provável. Assim, o participante passou para a fase 1.2

após o primeiro bloco de tentativas.

Na fase 1.2., 95% das escolhas do participante

ocorreram no quadrado laranja (reforçador menor e mais

provável), e 5% no quadrado azul (reforçador maior e menos

provável). Somente uma das escolhas dentre as 20 tentativas

foi no quadrado azul. Esta ocorreu na primeira tentativa do

bloco 1 (L/A), e não houve pontos como consequência. Nas 19

tentativas restantes, as escolhas foram concentradas na

tecla que dava acesso ao reforçador menor e mais provável,

sendo que 18 delas tiveram pontos como consequência, e

somente em uma delas não houve pontos (tentativa 10).

25

Figura 1: Respostas de escolha emitidas por P1 ao longo

dos blocos nas subfases 1.1 (V/V) e na subfase 1.2 (L/A).

Desta forma, o participante seguiu para a fase 2 com

um padrão de preferência sob controle do reforçador menor e

mais provável, concentrando entre 99% a 100% de suas

respostas nas teclas que dão acesso a este reforçador.

No caso dos participantes P2 e P3, pode-se notar que o

estabelecimento de padrão de preferência foi bastante

diferente do que observado no caso de P1.

Ambos os participantes (P2 e P3), iniciaram o estudo

dividindo suas escolhas entre os dois tipos de reforçadores

(menor e mais provável, e maior e menos provável), e

precisaram de 2 blocos para atingir o critério de

preferência de 75% de escolhas pelo reforçador menor e mais

provável na Subfase 1.1, e um bloco para a fase 1.2.

26

Para P2, na Subfase 1.1., das 20 tentativas de escolha

disponíveis no primeiro bloco, como demonstrado na Figura

2, 50% delas ocorreram no quadrado vermelho, ou seja,

reforçador menor e mais provável. O dado indica que o

participante tendia a dividir suas escolhas entre as

alternativas concorrentes, provavelmente como uma

estratégia para aumentar seus ganhos, ficando sob controle

tanto da magnitude do reforçador (escolha pelo reforçador

maior e menos provável), quanto da maior probabilidade do

ganho dos pontos (reforçador menor e mais provável). Ao

longo das tentativas do primeiro bloco, nota-se também que

P2 se manteve respondendo no reforçador maior e menos

provável, possivelmente porque por três vezes o

Participante obteve reforço, sempre após três tentativas em

que insistia na escola desse reforçador. Nota-se, neste

caso, que uma sequência de responder foi casualmente

reforçada, o que poderia levar ao fortalecimento de um

padrão de variação entre as duas alternativas de reforço.

Assim, o Participante 2 precisou de mais um bloco para

atingir o critério de 75% de escolhas pelo reforçador menor

e mais provável, passando para a sub-fase 1.2 após 31

respostas de escolha, conforme mostra a Figura 2.

Na Subfase 1.2, P2 obteve reforço nas cinco respostas

de escolha pelo reforçador maior e menos provável. O

programa de computador foi programado de forma que 28% das

respostas emitidas neste reforçador fossem reforçadas.

Dentre as 20 tentativas disponíveis, em seis delas,

27

aleatoriamente, o Participante poderiam ser reforçado.

Assim, o Participante foi reforçado nas cinco respostas

emitidas neste reforçador, fato que aumenta a probabilidade

de resposta neste reforçador.



Para P3, na Subase 1.1., das 20 tentativas de escolha

disponíveis no primeiro bloco, como demonstrado na Figura

3, 60% delas ocorreram no quadrado vermelho, ou seja,

reforçador menor e mais provável. As outras 40% respostas

de escolha ocorreram no quadrado verde, ou seja, reforçador

maior e menos provável.

28



No entanto, deve-se notar que, diferentemente de P1, o

participante P3, tal como P2, nunca deixou de dividir as

suas escolhas. O que pode explicar este padrão é o fato de

que P1 foi reforçado por 90% das suas respostas de escolha

no reforçador menor e mais provável e não obteve reforço

pelas respostas de escolha no reforçador maior e menos

provável. Já P2 e P3 entraram em contato com a consequência

reforçadora nos dois tipos de reforçadores, apesar de ter

acontecido com maior frequência para o reforçador menor e

mais provável.

Como se pode notar, assim como P2, P3 divide suas

respostas de escolha entre os dois tipos de reforçadores,

recebendo mais frequentemente reforço após escolhas pelo

29

reforçador menor e mais provável. O Participante 3 parece

ter se exposto mais as contingências de maior probabilidade

de reforço, o que pode ter sido uma variável importante

para explicar a maior concentração de escolhas nesta

alternativa no início do bloco 2, e ao final do bloco 1

(L/A). No bloco 2 da primeira subfase (vermelho e verde),

P3 passa a emitir um comportamento um pouco mais estável,

respondendo mais vezes no reforçador menor e mais provável,

e sendo reforçado em 6 das 7 respostas de escolhas emitidas

neste reforçador em sequência.

Na subfase 1.2 (laranja e azul) 4 das 5 respostas de

escolha emitidas por P3 para o reforçador maior e menos

provável não obtiveram reforço como consequência. Já todas

as respostas emitidas pelo reforçador menor e mais provável

foram reforçadas. Com esse desempenho, P3 alcança o

critério de preferência de 75% de escolhas pelo reforçador

menor e mais provável. Porém, deve-se notar que, P3 ainda

divide as respostas de escolha até o final da Fase 1

conforme mostra a Figura 3. Das 16 tentativas em que o

participante alterna para a resposta de escolha pelo

reforçador menor e mesmo provável, em 6 delas P3 é

reforçado.

Assim, tanto para P2 quanto para P3, as contingências

mantiveram o comportamento de alternar a resposta de

escolha em ambos os reforçadores, ainda que o critério de

75% de respostas de escolhas pelo reforçador menor e mais

provável tenha sido alcançado.

30

2) ESTABELECIMENTO DO VALOR AVERSIVO E POSITIVO PARA VEG E VOJ VIA

CONDICIONAMENTO

O objetivo da Fase 2, foi produzir valor aversivo e

positivo para cada uma das pseudopalavras VOJ e VEG,

respectivamente, e observar seus efeitos posteriores sobre

o responder dos participantes. A fase foi subdividias em

duas subfases:

Na subfase 2.1, os participantes passaram por uma

atividade de quebra cabeça, na qual diante de VEG, a

pressão na tecla enter tinha como consequência três pontos

acrescidos no contador, bem como o acréscimo de três peças

em um quebra cabeça disposto na tela do computador. Diante

de VOJ, a pressão na tecla enter tinha como consequência

três pontos diminuídos do contador e a diminuição de três

peças da tela.

Cada condição dos dois estímulos foi apresentado por

cinco vezes de forma randômica, e tiveram a duração de 10s,

sendo apresentados por cinco vezes cada um, aleatoriamente.

A única tecla que estava em funcionamento nesta fase era a

tecla enter.

Após 10 tentativas de pressão a tecla, a Subfase 2.2

tinha início, sendo mantidas as mesmas contingências

programadas na Subfase 2.1, exceto pelo fato de que ao

início da sexta tentativa, o participante recebia a

instrução de que poderia pressionar a tecla de espaço para

31

“pular” o estímulo que desejasse, ou seja, o participante

podia, ao pressionar a tecla espaço, subtrair a

apresentação de VEG ou VOJ, quantas vezes desejasse. O

objetivo desta manipulação foi verificar se algum estímulo,

VEG ou VOJ, teria adquirido função aversiva, dado que o

participante poderia emitir comportamento de fuga diante

deste, ao “pular” este estímulo e esquivar-se de

possibilidade de perder pontos ao pressionar a tecla enter

em sua presença.

Para os três participantes, a fase teve início com a

apresentação do estímulo VEG. Durante esta primeira

apresentação, os participantes seguiram os 10 segundos

pressionando a tecla enter continuamente. Durante as

condições em que o estímulo VEG era apresentado, os

participantes respondiam com pressões a tecla enter

continuamente, obtendo os pontos correspondentes e peças

para seu quebra-cabeças.

No momento em que o estímulo VOJ foi apresentado pela

primeira vez, o participante P1 pressionou uma vez a tecla

enter e teve 3 pontos descontados do seu contador, ao mesmo

tempo em que três peças foram retiradas do quebra cabeça. A

partir deste momento, todas as vezes em que VOJ estava

disponível, o sujeito ignorou o teclado pelos 10 segundos,

e nenhuma resposta foi contabilizada novamente durante a

presença de VOJ para P1.

32

A Figura 4 representa quantas respostas de pressão a

tecla enter foram dadas na presença do estímulo VEG (cinza)

e na presença do estímulo VOJ (preto).

0

20

40

60

80

100

Ser...

Pressões à tecla enter em

porcentagem VOJ

FIGURA 4: Porcentagem de resposta de pressão à tecla enter

do participante P1 diante do estímulo VEG e diante do estímumo

VOJ.

Já para P2, no momento em que o estímulo VOJ foi

apresentado pela primeira vez, o participante pressiona uma

vez a tecla enter e tinha 3 pontos descontados do seu

contador e três peças saíram do quebra cabeça. Diferente de

P1, P2 seguiu pressionando a tecla enter na presença de VOJ

por 17 vezes, o que levou a perda de 51 pontos. A

frequência de pressões foi diminuindo ao longo da fase,

porém, P2 seguiu pressionando até o final da fase, não

deixando de responder totalmente.

33

0

20

40

60

80

100

Ser...


porcentagem VOJ



VOJ.

Para P3, no momento em que o estímulo VOJ foi

apresentado pela primeira vez, o participante pressiona a

tecla enter nove vezes e perde 21 pontos dos 30

anteriormente adquiridos diante de VEJ, bem como a perda

das peças do quebra cabeça. P3 finalizou a fase 2.1. com 93

pontos, o que indica que a pressão da tecla enter diante de

VEG foi maior (92%) que diante de VOJ (8%), como mostra a

Figura 6. Desta forma, tanto P2 quanto P3 terminaram a Fase

2 com um saldo de pontos positivo, apesar de ambos seguirem

pressionando a tecla enter diante de VOJ até o final do

experimento, mas com uma frequência menor em comparado a

frequência diante de VEG.

34

0

20

40

60

80

100

Ser...


porcentagem VOJ



VOJ.

Na fase 2.2, quando os participantes podiam pular a

apresentação de uma das condições de estímulos pressionando

a tecla espaço, P1 a pressionou todas as vezes em que o

estímulo VOJ foi apresentado, e não houve pressão diante do

estímulo VEG, como mostra a Figura 7. O dado parece sugerir

que o estímulo VOJ tenha adquirido valor aversivo.

0

20

40

60

80

100

Ser...

Pressões à tecla de espaço

em porcentagem

VEG

35

FIGURA 7: Porcentagem de resposta de pressão à tecla de

espaço do participante P1 diante do estímulo VEG e diante do

estímumo VOJ.

Para P2, nesta subfase 2.2, o participante pressionou

continuamente a tecla enter diante de VEG, recebendo a

pontuação de acordo com as pressões. Já diante de VOJ, o

participante pressiona a tecla enter somente uma vez,

perdendo 3 pontos. Após isso, pressiona a tecla espaço

todas às vezes que o estímulo VOJ está presente, como

mostra a Figura 8.

0

20

40

60

80

100

Ser...


em porcentagem

VEG



estímumo VOJ.

P3, por sua vez, pressionou todas às vezes (100%) a

tecla de espaço, emitindo comportamento de esquiva/fuga

diante do estímulo VOJ, como pode ser observado na Figura

9, esquivando-se da contingência de perda de pontos diante

de sua apresentação. Diante de VEG continuou pressionando a

tecla enter, terminando a Fase 2 com um saldo de 129 pontos.

36

0

20

40

60

80

100

Ser...


em porcentagem

VEG



estímumo VOJ.

Uma síntese dos resultados dos três participantes

sugere que, o estímulo VOJ parece ter adquirido valor

aversivo, pois os participantes emitem comportamento de

fuga diante deste, pressionando a tecla de espaço que

permitia que os participantes “pulassem” o estímulo,

esquivando-se da perda dos pontos e das peças. Já o

estímulo antes neutro VEG, parece ter adquirido valor

discriminativo para a resposta de pressão na tecla enter,

pois os participantes emitiam a resposta de pressão nesta

tecla continuamente diante de VEG. Ainda que nesta fase o

valor positivo de VEG não tenha sido testado, entende-se

que esta função possa também ter sido adquirida pela

pseudopalavra, dado seu pareamento com a apresentação do

reforço.

37

3) EFEITOS PRODUZIDOS PELA APRESENTAÇÃO DAS DIFERENTES DESCRIÇÕES

VERBAIS (VEG E VOJ) NA REVERSÃO OU NÃO DO PADRÃO DE PREFERÊNCIA:

Na Fase 3, os participantes foram submetidos às mesmas

contingências de escolhas concorrentes descritas na Fase 1.

No entanto, diferentes descrições verbais foram

apresentadas antes de cada escolha, o que permitiu avaliar

seu efeito sobre a reversão (ou não) do padrão de

preferência antes estabelecido.

Nas dez tentativas iniciais desta fase (3.1) não houve

apresentação de qualquer tipo de descrição acerca das

respostas de escolha. Tal manipulação pretendeu avaliar a

estabilidade do padrão de preferência estabelecido na Fase

1, o que permitiria esclarecer se possíveis mudanças neste

padrão seriam, de fato, decorrentes da introdução das

descrições acompanhadas pelas pseudopalavras VEG e VOJ.

A partir de então, vinte novas tentativas foram

sequencialmente apresentadas, sendo antecedidas por uma

descrição acompanhada por um estímulo VEG ou VOJ,

relacionadas a função positiva ou aversiva, via

condicionamento respondente. As descrições foram

posicionadas acima de um dos quadrados coloridos dispostos

na tela do computador, de forma a avaliar seu efeito sobre

o padrão de preferencia inicialmente estabelecido na Fase

1. Assim, o participante que inicialmente demonstrou

preferencia pela escolha de reforçamento menor e mais

provável, a seguinte descrição verbal apareceu sobre o

quadrado de escolha por reforçamento maior e menos provável

38

“Escolher aqui é...VEG (estímulo que teria adquirido valor

apetitivo e de provável estímulo discriminativo a partir da

história de condicionamento na fase anterior). De forma

contrária, a seguinte descrição verbal surgirá sobre a

quadrado respectivo à preferência inicial estabelecida “

Escolher aqui é... VOJ” (estímulo que teria adquirido valor

aversivo a partir da história de condicionamento na fase

anterior).

A figura abaixo ilustra o desempenho do Participante 1

ao longo das três subfases (sem instrução, VEG e VOJ) da

Fase 3. As linhas pontilhadas dividem as subfases compostas

por 10 oportunidades de escolhas. A área cinza do gráfico

indica quais respostas emitidas pelo participante foram de

acordo com a a instrução, e respostas na área sem cor são

opostas à instrução.

39

FIGURA 10: Respostas de escolha nas dez tentativas de cada

subase disponíveis, emitidas pelo participante P1 ao longo da

fase 3. A área em cinza é aquela em que as respostas de escolha

foram pelo reforçador maior e menos provável, ou seja, respostas

que podem estar son controle da instrução.

Como se pode notar, na subfase 3.1, 100% das escolhas

de P1 foram no reforçador menor e mais provável, ou seja, ,

no caso de P1, nota-se a manutenção de um padrão de

preferência estabelecido no início do experimento.

Nas próximas 10 tentativas (subfase 3.2), somente na

primeira o participante seguiu a instrução, de forma que o

quadrado selecionado foi o corresponde ao reforço maior e

menos provável, resposta considerada de acordo com o

descrito na instrução e oposta ao que o participante vinha

fazendo até então durante o experimento. Assim, o quadrado

selecionado foi o que continha acima a frase “fazer isto é

VEG”. Nota-se, no entanto, que nesta tentativa, P1 não

obteve pontuação por seguir a instrução e emitir a resposta

de escolha diante de VEG, o que pode explicar que nas novas

tentativas seguintes o participante não tenha se comportado

de acordo com as instruções, passando a escolher pelo

reforço menor e mais provável, que foi recebido em 8 das 9

tentativas desta Subfase (exceto na tentativa 5.

Nas 10 tentativas seguintes (Subfase 3.3), a frase

“fazer isto é VOJ” aparecia acima do quadrado que tinha

como consequência o reforço menor e mais provável. Somente

em uma delas o participante seguiu a regra, como pode ser

40

observado na Figura 10. De forma que, novamente, na

primeira tentativa do bloco, o quadrado selecionado foi o

corresponde ao reforço maior e menos provável, padrão

correspondente ao descrito na instrução e oposto ao

estabelecido na Fase 1 e o que vinha sendo mantido nas

tentativas anteriores da sub fase 3.2. Mais uma vez, P1 não

obteve o recebimento de pontos como consequência por seguir

a instrução nesta tentativa e durante as 9 tentativas

seguintes, o quadrado selecionado passou a ser aquele que

tinha como consequência para a resposta de escolha, reforço

menor e mais provável, ou seja, os quadrados que continham

a cima a frase “fazer isto é VOJ”. Destas 9 oportunidades

de escolha, em todas elas o participante obteve pontos como

consequência por não seguir a instrução.

Assim, observamos que o estímulo anteriormente neutro

VOJ, parece ter obtido valor aversivo durante a atividade

de quebra cabeça, pois, o participante emitiu comportamento

de fuga na presença deste, durante a Fase 2 do estudo.

Porém, durante a Fase 3, em que investigamos se diante de

VOJ o participante reverteria seu padrão de preferencial,

pudemos notar que inicialmente ele seguiu a regra, porém,

como as consequências permanecem as mesmas de quando ele

estabeleceu sua preferencia, o participante voltou a

responder de acordo com esta.

Os dados nos mostra que, mesmo que pseudopalavras com

valor aversivo ou positivo tenham sido incluídas para

favorecer o seguimento da instrução, elas não

41

necessariamente aumentam a probabilidade de seguimento da

instrução, quando as contingencias para o seguimento da

regra não sejam mantidas pelo acréscimo de pontos.

No caso do Participante 1, nota-se que ele nunca foi

reforçado por seguir a instrução neste experimento, e por

outro lado, tem uma história bastante forte de reforçamento

para a resposta de escolha pelo reforçador menor e mais

provável. Assim, mesmo quando as descrições foram

acompanhadas de pseudopalavras com valor aversivo ou

positivo, a história de reforçamento deste participante em

específico, parece contribuir para que ele continue se

comportando da maneira que vinha fazendo ao longo do

estabelecimento do padrão de preferência.

Uma hipótese acerca destes resultados seria a de que,

o participante teria entrado mais em contato com a

consequência reforçadora (pela resposta de pressão à tecla

diante de VEG) na Fase 2, do que com consequências

aversivas na presença de VOJ nesta mesma Fase. Por mais que

durante o experimento ele tenha emitido comportamento de

esquiva de VOJ, poucas foram as vezes em que ele entrou de

fato em contato com a perda dos pontos, pois assim que isto

ocorreu ele não mais pressionou a tecla que retirava pontos

e peças da tela diante de VOJ.

Desta forma, para P1, a história construída ao longo

do experimento, somada a uma história pessoal anterior do

participante de seguimento de instruções, parece não ter

contribuído para que o estímulo verbal tivesse maior

42

controle sobre o comportamento do seguir instruções neste

experimento do que as contingências atuais.

No caso de P2, no entanto, nota-se um padrão diferente

do que o de P1 já na fase 3.1, na qual não havia instrução

para a resposta de escolha. Nesta fase, 70% das escolhas de

P2 foram no reforçador menor e mais provável, ou seja,

pode-se notar, no caso de P2, a manutenção de um padrão de

preferência estabelecido no início do experimento, porém,

com uma variação maior, ele não manteve o critério 75% de

preferência por esta alternativa de reforço, tal como na

Fase 1. Somente em três das dez tentativas da sub-fase 3.1,

P2 emitiu resposta de escolha no quadrado correspondente ao

reforço maior e menos provável. Em nenhuma das três

tentativas o participante obteve pontos como reforço. Uma

provável hipótese acerca da emissão de respostas de escolha

por esta alternativa de reforço, ainda que o participante

não viesse recebendo pontos durante esta subfase 3.1.,

seria de que na Fase 1 ele foi bastante reforçado por

manter um comportamento de alternar entre os reforço,

incluindo assim, a escolha pelo reforço maior e menos

provável.

Já nas sete respostas de escolha no quadrado

correspondente ao reforçador menor e mais provável pode-se

observar o recebimento de pontos como reforço em todas

elas, como mostra a Figura 11.

43






Nas próximas 10 tentativas (subfase 3.2), a frase

“fazer isto é VEG” aparecia acima do quadrado que tinha

como consequência o recebimento do reforço maior e menos

provável, favorecendo a escolha oposta ao padrão

estabelecido até então. Nesta subfase, das 10 tentativas

disponíveis diante do estímulo VEG, em cinco delas o

participante escolher o reforçador maior e menos provável,

padrão de acordo ao sugerido na instrução (50%), como pode

ser observado na Figura 11. Na primeira das tentativas

desta sub-fase, P2 segue a instrução, porém, não é

reforçado por isto, passando a emitir a resposta de escolha

no reforçador (menor e mais provável) em seguida, sendo

44

reforçado por comportar-se em desacordo ao sugerido na

instrução. Isto parece indicar que as contingências atuais

parece não contribuir para a manutenção do comportamento de

seguir regras.

Na terceira tentativa da Subfase 3.2, P2 volta, no

entanto, a escolher por reforçador maior e menos provável,

de acordo com o padrão especificado na instrução. Dado que

o participante não recebeu reforço anterior por seguir a

instrução e escolher por esta alternativa de reforço nesta

subfase, escolher novamente por reforçador maior e menos

provável pode sugerir tanto que a presença de VEG possa ter

estabelecido valor positivo para esta escolha, independente

das contingencias atuais mantidas; quanto que o padrão de

dividir as escolhas entre os dois reforçadores, reforçado

na Fase 1 do experimento, foi mantido durante esta Subfase

3.2.

P2 foi reforçador ao emitir resposta de escolha na

alternativa de reforço maior e menos provável, após emitir

algumas respostas no reforçador menos e mais provável.

Assim, o padrão parece estar mais sob o controle das

contingências do que sob controle da instrução, atenuando o

valor do Sd verbal.

Quando é reforçado por 4 tentativas seguidas de

escolha pelo reforçador oposto ao seguir a instrução, P2

continua a emitir resposta de escolha neste reforçador até

que não recebe reforço. Assim como nas tentativas

anteriores, quando P2 não recebe reforço pela resposta de

45

escolha, ele emite comportamento de escolha no reforçador

oposto, e neste caso ele é reforçado.

O padrão de alternação que P2 apresenta (quatro

tentativas em reforçamento menor e mais provável, passando

para uma variação para maior e menos provável), pode

indicar um maior controle sobre as contingências do que das

pseudopalavras. Ou seja, parece que as contingências são

relevantes no controle do padrão do responder de P2,

independente da presença de VEG e VOJ.

As próximas 10 tentativas (subfase 3.3) aparecem com a

frase “fazer isto é VOJ” acima do quadrado que tinha

reforço menor e mais provável como consequência para a

resposta de escolha. Nesta subfase, das 10 tentativas

disponíveis diante do estímulo VOJ, somente em duas delas o

participante não escolheu o quadrado correspondente a VOJ.

O dado parece indicar que o estimulo não parece exercer

valor aversivo sobre o responder do sujeito, como efeito do

enfraquecimento do valor do estímulo na subfase anterior.

P2 começou a Subfase 3.3 respondendo no quadrado

corresponde a escolha pelo reforçador menor e mais provável

e obtém pontos em todas as escolhas. Nota-se assim, que ele

não iniciou esta subfase seguindo a instrução. Na quinta

tentativa, o participante volta a alternar a escolha para a

alternativa de reforço maior e menos provável e recebe

pontos como reforço, porém, em seguida passa a responder no

reforçador menor e mais provável, ou seja, faz o oposto à

instrução. P2 volta a responder no reforçador menor e mais

46

provável por quatro tentativas, obtendo pontos em todas

elas até que na ultima tentativa, responde no quadrado

correspondente ao reforçador maior e menos provável,

seguindo a instrução, porém, novamente não obtém pontuação

por esta resposta de escolha.

Esses dados sugerem que na subfase 3.3 (VOJ), P2

responde menos de acordo com a instrução do que na subfase

3.2 (VEG). Mesmo quando foi reforçado por emitir resposta

de escolha de acordo com a instrução, não permaneceu

emitindo resposta de escolha por este reforçador. Isto pode

mostrar que P2 não está sob controle da instrução, mas pode

ainda está dividindo as respostas de escolha entre os dois

reforçadores, padrão estabelecido pelas contingências de

reforçamento intermitente para o comportamento de alternar

suas escolhas ao longo do estudo.

Novamente podemos inferir que ao longo do experimento,

o contato com as contingências reforçadoras tem maior

controle sobre o responder do participante, do que a

variável verbal, mesmo que esta tenha adquirido um valor

aversivo ou positivo no experimento na Fase 2.

Na fase 3.1, na qual não havia instrução para a

resposta de escolha, 100% das escolhas de P3 foram no

reforçador menor e mais provável, confirmando o padrão de

preferência estabelecido na Fase 1. Durante as 10

tentativas, nas 9 primeiras o participante obteve como

consequência os pontos correspondentes a respostas de

escolha no reforçador menor e mais provável. Ou seja,

47

somente na ultima não houve consequência, como mostra a

Figura 12.

Na subfase 3.2, das 10 tentativas disponíveis diante

do estímulo VEG, em sete delas o participante seguiu a

instrução (70%), como pode ser observado na Figura 12.

Assim, o quadrado selecionado por sete vezes foi o que

continha acima a frase “fazer isto é VEG”. Destas sete,

quatro delas tiverem reforço como consequência.






48

Na primeira tentativa da sub-fase 3.1, o participante

seguiu a instrução, o que parece sugerir o controle que a

pseudopalavra exerceu sobre o responder, pois o

participante vinha respondendo no reforçador oposto durante

toda a subfase anterior (3.1). P3 é reforçado por seguir a

instrução, e segue por 5 tentativas neste reforçador maior

e menos provável. Depois de duas tentativas consecutivas

sem obter reforço, o participante passa a responder no

outro reforçador, dividindo as escolhas entre os dois até o

final da subfase 3.2.

Na subfase 3.3, novamente P3 comporta-se de acordo com

o sugerido na instrução e é reforçado por isto, passando a

responder de forma muito parecida com a subfase 3.2. A

partir dos dados, parece que, inicialmente, o estímulo

verbal exerce controle sobre o responder do sujeito. Porém,

quando não recebe mais reforço por esta resposta, passa a

revezar novamente, podemos dizer que P3 esta em certa

medida, sob controle das contingências atuais.

Com base nesses dados, parece que P3 esteve sob

controle das instruções inicialmente, e por ter sido

reforçado também por seguir as instruções, porém, foi mais

reforçado por não fazê-lo. Assim, ao final do experimento,

o participante esteve sob controle das contingências,

mantendo seu padrão de revezar entre os reforçadores.

Os resultados agora apresentados referem-se a uma

análise ao desempenho dos participantes ao longo de todas

as fases, com objetivo de apresentar um panorama geral do

49

padrão comportamental de cada Participante, além da

comparação entre o responder dos três participantes.

As figuras ilustram a porcentagem do padrão de

respostas do participante ao longo dos blocos do

experimento que envolveram escolha entre os dois tipos de

reforçadores (Fase 1 e Fase 3). A primeira área da figura

corresponde a Fase 1. A área seguinte corresponde a Fase 3,

dividida entre as três subfases.

As resposta localizadas na área cinza do gráfico,

indicam as respostas de escolha emitidas no reforçador

maior e menos provável. Se as respostas estiverem agrupadas

em maior número nesta área cinza durante a fase 3,

significa que houve a reversão do padrão de preferência do

participante, do reforçador menor e mais provável para o

reforçador maior e menos provável.

0

20

40

60

80

100

120

Pref

erên

cia

pelo

ref

orço

men

or e

mai

s pr

ováv

el e

m po

rcen

tage

m

Bloco V/V Bloco L/A

Sem Regra

VEG VOJFASE 3FASE 1

P1

50

FIGURA 13: Porcentagem de resposta de escolha no

reforçador menor e mais provável do participante P1. As áreas em

cinza são aquelas em que as respostas estariam se o participante

estivesse se comportando sob controle da instrução.

0

20

40

60

80

100

120

Pref

erên

cia

pelo

ref

orço

men

or e

mai

s pr

ováv

el e

m po

rcen

tage

m

V/V L/A

Sem Regra VEG VOJFASE 3FASE 1

P2Bloco 1

Bloco 2

FIG

URA 14: Porcentagem de resposta de escolha no reforçador menor e

mais provável do participante P2. As áreas em cinza são aquelas

em que as respostas estariam se o participante estivesse se

comportando sob controle da instrução.

51

0

20

40

60

80

100

120

Pref

erên

cia

pelo

ref

orço

men

or e

mai

s pr

ováv

el e

m po

rcen

tage

m

V/V L/A

Sem Regra VEG VOJ

FASE 3FASE 1

P3Bloco 1

Bloco 2

FIGURA 15: Porcentagem de resposta de escolha no

reforçador menor e mais provável do participante P3. As áreas em

cinza são aquelas em que as respostas estariam se o participante

estivesse se comportando sob controle da instrução.

Dos três participantes, P3 foi o que mais entrou em

contato com a consequência de perder pontos e peças no

quebra cabeça, por continuar pressionando a tecla enter na

presença de VOJ. Os outros dois participantes (P1 e P2),

assim que tinham a possibilidade de pular a janela de VOJ o

faziam, ou então, ignoravam a tela correspondente a VOJ.

Assim, P3 foi o participante que mais se distanciou do

antigo padrão de preferência estabelecido na Fase 1, quando

novamente observado na Fase 3. Porém, aparentemente, o

participante demonstra um responder sob controle das

contingências reforçadoras, e não sob controle da

52

instrução, pois ele foi reforçado por responder de acordo

com a instrução.

CONCLUSÃO

O presente trabalho pretendeu avaliar o efeito de

descrições verbais com função aversiva ou positiva, sobre o

comportamento de escolha de três participantes adultos.

Durante o experimento foi avaliada a preferência

inicial dos participantes entre alternativas do reforço

menor e mais provável e maior e menos provável, Sendo

posteriormente avaliado se a inclusão de instruções verbais

contrárias ao padrão inicialmente estabelecido, e

acompanhadas por pseudopalavras qualificadoras com valor

positivo ou aversivo poderiam levar à reversão deste

padrão.

Segundo Braam e Mallot (1990) descrições verbais

controlarão diferencialmente as respostas não verbais, a

depender das contingências que especifiquem. Para Mallot

(1989), o controle de instruções/regras que especifiquem

contingências de ação seria maior quando fossem

acompanhadas por estímulos que maximizem o valor aversivo

de uma instrução, pois a instrução/regra funcionaria como

estímulo aversivo condicionado, capaz de favorecer seu

53

seguimento por induzir condições aversivas que seriam

atenuadas após seu cumprimento.

Almeida e Hubner (2009) pretenderam contribuir com a

discussão sobre as condições que afetam a probabilidade de

controle verbal sobre o comportamento não verbal,

investigando se a inclusão de operantes autoclíticos pode

favorecer este controle. As autoras analisaram se operantes

verbais autoclíticos negativos e também positivos

reverteriam o padrão de preferência estabelecido

anteriormente pelos participantes. Os resultados de Almeida

e Hubner (2009), apontaram que não houve reversão do padrão

de preferência por conta das instruções introduzidas. A

hipótese levantada pelas autoras foi que o histórico

anterior dos sujeitos sobre autoclíticos “pior” e “melhor”

utilizados no experimento, poderiam ter influenciado na

maneira em que cada participante iria responder a esses

estímulos.

No presente estudo, pretendeu-se testaro controle

verbal no estabelecimento de um valor aversivo a VOJ,

analisando se quando acompanhado a instrução, ele também

teria a função de maximizar o valor aversivo desta. Bem

como testas se o estabelecimento de um valor positivo a

outro estímulo, VEG, também exerceria controle sob o

responder do sujeito com o objetivo de reverter o padrão

anteriormente estabelecido no experimento.

O estabelecimento prévio do valor aversivo e positivo

de determinados estímulos foi garantido durante a Fase 2 do

54

experimento, de maneira que pudemos assim, ter controle

sobre essa variável, isolando os efeitos da história prévia

dos participantes com as palavras que qualificavam as

escolhas.

Assim, no presente estudo, o efeito das descrições na

reversão da preferência dos participantes foi avaliado em

condições em que houve o estabelecimento de um novo evento,

no caso a instrução aversiva gerada pela inclusão da

pseudopalavra VOJ (e do aumento do valor positivo desta

escolha, pela inclusão de um estímulo de função positiva

VEG). No caso das descrições acompanhadas por VOJ, entende-

se que a reversão de preferência dar-se-ia como uma

resposta de esquiva, a fim de eliminar a aversividade

imposta por este tipo de descrição.

Com base nesta discussão, testamos assim, o controle

que descrições acompanhadas pelas pseudopalavras VEG e VOJ

exerciam sobre o responder dos participantes, após terem

sido diretamente pareados com reforço e punição,

respectivamente. Os dados mostram que esse controle não foi

suficiente para que os participantes seguissem a instrução,

nas condições em que havia reforço para respostas

incompatíveis com o seguimento

Para os três participantes as pseudopalavras pareceram

exercer controle sobre o responder nas primeiras tentativas

de escolha da Fase 3 (que verificaria o controle dos

estímulos verbais), mas nas próximas tentativas, ao longo

das subfases, o responder deste três participantes voltou a

55

ficar sob controle das contingências e da maneira a

responder anteriormente estabelecido durante a Fase 1.

Assim, os resultados parecem demonstrar que os

participantes estavam sobre controle da magnitude do

reforçador (escolha pelo reforçador maior e menos

provável), ou da probabilidade do ganho dos pontos

(reforçador menor e mais provável), de acordo com seu

padrão de preferencia estabelecido anteriormente.

Desta forma, instruções verbais acompanhadas por

estímulos VEG e VOJ, parecem exercer pouco controle sobre o

responder dos participantes, mesmo tendo adquirido valor

positivo e aversivo, respectivamente.

Nos estudos descritos por Braam e Mallot em que

objetivo era investigar se descrições verbais controlariam

diferencialmente as respostas não verbais, a depender das

contingências, foi possível tirar duas conclusões. A

descrição de reforços atrasados ou ausência de reforço

parece ter enfraquecido o controle pela regra, e, a

inclusão de prazos (resposta verbal) parece maximizar o

controle da regra que descreve contingências indiretas

envolvendo atraso de reforço. Porém, nossos dados não vão

de acordo com os dos autores, pois a resposta verbal não

pareceu maximizar o controle pela regra, mesmo que esta

descrevesse contingências aversivas condicionadas.

Talvez o fato de no experimento dos autores, as

contingências descreverem o atraso do reforço, tenha

influenciado de maneira diferente do nosso experimento, que

56

não descrevia um atraso. No nosso experimento, mesmo que o

participante não seguisse a instrução, ele poderia ser

reforçado por isto, assim como seguir a instrução não

necessariamente tinha como consequência o reforço. Nestas

condições, pode-se observar se o responder está sob

controle da instrução ou sob o controle das contingências

vigente, o que ocorreu no nosso caso.

Isto parece fazer com que os participantes voltem a

emitir respostas de escolha que, nas fases anteriores do

experimento, teriam aumentado a possibilidade de reforço e

que nas condições atuais, continuam a reforçar este

comportamento.

De acordo com Skinner (1953), ao discutir o

comportamento de autocontrole, a declaração de uma resposta

verbal pode controlar a probabilidade de uma segunda

resposta, se esta primeira adquire uma função aversiva,

dados pareamentos anteriores com punição pelo comportamento

de desobedecer à instrução. Porém, este pareamento precisa

ser mantido para que seu valor aversivo não se perca,

perdendo também a função de resposta controladora.

No nosso experimento, foi possível perceber que o

valor positivo de VEG e aversivo de VOJ foi atenuado na

Fase 3, pois a punição não estava em vigor caso a instrução

não fosse seguida.

Assim, nota-se que no nosso experimento não pareceu

possível manter o valor positivo ou aversivo estabelecido

via condicionamento diante de contingências atuantes que

57

favoreçam a emissão de respostas opostas a instrução. Mesmo

que VEG e VOJ tenham adquirido valor positivo ou aversivo,

elas não foram suficientes para manter o controle do

comportamento de escolhas, diferentemente do resultado

obtido por Braam e Mallot (1990).

Porém, os resultados são semelhantes aos obtidos por

Almeida e Hubner (2009), em que não foi possível observar

reversão do padrão por conta do controle da regra. Assim,

de modo geral, os resultados pareceram indicar que não é

possível manter o valor aversivo de uma regra/instrução

quando as contingências vigentes são opostas ao

comportamento de seguir a instrução, no caso do sujeito ser

mais reforçado por fazer o contrário a ela. Foi possível

verificar que o valor aversivo é atenuado, caso não

aconteça punição por não seguir a regra. Assim como o valor

positivo, caso o sujeito não seja reforçado por seguir a

instrução. O que justifica essa hipótese, também é o fato

de o participante que mais seguir a instrução, foi aquele

que foi reforçado por fazê-lo. De modo que este continua

sob controle das contingências e não da instrução.

Neste caso em específico, em que o Participante 3 que

aparentemente segue mais as instruções, foi necessária uma

análise tentativa a tentativa para compreender se o

responder estava sob controle da instrução ou das

contingências. Isto porque, o participante foi reforçado em

90% das respostas de escolhas emitidas de acordo com a

instrução. Mesmo que a programação do nosso experimento

58

tenha sido de 28% de probabilidade de reforço neste

reforçador (maior e menos provável), ao acaso, o

participante obteve o reforço em quase todas as respostas

de escolha neste reforçador, o que implicou no aumento da

probabilidade de resposta neste reforçador.

Como sugestão para estudos futuros, poderia ser

repensado o parâmetro de probabilidade seria o mais

adequado a ser utilizado nesta investigação, pois

aparentemente este contribuiu diretamente para os

resultados obtidos, uma vez que interfere no acesso as

contingências de reforço, fazendo com que os participantes

tentem maximizar o acesso ao reforço, dividindo as

respostas entre os dois tipos de reforçadores. Com isso,

ocasiões em que o participante obedece à regra podem ser

seguidas sem o acesso ao reforço, da mesma forma que

ocasiões em que o participante não segue as instruções

podem ser seguidas de acesso ao reforçador, como aconteceu

nos resultados obtidos dos Participantes P1 e P2.

Outra sugestão seria sobre como garantir que o

Participante entre em contato por mais vezes com a

consequência punitiva na Fase 2 do experimento, para que

esta adquira valor aversivo mais eficiente. No caso do

Participante P1, ele quase não entrou em contato com a

perda de pontos e de peças, de forma que isto pode ter

influenciado em seu responder na Fase 3.

59

REFERÊNCIAS BIBLIOGRÁFICAS:

ALMEIDA, P.E.M; HUBNER. M.M.C (2009)

“Comportamento verbalmente controlado: uma análise

do efeito de operantes verbais autoclíticos sobre o

comportamento de escolha”. Tese de doutorado

defendida No Programa de Psicologia Experimental da

Universidade de São Paulo, São Paulo.

BORTOLOTI, R.; DE ROSE, J. C. (2008)

“Transferência de ‘significado’ de expressões faciais

apresentadas brevemente para estímulos abstratos

equivalentes à elas”. Acta Comportamentalia Vol.16, Núm.2,

pp.223-241. São Carlos, São Paulo.

BRAAM, C; MALLOT, R.W (1990) “I´ll do it when

the snow melts: The effects of deadlines and

delayed outcomes on rule-governed behavior in

60

preschool children”. The Analysis of Verbal

Behavior, 8 , 67-76.

FRANÇA, T. P. (2002) “Transferência de Função

Aversiva em Classes de Equivalência: Uma Visão Analítico-

Comportamental dos Transtornos de Ansiedade”. Brasília,

IBAC.

MALLOT, R.W. (1989) “The achievement of evasive

goals: Control by rules describing contingencies

that are not direct acting”. Em Hayes, S. (org)

Rule-governed behavior: cognition, contingencies,

and instructional control (p. 269-322) New York:

Plenum Press.

MATOS, D. (2013) “Análise dos efeitos do Atraso e

da Probabilidade do Reforço sobre a escola em Condições com

Esquemas Concorrentes Encadeados e Simples” Tese de

doutorado defendida no Programa de Psicologia Experimental:

Análise do Comportamento da PUC-SP, São Paulo.

REIS, A.A; TEIXEIRA, E.R & PARACAMPO, C.C.P

(2005) “Auto-regras como variáveis facilitadoras na

emissão de comportamentos autocontrolados: o

exemplo do comportamento alimentar”. Interação em

Psicologia, 9 (1), 57-64.

SKINNER, B.F. “Ciência e Comportamento Humano”.

5ª edição. Ed Martins Fontes, 1953/1981. São

Paulo.

61

VALDIVIA, S., LUCIANO, C. & MOLINA, F. J.

(2006) “Verbal regulation of motivational states” The

Psychological Record: Vol. 56: Iss. 4, Article 8

Documents

COMPORTAMENTO VERBALMENTE CONTROLADO E AUTOCONTROLE: UMA ANÁLISE DO EFEITO DE RESPOSTAS VERBAIS ACOMPANHADAS POR ESTÍMULOS COM FUNÇÃO AVERSIVA OU POSITIVA SOBRE O COMPORTAMENTO