Upload
independent
View
4
Download
0
Embed Size (px)
Citation preview
1
PONTIFÍCIA UNIVERSIDADE CATÓLICA DE SÃO PAULO (PUC-SP)
SECRETARIA DE CIÊNCIAS HUMANAS E DA SAÚDE
DEPARTAMENTO DE PSICOLOGIA
COMPORTAMENTO VERBALMENTE CONTROLADO E AUTOCONTROLE: UMA
ANÁLISE DO EFEITO DE RESPOSTAS VERBAIS ACOMPANHADAS POR
ESTÍMULOS COM FUNÇÃO AVERSIVA OU POSITIVA SOBRE O
COMPORTAMENTO DE ESCOLHA. SUB PROJETO 1
BOLSISTA: LUNA PEREIRA GIMENEZ
ORIENTADORA: PAOLA E. DE M. ALMEIDA
SÃO PAULO
2
AGOSTO – 2014
PONTIFÍCIA UNIVERSIDADE CATÓLICA DE SÃO PAULO (PUC-SP)
SECRETARIA DE CIÊNCIAS HUMANAS E DA SAÚDE
DEPARTAMENTO DE PSICOLOGIA
COMPORTAMENTO VERBALMENTE CONTROLADO E AUTOCONTROLE: UMA
ANÁLISE DO EFEITO DE RESPOSTAS VERBAIS ACOMPANHADAS POR
ESTÍMULOS COM FUNÇÃO AVERSIVA OU POSITIVA SOBRE O
COMPORTAMENTO DE ESCOLHA. SUB PROJETO 1
BOLSISTA: LUNA PEREIRA GIMENEZ
ORIENTADORA: PAOLA E. DE M. ALMEIDA
3
SÃO PAULO
AGOSTO – 2014
COMPORTAMENTO VERBALMENTE CONTROLADO E AUTOCONTROLE: UMA
ANÁLISE DO EFEITO DE RESPOSTAS VERBAIS ACOMPANHADAS POR
ESTÍMULOS COM FUNÇÃO AVERSIVA OU DISCRIMINATIVA SOBRE O
COMPORTAMENTO DE ESCOLHA. SUB PROJETO 1
Relatório Final de Pesquisa
Programa Institucional de Bolsas Iniciação Científica
Vigência agosto/2013 a julho/2014
PIBIC/CEPE
4
SÃO PAULO
AGOSTO - 2014
Sumário
INTRODUÇÃO.....................................................5
MÉTODO........................................................11Fase 1- Instalação de um padrão de preferência por reforçadores menores e mais prováveis, em uma situação de escolha concorrente.........................................12
Fase 2 – Estabelecimento do valor aversivo e positivo para dois estímulos via condicionamento respondente..............14
Fase 3 – Apresentação de descrições verbais acompanhadas por estímulos com função aversiva ou positiva...................15
RESULTADOS E DISCUSSÃO........................................161) ESTABELECIMENTO DO PADRÃO DE PREFERÊNCIA ENTRE O REFORÇADOR MENOR EMAIS PROVÁVEL, E O REFORÇADOR MAIOR MENOS PROVÁVEL:...............162) ESTABELECIMENTO DO VALOR AVERSIVO E POSITIVO PARA VEG E VOJ VIA CONDICIONAMENTO.............................................223) EFEITOS PRODUZIDOS PELA APRESENTAÇÃO DAS DIFERENTES DESCRIÇÕES VERBAIS (VEG E VOJ) NA REVERSÃO OU NÃO DO PADRÃO DE PREFERÊNCIA:......27
CONCLUSÃO.....................................................39
REFERÊNCIAS BIBLIOGRÁFICAS:...................................44
5
RESUMO
O presente trabalho pretendeu avaliar o efeito de descrições
verbais com função aversiva ou positiva sobre o comportamento de
escolha de três participantes adultos em uma tarefa de
computador. Para tanto, um delineamento de escolhas concorrentes
foi planejado, sendo observado o padrão de preferência de cada
participante entre as alternativas de reforçamento menor e mais
provável ou maior e menos provável, durante uma atividade no
computador. Estabelecida a preferência dos participantes, dois
estímulos (pseudopalavras “VEG e VOJ”) foram apresentados
durante condições de perda ou ganhos de reforços, em uma tarefa
em que os os participantes foram convidados a montar um quebra-
cabeça, a partir de respostas de pressão às teclas do
computador. Na presença do estímulo VEG, respostas a uma das
teclas levava ao aparecimento das imagens do quebra-cabeça no
centro da tela, e ao acréscimo de pontos em um contador
localizado acima da imagem. Na presença do estímulo VOJ,
6
respostas de pressão levava à perda de pontos e de peças. Cada
condição de apresentação dos dois estímulos aconteceu por dez
vezes, de forma randômica por 10 segundos cada. Após a quinta
tentativa de apresentação, uma mensagem aparecia na tela,
avisando ao participante que, caso quisessem, poderiam apertar a
barra de espaços, para mudar de tela, encerrando a tentativa.
Após isto as diferentes descrições verbais VEG e VOJ foram
apresentadas antes de cada escolha, assim como na Fase 1, o que
permitiu avaliar seu efeito sobre a reversão (ou não) do padrão
de preferência antes estabelecido. Os resultados encontrados
parecem indicar que o valor positivo ou aversivo do estímulo
verbal não foi suficiente para que os participantes seguissem a
instrução. Para os três participantes as pseudopalavras
pareceram exercer controle sobre o responder nas primeiras
tentativas de escolha da Fase 3 (que verificaria o controle dos
estímulos verbais), mas nas próximas tentativas, ao longo das
subfases, o responder deste dois participantes voltou a ficar
sob controle das contingências e da maneira de responder
anteriormente estabelecida na Fase 1. Assim, os resultados
demonstram que os participantes parecem estar sobre controle da
magnitude do reforçador (escolha pelo reforçador maior e menos
provável), ou da probabilidade do ganho dos pontos (reforçador
menor e mais provável), de acordo com os padrões de preferência
estabelecidos anteriormente.
Palavras chave: autocontrole, descrições verbais.
7
INTRODUÇÃO
O presente trabalho pretendeu avaliar o efeito de
descrições verbais com função aversiva ou positiva sobre o
comportamento de escolha de três participantes adultos.
Durante o experimento foi avaliada a preferência dos
participantes entre alternativas do reforço menor e mais
provável e maior e menos provável, tendo sido planejados
ajustes que favoreceriam a escolha menor e mais provável,
tradicionalmente nomeada como uma escolha impulsiva.
O estudo aqui proposto foi elaborado inicialmente a
partir do referencial teórico skinneriano acerca do
autocontrole, brevemente retomado a seguir.
Para Skinner (1953), um homem se controla precisamente
como controlaria o comportamento de qualquer outro através
da manipulação de variáveis das quais o comportamento é
função. Ou seja, seu comportamento é um objeto próprio de
análise e as variáveis que o individuo utiliza na
manipulação de seu comportamento nem sempre são acessíveis
aos outros. Assim, o comportamento de autocontrole é aquele
capaz de alterar a probabilidade de ocorrência de uma
resposta com consequências conflitantes.
O motivo pelo qual um indivíduo vem a controlar parte
de seu próprio comportamento é determinando pelas
consequências conflitantes produzidas por uma resposta, ou
seja, quando uma mesma resposta leva tanto a reforço
positivo ou negativo, como pode levar a punição, definida
8
pela retirada de reforçadores positivos ou apresentação de
estímulos aversivos.
De acordo com Skinner (1974/2006), para que um
determinado estímulo seja considerado aversivo, é
necessário que sua remoção tenha características
reforçadoras. Os estímulos aversivos eliciam no organismo
várias reações fisiológicas que podem ser sentidas ou
introspectivamente observadas, e que podem ser bastante
perturbadoras e incluem predisposição para fugir. Nos casos
em que uma resposta que vem sendo reforçada for seguida
também pela apresentação de um aversivo, as emoções
eliciadas pelo estímulo aversivo tornam incompatível a
manutenção da resposta que produziria a consequência
reforçadora, suprimindo-a temporariamente.
Assim, o primeiro efeito da punição consiste na
eliciação de comportamentos incompatíveis com a resposta
que está sendo punida, sendo este primeiro efeito imediato,
ou seja, acaba por impedir a ocorrência da resposta naquele
exato momento. O segundo efeito pode ser observado no
futuro, mesmo que a resposta não esteja sendo punida
diretamente naquele momento. Neste caso, ocorre de os
estímulos aversivos condicionados na ocasião passada de
punição estarem agora controlando a resposta. Isso porque,
quando um comportamento é punido, qualquer estimulo que
estivesse presente na ocasião da punição, torna-se um
aversivo condicionado, dado o pareamento direto com a
punição. Desta forma, a tendência ao comportamento punido
ou outros estímulos do ambiente que também podem ter sido
9
pareados com a punição no passado passam também a evocar
aqueles estados incompatíveis com a resposta punida. Um
terceiro efeito da punição consiste em que, qualquer
comportamento que reduza o contato com os estímulos
aversivos condicionados será reforçado. Assim, o terceiro
efeito é o estabelecimento de condições aversivas que serão
evitadas por comportamentos de “fazer alguma outra coisa”
(Skinner, 1953).
Dessa forma, o conceito de punição é importante para a
compreensão do autocontrole. Isso ocorre seja pela
eliciação de respostas incompatíveis com a resposta
anteriormente punida, seja pelo efeito enfraquecedor dos
estímulos aversivos condicionados e das respostas
emocionais, que provém de uma história punitiva anterior,
ou porque os mesmos estímulos adquirem função de
reforçadores negativos, por aumentarem a probabilidade de
uma resposta de fuga, levando à redução da condição
aversiva. Portanto, o comportamento de autocontrole ocorre
para evitar as sensações desagradáveis que são eliciadas
quando uma resposta cuja classe de respostas tem um
histórico de punição quando emitidas.
Por exemplo, um sujeito que acorda tarde, porém sempre
que isso acontece e chega atrasado ao trabalho é
repreendido por seu chefe e tem o horário de descanso
reduzido. Quando este sujeito acorda cedo e tem vontade de
dormir mais, ele está diante de um conflito, pois o
comportamento de dormir mais pode gerar reforçadores
(positivos ou negativos), bem como gerar a apresentação de
10
uma punição futura (positiva ou negativa). Desta forma, a
punição estará relacionada com o comportamento de
autocontrole no caso do sujeito fazer alguma outra coisa
que não seja dormir, por exemplo, emitir uma regra para si
próprio como: “Levante-se!”. Ele seguiria esta regra, pois
quando estiver diante da escolha com uma possibilidade de
continuar dormindo, estímulos aversivos condicionados são
eliciados, causando um desconforto incompatível com a ação
de continuar dormindo. Assim, o fazer alguma outra coisa
seria uma resposta de fuga aos estímulos aversivos
condicionados.
Neste caso, a declaração de uma resposta verbal pode
controlar a probabilidade de uma segunda resposta, se esta
adquire uma função aversiva por pareamento com punição pelo
comportamento de desobedecer à instrução. Porém, este
pareamento precisa ser mantido para que seu valor aversivo
não se perca, perdendo também a função de resposta
controladora.
Tendo em vista a emissão desta resposta controladora
de instrução verbal, o individuo emite um dos
comportamentos que podemos chamar de autocontrole. As
variáveis utilizadas pelo sujeito, tais como a apresentação
da estimulação verbal nem sempre são acessíveis e visíveis
para os outros. Outras variáveis podem também ser
manipuladas com objetivo de aumentar a probabilidade da
emissão das respostas que compitam com a resposta que se
deseja controlar, como também para reduzir o valor
11
reforçador das consequências destas respostas, diminuindo
assim, sua probabilidade de emissão.
Sobre estas variáveis controladoras, o estudo de
Mallot e Braam (1990) teve como objetivo, investigar se
descrições verbais controlariam diferencialmente as
respostas não verbais, a depender das contingências. Foram
selecionadas cinco crianças que apresentavam alta
porcentagem de colaboração com os pedidos da professora em
completar tarefas de higiene. As regras apresentadas pelo
experimentador solicitavam que a criança emitisse um
determinado comportamento, como por exemplo, recolher os
brinquedos. Foram apresentadas quatro condições, cada uma
com um tipo diferente de regra apresentada. Foi avaliado o
controle exercido pelas diferentes condições (“pedidos”,
“reforçamento”, “sem apresentação de prazo + reforço
atrasado” e “apresentação de prazo + reforço atrasado”), a
partir da subordinação das crianças às solicitações
apresentadas em cada uma dessas quatro condições.
A hipótese dos autores é de que a descrição dos prazos
potencializaria os efeitos aversivos gerados pela
apresentação da regra, favorecendo a emissão de
comportamentos de acordo com a regra. Para os autores, os
resultados mostram que o controle por regras que descrevam
contingências diretas teria sido estabelecido antes do
estudo, pela história de seguimento de regras de cada
participante. Para os autores os dados do estudo parecem
indicar que as respostas dos participantes estavam sob
controle estrito das condições de reforçamento descritas, e
12
não do controle generalizado das regras, estabelecido
previamente. Porém, a declaração de prazos para finalizar a
tarefa pareceu aumentar o controle das regras que
anunciavam consequências atrasadas.
Foi possível tirar duas conclusões deste estudo. A
descrição de reforços atrasados ou ausência de reforço
parece ter enfraquecido o controle pela regra, e, a
inclusão de prazos (resposta verbal) parece maximizar o
controle da regra que descreve contingências indiretas
envolvendo atraso de reforço. Isto ocorre porque a inclusão
de prazos pode ser entendida como a manipulação de
respostas autoclíticas de mando, alterando a reação do
ouvinte diante das solicitações.
O estudo de Almeida e Hubner (2009) pretende
contribuir com a discussão sobre as condições que afetam a
probabilidade de controle verbal sobre o comportamento não
verbal, investigando se a inclusão de operantes
autoclíticos poderia favorecer este controle.
Para tanto, as autoras analisaram o efeito de
operantes verbais autoclíticos sobre o comportamento de
escolha, avaliando uma possível reversão do padrão de
preferência dos participantes (receber reforço maior a
longo prazo ou reforço menor a curto prazo), diante de/após
apresentação de diferentes declarações verbais. As opções
de escolha para os participantes eram concorrentes, sendo
primeiro observado o padrão de escolha dos participantes e,
então, introduzidas as descrições verbais específicas.
13
Durante esta fase foi também avaliado se a emissão de
autoclíticos alterava o controle pela descrição, que
qualificava como “pior”, por exemplo, a preferência do
participante estabelecida no inicio do experimento. Os
resultados apontam que neste estudo a presença de
autocliticos acompanhando as descrições verbais não foram
suficientes para a reversão do padrão de preferência dos
participantes. No entanto, foi observado o aumento no tempo
para emissão da resposta diante de descrições acompanhadas
por operantes verbas autoclíticos.
Algumas hipóteses foram levantadas para interpretar os
resultados deste estudo, como por exemplo, o histórico de
reforçamento anterior para o comportamento de seguir regras
dos participantes, de forma que, notou-se uma importância
em estabelecer previamente uma função aversiva ou
reforçadora para os autocliticos, pois as qualidades “pior”
e “melhor” podem controlar de maneira diferente as
respostas, dada as diferentes histórias que estabeleceram
seu valor positivo ou negativo para casa participante.
Com relação ao presente trabalho, o estabelecimento
prévio do valor aversivo e postivo de determinados
estímulos foi garantido durante uma das fases
experimentais, de maneira que pudemos assim, ter controle
sobre essa variável, isolando os efeitos da história prévia
dos participantes com as palavras que qualificavam as
escolhas.
14
Desta forma, o presente estudo foi baseado no estudo
de Almeida e Hubner (2009), no sentido de que diferentes
descrições verbais também foram manipuladas a fim de
avaliar a reversão ou não da preferência sobre a quantidade
e probabilidade do reforço por parte dos participantes, ou
seja, se os participantes passam a preferir uma
probabilidade menor para a obtenção de um maior numero de
pontos. Porém, foi feita a mudança com relação aos
parâmetros dos reforçadores planejados, pois na tese das
autoras, estes eram controlados pelo tempo (atrasado ou
imediato) e no presente estudo, será a probabilidade (mais
ou menos provável) bem como a magnitude (mais pontos ou
menos pontos) que irão compor as combinações presentes nas
diferentes escolhas.
A alteração planejada levou em consideração o estudo
de Matos (2013), que teve como objetivo avaliar o efeito da
manipulação dos parâmetros de atraso e probabilidade do
reforço sobre as escolhas em esquemas concorrentes simples
e encadeados e se esses efeitos sugiririam semelhanças
entre esses dois parâmetros.
Matos (2013) avaliou também os efeitos de diferentes
esquemas de reforçamento sobre as escolhas de três
participantes que eram feitas em esquemas concorrentes
simples, sendo uma alternativa composta por reforço maior e
menos provável e a outra por reforço menor e mais provável.
Nas condições de seleção, os três participantes preferiram
o reforçador com menor magnitude e maior probabilidade
inicialmente. Durante o esquema FR/FR do experimento, foi
15
estabelecido o padrão de resposta sob controle do reforço
maior e menos provável (considerado comportamento de
autocontrole), porém, nas condições SigFR (a diferença
entre FR para SigFR é que após a penúltima resposta de
clicar sobre um dos quadrados, eles eram desativados por um
segundo, e a tela ficava escura durante este período e os
cliques não tinham quaisquer efeitos) e FI, a escolha maior
entre os participante foi no componente menos e mais
provável (comportamento impulsivo).
Assim, com base neste estudo de Matos, foi decidido
utilizar o esquema FI/FI em nosso experimento, a fim de
garantir a preferencia pelo reforçador menor e mais
provável na fase inicial do experimento, ou seja, favorecer
o padrão nomeado como impulsivo de responder, e observar
uma possível reversão para o padrão de comportamento de
autocontrole.
SUBPROJETO 1: COMPORTAMENTO VERBALMENTE CONTROLADO E
AUTOCONTROLE: UMA ANÁLISE DO EFEITO DE RESPOSTAS VERBAIS
ACOMPANHADAS POR ESTÍMULOS COM FUNÇÃO AVERSIVA OU
DISCRIMINATIVA SOBRE O COMPORTAMENTO DE ESCOLHA.
MÉTODO
16
Participantes
Participaram do estudo três adultos, selecionados
entre estudantes de uma universidade privada da cidade de
São Paulo. Os participantes foram considerados leitores
fluentes, com conhecimento prévio no uso de computador. Os
participantes assinaram um termo de consentimento livre e
esclarecido, que identificava os objetivos da pesquisa e
garantiam a possibilidade de desistência a qualquer momento
do estudo.
Ao final da pesquisa, os participantes receberam um
brinde por sua participação, sendo o valor determinado pelo
total de pontos obtidos por seu desempenho no jogo de
computador.
Material e local de coleta:
Foi utilizado um computador notebook, equipado com
programa especialmente delineado para o estudo (Woeltz,
2014) com possibilidade de apresentar instruções escritas,
dispor arranjos de estímulos, e registrar o desempenho dos
participantes. Quatro adesivos de cores diferentes
(vermelho, verde, azul e laranja) foram colados às teclas
do computador, indicando aos participantes quais as teclas
deveriam ser acionadas durante o jogo.
Sala com mesa e cadeira, para o participante realizar
a tarefa e termo de consentimento livre e esclarecido.
17
Procedimento:
O procedimento de coleta de dados foi dividido em três
fases principais, com suas respectivas sub-fases:
Fase 1- Instalação de um padrão de preferência por
reforçadores menores e mais prováveis, em uma situação de
escolha concorrente.
O objetivo desta fase foi estabelecer a preferência do
participante pela alternativa de reforço menor e mais
provável, disponível em uma tarefa de escolha entre o
reforço menor e mais provável ou maior e menos provável em
esquema de FI/FI, sendo utilizado o FI de 2 segundos.
Instruções acerca das contingências programadas para as
diferentes respostas de escolha foram apresentadas aos
participantes via computador.
Durante a atividade, dois quadrados de diferentes
cores foram dispostos à esquerda e à direita da tela do
computador. Entre eles, a mensagem “Escolha entre vermelho
(laranja) ou verde (azul)” foi apresentada, sendo
considerada como resposta de escolha a pressão da tecla de
cor respectiva no teclado do computador. Na Subfase 1.1,
quadrados de cor vermelha e verde surgiram na tela, e
respostas de pressão à tecla de cor vermelha foram seguidas
pela apresentação de reforço menor e mais provável com 95%
de probabilidade de acesso ao reforçador (2 pontos) ; e
respostas na tecla verde foram seguidas pela apresentação
18
de reforço maior e menos provável com 28% de probabilidade
de acesso ao reforçador (8 pontos). Na subfase 1.2, a única
modificação planejada foi nas cores dos quadrados e teclas,
que passaram a ser de cor laranja (reforçador menor e mais
provável) e azul (reforçador maior e menos provável). A
mudança de cores nas duas condições foi planejada a fim de
garantir que as respostas motoras permanecessem sob
controle dos estímulos visuais, aumentando a probabilidade
do participante atentar para instruções e demais mudanças
na tela, previstas nas condições posteriores.
Em cada uma das Subfases 1 e 2, a tarefa foi iniciada
com oito tentativas de escolha-forçada. Nestas tentativas,
a tela do computador apresentava os dois quadrados de
diferentes cores e a mensagem de escolha, mas apenas uma
das teclas do teclado estava em funcionamento. O objetivo
desta manipulação foi garantir que o participante tinha
contato com as contingências programadas nas duas teclas,
antes do início das tentativas de escolhas-livres. Após o
encerramento das tentativas de escolha-forçada, os
contadores eram zerados e a tela escurecida. Uma pressão
na barra de espaço indicava que o participante estava
pronto para iniciar as tentativas de escolha-livre. A
partir de então, a escolha por uma das teclas do par em
funcionamento foi seguida pela soma de pontos no contador
de cor respectiva, que apresentava o total de pontos
obtidos na sessão. Após a emissão da resposta de escolha,
os dígitos foram apresentados na parte de cima dos
contadores, acompanhados por um bip. Os dígitos
19
sobrepuseram-se uns aos outros, em intervalos de 500ms,
ficando coloridos e visíveis ao participante por 2s, antes
de serem somados ao total obtido nas tentativas anteriores.
O intervalo entre tentativas foi de 2s, independente da
escolha anterior.
Para o encerramento das fases, um critério de
preferencia foi estipulado a partir da escolha por uma das
alternativas de reforço em 75% das oportunidades
apresentadas, em um bloco de 20 tentativas. O máximo de
quatro blocos foi previsto para que o participante alcance
o critério de preferência, e as fases encerradas. Caso o
índice de preferencia não tivesse sido atingido após dois
blocos, um ajuste no esquema do reforço foi programado ao
início do terceiro bloco a fim de favorecer a direção da
escolha por reforçadores menores e mais prováveis. Assim,
um ajuste nos parâmetros do reforço foi programado ao
início do terceiro bloco, a fim de favorecer a escolha na
direção do reforço menor e mais provável. O reajuste
implicava em: o participante passar a receber 3 pontos (ao
invés de 2) a cada escolha/pressão na tecla correspondente
ao reforço menor e mais provável, mantendo-se a
probabilidade de 95% de chance de acesso ao reforçador. Ao
mesmo tempo, continuaria recebendo 8 pontos caso opte pela
escolha do reforçador maior e menos provável. No entanto,
passará a ter a 20% de probabilidade (não mais 28%) de
acesso ao reforçador.
Caso o critério não fosse atingido após o total de
quatro blocos, o participante seria desligado do estudo,
20
não prosseguindo para as fases posteriores. Quando
necessário o ajuste, os parâmetros definidos na Fase 1.1
foram mantidos na Fase 1.2, desde o início do primeiro
bloco.
Ao final de cada Subfase, o participante chamava o
pesquisador, que conferia os pontos obtidos. O
participante, então, recebe um recibo e era convidado a
participar das próximas Fases do estudo.
Fase 2 – Estabelecimento do valor aversivo e positivo para
dois estímulos via condicionamento respondente.
Nesta fase, dois estímulos compostos por
pseudopalavras “VEG e VOJ” foram apresentados durante
condições de perda ou ganhos de reforços, em uma tarefa de
computador.
Os participantes foram convidados a montar um quebra-
cabeça, a partir de respostas de pressão às teclas do
computador.
Na presença do estímulo VEG, respostas a uma das
teclas levava ao aparecimento das imagens do quebra-cabeça
no centro da tela, e ao acréscimo de pontos em um contador
localizado acima da imagem. Na presença do estímulo VOJ,
respostas de pressão leva a perda de pontos e de 3 peças do
quebra cabeça. Cada condição de apresentação dos dois
estímulos ocorreu por dez vezes, de forma randômica por 10
segundos cada.
21
Após a quinta tentativa de apresentação de casa uma
das condições de est[imulo, uma mensagem aparecia na tela,
avisando ao participante que, caso quisesse, poderia
apertar a barra de espaços, para mudar de tela, encerrando
a tentativa. O objetivo de tal manipulação foi avaliar se a
pseudopalavra VOJ poderia ser um estímulo que tivesse
adquirido função aversiva, já que uma resposta de
fuga/esquiva seria provável nesta condição. O mesmo não
seria esperado no caso de VEG, o que levaria o participante
a não emitir respostas de fuga/esquiva diante de sua
apresentação.
Fase 3 – Apresentação de descrições verbais acompanhadas
por estímulos com função aversiva ou positiva.
Nesta fase, os participantes foram submetidos às
mesmas contingências de escolhas concorrentes descritas na
Fase 1. No entanto, diferentes descrições verbais foram
apresentadas antes de cada escolha, o que permitiu avaliar
seu efeito sobre a reversão (ou não) do padrão de
preferência antes estabelecido.
Para todos os participantes, nas dez tentativas
iniciais desta fase não houve apresentação de qualquer tipo
de descrição acerca das respostas de escolha. Tal
manipulação pretendeu avaliar a estabilidade do padrão de
preferência estabelecido na Fase 1, o que permitiu
esclarecer se possíveis mudanças neste padrão seriam, de
fato, decorrentes da introdução das diferentes descrições.
A partir de então, vinte novas tentativas foram
22
sequencialmente apresentadas, sendo antecedidas por uma
descrição acompanhada por um estímulo VEG ou VOJ,
relacionadas com condições de reforçamento positivo ou
punição durante a Fase 2, o que teria permitido a aquisição
de uma função positiva ou aversiva os estímulos, via
condicionamento respondente. As descrições acompanhadas
pelas pseudopalavras VEG e VOJ foram, assim, posicionadas
acima de um dos quadrados coloridos dispostos na tela do
computador, de forma para o participante que inicialmente
demonstrou preferencia pela escolha de reforçamento menor e
mais provável, a seguinte descrição verbal aparecia sobre o
quadrado de escolha por reforçamento maior e menos provável
“Escolher aqui é...VEG (estímulo que teria adquirido valor
eliciador positivo e de provável estímulo discriminativo a
partir da história de condicionamento na fase anterior). De
forma contrária, a seguinte descrição verbal aparecia sobre
a quadrado respectivo à preferência inicial estabelecida “
Escolher aqui é... VOJ” (estímulo que teria adquirido valor
aversivo a partir da história de condicionamento na fase
anterior).
Todas as condições descritas foram apresentadas em uma
única sessão. Terminada a sessão, os participantes foram
avisados pelo computador do encerramento do estudo,
recebendo do pesquisador o recibo do brinde a ser recebido
após a sessão.
23
RESULTADOS E DISCUSSÃO
Os resultados agora apresentados serão discutidos de
acordo com os seguintes aspectos: estabelecimento do padrão
de preferência dos participantes entre as alternativas de
reforçamento menor e mais provável ou reforçamento maior e
menos provável; aquisição de diferentes funções (aversiva e
positiva) na apresentação de estímulos verbais (VEJ e VOJ);
e os efeitos produzidos pela apresentação das diferentes
descrições verbais acompanhadas por estas pseudopalavras na
reversão ou não do padrão de preferência inicial.
1) ESTABELECIMENTO DO PADRÃO DE PREFERÊNCIA ENTRE O REFORÇADOR
MENOR E MAIS PROVÁVEL, E O REFORÇADOR MAIOR MENOS PROVÁVEL:
O objetivo desta fase foi estabelecer a preferência do
participante pela alternativa de reforço menor e mais
provável, disponível em uma tarefa de escolha entre o
reforço menor e mais provável ou maior e menos provável.
Os resultados encontrados revelam que, os três
participantes alcançaram o critério de estabilidade
definido para caracterizar a preferência pela escolha do
reforçador menor e mais provável na Fase 1, ou seja,
atingiram o índice de 75% de escolhas por esta alternativa
de reforço a longo das tentativas disponíveis na Fase 1.
Os gráficos abaixo representam o desempenho dos
participantes ao longo da Fase 1 e correspondem às
respostas emitidas nos diferentes blocos de 20 tentativas
cada. A área cinza do gráfico indica as respostas de
escolha do participante pelo reforçador menor e mais
24
provável. Os triângulos indicam as respostas emitidas que
obtiveram pontos como consequência, dadas as diferentes
probabilidades de obtenção de reforço programadas pelo
experimentador.
Para P1, das 20 tentativas de escolha disponíveis no
primeiro bloco, como demonstrado na Figura 1, 100% delas
ocorreram no quadrado vermelho, ou seja, reforçador menor e
mais provável. Assim, o participante passou para a fase 1.2
após o primeiro bloco de tentativas.
Na fase 1.2., 95% das escolhas do participante
ocorreram no quadrado laranja (reforçador menor e mais
provável), e 5% no quadrado azul (reforçador maior e menos
provável). Somente uma das escolhas dentre as 20 tentativas
foi no quadrado azul. Esta ocorreu na primeira tentativa do
bloco 1 (L/A), e não houve pontos como consequência. Nas 19
tentativas restantes, as escolhas foram concentradas na
tecla que dava acesso ao reforçador menor e mais provável,
sendo que 18 delas tiveram pontos como consequência, e
somente em uma delas não houve pontos (tentativa 10).
25
Figura 1: Respostas de escolha emitidas por P1 ao longo
dos blocos nas subfases 1.1 (V/V) e na subfase 1.2 (L/A).
Desta forma, o participante seguiu para a fase 2 com
um padrão de preferência sob controle do reforçador menor e
mais provável, concentrando entre 99% a 100% de suas
respostas nas teclas que dão acesso a este reforçador.
No caso dos participantes P2 e P3, pode-se notar que o
estabelecimento de padrão de preferência foi bastante
diferente do que observado no caso de P1.
Ambos os participantes (P2 e P3), iniciaram o estudo
dividindo suas escolhas entre os dois tipos de reforçadores
(menor e mais provável, e maior e menos provável), e
precisaram de 2 blocos para atingir o critério de
preferência de 75% de escolhas pelo reforçador menor e mais
provável na Subfase 1.1, e um bloco para a fase 1.2.
26
Para P2, na Subfase 1.1., das 20 tentativas de escolha
disponíveis no primeiro bloco, como demonstrado na Figura
2, 50% delas ocorreram no quadrado vermelho, ou seja,
reforçador menor e mais provável. O dado indica que o
participante tendia a dividir suas escolhas entre as
alternativas concorrentes, provavelmente como uma
estratégia para aumentar seus ganhos, ficando sob controle
tanto da magnitude do reforçador (escolha pelo reforçador
maior e menos provável), quanto da maior probabilidade do
ganho dos pontos (reforçador menor e mais provável). Ao
longo das tentativas do primeiro bloco, nota-se também que
P2 se manteve respondendo no reforçador maior e menos
provável, possivelmente porque por três vezes o
Participante obteve reforço, sempre após três tentativas em
que insistia na escola desse reforçador. Nota-se, neste
caso, que uma sequência de responder foi casualmente
reforçada, o que poderia levar ao fortalecimento de um
padrão de variação entre as duas alternativas de reforço.
Assim, o Participante 2 precisou de mais um bloco para
atingir o critério de 75% de escolhas pelo reforçador menor
e mais provável, passando para a sub-fase 1.2 após 31
respostas de escolha, conforme mostra a Figura 2.
Na Subfase 1.2, P2 obteve reforço nas cinco respostas
de escolha pelo reforçador maior e menos provável. O
programa de computador foi programado de forma que 28% das
respostas emitidas neste reforçador fossem reforçadas.
Dentre as 20 tentativas disponíveis, em seis delas,
27
aleatoriamente, o Participante poderiam ser reforçado.
Assim, o Participante foi reforçado nas cinco respostas
emitidas neste reforçador, fato que aumenta a probabilidade
de resposta neste reforçador.
Figura 2: Respostas de escolha emitidas por P2 ao longo
dos blocos nas subfases 1.1 (V/V) e na subfase 1.2 (L/A).
Para P3, na Subase 1.1., das 20 tentativas de escolha
disponíveis no primeiro bloco, como demonstrado na Figura
3, 60% delas ocorreram no quadrado vermelho, ou seja,
reforçador menor e mais provável. As outras 40% respostas
de escolha ocorreram no quadrado verde, ou seja, reforçador
maior e menos provável.
28
Figura 3: Respostas de escolha emitidas por P3 ao longo
dos blocos nas subfases 1.1 (V/V) e na subfase 1.2 (L/A).
No entanto, deve-se notar que, diferentemente de P1, o
participante P3, tal como P2, nunca deixou de dividir as
suas escolhas. O que pode explicar este padrão é o fato de
que P1 foi reforçado por 90% das suas respostas de escolha
no reforçador menor e mais provável e não obteve reforço
pelas respostas de escolha no reforçador maior e menos
provável. Já P2 e P3 entraram em contato com a consequência
reforçadora nos dois tipos de reforçadores, apesar de ter
acontecido com maior frequência para o reforçador menor e
mais provável.
Como se pode notar, assim como P2, P3 divide suas
respostas de escolha entre os dois tipos de reforçadores,
recebendo mais frequentemente reforço após escolhas pelo
29
reforçador menor e mais provável. O Participante 3 parece
ter se exposto mais as contingências de maior probabilidade
de reforço, o que pode ter sido uma variável importante
para explicar a maior concentração de escolhas nesta
alternativa no início do bloco 2, e ao final do bloco 1
(L/A). No bloco 2 da primeira subfase (vermelho e verde),
P3 passa a emitir um comportamento um pouco mais estável,
respondendo mais vezes no reforçador menor e mais provável,
e sendo reforçado em 6 das 7 respostas de escolhas emitidas
neste reforçador em sequência.
Na subfase 1.2 (laranja e azul) 4 das 5 respostas de
escolha emitidas por P3 para o reforçador maior e menos
provável não obtiveram reforço como consequência. Já todas
as respostas emitidas pelo reforçador menor e mais provável
foram reforçadas. Com esse desempenho, P3 alcança o
critério de preferência de 75% de escolhas pelo reforçador
menor e mais provável. Porém, deve-se notar que, P3 ainda
divide as respostas de escolha até o final da Fase 1
conforme mostra a Figura 3. Das 16 tentativas em que o
participante alterna para a resposta de escolha pelo
reforçador menor e mesmo provável, em 6 delas P3 é
reforçado.
Assim, tanto para P2 quanto para P3, as contingências
mantiveram o comportamento de alternar a resposta de
escolha em ambos os reforçadores, ainda que o critério de
75% de respostas de escolhas pelo reforçador menor e mais
provável tenha sido alcançado.
30
2) ESTABELECIMENTO DO VALOR AVERSIVO E POSITIVO PARA VEG E VOJ VIA
CONDICIONAMENTO
O objetivo da Fase 2, foi produzir valor aversivo e
positivo para cada uma das pseudopalavras VOJ e VEG,
respectivamente, e observar seus efeitos posteriores sobre
o responder dos participantes. A fase foi subdividias em
duas subfases:
Na subfase 2.1, os participantes passaram por uma
atividade de quebra cabeça, na qual diante de VEG, a
pressão na tecla enter tinha como consequência três pontos
acrescidos no contador, bem como o acréscimo de três peças
em um quebra cabeça disposto na tela do computador. Diante
de VOJ, a pressão na tecla enter tinha como consequência
três pontos diminuídos do contador e a diminuição de três
peças da tela.
Cada condição dos dois estímulos foi apresentado por
cinco vezes de forma randômica, e tiveram a duração de 10s,
sendo apresentados por cinco vezes cada um, aleatoriamente.
A única tecla que estava em funcionamento nesta fase era a
tecla enter.
Após 10 tentativas de pressão a tecla, a Subfase 2.2
tinha início, sendo mantidas as mesmas contingências
programadas na Subfase 2.1, exceto pelo fato de que ao
início da sexta tentativa, o participante recebia a
instrução de que poderia pressionar a tecla de espaço para
31
“pular” o estímulo que desejasse, ou seja, o participante
podia, ao pressionar a tecla espaço, subtrair a
apresentação de VEG ou VOJ, quantas vezes desejasse. O
objetivo desta manipulação foi verificar se algum estímulo,
VEG ou VOJ, teria adquirido função aversiva, dado que o
participante poderia emitir comportamento de fuga diante
deste, ao “pular” este estímulo e esquivar-se de
possibilidade de perder pontos ao pressionar a tecla enter
em sua presença.
Para os três participantes, a fase teve início com a
apresentação do estímulo VEG. Durante esta primeira
apresentação, os participantes seguiram os 10 segundos
pressionando a tecla enter continuamente. Durante as
condições em que o estímulo VEG era apresentado, os
participantes respondiam com pressões a tecla enter
continuamente, obtendo os pontos correspondentes e peças
para seu quebra-cabeças.
No momento em que o estímulo VOJ foi apresentado pela
primeira vez, o participante P1 pressionou uma vez a tecla
enter e teve 3 pontos descontados do seu contador, ao mesmo
tempo em que três peças foram retiradas do quebra cabeça. A
partir deste momento, todas as vezes em que VOJ estava
disponível, o sujeito ignorou o teclado pelos 10 segundos,
e nenhuma resposta foi contabilizada novamente durante a
presença de VOJ para P1.
32
A Figura 4 representa quantas respostas de pressão a
tecla enter foram dadas na presença do estímulo VEG (cinza)
e na presença do estímulo VOJ (preto).
0
20
40
60
80
100
Ser...
Pressões à tecla enter em
porcentagem VOJ
FIGURA 4: Porcentagem de resposta de pressão à tecla enter
do participante P1 diante do estímulo VEG e diante do estímumo
VOJ.
Já para P2, no momento em que o estímulo VOJ foi
apresentado pela primeira vez, o participante pressiona uma
vez a tecla enter e tinha 3 pontos descontados do seu
contador e três peças saíram do quebra cabeça. Diferente de
P1, P2 seguiu pressionando a tecla enter na presença de VOJ
por 17 vezes, o que levou a perda de 51 pontos. A
frequência de pressões foi diminuindo ao longo da fase,
porém, P2 seguiu pressionando até o final da fase, não
deixando de responder totalmente.
33
0
20
40
60
80
100
Ser...
Pressões à tecla enter em
porcentagem VOJ
FIGURA 5: Porcentagem de resposta de pressão à tecla enter
do participante P2 diante do estímulo VEG e diante do estímumo
VOJ.
Para P3, no momento em que o estímulo VOJ foi
apresentado pela primeira vez, o participante pressiona a
tecla enter nove vezes e perde 21 pontos dos 30
anteriormente adquiridos diante de VEJ, bem como a perda
das peças do quebra cabeça. P3 finalizou a fase 2.1. com 93
pontos, o que indica que a pressão da tecla enter diante de
VEG foi maior (92%) que diante de VOJ (8%), como mostra a
Figura 6. Desta forma, tanto P2 quanto P3 terminaram a Fase
2 com um saldo de pontos positivo, apesar de ambos seguirem
pressionando a tecla enter diante de VOJ até o final do
experimento, mas com uma frequência menor em comparado a
frequência diante de VEG.
34
0
20
40
60
80
100
Ser...
Pressões à tecla enter em
porcentagem VOJ
FIGURA 6: Porcentagem de resposta de pressão à tecla enter
do participante P3 diante do estímulo VEG e diante do estímumo
VOJ.
Na fase 2.2, quando os participantes podiam pular a
apresentação de uma das condições de estímulos pressionando
a tecla espaço, P1 a pressionou todas as vezes em que o
estímulo VOJ foi apresentado, e não houve pressão diante do
estímulo VEG, como mostra a Figura 7. O dado parece sugerir
que o estímulo VOJ tenha adquirido valor aversivo.
0
20
40
60
80
100
Ser...
Pressões à tecla de espaço
em porcentagem
VEG
35
FIGURA 7: Porcentagem de resposta de pressão à tecla de
espaço do participante P1 diante do estímulo VEG e diante do
estímumo VOJ.
Para P2, nesta subfase 2.2, o participante pressionou
continuamente a tecla enter diante de VEG, recebendo a
pontuação de acordo com as pressões. Já diante de VOJ, o
participante pressiona a tecla enter somente uma vez,
perdendo 3 pontos. Após isso, pressiona a tecla espaço
todas às vezes que o estímulo VOJ está presente, como
mostra a Figura 8.
0
20
40
60
80
100
Ser...
Pressões à tecla de espaço
em porcentagem
VEG
FIGURA 8: Porcentagem de resposta de pressão à tecla de
espaço do participante P2 diante do estímulo VEG e diante do
estímumo VOJ.
P3, por sua vez, pressionou todas às vezes (100%) a
tecla de espaço, emitindo comportamento de esquiva/fuga
diante do estímulo VOJ, como pode ser observado na Figura
9, esquivando-se da contingência de perda de pontos diante
de sua apresentação. Diante de VEG continuou pressionando a
tecla enter, terminando a Fase 2 com um saldo de 129 pontos.
36
0
20
40
60
80
100
Ser...
Pressões à tecla de espaço
em porcentagem
VEG
FIGURA 9: Porcentagem de resposta de pressão à tecla de
espaço do participante P1 diante do estímulo VEG e diante do
estímumo VOJ.
Uma síntese dos resultados dos três participantes
sugere que, o estímulo VOJ parece ter adquirido valor
aversivo, pois os participantes emitem comportamento de
fuga diante deste, pressionando a tecla de espaço que
permitia que os participantes “pulassem” o estímulo,
esquivando-se da perda dos pontos e das peças. Já o
estímulo antes neutro VEG, parece ter adquirido valor
discriminativo para a resposta de pressão na tecla enter,
pois os participantes emitiam a resposta de pressão nesta
tecla continuamente diante de VEG. Ainda que nesta fase o
valor positivo de VEG não tenha sido testado, entende-se
que esta função possa também ter sido adquirida pela
pseudopalavra, dado seu pareamento com a apresentação do
reforço.
37
3) EFEITOS PRODUZIDOS PELA APRESENTAÇÃO DAS DIFERENTES DESCRIÇÕES
VERBAIS (VEG E VOJ) NA REVERSÃO OU NÃO DO PADRÃO DE PREFERÊNCIA:
Na Fase 3, os participantes foram submetidos às mesmas
contingências de escolhas concorrentes descritas na Fase 1.
No entanto, diferentes descrições verbais foram
apresentadas antes de cada escolha, o que permitiu avaliar
seu efeito sobre a reversão (ou não) do padrão de
preferência antes estabelecido.
Nas dez tentativas iniciais desta fase (3.1) não houve
apresentação de qualquer tipo de descrição acerca das
respostas de escolha. Tal manipulação pretendeu avaliar a
estabilidade do padrão de preferência estabelecido na Fase
1, o que permitiria esclarecer se possíveis mudanças neste
padrão seriam, de fato, decorrentes da introdução das
descrições acompanhadas pelas pseudopalavras VEG e VOJ.
A partir de então, vinte novas tentativas foram
sequencialmente apresentadas, sendo antecedidas por uma
descrição acompanhada por um estímulo VEG ou VOJ,
relacionadas a função positiva ou aversiva, via
condicionamento respondente. As descrições foram
posicionadas acima de um dos quadrados coloridos dispostos
na tela do computador, de forma a avaliar seu efeito sobre
o padrão de preferencia inicialmente estabelecido na Fase
1. Assim, o participante que inicialmente demonstrou
preferencia pela escolha de reforçamento menor e mais
provável, a seguinte descrição verbal apareceu sobre o
quadrado de escolha por reforçamento maior e menos provável
38
“Escolher aqui é...VEG (estímulo que teria adquirido valor
apetitivo e de provável estímulo discriminativo a partir da
história de condicionamento na fase anterior). De forma
contrária, a seguinte descrição verbal surgirá sobre a
quadrado respectivo à preferência inicial estabelecida “
Escolher aqui é... VOJ” (estímulo que teria adquirido valor
aversivo a partir da história de condicionamento na fase
anterior).
A figura abaixo ilustra o desempenho do Participante 1
ao longo das três subfases (sem instrução, VEG e VOJ) da
Fase 3. As linhas pontilhadas dividem as subfases compostas
por 10 oportunidades de escolhas. A área cinza do gráfico
indica quais respostas emitidas pelo participante foram de
acordo com a a instrução, e respostas na área sem cor são
opostas à instrução.
39
FIGURA 10: Respostas de escolha nas dez tentativas de cada
subase disponíveis, emitidas pelo participante P1 ao longo da
fase 3. A área em cinza é aquela em que as respostas de escolha
foram pelo reforçador maior e menos provável, ou seja, respostas
que podem estar son controle da instrução.
Como se pode notar, na subfase 3.1, 100% das escolhas
de P1 foram no reforçador menor e mais provável, ou seja, ,
no caso de P1, nota-se a manutenção de um padrão de
preferência estabelecido no início do experimento.
Nas próximas 10 tentativas (subfase 3.2), somente na
primeira o participante seguiu a instrução, de forma que o
quadrado selecionado foi o corresponde ao reforço maior e
menos provável, resposta considerada de acordo com o
descrito na instrução e oposta ao que o participante vinha
fazendo até então durante o experimento. Assim, o quadrado
selecionado foi o que continha acima a frase “fazer isto é
VEG”. Nota-se, no entanto, que nesta tentativa, P1 não
obteve pontuação por seguir a instrução e emitir a resposta
de escolha diante de VEG, o que pode explicar que nas novas
tentativas seguintes o participante não tenha se comportado
de acordo com as instruções, passando a escolher pelo
reforço menor e mais provável, que foi recebido em 8 das 9
tentativas desta Subfase (exceto na tentativa 5.
Nas 10 tentativas seguintes (Subfase 3.3), a frase
“fazer isto é VOJ” aparecia acima do quadrado que tinha
como consequência o reforço menor e mais provável. Somente
em uma delas o participante seguiu a regra, como pode ser
40
observado na Figura 10. De forma que, novamente, na
primeira tentativa do bloco, o quadrado selecionado foi o
corresponde ao reforço maior e menos provável, padrão
correspondente ao descrito na instrução e oposto ao
estabelecido na Fase 1 e o que vinha sendo mantido nas
tentativas anteriores da sub fase 3.2. Mais uma vez, P1 não
obteve o recebimento de pontos como consequência por seguir
a instrução nesta tentativa e durante as 9 tentativas
seguintes, o quadrado selecionado passou a ser aquele que
tinha como consequência para a resposta de escolha, reforço
menor e mais provável, ou seja, os quadrados que continham
a cima a frase “fazer isto é VOJ”. Destas 9 oportunidades
de escolha, em todas elas o participante obteve pontos como
consequência por não seguir a instrução.
Assim, observamos que o estímulo anteriormente neutro
VOJ, parece ter obtido valor aversivo durante a atividade
de quebra cabeça, pois, o participante emitiu comportamento
de fuga na presença deste, durante a Fase 2 do estudo.
Porém, durante a Fase 3, em que investigamos se diante de
VOJ o participante reverteria seu padrão de preferencial,
pudemos notar que inicialmente ele seguiu a regra, porém,
como as consequências permanecem as mesmas de quando ele
estabeleceu sua preferencia, o participante voltou a
responder de acordo com esta.
Os dados nos mostra que, mesmo que pseudopalavras com
valor aversivo ou positivo tenham sido incluídas para
favorecer o seguimento da instrução, elas não
41
necessariamente aumentam a probabilidade de seguimento da
instrução, quando as contingencias para o seguimento da
regra não sejam mantidas pelo acréscimo de pontos.
No caso do Participante 1, nota-se que ele nunca foi
reforçado por seguir a instrução neste experimento, e por
outro lado, tem uma história bastante forte de reforçamento
para a resposta de escolha pelo reforçador menor e mais
provável. Assim, mesmo quando as descrições foram
acompanhadas de pseudopalavras com valor aversivo ou
positivo, a história de reforçamento deste participante em
específico, parece contribuir para que ele continue se
comportando da maneira que vinha fazendo ao longo do
estabelecimento do padrão de preferência.
Uma hipótese acerca destes resultados seria a de que,
o participante teria entrado mais em contato com a
consequência reforçadora (pela resposta de pressão à tecla
diante de VEG) na Fase 2, do que com consequências
aversivas na presença de VOJ nesta mesma Fase. Por mais que
durante o experimento ele tenha emitido comportamento de
esquiva de VOJ, poucas foram as vezes em que ele entrou de
fato em contato com a perda dos pontos, pois assim que isto
ocorreu ele não mais pressionou a tecla que retirava pontos
e peças da tela diante de VOJ.
Desta forma, para P1, a história construída ao longo
do experimento, somada a uma história pessoal anterior do
participante de seguimento de instruções, parece não ter
contribuído para que o estímulo verbal tivesse maior
42
controle sobre o comportamento do seguir instruções neste
experimento do que as contingências atuais.
No caso de P2, no entanto, nota-se um padrão diferente
do que o de P1 já na fase 3.1, na qual não havia instrução
para a resposta de escolha. Nesta fase, 70% das escolhas de
P2 foram no reforçador menor e mais provável, ou seja,
pode-se notar, no caso de P2, a manutenção de um padrão de
preferência estabelecido no início do experimento, porém,
com uma variação maior, ele não manteve o critério 75% de
preferência por esta alternativa de reforço, tal como na
Fase 1. Somente em três das dez tentativas da sub-fase 3.1,
P2 emitiu resposta de escolha no quadrado correspondente ao
reforço maior e menos provável. Em nenhuma das três
tentativas o participante obteve pontos como reforço. Uma
provável hipótese acerca da emissão de respostas de escolha
por esta alternativa de reforço, ainda que o participante
não viesse recebendo pontos durante esta subfase 3.1.,
seria de que na Fase 1 ele foi bastante reforçado por
manter um comportamento de alternar entre os reforço,
incluindo assim, a escolha pelo reforço maior e menos
provável.
Já nas sete respostas de escolha no quadrado
correspondente ao reforçador menor e mais provável pode-se
observar o recebimento de pontos como reforço em todas
elas, como mostra a Figura 11.
43
FIGURA 11: Respostas de escolha nas dez tentativas de cada
subase disponíveis, emitidas pelo participante P2 ao longo da
fase 3. A área em cinza é aquela em que as respostas de escolha
foram pelo reforçador maior e menos provável, ou seja, respostas
que podem estar son controle da instrução.
Nas próximas 10 tentativas (subfase 3.2), a frase
“fazer isto é VEG” aparecia acima do quadrado que tinha
como consequência o recebimento do reforço maior e menos
provável, favorecendo a escolha oposta ao padrão
estabelecido até então. Nesta subfase, das 10 tentativas
disponíveis diante do estímulo VEG, em cinco delas o
participante escolher o reforçador maior e menos provável,
padrão de acordo ao sugerido na instrução (50%), como pode
ser observado na Figura 11. Na primeira das tentativas
desta sub-fase, P2 segue a instrução, porém, não é
reforçado por isto, passando a emitir a resposta de escolha
no reforçador (menor e mais provável) em seguida, sendo
44
reforçado por comportar-se em desacordo ao sugerido na
instrução. Isto parece indicar que as contingências atuais
parece não contribuir para a manutenção do comportamento de
seguir regras.
Na terceira tentativa da Subfase 3.2, P2 volta, no
entanto, a escolher por reforçador maior e menos provável,
de acordo com o padrão especificado na instrução. Dado que
o participante não recebeu reforço anterior por seguir a
instrução e escolher por esta alternativa de reforço nesta
subfase, escolher novamente por reforçador maior e menos
provável pode sugerir tanto que a presença de VEG possa ter
estabelecido valor positivo para esta escolha, independente
das contingencias atuais mantidas; quanto que o padrão de
dividir as escolhas entre os dois reforçadores, reforçado
na Fase 1 do experimento, foi mantido durante esta Subfase
3.2.
P2 foi reforçador ao emitir resposta de escolha na
alternativa de reforço maior e menos provável, após emitir
algumas respostas no reforçador menos e mais provável.
Assim, o padrão parece estar mais sob o controle das
contingências do que sob controle da instrução, atenuando o
valor do Sd verbal.
Quando é reforçado por 4 tentativas seguidas de
escolha pelo reforçador oposto ao seguir a instrução, P2
continua a emitir resposta de escolha neste reforçador até
que não recebe reforço. Assim como nas tentativas
anteriores, quando P2 não recebe reforço pela resposta de
45
escolha, ele emite comportamento de escolha no reforçador
oposto, e neste caso ele é reforçado.
O padrão de alternação que P2 apresenta (quatro
tentativas em reforçamento menor e mais provável, passando
para uma variação para maior e menos provável), pode
indicar um maior controle sobre as contingências do que das
pseudopalavras. Ou seja, parece que as contingências são
relevantes no controle do padrão do responder de P2,
independente da presença de VEG e VOJ.
As próximas 10 tentativas (subfase 3.3) aparecem com a
frase “fazer isto é VOJ” acima do quadrado que tinha
reforço menor e mais provável como consequência para a
resposta de escolha. Nesta subfase, das 10 tentativas
disponíveis diante do estímulo VOJ, somente em duas delas o
participante não escolheu o quadrado correspondente a VOJ.
O dado parece indicar que o estimulo não parece exercer
valor aversivo sobre o responder do sujeito, como efeito do
enfraquecimento do valor do estímulo na subfase anterior.
P2 começou a Subfase 3.3 respondendo no quadrado
corresponde a escolha pelo reforçador menor e mais provável
e obtém pontos em todas as escolhas. Nota-se assim, que ele
não iniciou esta subfase seguindo a instrução. Na quinta
tentativa, o participante volta a alternar a escolha para a
alternativa de reforço maior e menos provável e recebe
pontos como reforço, porém, em seguida passa a responder no
reforçador menor e mais provável, ou seja, faz o oposto à
instrução. P2 volta a responder no reforçador menor e mais
46
provável por quatro tentativas, obtendo pontos em todas
elas até que na ultima tentativa, responde no quadrado
correspondente ao reforçador maior e menos provável,
seguindo a instrução, porém, novamente não obtém pontuação
por esta resposta de escolha.
Esses dados sugerem que na subfase 3.3 (VOJ), P2
responde menos de acordo com a instrução do que na subfase
3.2 (VEG). Mesmo quando foi reforçado por emitir resposta
de escolha de acordo com a instrução, não permaneceu
emitindo resposta de escolha por este reforçador. Isto pode
mostrar que P2 não está sob controle da instrução, mas pode
ainda está dividindo as respostas de escolha entre os dois
reforçadores, padrão estabelecido pelas contingências de
reforçamento intermitente para o comportamento de alternar
suas escolhas ao longo do estudo.
Novamente podemos inferir que ao longo do experimento,
o contato com as contingências reforçadoras tem maior
controle sobre o responder do participante, do que a
variável verbal, mesmo que esta tenha adquirido um valor
aversivo ou positivo no experimento na Fase 2.
Na fase 3.1, na qual não havia instrução para a
resposta de escolha, 100% das escolhas de P3 foram no
reforçador menor e mais provável, confirmando o padrão de
preferência estabelecido na Fase 1. Durante as 10
tentativas, nas 9 primeiras o participante obteve como
consequência os pontos correspondentes a respostas de
escolha no reforçador menor e mais provável. Ou seja,
47
somente na ultima não houve consequência, como mostra a
Figura 12.
Na subfase 3.2, das 10 tentativas disponíveis diante
do estímulo VEG, em sete delas o participante seguiu a
instrução (70%), como pode ser observado na Figura 12.
Assim, o quadrado selecionado por sete vezes foi o que
continha acima a frase “fazer isto é VEG”. Destas sete,
quatro delas tiverem reforço como consequência.
FIGURA 12: Respostas de escolha nas dez tentativas de cada
subase disponíveis, emitidas pelo participante P3 ao longo da
fase 3. A área em cinza é aquela em que as respostas de escolha
foram pelo reforçador maior e menos provável, ou seja, respostas
que podem estar son controle da instrução.
48
Na primeira tentativa da sub-fase 3.1, o participante
seguiu a instrução, o que parece sugerir o controle que a
pseudopalavra exerceu sobre o responder, pois o
participante vinha respondendo no reforçador oposto durante
toda a subfase anterior (3.1). P3 é reforçado por seguir a
instrução, e segue por 5 tentativas neste reforçador maior
e menos provável. Depois de duas tentativas consecutivas
sem obter reforço, o participante passa a responder no
outro reforçador, dividindo as escolhas entre os dois até o
final da subfase 3.2.
Na subfase 3.3, novamente P3 comporta-se de acordo com
o sugerido na instrução e é reforçado por isto, passando a
responder de forma muito parecida com a subfase 3.2. A
partir dos dados, parece que, inicialmente, o estímulo
verbal exerce controle sobre o responder do sujeito. Porém,
quando não recebe mais reforço por esta resposta, passa a
revezar novamente, podemos dizer que P3 esta em certa
medida, sob controle das contingências atuais.
Com base nesses dados, parece que P3 esteve sob
controle das instruções inicialmente, e por ter sido
reforçado também por seguir as instruções, porém, foi mais
reforçado por não fazê-lo. Assim, ao final do experimento,
o participante esteve sob controle das contingências,
mantendo seu padrão de revezar entre os reforçadores.
Os resultados agora apresentados referem-se a uma
análise ao desempenho dos participantes ao longo de todas
as fases, com objetivo de apresentar um panorama geral do
49
padrão comportamental de cada Participante, além da
comparação entre o responder dos três participantes.
As figuras ilustram a porcentagem do padrão de
respostas do participante ao longo dos blocos do
experimento que envolveram escolha entre os dois tipos de
reforçadores (Fase 1 e Fase 3). A primeira área da figura
corresponde a Fase 1. A área seguinte corresponde a Fase 3,
dividida entre as três subfases.
As resposta localizadas na área cinza do gráfico,
indicam as respostas de escolha emitidas no reforçador
maior e menos provável. Se as respostas estiverem agrupadas
em maior número nesta área cinza durante a fase 3,
significa que houve a reversão do padrão de preferência do
participante, do reforçador menor e mais provável para o
reforçador maior e menos provável.
0
20
40
60
80
100
120
Pref
erên
cia
pelo
ref
orço
men
or e
mai
s pr
ováv
el e
m po
rcen
tage
m
Bloco V/V Bloco L/A
Sem Regra
VEG VOJFASE 3FASE 1
P1
50
FIGURA 13: Porcentagem de resposta de escolha no
reforçador menor e mais provável do participante P1. As áreas em
cinza são aquelas em que as respostas estariam se o participante
estivesse se comportando sob controle da instrução.
0
20
40
60
80
100
120
Pref
erên
cia
pelo
ref
orço
men
or e
mai
s pr
ováv
el e
m po
rcen
tage
m
V/V L/A
Sem Regra VEG VOJFASE 3FASE 1
P2Bloco 1
Bloco 2
FIG
URA 14: Porcentagem de resposta de escolha no reforçador menor e
mais provável do participante P2. As áreas em cinza são aquelas
em que as respostas estariam se o participante estivesse se
comportando sob controle da instrução.
51
0
20
40
60
80
100
120
Pref
erên
cia
pelo
ref
orço
men
or e
mai
s pr
ováv
el e
m po
rcen
tage
m
V/V L/A
Sem Regra VEG VOJ
FASE 3FASE 1
P3Bloco 1
Bloco 2
FIGURA 15: Porcentagem de resposta de escolha no
reforçador menor e mais provável do participante P3. As áreas em
cinza são aquelas em que as respostas estariam se o participante
estivesse se comportando sob controle da instrução.
Dos três participantes, P3 foi o que mais entrou em
contato com a consequência de perder pontos e peças no
quebra cabeça, por continuar pressionando a tecla enter na
presença de VOJ. Os outros dois participantes (P1 e P2),
assim que tinham a possibilidade de pular a janela de VOJ o
faziam, ou então, ignoravam a tela correspondente a VOJ.
Assim, P3 foi o participante que mais se distanciou do
antigo padrão de preferência estabelecido na Fase 1, quando
novamente observado na Fase 3. Porém, aparentemente, o
participante demonstra um responder sob controle das
contingências reforçadoras, e não sob controle da
52
instrução, pois ele foi reforçado por responder de acordo
com a instrução.
CONCLUSÃO
O presente trabalho pretendeu avaliar o efeito de
descrições verbais com função aversiva ou positiva, sobre o
comportamento de escolha de três participantes adultos.
Durante o experimento foi avaliada a preferência
inicial dos participantes entre alternativas do reforço
menor e mais provável e maior e menos provável, Sendo
posteriormente avaliado se a inclusão de instruções verbais
contrárias ao padrão inicialmente estabelecido, e
acompanhadas por pseudopalavras qualificadoras com valor
positivo ou aversivo poderiam levar à reversão deste
padrão.
Segundo Braam e Mallot (1990) descrições verbais
controlarão diferencialmente as respostas não verbais, a
depender das contingências que especifiquem. Para Mallot
(1989), o controle de instruções/regras que especifiquem
contingências de ação seria maior quando fossem
acompanhadas por estímulos que maximizem o valor aversivo
de uma instrução, pois a instrução/regra funcionaria como
estímulo aversivo condicionado, capaz de favorecer seu
53
seguimento por induzir condições aversivas que seriam
atenuadas após seu cumprimento.
Almeida e Hubner (2009) pretenderam contribuir com a
discussão sobre as condições que afetam a probabilidade de
controle verbal sobre o comportamento não verbal,
investigando se a inclusão de operantes autoclíticos pode
favorecer este controle. As autoras analisaram se operantes
verbais autoclíticos negativos e também positivos
reverteriam o padrão de preferência estabelecido
anteriormente pelos participantes. Os resultados de Almeida
e Hubner (2009), apontaram que não houve reversão do padrão
de preferência por conta das instruções introduzidas. A
hipótese levantada pelas autoras foi que o histórico
anterior dos sujeitos sobre autoclíticos “pior” e “melhor”
utilizados no experimento, poderiam ter influenciado na
maneira em que cada participante iria responder a esses
estímulos.
No presente estudo, pretendeu-se testaro controle
verbal no estabelecimento de um valor aversivo a VOJ,
analisando se quando acompanhado a instrução, ele também
teria a função de maximizar o valor aversivo desta. Bem
como testas se o estabelecimento de um valor positivo a
outro estímulo, VEG, também exerceria controle sob o
responder do sujeito com o objetivo de reverter o padrão
anteriormente estabelecido no experimento.
O estabelecimento prévio do valor aversivo e positivo
de determinados estímulos foi garantido durante a Fase 2 do
54
experimento, de maneira que pudemos assim, ter controle
sobre essa variável, isolando os efeitos da história prévia
dos participantes com as palavras que qualificavam as
escolhas.
Assim, no presente estudo, o efeito das descrições na
reversão da preferência dos participantes foi avaliado em
condições em que houve o estabelecimento de um novo evento,
no caso a instrução aversiva gerada pela inclusão da
pseudopalavra VOJ (e do aumento do valor positivo desta
escolha, pela inclusão de um estímulo de função positiva
VEG). No caso das descrições acompanhadas por VOJ, entende-
se que a reversão de preferência dar-se-ia como uma
resposta de esquiva, a fim de eliminar a aversividade
imposta por este tipo de descrição.
Com base nesta discussão, testamos assim, o controle
que descrições acompanhadas pelas pseudopalavras VEG e VOJ
exerciam sobre o responder dos participantes, após terem
sido diretamente pareados com reforço e punição,
respectivamente. Os dados mostram que esse controle não foi
suficiente para que os participantes seguissem a instrução,
nas condições em que havia reforço para respostas
incompatíveis com o seguimento
Para os três participantes as pseudopalavras pareceram
exercer controle sobre o responder nas primeiras tentativas
de escolha da Fase 3 (que verificaria o controle dos
estímulos verbais), mas nas próximas tentativas, ao longo
das subfases, o responder deste três participantes voltou a
55
ficar sob controle das contingências e da maneira a
responder anteriormente estabelecido durante a Fase 1.
Assim, os resultados parecem demonstrar que os
participantes estavam sobre controle da magnitude do
reforçador (escolha pelo reforçador maior e menos
provável), ou da probabilidade do ganho dos pontos
(reforçador menor e mais provável), de acordo com seu
padrão de preferencia estabelecido anteriormente.
Desta forma, instruções verbais acompanhadas por
estímulos VEG e VOJ, parecem exercer pouco controle sobre o
responder dos participantes, mesmo tendo adquirido valor
positivo e aversivo, respectivamente.
Nos estudos descritos por Braam e Mallot em que
objetivo era investigar se descrições verbais controlariam
diferencialmente as respostas não verbais, a depender das
contingências, foi possível tirar duas conclusões. A
descrição de reforços atrasados ou ausência de reforço
parece ter enfraquecido o controle pela regra, e, a
inclusão de prazos (resposta verbal) parece maximizar o
controle da regra que descreve contingências indiretas
envolvendo atraso de reforço. Porém, nossos dados não vão
de acordo com os dos autores, pois a resposta verbal não
pareceu maximizar o controle pela regra, mesmo que esta
descrevesse contingências aversivas condicionadas.
Talvez o fato de no experimento dos autores, as
contingências descreverem o atraso do reforço, tenha
influenciado de maneira diferente do nosso experimento, que
56
não descrevia um atraso. No nosso experimento, mesmo que o
participante não seguisse a instrução, ele poderia ser
reforçado por isto, assim como seguir a instrução não
necessariamente tinha como consequência o reforço. Nestas
condições, pode-se observar se o responder está sob
controle da instrução ou sob o controle das contingências
vigente, o que ocorreu no nosso caso.
Isto parece fazer com que os participantes voltem a
emitir respostas de escolha que, nas fases anteriores do
experimento, teriam aumentado a possibilidade de reforço e
que nas condições atuais, continuam a reforçar este
comportamento.
De acordo com Skinner (1953), ao discutir o
comportamento de autocontrole, a declaração de uma resposta
verbal pode controlar a probabilidade de uma segunda
resposta, se esta primeira adquire uma função aversiva,
dados pareamentos anteriores com punição pelo comportamento
de desobedecer à instrução. Porém, este pareamento precisa
ser mantido para que seu valor aversivo não se perca,
perdendo também a função de resposta controladora.
No nosso experimento, foi possível perceber que o
valor positivo de VEG e aversivo de VOJ foi atenuado na
Fase 3, pois a punição não estava em vigor caso a instrução
não fosse seguida.
Assim, nota-se que no nosso experimento não pareceu
possível manter o valor positivo ou aversivo estabelecido
via condicionamento diante de contingências atuantes que
57
favoreçam a emissão de respostas opostas a instrução. Mesmo
que VEG e VOJ tenham adquirido valor positivo ou aversivo,
elas não foram suficientes para manter o controle do
comportamento de escolhas, diferentemente do resultado
obtido por Braam e Mallot (1990).
Porém, os resultados são semelhantes aos obtidos por
Almeida e Hubner (2009), em que não foi possível observar
reversão do padrão por conta do controle da regra. Assim,
de modo geral, os resultados pareceram indicar que não é
possível manter o valor aversivo de uma regra/instrução
quando as contingências vigentes são opostas ao
comportamento de seguir a instrução, no caso do sujeito ser
mais reforçado por fazer o contrário a ela. Foi possível
verificar que o valor aversivo é atenuado, caso não
aconteça punição por não seguir a regra. Assim como o valor
positivo, caso o sujeito não seja reforçado por seguir a
instrução. O que justifica essa hipótese, também é o fato
de o participante que mais seguir a instrução, foi aquele
que foi reforçado por fazê-lo. De modo que este continua
sob controle das contingências e não da instrução.
Neste caso em específico, em que o Participante 3 que
aparentemente segue mais as instruções, foi necessária uma
análise tentativa a tentativa para compreender se o
responder estava sob controle da instrução ou das
contingências. Isto porque, o participante foi reforçado em
90% das respostas de escolhas emitidas de acordo com a
instrução. Mesmo que a programação do nosso experimento
58
tenha sido de 28% de probabilidade de reforço neste
reforçador (maior e menos provável), ao acaso, o
participante obteve o reforço em quase todas as respostas
de escolha neste reforçador, o que implicou no aumento da
probabilidade de resposta neste reforçador.
Como sugestão para estudos futuros, poderia ser
repensado o parâmetro de probabilidade seria o mais
adequado a ser utilizado nesta investigação, pois
aparentemente este contribuiu diretamente para os
resultados obtidos, uma vez que interfere no acesso as
contingências de reforço, fazendo com que os participantes
tentem maximizar o acesso ao reforço, dividindo as
respostas entre os dois tipos de reforçadores. Com isso,
ocasiões em que o participante obedece à regra podem ser
seguidas sem o acesso ao reforço, da mesma forma que
ocasiões em que o participante não segue as instruções
podem ser seguidas de acesso ao reforçador, como aconteceu
nos resultados obtidos dos Participantes P1 e P2.
Outra sugestão seria sobre como garantir que o
Participante entre em contato por mais vezes com a
consequência punitiva na Fase 2 do experimento, para que
esta adquira valor aversivo mais eficiente. No caso do
Participante P1, ele quase não entrou em contato com a
perda de pontos e de peças, de forma que isto pode ter
influenciado em seu responder na Fase 3.
59
REFERÊNCIAS BIBLIOGRÁFICAS:
ALMEIDA, P.E.M; HUBNER. M.M.C (2009)
“Comportamento verbalmente controlado: uma análise
do efeito de operantes verbais autoclíticos sobre o
comportamento de escolha”. Tese de doutorado
defendida No Programa de Psicologia Experimental da
Universidade de São Paulo, São Paulo.
BORTOLOTI, R.; DE ROSE, J. C. (2008)
“Transferência de ‘significado’ de expressões faciais
apresentadas brevemente para estímulos abstratos
equivalentes à elas”. Acta Comportamentalia Vol.16, Núm.2,
pp.223-241. São Carlos, São Paulo.
BRAAM, C; MALLOT, R.W (1990) “I´ll do it when
the snow melts: The effects of deadlines and
delayed outcomes on rule-governed behavior in
60
preschool children”. The Analysis of Verbal
Behavior, 8 , 67-76.
FRANÇA, T. P. (2002) “Transferência de Função
Aversiva em Classes de Equivalência: Uma Visão Analítico-
Comportamental dos Transtornos de Ansiedade”. Brasília,
IBAC.
MALLOT, R.W. (1989) “The achievement of evasive
goals: Control by rules describing contingencies
that are not direct acting”. Em Hayes, S. (org)
Rule-governed behavior: cognition, contingencies,
and instructional control (p. 269-322) New York:
Plenum Press.
MATOS, D. (2013) “Análise dos efeitos do Atraso e
da Probabilidade do Reforço sobre a escola em Condições com
Esquemas Concorrentes Encadeados e Simples” Tese de
doutorado defendida no Programa de Psicologia Experimental:
Análise do Comportamento da PUC-SP, São Paulo.
REIS, A.A; TEIXEIRA, E.R & PARACAMPO, C.C.P
(2005) “Auto-regras como variáveis facilitadoras na
emissão de comportamentos autocontrolados: o
exemplo do comportamento alimentar”. Interação em
Psicologia, 9 (1), 57-64.
SKINNER, B.F. “Ciência e Comportamento Humano”.
5ª edição. Ed Martins Fontes, 1953/1981. São
Paulo.