Upload
marinitak
View
219
Download
0
Embed Size (px)
Citation preview
7/25/2019 Campbell Stanley
1/44
.
.~;~~
Donald T. Campbell
Julin C~Stanley
,,.,..,,t:
e r.t A.r.I
r~~_.t o~
~
I
;r~ ~.: ~
- , :\
\ .
Delineamentosexperimentais
,e qua~e-expe~imentais
,de pesquisa
~l(lV~~e~~6~. e ~
\
:i
Traduo de
i
Renato Alberto T. pio Dio
U. F. M. G. - BIBLIOTECA UNIVERSITRIA
:231-0
O(
O~
([;;;.tt.-/cit
~::1
111111I111111111I1111111111111111I111
18913138709
\ ~
NO DANIFIQUE ESTA ETIQUETA
O~\j 6
E.P.U. - Editora Peaggi~a e Universitria Ltda.
EDUSP - Editora da Universidadede So Paulo
So~aulo
r-
Trs delineamentos pr-experimentais
1. Estudo de um nico caso semcontrole
Muitas pesquisas educacionais, em n~ssos dias, seguem o modelo
em que um nico grupo estudado apena S uma vez, em seguida a
algum agente ou tratamento presumivelmente capaz de causar mu-
dana. O diagrama de tais estudos pode ser o seguinte:
I
i
.1
t
\
x O
j
t
Como tem sido salientado (p~ex., Boring, 1954; Stouffer, 1949),
tais estudos ressentem-se. de uma to completa fal ta de controle a
.
ponto de no possurem quase nenhum valor cient fico. O delinea-
mento aqui introduzido como um ponto de referncia mnimo. No
obstante, devem ser feitos alguns comentrios a seu respeito em
razo do contnuo investimento em tais estudos e das inferencias
causais que deles se t iram. O processo de comparao, de anotao
de ~ferenas ou de contraste essencial evidncia cientfica (e a
todos os processos de diagnstico do conhecimento que incluem a
retina do olho) . Qualquer aparncia de conhecimento absoluto ou.
de conhecimento intrnseco acerca de objetos singulares isolados
resulta ilusria aps a anlise. A evidncia cientfica exige pelo
menos uma comparao; para que tal comparao possa ser til,
ambos os lados dela devem ser tra tados com o mesmo cuidado e com
a mesma preciso.
Nos estudos de caso representados pelo Delineamento 1, uma
nica instncia cuidadosamente estudada implicitamente comparada
com outros eventos-observados e lembrados casualmente.
As
infern-
7/25/2019 Campbell Stanley
2/44
,
valioso, se um conjunto de observaes r~ reduzido pela metade
e o esforo poupado. dirigido. ao estudo, igualmente ponnenorizado,
de uma instncia comparativa apropriada. Parece quase um dc:s-
res .peito tica, em nossos dias, aceitar estudos de caso dessa natu-
reza como teses ou dissertaes. em educao (ou seja, estudos que
envolvam um nico grupo observado apenas uma vez). Testes pa-
dronizados em tais estudos de caso proporcionam apenas um auxilio
muito limitado, uma vez que as fontes rivais de diferena que no X
so to numerosas a ponto de tomar o grupo de referncia padro
quase inti l como grupo de cpntrole . Pela mesma razo, asmuitas
fontes de diferena no controladas .entre o presente estudo de caso
e os potenciais estudos futuros, que possam ser comparados com ele,
so to numerosas que eliminam as esperanas de se criar um
quadro de refer~cia para futuros estudos. De inodo. geral, seria
melhor canalizar o esforo descritivo nQsentido de distribu-lo entre
ambos os lados de uma, comparao interessante.
O Delineamento I , setomado em conjuno com as comparaes
do conhecimento comum impl1cito, padece do Diaior nmero de
fraquezas de cada um dos delineamentos subseqentes. Por esoarazo,
o enunciado de tais fraquezas ser deixado' para as ocasies mais
especificas.
2. Pr.teste e ps-teste aplicados a um grupo
Embora esse del ineamento ainda seja largamente usado em pes-
quisa educacional e embora seja considerado to melhor do que o
Delineamento I, a ponto de ,ser tido como aceitvel quando nada
melhor possa ser feito (ver a discusso ds planos quase-experimen.
tais adiante), aqui introduzido como um mau exemplo parailus- '
trar diversas das variveis estranhas confundid~s capazesde compro-
meter a val idade interna. Essas variveis oferecem hipteses plaus-
veis para explicar uma diferena 01 - O2, rivalizando. com a hip-
tese de que ? ' causou a diferena:
01 X OJ '
A primeira dessas hipteses rivais no controladas histTia.
Entre 01 e O2muitos outros eventos produtores de mudana podem
ter. ocorr ido alm do X.do experimentador. Se o pr-teste 01) e o
ps-teste 02) foram aplicados em dias diferentes , ento os eventos.
in tercorrentes podem ter causado a diferena. Para tomar-se uma
hiptese rival plausivel, tal evento deve ter oconido maioria dos
1.4
[
.,
es.tudantes no grupo estudado, ou seja, em alguma outra aula ou
atravs de uma notc ia amplamente divulgada. No estudo de sala-
de-aula de CoIl ier (realizado em 1940, mas comunicado em 1944),
enquanto os estudantes estavam lendo materiais da propaganda
nazs ta, a Frana capitulou; aSmudanas de ati tude obt idas parece.
r,am mais 'provavelmente ser o resu1i:ado desse evento do que da
prpria propaganda.4 Histria toma.se uma explanao rival. de
mudan.a.mais plausvel quanto maior for o lapso de tempo entre
01 e-0J e pode ser encarada como um problema triv ia l num expe-
rimento realizad~ num perodo de uma ou duas horas, embOrdevam
ser, mesmo nesse caso, levad~ em conta fontes estranhas tais como
. risos, distraes, etc.~ relevante para a varivel histria a condio
de isolamento e pe~imental, que pode ser quase alcanado ~mmuitos
laboratrios de cincias fsicas a ponto de tomar o Delineamento 2
aceitvel para muitas .de suas pesquisas. Em pesquisa sobre mtodos
de ensino quase nunca sepode'presumir um isolamento experimental
efetivo. dessa natureza. Por essas razes consta um sinal menos no
cruzamento do Delineamento 2 e Histria na Tabela 1. Classificare..
mos como histria um grupo de possveis efeitos de estao ou de pro-
gramao d~_eventos institucionais, embora tais efeitos possam .tam-
bm ser rotulados de maturao. Assim, otimismo pode variar com
as estaes do ano e ansiedade com o horrio dos exames semestrais
(p. ex. , Crook,. 1937; Windle, 1954) . Tais efeitos podem produzir
uma mudana 01 - O2 suscetvel de ser confundida com o efeito
deX.
,
Uma segunda var ivel ou classe de var iveis rival designada
por maturao. Esse termo aqui usado para cobrir todos aqueles
processos bi~lgicos ou psicolgicos que variam sistematicamente com
a passagem do tempo, independentemente de eventos externos espe-
dficos. Assim, entre 01 e O2 os estudantes podem ter ficado mais
velhos, mais fami-ntos,mais. cansados, mais aborrecidos, etc., e a dife-
rena obt ida pode ref leti r esseprocesso mais do que X. Em educao
remedial, que visa a pessoas excepcionalmente carentes, um processo
de remisso espontnea , anlogo cura de uma ferida, pode ser
confundido com o efeito especifico do tratamento X. (No preciso
dizer que tal remisso no encarada como espont~nea em qual-
quer sentido causal, mas representa os efeitos cumulativos de processos
de aprendizagem e as presses ambientais da experincia diria total,
que estariam opera~do, ainda que X no tivesse ~do introduzido.)
4 Collier usou, na realidade, um plano mais adequado do que esse, designado
Delineamento 10 no presente sistema.
IS
7/25/2019 Campbell Stanley
3/44
.
~_.~_ ~ ,. -o.. .__
'
Tabela I. Fontes de invalidade para Delineamentos1 a 6.
Fon~s de invalidade
Interna
o
~
' 4.1
o 'Q
' 'fi. ~ 5 ,o ~
'Cfc.oS;o:=
~
B
fi
E~'~
1:.
._.
ftt
ri
' u _ o
11:: :: I-ndio Xo ou a ausncia de X no tpica de pero-
dos sem X em geral, mas apenas representativa de ausncias
de X intercaladas entre presenas. Se Xl tiver algum efeito pro-
longado capaz de repercutir nos perodos de no-X, como pare-
X10 XoO XIO XoO
Essedelineamento pode ser visto como uma forma do experimento de
srie temporal com a introduo repetida da varivel experimental.
O experimento Q15viamentemais til quando o efeito da varivel
experimental a
1
fecipado como de carter transitrio ou reversvel.
Enquanto a lgic do experimento pode ser vista como uma extenso
do experimento e srie temporal, o modo de anlise estatstica
mais tipicamente semelhante ao do experimento de dois grupos
em que empregada a significncia da diferena entre as mdias de
dois conjuntos de medidas. Usualmente, as medi
7/25/2019 Campbell Stanley
35/44
i
~
I
I
I
I..-~~~.
ceria usualmente provvel. o plano. experimental poder subesti-
mar o efeito de Xl se comparado com um estudo do Delineamento
6, por exemplo. Do outro lado, o simples fato de haver freqentes
mudanas pode aumentar o valor estimulante de X em relao ao
que esse valor seria sob uma apresentao contnua e homognea.
A msica hawaiana no estudo de Kerr pode afetar o trabalho de.
modo completamente diferente se intercalada por um dia entre dias
de outra msica, do que o faria se constitusse uma programao
contnua. Os delineamentos experimentais de Ebbinghaus (1885) p0-
dem ser encarados como essencialmente desse tipo e, como observou
Underwood (1957a), as leis por ele encontradas so limitadas em
sua generalizabilidade a uma populao de pessoas que aprenderam
dzias de outras listas ltamente semelhantes. Muitas de suas con-
cluses, com efeito, no prevalecem no. caso de pessoas que tenham
aprendido uma nica lista de slabas sem sentido. Assim, embora o
esquema seja vlido internamente, sua validade externa pode ser
seriamente limitada a alguns tipos de contedo. (Ver tambm
Kempthorne, 1952. Capo29.)
Note-se, contudo, que muitos aspectos do ensino sobre os quais
algum gostaria de conduzir um experimento podem muito bem ter
efeitos limitados, do ponto de vista prtico, ao perodo de efetiva pre-
sena de X. Para tais fins, esse delineamento pode ser perfeitamente
valioso. Suponhamos que um professor levante a questo do valor
de recitao oral
versus
estudo individual silencioso. Ao variar esses
dois processos .ao longo de uma srie de unidades de ensino, pode-se
montar um experimento interpretvel . O efeito da presena de um
pai-observador na sala de aula sobre o debate voluntrio de estudan-
tes pode ser estudado dessa forma. Conscincia de tais esquemas
pode situar uma testagem experimental d~ alternativas dentro do
alcance de um nico professor. Isso poderia
.
servir de teste-piloto
para avaliar procedimentos que, se promissores, poderiam ser exami-
nados por experimentos mais amplos e mais coordenados.
Essa abordagem pode ser aplicada a uma amostragem de ocasies
em relao a um nico indivduo. Embora no d ensejo tipicamente
aplicao de testes de significncia, eSseum delineamento recor-
rente em pesquisa fisiolgica, em que um estmulo aplicado ]:'epeti-
damente a um animal, com o cuidado de evitar qualquer periodici-
dade na estimulao. Esta ltima caracterstica corresponde exign-
cia de aleatoriedade de ocasies exigidas pela lgica do plano.
Podem ser usados tambm quadrados latinos ao invs de simples
casualizao (por exemplo, Cox, 1951; Maxwell, 1958).
78
Testes de significdncia para
o
Delineamento 8
Ainda uma vez, necessitamos de testes de significncia apropria-
dos para esseparticular t ipo de delineamento. Note-~ que se acham
implicadas duas dimenses de generalizao: generalizao atravs
de ocasies e generalizao atravs de pessoas. Se considerarmos uma
instncia em que uma p.essoa apenas empregada, o teste de signi-
ficncia ser obviamente limitado a generalizaes a respeito dessa
nica pessoa e envolver uma generalizao atravs de instncias,
para cujo propsito ser apropriado usar ~ t com graus deliber-
dade iguais ao nmero de ocasies menos das. Se algum tiver regis-
tros individuais sobre certo nmero de pessoas submetidas ao mesmo
tratamento - todas parte de um mesmo grupo - ento os dados
podem tambm ser usados para generalizao atravs de pessoas.
Nessa situao usual, parecem comuns duas estratgias. Uma estra-
tgia errada seria a de gerar para cada indivduo um nico escore
para -cada tratamento experimental e, em seguida, aplicar testes de
significncia da diferena entre mdias com ddos correladonados.
Embora no fossem efetivamente empregados testes de significncia,.
foi essa a lgica implci ta n.as anlises de Allport e Sorokin, mas, '
quando se acham envolvidas apenas uma ou duas repeties de cada
condio experimental, erros de amostragem de ocasies podem ser
muito amplos ou o controle de histria pode ser muito pobre. Erros
casuais de amostragem de ocasies podem contribuir para o que,
sob essa anlise, se apresentaria como diferenas significativas entre
tratamentos. Se o efeito de ocasies for significativo e aprecivel ,
isso parece ser um erro muito srio. Poder-se-ia,.por exemplo, seguin-
do essa lgica, obter uma diferena altamente sigrt if icativa entre
Xl c: X caso cada um dos tratamentos tenha sido apresentado
apenas uma vez e. numa ocasio, algum evento estranho tenha
produzido, por acaso, um resultado marcante. Parece essencial, pois,
que pelo menos duas ocasies sejam hierarquizadas em cada trata-
mento e que estejam r~presentados graus de liberdade entre ocasies
dentro de tratamentOs. Esserequisito , provavelmente, mais facilmen-
te satisfeito qUandO
~
e testa inicialmente a diferena entre mdias de
tratamentos contra termo de erro entre-ocasies-dentro.de-trata-
mentos . Aps deter inar dessa forma a significncia do efeito do
tratamento, pod~-se prosseguir a fim de descobrir para que propor-
o de sujeitos essa significncia prevalece.u de modo a obter evidn-.
cia relevante para a generalizao do efeito atravs de pessoas; Me-
didas reiteradas e amostragem de ocasies levantam muitos proble-
mas de estatsticas, alguns dos quais ainda sem soluo (Collier, 1960;
Cox, 1951; Kempthorne, .1952). .
79
7/25/2019 Campbell Stanley
36/44
.1
l
80
~-i
,
1;
i
.. --
9. O delineamento de materiais equivalentes
Intimamente aliado ao delineamento de amostras. temporais equi-
valentes acha~seo Delineamento 9, cujo argumento se baseia na equi.
valncia de amostras de materiais a que so aplicadas as variveis
experimentais em comparao. Sempre, ou. quase sempre, amostras
temporais equivalentes acham-se tambm ehvolvidas, mas elas podem
ser to sutil e estreitamente entremeadas qu~ existe prtica equivaln-
cia temporal. Num delineamento de X.re~ido a um grupo, so
necessrios materiais equivalentes toda vez que a natureza das vari.
veis experimentais
tal,
que os efeitos so duradouros e que os trata-
mentos diferentes e as repeties de tratamentos devem.ser aplicados
a contedo no-idntico. O esquema pode ser simbolizado assim:
MeXIO MbXOO MeXIO MrlXoQ etc.
psicologia do Professor G. E. Ml1er em 1895 e 1896e ao universo
de materiais mnemnicos amostrados. bvio que seria necessrio
replicar o experimento em numerosas pessoas a fim de se poder
generalizar atravs de pessoas, com o que se conseguiria uma relao
psicolgica mais geral.
Outra ilustrao decorre dos primeiros estudos de conforinidade
com a opini) grupal. Por exemplo, Moore (1921) obteve uma
estimativa de controle . de estabilidade (reteste) de respostas a
questionrio a partir' de um conjunto de itens e, em seguida, com-
parou essa estimativa com a mudana resultante quando, com outro
conjunto de itens,o reteste (oi acompanhado por uma afirmativa de
.
o.pinio majoritria; ou, ento, considere-se o estudo em que estu-
dantes so solicitados a emitir sua opinio sobre um nmero de
questes apresentadas num longo questionrio. Essas questes so
ento distribudas em dois grupos to equivalentes quanto possvel.
Mais tarde, osquestionrios so devolvidos aos estudantes e o grupo
vo~apara cada item indicado. Esses votos so falsif icados para que
indiquem maiorias em direes opostas pra as duas amostras de
itens. Como uma medida PS-X,os estudantes so solicitados a votar
de novo sobre todos os itens. Dependendo da adequao do argu-
mento de equivalncia amostral dos dois conjuntos de itens, as
diferenas em mudanas entre os dois tratamentos experimentais
pareceriam fornecer uma demonstrao experimental definitiva dos
efeitos da comunicao de opinies do grupo, mesmo na ausncia de
qualquer grupo de controle de pessoas.
Assim como o Delineamento 8, o Delineamento 9 possui validade
interna elIJ.todos os pontos e, em geral, pelas mesmas razes. Podemos
~otar, com relao validade externa, que os efeitos no Delineamento
9, como em todos os experimentos que envolvam medidas repetidas,
podem ser absolutamente especficos a pessoasmedidas repetidamente.
Em experimentos de aprendizagem, as medidas so de tal forma uma
parte do contexto experimental no mtodo tpico usado em nossos
dias (embora no necessariamente no mtodo de Jost, em que as
prticas envolveram nmeros controlados de leituras das listas) que
essa limitao generalizao se torna irrelevante. Condies reativas
parecem estar menos certamente envolvidas nQDelineamento 9 do que
no Delineamento 8 por causa da heterogeneidade dos materiais e da
maior. possibilidade de que os sujeitos no sabero que esto sendo
submetidos a diferentes tratamentos em pocas diferentes em relao a
itens diferentes. Essa baixa reatividade no seria encontrada no expe-
rimento de Jost, mas estaria presente no estudo sobre conformidade.
Interferncia entre os nveis da varivel experimental ou interfern-
Os MM indicam materiais espedficos, sendo a anlostra ~MelMel etc.,
eoi termos amostrais, igual amostra MblMil etc. A importncia da
equivalncia amostral dos dois conjuntos de materiais talvez seja
melhor indicada se o plano for diagramado desta forma:
uma pessoa
{
Amostra de materiais A .(0) Xo O
ou grupo Amostra de materiais B (O) Xl O
Os 00 entre parnteses indicam que, em alguns delineamentos, ser
usado um pr-teste e, em outros, no.
O experimento inicial de Jost (1897) sobre prtica massificada
versus prtica distribuda oferece uma ilustrao excelente. Em seu
terceiro experimento, foram preparadas 12 listas montadas mais ou
menos casualmente de 12 slabas sem sentido cada uma. Seis das
listas foram atribudas prtica distribuda e seis prtica massif- .
cada. Essas 12 listas foram, em seguida, simultaneamente aprendidas
ao longo de um periodo de sete dias, com uma program~o entre-
tecida cuidadosamente de modo a controlar fadiga, etc. Sete de tais
conjuntos de seis listas distribudas e de seis listas massificadas foram
aprendidos ao longo de um perodo que se estendeu de 6 de novem-
bro de 1895 a 7 de abril de 1896.Ao trmino, Jost possua resultados
em 40 diferentes listas de slabas sem sentido aprendidas pela prtica
massificada e 40 aprendidas pela prtica distribuda. A interpretabili-
dade das diferenas encontradas em um nico sujeito, Professor
G. E. MIler, depende da equivalncia amostral das.listas no-idn-
t icas envolvidas. Dentro de tais l imites, esse experimento parece
possuir validade externa. Os resultados, naturalmente, limitam-se
81
.'
f
f
.
'
f
H
'I
r
i
7/25/2019 Campbell Stanley
37/44
L
I1
H
Li
H
li
d
il
.
;{
I
I
,I
I
r
I
I
I'
,'I
l
i
~~
:1
i
1
~
~
da entre os materiais constituem provavelmente uma clara fraqueza
desse experimento, tanto quanto do Delineamento 8.
Temos- uma ilustrao espedfica do tipo de limitao assim
.introduzida com relao aos resultados obtidos por lost. Suas con-
cluses foram de que a aprendizagem espaad~. mais efide~te do
que a prtica intensiva. Pelas condies de su experimentao em
geral, ele estava autorizado a generalizar apenas~pessoas que esta-
vam aprendendo muitas listas, isto , pessoas para as quais o nvel
de interferncia era elevado. Pesquisa atual indica que a superiori-
dade de aprendizagem espaada limitada apenas a tais populaes
e que, para pessoas aprendendo materiais altamente novos pela pri-
meira vez, essa vantagem no exis-te (Underwood e Richardson,
1958).
Estatlsticas para o Delineamento 9
A amostragem de materiais obvimente relevante validade
e ao grau de prova do experimento. Sendo assim, o N para a com-
putao da significncia das diferenas entre as mdias de grupos
de tratamento deveria provavelmente ter sido um N de listas no
experimento d~ Jost (ou um N de itens no estudo de conformidade)
de modo a representar esse relevante domnio amostral. Isso deve
ser suplementado por uma base para genera~izar atravs de, pessoas.
Provavelmente a melhor prtica, atualmente, proceder
seriatim
estabelecendo ntes a generalizao .atravs das amostras de listas ou
itens e, em seguida, computando um escore de efeitos experimentais
para cad.a pessoa e empregando esse escore como base para genera-
lizar atravs de pessoas. (Ver a literatura a'cautelatria citada acima
com referncia ao Delineamento 8.) .
10. O delineamento com grupo de controle no-equivalente
Um dos mais divulgados planos experimentais em, pesquisa
educacional envolve um grupo experimental e,um grupo de controle,
ambos submetidos a um pr e ps. teste, mas em que o grupo de
controle e o grupo experimental no possuem equivalncia amostral
pr-experimental. Pelo contrrio, os grupos constituem coletivos
naturalmente reunidos, tais como classes escolares, to semelhantes
quanto a situao o permitir, mas, de qualquer forma, no to seme.
lhantes que justif iquem a dispensa do' pr.teste. A atribuio de X
82,
. .. . .. ,
a um grupo ou outro pressupe-se casual e sob o controle do expe-
rimentador.
o
X
o
o
o
11
Duas coisas precisam ser mantidas claras a respeito deste plano:
primeiro, no deve ser confundido com o Delineamento 4 - o Plano
com Grupo de Controle e com Pr e Ps-Teste - em que os
sujeitos experimentais so atribudos
aleatoriamente
de uma popu~
. lao comum aos grupos experimental e de controle. Segundo, apesar
disso, o Delineamento ]O deve ser considerado como digno de ser
usado em muhas instncias em que os Delineamentos 4, 5 ou 6 forem
impossveis. Em particular, deve admitir-se que a adio de um grupo
de controle, ainda que no emparelhado ou no equivalente, reduz
sensivelmente a equivocidade de interpretao em comparao com o
que obtido pelo Delineamento 2 - o Plano de um Grupo Pr e
Ps-testado. Quanto mais semelhantes Jorem os grupos experimental
e de controle em seu recrutamento e quanto mais tal similaridade
for confirmada pelos escores no pr-teste, tanto mais efetivo se tomar
esse controle. Pressupondo que tais desiderata sejam aproximados
para fins de validade interna. podemos encarar o delineamento como
capaz de controlar os efeitos principais de histria, miiturao, testa-
gem e instrumentao, porquanto a diferena para o grupo experi-
mental entre pr-teste e ps-teste (se maior do que a apurada no
grupo de controle) no pode ser explicada pOr 'efeitos principais
dessas variveis que afetariam tanto o grupo experimental quanto
o grupo de controle. (No obstante, devem ser tom~das srias pre-
caues com relao histria intra-sesso j lembrada com relao
ao Delineamento 4.)
, ,
Um esforo para explicar um ganho do pr-teste ao ps-teste,
especfico ao grupo experimental , em termos de fatores estranhos
tais como histria, inaturao ou testagem, deve admitir como hip-
tese uma interao entre essas variveis e as diferenas de seleo
especficas que distinguem os grupos experimental e de controle.
Embora tais interaes sejam, em geral, improvveis, um nmero de
shuaes existe em que podem ser invocadas. Talvez as mais comuns
sejam interaes. envolvendo maturao. Se o grupo experimental
for constitudo de pacientes de psicoterapia e o grupo de controle
de alguma outra populao disponvel testada e retestada, um ganho
especifico ao grupo experimental pode bem ser interpretado como
um processo de remisso espontnea especfico a tal grupo extremo,
.'
83
F
i,I
.
,
t~
l
:j ,
rr
7/25/2019 Campbell Stanley
38/44
'I
;
t.
.
L--...
um ganho que tf:ria ocorrido mesmo sem X. Tal interao seleo-
maturao (ou uma interao seleo-histria ou ainda uma inte-
rao seleo-testagem) poderia ser tomada erroneamente pelo efeito
de X e, portanto; representa uma ameaa validade intern do
.experimento. Essa possibilidade est prevista na oitava coluna da
Tabela 2 e o principal fator de validade intern que distingue
os Delineamentos 4 elO.
Uma ilustrao concreta extrada da pesquisa educacional pode
esclarecer esse ponto. Sanford e Hemphill (1952), com seu estudo
dos efeitos de um curso de
~
S'cologia em Annap~is, fornecem um
excelente ex
.
emplo do Deline ento 10. Nesse estudo,.. ,aSegunda Tur-
ma em Annapolis consti tuiu grupo experimental e a Terceira Tur-
ma o grupo de controle. Osganhos maiores por parte do grupo expe-
rimental podem ser explicados como uma parte de algum processo
geral de sofisticao ocorrente de forma acentuada nas primeiras
duas classes e apenas em grau mnimo na Terceira e .Quarta, repre-
sentando, assim, uma interao entre os fatores de seleo diferen-
ciadores do grupo experimental e do de controle e mudanas natu-
rais (maturao) caractersticas desses grupps. Tais ganhos no repre-
sentariam qualquer efeito do programa experimental. O peculiar
grupo de controle utilizado por Sanford e H~mphill toma possvel
testar, de alguma forma, essa hiptese rival (algo semelhante ao
processo do Delineamento 15 adiante). A hiptese de seleo-matura-
o prediria que a Terceira Turma (grupo de controle),em seu teste
inicial, mostraria uma superioridade s medidas do pr-teste da
Segunda Turma (grupo experimental) aproximadamente da mesma
magnitude daquela constatada entre o pr-teste e o ps-teste do grupo
experimental. Felizmente para a interpretao de seu experimento,
isso em geral no ocorreu. As diferenas entre turmas no pr-teste
no foram, na maioria das instncias, nem na mesma direo nem
da mesma magnitude apresentadas pelos ganhos pr-teste-ps-teste
do grupo experimental; contudo, sua concluso de um ganho si.~i-
ficativo por parte do grupo experimental em escores de confiana
obtidos no questionrio de situaes sociais pode ser explicada como
um artifcio de seleo-matUrao. O grupo experimental apresenta
um ganho de 43,26 a 51,42, ao passo que a Terceira Turma comea
com um escore de 55,82 e chega a um escore de 56,78.
A hiptese de uma interao entre seleo e maturao ser
ocasionalmente sustentvel, mesmo q~aIido..os grupos forem idn,~
ticos em escores do pr-teste. A mais comum dessas instncias ser
a de um grupo que tenha um ndice de maturao ou de mudana
autnoma superior ao de outro. O Delineamento '14 oferece uma
extenso do lO que tender a eliminar essa interao.
84
.-
.0
Regresso constitui-se em outro srio problema de validade inter-
na para o Delineamento 10. Como o indica o ? da Tabela 2, essa
possibilidade evitvel, mas talvez se trate de um problema mais
freqentemente ignorado do que evitado. Em geral, se ambos os
grupos comparados tiverem sido selecionados pelos seus escores extre-
mos em O ou em medidas correlacionadas, ento a diferena em
grau de mudana do pr-teste para o ps-teste entre os dois grupos
bem pode ser um produto de regresso ~ais do que o efeitq de X.
Essa possibilidade tem prevalecido cada vez mais por causa de uma
teimosa e enganadora tradio da experimentao educacional, em
que o emparelhamento tem sido encarad como o processo apro-
priado e suficiente para estabelecer a equivalncia pr-experimental
de grupos. Esse erro tem sido acompanhado pela incapacidade de
distinguir os Delineamentos 4 e 10 e as funes bem diferentes do
emparelhamento nos escores do pr-teste sob as duas condies. No
Delineamento 4, o emparelhamento pode ser reconhecido como um
adjunto ti l casualizao mas no como seu substituto: em termos
de escores no pr-teste ou em variveis relacionadas, a populao total
disponvel para os objetivos experimentais pode ser organizada em
pares de sujeitos cuidadosamente emparelhados; membros desses
pares podem da ser atribudos, le tori mente s condies experi-
mental ou de controle. Esse emparelhamento, acrescido casuali-
zao subseqente, produz usualmente um delineamento experimen-
tal com preciso .maior do que a gerada apenas pela casualizao.
No se deve confundir esse ideal com.o processo pelo qual, no
Delineamento 10, se tenta compensar as diferenas entre os grupos
experimental e de controle no equivalentes atravs do recurso ao
emparelhamento, quando a atribuio aleatria aos tratamentos n
for possvel. Se, no Delineamento 10, as mdias dos grupos forem
substancialmente diferentes, ento a tcnica do emparelhamento no
s deixa de garantir a desejada equalizao, como tambm enseja a
ocorrncia de efeitos de regresso no queridos. Pode-se prever com
certeza que os dois grlipos diferiro em seus escores independente-
mente de quaisquer. efeitos de X e que essa diferena variar direta-
mente com a diferena entre as populaes totais de que foi feita a
seleo e inversamente com a correlao teste-reteste. Rulon (1941),
Stanley e Beeman (1958)e R. L. Thorndike discutiram esseproblema
exaustivamente e chamaram a ateno para a anlise de covarincia e
outras tcnicas statsticas sugeridas por ]ohnson e Neyman (ver
Johnson e Jackson, 1959, pp. 424 444 e por Peters e Van Voorhis
(1940) para testar os efeits da varivel experimental sem o pro-
cesso de emparelhamento; contudo, devem ser levadas em conta as
recentes advertncias feilas por Lord (1960) relativas anlise de
85
_
>.
7/25/2019 Campbell Stanley
39/44
covarinda, quando a covarivel no perfeitamente fidedigna. A
aplicao da anlise de covarincia a esse Delineamento 10 envolve
pressuposies (como a de homogeneidade de regresso) menos plau-
sveisaqui do que nos contextos do Delineamento 4 (Lindquist, 1953).
Ao interpretar estudos publicados do Delineamento 10 em que
foi empregado emparelhamento, pode-se notar que a direo do erro
previsvel. Considere-se um experimento de psicoterapia que use
como O os graus de insatisfao dos sujeitos com sua prpria perso-
nalidade. Suponhamos que o grupo experimental seja constitudo
de sujeitos que procuraram a terapia e o grupo de controle empa-
relhado, de pessoas normais ; ento o grupo de controle acabar
representando escores baixos extremos do grupo normal (seleciona-
dos por causa de sua extremidade), regredir no ps. teste em dire-
o mdia do grupo normal e, por conseguinte, far com que um
efeito significat. ivo da terapia tenha menor probabilidade de ser
evidenciado ao invs de produzir uma impresso espria de eficcia
do processo terapu~ico.
A ilustrao de solicitantes de psicoterapia tambm fornece uma
instncia em que as pressuposies de regresso homognea e de
amostragem do mesmo universo, exceto por extremidade de escores,
pareceriam provavelmente ser imprprias. A incluso de controles
normais em pesquisa sobre psicoterapia de alguma util idade, mas
deve.se ter a mxima precauo. na interpretao dos resultados.
Parece importante distinguir duas verses do Delineamento 10, atri-
buindo-se-Ihes diferente t tu como aproximaes da verdadeira expe-
rimentao. De. um lado, h a situao em que o experimentador
possui dois grupos naturais disponveis, por exemplo, duas classes,
e tem livre escolha ao decidir quem se submete a X ou, pelo menos,
no tem razo para suspeitar recrutamento diferencial relacionado
com X. Ainda que os grupos possam diferir emmdias iniciais em O,
o estudo pode aproximar-se da verdadeira experimentao. De outro
lado, h instncias do Delineamen,to 10 em que os respondentes .so
claramente aUto-selecionados, tendo o grupo experimental procura-
do deliberadamente expor-se a XJ sem que haja grupo de controle
disponvel originrio da mesma populao. Nesse ltimo caso, a
pressuposio de regresso uniforme entre os grupos experimental e
de controle torna-se menos provvel e aumenta a probabilidade de
interao seleo-maturao (assim como. de outras interaes). O
Delineamento 10 auto-selecionado , pois, muito mais fraco, mas
capaz de fornecer informao que, em muitas instncias, afastaria a
hiptese de que X teve um efeito. O grupo de controle, mesmo se
amplamente divergente em mtodo de recrutamento e em nvel
mdio, auxilia a interpretao.
A ameaa de testagem validade externa igual apresentada
em relao ao Delineamento 4 (ver p. 34).O ponto de interrogao
para a interao de seleo e X lembra-nos de que o efeito de X
bem pode ser especfico a respondentes selecionados como o foram
os do nosso experimento. Uma vez que os requisitos do Delineamento
10 tendem a impor menos limitaes nossa liberdade de ampla-
mente selecionar amostras do que os do Delineamento 4, essaespecifi-
cidade ser usualmente menor do que o seria num experimento de
laboratrio. A ameaa valida~e externa representada por condies
reativas acha-se presente, mas provavelmente em menor grau do que
na maioria de experimentos em sentido estrito, como o Delinea-
mento 4.
Quando houver a alternativa de usar duas classesintactas com
o Delineamento 10 ou extrair amostras casuais de estudantes das
classes para tratamentos experimentais diferentes dentro do Delinea-
mento 4, 5 ou 6, esta ltima opo ser quase certamente a mais
reativa, criando mais conscincia do experimentol atitude de eu sou
uma cobaia e coisas desse tipo.
Os estudos de Thorndike de disciplina formal e transferncia
(por exemplo, E. L. Thorndike e Woodworth, 1901; Brolyer, Thorn-
dike e Woodyard, 1927) representam aplica~es do Delineamento
10 a XX no-controlados pelo experimentador. ,Esses,estudos evita-
ram em parte, pelo menos, o erro de efeitos de regresso devidos a
simples emparelhamento, mas devem ser cuidadosamente analisados
em termos de mtodos modernos. O uso de estatsticas de covarincia
teria provavelmente produzido mais forte evidncia, de transferncia
de Latim para vocabulrio ingls, por exemplo.
Na direo inversa, os usualmente positivos; embora pequenos,
efeitos de transferncia encontrados poderiam ser explicados no
como transferncia, mas como a seleo nos cursos de Latim daque-
les estudantes cujo ndice anual de crescimento \ ocabular teda sido
maior do que o do grupo de controle, mesmo sem a presena do
ensino do Latim. Isso .seria classificado aqui como uma interao
seleo-maturao. Em muitos sistemas escolares, essa hiptese rival
poderia ser testada atravs da extenso da amplitude dos 00 pr-
Latim considerados, como no Delineamento 14.
~
ais estudos foram
esforos monumentais no sentido de introduzir pensamento expe-
rimental no campo da pesquisa. Merecem aten renovada e exten-
so a mtodos modernos.
lI. Delineamento contrahalanado
Sob esse ttulo, acham-se compreendidos todos os delineamentos
em que o controle experimental alcanado ou a preciso aumentada
86
87
r
,
't
.7
li
i
:;:'
,f.
7/25/2019 Campbell Stanley
40/44
ti
11
r
I
i
'i
pela entrada',de todos os respondentes (ou contextos) em todos os
tratamentos. Tais esquemas tm sido cham,ados experimentos rota~
tivos por McCall (1923), delineamentos contrabalanados (por
exemplo, Underwood, 1949), delineamentos. cruzados (por exemplo,
,Cochran e Coxo 1957; Cox, 1958) e delineamentos de trocas mtuas,
em ingls switch ove1 designs (Kempthome, 1952).A montagem do
quadrado latino tipicamente empregada no contrabalanamento.
Esse quadrado latino empregado no Delineamento ll, classificado
aqui como um delineamento qUfise-experimental, em que quatro tra.
tamentos experimentais so aplicados, de um modo restritivamente
casualizado
por turnos, a quatro grupos naturalmente reunidos ou
mesmo a quatro indivduos (por exemplo, Maxwell, 1958):
Tempo 1 Tempo 2 Tempo 3 Tempo 4
Grupo A
X10 X20
XBO
X40
As diterenas em tais somas no poderiam' ser simplesmente inter-
pretadas como artefatos das diferenas do grupo inicial ou como'
efeitos de prtica, histria, etc. Igualmente comparveis so as somas
das linhas quanto s diferenas intrnsecas aos grupos, bem como as
s,ornasdas colunas da primeira apre~ntao quanto s diferenas em
ocsies. Em termos de anlise de varincia, o delineamento vem,
pois. fornecer dados em trs efeitos principais num plano com
nmero de celas usualmente exigidas para dois. Raciocinando em ter-
mos de anlise de varincia, o custo dessa maior eficincia claro: o
que parece ser um efeito principal significativo para cada um dos
trs cri trios classificatrios poderia, ao invs, ser uma interao
significativa de uma forma complexa entre os outros dois (Lindquist,
1953, pp. 258-264).As diferenas aparentes entre os efeitos dos XX
poderiam, pelo .contrrio, ser um efeito de interao especifica com-
plexa entre as diferenas dos grupos e as ocasies. Inferncias quanto
aos efeitos de X dependero da plausibil idade dessa hiptese rival
e, portanto, sero discutid J.Smais a fundo.
Note-se, inicialmente, que a hiptese de tal iriterao mais
plausvel para a aplicao quase-experimental descrita do que para
as aplicaes de quadrados latinos em experimentos em sentido
estrito, descri tos em textos que tratam do assunto. No que tem sido
descrito como dimenso de grupos. confundem-se duas possveis fon-
tes de efeitos sistemticos. Primeiro, fatores de seleo sistemtica
acham-se envolvidos na organizao natural dos grupos. Pode-se espe-
rar que tais fatores ' no s tenham efeitos principais como tambm
interajam com histria, maturao, efeitos de prtica, etc. Houvesse
sido montado dessa forma um experimento completamente contro-
lado, cada pessoa teria sido atribuda a cada grupo independente-
mente e ao acaso e tal fe)Otede efeitos principais e interativos teria
sido removida, pelo menos na extenso do erro de amostragem.
, caract~rstica do quase-experimento introduzir o contrabalana-
mento a fim de criar uma espcie de equao precisamente porque
tal atr ibuio aleat~ria 'no foi possvel. (Ao contrrio, em experi-
mentos completamente controlados, o quadrado latino empregado
por motivos de economia ou para superar 'problemas especficos 'da
amostragem de reas de terra.) Uma segunda possvel fonte de efeitos
confundida com grupos a associada com as especficas seqncias,
de tratamentos. ~e todas as rplicas num experimento em sentido
estri to ' houvessem de seguir o mesmo quadrado latino, essa fonte de
efeitos principais e interativos tambm estaria presente; contudo, no
tpico experimento em .rentido estrito alguns conjuntos de respon-
dentes replicados teriam sido atribudos a diferentes quadrados lati-
nos especficos, eliminando-se assim o efeito sistemtico de seqn-
Grupo B X20
X4.0
X10
XaO
~----
Grupo C
XsO
X10
X40
X20
Grupo D
X40
XaO
X20
X10
o delineamento foi diagranlado apenas com ps-testes, porque
seria especialmente preferido toda vez que pr-testes fossemdesaconse-
lhados e sempre que delineamentos, como o 10, no fossem pos-
sveis. O delineamento contm trs classificaes ou categorias (gru_
pos, ocasies e XX ou tratamentos experimentais). Cada classificao
o rtogonal s outras duas no sentido de que cada varivel de
cada classificao ocorre com igual freqncia (uma vez para o
quadrado latino) com cada varivel de cada uma das outras classifi-
caes. Para comear, pode-se notar que cada tratamento (cada X)
ocorre uma vez e apenas uma vez em cada coluna e apenas uma
vez em cada linha. O meS1Iloquadrado latino pode ser girado de
modo que os XX se tornem cabeas de linhas ou de colunas: '
Somas de escores por XX so, por conseguinte. comparveis por se
acharem cada tempo e cada grupo representados em cada tratamento.
88
89
.-
Xl
X2
Xa
X4
Grupo A
.t1O t2O
taO
t. p
Grupo B
taO t1O. t40 t2O
Grupo C
t20
t40
t10
tua
Grupo D
t40
taO
t20
t10
li
---
7/25/2019 Campbell Stanley
41/44
}
i r
:lt
H
~
n
f
1
j
li
li
d
II
11
I
I
.
: ~ . w .
cias espedficas. Isso tambm elimina a possibilidade de que uma
interao sistemtica especifica tenha produzido um aparente efeito
principal de
XX.
Ocasies podem provavelmente produzir um efeito principal
devido a testagem reiterada, maturao, prtica, efeitos cumulativos'
ou transferncia . Histr ia capaz tambm de produzir efeitos para '
ocasies. A estrutura do quadrado lat ino, claro, impede que esses
efeitos principais sejam contaminados pelos efeitos principais de
XX;
mas, sempre que os efeitos principais sejam sintomas de heteroge-
neidade significativa, existe provavelmente maior justificativa em
suspeitar interaes significativas do que quando os efeitos principais
se acham ausentes; Efeitos de prtica, por exemplo; podem ser mono-
tnicos,mas so provavelmente no-linear~s e gerariam, a um tempo,
efeitos principais e interativos. Muitos usos de quadrados latinos
em experimentos em sentido estrito, conio na agricultura, por exem- .
pIo, no envolvem medidas repetidas e ho produzem, tipicamente,
quaisquer correspondentes efeitos sistemticos de coluna. Os. do tipo
cruzado, todavia, t~m em comum com os quase-experimentos essa
fraqueza potencial. .
Essas consideraes tomam clara a extrema importncia da r-
plica do delineamento quase-experimental com diferentes quadrados
Jatinos espedficos. Tais rplicas, em nmero suficiente, transforma-
riam o quase-experimento num experime~to verdadeiro. Envolveriam
provavelmente tambm um nmero suficiente de grupos a fim de
tornar possveLa atribuio aleatria de grupos intactos a tratamen-
tos, o que constitui usualmente um meio de controle prefervel. No
obstante, fal ta de tais possibi lidades, um nico quadrado latino
representa um delineamento quase-experimental intuitivamente satis-
fatrio, por causa de sua demonstrao de todos osefeitos em todos os
grupos comparados. Desde que se tenham em mente os possveis erros
de interpretao, t rata-se de um plano digno de ser usado, quando
no seja possvel melhor controle. Apontadas que foram suas ~rias
debilidades. examinemos e salientemos suas relativas vantagens.
Como todos os quase-experimentos,. este ganha fora atravs da
consistncia das rplicas internas do experimento. Para tornar clara
essa consistncia, os efeitos principais de oeasies e de grupos devem
ser removidos pelo expediente de expressar cada cela como um desvio'
das mdias da linha (grupo) e da coluna (tempo): Mo - Mil.
~
M
,I
+
M...
Ento devem ser redistribudos os dados com trata.
mentos
XX)
como cabeas de colunas. Suponhamos que o quadro
resultante seja o de uma consistncia gratificante, com o mesmo tra-
tamento mais forte em todos os quatros grupos, etc. Quais so as
90
possibil idades de no ser esse o verdadeiro efei to de tratamentos,
mas, ao contrrio , de ser uma interao de grupos e ocasies? Pode-
mos notar que as interaes de grupos e ocasies mais. plausveis
reduziriam ou obScureceriam o efeito manifes.to de X. Uma interao
que imitasse um efeito principal de X seria improvvel e tanto mais
improvvel quanto maiores forem os quadrados latinos.
O experimentador seria mais atrado por esse delineamento
quando tivesse um controle programado sobre pouqussimos grupos
naturalmente agregados, tais como classes,mas no pudesse subdividir
tais grupos naturais em subgrupos aleatoriamente equivalentes, seja
para a apresentao de X seja para a testagem. Em tal situao,
desde que seja vivel a pr-testagem, poder ser usado tambm o
Delineamento 10; ele tambm envolve uma possvel confuso dos
efeitos deX com interaes de seleo e ocasies. Julgamos essapos-
sibilidade menos provvel no plano contrabalanado, porque todas
s comparaes so feitas em cada grupo e, portant, vrias interaes
.emparelhadas precisariam imitar o efeito exp~ental.
Ao passo que, em outros delineamentos, a reatividade especial de
apenas um dos grupos a um evento estranho (histria) ou prtica
(maturao) pode simular um efeito de Xl' tais efeitos coincidentes,
no plano contrabalanado, deveriam ocorrer em ocasies separa-
das em cada um dos grupos em turno. Isso deixa implcito, claro,
que no interpretaramos um efeito principal de X como signifi-
cativo se a inspeo das celas mostrasse que um efeito principal
estatisticamente significativo fosse primariamente p resultado de um
efeito muito forte em apenas um dos grupos. Para ulterior discusso
desse assunto, ver as comunicaes de Wilk e Kempthorne (1957) ,
Lubin (1961) e Stanley (J955).
12. Delineamento com pr-teste e ps- tes te de amostrs distintas
Para populaes 'grandes, tais como cidades, indstrias, escolas
e; unidades militares, pode freqentemente acontecer que, embora
no seja possvel segregar aleatoriamente subgrupos para tratamentos
experimentais diferenciais, se possa exercer algo como completo con-
trole experimental. sobre o
quando
e o
a quem
do OJ empregando-se
atribuio casual de processos. Tal controle toma possvel o
Delineamento 12:
A
O
A
X)
X O
91
Nesse diagrama, linhas representam subgrupos aleatoriamente
etc.). Maturao e a provavelmente mais ameaadora possibilidade
n
f
,>
fi
..
u
7/25/2019 Campbell Stanley
42/44
equivalentes e
X)
simboliza a apresentao de X irrelevante ao
problema em estudo. Uma amostra medida antes de X e outra
amostra equivalente depois de X. No este um delineamento intrin-
secamente forte , como o indica sua l inha na Tabela 2. No obstante,
pode ser ele freqUentemente tudo que seja vivel e, nessas condies,
merecer ser seguido. Tem sido usado em experimentos de cincias
sociais, que permanecem os melhores estudos existentes em sua rea
(por exemplo, Star e Hughes, 1950) .Embora tenha sido chamado o
delineamento simulado antes-e-depois (Sentiz, ]ahoda, Deutsch e
Cook, 1959, p. 116), bom notar sua;superioridade sobre o delinea-
mento comum antes-e-depois - Delineamento 2 - atravs de seu con-
trole tanto do efeito p. rincipal de testagem quanto da interao de
testagem. com X. A principal debilidade do delineamento sua inca-
pacidade de controlar histria. Assim, no estudo sobre a campanha
. d e publicidade de Cincinnati em favor das Naes Unidas e da
UNESCO (Star e Hughes, 1950),eventos estranhos no cenrio inter~
nacional exerceram provavelmente influncia no observado decrs-
cimo de otimismo quanto ao bom relacionamento com a Rssia.
do espri to d,este captulo incent ivar delineamentos remen-
dados , em que so acresentadas certas caractersticas a fim de con.
t rolar fatores especficos, mais ou menos um por vez (em contraste
com os mais ntidos experimentos em sentido estrito, em que um
nico grupo de controle cont iola todas as ameaas validade int~
na). Repet ind9-se o Delineamento 12 em diferentes con~extos em
tempos diferentes, como no D~linelD1ento12a (ver Tabela 2, p. 70),
controla-se histr ia . porque. se o mesmo efei to apurado repetid~-
mente, a possibi lidade de se tra tar de um produto de eventos hist-
ricos coincidentes toma.se menos provvel; mas tendncias histricas
seculares consistentes ou ciclos sazonais ainda permanecem explica-
es rivais no controladas. Ao replicar o efeito em outros contextos,
pode-se reduzir a possibi lidade de que o efei to observado seja espe-
cfico nica populao inicialmente selecionada; contudo, se o
contexto da pesquisa permitir o Delineamento
12a,
permitir tam-
.b~ o Delineamento 13, que, em geral , deveria ser preferido.
.
Maturao - o efeito de os respondentesficaremmais velhos
-
improvvel como hiptese rival,. mesmo num levantamento de
opinio pblica que se estenda por meses; mas, nas amostras ge
levantamento ou mesmo em algumas classescolegiais, as amostras
so suficientementegrandese as idades suficientementeheterogneas
para que se possam comparar sub.amosttas do grupo no pr.teste
que difiram em maturao (idade, nmero de semestres no
college,
de tendncias seculares e sazonais podem tambm ser controladas por
um delineaniento como o
12b,
que acrescenta um anter ior grupo de
pr-teste adicional, aproximando o esquema do modelo da srie
temporal, embora sem a testagem repetida. Para populaes tais
como a de sol ici tantes de psicoterapia , em que a cura ou a remisso
espontnea podem ocorrer, podem no ser plausveis as pressuposi-
es de linearidade implicitamente envolvidas.
:t
mais provvel que
a tendncia maturacional seja negativamente acelerada e faa, por-
tanto, com que o ganho maturacional 01
-
O2
seja maior do que o
ganho O2
-
Os, trabalhando, pois, contra a interpretao de que X
tenha t ido uni efei to
lnstrumentao representa um fator aleatrio nesse delineamento
quando empregado no contexto de levantamento amostrado. Se os
mesmos entrevistadores forem empregados no pr-teste e no ps-teste,
acontecer usualmente qUe muitos estaro {:olhendo sua primeira
entrevista no pr-teste e atuaro com mais experincia (ou talvez
com mais cinismo) no ps-teste. Se os entrevistadores diferirem em
cada fase e forem poucos, diferenas em idiossincrasias de entrevis-
tador sero confundidas com a varivel experimental . Se os entre-
vistadores tiverem conhecimento da hiptese e do fato de X ter ou
no sido aplicado, ento as expectativas do entrevistador podem
criar diferenas, como foi demonstrado experimentalmente por Stan-
ton e BaIter (1942) e Smith e Hyman (1950). O ideal seria usar
amostras casuais equivalentes de entrevistadores em cada fase e man-
ter os entrevistadores na ignornci.a do experimento. Alm disso, o
recrutamento de entrevistadores pode mostrar diferenas numa base
sazonal, por exemplo. porquanto maior nmero de univers itrios
se acha disponvel durante as frias de vero, etc. Os ndices de
recusa so provavelmente mais baixos e a durao das entrevistas
mais longas no vero do que no inverno. Para questionrios auto-
aplicados na sala de aula, esse ,erro de instrumento pode ser menos
provvel, embora as instrues sobre aplicao do teste possam talvez
ser melhor classificadas como instrumentao do que como efeitos
de X sobre
O. .
Cas~ entre pr-testes intercorram vrios meses, mortalidade pode
constituir-se em problema no Delineamento 12. Seambas as amostras
foram selecionadas ao mesmo tempo (ponto
A),
. medida que o
tempo passa de se esperar que mais membros da amostra selecio-
nada se tomem inacessveis e mais segmentos transitrios da popula-
o se percam, produzindo uma diferena na populao entre os
diversos perlodos. Diferenas entre grupos no nmero de pessoas no
con~ct.adas servem como uma advertncia de tal possibilidade.
92
93
.
f
I
i
I
t
1
i
H
.
il
:1
:,
I
I
I;
i
i
I
I
I
I i
,
, I
,
,
I
f
f1
~:~
'1
\
___
7/25/2019 Campbell Stanley
43/44
;-'1
'I
,
I
,
i-
r
Talvez, para estudos que perdurem por longos perodos, as amos-
tras do pr-teste e do ps-teste devam ser selecionadas independen-
temente e em pocas apropriadamente diferentes, embora isso tam-
bm tenha uma fonte de vis sistemtico, resultante de possveis
mudanas no padro residencial do universo como um todo. Em
alguns contextos, como nas escolas,arquivos tornaro possvel a elimi-
nao de escores do pr-teste dos que j no ~stejam disponveis ao
tempo do ps-teste, tornando assim o pr~testee o,ps-teste mais com-
parveis. Para 'fornecer um contato que torne essa correo possvel no
levantamen~o da amostra e p lra fornecer uma confirmao adicional
de efeito que mortalidade no possa contaminar, o grupo do pr-
teste pode ser retestado, como no Delineamento 12c, em que a dife-
rena 01 - O2 aeveria confirmar a comparao 01 - Os. Esse foi o
estudo de Duncan et aI. (1957) sobre a reduo em crenas falazes
causadas por um {:ursointrodutrio em psicologia. (Nesse esquema, '
o grupo do reteste' no :torna possvel o exame dos ganhos para
'pessoas de escores iniciais diversos porque a ausnda do grupo de
controle impede que se controle regresso.)
caracterst ica deste esquema mover-se do laboratrio para a
situao de campo para a qul o pesquisador quer generalizar, testan-'
do os efeitos de X em seu contexto natural. Em geral, como o indi-
cam as Tabelas 1 e 2, osDelineamentos 12, 12a, 12b e l2c so capazes
de ser superiores em validade externa ou genera1izabilidade aos ver-
dadeiros experimentos dos Delineamentos 4, 5 e 6. Estes esquemas '
exigem to pouco, por parte dos respondentes, que coperem ou que
estejam em certos lugares em certas ocasies, etc., que pode ser
empregada amostnigem representativa de populaes especificadas
de antemo.,
Nos Delineamentos 12e 13 (e, por certo, em algumas variaes
dos Delineamentos 4 e 6, em que X e O so aplicados atravs de con-
tatos individuais, etc.) possvel a amostragem representativa.
Os + + na coluna da interao seleo X so altamente relativps e
poderiam, .a rigor, ser substitudos por pontos de interrogao, uma
vez que, geralmente, na prtica, as unidades no so selecionadas por
sua relevncia terica, mas, freqentemente, por 1,Ilotivosde esp1rito
de cooperao e acessibilidade, o que os torna provavelmente atipicos
do universo para o qual se quer generalizr. '
No era para Cincinnati, Dias sim para os americanos em geral
ou para o povo em geral que Star e Hughes (1950) queriam genera-
l izar e permanece a possibilidade de que a reao a X em Cincinnati
tenha sido atipica de tais universos; mas o grau de tal vis de acessibi-
l idade to menor do que o encontrado em delineamentos mais exi-
gentes, que parece justificar-se um + comparativo.
13. Delineamentos com grupo de controle e pr-teste-p6s-teste de
amostras distintas
Espera-se qe o Delineamento 12seja usado em contextos emque
X, se for,mesmo apresentado, deve ser apresentado ao grupo comoum
todo. Se houver grupos comparveis (se no equivalentes) a que se
possa deixar de aplicar .Xi ento pode ser acrescentado um grupo de
controle ao Delineamento 12, criando-se o Esquema 13:
A
O
X)
A X O
A O
A
O
Este delineamento muito semelhante ao Delineamento 10, com
exceo do fato de que as mesmas pessoas espeCificasno so retesta-
tadas e, assim, evitada a possvel interao de testagem e X., Assim
como ocorre com o Delineamento 10, a fraql,lezado Delmeamento 13
quanto validade interna resulta da possibilidade de se interpretar
como um efeito de X uma tendncia local especfica no grupo expe-
rimental que, na realidade, com ele n~o se relaciona. Aumentando o
. nmero de unidades sociais envolvidas (escolas, cidades, indstrias,
navios, etc.) e atr ibuindo-as em certo nmero e, aleatoriamente ao
tratamento experimental e ao de controle, a nic.tonte de invalidade
pode ser removida e pode ser alcanado um verdadeiro experimento,
como o Delineamento 4, salvo evitar-se o reteste d,e indivduos espe-
cficos. Esse plano pode ser designado 13a.Seu diagrama (na Tabela
3) tem sido complicado pelos dois nveis de 'equivalncia (obtida
por atribuio aleatria) que se acham envolvidos. Ao nvel dos res-
pondentes, h, dentro de cada unidade social a equivalncia das
amostras separadas do pr-teste e do ps-teste, indicada pelo ponto
de atribuio A. Entre as vrias unidades sociais que recebem ambos
os tratamentos, no h' tal equivalncia, falta essaindicaaa pela linha
tracejada. O A designa a consti tuio do grupO experimental e do
grupo de controle pela atribuio aleatria dessas numerosas unida-
des sociais a um ou outro tratamento.
Como se v na linha correspondente a 13a na Tabela 3, esse
plano recebe, ~m escore perfeito tanto para a validade interna
quanto para a validade externa, esta ltima pelas razesj discutidas
em relao ao Delineamento 12, com maior fora quanto interao
seleo-X por causa da representao de numerosas unidades sociais,
em contraste com o uso de uma s. Ao que consta, este excelente
mas dispendioso delineamento no tem sido usado.
94
95
r.
i: