La Percepcion Visual

Dolores Luna Pfo Tudela

<( > 1-

z l.J 0 u

Percepcion visual

I-

I-

0

I-

0

I-

0

L.U

ÍNDICE

Prólogo . ................... .. ...... .. .. .. ... .. . . ... .. .. 15

Capítulo l. Introducción: historia y enfoque general . . . . . . . . . . . . . 19

l. Influencias iniciales . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 20 2. La teoría clásica. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 23

2.1. La sensación como unidad de análisis . . . . . . . . . . . . . . . . 24 2.2. La percepción como síntesis de sensaciones . . . . . . . . . . . 25 2.3. La inferencia inconsciente. . . . . . . . . . . . . . . . . . . . . . . . . 26

3. La primera mitad del siglo XX . . . . . . . . . . . . . . . . . . . . . . . . . . 27 3 .l. La teoría de la Gestalt. . . . . . . . . . . . . . . . . . . . . . . . . . . . 27

3 .l. l. Fenomenología. . . . . . . . . . . . . . . . . . . . . . . . . . . 28 3 .1.2. Configuración . . . . . . . . . . . . . . . . . . . . . . . . . . . 28 3 .1.3 . Innatismo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 29

3 .2. El conductismo. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 30 3.3. Teoría de la percepción directa . . . . . . . . . . . . . . . . . . . . 32

3.3 .l. Percepción ecológica . . . . . . . . . . . . . . . . . . . . . . 3 2 3.3 .2. Percepción directa. . . . . . . . . . . . . . . . . . . . . . . . 34

3 .4. Otras influencias. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 36 4. La segunda mitad del siglo xx. . . . . . . . . . . . . . . . . . . . . . . . . . 37

4.1. La psicología cognitiva..... . ..... . ............... 37 4.1.1. Sistemas.. .. .. . .. . . . .... .. .. ....... . . . . . 38 4.1.2. Información, codificación y representación. . . . . . 39 4.1.3. Características de los procesos........... . ... 40 4.1.4 . Métodos. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 42

4.2. El computacionalismo . . . . . . . . . . . . . . . . . . . . . . . . . . . 44 4.2.1. La teoría de David Marr. . . . . . . . . . . . . . . . . . . . 44

4.2.1.1. Los niveles de análisis. . . . . . . . . . . . . . . 45 4.2.1.2. Los niveles de organización del procesa-

miento visual . . . . . . . . . . . . . . . . . . . . . 46

8 PERCEPCIÓN VISUAL

4.2.2. El conexionismo. . . . . . . . . . . . . . . . . . . . . . . . . . 49 4.3. Los avances de la fisiología . . . . . . . . . . . . . . . . . . . . . . . . 51

5. Marco teórico . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 53 5 .l. La función de la visión . . . . . . . . . . . . . . . . . . . . . . . . . . . 53 5 .2. El procesamiento de la información. . . . . . . . . . . . . . . . . 54 5.3. Mecanismos neuronales. . . . . . . . . . . . . . . . . . . . . . . . . . 56

Capítulo 2. La percepción del color . . . . . . . . . . . . . . . . . . . . . . . . . . 59

Introducción..... . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 59 l. La apariencia del color . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 60

l. l. La cantidad de luz y su medida. . . . . . . . . . . . . . . . . . . . . 60 1.2. El espectro electromagnético . . . . . . . . . . . . . . . . . . . . . . 61 1.3. La codificación del color. . . . . . . . . . . . . . . . . . . . . . . . . . 62 1.4. Los atributos del color . . . . . . . . . . . . . . . . . . . . . . . . . . . 63 1.5 . Sistemas de ordenación de los colores. . . . . . . . . . . . . . . . 64

1.5 .l. El sistema de colores de Munsell . . . . . . . . . . . . . 64 1.5 .2. La codificación de la longitud de onda . . . . . . . . . 66 1.5 .3. El diagrama de cromaticidad . . . . . . . . . . . . . . . . 70

1.6. La mezcla de pigmentos . . . . . . . . . . . . . . . . . . . . . . . . . . 72 2. Tricromaticidad. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 73

2.1. Las deficiencias cromáticas . . . . . . . . . . . . . . . . . . . . . . . . 73 2.2. Fisiología de los fotorreceptores . . . . . . . . . . . . . . . . . . . 74

3. Procesamiento oponente. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 76 3 .l. Fenómenos que cuestionan la teoría tricromática . . . . . . . 77 3 .2. Teoría de Hering . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 78 3.3. Teoría de Hurvich y Jameson . . . . . . . . . . . . . . . . . . . . . . 78 3.4. Investigaciones de DeValois . . . . . . . . . . . . . . . . . . . . . . . 80 3.5. Avances recientes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 80

3.5 .l. Investigación empírica . . . . . . . . . . . . . . . . . . . . . 8 O 3.5 .2. Elaboración teórica . . . . . . . . . . . . . . . . . . . . . . . 81

4. La constancia del color . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 86 4.1. La constancia de la claridad . . . . . . . . . . . . . . . . . . . . . . . 8 8 4.2. La constancia cromática . . . . . . . . . . . . . . . . . . . . . . . . . . 95

5. Categorización del color . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 103

Capítulo 3. Procesamiento visual inicial. . . . . . . . . . . . . . . . . . . . . . . 107

Introducción. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 107 l. Las investigaciones de Hube! y Wiesel. . . . . . . . . . . . . . . . . . . . 108

l. l. Tipos de células . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 108 1.2. La arquitectura de la corteza estriada . . . . . . . . . . . . . . . . 112

1.2.1. Organización retinotópica . . . . . . . . . . . . . . . . . . 112 1.2.2. Columnas de dominio ocular . . . . . . . . . . . . . . . . 113

ÍNDICE 9

1.2.3. Columnas de orientación.. . . . . . . . . . . . . . . . . . 114 1.2.4. Organización modular . . . . . . . . . . . . . . . . . . . . . 115

2. Aproximación psicofísica . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 116 2.1. El análisis de la frecuencia espacial.. . . . . . . . . . . . . . . . . 116 2.2. El concepto de frecuencia espacial . . . . . . . . . . . . . . . . . . 117 2.3. El análisis de Fourier . . . . . . . . . . . . . . . . . . . . . . . . . . . . 119 2.4. El análisis de Fourier como modelo . . . . . . . . . . . . . . . . . 121 2.5. Evidencia experimental. . . . . . . . . . . . . . . . . . . . . . . . . . . 122

2.5 .1. La Función de Sensibilidad al Contraste (FSC) . . . 123 2.5 .2. Predicciones a partir de la FSC. . . . . . . . . . . . . . . 124 2.5 .3. Los posefectos de frecuencia espacial . . . . . . . . . . 124 2.5 .4. Manipulación de la fase de los enrejados . . . . . . . 126

2.6. Función de la corteza visual primaria . . . . . . . . . . . . . . . . 127 3. La aproximación computacional . . . . . . . . . . . . . . . . . . . . . . . . 130

3 .1. El esbozo primario . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13 O 3.2. El esbozo primario bruto . . . . . . . . . . . . . . . . . . . . . . . . . 132

3.2.1. Filtrado de la imagen . . . . . . . . . . . . . . . . . . . . . . 132 3 .2.2. Localización de los puntos de cruce de cero . . . . . . 133 3.2.3. La determinación de las características. . . . . . . . . 138

3.3. Bases fisiológicas del esbozo primario bruto . . . . . . . . . . . 139 3.4. Valoración de la teoría de David Marr . . . . . . . . . . . . . . . 141

Conclusión.... . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 141

Capítulo 4. El espacio tridimensional. . . . . . . . . . . . . . . . . . . . . . . . . . . 145

1. Las claves de profundidad. . . . . . . . . . . . . . . . . . . . . . . . . . . . . 146 1.1. Claves monoculares . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 146

1.1.1. Claves estáticas. . . . . . . . . . . . . . . . . . . . . . . . . . . 146 1.1.1.1. Claves oculares. . . . . . . . . . . . . . . . . . . . 146

• Acomodación . . . . . . . . . . . . . . . . . . . 146 1.1.1.2. Claves pictóricas . . . . . . . . . . . . . . . . . . 14 7

• Perspectiva lineal . . . . . . . . . . . . . . . . 14 7 • Altura relativa . . . . . . . . . . . . . . . . . . 14 9 • Perspectiva aérea . . . . . . . . . . . . . . . . 149 • Tamaño relativo . . . . . . . . . . . . . . . . . 150 • Tamaño familiar. . . . . . . . . . . . . . . . . 150 • Gradiente de textura . . . . . . . . . . . . . 150 • Sombreado y sombras. . . . . . . . . . . . . 151 • Interposición . . . . . . . . . . . . . . . . . . . 155

1.1.2. Claves dinámicas . . . . . . . . . . . . . . . . . . . . . . . . . 15 5 1.2.2.1. Paralaje de movimiento . . . . . . . . . . . . . 15 5 1.2.2.2. Flujo óptico . . . . . . . . . . . . . . . . . . . . . . 15 6 1.2.2.3. El efecto de profundidad cinética. . . . . . 158

1.2. Las claves binoculares . . . . . . . . . . . . . . . . . . . . . . . . . . . . 159


1.2.1. Convergencia binocular . . . . . . . . . . . . . . . . . . . . 159 1.2.2. La estereoscopia. . . . . . . . . . . . . . . . . . . . . . . . . . 161

1.2.2.1. Conceptos fundamentales. . . . . . . . . . . . 161 1.2.2.2. Procedimientos estereoscópicos . . . . . . . 165 1.2.2.3. El problema de la correspondencia. . . . . 167 1.2.2.4. Estereogramas de puntos aleatorios . . . . 167 1.2.2.5. Características de la estereoscopia humana 168 1.2.2.6. Mecanismos fisiológicos de la estereosco-

pla ... . . . . . . . . . . . . . . . . . . . . . . . . . . 170 1.2.3. Rivalidad binocular . . . . . . . . . . . . . . . . . . . . . . . 171

1.3. Relación entre las claves de profundidad . . . . . . . . . . . . . 172 1.3.1. Dominancia . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 172 1.3 .2. Compromiso . . . . . . . . . . . . . . . . . . . . . . . . . . . . 173 1.3.3. Interacción. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 173

2. Teorías de la percepción espacial. . . . . . . . . . . . . . . . . . . . . . . . 17 4 2.1. La aproximación constructivista . . . . . . . . . . . . . . . . . . . . 17 4

2.1.1. La constancia del tamaño................... 175 2.1.2. Tomar en consideración la distancia . . . . . . . . . . . 177 2.1.3. Evidencia a favor de la hipótesis de la in varianza

tamaño-distancia . . . . . . . . . . . . . . . . . . . . . . . . . 178 2.1.3 .l. La ley de Emmert. . . . . . . . . . . . . . . . . . 178 2.1.3 .2. Percepción del tamaño e indicadores de

profundidad. . . . . . . . . . . . . . . . . . . . . . 179 2.2. La aproximación ecológica. . . . . . . . . . . . . . . . . . . . . . . . 182

2.2.1. La constancia del tamaño desde una perspectiva ecológica . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 183

2.2.2. Resultados experimentales . . . . . . . . . . . . . . . . . . 184 3. Posible reconciliación . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 185

3 .l. Los sistemas visuales dorsal y ventral . . . . . . . . . . . . . . . . 18 6 3.2. Las disociaciones neuropsicológicas . . . . . . . . . . . . . . . . . 188

3.2.1. Percepción sin coordinación visomotora........ 190 3.2.2. Coordinación visomotora sin percepción. . . . . . . 191

3.3. La propuesta de Norman . . . . . . . . . . . . . . . . . . . . . . . . . 193 3.3.1. Características de los dos sistemas . . . . . . . . . . . . 193 3.3.2. Relación entre los dos sistemas y las teorías per

ceptivas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 194 3.3 .2.1. Las claves de profundidad . . . . . . . . . . . 196 3.3.2.2. La percepción del tamaño . . . . . . . . . . . 197

Capítulo 5. Percepción del movimiento . . . . . . . . . . . . . . . . . . . . . . . . . 199

l. Movimiento real . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 200 1.1. Umbrales de detección del movimiento. . . . . . . . . . . . . . . 200

2. Ilusiones de movimiento . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 202

ÍNDICE 11

2.1. Posefectos de movimiento. . . . . . . . . . . . . . . . . . . . . . . . . 203 2.2. Movimiento auto-cinético . . . . . . . . . . . . . . . . . . . . . . . . 204 2.3. Movimiento inducido. . . . . . . . . . . . . . . . . . . . . . . . . . . . 204 2.4. Movimiento aparente . . . . . . . . . . . . . . . . . . . . . . . . . . . . 206

2.4.1. Condiciones que determinan la percepción del movimiento aparente . . . . . . . . . . . . . . . . . . . . . . 208

2.4.2. Tipos de movimiento aparente. . . . . . . . . . . . . . . 210 3. Mecanismos fisiológicos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 211

3 .l. Detectores del movimiento. . . . . . . . . . . . . . . . . . . . . . . . 211 3.2. Análisis cortical del movimiento. . . . . . . . . . . . . . . . . . . . 212

4. Modelos de detección del movimiento . . . . . . . . . . . . . . . . . . . 213 5. Percepción de acontecimientos . . . . . . . . . . . . . . . . . . . . . . . . . 216

5 .l. Percepción de la causalidad. . . . . . . . . . . . . . . . . . . . . . . . 216 5 .2. Movimiento biológico . . . . . . . . . . . . . . . . . . . . . . . . . . . 218 5.3. Movimiento propio y flujo óptico................... 219

Resumen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 222

Capítulo 6. Percepción de la forma l. Organización perceptiva. . . . . . 223

l. Organización perceptiva . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 225 1.1. Principios de organización perceptiva. . . . . . . . . . . . . . . . 226

1.1.1. Principios de segregación de la figura y el fondo. . 226 1.1.2. Principios de agrupamiento perceptivo. . . . . . . . . 229 1.1.3. Limitaciones de la Teoría de la Gestalt . . . . . . . . . 231

2. Desarrollos posteriores en el estudio de la organización percep-tiva. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 233 2.1. Investigaciones sobre la segregación de la figura y el fondo 233

2.1.1. Componentes de frecuencia espacial y segregación de la figura y el fondo. . . . . . . . . . . . . . . . . . . . . . 233

2.1.2. Asignación unilateral de bordes . . . . . . . . . . . . . . 235 2.1.3. Influencia de los procesos de reconocimiento en la

segregación de la figura y el fondo . . . . . . . . . . . . 23 7 2.2. Investigaciones sobre agrupamiento perceptivo. . . . . . . . . 239

2.2.1. Agregados perceptivos y configuraciones . . . . . . . 239 2.2.2. Cuantificación del agrupamiento perceptivo. . . . . 243 2.2.3. Teoría computacional de la visión y agrupamiento

perceptivo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 245 2.3. Segregación de la textura . . . . . . . . . . . . . . . . . . . . . . . . . 248

2.3 .l. Procedimiento experimental. . . . . . . . . . . . . . . . . 249 2.3.2. Teorías. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 250

Resumen. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 25 2


Capítulo 7. Percepción de la forma 11. Detección y discriminación de formas visuales . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 25 3

l. Detección de formas visuales. . . . . . . . . . . . . . . . . . . . . . . . . . . 253 l. l. Detección de patrones de puntos . . . . . . . . . . . . . . . . . . . 254

1.1.1. Procedimiento de enmascaramiento visual . . . . . . 25 4 1.1.2. Factores que afectan a la detectabilidad de las for-

mas visuales . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 255 1.2. Detección de la simetría . . . . . . . . . . . . . . . . . . . . . . . . . . 257

1.2.1. Patrones estimulares y procedimientos experimen-tales . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 257

1.2.2. Factores que influyen en la detección de la simetría 260 2. Discriminación de formas visuales. . . . . . . . . . . . . . . . . . . . . . . 263

2.1. Propiedades componentes y globales de los estímulos. . . . 264 2.1.1. Relaciones entre dimensiones estimulares. . . . . . . 267 2.1.2. Contribución de las propiedades componentes y

configuracionales en la discriminación . . . . . . . . . 271 2.2. Primacía del procesamiento de la información global y lo-

cal . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 272 2.2.1. Hipótesis de la primacía global. . . . . . . . . . . . . . . 273 2.2.2. Factores que afectan a la primacía del procesa-

miento................................. 274 2.2.3. Origen de la primacía del procesamiento . . . . . . . 276

2.3. Teoría de integración de características. . . . . . . . . . . . . . . 2 77 2.3.1. Evidencia comportamental.................. 277 2.3.2. Modelo de percepción del objeto. . . . . . . . . . . . . 279

Resumen. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 282

Capítulo 8. Reconocimiento visual. . . . . . . . . . . . . . . . . . . . . . . . . . . . . 283

l. Reconocimiento de objetos . . . . . . . . . . . . . . . . . . . . . . . . . . . . 284 l. l. Comparación de plantillas . . . . . . . . . . . . . . . . . . . . . . . . 284 1.2. Análisis de características . . . . . . . . . . . . . . . . . . . . . . . . . 287 1.3. Descripciones estructurales........................ 289 1.4. Teoría de Marr y Nishihara. . . . . . . . . . . . . . . . . . . . . . . . 291 1.5. Modelo de reconocimiento por componentes.......... 293

1.5 .l. Modelo PDP de reconocimiento por componentes 297 2. Reconocimiento de caras. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 299

2.1. Procesamiento de las características componentes de las caras.... . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 299

2.2. Interacciones entre características componentes en el reconocimiento de caras . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 301

2.3. Procesamiento configuracional de las caras. . . . . . . . . . . . 302 3. Diferencias entre el reconocimiento de caras y objetos . . . . . . . 304

ÍNDICE 13

Capítulo 9. Apéndice metodológico. . . . . . . . . . . . . . . . . . . . . . . . . . . . 307

l. Psicofísica clásica. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3 07 1.1. Métodos psicofísicos indirectos . . . . . . . . . . . . . . . . . . . . 3 08

1.1.1. Método de los estímulos constantes . . . . . . . . . . . 308 1.1.2. Método de los límites . . . . . . . . . . . . . . . . . . . . . . 312 1.1.3. Método de los ajustes o error promedio. . . . . . . . 315

1.2. Teorías del umbral . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 319 2. Teoría de Detección de Señales (TDS). . . . . . . . . . . . . . . . . . . . 322

2.1. Descripción de la TDS . . . . . . . . . . . . . . . . . . . . . . . . . . . 322 2.2. Índices correspondientes al proceso sensorial (d') y al pro-

ceso de decisión . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 325 2.3. Curva ROC . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 329

3. Métodos de construcción de escalas sensoriales. . . . . . . . . . . . . 3 31 3 .1. Métodos directos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3 3 2

3.1.1. Estimación de magnitud. . .. . ............... 332 3.1.2. Producción de magnitud. . . . . . . . . . . . . . . . . . . . 333

3.2. La ley psicofísica potencial . . . . . . . . . . . . . . . . . . . . . . . . 334 3.3. Método de ajuste de modalidades sensoriales y validez de

la ley psicofísica potencial. . . . . . . . . . . . . . . . . . . . . . . . . 335 3.4. Limitaciones de la propuesta de Stevens. . . . . . . . . . . . . . 337 3.5. Interpretación de la ley potencial . . . . . . . . . . . . . . . . . . . 3 3 7

3.5 .l. Interpretación sensorial . . . . . . . . . . . . . . . . . . . . 3 3 7 3.5 .2. Interpretaciones cognitivas. . . . . . . . . . . . . . . . . . 33 8

4. Tiempo de reacción (TR) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 339 4.1. Tareas de TR . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 340 4 .2. Problemática específica del tiempo de reacción. . . . . . . . . 341

4.2.1. La medida del TR. . . . . . . . . . . . . . . . . . . . . . . . . 341 4.2.2. Técnicas de velocidad y precisión............. 342

5. Técnicas y procedimientos experimentales en el estudio de la percepción . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 343

Resumen. .... . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 344

Glosario . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 345 Referencias. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 359

Capítulo 1

INTRODUCCIÓN: HISTORIA Y ENFOQUE GENERAL

Las disciplinas científicas se configuran a lo largo de la historia. Son el resultado de complejas interacciones de un conjunto de factores sociales, económicos y científicos. La forma de pensar actualmente sobre la percepción humana, al igual que sobre otros aspectos de la psicología o de la vida, es el resultado de unas formas de pensar sobre la ciencia y sobre la psicología en particular, que han tenido lugar a lo largo de siglos. Los descubrimientos, las discusiones, los acuerdos y desacuerdos de los investigadores del pasado, determinan la forma en que nosotros planteamos hoy los problemas. Por eso, al comenzar a estudiar la percepción visual, es necesario que conozcamos a los principales interlocutores, a aquellas personas que con sus contribuciones teóricas han organizado este campo de estudio de la forma en que hoy lo está. Muchas de esas contribuciones serán estudiadas en detalle a lo largo de este libro. Lo que nos interesa en este capítulo es prestar atención a las ideas generales, a los conceptos básicos que han estructurado nuestro campo de estudio. De la misma forma que antes de edificar una casa es necesario urbanizar el terreno sobre el que se va a construir, así antes de estudiar en detalle los distintos aspectos de la percepción, es necesario tener un conocimiento del marco general en el que se encuadran las investigaciones que vamos a estudiar en los próximos capítulos.

En este capítulo vamos a presentar ese marco general. Comenzaremos viendo que la investigación científica de la percepción en psicología depende en sus orígenes de la reflexión filosófica previa y de los avances científicos en otras disciplinas relacionadas con la psicología. A continuación nos adentraremos en el estudio de la época correspondiente a la segunda mitad del siglo XIX

en la que se configura la concepción científica clásica de la investigación de la percepción. En el tercer y cuarto apartado del capítulo veremos el desarrollo


que tuvo lugar en la primera y segunda mitad del siglo xx respectivamente. Finalmente, en el contexto de esta exposición histórica, podremos entender mejor el marco teórico general que inspira este libro y que expondremos de forma sumaria en la última parte de este capítulo.

1. INFLUENCIAS INICIALES

El interés por explicar cómo percibimos es muy antiguo. Las primeras teorías científicas de la percepción no se formularon a partir de la nada, sino que estuvieron influidas por teorías previas basadas en el sentido común o en la reflexión filosófica. Para la filosofía, y sobre todo para la filosofía moderna, el estudio de la percepción formaba parte de la teoría del conocimiento que se interesaba por justificar su validez. mn qué medida nuestros sentidos nos proporcionan un conocimiento válido del mundo que nos rodea? ¿Hasta qué punto podemos confiar en nuestros sentidos? Estas preguntas son fundamentales para una teoría del conocimiento y, al intentar contestarlas, la reflexión filosófica moderna tendió a polarizarse en torno a dos posturas contrapuestas: el racionalismo y el empirismo.

Para el racionalismo, los sentidos no eran una fuente fiable de conocimiento. No es que nos engañen siempre, pero nos pueden engañar y, por tanto, no pueden ser el fundamento último de un conocimiento cierto. El racionalismo estaba convencido de que el conocimiento indudable y cierto era posible, y creyó encontrar el fundamento de la certeza en la razón, no en los sentidos. El filósofo francés René Descartes, que fue uno de los principales teóricos del racionalismo, pensaba que, en el proceso de intentar fundamentar el conocimiento, se podía dudar de todo menos del hecho de pensar: Cogito ergo sum, que significa: pienso, luego existo . En el hecho de pensar, Descartes encontró el fundamento de toda certeza, comenzando por la certeza de la propia existencia. El pensamiento y el razonamiento nos proporcionan un conocimiento más fiable que el conocimiento proporcionado por los sentidos. Para Descartes, la mente humana está dotada de ideas innatas, que no dependen de la experiencia sensorial, y que constituyen el fundamento de nuestras certezas más fundamentales.

Como psicólogos, no constituye nuestro principal interés la valoración de los argumentos filosóficos de los racionalistas. Lo que tiene importancia para nosotros es que el racionalismo concede una importancia fundamental, a la hora de explicar la naturaleza de nuestro conocimiento, por un lado a los procesos de pensamiento y, por otro, a factores innatos. Como veremos más adelante, dos problemas fundamentales que hay que resolver en el estudio de la percepción tienen que ver, por un lado, con el grado de implicación que los procesos cognoscitivos relacionados con el pensamiento tienen en la percepción, y, por otro lado, con el grado de dependencia que la percepción tiene respecto de factores innatos.

INTRODUCCIÓN: HISTORIA Y ENFOQUE GENERAL 21

El empirismo representó en la discusión filosófica la postura opuesta al racionalismo. Los empiristas nunca estuvieron convencidos de que el conocimiento cierto fuera posible. Ellos se interesaron más por determinar cómo era nuestro conocimiento y valorar después el grado de certeza que podía ofrecer. El punto de partida que adoptaron los empiristas afirmaba que, de hecho, todo conocimiento empieza por los sentidos. No existen ideas innatas, como defendían los racionalistas, sino que todo conocimiento procede de la experiencia y la experiencia es inicialmente sensorial. John Locke, uno de los principales teóricos del empirismo, describía la mente como una hoja de papel en blanco sobre la cual escribe la experiencia. Los empiristas pusieron el acento en la composición de la mente a base de elementos simples. El nombre que dieron a esos elementos varió de unos autores a otros. Por ejemplo, Locke pensaba que los elementos constitutivos de la mente eran las ideas que, a su vez, podían tener su origen bien en las sensaciones proporcionadas por los sentidos o en la reflexión, que fue un término utilizado por Locke para referirse al conocimiento que la mente tiene de sus propias operaciones. Otro empirista cuyos escritos ejercieron una profunda influencia fue David Hume, quien utilizó el término impresión para referirse a los datos sensoriales y perceptivos y reservó el término idea para referirse a las <<débiles copias>> de esas impresiones que mantenemos en la memoria y en la imaginación. Lo importante para nosotros es que en torno al empirismo, no importa cual fuera la terminología utilizada, se elaboro la idea de que las sensaciones eran los elementos irreductibles del conocimiento y que el conocimiento complejo era el resultado de la asociación de diferentes sensaciones simples.

El concepto de sensación elaborado por la filosofía empirista encontró un valioso apoyo en los descubrimientos que a principios del siglo XIX realizó la fisiología de los sentidos. Charles Bell en 1811 y Frans;ois Magendie once años después demostraron que las funciones sensoriales estaban mediadas por un conjunto de nervios que eran diferentes de los que mediaban las funciones motoras. En 1820, Johannes Müller formuló la doctrina de la energía específica de los nervios según la cual cada sensación estaba determinada por la actividad específica de los nervios sensoriales que le servían de medio de transmisión, independientemente de cual fuera el estímulo que causara esa actividad. Aunque esta doctrina, tal como fue formulada por Müller, no es aceptada hoy, tuvo una extraordinaria importancia en su tiempo y contribuyó en gran medida a fomentar la investigación encaminada a determinar los diferentes sentidos o modalidades sensoriales y a estudiar la forma en que los efectos producidos por un objeto percibido eran transmitidos hasta el cerebro mediante los nervios sensoriales.

En el proceso de determinar cuáles eran las sensaciones elementales, los fisiólogos y los físicos del siglo XIX prestaron mucha atención a la sensación misma como hecho mental o dato de consciencia e idearon procedimientos experimentales para poder estudiarlas.


Como resultado de ese esfuerzo, comenzaron a aparecer todo un conjunto de métodos y de resultados que dieron origen a la psicofísica. En 1834 Ernst H. Weber estaba interesado en estudiar si los nervios que responden al estado de nuestros músculos, también contribuyen a nuestro sentido del tacto cuando tratamos de juzgar el peso de los objetos. Weber introdujo el concepto de diferencia apenas perceptible y comprobó que no se trataba de una cantidad absoluta sino que se aproximaba a una razón constante del peso que se estaba juzgando. Posteriormente, en 1860, Gustav T. Fechner publicó sus Elementos de Psicofísica, libro fundamental en la historia de la psicología de la percepción y de la psicología experimental en general. A partir de Fechner, la psicofísica quedó establecida como disciplina interesada en establecer las relaciones matemáticas precisas entre los estímulos, cuidadosamente medidos en escalas físicas, y las sensaciones evocadas por esos estímulos, cuidadosamente medidas en escalas de sensación. Los métodos para construir escalas de las sensaciones y los resultados principales, representados por la Ley de Fechner, forman parte del patrimonio de la psicofísica actual que nosotros estudiaremos preferentemente en sus aspectos metodológicos recogidos en el Apéndice de este libro.

El concepto de percepción tardó más en acuñarse que el de sensación. Suele citarse a Thomas Reid como uno de los teóricos más influyentes a la hora de establecer una distinción entre sensación y percepción. Reid fue un filósofo escocés del siglo XVIII descontento con el excesivo énfasis en el valor de las sensaciones que adoptaba el empirismo inglés. Pensaba Reid1 que una teoría del conocimiento basada exclusivamente en sensaciones estaba abocada al escepticismo respecto del valor real de nuestros conocimientos, como de hecho estaba ocurriendo en la versión del empirismo que formulaba Hume. Reid era un realista filosófico y quería establecer el valor real y objetivo del conocimiento sobre sólidas bases filosóficas. Para conseguirlo consideraba fundamental la distinción entre sensación y percepción. Para Reid, la percepción es mucho más que una sensación, aunque depende de las sensaciones. La percepción incluye dos elementos que no están presentes en la sensación. El primero es una concepción del objeto. El segundo es una irresistible convicción de la existencia de ese objeto. Reid, por tanto, diferenció claramente entre sensación y percepción incluyendo en la percepción tanto la categorización del objeto como su existencia objetiva. De nuevo, no es el valor filosófico de los argumentos de Reid lo que ahora nos interesa, sino la distinción que introdujo entre sensación y percepción. Como veremos, otros investigadores posteriores encontraron útil esta distinción aunque la establecieron sobre una base diferente a la formulada por Reid. No obstante, merece la pena señalar que una idea que Reid consideraba filosóficamente crucial, cuando pensaba que la existencia real de los objetos es percibida directamente, ha tenido una

l. Existe traducción de la obra principal de Reid en la Editorial Trotta (2004): Investigación sobre la mente humana según los principios del sentido común.


influencia muy importante en la formulación de la teoría de la percepción directa que, como veremos más adelante, llevó a cabo a mediados del siglo xx James Gibson.

2. LA TEORÍA CLÁSICA

La que hoy suele conocerse con el nombre de teoría clásica, fue formulada durante la segunda mitad del siglo XIX por Hermann von Helmholtz y posteriormente reelaborada por Wilhelm Wundt. Esta teoría ha constituido un patrimonio común de casi todos los teóricos de la percepción y sus ideas centrales han sido reformuladas de forma diferente hasta nuestros días. Bien sea para perfeccionar su formulación, o para mostrarse en desacuerdo con ella, la teoría clásica constituye un punto de referencia obligado en el estudio de la percepción.

En 1856 Helmholtz comenzó a publicar su Tratado de Óptica Fisiológica y en 1863 publicó su libro Sobre la Sensación de Tono. Ambas publicaciones pueden considerarse como el fundamento de la moderna investigación científica de la percepción visual y auditiva respectivamente. Es interesante caer en la cuenta de que, en su Tratado de Óptica Fisiológica Helmholtz trató los problemas más elementales de la sensación y los problemas más complejos de la percepción como parte de una única disciplina fisiológica. El tercer volumen de su Tratado estudia un conjunto de problemas que, con el tiempo, han pasado a formar parte de los textos de psicología de la percepción y han desaparecido de los textos de fisiología. Esta situación, que puede entenderse como resultado de la progresiva especialización que caracteriza al desarrollo de la ciencia, no debe ocultar el valor de la concepción unitaria de Helmholtz, para quien el uso de métodos comportamentales o introspectivos no suponía un cambio de disciplina sino el desarrollo de la fisiología por otros medios.

El interés por fundar una ciencia específica de lo mental, basada en el uso de la introspección como método adecuado para captar su especificidad, fue cosa de Wundt, que era discípulo de Helmholtz. En 1874 publicó sus Fundamentos de Psicología Fisiológica y en 1879 fundó el primer laboratorio dedicado al estudio de la psicología experimental. A partir de Wundt, la investigación psicológica de la percepción inició un rumbo particular que, si bien ha estado casi siempre en contacto con los principales descubrimientos fisiológicos, tiene su propia historia. En este nuevo contexto, la formulación de la teoría clásica de la percepción por el discípulo de Wundt, Edward Titchener, suele conocerse con el nombre de estructuralismo. En la exposición que vamos a hacer de la teoría clásica prescindiremos de las diferencias entre las formulaciones de Helmholtz, Wundt y Titchener, con el fin de fijar nuestra atención en las ideas centrales que caracterizan esta postura teórica.

De forma general, el punto de vista clásico afirma que nuestra percepción de los objetos y de los acontecimientos está determinada por estructuras men-


tales que no nos han venido dadas de forma innata sino que son el resultado de un proceso de aprendizaje perceptivo a partir de experiencias sensoriales elementales. El punto de vista clásico fue, en su origen, fundamentalmente empirista y trató de integrar en una teoría unitaria las principales aportaciones que el desarrollo científico del momento podía hacer al estudio de la percepción. Tres aspectos de la teoría merecen especial atención:

2.1. La sensación como unidad de análisis

Para la teoría clásica de la percepción, la investigación perceptiva debe comenzar por el análisis de las sensaciones básicas. Primero se procede a diferenciar las modalidades sensoriales y a continuación se trata de subdividir cada modalidad en sus diferentes sensaciones elementales. Este programa de investigación exigía buscar en primer lugar los estímulos físicos más simples que fueran capaces de evocar una sensación, después había que investigar los receptores elementales que responden a ese estímulo. Dado que la doctrina formulada por Johannes Müller afirmaba que cada sensación era el resultado de una energía nerviosa específica, parecía lógico pensar que a partir del análisis de las sensaciones se podría llegar a determinar esas energías. Para ello, los conceptos de umbral absoluto y de umbral diferencial acuñados por la psicofísica, así como los métodos ideados para medir esos umbrales, resultaban imprescindibles. Los primeros resultados parecían prometedores. Como veremos en el Capítulo 2 de este libro, a partir de este programa de investigación Helmholtz pudo reformular la teoría tricromática de la percepción del color que Thomas Young había anticipado. En otros campos de la investigación perceptiva, la psicofísica también hizo importantes avances y aportaciones.

Sin embargo, el concepto mismo de sensación no estaba libre de problemas. Por un lado, el análisis de las sensaciones llevó a describirlas en términos de atributos. Wundt propuso de modo relativamente informal que toda sensación tenía dos atributos: cualidad e intensidad, pero fue Külpe quien utilizó de forma sistemática el término atributo para caracterizar las sensaciones. Los atributos no son entidades separables que al juntarse forman la sensación, son aspectos diferentes de la sensación que pueden variar de forma más o menos independiente pero que son necesarios para que se dé una sensación. Una sensación sin cualidad o sin intensidad no es una sensación aunque ambos aspectos pueden variar de forma muy diversa. Para Külpe, las sensaciones correspondientes a los cinco sentidos necesitan tener tres atributos: cualidad, intensidad y duración. Además, la visión y el tacto, poseían un cuarto atributo que era la extensión. Al incluir la duración y la extensión como atributos, Külpe hizo concesiones a las posiciones innatistas que consideraban que el espacio y el tiempo no dependían de la experiencia, sino que estaban dadas en la propia estructura mental. Vemos, pues, que en el análisis mismo de la sensación, la teoría clásica se encontró con las grandes limitaciones de una posición empirista radical.


Otro aspecto que contribuyó al declive del concepto de sensación tuvo que ver con el carácter de elemento fundamental que se le asignaba. Un problema importante para considerar a las sensaciones como unidades fundamentales, es que no podemos distinguirlas una vez que entran a formar parte de un compuesto. Como veremos al tratar del color, que era considerada una de las sensaciones más simples, la mezcla de colores fundamentales produce un nuevo color pero en el nuevo color no hay rastro de las sensaciones correspondientes a los colores que producen la mezcla. Para Titchener, para quien la introspección debía servir siempre para aislar las sensaciones componentes, cada matiz distinto de color era una sensación elemental diferente. Para Helmholtz, sin embargo, los resultados de los experimentos de mezcla de colores eran más fiables que la introspección para detectar los componentes elementales y, en el caso del color, sólo había tres componentes elementales. ¿Había, por tanto, sólo tres sensaciones de color? El problema no es meramente una cuestión de nombres, sino que pone de manifiesto que, incluso en el caso de las sensaciones consideradas más simples, la idea de que las sensaciones constituían los elementos irreductibles de la experiencia consciente, se encontraba con problemas de difícil resolución. El terreno estaba preparado para la formulación de nuevas alternativas.

2.2. La percepción como síntesis de sensaciones

Para comprender la teoría clásica de la percepción, es importante distinguir entre el estímulo distante y el estímulo próximo. Al hablar de estímulo distante se hace referencia a las propiedades físicas de los objetos mismos, por ejemplo su tamaño, su forma, la distancia a la que se encuentra del observador, etc. El concepto de estímulo próximo hace referencia a las propiedades de la estimulación que actúa sobre nuestros receptores. En el caso de la visión, por ejemplo, el estímulo próximo hace referencia a la imagen del objeto que se proyecta sobre la retina de los ojos.

En la percepción, las características más importantes que captamos de los objetos son sus características distantes. Lo que se nos impone en la percepción visual son características que pertenecen a los objetos, no a nuestras imágenes retinianas. ¿Cómo es posible llegar a captar esas características a partir del estímulo próximo? Esta pregunta, que es fundamental para la mayor parte de los teóricos de la percepción, encontró en la teoría clásica una respuesta basada en el aprendizaje. La percepción de las características distantes no son una respuesta sensorial directa, sino una percepción compleja aprendida. La percepción visual de los objetos se compone, por tanto, de sensaciones visuales no espaciales, tales como el matiz o el brillo, y de imágenes de sensaciones no visuales que han estado característicamente asociadas con esas sensaciones en la experiencia previa con esos objetos. En el Capítulo 4 de este libro tendremos ocasión de estudiar los resultados que esta forma de pensar ha proporcionado a la investigación de la percepción del espacio visual.


Un fenómeno de capital importancia en el estudio de la percepción es el de las constancias. Percibimos constante el color de un objeto a pesar de los cambios en las condiciones de iluminación, o el tamaño de ese mismo objeto a pesar de que se nos muestre a distancias diferentes. En casos como éstos los cambios en el estímulo próximo no determinan nuestra percepción. ¿cómo es posible la constancia de estas percepciones? Helmholtz lo explicó también en términos de aprendizaje y formuló una regla, que más tarde se conoció como el principio de verosimilitud, y que viene a decir lo siguiente: Percibimos aquellos objetos y acontecimientos que, bajo condiciones normales, serían los que produjeran el conjunto de estimulación sensorial efectiva que estamos recibiendo. Dicho con otras palabras, acabamos percibiendo aquellas características de los objetos que, sobre la base de la experiencia previa, son más probables.

2.3. La inferencia inconsciente

Helmholtz también proporcionó una teoría sobre la forma en que nuestro sistema perceptivo aplicaba la regla. Cuando, por ejemplo, percibimos un objeto del mismo tamaño a pesar de sus cambios en la distancia a que se encuentra de nosotros, es porque hemos aprendido a hacer algo que produce el mismo resultado que <<tomar en cuenta la distancia>>. De forma parecida, cuando un papel continúa viéndose blanco a pesar de que lo vemos bajo una luz tenue, es porque hemos aprendido a tomar en cuenta los cambios en iluminación. Pero Helmholtz no pensaba que este proceso de <<tomar en cuenta>> la distancia o la iluminación fuera un acto consciente de reflexión sobre la situación. Helmholtz pensó que se trataba de una inferencia inconsciente a partir de sensaciones que nos pasan desapercibidas.

La explicación de Helmholtz fue en su momento, y continuó siéndolo durante mucho tiempo, una fuente de controversia. Cuando se formuló, muchos pensaron que era un auténtico sinsentido. Hablar de sensaciones imperceptibles resultaba algo contradictorio en sí mismo para aquellos que creían que la sensación era el elemento constitutivo de la percepción. Otros consideraron que la explicación era excesivamente complicada y especulativa. Sin embargo, la explicación de Helmholtz ha tenido también defensores hasta nuestros días, aunque se ha reformulado de maneras diferentes. Helmholtz describió el proceso perceptivo utilizando los términos que le proporcionaba la psicología de su tiempo, y lo describió como si fuera un proceso de resolución de problemas, que es el resultado de la experiencia previa pero que se desencadena al margen de la voluntad consciente del observador. Todo el aparato conceptual que hoy tenemos cuando hablamos de aprendizaje implícito y de habilidades automáticas, habría sido de gran utilidad para Helmholtz a la hora de formular su intuición fundamental.

Vista desde nuestra perspectiva actual, la teoría de la percepción de Helmholtz es una teoría fuertemente cargada de elementos cognitivos. Para Helm-


holtz, la percepción no estaba determinada por los procesos sensoriales sino por toda la estructura mental que él resumió en el concepto de inferencia inconsciente. El estímulo próximo es pobre en cuanto a la información que proporciona y necesita ser completado por toda la constelación de conocimientos sobre el mundo que nuestra experiencia nos ha ido proporcionando. Esta forma de pensar, basada sobre la pobreza de la estimulación y la importancia del conocimiento para determinar lo que percibimos, es todavía hoy muy importante.

3. LA PRIMERA MITAD DEL SIGLO XX

La teoría clásica de la percepción no pasó sin críticas por el siglo XIX. Hemos visto, al hablar de la sensación, que las discusiones en torno a la mezcla de colores arrojaron serias dudas sobre la validez del concepto mismo de sensación elemental y sobre la forma de determinar la existencia de elementos. Una importante contrapropuesta a la teoría tricromática de Helmholtz, fue la teoría de los procesos oponentes formulada por Ewald Hering que estudiaremos en el Capítulo 2. Sin embargo, hubo que esperar al siglo XX para que se desarrollara una alternativa teórica que representara un reto global a las posturas defendidas por la teoría clásica. Esta alternativa estuvo representada por la teoría de la Gestalt.

En este apartado, vamos a centrarnos en la exposición de esta teoría y nos referiremos también a otro importante cambio que tuvo lugar en la psicología de este periodo, el producido por el conductismo y su repercusión sobre el estudio de la percepción. Finalmente, abordaremos la exposición de la teoría de la percepción directa, formulada por James. ]. Gibson, que se desarrolló durante el segundo tercio del siglo XX y que ha ejercido como principal oponente de la teoría clásica aún en nuestros días. No debe pensarse que en esta época toda la actividad investigadora estuvo limitada a estas teorías, pero sí fueron las más influyentes en el estudio de la percepción o en la psicología general.

3.1. La teoría de la Gestalt

Los postulados principales del racionalismo hicieron su aparición en el campo de la investigación científica de la percepción de la mano de la psicología de la Gestalt. Si Helmholtz había hablado ya de sensaciones imperceptibles, para la Gestalt las sensaciones, consideradas como elementos de la vida anímica, eran inexistentes. El término Gestalt proviene del alemán y significa configuración o forma total. El término designa de forma adecuada el interés de esta teoría por centrar la investigación perceptiva en el estudio de las relaciones que estructuran las distintas partes de una escena, más que en los elementos sensoriales que supuestamente la componen. Veamos los principales aspectos de esta teoría.


3 .1.1. Fenomenología

Para la teoría clásica, la introspección era el método específico de la psicología para la investigación de la percepción. Sin embargo, la introspección que propugnaban los primeros psicólogos estructuralistas era una introspección que requería un complicado y largo entrenamiento, durante el cual el observador aprendía a observar sus propios estados mentales. Desafortunadamente, este entrenamiento con frecuencia inducía en el observador una tendencia a percibir sus estados mentales de acuerdo con las inclinaciones teóricas del investigador, influyendo así en los resultados de una forma que no tenía que ver con la naturaleza del problema que se estaba investigando sino que dependía del tipo de entrenamiento recibido.

Para la teoría de la Gestalt, la experiencia consciente del observador también constituía la fuente principal de datos de la investigación psicológica. Sin embargo, la Gestalt estaba interesada en los datos de conciencia tal como aparecían de forma inmediata en la misma, sin contaminar con prejuicios teóricos inducidos por un entrenamiento particular. Más que de introspección, en el caso de la Gestalt debe hablarse de descripción fenomenológica para marcar la diferencia entre la introspección clásica y la actitud de auto-observación que buscaban los gestaltistas. Para ellos, no se trataba de forzar al observador a discriminar las sensaciones elementales que aparecían en su consciencia, sino de respetar los datos inmediatos de la misma e intentar describirlos de la forma más objetiva posible.

3.1.2. Configuración

Todos los principales líderes de la Gestalt, Max Wertheimer, Wolfgang Kohler (1929) y Kurt Kofka (1935), rechazaron los supuestos fundamentales de atomismo y empirismo de la teoría clásica. Pensar que la percepción es el resultado de la concatenación de sensaciones, como si éstas fueran los átomos de un compuesto, es para los gestaltistas el resultado de un artefacto introducido en la experimentación por la propia teoría clásica mediante el entrenamiento introspectivo. Lo importante en la percepción es la configuración del campo perceptivo, la forma en que se relacionan los componentes de la escena, la totalidad estructurada por esas relaciones. Para los gestaltistas, el todo es diferente de la suma de sus partes porque las relaciones entre los componentes provocan la aparición de propiedades emergentes, que son propiedades pertenecientes a un conjunto como tal pero que ninguno de los componentes del conjunto posee por sí mismo. Una melodía puede perfectamente ser traspuesta de una escala a otra porque lo importante en la melodía no son los elementos sino las relaciones entre las notas. De forma parecida, una persona puede percibir que la intensidad de un estímulo es mayor que, igual o menor que la intensidad de otro sin necesidad de conocer los valores absolutos de intensidad de ninguno de ellos.


Los gestaltistas también rechazaron la analogía química que había utilizado la teoría clásica al considerar la percepción como un compuesto formado por sensaciones elementales. Ellos preferían analogías tomadas de la física y hablaban del campo perceptivo como si fuera semejante a los campos magnéticos o eléctricos. Por ejemplo, la presencia de una partícula con carga eléctrica positiva, define un campo eléctrico a su alrededor. Si se añade una segunda partícula, la estructura del campo se modifica y lo hace de distinta forma dependiendo de que la carga de la segunda partícula sea igual o diferente de la de la primera. De forma parecida, en la Figura 1.1 A podemos ver un campo visual formado por un elemento que es la letra K. En B, la percepción predominante es la de un rombo flanqueado por dos líneas verticales. Sin embargo, el rombo surge por la adición de otra letra K rotada 180 grados y yuxtapuesta a la anterior. En B, la identidad de cada letra individual se pierde porque la relación espacial entre las dos letras da lugar a la percepción del rombo. Si, en vez de estar juntas, aumentáramos la distancia entre las letras, como en C, cada una recuperaría su identidad como una letra K.

A k FIGURA 1.1. El efecto de la totalidad en B modifica la percepción de los

elementos en A (letra K).

La teoría de la Gestalt hizo aportaciones muy importantes a la investigación de la percepción Sus principios de organización, a veces llamados leyes, constituyen aún hoy una importante materia de estudio y de investigación que nosotros veremos en detalle en el Capítulo 6.

3.1.3. Innatismo

Los teóricos de la Gestalt también rechazaron el empirismo característico de la teoría clásica. Para ellos, los principios organizadores de la percepción no tenían su origen en la experiencia del individuo, ni eran el resultado de un aprendizaje previo. Los principios de organización eran el resultado de la interacción de las estructuras cerebrales con el medio ambiente y esas estructuras eran innatas o, a lo sumo, resultado de la maduración. Los teóricos de la Gestalt, y en particular Kohler, recurrieron a la estructura de los mecanismos cerebrales a la hora de buscar explicación para los fenómenos perceptivos pero trataron también de introducir nuevas ideas en la neurofisiología de su


tiempo. Ellos consideraban que el cerebro era un ejemplo de Gestalt física, es decir un sistema físico que funcionaba como una totalidad dinámica que tendía hacia un estado de equilibrio de energía mínima. Además, pensaban que los mecanismos causales subyacentes a los procesos perceptivos eran campos electromagnéticos generados por la actividad de las neuronas. Esos campos también tenían las propiedades de una Gestalt física. La semejanza entre la dinámica de los campos electromagnéticos cerebrales y la de los campos perceptivos, les llevó a formular su doctrina del isomorfismo psicofísico. Esta doctrina venía a afirmar que tanto en el caso de la percepción del espacio como en la del tiempo o en la de la forma, la organización del campo perceptivo era una verdadera representación de la organización dinámica de los procesos fisiológicos subyacentes. Se da por tanto una igualdad de forma o isomorfismo2 entre el funcionamiento del psiquismo y el funcionamiento del cerebro, lo que permite inferir la naturaleza de los procesos cerebrales a partir del análisis de las leyes que configuran el campo perceptivo.

Los gestaltistas eran perfectamente conscientes de que en la percepción se producían fenómenos como las constancias o las ilusiones. La explicación que ellos propugnaron, sin embargo, no se basaba en la experiencia, como habían hecho Helmholtz y los empiristas, sino en las propiedades dinámicas del cerebro como una Gestalt física. En oposición al principio de verosimilitud, ellos formularon el principio de Pragnanz, que también se suele denominar el principio mínimo. Este principio establece que, en situaciones en las que son posibles más de una interpretación de la escena visual, el sistema perceptivo impondrá la interpretación más simple. Como tendremos ocasión de ver, el significado preciso de este principio y su aplicación a situaciones concretas ha dado origen a mucha controversia. Ahora es suficiente caer en la cuenta de que el principio mínimo es un principio coherente con una forma de pensar que considera el funcionamiento de la mente isomórfico con el funcionamiento del cerebro y a éste como un sistema dinámico que tiende a un estado de energía mínima.

3.2. El conductismo

En la historia de la psicología experimental, cada una de las primeras escuelas de pensamiento introdujo, junto a una concepción de lo que debía de ser la psicología, un método para llevar a cabo su programa de investigación. Como resultado de ambos, teoría y método, cada escuela fue capaz de hacer aporta-

2. Se dice que un sistema es isomórfico con otro respecto de sus relaciones espaciales si cada punto en uno de ellos corresponde a un punto en el otro y las relaciones topológicas de orden espacial de los puntos es la misma en los dos sistemas. Este concepto topológico se puede extender al tiempo, a la cualidad y a la intensidad como hicieron los gestaltistas. En pocas palabras, para los teóricos de la Gestalt existía una perfecta correspondencia entre los acontecimientos físicos del funcionamiento cerebral y los acontecimientos mentales. El isomorfismo es, por tanto, una forma especial de paralelismo psicofísico.


ciones significativas al estudio de aquellos procesos psicológicos que mejor se adaptaban a la utilización de sus métodos. Para la teoría clásica de la percepción, al igual que para la Gestalt, los datos fundamentales de la investigación psicológica eran los datos de consciencia, por eso sus principales aportaciones se encuentran hoy en el campo de la percepción. Para el conductismo los datos fundamentales se encontraban en el comportamiento y se centró en el estudio de los factores que modifican la conducta de los organismos. Por eso, cuando los conductistas se interesaron por los procesos que determinan esa modificación, realizaron sus principales aportaciones en el campo del aprendizaje y de la motivación.

Las aportaciones del conductismo al estudio de la percepción fueron escasas y en ningún caso comparables a la aportación de las teorías que hemos estudiado. No se puede hablar de una teoría conductista de la percepción porque los principales teóricos del conductismo nunca llegaron a formular una. Es curioso que una psicología como la conductista, que anclaba la objetividad del estudio científico del comportamiento en las relaciones entre estímulos y respuestas, aportara tan poco al estudio de la estimulación y al estudio de los procesos motores. Su interés se focalizó casi exclusivamente en la relación entre estímulos y respuestas pero en la práctica investigadora siempre utilizó estímulos muy simples3, en los que se manipulaba una única dimensión, y respuestas cuyo aspecto más interesante era el carácter mensurable de su resultado y la forma en que podía ser moldeada para lograr ese resultado.

A pesar de su escasa aportación a la teoría de la percepción, no debe pasarse por alto su aportación metodológica. Con el estudio del comportamiento, el conductismo abrió a la psicología de su tiempo todo un campo de investigación que estaba sin explorar, introdujo rigor en la experimentación y precisión en las medidas y en el lenguaje. No cabe duda de que exageró al exigir que la psicología se limitara al estudio de la conducta, pero el estudio de la conducta ha sido desde entonces crucial para el desarrollo de la psicología.

En el caso de la investigación en percepción, el conductismo la redujo al estudio de la conducta discriminativa y de esta conducta lo que más le interesó fue su adquisición y el análisis de las variables que determinaban el control de la conducta por parte de los estímulos. Sin embargo, cometieron el error de pensar que los estímulos manipulados por el investigador, que podemos llamar estímulos nominales, eran lo mismo que los estímulos funcionales, que son los que realmente influyen en el organismo, con lo cual pasaron por alto el problema central que se plantea el estudio de la percepción, que es la relación entre ambos tipos de estímulos.

3 . Cuando el neoconductismo comenzó a investigar estímulos compuestos, a finales de los sesenta en el siglo pasado, los cambios que tuvo que introducir en la teoría asociacionista reintroduciendo conceptos que anteriormente habían sido rechazados por mentalistas, condujeron a la teoría del aprendizaje hacia posiciones cognitivas.


Desde el punto de vista metodológico, el conductismo ayudó a valorar la importancia de las tareas experimentales y el análisis de las variables que las afectan. Pero lo importante de las tareas es su capacidad para informar de los procesos que intervienen en ellas y la explotación de esa capacidad no la pudo llevar a cabo el conductismo.

3.3. Teoría de la percepción directa

Esta teoría es también conocida como teoría ecológica de la percepción y fue desarrollada a lo largo de muchos años por James J. Gibson (1950, 1966, 1979). Este investigador estuvo muy influenciado por la teoría de la Gestalt, pero también comparte posiciones propias del conductismo. De la teoría de la Gestalt, Gibson adoptó su oposición a toda postura atomista que, como hiciera la teoría clásica, tratase de buscar elementos simples en la percepción. Sin embargo, al contrario que los gestaltistas, Gibson no creía que el fundamento de la teoría perceptiva estuviera en la estructura del organismo, sino en el estudio del medio ambiente en el que el organismo está inmerso. Se trata, por tanto, de analizar a fondo la estimulación para localizar la información relevante en cada situación. Veamos ahora con más detalle los puntos fundamentales de la postura de Gibson.

3 .3 .1. Percepción ecológica

En el espíritu de la Gestalt, Gibson piensa que el análisis perceptivo debe centrarse en la conformación óptica ambiental. Con este término quiere indicar el patrón global de la estimulación, por oposición a aspectos parciales de la misma, como son las sensaciones. Éstas se definen en términos de luminancia, mientras que la conformación óptica se mide en términos de los márgenes existentes entre áreas de diferente luminancia. Las luminancias cambian con cambios en la iluminación, mientras que la conformación óptica permanece invariante ante esos cambios. La conformación óptica es un concepto relacional, mientras que las luminancias son las cantidades de luz medidas por un fotómetro.

Gibson estaba convencido de que el patrón de estimulación que llega a los sentidos, lejos de ser pobre en información, como pensaba Helmholtz y los clásicos, contiene toda la información necesaria para determinar de forma inequívoca qué ha de percibirse en una situación determinada. La supuesta pobreza del estímulo es, según Gibson, el resultado de estudiar la percepción en condiciones restrictivas en las que se priva al organismo de información que está disponible en condiciones normales y habituales de la vida cotidiana. La teoría clásica ha fomentado investigaciones en las que un observador estático, mirando por un orificio, tiene acceso a una información que es exclusiva y peculiar de un punto de vista determinado. La percepción cotidiana, sin embargo, es una percepción dinámica que cambia a medida que el observador

INTRODUCCIÓN : HISTORIA Y ENFOQUE GENERAL 33

se mueve con respecto a la escena total, y ese tipo de percepción es el que, según Gibson, debemos estudiar. Como veremos en el Capítulo 4, Gibson hizo aportaciones muy interesantes al estudio de la percepción del espacio visual al poner el énfasis en la investigación del sentido de los cambios en los gradientes y de la información inducida por el movimiento en el flujo óptico. Igualmente serán interesantes sus análisis de los aspectos invariantes de la estimulación que él relaciona con las constancias perceptivas.

Gibson (1966, 1979) trató de ofrecer una óptica ecológica como alternativa a la óptica geométrica utilizada por la teoría clásica. La óptica geométrica, en lugar de tratar la luz en términos de onda o de corpúsculo, construye sus representaciones sobre el concepto de rayo de luz. Dado que la trayectoria de un rayo corresponde aproximadamente a la de un fotón, la óptica geométrica puede utilizar líneas rectas para representar esas trayectorias y emplear técnicas geométricas para poder predecir con aceptable aproximación la posición de las imágenes formadas por los sistemas ópticos. La óptica geométrica trata el ojo humano como un caso particular de cámara oscura y ha contribuido a popularizar la semejanza entre el ojo y la cámara fotográfica y entre la imagen retiniana y la imagen impresa en una fotografía. Para Gibson, la utilización de la óptica geométrica como base para la descripción de los estímulos es un error porque está fundamentada en abstracciones que no pueden captar la riqueza de la conformación óptica ambiental. La óptica geométrica es una ciencia de la luz, no una ciencia de la visión. La ciencia de la visión necesita hacer referencia al organismo y a la relación del organismo con el medio. Una óptica adecuada a una teoría de la percepción visual necesita hacer referencia a la forma particular en que se configura para el organismo el ambiente con el que interactúa. Para ello se necesita una óptica ecológica.

La óptica ecológica propuesta por Gibson está organizada en torno a dos conceptos fundamentales: información y propiedad funcional4

•

En su libro Los sentidos considerados como sistemas perceptivos Gibson (1966) introdujo el concepto de información en contraposición al concepto de energía. La energía es la estimulación apropiada para las células receptoras; los receptores responden a una energía particular. Sin embargo los órganos sensoriales son sistemas perceptivos que responden a estímulos de un orden superior al de los estímulos de los receptores. Los sistemas perceptivos responden a la información que hace referencia a los objetos mismos. El concepto de información en Gibson no es el concepto formal introducido por la teoría matemática de la información. Gibson no formalizó el término sino

4. Siguiendo a García Albea (1986) utilizamos el término propiedad funcional para traducir el término inglés affordance acuñado por Gibson. Gibson introdujo el neologismo affordance, derivado del verbo to afford que significa ofrecer o proporcionar, para referirse a aquellos aspectos de los objetos que hacen referencia a un posible uso de los mismos por parte de un observador o a una re lación determinada entre objeto y observador. Ver texto.


que lo utilizó para acentuar el carácter objetivo de la percepción en cuanto que ésta nos informa acerca de los objetos. La información en Gibson es <<información sobre algo» y únicamente significa <<especificidad respecto de algo>>. Al afirmar que los sentidos perciben información sobre los objetos, Gibson quiere poner de manifiesto que, por ser sistemas perceptivos y no simplemente órganos receptores, los sentidos son capaces de captar características reales de los objetos que no nos son dadas propiamente en la energía que llega a nuestros receptores sino en las relaciones que determinan la estructura de la conformación óptica. Cómo es posible que los sentidos lleguen a captar esta información es un problema que veremos más adelante.

En su último libro La aproximación ecológica a la percepción visual, Gibson (1979) introdujo el concepto de affordance como una extensión del concepto de información. Al igual que la información, las propiedades funcionales que constituyen una affordance están especificadas en la estructura de la conformación óptica, pero añaden un aspecto que las cualifica: son invariantes que están en consonancia con el cuerpo del observador mismo. Gibson da ejemplos de varias propiedades funcionales de superficies, tales como <<sentarse sobre ella>> en el caso de una silla, <<subir por ella>> en el caso de una escalera de mano o incluso «introducir en su interior>> en el caso de un buzón de correos. Gibson mantiene que nuestro sistema perceptivo es capaz de captar estas propiedades directamente. Vemos, por tanto, que la idea central de Gibson consiste en remachar que la investigación de la percepción debe centrarse en estudiar las propiedades de nuestros sentidos considerados como sistemas perceptivos, es decir como totalidades dinámicas estructuradas cuya capacidad de captar información y propiedades funcionales sobrepasa con mucho la de sus componentes. Pero considera que este objetivo investigador no se logrará a base de descomponer el sistema y ver lo que tenemos <<dentro de la cabeza>> sino estudiando el medio ambiente, dentro del cual se encuentran inmersos nuestros sistemas perceptivos.

3.3.2. Percepción directa

El segundo punto fundamental en la teoría de Gibson es el carácter directo que atribuye a la percepción. Hemos visto que para la teoría clásica la estimulación es pobre a la hora de informarnos sobre el medio ambiente y que necesita suplir esta deficiencia informativa con información proveniente de nuestros recuerdos y, en general, con la experiencia acumulada por el observador a lo largo de su vida. Nada de esto es necesario para Gibson. Lo que percibimos está perfectamente determinado por la particular conformación estimular que en un momento determinado nuestros sistemas perceptivos captan. No necesitamos recurrir a recuerdos, a pensamientos o a inferencias para explicar la percepción.

Al decir que la percepción es directa, Gibson quiere decir que toda la información necesaria para determinar la percepción se encuentra en el medio


ambiente y que no necesitamos recurrir a procesos del orgamsmo para su explicación:

Cuando afirmo que la percepción del medio ambiente es directa, quiero decir que no está mediada por imágenes retinianas, imágenes neuronales o imágenes mentales. Percepción directa es la actividad de obtener la información de la conformación óptica de la luz. Llamo a esto un proceso de captación de información que implica la actividad exploratoria de buscar, explorar y mirar a las cosas (1979, p. 147).

Dos aspectos merecen ser resaltados en las palabras de Gibson que acabamos de transcribir. Por un lado, su oposición a cualquier tipo de mediación basada sobre representaciones; por otro, su concepción de la percepción como un proceso activo. Su oposición a cualquier tipo de representación le ha enfrentado a las teorías del procesamiento de la información que, como vamos a ver, han predominado desde mediados del siglo XX. También le ha enfrentado a la investigación neurofisiológica que, con una mentalidad analítica, trata de estudiar los componentes de los sistemas perceptivos y la función que esos componentes tienen en la percepción. En su afán por evitar toda referencia a procesos intermedios entre la estimulación y la experiencia perceptiva, Gibson prácticamente ignoró, como carente de valor para la teoría de la percepción, todo un conjunto de datos fisiológicos que, en nuestra opinión, no se pueden ignorar. Con respecto a las investigaciones neurofisiológicas Gibson mantuvo en percepción una postura similar a la mantenida por los primeros conductistas respecto al aprendizaje: no proporcionan datos relevantes para una teoría de la percepción.

En cuanto a la concepción de la percepción como un proceso activo, hay que caer en la cuenta de la significación que el término activo tiene en Gibson. Lo utiliza para poner de manifiesto la importancia que la locomoción del observador tiene para cambiar el patrón estimular y para especificar la información presente, por ejemplo, en el flujo óptico. También lo utiliza para reconocer la importancia que la motivación puede tener para captar una determinada propiedad funcional en el estímulo. Pero en sí mismo el acto de percibir no es activo en el sentido constructivista que dio a este término la teoría clásica. Para ésta, la percepción es activa en cuanto que es una síntesis de la información proporcionada por los sentidos y la proporcionada por la experiencia previa del observador. Para Gibson toda la información está en la estimulación, el observador no aporta información alguna sino que se limita a captar aquella información con la que se encuentra en sintonía. Desde el punto de vista de una teoría del conocimiento, Gibson, al igual que Thomas Reid, es un realista.

La teoría de Gibson es más fuerte en lo referente a su posición ecológica que en su defensa de la percepción directa. Su influencia ha sido importante y amplia en el estudio de la percepción aunque sus posturas extremas respecto al papel de las representaciones no son en absoluto mayoritarias. Su


despreocupación por incorporar los datos de la fisiología en la teoría de la percepción, además de privarle del respeto de los fisiólogos, es compartida por muy pocos psicólogos. En el Capítulo 4 tendremos ocasión de ver que, precisamente gracias a los avances de la neurociencia, puede ser posible armonizar las posturas constructivistas de la teoría clásica y las de Gibson.

3.4. Otras influencias

Aunque en nuestra exposición nos hemos centrado en las aportaciones nuevas, que hicieron su aparición en la primera mitad del siglo XX, no debe pensarse que estas nuevas tendencias sustituyeron a la teoría clásica. Muchos psicólogos continuaron trabajando dentro del programa de investigación planteado por la teoría clásica e hicieron aportaciones interesantes. Merece la pena mencionar en este contexto distintas formas de funcionalismo que concebían el proceso perceptivo como una transacción en la que los estímulos y el observador se implican mutuamente de forma que para definir el estímulo funcional o efectivo para un determinado observador es necesario conocer su conducta previa. De esta forma, estímulo y conducta se encuentran inmersos en un círculo de interacción que determina su definición mutua. Este transaccionalismo, como se llamó entonces, tuvo su origen en los escritos del filósofo John Dewey y dio origen a interesantes trabajos de investigación entre los que destacan las influyentes demostraciones del investigador Adelbert Ames.

También muy influyente fue el funcionalismo probabilista formulado por Egon Brunswick quien, al igual que Gibson, acentuó la importancia de estudiar situaciones ecológicamente válidas, en las que la estimulación no estuviera empobrecida sino que fuera representativa tanto de las situaciones en las que el organismo vive, como de las situaciones a las que el investigador quiere generalizar sus conclusiones. Brunswick también estuvo muy interesado en reformular la teoría perceptiva de Helmholtz dejando de lado sus sensaciones elementales y sus mecanismos sensoriales. Pensaba que el aprendizaje perceptivo es el proceso que lleva al organismo a confiar en aquellos indicios o claves estimulares que están altamente correlacionadas con alguna propiedad física de los objetos o de los acontecimientos.

A pesar de que el concepto de sensación, entendido como elemento componente de la percepción, fue progresivamente abandonado, el estudio, dentro de cada modalidad sensorial, de las respuestas a cambios en aspectos simples de la estimulación, continuó siendo tarea de la psicofísica. Una aportación importante a su desarrollo, que estudiaremos en la sección de métodos en este libro, fue la aparición de los métodos directos ideados por S.S. Stevens con el fin de conseguir escalas de razón en la medición de esas respuestas sensoriales. Sobre la base de estos métodos, Stevens formuló su ley potencial psicofísica y dio origen a lo que hoy se conoce como nueva psicofísica para distinguirla de la psicofísica clásica fechneriana.


4. LA SEGUNDA MITAD DEL SIGLO XX

A mediados del siglo xx se produjo un cambio en la orientación predominante en la investigación psicológica que afectó a todas sus áreas de especialización. Las actitudes conductistas, que habían predominado en la época anterior, cedieron rápidamente el paso al interés por los procesos subyacentes a la conducta de los organismos. Pronto se cayó en la cuenta del carácter cognoscitivo de esos procesos, sobre todo en el caso de la conducta humana, y surgió la moderna psicología cognitiva. La psicología cognitiva proporcionó al estudio de la percepción un marco de referencia en el que muchas de las ideas de la teoría clásica pudieron ser reformuladas. Este marco de referencia también ayudó a integrar otras dos corrientes de investigación científica cruciales para el desarrollo de la investigación en percepción: los avances de la investigación fisiológica y el computacionalismo. Veremos ahora cada una de estas aportaciones.

4.1. La psicología cognitiva

La psicología cognitiva, en el sentido de una psicología interesada por el estudio de los procesos mentales, ha sido el tipo de psicología más frecuente en la corta historia de la psicología experimental. La teoría clásica, el estructuralismo e incluso la Gestalt pueden ser consideradas versiones distintas de una psicología cognitiva. Sin embargo, el término psicología cognitiva se utiliza hoy para designar una versión particular que surgió a mediados del siglo xx, que suele también conocerse como procesamiento de información. Esta versión ofreció una aproximación al estudio de los procesos cognitivos considerando la mente humana como un sistema capaz de manejar símbolos de una forma semejante a un ordenador electrónico. La metáfora del ordenador constituye la analogía que va a servir de guía para estudiar los procesos mentales.

Al igual que un programa de un ordenador, los procesos mentales pueden ser analizados como una serie de fases o estadios. Cada estadio recibe una información de entrada, opera sobre esa información transformándola de alguna forma y produce una información de salida. El funcionamiento final del sistema es el resultado del conjunto de operaciones que, a través de las distintas fases, transforman la información inicialmente recibida. Para el procesamiento de información, al igual que para el estructuralismo y la Gestalt, y en oposición a Gibson y los conductistas, el estudio de los procesos que transforman la información de entrada (input) y producen una determinada salida (output) constituye el objeto de estudio de la psicología. En este contexto, la percepción es una fase del procesamiento de la información mediante la cual el organismo construye una representación del medio ambiente que pueda guiar su actividad. Esta representación se consigue sobre la base de la información proporcionada por la estimulación y mediante las operaciones que


el sistema aplica a su transformación. Veamos con más detalle las principales características del procesamiento de información.

4.1.1. Sistemas

El procesamiento de información considera la cognición como una actividad resultante de la interacción de los componentes de un sistema. No niega la importancia de analizar los componentes del sistema pero concede mayor importancia a la estructura y a la organización funcional resultante de la interacción de sus componentes. El procesamiento de información se sitúa en una posición intermedia entre el estructuralismo y la Gestalt.

Una forma de representar el funcionamiento de un sistema y sus componentes principales ha consistido en utilizar diagramas de flujo. La Figura 1.2 presenta un diagrama de flujo en el que un sistema A recibe dos tipos de input, (a) y (b). Cada rectángulo en el diagrama representa un conjunto de operaciones que acaban produciendo un output; a su vez, estos outputs forman el input de la fase siguiente (e) que acaba produciendo una salida final (O) para el sistema A.

A

-----1•~ a

e • o

___ _____,..... b

FIGURA 1.2. Ilustración de un diagrama de flujo.

Como podemos comprobar, un diagrama de flujo es una forma abstracta de representar la organización de los componentes de un sistema y su funcio-


namiento. Una posible interpretación del diagrama en la Figura 1.2 podría ser un sistema de integración de información procedente de distintas modalidades sensoriales que recibe información visual (a) y táctil (b) y produce, mediante una operación sobre los dos tipos de información (e), una representación integrada de ambas (0). Lo que ahora nos interesa recalcar es que un diagrama de flujo permite representar los sistemas perceptivos como conjuntos de subsistemas que están compuestos de una información de entrada (input), un conjunto de operaciones representadas por los rectángulos, y una información de salida (output).

Una propiedad importante de los sistemas de procesamiento de información es la que Palmer y Kimchi (1986) han llamado su descomposición recursiva. Es decir, la posibilidad de subdividir un sistema en otros subsistemas componentes, cada uno de ellos dotado de un input, de una función y de un output. En la Figura 1.2 vemos que el sistema total A está compuesto por tres subsistemas, uno especializado en procesar la información visual, otro en procesar la información táctil, y un tercero que integra ambas informaciones. A medida que avanza la investigación de cada uno de esos componentes, es posible proceder a un análisis más detallado del funcionamiento de cada subsistema mediante la especificación de sistemas menores que componen los subsistemas. Este esquema de análisis es recursivo porque se puede aplicar una y otra vez siempre que lo requiera el análisis del sistema que se está estudiando hasta que se llega a un último nivel que no se puede descomponer más. A los componentes de este último nivel se les suele denominar características primitivas, cuando se trata de componentes de una representación, o, si de trata de procesos, son llamados operaciones elementales.

4.1.2. Información, codificación y representación

Durante las primeras fases del desarrollo del procesamiento de información, se trató de utilizar el concepto de información en el sentido técnico propuesto por la teoría de la información de Shannon, que trataba de medirla en términos de la probabilidad de emisión de un mensaje5, pero los resultados no fueron alentadores. Paulatinamente los intentos de formalizar el concepto se abandonaron y el concepto de información pasó a ser utilizado como sinónimo de conocimiento6 • Información es la cantidad de conocimiento que

5. En la teoría matemática de la información, el concepto de información es un estadístico que, al igual que cualquier otro estadístico, como puede ser el concepto de varianza, deriva su significado preciso de una fórmula determinada. En este contexto, la información es una función monótona inversa de la probabilidad de que un mensaje sea emitido, de forma que cuanto menor es la probabilidad de emisión de un mensaje mayor es su valor de información .

6. George Miller (1956) propuso el concepto de chunk como unidad de información capaz de proporcionar una medida de la capacidad de procesamiento. El número de chunks, por ejemplo, que puede mantener la memoria inmediata se identifica con el número de ítems que una persona puede recordar. Pero el mismo Miller resaltó que, tan pronto como una persona


una persona adquiere o posee sobre el medio ambiente que le rodea. En el caso de la percepción, no se trata tanto de la cantidad de información que hay en la estimulación, como era el caso de Gibson, cuanto de la cantidad de conocimiento que el observador puede llegar a adquirir sobre la base de esa estimulación.

Íntimamente relacionados con esta forma de concebir la información están los conceptos de codificación y de representación. Para el procesamiento de información el conocimiento está organizado en la mente humana en forma de imágenes o en otros posibles formatos7 de representación. La información del medio ambiente que nos llega a través de los sentidos necesita ser trasladada a esas formas o códigos de representación por medio de un conjunto de procesos a los que se les da el nombre de procesos de codificación. La percepción es fundamentalmente un conjunto de procesos de codificación mediante los cuales se genera en el observador una representación mental del medio ambiente.

4.1.3. Características de los procesos

Los procesos propios de un sistema cognitivo, como el sistema perceptivo, pueden estar organizados de forma serial o en paralelo. La organización es serial cuando los procesos se llevan a cabo en secuencia, uno después de otro, y cada uno de ellos recibe como input el output final del proceso que le precede, por lo que no empieza a funcionar hasta que el proceso anterior ha finalizado . Cuando los procesos se organizan en paralelo, actúan simultáneamente y su input es independiente del output de otros procesos.

Los primeros modelos que el procesamiento de información utilizó para representar procesos mentales, mostraban una organización serial. Posteriormente, sobre todo a medida que se fue cayendo en la cuenta de la complejidad de los procesos perceptivos, los modelos de organización en mayor o menor grado en paralelo fueron ganando terreno. La rapidez con que tienen lugar los procesos perceptivos visuales parecía requerir una estructura del sistema visual en la que numerosas operaciones pudieran realizarse simultáneamente. Esta estructura, a su vez, exigía una división del trabajo de forma que distintos componentes del sistema perceptivo se especializaran en llevar

observa relaciones entre los ítems, puede reagrupar los ítems originales en unidades (chunks) más generales. Así, aunque el número de chunks que se pueden recordar permanezca constante -él pensaba que era de siete ítems con una variabilidad de más o menos dos- la cantidad de información que una persona puede memorizar varía en función del nivel de generalidad de las unidades de agrupamiento. Obsérvese que en la definición de información de Miller se produce el paso de una definición en términos de la probabilidad de un mensaje, a una definición en términos del conocimiento que posee una persona.

7 . Las discusiones sobre los diferentes formatos de representación han sido, y continúan siendo, agitadas pero no es este el momento de entrar en esas discusiones (véase Rumelhart y Norman, 1988).


a cabo un determinado conjunto de funciones. Por ejemplo, un componente del sistema podía especializarse en procesar el color de una escena, mientras otro componente procesaba la forma y un tercero el movimiento. Cuando un sistema presenta una organización especializada de este tipo se dice que tiene una estructura o arquitectura modular, y a los componentes del sistema se les llama módulos.

Otra dimensión que el procesamiento de información ha utilizado para caracterizar a los procesos está relacionada con la dirección que sigue el flujo de procesamiento. Cuando el procesamiento está constituido por un conjunto de operaciones que operan sobre los datos que proporciona el input para construir representaciones progresivamente más complejas, se dice que el procesamiento tiene lugar de abajo a arriba. Cuando el procesamiento tiene lugar en la dirección opuesta, de forma que las representaciones más complejas, tales como objetivos o creencias, actúan mediante feedback sobre las operaciones más simples, se dice que el procesamiento tiene lugar de arriba a abajo. Una caracterización afín a ésta, pero que pone el acento en el papel que juegan las influencias complejas de feedback, es la que distingue entre procesos dirigidos por los datos, cuando operan con independencia de esas influencias, y procesos dirigidos conceptualmente, cuando operan bajo su influencia.

Las distintas teorías que han surgido dentro del procesamiento de información varían unas de otras en la importancia que conceden a cada uno de estos tipos de procesamiento. La teoría de la visión de David Marr, que estudiaremos más adelante, es una teoría concebida en su totalidad de abajo a arriba y fundamentalmente dirigida por los datos. Por el contrario, otras teorías han acentuado el papel que el conocimiento previo, las intenciones y las creencias ejercen sobre lo percibido; son teorías preferentemente de arriba a abajo. Sin embargo, la mayor parte de las teorías defienden la coexistencia de los dos tipos de procesamiento; estas teorías suelen ser llamadas interactivas.

Una última caracterización de los procesos que se ha utilizado frecuentemente en la psicología cognitiva, es la que distingue entre procesos automáticos y procesos bajo control atencional, frecuentemente llamados simplemente procesos controlados. Esta clasificación está relacionada con el grado de dependencia de la atención que un proceso tiene para poder llevar a cabo su función. En general se llama automático a un conjunto o a una secuencia de operaciones que se pone en funcionamiento ante la sola presencia de un estímulo. La secuencia puede incluir tanto procesamiento de abajo a arriba como de arriba a abajo. Un proceso automático puede formar parte de un sistema perceptivo de forma innata o como resultado de la práctica. En la medida en que un proceso automático depende de la práctica, su automaticidad debe entenderse como una cuestión de grado, no como una propiedad del tipo todo o nada. Por otro lado, hay circunstancias en las que se requiere la influencia de la atención para ensamblar un conjunto o una secuencia de operaciones; en este caso se trata de un procesamiento controlado. Las circuns-


tancias pueden ser varias, por ejemplo que se trate de una secuencia nueva, o que la situación en la que se van a llevar a cabo las operaciones sea delicada o peligrosa para el organismo. La automaticidad y la dependencia del control atencional son características complementarias de los procesos perceptivos. Cuanto más automático es un proceso, menor implicación atencional requiere y cuanto menor grado de automatismo posee más necesaria es la implicación de la atención para poder operar. En la investigación de los procesos de percepción la distinción entre procesos automáticos y controlados tiene una amplia aplicación. Existen procesos, como, por ejemplo, los implicados en la percepción visual del movimiento, que se ponen en funcionamiento ante la sola presencia de un estímulo adecuado. Sin embargo otros, como es el caso de la lectura, requieren gran concentración atencional al principio pero, a medida que la práctica mejora su aprendizaje, la implicación de la atención es cada vez menor.

4.1.4. Métodos

El procesamiento de información reintrodujo el estudio del tiempo de reacción como una de las principales variable dependientes para hacer inferencias acerca de los procesos perceptivos y de los procesos mentales en general. El método sustractivo introducido por el psicólogo holandés F. C. Donders en 1868 fue ampliamente utilizado. De acuerdo con este método, el tiempo empleado por una persona en la realización de una tarea podía dividirse en una serie de fases o estadios cada uno de los cuales correspondía a una operación elemental componente de la tarea. Donders utilizó tareas muy simples que denominó con las letras A, By C. La tarea A, que se ha llamado también tarea de tiempo de reacción simple o tarea de detección, consiste en la presentación de un único estímulo al que el observador debe responder lo antes que pueda con una única respuesta. La tarea A consiste, por tanto, en la presentación de un estímulo por parte del experimentador y la realización de una respuesta8 por parte del observador. La tarea B de Donders, llamada también tarea de tiempo de reacción de elección o tarea de discriminación, consiste en la presentación de dos o más estímulos y un número equivalente de respuestas, cada una de ellas asociada a un estímulo determinado. Ante la presentación de un estímulo por parte del experimentador, el observador debe contestar con la respuesta asociada a ese estímulo. En la tarea C de Donders, también llamada de tiempo de reacción selectivo o tarea responde/no respondas se presentan dos o más estímulos pero el observador sólo debe responder a uno de ellos y no responder al resto.

8. En las tareas de detección no se presenta el estímulo en todos los ensayos para evitar errores de anticipación. En un porcentaje determinado de ensayos no se presenta el estímul o con el fin de que, a lo largo de la tarea, el observador responda a la presencia real del estímulo. A estos ensayos sin estímulo se les llama ensayos trampa (catch trials) .


Donders supuso que cada una de estas tareas estaba compuesta de un número determinado de procesos elementales9 y que restando al tiempo de reacción empleado en responder en una de ellas, el tiempo empleado en responder a la inmediatamente más simple, podía aislar el tiempo empleado en cada proceso elementaP0

• La lógica utilizada por Donders para hacer inferencias acerca de los procesos mentales es tributaria de supuestos que acabaron por resultar excesivamente restrictivos, aún así la aplicación de su lógica ha producido resultados interesantes cuando se ha aplicado a situaciones que cumplían los supuestos. Sus tareas, sin embargo, han quedado como tareas fundamentales en la investigación de la percepción. Los intentos de superar las limitaciones del método sustractivo llevaron a la formulación de nuevos métodos, como el método de los factores aditivos de Sternberg, que contribuyeron a profundizar en la investigación cognitiva 11 •

Muy próxima al procesamiento de información puede considerarse la Teoría de Detección de Señales (TDS), que surgió en la investigación psicológica cuando la psicofísica comenzó a prestar atención a los procesos implicados en la respuesta a estímulos simples. Esta teoría puso de manifiesto que una respuesta tan simple como la que un observador puede emitir en una tarea de detección encaminada a determinar un umbral absoluto, no refleja de forma incontaminada el funcionamiento de un sistema sensorial, sino que hay que tomar en consideración a los procesos de decisión implicados en la emisión de la respuesta. Desde que fue formulada, la TDS ha sido utilizada dentro del procesamiento de información como un procedimiento para mejorar las inferencias basadas sobre medidas de precisión. La importancia de esta teoría tendremos ocasión de valorarla con mayor conocimiento cuando la estudiemos en la sección de métodos.

Finalmente hay que destacar la importancia que dentro del procesamiento de información alcanzaron los procedimientos de formalización de las teorías y de los modelos. El desarrollo de los modelos matemáticos fue extraordinario pero sobre todo hizo su aparición, como método específicamente ligado a esta aproximación psicológica, la implementación de las teorías mediante simulación en ordenador. Una simulación es un programa que al incorporar en su funcionamiento una teoría, permite contrastar sus predicciones y explorar sus consecuencias con una precisión difícil de alcanzar por otros procedimientos.

9. Donders pensó que la tarea A solamente implicaba un proceso elemental de detección. La B implicaba tres procesos: detección, discriminación y selección de la respuesta. La e dos: detección y discriminación.

10. Restando, por ejemplo, al tiempo empleado en B el tiempo de e se obtendría el tiempo correspondiente a la selección de respuesta. Restando al tiempo de e el de A se obtendría el tiempo correspondiente a la discriminación.

11. Una exposición más detallada de estos métodos puede encontrarse en Tudela (1981).


4.2. El computacionalismo

El computacionalismo representa, a la vez, la madurez teórica del procesamiento de información y la apertura de la psicología cognitiva a la interacción con otras disciplinas interesadas en la investigación de los procesos cognoscitivos. El ordenador, en cuanto realización física de un sistema complejo de procesamiento de información, había sido una fuente de inspiración para la psicología cognitiva desde sus comienzos. Sin embargo, la referencia al ordenador no tenía las mismas connotaciones para todos los investigadores. Para unos, el ordenador era preferentemente una metáfora, una analogía que nos permitía pensar acerca de los procesos cognitivos. Para otros, sin embargo, el ordenador era mucho más que una simple metáfora; el ordenador y la mente humana eran casos particulares de una clase de sistemas de procesamiento de información que Newell y Simon llamaron sistemas de símbolos físicos (Newell, 1980). El estudio de estos sistemas y la búsqueda de una teoría general de los mismos constituyeron los objetivos de una nueva empresa científica a la que se denominó ciencia cognitiva. La ciencia cognitiva12 surgió como una empresa multidisplinar en la que convergió el interés por investigar los procesos cognitivos de disciplinas aparentemente tan dispares como la psicología cognitiva, la neurociencia, la inteligencia artificial, la lingüística, la filosofía de la mente y la antropología.

En la investigación de los procesos perceptivos, destacaremos dos aportaciones de la ciencia cognitiva que merecen mayor detenimiento. Primero veremos las características generales de la teoría de David Marr, que en otros capítulos de este libro volverá a recibir un tratamiento más detallado. En segundo lugar estudiaremos los conceptos fundamentales de una alternativa que, dentro de la ciencia cognitiva, apareció en oposición a la consideración de la mente como un sistema de símbolos físicos, conocida como conexionismo.

4.2.1. La teoría de David Marr

David Marr procedía del campo de la neurociencia teórica y durante los primeros años de su carrera como investigador estuvo interesado en la teoría abstracta del cerebro. Posteriormente se centró en la investigación de la visión y sintetizó su teoría en su libro Vision 13 que está considerado como una de las contribuciones más importantes del siglo XX al estudio de la percepción visual.

12. Una buena exposición de los intereses de cada disciplina componente y de los factores que llevaron al nacimiento de esta empresa puede encontrarse en el libro de Howard Gardner La nueva ciencia de la mente: Historia de la revolución cognitiva, editado en castellano por Paidós (1987) .

13 . El libro fue publicado póstumamente en 1982, casi dos años después de su muerte por leucemia en noviembre de 1980 a los 35 años. La traducción castellana del libro fue editada por Alianza Editorial en 1985.


David Marr mostró pronto su insatisfacción con el carácter fragmentario tanto de la investigación psicofísica como de la investigación fisiológica de la visión. La psicofísica resultaba casi exclusivamente descriptiva y la fisiológica, aunque estaba interesada en los mecanismos cerebrales de la percepción, producía, en opinión de Marr, unas explicaciones excesivamente simples. Las investigaciones de los años sesenta, que veremos con mayor detalle más adelante, estaban centradas en la búsqueda de detectores, pero el descubrimiento de detectores por sí mismos -pensaba Marr- no nos dice nada sobre cómo llevan a cabo la detección de una característica más o menos compleja, ni cómo se integra la información de los diferentes detectores para producir una representación integrada del medio ambiente. De forma irónica decía David Marr que pretender entender la visión estudiando sólo neuronas era como pretender entender el vuelo de las aves analizando sólo plumas. Para comprender el vuelo de las aves necesitamos conocer la dinámica del proceso y una vez conocida podremos construir una máquina que vuele. Para David Marr, una teoría de la visión adecuada debe interesarse por los procesos de construcción de las representaciones que permiten al cerebro ver. Para ello se requiere una aproximación computacional que, como resultado final, permita construir máquinas que vean. La aproximación de David Marr proporcionó tanto una filosofía de la investigación computacional como una teoría concreta de las principales fases de procesamiento visual. Veremos ahora cada una de estas dos aportaciones.

4.2.1.1. Los niveles de análisis

Para David Marr, los sistemas complejos de procesamiento de información, como es la mente humana o el sistema visual, no pueden ser explicados y comprendidos desde un único punto de vista. Es necesario, en primer lugar determinar los puntos de vista desde los que el sistema puede ser estudiado y después integrar la información proporcionada por cada uno de ellos. A los puntos de vista desde los que podemos estudiar un sistema David Marr les da el nombre de niveles de análisis. Cada nivel de análisis está determinado por un tipo de pregunta que nos hacemos acerca del sistema y la explicación adecuada a cada nivel de análisis es la respuesta a esa pregunta. David Marr propuso que los niveles de análisis fundamentales son tres :

a) Nivel computacional. Es el nivel que especifica de forma abstracta el problema que un sistema de procesamiento de información tiene que resolver. La pregunta que determina este nivel es: ¿qué hace el sistema? Una explicación a este nivel tiene que apuntar a los objetivos y a la finalidad del sistema en un contexto determinado. David Marr utilizó como ejemplo sencillo de sistema de información una caja registradora. Lo que hace una caja registradora son operaciones aritméticas elementales, como sumar o multiplicar. Por tanto, una explicación


de nivel computacional de una caja registradora deberá especificar las operaciones que hace y encontrará el por qué de esas operaciones en la teoría de la aritmética. En el caso de la visión, una teoría computacional de la visión deberá especificar los objetivos fundamentales del sistema, por ejemplo, siguiendo a Aristóteles, puede definirse como objetivo fundamental del sistema visual descubrir a partir de imágenes qué existe en el mundo y dónde está.

b) Nivel Algorítmico. Es el nivel que especifica cómo se llevan a cabo las operaciones o procesos del sistema. En este nivel es necesario especificar una representación que codifique el input y el output del sistema y un algoritmo que lleve a cabo la correspondencia entre input y output. En el ejemplo de la caja registradora, el nivel algorítmico deberá determinar si la representación que se utiliza es decimal o binaria y cuál es el algoritmo concreto utilizado para efectuar las operaciones. En el caso de un ordenador, el nivel algorítmico es el nivel del programa donde se especifican, en un lenguaje concreto de programación, los pasos necesarios para resolver un problema. En general, por tanto, este nivel se pregunta por, y busca explicaciones relacionadas con el modo en que un sistema resuelve los problemas.

e) Nivel de Implementación. Este nivel se interesa por la naturaleza de la realización física del sistema, por la tecnología que utiliza. En el caso de la caja registradora las preguntas típicas de este nivel tendrían que ver con ruedas dentadas o con circuitos electrónicos; en el caso de un sistema visual, tendrían que ver con circuitos integrados o con neuronas si se trata de un sistema biológico.

Los tres niveles de análisis pueden estar muy relacionados entre sí; por ejemplo, la elección de circuitos electrónicos para construir una caja registradora, puede condicionar la elección de una representación binaria. Sin embargo es conveniente distinguir entre los diferentes niveles de análisis con el fin de tener claro cual es el tipo de explicación adecuada a una determinada pregunta. Sobre todo es conveniente tener claro que, al tratar de explicar el comportamiento de sistemas complejos de procesamiento de información, carece de sentido buscar la explicación de ese comportamiento como si solamente hubiera una única explicación posible. Una explicación sólo tiene sentido en relación con una pregunta en un determinado nivel de análisis; por eso necesitamos explicaciones en niveles distintos para entender adecuadamente esos sistemas.

4.2.1.2. Los niveles de organización del procesamiento visual

Para David Marr, el problema fundamental de la percepción visual en su conjunto es construir una descripción invariante de la forma y de la posición


de las cosas a partir de imágenes. No es que la visión no lleve a cabo otras funciones, como procesar el color o el movimiento de los objetos. Pero estas funciones son secundarias, o mejor, subordinadas al objetivo primordial de la visión que es proporcionar información sobre la forma de los objetos en el espacio. El sistema visual logra este objetivo a través de tres grandes pasos o fases de procesamiento a partir de un input inicial. Este input es una imagen bidimensional de la escena visual generada por los valores de intensidad de cada uno de los puntos de la imagen correspondientes a la excitación de los receptores. Las tres fases de procesamiento son las siguientes:

a) El Esbozo Primario. El objetivo de esta fase es hacer explícita la información acerca de la imagen bidimensional; en primer lugar los cambios de intensidad que hay en ella, después la distribución geométrica y la organización de esos cambios. El input de esta fase es la imagen inicial. El output está formado por un conjunto de primitivas simples -bordes, barras, manchas y terminaciones- agrupadas de acuerdo con principios de organización semejantes a los propuestos por la Gestalt. Estas primitivas constituyen los elementos simbólicos básicos a partir de los cuales se van a construir las representaciones de las fases siguientes.

b) El esbozo 2112-D. En esta fase se hace explícita la información acerca de la orientación y de la profundidad de las superficies visibles. También se especifican los contornos y las discontinuidades en orientación y profundidad en un sistema de coordenadas centradas en el observador. Se trata por tanto de recuperar información acerca de las superficies que conforman la escena visual en un espacio tridimensional, pero la consecución de la tercera dimensión no es perfecta, por eso esta fase se llama esbozo 2112-D, ya que los valores de orientación y de profundidad obtenidos están referidos al observador.

El procesamiento en esta fase tiene dos características fundamentales: modularidad y paralelismo. La modularidad implica que los procesos que tienen lugar en esta fase son llevados a cabo de una forma especializada por distintos componentes del sistema visual; así mientras un módulo procesa el color, otro procesa el movimiento, otro la textura, otro la disparidad binocular, etc. El paralelismo implica que el funcionamiento de cada módulo es independiente del funcionamiento de los demás y se llevan a cabo al mismo tiempo. El input para cada módulo de esta fase es el resultado de la fase de esbozo primario. El output de esta fase está formado por la información peculiar proporcionada por cada modulo, tal como color, movimiento, etc. Pero además la integración de la información que cada módulo proporciona sobre la orientación y profundidad de cada punto de la escena visual respecto al observador, permite también recuperar una representación de las superficies.


e) El modelo 3-D. En esta fase el sistema visual consigue una representación de las formas y de su organización espacial en un marco de referencia centrado en el objeto mismo, utilizando una representación jerárquica y modular de primitivas volumétricas 14 y de superficie. El input a esta última fase es el resultado de la fase anterior y el resultado final son modelos tridimensionales organizados jerárquicamente cada uno de ellos constituido por una configuración espacial de ejes en torno a los cuales se engarzan las primitivas volumétricas. La Figura 1.3 muestra un ejemplo, proporcionado por Marr y Nishihara (1978), de aplicación recursiva de este principio de organización jerárquica. A distintos niveles de magnitud, una primitiva volumétrica -en este caso un cilindro- se engarza en torno a un eje produciendo una representación de un cuerpo humano entero, un brazo, un antebrazo y una mano.

Figura humana

w __ Brazo

~ ~ Antebrazo

~ Maoo

1 ~1 1

'-

FIGURA 1.3. Ilustración del principio de aplicación recursiva de la organización jerárquica de las primitivas volumétricas (David Marr). Fuente: David Marr. Vision: A Computational/nvestigation into the Human Representation and Processing of

Visuallnformation. 1982. New York: Henry Holt.

En otros capítulos de este libro tendremos ocasión de estudiar los aspectos algorítmicos de estas fases y cómo se llevan a cabo en el cerebro humano. La exposición que acabamos de hacer se ha centrado en formular los objetivos que caracterizan el nivel computacional de cada una de las fases.

La influencia de la teoría de David Marr en la investigación actual de la percepción visual ha sido determinante. Muchos aspectos concretos de su teoría han quedado sobrepasados por la investigación posterior, pero su concepción teórica global, y sobre todo su forma de abordar la investigación han marcado un antes y un después en la investigación de la percepción visual.

14. Son características que representan el volumen de espacio que una forma determinada ocupa. Constituyen las unidades volumétricas más sim ples a partir de las cuales se construye la representación final de un objeto.


David Marr fue un auténtico pionero de la neurociencia computacional y su aportación a la teoría de la percepción visual es, en opinión de muchos investigadores, comparable a la que Helmholtz realizó en su tiempo.

4.2.2. El conexionismo

La teoría de David Marr es un buen ejemplo de una teoría computacional simbólica. Hemos visto que al final de la primera de las fases de la teoría, el procesamiento visual alcanza las características primitivas de una representación simbólica. Los bordes, las manchas, las barras y las terminaciones son entidades elementales de la representación que tienen un significado porque hacen referencia a aspectos particulares de la escena visual representada y son simbólicas porque tienen un significado. Cuando, en una representación, existe una correspondencia uno a uno entre los elementos que forman la representación y los aspectos de la escena representada, se dice de ella que es una representación local. Las representaciones simbólicas utilizan preferentemente representaciones locales.

A comienzos de los años ochenta en el siglo pasado, apareció en la ciencia cognitiva una alternativa a los sistemas simbólicos conocida con el nombre de conexionismo. Su objetivo fundamental era aproximar la teoría de los procesos cognitivos a la teoría del cerebro. Para ello propusieron construir representaciones con <<inspiración neuronal» y procesos que funcionaran <<al estilo del cerebro>>, de ahí que esta aproximación sea conocida también con el nombre genérico de redes neuronales. Una red neuronal está compuesta de un conjunto de unidades elementales de procesamiento parecidas a las neuronas del cerebro que están conectadas entre sí de una forma determinada. Las conexiones entre unidades de la red pueden tener distinta fuerza de forma que la conexión entre dos unidades puede ser más o menos fuerte que la conexión de cada una de ellas con una tercera unidad. Además, las conexiones entre unidades pueden ser excitatorias, si la activación de una unidad provoca un aumento en el nivel de activación de la otra, o inhibitorias, si el nivel de activación de la segunda disminuye como consecuencia de la activación de la primera. Las diferentes fuerzas de las conexiones excitatorias e inhibitorias entre las unidades de una red definen lo que se llama un patrón de conectividad que puede cambiar como consecuencia de sucesivas experiencias de acuerdo con una regla de aprendizaje. Otros conceptos importantes para entender el funcionamiento de una red neuronal son: la regla de activación que especifica la forma en que se combinan las diferentes entradas que una unidad recibe para determinar el estado de activación de la unidad. Finalmente una red neuronal debe de concretar una función de output que determine la correspondencia entre el estado de activación y el output del sistema, y un ambiente que especifique el medio en el que debe funcionar la red.

La Figura 1.4 presenta un ejemplo de red neuronal. En la figura, las unidades están representadas por círculos y las conexiones por líneas que terminan


Activación de output

t t

t t t Activación de input

FIGURA 1.4. Ejemplo de red neuronal.

en una punta de flecha. La red representada en la Figura 1.4 está formada por tres capas, cada una de ellas formada por un conjunto de unidades elementales de procesamiento. La primera capa está formada por unidades de input que son activadas por el medio ambiente en el que actúa la red. El estado de activación de las unidades de la tercera capa determina el output de la red. Finalmente la capa intermedia esta formada por unidades ocultas, así llamadas porque no establecen contacto directo ni con el input ni con el output de la red; su función es modificar las conexiones entre las unidades de input y las de output en función de la información que reciben tanto de otras unidades de input como de las unidades ocultas a las que se encuentran conectadas.

Las redes neuronales dan lugar a representaciones distribuidas en las que no se puede establecer una correspondencia uno a uno entre las entidades del mundo representado y las unidades de la red. En una representación distribuida cada entidad del mundo está representada por el patrón de activación del conjunto de unidades que forman parte de la red y, a su vez, cada unidad de la red puede estar implicada en la representación de muchas entidades diferentes del mundo representado. Por ejemplo, si suponemos que la red en la Figura 1.4 es una red implicada en el reconocimiento de objetos, cada unidad puede responder a un aspecto restringido del objeto, como puede ser su color o su forma. Ante la presencia de un objeto concreto, como puede ser una manzana, las unidades de la red responderán cada una al aspecto concreto correspondiente a su color y a su forma, de modo que la manzana no estará representada por una única unidad sino por un conjunto de unidades cuyo patrón conjunto de activación corresponderá a la manzana. Sin embargo ninguna unidad en la red mantiene una relación especial con la manzana representada; por el contrario, cualquier unidad de la red puede formar parte de otros patrones de activación diferentes que, a su vez, correspondan a otros objetos del medio ambiente.


La investigación con redes neuronales ha puesto de manifiesto que la acción coordinada de las unidades de una red da origen a propiedades emergentes capaces de simular procesos cognitivos. Por ello se han convertido en un importante instrumento de formalización de teorías psicológicas a la vez que proporcionan una forma de pensar acerca del funcionamiento del cerebro que permite aproximar entre sí los conceptos mentales propios de la psicología cognitiva y los conceptos fisiológicos propios de la neurociencia.

La utilización de modelos explicativos formulados en términos de redes neuronales no está necesariamente reñida con la utilización de teorías simbólicas. El mismo David Marr utilizó de una forma muy pragmática ambas formas de teorizar dependiendo del tipo de proceso que pretendía estudiar15 •

4.3. Los avances de la fisiología

Durante los años cincuenta del siglo XX la investigación fisiológica de los sistemas sensoriales comenzó a establecer un contacto mucho más directo con los problemas propios de la investigación psicológica de la percepción. Anteriormente los fisiólogos se contentaban con describir cómo los órganos de los sentidos y sus nervios correspondientes presentaban una imagen del mundo externo al cerebro y consideraban que era tarea de los psicólogos la investigación de lo que ocurría después. Con la invención de los microelectrodos y el registro unicelular, la implicación de los fisiólogos en la investigación perceptiva se hizo habitual y así continúa hasta nuestros días.

Entre los principales hallazgos que llevaron a conceptuar el cerebro como un sistema de procesamiento de información merece la pena resaltar las investigaciones realizadas en la retina de las ranas por investigadores tales como Barlow (1953) y Lettvin, Maturana, McCulloch y Pitts (1959). Estos autores descubrieron un tipo particular de células ganglionares en la retina de las ranas que respondían únicamente cuando un pequeño disco oscuro aparecía en su campo de visión. Si ese mismo estímulo se presentaba a una rana intacta, ésta se orientaba hacia el objeto e iniciaba una serie de respuestas tendentes a cazar y comerse el objeto. Los investigadores denominaron a esas células <<detectores de bichos» pues parecían preferentemente sintonizadas a la presencia de los pequeños insectos que constituyen una parte importante de la dieta de las ranas. La significación teórica de estos hallazgos iba más allá de la mera curiosidad que el hecho podía suscitar: <<La retina de la rana era capaz de transmitir un mapa de las características relevantes en el mundo del ani-

15. Durante los años ochenta del pasado siglo tuvo lugar un amplio debate sobre la conveniencia de utilizar arquitecturas simbólicas o arquitecturas conexionistas para teorizar en psicología. Hoy en día las actitudes son más pragmáticas y menos fundamentalistas que entonces y la adopción de una u otra forma de teorizar suele estar determinada por su adecuación para comprender el proceso particular que se estudia. También en este punto la actitud de David Marr ha resultado pionera.


mal, y su función principal no era tanto transformar los distintos niveles de luminancia en impulsos nerviosos de diferente frecuencia, cuanto responder de forma invariante a distintos patrones de estimulación externa a pesar de los cambios en luminancia>> (Barlow, 1972).

A partir de estos descubrimientos iniciales, la investigación neurofisiológica produjo una serie de hallazgos que acabarían por revolucionar la forma de pensar acerca de las neuronas que la fisiología había mantenido hasta entonces. Hartline (1949) y Barlow (1953) demostraron la existencia de inhibición lateral, mecanismo periférico de interacción neuronal capaz de explicar fenómenos perceptivos tales como el contraste simultáneo de la claridad. En 1959 Hube! y Wiesel publicaron sus primeros trabajos sobre las neuronas de la corteza estriada de los gatos que les valió el premio Nobel de fisiología y medicina en 1981. Dedicaremos especial atención a estos trabajos en el Capítulo 3. A lo largo de los años sesenta, las investigaciones de los De Valois, que estudiaremos detenidamente en el Capítulo 2, acabaron por dar la razón que le correspondía a la teoría de los procesos oponentes del color que Hering había mantenido en el siglo XIX y Hurvich y Jameson habían reformulado unos años antes. En 1967, Barlow, Blakemore y Pettigrew encontraron células especializadas en la detección de la profundidad binocular.

Todos estos descubrimientos llevaron a los investigadores al convencimiento de que cada neurona individual en el sistema visual era capaz de llevar a cabo tareas mucho más complejas que las que hasta entonces se habían pensado. Las neuronas no se limitaban a transmitir información más o menos precisa sobre la intensidad luminosa de la imagen, sino que eran capaces de informar sobre las características elementales de un patrón y sobre la organización jerárquica de esos elementos. Eran capaces de detectar la distancia a la que se encontraban los objetos, y de ignorar las causas irrelevantes de las variaciones en iluminación. Las neuronas aparecían cada vez de forma más clara como unidades elementales y el cerebro como un sistema complejo de procesamiento de información.

Este cambio en la forma de entender el funcionamiento de las neuronas y en última instancia del cerebro, llevó a una convergencia de puntos de vista entre la psicología y la neurociencia en donde tanto la mente como el cerebro comenzaron a ser considerados como sistemas complejos de procesamiento de información. Desde entonces la relación entre psicología cognitiva y neurociencias ha sido cada vez más estrecha dentro de un intercambio de recíproca influencia que ha terminado por dar origen a la moderna Neurociencia Cognitiva. Con este nombre se denomina en la actualidad a la empresa ínterdisciplinaria que investiga la relación entre procesos psicológicos y estructuras cerebrales mediante la utilización de técnicas de neuroimagen. Estas técnicas, tales como la tomografía por emisión de positrones (PET) o la resonancia magnética funcional (fMRI) entre otras, permiten el registro de la actividad cerebral durante la realización de una determinada tarea. En este contexto, la utilización de tareas como las desarrolladas por la psicología cognitiva para la


investigación de los procesos mentales está resultando ser un procedimiento imprescindible para comprender la organización funcional del cerebro.

5. MARCO TEÓRICO

Aunque en la exposición de los temas que desarrollamos a lo largo de este libro de texto hemos procurado integrar las principales aportaciones que se han hecho al estudio de la percepción visual desde las diferentes perspectivas que hemos expuesto en este capítulo, no cabe duda de que nuestras preferencias teóricas determinan tanto la elección del material que se expone en los próximos capítulos como las valoraciones que en ellos se hacen de las diferentes posturas teóricas. Por ello parece conveniente exponer de forma explícita y breve esas preferencias con el fin de que el lector pueda orientarse y pueda también situar este libro en el contexto histórico que hemos esbozado en este capítulo.

En términos generales la orientación de este libro se enmarca dentro de la aproximación cognitiva conocida como procesamiento de información. En la medida en que el computacionalismo representa la madurez del procesamiento de información consideramos que el marco general de la teoría de la visión propuesta por David Marr constituye un punto de int1exión en la investigación perceptiva que el estudiante debe conocer porque representa el nuevo punto de partida de la moderna teoría de la percepción visual. A lo largo de los capítulos de este libro tendremos ocasión de discutir las aportaciones de Marr a la resolución de problemas concretos, pero el enfoque general que él propuso y sobre todo su concepción sobre los diferentes aspectos a los que una teoría de la percepción visual debe atender nos parecen particularmente interesantes.

5 .1. La función de la visión

En primer lugar una teoría de la percepción visual debe tomar en consideración la función que la visión desempeña en el contexto de la interacción del organismo con su medio. Dentro del objetivo general de supervivencia y de reproducción que caracteriza el comportamiento de cualquier organismo, la visión proporciona información precisa y a distancia sobre los objetos y sobre la posición espacial de los mismos en el medio ambiente a partir de la luz que los objetos emiten o ret1ejan. Mediante esta información el organismo es capaz de dirigir las acciones que garantizan su supervivencia.

La precisión de la visión es un requisito indispensable para la supervivencia del organismo. Si la visión no fuera capaz de informarnos sobre la identidad y sobre la posición espacial de los objetos nunca habría evolucionado hasta el nivel de precisión que ha llegado a adquirir en las personas. No quiere esto decir que la visión sea infalible; a veces nos engaña, por eso las ilusiones ópticas constituyen un importante conjunto de fenómenos que una teoría de la percepción debe explicar. Sin embargo las ilusiones no constituyen la norma


en el funcionamiento de la visión sino la excepción. Normalmente la visión es verídica y proporciona al organismo una información lo suficientemente precisa como para guiar sus acciones de forma eficaz.

La información que proporciona la visión tiene la propiedad de ser una información a distancia, lo que representa un valor adicional para la supervivencia del organismo pues le permite adquirirla sin entrar en contacto con los objetos y sin comprometer su seguridad. La visión comparte esta característica con la audición y el olfato pero la información espacial que estos sentidos proporcionan no es tan precisa como la proporcionada por la visión, al menos en el caso de las personas y de una gran parte de otros animales. El tacto y el gusto también proporcionan información acerca de algunas propiedades de los objetos pero es necesario que éstos entren en contacto con el observador.

La característica más específica y definitoria de la visión es que la información sobre los objetos y sobre su posición espacial se obtiene a partir de la luz que emiten o reflejan. Pero la luz que llega al observador depende de numerosos factores, depende de la iluminación que el objeto o la escena reciben, de la reflectancia de sus superficies, de su geometría, del punto de vista del observador, etc. Muchos de estos factores cambian continuamente y a pesar de ello nuestra percepción visual nos presenta objetos que mantienen constante su color, su forma o su tamaño, entre otras características. ¿Cómo puede el sistema visual proporcionarnos la percepción de objetos y escenas constantes a partir de una información tan cambiante? Este es el problema central que la visión tiene que resolver.

Al plantear así el problema central de la visión, adoptamos una postura fundamentalmente realista afín a la propuesta por Gibson. Consideramos los sentidos, y en nuestro caso concreto la visión, como canales para la percepción del mundo real externo. Por eso el problema central de la percepción consiste en recuperar las propiedades válidas de ese mundo externo a partir de la información de los sentidos.

5.2. El procesamiento de la información

En segundo lugar, una teoría de la visión debe preguntarse por la forma en que el sistema visual resuelve el problema que acabamos de plantear. En este sentido, nuestra posición es muy diferente a la de Gibson. Para él el problema de una teoría de la percepción se reducía a identificar en la estimulación las variables responsables de la constancia perceptiva, los invariantes en relación a los cambios en el punto de vista del observador y a los cambios en iluminación. Para nosotros, la identificación de los aspectos relevantes en la estimulación es solamente el primer paso de una cadena de acontecimientos que una teoría de la percepción visual debe tratar de desentrañar. Es necesario tomar en consideración las diferentes fases mediante las cuales el sistema visual procesa la información estimular y la convierte en conocimiento para el organismo del medio ambiente en el que se desarrolla su actividad.


Llevar a cabo este análisis del procesamiento de la información implica describir los diferentes tipos de representaciones que el sistema visual construye y los procesos que permiten la codificación de los estímulos, la progresiva organización de la escena visual y la construcción de las representaciones fundamentales. El concepto de representación es central en una teoría del procesamiento de información, pero no debe entenderse de forma simplista como una especie de fotografía dentro de la cabeza que es observada por un homúnculo más o menos misterioso, sino como un complejo sistema de correspondencias entre características del medio y códigos neuronales que permiten al sistema visual recuperar internamente la información relevante del medio.

La Figura 1.5 presenta las principales fases de procesamiento que cabe distinguir en el proceso de consecución de la representación final que nos permite percibir visualmente una escena o un objeto.

o

i Categorización

del Objeto

Representación del

objeto

Recuperación de

Superficies

t Análisis

de la Imagen

FIGURA 1.5. Principales fases del procesamiento visual .

Las tres primeras corresponden en términos generales a las tres fases propuestas por David Marr que hemos visto anteriormente. La primera está centrada en el análisis de la imagen bidimensional proporcionada por la distribución de luminancia que llega a nuestros receptores y que es objeto del procesamiento visual inicial. La segunda está dedicada a la recuperación del trazado tridimensional de las superficies visibles, y la tercera a la obtención de la representación volumétrica de los objetos en coordenadas centradas en


los objetos mismos. Al final de la tercera fase el sistema visual ha sido capaz de obtener una representación perceptiva de los objetos individuales y de la escena concreta presente en la estimulación. Con todo, el procesamiento perceptivo no termina ahí; aún es preciso considerar una fase última de categorización en la que las representaciones perceptivas alcanzan un significado al entrar en relación con el mundo conceptual del observador. En esta última fase, el mundo percibido proporcionado por los sentidos es asimilado e integrado en el sistema de conocimiento del perceptor.

Este esquema general de procesamiento, que iremos desarrollando a lo largo de este libro, constituye el marco general de nuestra postura que es confesadamente constructivista en el sentido de que considera necesario, para poder explicar adecuadamente la percepción visual, tomar en consideración tanto los procesos que el sistema visual pone en funcionamiento para obtener una representación del medio ambiente, como el conocimiento del observador que da significado a lo percibido. Nuestra postura simpatiza con la teoría clásica en su consideración constructivista de la percepción pero no suscribe en su totalidad sus postulados empiristas. El empirismo que inspiró la teoría clásica solamente tomó en consideración la experiencia del individuo adquirida a través del aprendizaje y retenida en la memoria. Nosotros consideramos necesario además tomar en consideración la experiencia de las especies que después de siglos de evolución habrían de originar la especie humana. El sistema responsable de la percepción visual es el resultado de un largo proceso de selección natural que nos proporciona desde el nacimiento unos mecanismos cuya maduración y funcionamiento dependen de la experiencia individual pero no son equivalentes a una hoja en blanco, como pretendían los empiristas, sino que en muchos aspectos está dotado de pautas de funcionamiento predeterminadas. La disyuntiva entre herencia o medio propuesta por innatistas y empiristas obligando a elegir una de las opciones carece de sentido en la actualidad. No se trata ya de optar por principio por una de ellas sino de determinar empíricamente el papel de cada una de ellas en la explicación de la percepción.

5 .3. Mecanismos neuronales

Finalmente, una teoría de la percepción debe prestar atención a las estructuras cerebrales que la hacen posible. Aunque esta afirmación parece evidente en sí misma, la historia de la investigación muestra que los contactos entre la psicología y la fisiología no han sido habituales aunque afortunadamente son cada vez más estrechos. Como vimos al comienzo de este capítulo, el estudio de la percepción visual formaba parte de la óptica fisiológica tal como la entendía Helmholtz, pero el desarrollo de la psicología de la percepción visual se centró en el análisis de la experiencia consciente y en el estudio de los factores estimulares que determinaban esos estados de consciencia. La referencia a mecanismos fisiológicos se limitaba a los órganos de los sentidos, en parte


también porque la propia fisiología no había sido capaz de avanzar más en la comprensión de los mecanismos perceptivos. Como hemos visto anteriormente, a partir de la mitad del pasado siglo el panorama empezó a cambiar y en la actualidad la relación entre psicología y fisiología del cerebro es cada vez más estrecha. La moderna neurociencia cognitiva permite relacionar los fenómenos perceptivos tradicionalmente estudiados por la psicología y las estructuras cerebrales de una forma que hasta ahora no había sido posible. Todo hace pensar que esta nueva empresa multidisciplinar marcará el futuro de la investigación sobre percepción, y probablemente de la investigación psicológica en general.

Capítulo 2

LA PERCEPCIÓN DEL COLOR

INTRODUCCIÓN

La percepción del color ocupa un lugar central en el estudio de la percepción visual por múltiples razones. En primer lugar por tratarse de un tema que recoge aportaciones de disciplinas muy diversas; la física, la fisiología, las ciencias de la computación, la lingüística y la antropología social son algunas de las principales disciplinas que junto con la psicología han contribuido en mayor medida a mejorar nuestro conocimiento sobre la percepción del color. Esta necesidad de aportaciones diversas hace de este tema un modelo ideal y a la vez concreto para comprender la naturaleza interdisciplinar de la investigación cognitiva. En segundo lugar, nuestros conocimientos sobre el procesamiento del color están relativamente bien fundamentados. No se puede decir que conozcamos todo lo que es relevante en este campo, pero es verdad que, en comparación con otras áreas de la investigación perceptiva, nuestros conocimientos sobre el color están mejor fundamentados y el grado de acuerdo entre investigadores es mayor. Finalmente, el tema del procesamiento del color es un buen ejemplo de la forma en que teorías consideradas opuestas para explicar un conjunto de fenómenos pueden resultar complementarias si se amplía el marco teórico de referencia. Como veremos más adelante, durante casi un siglo la teoría tricromática y la teoría de los procesos oponentes fueron consideradas como irreconciliables para explicar los fenómenos fundamentales relacionados con la percepción del color. Hoy sabemos que el valor explicativo de cada una de esas teorías depende del nivel de organización perceptiva al que consideremos el procesamiento del color. En consecuencia, el tema de la percepción del color constituye también un ejemplo ideal y concreto para la epistemología científica interesada en cómo progresa el conocimiento científico.


El tema está organizado con el convencimiento de que el interés central de la percepción del color radica en comprender su apariencia. ¿Por qué los colores se muestran en nuestra experiencia consciente de la forma en que lo hacen? La contestación a esta pregunta está fundamentada en tres principios: tricromaticidad, procesamiento oponente y constancia. El capítulo se centrará preferentemente en la comprensión de estos tres principios que pertenecen a niveles bajo e intermedio en el procesamiento perceptivo del color. Aún así, la consideración de estos tres principios no agota el conjunto de aspectos relevantes para la percepción del color. Por ello también prestaremos atención al papel de factores de alto nivel relacionados con nuestro sistema conceptual y con el modo en que nuestro conocimiento contribuye a categorizar los colores. Por último haremos referencia a la importancia que el color desempeña en la percepción de alto nivel.

1. LA APARIENCIA DEL COLOR

El estudio de la apariencia del color encontró su primera aportación fundamental en el descubrimiento de Isaac Newton sobre la composición espectral de la luz. Cuando hizo pasar un rayo de luz solar a través de un prisma, Newton observó la aparición de un arco iris mostrando los colores del espectro luminoso. También supo comprobar que estos colores eran fundamentales, ya que haciendo pasar un rayo de cada color por un segundo prisma, el color no volvía a descomponerse produciendo la aparición de un segundo arco 1ns.

Hoy sabemos que la luz puede ser descrita en términos de onda y en términos de corpúsculo y que cada una de estas dos descripciones puede ser de diferente utilidad a la hora de entender los fenómenos relacionados con el color. La consideración de la luz como onda es útil para comprender su composición espectral y los aspectos cualitativos del color, mientras que la consideración de la luz como corpúsculo resulta más apropiada para referirnos a la cantidad de luz asociada a los colores. Veamos estos dos aspectos con mayor precisión.

1.1. La cantidad de luz y su medida

Las medidas de la cantidad de luz dimanan de una concepción corpuscular de la luz. Según esta forma de entenderla, la luz está compuesta por paquetes elementales (<<cuantos>>) de energía, llamados fotones, que constituyen la unidad de medida de la cantidad de luz. La medición de la cantidad de luz puede hacerse desde dos perspectivas diferentes. Una de ellas, que es la propia de la radiometría, considera la luz como cualquier otro tipo de energía, sin hacer referencia al uso que puede hacerse de ella. La segunda perspectiva es la propia de la fotometría que toma en consideración únicamente la cantidad de luz

LA PERCEPCIÓN DEL COLOR 61

que es visualmente efectiva, es decir la cantidad de luz que se puede percibir, e introduce un factor de corrección en las medidas radiométricas basado en la sensibilidad de nuestros receptores. De entre los diferentes conceptos fotométricos son importantes para el estudio de la percepción los siguientes:

Iluminancia (E) Es la cantidad de luz visualmente efectiva que incide sobre una superficie. Por ejemplo la cantidad de luz procedente de un rayo de luz que incide sobre una mesa. Su valor depende de dos factores: de la distancia entre la superficie iluminada y la fuente de iluminación 1, siendo menor cuanto mayor es la distancia, y del ángulo de desviación de la perpendicular; la cantidad de iluminancia es menor cuanto mayor es dicho ángulo. La unidad de medida de la iluminancia es ellux.

Luminancia (L) Es la cantidad de luz visualmente efectiva emitida por una fuente de luz extensa. Por ejemplo, la cantidad de luz reflejada por una mesa. Su unidad de medida es la candela por metro cuadrado (cd · m2). Puesto que una parte importante de las fuentes luminosas extensas son superficies que reflejan la luz que reciben, es importante tomar en consideración la proporción de cantidad de luz recibida que una superficie emite. Esa proporción viene dada por el cociente entre la cantidad de luz emitida (luminancia) y la cantidad de luz recibida (iluminancia) y se denomina reflectancia.

1.2. El espectro electromagnético

La consideración de la luz como onda nos permite relacionarla con los distintos tipos de energía que componen el espectro electromagnético. Como puede verse en la Figura 2.1 (p. 97), el espectro electromagnético ordena los distintos tipos de energía en función de la longitud de onda que caracteriza a cada una de ellas. Sólo una pequeña parte del espectro electromagnético, la comprendida entre los 400 y 700 nm2, tiene interés para nuestro tema porque solamente esa franja de longitudes de onda tiene efectividad visual y constituye el espectro visible.

El diferente grado de refracción de las distintas longitudes de onda permite observar los componentes del espectro luminoso cuando, como hizo Newton, se hace pasar un rayo de luz solar a través de un prisma. Las longitudes de onda cortas, que son más fuertemente refractadas, presentan una apariencia violeta (400 nm) 3 o azulada (480 nm) cuando se las ve sobre fondo oscuro, mientras que las longitudes de onda más largas tienen apariencia

l. La iluminancia se mide en el destino, es decir en la superficie a la que llega la luz y no en la fuente luminosa. Para la elaboración de sus conceptos fundamentales, la fotometría asume que la fuente luminosa es un punto y los conceptos que hacen referencia a la medición de la cantidad de luz en la fuente son flujo luminoso (F) e intensidad luminosa (I). Para una explicación más extensa de la medición de la cantidad de luz, ver Tudela (1981).

2. Un nanometro equivale a una milmillonésima de metro (10 -9}.

3. Los valores de longitud de onda asociados a cada color tienen una finalidad orientativa y están basados en Wyszecki & Stiles (1982).


anaranjada (610 nm) o roja (700 nm) cuando son vistas sobre fondo oscuro. Otros colores, como el verde (540 nm) o el amarillo (580 nm) ocupan posiciones intermedias en el espectro visible.

La distribución espectral de una luz es la función que describe la cantidad de luz que contiene en cada una de las longitudes de onda. La luz solar contiene una cantidad aproximadamente igual en todas las longitudes de onda aunque tanto al salir como al ponerse el sol predomina la presencia de las longitudes de onda larga. Una lámpara de tungsteno, como las que se usan habitualmente en la iluminación doméstica, contiene muy poca luz en las longitudes de onda cortas y, dentro del espectro visible, la cantidad de luz que proyecta está linealmente relacionada con la longitud de onda por lo que los colores rojos tienden a predominar en ambientes iluminados con este tipo de lámparas. En la luz proveniente de una lámpara fluorescente todas las longitudes están relativamente bien representadas y, aunque la distribución no es igual para todas las longitudes de onda, es un tipo de luz que se aproxima a la luz natural. La distribución espectral de las fuentes de iluminación es un factor determinante de la estimulación en la percepción del color y debe ser tomada seriamente en consideración por el investigador.

1.3. La codificación del color

Newton fue plenamente consciente de que el color no era una propiedad de la luz y de que, hablando en sentido estricto, no se podía decir que los rayos de luz tuvieran un color determinado. El color es una sensación consciente resultante de la interacción de nuestros sentidos con la estimulación luminosa y por ello constituye un importante capítulo de la psicología de la percepción. La longitud de onda es el parámetro estimular preferentemente relacionado con la sensación de color pero solamente representa el primer paso en la cadena causal de acontecimientos que determinan esa sensación. Al conjunto de procesos que completan esa cadena causal podemos llamarlos procesos de codificación del color ya que son los encargados de transformar un código físico, expresado en términos de longitudes de onda, en un código psicológico, expresado en términos de experiencias conscientes de color.

Las estrategias científicas utilizadas para estudiar la codificación del color son de dos tipos: psicofísicas y fisiológicas. Las estrategias psicofísicas estudian la relación entre la manipulación de las características del estímulo luminoso y la experiencia de color. La psicofísica se interesa preferentemente por describir y medir adecuadamente la experiencia sensorial y por relacionar las características de esa experiencia con los parámetros de la estimulación. Las estrategias fisiológicas estudian la relación tanto de las características estimulares como de la experiencia sensorial con los distintos componentes del sistema visual. La fisiología se interesa preferentemente por identificar esos componentes y determinar su relación con los parámetros estimulares y con la experiencia de color. Desde un punto de vista histórico la investigación


psicofísica ha sido la primera y ha preparado el terreno que ha hecho posible la investigación fisiológica. En la actualidad los dos tipos de estrategias son utilizados de forma conjunta y complementaria. En esta exposición del tema veremos en primer lugar los principales hallazgos de la investigación psicofísica y estudiaremos los principales descubrimientos fisiológicos en el contexto de la discusión de los principios explicativos mencionados al principio. Ahora comenzaremos por caracterizar la apariencia del color como una primera aproximación al fenómeno para el que buscamos explicación en este tema.

1.4. Los atributos del color

La forma en que los colores aparecen en nuestra experiencia consciente puede describirse por referencia a tres atributos básicos: matiz, saturación y brillo/ claridad4

• Son atributos psicológicos que hacen referencia a nuestra experiencia consciente y deben ser claramente diferenciados de las dimensiones físicas del estímulo con las que están relacionadas.

El matiz de un color hace referencia a la cualidad que diferencia un color de otro; es el aspecto cualitativo que nos permite clasificarlo con términos como rojo, verde o azul. Como hemos visto anteriormente, en el espectro luminoso existe una alta correlación entre longitud de onda y matiz, tal como aparece en el arco iris. Estos colores forman parte del grupo de colores espectrales. Sin embargo no debe confundirse el matiz con la longitud de onda. Hay colores que no están relacionados con una longitud de onda determinada, como es el caso de los colores no espectrales. Estos colores, como ocurre con los púrpuras y morados, sólo pueden obtenerse mediante la mezcla de dos o más luces monocromáticas. A los colores tanto espectrales como no espectrales se les da el nombre de cromáticos. Otros colores, como son el blanco, gris y negro se comprenden mejor en relación con la dimensión de claridad que con el matiz, por ello suelen llamarse acromáticos. En sentido estricto, por tanto, el matiz hace referencia a los aspectos cualitativamente diferentes de la experiencia de color que tienen relación con diferencias de longitudes de onda o con mezclas de diferentes longitudes de onda.

La saturación hace referencia a la pureza cromática que presenta el color. Se define como el atributo de una sensación visual que permite hacer un juicio sobre el grado en que un estímulo cromático difiere de un acromático independientemente de su brillo. En general, el estímulo acromático de referencia suele ser el blanco, por ello también suele definirse, de un modo más informal, como el grado de mezcla con blanco que presenta un estímulo cromático. Por ejemplo, un color rosa es un rojo con poca saturación resultante

4. Utilizo los términos matiz, brillo y claridad como equivalentes a los términos ingleses hue, brightness y lightness.


de la mezcla de rojo con blanco. Para los colores espectrales, el referente de máxima saturación es el aspecto que presenta en el espectro visible, por ejemplo los colores que se pueden observar en la Figura 2. 1.

El brillo y la claridad son dos atributos distintos aunque relacionados. El brillo es el atributo de la sensación visual por el que un estímulo visual aparece más o menos intenso. El brillo hace referencia a la mayor o menor cantidad de luz que un estímulo visual parece emitir y está preferentemente relacionado con la luminancia por lo que a veces es definido de modo informal como luminancia percibida. Cuando un estímulo varía en brillo, oscila entre valores que van de brillante a tenue. El brillo está preferentemente asociado a estímulos que emiten luz.

La claridad es un atributo asociado a la percepción de estímulos que reflejan luz, como son la mayor parte de las superficies. La claridad está relacionada con la reflectancia más que con la luminancia, por lo que a veces se define como reflectancia percibida. Todas las superficies coloreadas tienen algún grado de claridad, oscilando entre valores que van de clara a oscura, pero estos cambios de claridad aparecen de forma más patente en las superficies acromáticas donde los cambios en claridad producen la aparición de colores que oscilan entre los blancos y los negros pasando por una amplia gama de grises. Por ello es útil asociar la claridad con la dimensión blanco-gris-negro y utilizar los términos claro y oscuro por aproximación a esta dimensión. En general, es conveniente reservar el término brillo para referirse a los cambios de intensidad de fuentes que emiten luz y utilizar el término claridad cuando se trata de superficies que reflejan luz.

1.5. Sistemas de ordenación de los colores

Existen muchos sistemas de organización de color basados en diferentes procedimientos psicofísicos. En este tema presentaremos dos de ellos: uno basado en juicios sobre la semejanza de pequeñas muestras de material coloreado y otro basado en operaciones de igualación de luces. El sistema de Munsell es uno de los primeros sistemas construidos con la finalidad de medir la apariencia del color sobre la base de las tres dimensiones de matiz, claridad y saturación que acabamos de estudiar. El segundo procedimiento resulta particularmente importante porque ha servido de fundamento a la colorimetría; lo estudiaremos más adelante al hablar de la investigación psicofísica relacionada con la codificación de la longitud de onda.

1.5 .1. El sistema de colores de Munsell

En 1905 el artista y profesor de arte Albert Munsell publicó un sistema de organización de los colores en forma de libro, integrado por un conjunto de pequeños trozos de papel coloreado de igual tamaño que varían en matiz,


10

Valor

[I] 5R

10P

5P

5PB

10GB 5GB

'~"-r-P r-r-:::::~

Límite de la gama de la mezcla de color

1 '\ 1\ IJ

_y ¡¡.-c.--

5Y

10Y

5GY

10G

65

FIGURA 2.2. Estructura del sistema descriptivo del color de Munsell: A organización general; B, estructura de una página; C, corte perpendicular al eje central de la figura representada en A. Fuente: Adaptación de la figura 9.13. de la obra de Brian A. Wandell Foundations of Vision. 1995. Sunderland, MA: Sinauer Press, p. 317.

valor y croma5. Los trozos están organizados de forma que difieren entre sí en intervalos perceptivamente iguales en cada una de las tres dimensiones cuando se ven en condiciones perceptivas normalizadas, es decir, a la luz del día y sobre fondo que puede oscilar entre el blanco y el gris medio. Cada página del libro presenta un conjunto de trozos coloreados que son del mismo matiz pero varían en valor y en croma. Cada página está organizada de forma que el eje vertical representa el valor en una escala de 10 intervalos, con el negro en la parte de abajo, el blanco arriba y la gama intermedia de grises. El eje horizontal representa el croma en una escala de cinco intervalos situando el mínimo a la izquierda -junto al eje del valor- y el máximo a la derecha y aumentando la puntuación de dos en dos para cada intervalo.

5. Los términos utilizados por Munsell para denominar las dimensiones de clasificación de los colores son parecidos a los que hemos visto anteriormente si denominamos valor a la claridad y croma a la saturación. Técnicamente, sin embargo, existe una pequeña diferencia entre croma y saturación. Croma se define como el atributo de una sensación visual que permite realizar un juicio sobre el grado en que un estímulo cromático difiere de un estímulo acromático del mismo brillo (o de la misma claridad). El requisito de igualación en la dimensión de brillo/ claridad es la diferencia fundamental entre croma y saturación.


Como puede verse en la Figura 2.2.B, cada página está formada por un conjunto de filas y de columnas. Cada una de las filas corresponde a una puntuación diferente en valor y dentro de cada fila los trozos tienen el mismo valor y varían en croma estando los más saturados en la parte derecha de la página. Así mismo, cada una de las columnas corresponde a una puntuación diferente de croma y dentro de cada columna los trozos tienen la misma puntuación en croma y varían en valor de menos (abajo) a más (arriba). Como puede observarse en la Figura 2.2.B, sólo mezclas de determinado valor y croma son posibles; la gama de posibles mezclas está encerrada en el espacio delimitado por la curva.

Si colocáramos el libro de pié y abriéramos las páginas alrededor del eje central, la figura geométrica generada se aproximaría a un cilindro como el que presenta la Figura 2.2.A, con el eje principal del cilindro representando el valor, el radio del cilindro representando el croma y el matiz situado en torno al perímetro del cilindro. La Figura 2.2.C, mediante un corte perpendicular al eje central, permite representar la organización del sistema de Munsell, con el valor situado en el centro, el matiz a lo largo del perímetro de la circunferencia y el croma a lo largo del radio. La escala de matices en torno a la circunferencia consta de diez segmentos con diez matices cada uno. Las referencias van en intervalos de veinte en veinte puntos del rojo (SR) al amarillo (5Y), al verde (5G), al azul (5B), al púrpura (5P) y vuelta al rojo. Intercalados entre esto se indican referencias correspondientes a mezclas intermedias. En realidad el libro de Munsell no presenta los cien posibles matices sino sólo 40 de ellos. Cada trozo de color se identifica por tres símbolos, por ejemplo 2,5 GB 5/10, en donde el primer símbolo (2,5 GB) indica el matiz (2,5 en el segmento Verde-Azul); el segundo (5) indica el nivel de valor y el tercero (10) el nivel de croma.

El sistema creado por Munsell fue anterior al que veremos más adelante, que es el sistema normalizado de la Comisión Internacional de Iluminación (CIE)6 • Con posterioridad a la normalización llevada a cabo por la CIE, la Munsell Corporation acordó producir los trozos coloreados de cada muestra de acuerdo con los valores de la CIE y no por medio de mezclas de pigmentos.

1.5 .2. La codificación de la longitud de onda

El primer paso en la codificación de la longitud de onda tiene lugar en el nivel de los receptores. En ese primer nivel dos clases de receptores visuales, bastoncillos y conos, determinan dos sistemas de visión que presentan características muy diferentes. El sistema de visión escotópica, que depende de los bastoncillos, es un sistema adaptado a las situaciones de bajo nivel de ilumi-

6. El acrónimo CIE corresponde al enunciado francés Commission Internacionale de l'Eclairage.


nación. Los bastoncillos son extremadamente sensibles a la luz y no difieren entre sí en su respuesta a la longitud de onda. Sin embargo, la sensibilidad de los bastoncillos no es la misma para cada una de las longitudes de onda.

El estudio psicofísico de la respuesta del sistema de visión escotópica a la longitud de onda de una luz se realiza mediante un experimento de igualación escotópica. En esta situación experimental se presenta un campo visual -por ejemplo, un círculo- dividido en dos mitades. Una de las dos mitades contiene la luz de prueba, que puede tener una distribución espectral fija, es decir un conjunto determinado de longitudes de onda. La otra mitad contiene una luz primaria, que tiene una distribución espectral fija y sólo puede variar en intensidad. La tarea del observador es manipular la intensidad de la luz primaria hasta que consigue igualarla a la luz de prueba. El resultado de este tipo de experimento es que, en condiciones de baja iluminación -condiciones escotópicas- los observadores pueden ajustar la intensidad de la luz primaria hasta igualar cualquier luz de prueba. Este resultado muestra de forma clara que la distribución espectral relativa de la luz es irrelevante para el funcionamiento del sistema visual escotópico; éste sólo es sensible a la cantidad de luz. Ahora bien, la intensidad de la luz primaria para conseguir la igualación no es la misma para todas las luces de prueba, lo que indica que el sistema de visión escotópica es más sensible a unas longitudes de onda que a otras. La Figura 2.3 muestra la función de sensibilidad espectral escotópica. Como puede verse, el sistema es poco sensible a las longitudes de onda extremas y muestra su máxima sensibilidad a las longitudes de onda medias en el entorno de los 51 O nm.

1.00

ro > 0.75 ~ Q) ...... -e ro 0.50 -e :.a ·¡¡; e Q) 0.25 U)

0.00

1 \ / \

1 \ J \

~

400 450 500 550 600

Longitud de onda (nm)

FIGURA 2.3. Función de sensibilidad espectral escotópica .


El sistema de visión fotópica, que depende de los conos, es un sistema especialmente adaptado a situaciones de alta iluminación y está directamente relacionado con la codificación diferencial de la longitud de onda. No todos los conos responden de la misma forma a la longitud de onda, unos son más sensibles a las longitudes de onda cortas, otros a las longitudes de onda medias y otros a las longitudes de onda largas. El estudio psicofísico de la respuesta del sistema de visión fotópica a la longitud de onda de una luz se realiza mediante un experimento de igualación de color. Este tipo de experimento es el fundamento de la colorimetría y a partir de Helmholtz y Maxwell los resultados obtenidos en este tipo de experimento proporcionaron los datos fundamentales para su teoría del color.

La situación experimental en un experimento de igualación de color es similar a la que vimos en el caso del experimento de igualación escotópica. El campo visual dividido en dos mitades contiene una luz de prueba que puede tener cualquier distribución espectral y la tarea del observador consiste en manipular la intensidad de tres luces primarias hasta conseguir que los dos lados del campo visual sean indistinguibles. Durante todo el experimento, la distribución espectral de las tres luces primarias permanece constante y el observador sólo puede modificar la cantidad de cada luz primaria. El resultado de este tipo de experimento es que, en condiciones de alta iluminación -condiciones fotópicas-los observadores pueden igualar todas las luces de prueba mediante la manipulación de las cantidades de luz de las tres luces primarias. Las dos partes del campo visual, a pesar de que tienen la misma apariencia, no tienen la misma distribución espectral por lo que al color resultante de la mezcla de las tres luces primarias se le da el nombre de metámero.

El conjunto de luces primarias que se pueden utilizar en un experimento de igualación de color debe cumplir una condición y es que ninguno de los colores primarios pueda obtenerse por la mezcla de los otros dos. En la práctica se ha comprobado que para obtener conjuntos de tres luces que puedan ser utilizadas como primarias, sus longitudes de onda deben estar ampliamente separadas en el espectro visible. Con el fin de tipificar las referencias calorimétricas, La Comisión Internacional de Iluminación (CIE), ha utilizado como primarios de su sistema R G B (rojo, verde, azul) tres luces de 700, 546.1 y 435.8 nm

La Figura 2.4 muestra la función resultante de un experimento que utilizó estas luces primarias. En ella se especifica las cantidades de R [r (/..)], G [g (/..)] y B [b (/..)] necesarias para igualar los colores de prueba correspondientes al espectro visible. Estas cantidades se denominan valores triestímulo y están expresadas en unidades tricromáticas7•

7. Las unidades tricromáticas se establecen por referencia a un experimento de igualación en el que el estímulo de prueba es un blanco con un espectro igual de energía en todas las longitudes de onda. Las cantidades de luz de cada luz primaria necesarias para igualar este blanco son las que se toman como unidad de referencia.


0.4f----l------+------+-----+----

600 700

Longitud de onda (le) nm. t E e::

--+-----:;---0 .....

69

FIGURA 2.4. Funciones resultantes de un experimento de igualación del color utilizando el sistema R G B. Fuente : Adaptación de la figura 4 (3.2.3.) de la obra de Günther Wyszecki & W. S. Stiles Color Science. © 1982 (2. 0 ed.), New York: John Wiley and Sons, p. 124. Reproducida con autorización de John Wiley and Sons, lnc.

Obsérvese en la Figura 2.4 que para igualar las longitudes de onda comprendidas entre los 435.8 y los 546.1 nm los valores de R que hay que añadir a la mezcla tienen un valor negativo. Esto significa que la igualación de los colores correspondientes a las longitudes de onda comprendidas en ese rango no puede lograrse mediante la mezcla de las tres luces primarias, pero sí se logra si la cantidad de R se mezcla con la luz del estímulo de prueba. En este caso lo que se hace es disminuir la saturación del estímulo de prueba y lograr de esta forma que el color resultante sea igualado por una mezcla de G y B. Así pues, en sentido estricto no es verdad que la apariencia de cualquier color pueda ser igualada por la mezcla de tres luces primarias, sin embargo sí es verdad que la igualación de cualquier color puede lograrse mediante la manipulación de tres luces primarias lo que permite establecer un sistema descriptivo basado en tres luces primarias que incluya todos los colores.

La ecuación del color es la expresión que determina la cantidad de cada luz primaria que es necesaria para lograr la igualación del color (E) correspondiente a una determinada longitud de onda (A.). Por ejemplo, con referencia a la Figura 2.4, el color correspondiente a una longitud de onda de 4 7 5 nm tiene la siguiente ecuación del color:


E475 =- 0,045R + 0,032G + 0,186B

En este caso ha sido necesario proyectar 0,045 unidades tricromáticas de R en el campo de prueba para lograr la igualación, por eso aparece como un valor negativo en la ecuación.

La mezcla de luces puede expresarse en términos de una ecuación lineal porque cumple las propiedades de homogeneidad y superposición. La superposición supone que si a ambos lados de la ecuación se suma una constante, la igualación persiste. Esta propiedad suele conocerse con el nombre de ley aditiva de Grassmann en honor al investigador que la descubrió. La homogeneidad supone que una igualación persiste si ambos términos de la ecuación se multiplican por una constante. Aunque esté implícitamente supuesto, es conveniente caer en la cuenta de que la mezcla de colores también tiene las propiedades simétrica y transitiva8

1.5 .3. El diagrama de cromaticidad

Dado que en toda mezcla de luces, la cantidad de luz en la mezcla es igual a la suma de las cantidades de cada luz primaria y la apariencia de la mezcla no depende de los valores triestímulo absolutos, se puede definir un sistema de coordenadas basado en la contribución proporcional de cada luz primaria al total de la mezcla. Por ejemplo, la proporción de R a la mezcla viene dada por la ecuación:

r = R 1 (R + G + B)

de igual manera puede determinarse la proporción de G y de B. A los valores r, g y b que representan la contribución proporcional de cada luz primaria a la mezcla se les llama coordenadas de cromaticidad. Un sistema de representación de los colores basado en coordenadas de cromaticidad puede utilizar solamente dos coordenadas ya que el valor de la tercera coordenada viene determinado por la diferencia entre uno y la suma de los valores de las dos coordenadas que se utilizan en la representación bidimensional. Éste es el caso del diagrama de cromaticidad de la CIE que aparece en la Figura 2.5.

Este diagrama está basado en el sistema X Y Z cuyos valores primarios no corresponden a un conjunto particular de luces primarias sino que son transformaciones lineales del sistema R G B. Estas transformaciones se hicieron con el propósito de tipificar la representación y teniendo en cuenta una serie de ventajas, entre ellas la de que los valores triestímulo fueran todos positivos.

8. La propiedad simétrica implica que si el estímulo A iguala el color del estímulo B entonces el estímulo B iguala el color del estimulo A. La propiedad transitiva implica que si el estimulo A iguala al B y B iguala C entonces el estímulo A iguala C.


-8

Longitud de onda dominante A_ , -7

-6

500

-5 Pureza de excitación

Pe=-a-a+b

y -4

-3

-2

o -1 -2 -3 -4 -5 -6 -7 -8

X

FIGURA 2.5. Diagrama de cromaticidad de la Comisión Internacional de la Iluminación (CIE).

71

En la Figura 2.5, puede verse que las coordenadas X e Y son suficientes para construir un sistema de representación de todos los colores. En el perímetro de la línea curva continua se representan las distintas longitudes del espectro luminoso con sus correspondientes matices de color en el grado máximo de pureza de excitación. La línea recta que une el punto de los 400 nm con el de los 700 nm corresponde a la zona de colores púrpura que no son espectrales. En el centro del diagrama se sitúa la zona de colores acromáticos con el punto D correspondiente al valor del estímulo acromático que sirve de referencia al sistema de unidades tricromáticas utilizado9

• Para los colores situados dentro del diagrama de cromaticidad puede determinarse su longitud de onda dominante, si la tienen, así como su pureza de excitación. La longitud de onda dominante de un estímulo de color está correlacionada con el matiz perceptivo del mismo. En el diagrama de cromaticidad se puede determinar mediante una línea que, trazada desde el punto de referencia D y pasando por el punto correspondiente al color que se quiere determinar

9. Por ejemplo en el sistema de 1931 de la CIE se ha utilizado como referencia el punto D

65 cuyas coordenadas son: X= 0,3127 e Y= 0,3290.


(Q), corte el perímetro del diagrama. El punto de intersección determina la longitud de onda dominante (A,d). La pureza de excitación está correlacionada con la saturación y es fácil de entender por referencia a la recta mencionada en la definición anterior. La pureza de excitación es el cociente entre la distancia desde el punto de referencia D al punto correspondiente al color (Q) y la distancia de la recta que une D con A,d pasando por Q. La pureza de excitación es cero cuando D y Q coinciden y alcanza el valor de 1 cuando Q y A,d coinciden.

El diagrama de cromaticidad nos permite también determinar los pares de colores complementarios10

, que son aquellas parejas de colores que, mezcladas en proporciones adecuadas, producen una igualación con un color acromático determinado (el de referencia, que en este caso es el blanco). En el diagrama de cromaticidad, los puntos opuestos del perímetro que están unidos por una recta que pasa por el punto de referencia D, determinan longitudes de onda que son complementarias. No todas las longitudes de onda tienen complementaria. Como puede verse en el diagrama de la Figura 2.4, los estímulos de color de longitudes de onda comprendida entre aproximadamente 493,3 y 566,5 no tienen complementario. El punto opuesto a estas longitudes de onda en el diagrama cae en la recta de los colores púrpura que no son colores espectrales.

1.6. La mezcla de pigmentos

Lo que se ha expuesto hasta este momento se ha referido exclusivamente a la mezcla de luces de colores. Como hemos visto, en este tipo de mezcla la resultante de la mezcla es igual a la suma de la cantidad de luz de las luces primarias, por ello se llama también mezcla aditiva de colores. Sin embargo no toda mezcla de colores es aditiva. Hay situaciones en que la resultante de una mezcla no es aditiva respecto a sus componentes. El caso más frecuente de mezcla no aditiva es la mezcla de pigmentos, tal como la puede llevar a cabo un pintor en su paleta. En este caso la mezcla suele llamarse sustractiva porque hay que tomar en consideración las longitudes de onda que son absorbidas y las que son reflejadas por los pigmentos. Por ejemplo, un pigmento azul absorbe longitudes de onda largas y refleja las cortas que son las que le proporcionan la apariencia azul. Por el contrario, un pigmento amarillo absorbe longitudes de onda cortas y refleja longitudes de onda largas. En la mezcla de ambos pigmentos, el azul absorbe las largas y el amarillo las cortas por lo que en la mezcla las longitudes de onda más reflejadas son las medias, que producen una sensación verde. Este resultado es la consecuencia de una

10. Técnicamente longitud de onda complementaria se define como la longitud de onda del estimulo monocromático que, cuando se mezcla aditivamente en proporciones adecuadas con el estímulo en consideración, produce una igualación con un color acromático determinado (el de referencia).


supresión de longitudes de onda provocada por la reflectancia particular de cada pigmento. En una mezcla de luces, realizada en las debidas proporciones, la mezcla de azul y amarillo hubiera producido un efecto gris ya que azul y amarillo son colores complementarios.

2. TRICROMATICIDAD

La experimentación con mezcla de luces que hemos estudiado, fue el fundamento más sólido de la teoría tricromática del color. Esta teoría fue propuesta en 1777 por George Palmer e independientemente vuelta a descubrir por Thomas Young en 1802. La teoría fue posteriormente elaborada por Maxwell y Helmholtz y suele ser conocida como la teoría tricromática de Young y Helmholtz. En su vertiente psicofísica, la teoría defendía que las sensaciones de color fundamentales eran tres: rojo, verde y azul. En su vertiente fisiológica, mantenía la existencia de tres tipos de receptores especialmente sensibles a diferentes longitudes de onda. Según Helmholtz, cada uno de los receptores respondía preferentemente a un tipo de longitud de onda, uno a las cortas, otro a las medias y otro a las largas. No obstante, cada uno de ellos era diferencialmente sensible a un rango de longitudes de onda amplio, por lo que se daba un cierto grado de solapamiento entre las distribuciones de sensibilidad de los tres receptores. Cada uno de los receptores, considerado de forma aislada, era ciego al color; sin embargo, debido al solapamiento de las funciones de sensibilidad, cualquier longitud de onda era capaz de estimular de forma diferente a cada receptor. El patrón de activación producido en los receptores por las distintas longitudes de onda era el responsable directo de la experiencia de color.

La teoría tricromática tenía a su favor un gran conjunto de resultados provenientes de experimentos de mezcla de luces como los que hemos estudiado anteriormente. Además es una teoría que explica bien las deficiencias cromáticas. Por último, la fisiología actual nos permite afirmar que, en el nivel de los receptores, la codificación del color tiene lugar de acuerdo con los postulados fundamentales de la teoría tricromática. Veamos estos dos últimos puntos con más detenimiento.

2.1. Las deficiencias cromáticas

Existen varios tipos de deficiencias en la percepción del color. En muy raros casos se produce una verdadera ceguera al color -acromatopsia- que reduzca la visión a la dimensión de claridad en la gama de blancos, grises y negros. Las personas que la padecen no necesitan más que una luz primaria en un experimento de igualación ya que sólo pueden basar su discriminación en la dimensión de brillo-claridad.


Más frecuente es la dicromatopsia. Quien la padece sólo tiene dos de los tres tipos de receptores del color, por lo que un dicrómata sólo necesita utilizar dos luces primarias para igualar una luz de prueba en un experimento de igualación de colores. Dependiendo del tipo de receptor que falte, pueden presentarse tres tipos de dicromatopsia. Los protanopas carecen de receptores de onda larga. Si una luz roja se hace más brillante que una luz verde, el protanopa confundirá estos colores. Los deuteranopas carecen de receptores de onda media. Esta deficiencia es más común que la protanopia y afecta también a la discriminación entre el verde y el rojo 11 • La apariencia del color para protanopas y deuteranopas es similar, las longitudes de onda cortas tienden a aparecer azules y las largas tienden a aparecer amarillas. En medio de estas dos bandas hay un punto acromático de color gris que permite discriminar a protanopas de deuteranopas ya que para los primeros tiene lugar en los 492 nm y para los segundos en los 498 nm. Los tritanopas carecen de receptores de ondas cortas y son poco frecuentes entre la población (1 entre 20.000 personas). La apariencia que toman los colores para el tritanopa es de verde para las longitudes de onda cortas y rojo para las largas. El punto gris de neutralidad cromática lo presentan en los 570 nm.

Existen otros tipos de anomalías llamadas tricromáticas que no son debidas a la falta de un tipo determinado de receptor sino a un funcionamiento anómalo de los receptores. Quienes las padecen pueden igualar cualquier color con una mezcla de tres luces primarias pero la mezcla difiere de la utilizada por las personas consideradas normales.

A lo largo de la historia de la investigación del color el estudio de las deficiencias cromáticas influyó poderosamente a favor de la teoría tricromática. No obstante, la evidencia determinante a favor de la teoría la aportó la investigación directa de los receptores.

2.2. Fisiología de los fotorreceptores

A mediados del siglo veinte la investigación fisiológica fue capaz de aislar y extraer el fotopigmento de los bastoncillos llamado rodopsina. Cuando este fotopigmento es expuesto a la luz, sufre una serie de modificaciones químicas que acaban produciendo un cambio gradual en el potencial de membrana. Una característica de todo este proceso es que no cambia a pesar de que cambie la longitud de onda que es absorbida. Es decir, aunque los cuantos de longitud de onda corta poseen más energía que los cuantos de longitud de onda larga, la secuencia de reacciones es la misma cuando se absorben unos

11. En general se conoce con el nombre de daltonismo a la imposibilidad de discriminar entre el rojo y el verde. El nombre de la deficiencia proviene de John Dalton, físico y químico británico que puso los fundamentos de la teoría atómica. Dalton sufrió la deficiencia, la describió y donó sus ojos a la investigación científica, lo que ha permitido determinar que Dalton era deuteranopa.


que cuando se absorben otros. A esta propiedad se le da el nombre de univarianza (Rushton, 1965) significando con ello que el fotopigmento establece una correspondencia entre toda la gama de longitudes de onda del espectro visible y un único tipo de output que es la tasa de absorción. La respuesta de la rodopsina no codifica información alguna sobre la composición espectral de la luz y por ello no somos capaces de discriminar luces de diferente color en condiciones de visión escotópica. Obsérvese que univarianza no significa que la rodopsina absorba de igual forma todas las longitudes de onda; no es así, de hecho es más sensible a las longitudes de onda media que a las bajas o altas, como se ha visto antes en la función de sensibilidad escotópica. Univarianza significa que, una vez absorbidos, los cuantos de cualquier longitud de onda tienen el mismo efecto visual.

La propiedad de univarianza permite establecer una relación entre la tasa de absorción del fotopigmento y los resultados de un experimento de igualación escotópica comparando la funcion de absorción de la rodopsina con la función de sensibilidad espectral escotópica. Wald y Brown (195 6) hicieron esa comparación y comprobaron que el grado de solapamiento entre ambas es prácticamente perfecto. Resultados como éste permiten establecer que la tasa de absorción de la rodopsina es el fundamento biológico de la igualación escotópica.

Con respecto a los conos, la investigación de los fotopigmentos ha sido más complicada y no han podido ser aislados hasta hace unos años por procedimientos de ingeniería genética (Merbs y Nathans, 1992). No obstante, utilizando una gran variedad de procedimientos, hace tiempo que se había establecido la existencia de tres tipos de conos que presentan una sensibilidad diferente a las distintas longitudes de onda. Unos conos muestran mayor capacidad de absorción para las longitudes de onda corta, por lo que son llamados conos S; tienen una sensibilidad máxima en torno a los 440 nm12 • Otro grupo de conos M muestra mayor capacidad de absorción para las longitudes de onda medias, con un máximo en torno a los 530 nm. El tercer grupo de conos L es más sensible a las longitudes de onda largas y su pico máximo se sitúa en torno a los 5 60 nm 13 • Los conos L son los más abundantes en la retina humana, son aproximadamente el doble que los conos M. Los más escasos son los conos S que vienen a representar entre el cinco y el diez por ciento de la población de conos. Según la opinión de Rusell y Karen De Valois (De Valois & De Valois, 1993) la razón entre los conos L, M y S viene a ser aproximadamente de 10 : 5 : 1.

12. Las referencias numéricas están basadas en Schnapf, Kraft & Baylor (1987). 13. Aunque hay acuerdo en que existen tres tipos diferentes de conos, las investigaciones

más recientes plantean la posibilidad de que el número de pigmentos sea mayor. En particular, es posible que los conos L posean dos tipos de pigmentos con máximos de sensibilidad ligeramente diferentes y que algo parecido ocurra con los conos M (Neitz, Neitz & Jacobs, 1991).

76

ro 100 > :.¡::::; ro ~ e

·O -~ o en

..0 <(

50

PERCEPCIÓN VISUAL

440 530 560 nm.

400 450 500 550 600 650

Longitud de onda (nm.)

FIGURA 2.6. Curvas de absorción relativa de cada uno de los receptores cromáticos.

La Figura 2.6 presenta la absorción relativa de cada uno de los tres tipos de conos. Como puede verse, existe solapamiento entre las distribuciones de absorción de cada uno de ellos aunque el solapamiento es mucho mayor entre las distribuciones de los conos M y L. La Figura 2.6 también pone de manifiesto que, ante una misma longitud de onda, la respuesta de cada tipo de cono es diferente. En general, el funcionamiento de los tres tipos de conos es parecido a lo que Helmholtz había anticipado aunque los detalles de las funciones de absorción son diferentes.

3. PROCESAMIENTO OPONENTE

En el siglo XIX, los investigadores de la percepción con una orientación fenomenológica, siempre concedieron una gran importancia a la forma en que los colores aparecen en nuestra experiencia consciente. Varios fenómenos relacionados con la percepción del color encontraban difícil acomodo en la teoría tricromática. Vamos a estudiarlos a continuación.


3.1. Fenómenos que cuestionan la teoría tricromática

a) Tareas de clasificación de colores. Hering observó que, cuando se pedía a los sujetos el agrupamiento de un conjunto de fichas de diferentes colores, el número de categorías más frecuentemente utilizado era cuatro: rojo, verde, azul y amarillo. Si los colores fundamentales fueran tres, ¿por qué se utilizaba el amarillo como categoría independiente de las otras tres?

b) Combinaciones de colores. Aunque la teoría tricromática es capaz de predecir el resultado de la mezcla de luces, no es capaz de explicar por qué no podemos tener experiencia de determinadas combinaciones. Por ejemplo, el púrpura es un color que parece ser rojo y azul, el naranja responde a una mezcla de rojo y amarillo, pero no existe experiencia de colores que respondan a combinación de rojo y verde o de azul y amarillo 14

•

e) Deficiencias cromáticas. Anteriormente hemos hablado de las deficiencias cromáticas y hemos visto que guardan una relación estrecha con la falta de determinados fotorreceptores, sin embargo también decíamos que, por ejemplo, la experiencia visual de un protanopa es semejante a la de un deuteranopa. La pérdida de la experiencia de color no ocurre de forma individualizada para cada uno de ellos, sino que tiene lugar por pares, y los emparejamientos no son arbitrarios sino que afectan al par rojo-verde o al par azul-amarillo.

d) Posefecto de color. Si un observador fija su vista en una superficie coloreada durante cierto tiempo y, a continuación, cambia su mirada a una superficie blanca, esta superficie adquirirá la apariencia del color oponente al que tenía la primera superficie.

Fije su mirada en el punto negro central de la Figura 2.7.a (p. 98) durante unos treinta segundos procurando que los ojos no se muevan del punto de fijación. A continuación traslade su mirada a la zona blanca de la derecha de la figura (Figura 2. 7 .b ). Observará que la superficie blanca adquiere las to

nalidades de los colores oponentes. Este fenómeno se conoce con el nombre de posefecto de color y está íntimamente relacionado con el fenómeno de adaptación cromática que consiste en la perdida de sensibilidad para un determinado matiz como consecuencia de una exposición repetida a ese mismo matiz.

Fenómenos como estos llevaron a muchos autores a defender la existencia de más de tres colores fundamentales. Por ejemplo, Ernst Mach, famoso físico y filósofo austriaco, propuso la existencia de seis colores fundamentales: rojo, verde, azul, amarillo, blanco y negro. Sin embargo, la teoría que se opuso con más fuerza a la teoría tricromática fue la de Ewald Hering.

14. Recuérdese que la asociación del verde con la mezcla de azul y amarillo responde a una experiencia basada en la mezcla de pigmentos, no en la mezcla de luces.


3 .2. Teoría de Hering

Hering, siguiendo a Mach, sostuvo la existencia de seis colores fundamentales, relacionados en pares amarillo-azul, rojo-verde y blanco-negro. Sin embargo, su teoría de los receptores defendía la existencia de tres sistemas retinianos, por lo que el número de receptores postulados no era diferente del postulado por la teoría tricromática. La diferencia fundamental radicaba en la forma de entender el funcionamiento de esos mecanismos. Para Hering, cada receptor estaba preferentemente dedicado al procesamiento de un par de colores oponentes y la respuesta de los receptores no era monofásica (excitatoria), sino bifásica (excitatoria e inhibitoria). Hering asumió la existencia de tres sustancias visuales en la retina, cada una capaz de experimentar un cambio químico en una de dos direcciones antagónicas. Hering llamó a estos cambios asimilación y desasimilación y relacionó la fase de asimilación de cada sustancia con la codificación del azul, el verde y el negro, y la fase de desasimilación con la codificación del amarillo, el rojo y el blanco respectivamente, de forma que en cada uno de los tres pares, amarillo-azul, rojo-verde, y blanco-negro el primer miembro del par estaba asociado con la desasimilación y el segundo con la asimilación.

Durante mucho tiempo los teóricos del color se dividieron entre partidarios de la teoría tricromática y partidarios de la teoría de procesos oponentes. Hasta mitad del siglo xx, la teoría preferida fue la teoría tricromática, aunque ya en 1905 von Kries y posteriormente Müller y Schrodinger manifestaron que las dos teorías no tenían por qué ser incompatibles. Ambas podían ser correctas pero en fases diferentes del procesamiento del color. Sin embargo, para la gran mayoría de los investigadores aceptar una teoría de doble proceso resultaba una complicación excesiva y una innecesaria violación del principio de economía explicativa. No obstante, los trabajos de Hurvich y Jameson (1957) abrieron definitivamente la puerta a una teoría de doble proceso.

3.3. Teoría de Hurvich y Jameson

Hurvich y Jameson utilizaron un procedimiento psicofísico conocido como experimento de cancelación de matiz. En este tipo de experimento, se pide al observador que juzgue si una luz de prueba tiene apariencia, por ejemplo, rojiza o verdosa. Si la apariencia es rojiza, el observador debe añadir luz verde hasta cancelar la impresión de luz rojiza. Si aparece verdosa, la luz que debe añadir es la roja. La idea central en el procedimiento consiste en la cancelación mutua de los matices oponentes de forma que, una vez que el matiz rojo o verde de la luz de prueba ha sido cancelado, la luz de prueba, más la luz añadida para cancelar, adquiere una tonalidad amarilla, azul o gris. El procedimiento es el mismo para cancelar los matices azulados o amarillentos, se utiliza luz amarilla para cancelar el azul y luz azul para cancelar la amarilla.


La Figura 2.8 (p. 97) muestra la valencia cromática del espectro visual obtenida mediante la aplicación de este método. En la parte A de la figura se representa la fuerza del par azul-amarillo. En las longitudes de onda cortas -valores menores de 5 00 nm aproximadamente- predomina el matiz azulado, mientras que en las largas -por encima de 500 nm- predominan los matices amarillentos15

. En el apartado B de la figura se representa la fuerza del par rojo-verde. Obsérvese que el matiz rojo está presente en las longitudes de onda cortas aunque en menor medida que en las largas; en las longitudes de onda medias predomina exclusivamente el verde. El apartado e representa la superposición de las funciones anteriores con la particularidad de que, para acentuar el carácter oponente de cada par de colores, se ha dado a los matices azul y verde valores negativos. Se trata solamente de una convención que no debe hacernos olvidar que los valores de las luces utilizadas son siempre positivos.

Sobre la base de estos datos psicofísicos, Hurvich y Jameson propusieron una teoría de la codificación del color de dos fases que reconciliaba la teoría tricromática de Helmholtz con la teoría de los procesos oponentes de Hering. La teoría tricromática era fundamentalmente correcta en el nivel de los receptores puesto que solamente existían tres tipos de fotorreceptores en la retina que se activaban en distinto grado ante cada longitud de onda. Sin embargo, en una segunda fase se producía una nueva codificación en términos de procesos oponentes de forma que determinados mecanismos cerebrales codificaban el par rojo-verde mientras otros mecanismos codificaban el par azul-amarillo. Hurvich y Jameson postularon además la existencia de un tercer mecanismo no oponente para el par blanco-negro encargado de procesar la claridad.

El modelo de Hurvich y Jameson estaba fundamentado en los datos psicofísicos procedentes de experimentos de cancelación de matices. En la más pura tradición de la psicología experimental, postulaba la existencia de determinados mecanismos neuronales para explicar los datos psicofísicos, pero no estaba apoyado en evidencia fisiológica directa. No obstante, la influencia de sus investigaciones fue grande y dieron un fuerte impulso a la investigación fisiológica del color.

15. En la Figura 2.8 apartados A y B, el color de los círculos hace referencia al color de la luz de cancelación. Debe tenerse en cuenta que la valencia cromática azul de cada longitud de onda se ha calculado mediante la cantidad de luz amarilla que ha sido necesaria para cancelar el matiz azulado de esa longitud de onda. Igualmente la valencia cromática amarilla se ha calculado mediante la cantidad de luz azul necesaria para cancelar el matiz amarillo. Así, las longitudes de onda inferiores a 500 nm han sido mezcladas con luz amarilla para poder ser canceladas, mientras que las superiores a 500 nm han sido canceladas con luz azul. De la misma forma debe interpretarse el gráfico de la Figura 2.8, B, para el par rojo-verde. El color de los círculos en el apartado C designa directamente la valencia cromática para el rojo y el amarillo con valor positivo y para el verde y el azul con valor negativo.


3.4. Investigaciones de DeValois

Las ideas de Hurvich y Jameson, y en consecuencia la teoría de los procesos oponentes, encontraron apoyo fisiológico en las investigaciones de Rusell DeValois y sus colaboradores (De Valois, R. L., Smith, C. J, Kitai, S. T. & Karoli, S. J., 1958. De Valois 1965. De Valois, Abramov, y Jacobs, 1966). Estos investigadores descubrieron en el núcleo geniculado lateral (NGL) del tálamo de primates, células que respondían selectivamente al color de una forma similar a la postulada por la teoría de los procesos oponentes. Unas células eran activadas por la luz roja e inhibidas por la luz verde y otras respondían de forma opuesta, se activaban ante la luz verde y eran inhibidas por la luz roja. Lo mismo ocurría para el par azul-amarillo. Una células eran activadas por la luz azul e inhibidas por la amarilla, mientras que otras presentaban el patrón opuesto. Además encontraron células no oponentes, algunas de las cuales eran excitadas por cualquier tipo de longitud de onda e inhibidas por la ausencia de luz y otras que eran activadas por la ausencia de luz e inhibidas por su presencia. En conjunto, las células descubiertas por De Valois y colaboradores presentaban un patrón de codificación del color que estaba de acuerdo con la teoría de los procesos oponentes. Estos resultados, junto con los tres tipos de fotorrectores del color, proporcionaron un impulso definitivo a las teorías duales de procesamiento del color como la propuesta por Hurvich y Jameson.

3.5. Avances recientes

Con posterioridad a los descubrimientos de De Valois que acabamos de ver se han producido avances importantes tanto de carácter empírico como teórico.

3.5.1. Investigación empírica

Desde el punto de vista empírico, la investigación fisiológica descubrió muy pronto que el procesamiento oponente del color no tenía su comienzo en el núcleo geniculado lateral del tálamo, sino que se iniciaba ya en la retina, concretamente en el nivel de las células bipolares y ganglionares. De hecho, la especialización de las vías nerviosas en lo referente a la transmisión de la información cromática se inicia ya en las células bipolares y ganglionares y continúa hasta la corteza a través de, al menos, tres vías diferentes:

l. La vía P tiene su origen en las células bipolares enanas y deja la retina a través de las células ganglionares del mismo nombre 16

• Este grupo de células

16. Las células ganglionares enanas son las más numerosas, representando aproximadamente el 80o/o de las células ganglionares. Estas células conducen la información de forma relativamente lenta (unos 6 m/s) y disparan de forma sostenida mientras el estímulo está presente.


comprende tanto neuronas de centro on como neuronas de centro off y tanto las unas como las otras contactan con un único cono L y M en el centro de la fóvea 17

• Los conos S, que son menos abundantes que los L y M, parece que solamente hacen contacto con bipolares enanas de centro off. Para todas estas células el contorno oponente al centro parece estar controlado por señales procedentes de una mezcla de los otros tipos de conos. Las células ganglionares envían la información a las capas parvocelulares del núcleo geniculado lateral que a su vez la proyecta sobre la capa 4Cb de la corteza visual primaria. La vía P es la principal portadora de información sobre el color.

2. La vía M. Tiene su origen en las células bipolares difusas que envían su información a las células ganglionares parasoP8• Estas células contactan preferentemente con grupos de bastoncillos y con grupos de conos L y M que contribuyen de forma conjunta, por lo que las células no pueden proporcionar una base para discriminar entre diferentes longitudes de onda. Las células parasol envían su información a las capas magnocelulares del núcleo geniculado lateral que desde allí se proyecta sobre la capa 4Ca y 4B de la corteza visual primaria. Aunque no envía información cromática diferenciada, esta vía proporciona la principal información que determina las funciones de luminosidad escotópica y fotópica.

3. La vía K. Ha sido la última de las vías claramente diferenciada. Se ha podido rastrear su origen en unas células ganglionares llamadas pequeñas biestratificadas que poseen un centro on activado por un cono S y un contorno inhibitorio que recibe información de conos L y M. Estas células ganglionares proyectan su información sobre las capas K19 del núcleo geniculado lateral y desde allí a la zona de las gotas (blobs) en las capas 2 y 3 de la corteza visual primaria. Esta vía transmite hasta la corteza información oponente relacionada con los conos S por lo que parece razonable pensar que está preferentemente relacionada con la codificación del par de colores azul-amarillo.

3.5.2. Elaboración teórica

Desde un punto de vista teórico, el interés de la investigación se ha centrado en la construcción de modelos que, siendo fieles a los descubrimientos empíricos obtenidos, puedan explicar la forma en que la codificación tricromática que tiene lugar en los receptores, se transforma en una codificación en pares

17. Fuera de la fóvea las células bipolares enanas reciben información de más de un cono y no parecen distinguir a los L de los M.

18. Las células ganglionares parasol, llamadas así por el parecido con una sombrilla que le da la distribución de sus dendritas, constituyen aproximadamente un 10% de las células ganglionares, su velocidad de conducción es mayor (unos 15 m/s) que la de las ganglionares enanas y responden a la estimulación con un disparo rápido y transitorio del potencial de acción.

19. Las capas K o koniocelulares están situadas entre las parvocelulares y las magnocelulares en el núcleo geniculado lateral.


de colores oponentes y, en última instancia, en la experiencia de color tal como aparece en nuestra consciencia. Son muchos los modelos que se han hecho, pero quizás uno de los más influyentes ha sido el propuesto por los DeValois (DeValois & DeValois, 1993) que veremos a continuación.

El modelo que han propuesto los DeValois es un modelo de cuatro fases que tienen lugar en zonas diferentes de los centros nerviosos relacionados con el procesamiento visual del color.

l. La primera fase tiene lugar en el nivel de los receptores y es de naturaleza tricromática. Tenemos tres tipos de receptores del color diferencialmente sintonizados a longitudes de onda largas (conos-L), longitudes de onda media (conos-M) y longitudes de onda corta (conos-S) . La proporción de conos L: M:S es 10:5 :1.

2. La segunda fase es de naturaleza oponente y tiene lugar en la retina y en el núcleo geniculado lateral del tálamo. En la retina, una red neuronal formada por las conexiones e interacciones de los fotorreceptores con las demás células retinianas (bipolares, horizontales, ganglionares y amacrinas) da origen a seis tipos de células ganglionares enanas oponentes. Tres de ellas, llamadas L , M y S 20 , tienen un centro activado directamente por conos o o o

L, M y S respectivamente y un contorno que en todas ellas es inhibido por influencias indirectas provenientes de conos L + M + S. Así, la información que converge en una célula Lo puede representarse como L - (LMS), la que converge en M o como M - (LMS) y la de So como S - (LMS). Las otras tres enanas oponentes, -Lo'-Mo y -S

0 tendrían una organización on off opuesta a

las anteriores ya que sería inhibidas en su centro por conexiones directas con conos L, M y S y excitadas en su contorno por las influencias indirectas de conos L+ M + S. La representación de la información convergente sobre cada una de estas células sería -L + (LMS), -M + (LMS) y -S + (LMS). Estos seis tipos de células ganglionares enanas mandan la información al núcleo geniculado lateral (NGL) a través de la vía P. En la retina tiene lugar también la codificación de la información que se transmite por la vía M pero no nos detendremos en ella ya que el modelo de los De Valois se centra en la información transmitida por la vía P21

• A partir de ahora nos centraremos exclusivamente en la vía P.

En el núcleo geniculado lateral del tálamo tiene lugar una organización más precisa del contorno de las unidades acentuando la naturaleza oponente de las mismas. Así, las células con un centro relacionado con un cono L reciben en su contorno un input antagonista proveniente exclusivamente de conos M y viceversa. En este nivel las células adquieren una estructura que

20. El subíndice o significa oponente. 21. El modelo de DeValois y DeValo is (1 993) no toma en consideración la aportación de

la vía K cuya existencia se ha establecido con posterioridad a la formulaci ó n del mismo. No obstante, el descubrimiento de la vía K sólo obligaría a introducir pequeñas modificaciones en el modelo dado el papel que éste encomienda a las unidades So y -\·


puede representarse así: L0

como L - M, -L0

como -L + M, M0

como M - L, -M como -M + L, S como S - LM, y -S como -S + LM. Por tanto, en este

o o o nivel la codificación del color adquiere un carácter claramente oponente en su estructura centro-contorno. Esta organización proporciona a las células del NGL la posibilidad de responder tanto a variaciones en el color como a variaciones en la luminancia de los estímulos. Esta idea se puede entender mejor examinando la Figura 2.9.

Mapa de input de cono Lo

/

Campo receptivo de luminancia

Campo receptivo de color

FIGURA 2.9. Organización funcional respecto al color en las células del núcleo geniculado lateral (NGL) del tálamo.

En la parte izquierda de la figura se puede ver la estructura centro-contorno de una célula Lo que tomamos como ejemplo. Dependiendo del tipo de estimulación que incide sobre esta célula, el campo receptivo de la misma puede ser de dos formas diferentes. Si la célula es estimulada por una luz acromática blanca, que contiene todas las longitudes de onda, la respuesta de la célula será excitatoria en su centro e inhibitoria en su contorno, es decir la respuesta ordinaria de una célula on-off a los cambios de luminancia. Esto es lo que aparece en la parte superior derecha de la figura. Sin embargo, si la luz que incide sobre la célula es roja, entonces el centro L responderá hasta su máximo posible mientras que el contorno -M, al no ser sensible a la luz roja, no producirá inhibición. El resultado será un campo receptivo uniforme respecto al color.


3. La tercera fase es la fase principal para el modelo pues en ella se produce la separación de la información referente al color de la información correspondiente a la luminancia y también tiene lugar la organización del código del color en un espacio tridimensional siendo estas dimensiones los pares rojo-verde, amarillo-azul y blanco-negro. Estos dos problemas se resuelven mediante combinaciones particulares de la información que proporcionan las células del NGL que hemos visto en la fase anterior y tiene lugar en la corteza visual.

La separación del color y la luminancia se puede entender considerando las propiedades de las células ejemplificadas en la Figura 2.9 . Supongamos, por ejemplo, que combinamos el output de una célula Lo con el de una -M

0

cuyo centro es inhibido por longitudes de onda medias y cuyo contorno es activado por las longitudes de onda largas. Como hemos visto antes, la célula Lo tiene un campo receptivo de centro excitatorio y contorno inhibitorio (onoff) en respuesta a los incrementos de luminancia, y tiene un campo uniforme excitatorio de color (rojo) en respuesta a los cambios hacia las longitudes de onda largas. En estas mismas situaciones de estimulación, la célula -M

0

responde a los incrementos de luminancia con un centro inhibitorio y un entorno excitatorio (off-on) y a la luz roja con un campo homogéneo del mismo color que el producido por Lo ya que su centro inhibitorio no se ve afectado por las longitudes de onda largas. El resultado de la combinación de Lo y -M

0

puede deducirse fácilmente dado el carácter lineal del modelo. Con respecto a los incrementos de luminancia los dos campos receptivos (on-off y off-on) se anularán mutuamente. Con respecto a la estimulación de luz roja las dos células sumarán sus respectivos campos receptivos. El resultado final de esta combinación es la producción de unidades de procesamiento que son ciegas a la luminancia pero sensibles al color.

Consideremos ahora la combinación del output de una célula L0

con una célula Mo que tiene un centro excitatorio para las longitudes de onda medias y un contorno inhibitorio para las largas. En este caso la respuesta a incrementos en luminancia será on-off para ambas produciéndose la suma de los campos receptivos. Sin embargo, la respuesta a la luz roja será excitatoria en L e inhibitoria en M produciéndose así la cancelación del color. El resultado

o o

final de esta combinación es la producción de unidades que son ciegas al color pero sensibles a la luminancia.

Resumiendo, la integración de la información procedente de Lo y - Mo suma color y cancela luminancia mientras que la de Lo y + Mo suma luminancia y cancela color. Lo mismo puede decirse para Mo y - L

0 y para M

0 y +

L El resultado final consigue separar el procesamiento del color del procesa~~ento de la luminancia.

La organización del espacio tridimensional de los procesos oponentes es el resultado de añadir el output de las células So y -S

0 a las combinaciones que

acabamos de estudiar22 •

22. El modelo supone que en este nivel la contribución del sistema S, formado por\ y -50


G + 8 +G) -Luz

+ + 8 + 8 + (9 -Oscuridad

+yl~ +y~ G 8 8 G

¡ ¡ ¡ Rojo Amarillo Verde Azul

FIGURA 2.1 O. Diagrama completo de la fase final del modelo propuesto por los DeValois. Fuente: Reproducción de la figura 6 de Vision Research. 33, 8. Russell L. DeValois & Karen K. DeValois. A multi-stage color model, pp.1 053-1066. © 1993.

Reproducida con autorización de Elsevier.

La Figura 2.10 representa el diagrama completo del modelo propuesto por los DeValois. Las líneas horizontales del diagrama representan combinaciones que cancelan el color y codifican la luminancia, una dando lugar a acromáticos claros y otra a acromáticos oscuros. Las líneas verticales del diagrama representan las combinaciones particulares que llevan a la codificación de los cuatro colores fundamentales que forman los dos pares oponentes cromáticos: rojo, amarillo, verde y azul. El diagrama pone de manifiesto también los supuestos fundamentales del modelo. En esencia, los De Valois proponen que a lo largo de la vía P, el eje predominante en la codificación del color es el formado por las células que reciben en el centro de sus campos receptivos inputs que provienen de los conos L y M. El papel del sistema oponente S es romper esa predominancia cuando la información llega a la corteza visual modulando la actividad del sistema L M de dos formas diferentes que dan lugar a los ejes rojo-verde y amarillo-azul. Así pues, los tres sistemas oponentes L M y S participan en la codificación de los colores pero L y M son los principales. Incluso en la codificación del azul, la contribución de Mo es mayor que la de S

0

23 •

es dos veces mayor que la que tienen los conos S en la retina. Es decir, si los pesos en la retina para L:M:S son 10:5:1, en este nivel son 10: 5: 2.

23. Este aspecto del modelo es interesante porque en las teorías del procesamiento del color siempre ha sido un problema difícil de explicar que el color azul se pueda percibir tan vívidamente como cualquier otro color fundamental siendo los fotorreceptores S mucho más escasos que los L y M.


4. La cuarta fase y última en el modelo asume la existencia de células complejas que responden selectivamente a un color y no a otros. En opinión de los DeValois, estas células deben darse en zonas corticales posteriores a Vl y no tienen el carácter oponente que tienen las células que participan en las fases anteriores. Estas células complejas disparan a una determinada región espectral y no producen respuesta alguna a otras. Esto no significa que el procesamiento del color pierda su carácter oponente en esta fase, sino que el procesamiento es oponente entre células diferentes y no dentro de cada célula como lo era en las fases anteriores. Por ejemplo, aunque son células diferentes las que disparan al rojo y al verde, estas células nunca disparan las dos al mismo estímulo, cuando disparan las células sensibles al rojo no lo hacen las sensibles al verde y viceversa. Sin embargo, las células que disparan al rojo y las que lo hacen al amarillo, pueden disparar ambas ante el mismo estímulo.

El modelo de los DeValois es uno de los más completos e influyentes en la investigación actual y constituye una buena muestra de la complejidad que los actuales modelos de procesamiento del color van adquiriendo. Merece la pena destacar algunos de sus aspectos más interesantes. En primer lugar, el modelo muestra cómo la información cromática y la acromática pueden ser proporcionadas por los mismos mecanismos. El modelo asume que la información acromática, no sólo es conducida por la vía M sino también por la vía P. En segundo lugar, el modelo muestra cómo pueden surgir células especializadas en la respuesta a seis colores, organizados en tres pares oponentes, a partir de los tres fotorreceptores cromáticos. Además, el modelo proporciona una explicación aceptable de la calidad de la percepción de las longitudes de onda cortas a pesar de la escasez de receptores especialmente sensibilizados a las mismas. Finalmente, desde un punto de vista computacional el modelo es sencillo pues mantiene, a lo largo de sus principales fases, un funcionamiento lineal para todas las unidades de procesamiento. La investigación futura se encargará de ir estableciendo la consistencia de los principales supuestos del modelo.

4. LA CONSTANCIA DEL COLOR

Llegados a este punto, podría parecer que, con lo tratado hasta aquí, los aspectos más importantes del procesamiento del color han quedado cubiertos. De hecho, aún se escriben libros de texto sobre percepción que terminan el tema del procesamiento del color después de presentar la armonización actual de la teoría tricromática y la teoría de los procesos oponentes. Sin embargo, casi podríamos decir que la historia no ha hecho más que empezar. Obsérvese que las teorías que hemos tratado se han centrado en el procesamiento de estímulos muy sencillos, luces y superficies monocromáticas aisladas. La información que nos ha proporcionado la investigación con estos estímulos ha sido de gran valor, pero no es menos verdad que el estudio de la percepción


del color exige la consideración de estímulos más complejos y de fenómenos que no pueden ser explicados por las teorías que acabamos de estudiar.

A mediados del siglo XX, un físico, llamado Edwin Land, famoso por haber inventado la técnica fotográfica de revelado instantáneo y fundador de la Polaroid Corporation, irrumpió en el campo de la investigación del color con unas investigaciones que causaron un fuerte impacto en la comunidad científica (Land, 1959 a y b). Land, que había desarrollado su técnica para fotografía en blanco y negro, estaba investigando la forma de ampliarla para obtener fotografía en color. En el proceso, comprobó que los principios de la colorimetría, que hemos visto anteriormente, no le permitían predecir la apariencia de los colores. Uno de los experimentos que provocaron en él mayor sorpresa y mayor dedicación a la investigación fue el siguiente. Tomó dos fotografías en blanco y negro de una misma escena rica en colores, una de ellas la tomó a través de un filtro rojo, y la otra a través de un filtro verde. Después de hacer las correspondientes filminas, proyectó a través de un filtro rojo en una pantalla la imagen tomada con el filtro rojo y superpuso a esta imagen la segunda, que había tomado con el filtro verde, pero proyectada sin filtro, es decir, proyectada con luz blanca. Sobre la base de la mezcla de luces, era de esperar que el resultado de la superposición fuera una escena o roja, o blanca o un rosa intermedio entre las dos luces mezcladas. Para sorpresa de todos, Land observó que la superposición de las dos filminas reproducía toda la gama de colores presentes en la escena inicial, casi con la misma viveza que si se tratara de una fotografía ordinaria en color. La reacción de Land en contra de la teoría tricromática fue frontaJ24 pero el tiempo se ha encargado de demostrar que las observaciones de Land sólo ponen de manifiesto la insuficiencia de la teoría tricromática para predecir la apariencia de los colores aunque sea útil para predecir cuándo dos luces parecerán iguales.

Las observaciones de Land eran una demostración más de un fenómeno conocido como constancia del color. Nuestra vida cotidiana está llena de ex-

24. En su ataque a la teoría tricromática, Land llegó a afirmar la existencia de dos únicos receptores del color. Debe tenerse en cuenta que en aquel tiempo la investigación fisiológica sobre los fotorreceptores no había establecido aún de forma clara la existencia de tres fotopigmentos. El razonamiento de Land estaba fundamentado en la evidencia psicofísica proporcionada por sus experimentos. Por otra parte, la reacción de los principales investigadores del momento en la percepción del color dio lugar a réplicas encontradas Oudd, 1960; Walls, 1960). En general se criticó la pretendida originalidad de sus ideas argumentando que la dependencia de la apariencia del color del contexto era algo que venía siendo estudiado mucho antes de la publicación del artículo y se trató de explicar las observaciones de Land por relación a otros fenómenos más conocidos de la percepción del color tales como la adaptación cromática. Entre los investigadores del color no cayó nada bien ni el tono del artículo, ni las pretensiones de novedad con que había sido escrito ni la publicidad dada por algunos medios de comunicación a los trabajos de Land. Con todo, la influencia de estos trabajos ha sido grande no tanto por el valor final que su teoría pueda tener para explicar la apariencia del color, cuanto por la forma en que formuló el problema ya que anticipó una postura computacional al mismo (Marr, 1982).


periencias que ponen de manifiesto que la percepción del color no depende exclusivamente de la cantidad de luz que un objeto refleja, o de la longitud de onda reflejada por el objeto sino de un conjunto de factores que tienen que ver con la naturaleza del objeto y con el contexto en que aparecen los colores. Supongamos que a plena luz del sol, a mediodía, exponemos un trozo de carbón a los rayos del sol. Por mucha luz que refleje, el carbón continúa apareciendo negro. Si comparamos la cantidad de luz reflejada por el carbón al mediodía con la reflejada por una hoja de papel blanco al anochecer, podríamos comprobar que, en términos absolutos, la cantidad de luz reflejada por el carbón al mediodía es mayor que la del papel blanco al anochecer. Sin embargo el carbón continúa viéndose negro al mediodía y el papel continúa viéndose blanco al anochecer. Los colores de los objetos nos aparecen como una propiedad de los objetos que nos permite muchas veces reconocerlos como tales objetos, y esto no es posible si nuestra experiencia de color variara en función de las variaciones que sufre la luminancia de los objetos. Nuestro sistema visual responde a una característica intrínseca de los objetos, como es su reflectancia, y no a las cantidades absolutas de luz que llegan a la retina, pero ¿cómo puede conocer nuestro sistema visual la reflectancia de un objeto si lo único que llega a la retina es su luminancia?

La Figura 2.11 (p. 98) presenta dos casos de contraste simultáneo, uno acromático y otro cromático, que ponen de manifiesto la dependencia del contexto que tiene nuestra percepción del color. En la parte superior de la figura, los dos cuadrados de los extremos tienen exactamente las mismas propiedades físicas y por lo tanto provocan el mismo tipo de reacción local en los fotopigmentos de los receptores retinianos. Sin embargo, los dos cuadrados son percibidos con distinta claridad debido al gradiente de claridad que caracteriza al entorno. En la parte inferior de la figura, la distribución espectral de las dos «X>> es la misma y esto se puede observar si fijamos la vista en el punto donde ambas coinciden. A pesar de ello, el color de cada <<X>> es diferente, demostrando que la apariencia del color no depende de la estimulación local de los fotorreceptores sino de la estructura espacial de la imagen como un todo. Las filminas que Edwin Land superpuso en el experimento mencionado anteriormente son una demostración más dramática aún de que nuestro sistema visual no atribuye color a los objetos en función exclusivamente de la luz que los objetos reflejan sino teniendo en cuenta complejas relaciones de la escena como un todo. Este es el problema que vamos a estudiar a continuación. Para hacer más comprensible la problemática, estudiaremos primero la constancia acromática y a continuación la cromática.

4.1. La constancia de la claridad

Para entender el problema de la constancia de la claridad, debemos recordar los conceptos de iluminancia, luminancia y reflectancia que vimos al comienzo de este capítulo. Los valores de luminancia que llegan a la retina son el


producto de la reflectancia del objeto por la iluminancia que recibe dicho objeto. Además, el rango de variación de los valores de luminancia en la retina como resultado de cambios en iluminancia, es mucho mayor que el rango de variación debido a cambios en reflectancia. El problema que se nos plantea consiste en descubrir cómo puede nuestro sistema visual distinguir los cambios en luminancia debidos a diferencias en iluminación de los cambios debidos a la reflectancia del objeto a partir de los cambios en luminancia que es la única información que recibe a través de los receptores. El hecho empírico innegable es que nuestra percepción de la claridad responde adecuadamente a los cambios en reflectancia. ¿cómo es esto posible?

Varias contestaciones se han dado a esta pregunta en la historia de la investigación del color. Helmholtz propuso que la luminancia de una región en la imagen retiniana era comparada con la intensidad percibida de la iluminación en esa parte de la escena visual. Para Helmholtz, el problema se reducía a un cálculo de la claridad similar al que hacen los físicos cuando calculan la reflectancia de una superficie. La luminancia retiniana dividida por la iluminancia percibida nos daba la reflectancia percibida -es decir, la claridad- de la misma forma que la luminancia de una superficie dividida por su iluminancia nos proporciona su reflectancia. El razonamiento de Helmholtz presentaba problemas lógicos y empíricos. Uno de los primeros en resaltar sus problemas lógicos fue Hering, quien tildó al razonamiento de Helmhotz de circular. Dada la luminancia de una superficie, uno necesita conocer la reflectancia de la misma para poder inferir su iluminancia, pero es precisamente la reflectancia lo que se trata de encontrar. La circularidad parece inevitable: necesitamos conocer la reflectancia para inferir la iluminancia y ésta para inferir la reflectancia. Desde un punto de vista empírico, el problema viene dado por la adaptación a la luz que nos hace insensibles a los niveles absolutos de iluminación en condiciones de visión normal. No parece, por tanto, probable que el sistema visual tenga acceso a la iluminancia de una superficie de forma directa e independiente de la luminancia retiniana.

Hering, a su vez, puso mucho énfasis en atribuir la constancia de la claridad, y del color en general, a mecanismos sensoriales por un lado, tales como el tamaño de la pupila y la adaptación, y a mecanismos cognitivos como la memoria del color. La opinión de Hering fue refutada por Katz en su famoso libro El Mundo del Color (1935) donde demostró que la constancia del color persistía en situaciones que excluían la influencia de los factores defendidos por Hering.

Los psicólogos de la Gestalt fueron los primeros en rechazar la idea de que la luminancia fuera el estímulo responsable de la percepción de la claridad y pusieron el énfasis en el papel desempeñado por los gradientes y por la razón entre luminancias. Dentro de esta tradición investigadora, el experimento realizado por Hans Wallach (1948) fue determinante para encauzar definitivamente la investigación.

Wallach utilizó una situación que aparece representada en la Figura 2.12.

90

111111

PERCEPCIÓN VISUAL

•• t Manipulado por el observador

FIGURA 2.12. Esquema del experimento de H. Wallach sobre la constancia de la claridad. Fuente : Adaptación de la f1gura 3.3.5. de la obra de Stephen E. Palmer Vision Science: Photons to Phenomenology. © 1999. Cambridge, MA: The MIT Press.

Presentó a los observadores dos estímulos distintos, cada uno formado por dos círculos concéntricos. Los círculos interiores de cada estímulo estaban iluminados por proyectores diferentes de los que iluminaban los círculos envolventes. En cada ensayo, los dos círculos concéntricos de un estímulo eran iluminados por el experimentador con una intensidad fija y diferente para cada uno de ellos. También el círculo envolvente del otro estímulo era iluminado por el experimentador con una intensidad diferente a la del círculo envolvente del primer estímulo. A modo de ejemplo, supongamos que la intensidad de los círculos del primer estímulo era fijada por el experimentador en 80 unidades para el envolvente y 20 unidades para el interno, y, a su vez, la intensidad del círculo envolvente del segundo estímulo se fijaba en 40 unidades. La tarea del observador consistía en manipular la cantidad de luz del proyector que iluminaba el círculo interno de la presentación variable hasta conseguir para el mismo una apariencia igual a la del círculo interno de la presentación fija.

Wallach encontró que los observadores ajustaban la intensidad del círculo de forma que la razón entre su luminancia y la de su círculo envolvente era igual a la razón entre la luminancia del círculo interno y la de su envolvente en la presentación fija. En el caso de nuestro ejemplo, los sujetos iluminaban


el círculo interno con 10 unidades de intensidad. Los resultados de Wallach pusieron de manifiesto la respuesta del sistema visual, no a los valores absolutos de iluminación, sino a los valores relativos. La investigación posterior ha puesto de manifiesto que la comparación entre la luminancia de la superficie interna y la de la superficie envolvente toma en consideración preferentemente los bordes donde se produce el tránsito de un nivel de luminancia a otro.

La Figura 2.13 (p. 99) ilustra un efecto, conocido con el nombre de efecto Craik-O'Brien-Cornsweet. En la figura aparece una superficie oscura junto a otra más clara. De hecho la distribución de luminancia es la misma para las dos, como lo muestran las dos rampas de luminancia que aparecen en la parte de abajo de la figura, pero el efecto perceptivo viene determinado por las diferencias en el borde central que se propaga a toda la superficie.

La teoría retinex propuesta por Edwin Land y colaboradores (Land & McCann, 1971) fue una de las primeras teorías que utilizó el cálculo de las razones de luminancia en los bordes como fundamento de su teoría para explicar la constancia del color. La teoría fue formulada para explicar preferentemente la constancia cromática pero, como veremos más adelante, su explicación de la constancia de la claridad es el fundamento de toda la teoría. Por eso, comenzaremos aquí su estudio y volveremos a ella al tratar de la constancia cromática.

Land y MeCano comenzaron por tomar en consideración la naturaleza de las superficies y de las imágenes. En su opinión, la reflectancia tiende a ser constante en el espacio delimitado por una superficie excepto en los bordes donde se produce un cambio abrupto entre objetos o entre pigmentos. Sin embargo, los cambios en iluminancia tienden a ser graduales y no producen transiciones bruscas. Por tanto, al analizar los cambios de luminancia en una imagen, los cambios escalonados en la función de luminancia serán indicadores de cambios en reflectancia mientras que los cambios graduales indicarán cambios en iluminancia. Land y MeCano estudiaron el alcance de estas ideas en un contexto experimental como el que aparece en la Figura 2.14 (p. 99).

El conjunto de colores que aparecen como estímulo en el apartado B se conoce con el nombre de Mondrian por su parecido con los planos rectangulares de colores puros creados por el pintor holandés Piet Mondrian. Un Mondrian proporciona un estímulo adecuado para estudiar el efecto conjunto de múltiples cambios de reflectancia al pasar de un plano a otro25 • En el apartado A de la figura se presenta un Mondrian acromático en blanco gris y negro apropiado para el estudio de la constancia de la claridad.

Land y McCann estudiaron la percepción de estos estímulos bajo distintas condiciones de iluminación. Los planos de un Mondrian formados de distintos niveles de gris repartidos de forma aleatoria en la superficie del cuadro,

25. Land utilizó este tipo de estímulo no sólo por la variedad de reflectancias que un Mondrian encierra sino también porque su carácter abstracto y sin referencia a objetos reconocibles excluía la influencia de factores de aprendizaje y de memoria.


constituyen un estímulo mucho más complejo que la organización de círculos concéntricos utilizada por Wallach. En el caso de Wallach sólo se daba un tipo de borde entre los círculos concéntricos y las superficies a comparar eran sólo dos, pero en un Mondrian los bordes que delimitan cada plano son muchos más, también son más las posibles superficies de comparación y se encuentran a distancias distintas. A pesar de ello, el gris de cada plano se mantiene constante. Como la luminancia de cada plano es el resultado de multiplicar la iluminancia por la reflectancia de la superficie, el problema al que se enfrenta el sistema visual es recuperar la reflectancia a partir de las luminancias.

La teoría retinex propone que la claridad de las superficies es el resultado de la integración global de las razones de luminancia determinadas localmente en los bordes. Land y McCann demostraron que la razón entre las luminancias de cualesquiera dos rectángulos en un Mondrian es igual al producto de las razones de las luminancias correspondientes a los bordes que hay que cruzar en la trayectoria que va de uno a otro. Por ejemplo, si tomamos dos rectángulos a y e en el Mondrian de la Figura 2.14, que están separados por una tercera superficie b, la razón entre la luminancia de a y la de e es igual al producto de dos razones de luminancias: la que existe en el borde que separa a y b entre la luminancia de a y la luminancia de b, y la que existe en el borde que separa b y e entre la luminancia de b y la luminancia de c. Land y McCann demostraron que esta relación se daba para cualquier número de rectángulos intervinientes y para cualquier trayectoria que se trazara entre cualesquiera dos planos de un Mondrian.

La teoría retinex es un buen ejemplo de teoría basada en propiedades intrínsecas de la imagen. La relación entre las razones de las luminancias de los planos de un Mondrian forma un conjunto entrelazado de invariantes que son, en última instancia, los responsables de la constancia de la claridad. La teoría es también un buen ejemplo de teoría computacional pues un retinex es un mecanismo hipotético de cómputo -en última instancia realizable en un mecanismo neuronal- cuyo funcionamiento equivale a un algoritmo que calcula las razones de luminancia e integra en el espacio correspondiente a la superficie del Mondrian la información correspondiente a los bordes para reconstruir la imagen sobre la base de la reflectancia.

La teoría retinex es capaz de explicar que la información local de la luminancia en los bordes es suficiente para recuperar la reflectancia relativa de todas las regiones de un Mondrian pero es importante caer en la cuenta de que la reflectancia relativa sólo nos informa de las diferencias entre las reflectancias de las regiones del cuadro, no nos dice nada de los valores absolutos de reflectancia. La importancia de este punto para la percepción de la claridad es grande, porque las diferencias relativas entre distintos niveles de claridad pueden ser iguales para la diferencia entre un blanco y una gama de grises claros que para la diferencia entre un gris medio y una gama de grises oscuros que terminen en negro. ¿cómo puede el sistema visual determinar que se trata de una gama que oscila entre blancos y grises o una gama entre grises y


negros? Los investigadores han etiquetado este problema con el nombre de problema del anclaje porque se trata de fijar un punto de la gama que permita interpretar el significado de las diferencias en términos absolutos. Land y McCann propusieron una regla simple. Asumieron que el sistema visual asigna el color blanco al valor de máxima reflectancia y atribuye al resto valores menores de claridad dependiendo de su relación con el primero26

• Esta regla ha resultado ser aplicable en muchas ocasiones cuando se trata de situaciones simples que implican la comparación de dos áreas. Sin embargo, incluso en situaciones simples la asignación del blanco parece depender no sólo de factores fotométricos como es la luminancia sino de factores geométricos como es el área. En su formulación más simple, la regla del área viene a decir que cuanto más grande es un área más clara parece. La dos reglas funcionan bien cuando el área más grande es también la de mayor luminancia pero la cosa se complica cuando hay conflicto entre las dos reglas. Gilchrist y colaboradores (1999) han formulado una regla del área que combina ambos factores y que puede formularse de la siguiente manera: en una situación estimular simple, cuando la más oscura de las dos regiones tiene el área relativa más grande, a medida que el área más oscura crece, su claridad aumenta. Al mismo tiempo, la región más pequeña y más clara al principio parece blanca, después parece una luz blanca fluorescente y finalmente parece una fuente emisora de luz. Un ejemplo de esta situación final es la apariencia de la luna en la noche. La luna es una superficie que refleja luz pero su apariencia no es blanca sino que parece emitir luz.

En el caso de situaciones estimulares complejas el problema es mucho mayor pues la atribución de claridad a las superficies depende de factores que determinan la organización de la escena. Aunque no nos vamos a detener en ellos ahora pues los estudiaremos con mayor detenimiento más adelante, merece la pena mencionar algunos resultados que nos ayuden a entender la complejidad que puede llegar a alcanzar algo aparentemente tan sencillo como es la determinación de la claridad de una superficie. Por ejemplo, Gilchrist (1980) demostró que, incluso en situaciones tan simples como la utilizada por Wallach, la razón entre las luminancias sólo es efectiva cuando las dos superficies aparecen como coplanares, es decir, pertenecientes al mismo plano en profundidad. Si, manipulando las claves de profundidad, los dos círculos aparecen como sustentados en planos de profundidad diferentes, la constancia de la claridad se rompe. Vemos, por tanto, que la asignación de claridad interactúa con otros factores que determinan la interpretación última. La Figura 2.15 presenta los conocidos anillos de Kofka y Benussi que ejemplifican la importancia de factores que afectan a la organización de la escena.

26. El problema del anclaje está relacionado pero es distinto del problema de la escala El primero se refiere a la constancia de los valores absolutos de los matices de gris. El segundo se refiere a la constancia de los valores relativos de los matices de gris.


A B e

FIGURA 2.15. Anillos de Koffka y Benussi. Fuente: Michael S. Gazzaniga (Ed .). The New Cognitive Neurosciences. © 2000 (2. 0 ed.). Cambridge, MA: The MIT Press,

p. 342, fig. 24.6.

En la parte A de la figura, el anillo central parece uniforme. En la parte B la uniformidad se rompe mediante la separación de las superficies que sirven de fondo, de modo que la mitad de la izquierda, que se inscribe en el fondo más oscuro, aparece más clara que la mitad de la derecha. En C las diferencias en claridad de las dos partes del círculo se hace mucho más compleja por la reorganización de la figura central producida por el simple cambio relativo de las posiciones de las dos mitades de la figura.

La influencia de estos factores que afectan a la interpretación final de la claridad pone de manifiesto la insuficiencia de las teorías que ponen el énfasis explicativo exclusivamente en factores fotométricos. Para la teoría retinex el papel de factores no fotométricos, como los que acabamos de ver, afecta a un supuesto central de la teoría, el relacionado con el efecto gradual de la iluminancia y la interpretación de los cambios bruscos de luminancia en términos de cambios en reflectancia. Este supuesto funciona bastante bien a la hora de explicar la percepción de un Mondrian pero hay situaciones múltiples en la experiencia perceptiva que no pueden explicarse así. Imaginemos, por ejemplo, una escena a plena luz del día en la que un edificio que interfieren los rayos del sol proyecta una sombra nítida sobre el suelo o sobre cualquier otra superficie. El borde que divide la zona sombreada de la iluminada es el resultado de un cambio brusco de luminancia en las dos zonas que lo delimitan producido por las diferencias en iluminancia de las dos superficies, pero en este caso el cambio brusco no es interpretado por el sistema visual como una diferencia en los pigmentos de las superficies, es decir, no es interpretado como un cambio de reflectancia sino que el sistema visual acierta a interpretarlos como un cambio en la iluminación que reciben las superficies, es decir, como un cambio en iluminancia. Existen por tanto cambios bruscos en luminancia producidos por bordes de iluminación que el sistema visual atribuye a cambios en la iluminancia de la escena y cambios bruscos de luminancia producidos por bordes de reflectancia que el sistema visual atribuye a cambios de claridad en las superficies. Las razones últimas de esta interpretación están


por determinar pero algunas han sido ya identificadas y su estudio forma parte de la investigación actual. Por ejemplo, el grado de nitidez del borde influye haciendo que cuanto mayor sea la nitidez más predomine la interpretación del borde como borde de reflectancia27• También la magnitud de la diferencia entre las luminancias que determinan el borde parece importante ya que los bordes de iluminación pueden producir diferencias en luminancia mucho mayores que los bordes de reflectancia. Ya hemos mencionado antes la importancia asociada a que los estímulos aparezcan como coplanares y de otros factores organizativos. A ellos hay que añadir la importancia de factores locales de la imagen como son las conjunciones en forma de T, de Y o de 'P que pueden formar la unión de bordes en figuras planas o en prismas. La investigación de estos factores forma parte de los temas más actuales de la investigación en este campo. Una idea bastante generalizada entre los investigadores es la existencia de marcos de referencia (Gilchrist, 1999) o ventanas adaptativas (Adelson, 2000) que delimitan una región en el espacio dentro de la cual tienen lugar los cómputos que determinan la asignación de claridad a una superficie y los principios de agrupamiento que la configuran. Los factores que están fuera de una determinada ventana adaptativa no ejercen un efecto en la determinación de la luminancia que esa ventana acota. Las ventanas adaptativas pueden cambiar de tamaño y de forma dependiendo de factores diversos, por ejemplo, si el número de elementos en una escena es muy grande la ventana adaptativa se hace más pequeña, y si el número de elementos es escaso la ventana se hace mayor. El concepto de ventana adaptativa nos proporciona una idea de la flexibilidad que posee el sistema implicado en el procesamiento de la claridad. La determinación de razones de luminancia y el conjunto de cómputos que acaban determinando la claridad de una superficie no se efectúan siempre de una forma rígida y predeterminada sino de forma flexible y adaptativa como lo requieren las diferentes situaciones estimulares que confronta el organismo.

4.2. La constancia cromática

Una vez que hemos visto la problemática referente a la constancia de la claridad, resulta más asequible abordar el tema de la constancia cromática. La constancia de la claridad se ha centrado en el estudio del eje blanco-negro y ahora se trata de ampliar esos conocimientos al eje rojo-verde y al amarilloazul. El problema se complica en cuanto al número de ejes que tiene que tomar en consideración el sistema visual a la hora de determinar el color de una superficie, pero la naturaleza del problema no es muy diferente del problema de la determinación de la claridad que hemos visto antes. En ambos casos el

27. Así ocurre en el experimento de Wallach . Hay que caer en la cuenta de que en ese experimento lo que produce el experimentador son bordes de iluminancia pero el observador los interpreta como bordes de reflectancia a pesar de que la reflectancia de la pantalla blanca de proyección es homogénea.


sistema visual tiene que recuperar la reflectancia de las superficies sobre la base de las luminancias que a partir de esas superficies llegan a la retina.

Edwin Land aplicó su teoría retinex a la visión cromática extendiendo las ideas que antes hemos estudiado a los tres fotorreceptores retinianos28 • Hemos visto que un retinex es un mecanismo hipotético encargado de hacer el cómputo de las razones entre las luminancias que delimitan los bordes de una escena con el fin de recuperar la reflectancia de las superficies que conforman un Mondrian. Con respecto al color, Land supuso que existen tres tipos diferentes de mecanismos retinex cada uno encargado de llevar a cabo un cómputo de la claridad similar al que hemos estudiado antes pero cada uno de ellos restringido al cómputo de la claridad correspondiente al rango de sensibilidad espectral de cada uno de los fotorreceptores. Para entender mejor esta idea, supongamos que tomamos una fotografía en blanco y negro de una escena rica en colores diferentes con un filtro que sólo deja pasar las longitudes de onda largas. El resultado será una fotografía monocromática en la que los objetos rojos aparecerán con mucha claridad, los objetos verdes aparecerán más oscuros y los azules aparecerán más oscuros todavía. Si el filtro con el que tomamos la fotografía sólo deja pasar las longitudes de onda cortas, los objetos más claros en la escena monocromática serán los azules y los rojos serán más oscuros. Si el filtro favorece a las longitudes de onda medias, los objetos más claros serán los verdes. Cada filtro producirá una fotografía monocromática pero la claridad de los objetos en cada fotografía dependerá de la reflectancia de sus superficies o pigmentos. El funcionamiento de cada retinex en la teoría de Land produciría un efecto parecido, aunque más complicado, al de los filtros. Todos los mecanismos retinex hacen el cómputo de razones de luminancia de la misma forma y todos producen como resultado del cómputo y de las operaciones de anclaje un mapa de las reflectancias -y por tanto de la claridad- correspondientes a cada zona de la escena. Sin embargo, cada uno de los tres mecanismos retinex se especializa en el cálculo de las reflectancias correspondientes a un conjunto de longitudes de onda diferentes. El resultado final de estas operaciones da lugar a tres mapas diferentes de claridad para una determinada escena, cada mapa registrando la claridad de los elementos de una escena para una determinada banda de longitudes de onda. La teoría retinex aún necesita asumir otra fase de procesamiento que, mediante la comparación de los tres registros de claridad para cada parte de la escena, asigna el color dominante a cada parte de la escena sobre la base de los valores de claridad calculados por cada retinex. Si un determinado objeto tiene mayor claridad en el retinex correspondiente a la banda de longitudes de onda larga, el objeto aparecerá rojo y de la misma for-

28. El nombre retinex es un acrónimo formado a partir de retina y córtex. En su teoría inicial Land no prestó atención al procesamiento oponente que, como hemos visto anteriormente, es importante, sino que, reduciendo al máximo la complejidad del procesamiento fisiológico, trató de conectar el funcionamiento de los hipotéticos mecanismos retinex con los diferentes tipos de fotorreceptores.

PERCEPCION VISUAL

.ncia de las superficies sabre la tperficies llegan a la retina. isi6n cromatica extendiendo las rreceptores retinianos28 • Hemos

encargado de hacer el c6mpulos hordes de una escena

superficies que conforman un que existen tres tipos diferentes llevar a cabo un c6mputo de la

cad a uno de ellos restringi-rango de sensibilidad espectral

mejor esta idea, supongamos de una escena rica en colores longitudes de onda largas. El

Ia que los objetos rojos apaapareceran mas oscuros y los

con el que tomamos la forolos objetos mas claros en la

seran mas oscuros. Si el filtro etos mas claros seran los ver

Vll1C1 Ll\oC1 pero la claridad de "" " ''"'·""·""''a de sus superficies o

Ia teorfa de Land producirfa de los filtros. Todos los mecaluminancia de la misma forma y de las operaciones de anclaje claridad- correspondientes a

de los tres mecanismos retinex

aun necesita asumir otra de los tres registros de

dominante a cada parte de calculados por cada retinex. Si el retinex correspondiente a la

rojo y de la misma for-

de retina y cortex. En su teorfa inicomo hemos visto anteriormente,

idad del procesamiento fisio l6gico, ismos retinex con los diferentes

LA PERCEPC TON DEL COLOR 97

I ESPECTRO ELECTR0\1 AGNETlCO I 10·" metros 10'' metros

R:'YOS Rayos Rayos-X UV costmcos gamma TV Radto

400 500 600 700

l.ongitud de onda (nm )

FIGURA 2. 1. Espectro electromagnetico: entre los 400 y los 700 nm est6 comprendido el espectro visible . Fuente: Adaptaci6n de Ia ilustrac i6n 3.1 . de Ia obra de Stephen E. Palmer Vision Science: Photons to Phenomenology.© 1999. Cambridge,

MA: The MIT Press.

1.00

a:::o A 1.00 <(...J 0.75 azul c O.....J ...J(i"

\ 0.75 W<(

o::;: 0.50 amarillo i"S::: t O:::...J t 0.50 W:::J

0.25 ~~ <( 0 u _J

;::: 0 0.25 _J

0.00 ·<( C3 ((' ::;: <( 0 a::: ::;: a::: 0 0.00 <(

B u w 0 <( 0 _J

u a::: :::J a::: 0.75 verde z ~-0.25 ~ <( W w 0..0 _J

...JO::: ~ t-0.50 t

ww o> 0.50 i"So a:::-o wO

0.25 -0.75 :::JO::: LL. 400 500 600 700

0.00 LONGITUD DE ONDA (nm.)

400 500 600 700 LONGITUD DE ONDA (nm.)

FIGURA 2.8. Valencia crom6tica del espectro visual obtenida mediante Ia aplicaci6n del metoda de cancelaci6n de matiz. En A para el par azul-amarillo y en B para el par rojo-verde, el color de los circu los de coda funci6n designa el correspondiente a Ia luz de cancelaci6n . En C el color de los circulos designa

directamente Ia va lencia crom6tica .

98 PERCEPCION VISUAL

•

a b

FIGURA 2.7. Posefecto de color. Fije su vista en e l punta negro central de a y al cabo de unos treinta segundos cambie al punta de fijaci6n en b.

A

B

FIGURA 2.11 . Contraste simult6neo acrom6tico (A) y crom6tico (B) . Fuente: A. Josef Albers. interaction of color. 1963. London: Yale University Press.

PERCEPCION VISUAL

•

b

punto negro central de a y al punto de fijac i6n en b.

i o (A) y crom6tico (B) . London: Ya le University Press.

LA PERCEPCION DEL COLOR

co "(3 c co .£-------E ::J

_J

99

FIGURA 2.13. Efecto de trans ito de luminanc ia de Craik-0' Brien-Cornsweet. Fuente: MichaelS. Gazzaniga (Ed.). The New Cognitive Neurosciences. © 2000

(2.0 ed.). Cambridge, MA: The MIT Press, p. 340, fig . 24.4.

A

B

FIGURA 2.14. Tipo de estimulo conoc ido con el nombre de Mondrian . El representado en A es acrom6tico y el representado en B es crom6tico.

100 PERCEPCION VISUAL

sagital coronal

. I ..... __ ,_ ,.~

. .

···· ···" . - -" ' .,... . ' . · ~ .. • .. ~ 1' ~'

h o rizontal

FIGURA 2.16. Activa c i6n del giro fusiforme en presenc ia de estfmulos de color segun diferentes pianos de corte del cerebra humano.

L

m re re cc 01

se b;

sc he Sl '

h; VI

m eJ

dr Ia Ia Ia n Ia ff C<

do Sr C<

If

C<

!\. d lc d

A

(J rr e; rr fl, o: Ia


En sus investigaciones con personas Zeki estudio las zonas implicadas en la percepción del color comparando la activación de distintas zonas cerebrales a un Mondrian acromático con su activación a un Mondrian cromático de formas iguales al anterior. Encontró que la zona del cerebro que respondía específicamente al color era la formada por el giro fusiforme situado en la zona ventral de la corteza occipital (ver Figura 2.16 en p. 100).

Zeki se refiere a estas zonas de la corteza cerebral humana como equivalentes al área V4 en el macaco, aunque no hay acuerdo en este punto.

La observación clínica de pacientes ha puesto también de manifiesto que la lesión de estas zonas del cerebro da lugar a una forma de acromatopsia cortical que reduce al paciente a un tipo de visión exclusivamente acromática32. Vemos, por tanto, que existe evidencia fisiológica importante a favor de zonas cerebrales cuya respuesta está asociada con aspectos importantes de la apariencia del color como es su constancia a pesar de los cambios en luminancia que puedan introducir en una escena las variaciones en iluminación. Zeki (Zeki & Marini,1998) es el investigador que más fuerte ha apostado por relacionar V4 con el cómputo que Land atribuía a sus mecanismos hipotéticos. Según Zeki son los campos receptivos de V4 los idóneos para llevar a cabo las comparaciones entre zonas remotas de una misma escena como postula la teoría retinex ya que reciben información no sólo de las células de V1 y V2 del mismo hemisferio sino también las del hemisferio cerebral contrario a través de conexiones del cuerpo calloso.

Con el estudio de la constancia del color completamos el tratamiento de los principios fundamentales que gobiernan la percepción del color. Hemos visto cómo una codificación inicial de la longitud de onda de naturaleza tricromática da lugar a una codificación en términos oponentes de los colores fundamentales. También hemos visto cómo, en fases posteriores de procesamiento, el sistema visual realiza determinados cómputos que permiten alcanzar información acerca de los objetos. La consecución de la constancia del color, y de todas las demás constancias, es uno de los principales logros del sistema visual para proporcionarnos un mundo objetivo al que poder adaptar nuestro comportamiento con éxito. En las primeras fases, el procesamiento del color tiene lugar de forma relativamente encapsulada, es decir, relativamente independiente de otros aspectos de la percepción visual, como son la forma o la profundidad. En el establecimiento de la constancia, sin embargo, el sistema visual utiliza información procedente de otros módulos visuales para resolver el problema de la asignación de colores a superficies. Una característica general de los procesos que tiene lugar en las fases que hemos

que muestran constancia al color sino las células en TEO, una zona próxima a V4 pero en la corteza temporal inferior.

32. Los síntomas que presentan los pacientes con acromatopsia cortical son muy variados. Una exposición interesante puede encontrarse en el capítulo 27 del libro de Zeki mencionado en la nota 29 .


estudiado es que predomina en ellos el procesamiento de abajo arriba. No excluimos que factores atencionales, de aprendizaje u otras influencias cognitivas puedan modular el funcionamiento de esos procesos33 , pero no son necesarios para llevar a cabo el procesamiento que tiene lugar en esas fases.

Sin embargo, la percepción del color no termina con la determinación de la constancia. Al igual que cualquier otro aspecto de la percepción, el color tiene que entrar en contacto con nuestro conocimiento del mundo, y en particular con nuestro conocimiento de los objetos y de los colores, para adquirir significación, para contribuir al reconocimiento de los objetos y para facilitar la adaptación al medio. A esta nueva fase del proceso perceptivo, en la que la información que fluye desde el medio ambiente hacia el organismo establece contacto con el conocimiento del organismo, la llamamos de forma genérica categorización perceptiva y es la fase que vamos a estudiar a continuación.

5. CATEGORIZACIÓN DEL COLOR

El espectro visible está formado por una banda continua de longitudes de onda que, en términos generales, se extiende entre los 400 y 700 nanometros. Hemos visto que toda esta gama de longitudes de onda es codificada en primer lugar por tres tipos diferentes de receptores y recodificada posteriormente sobre la base de tres pares de colores oponentes: rojo-verde, amarillo-azul y blanco-negro. Sin embargo, nuestro vocabulario está repleto de términos referentes a colores que van mucho más allá de los seis colores mencionados: rosa, marrón, malva, naranja, pardo, morado, marfil, oro, púrpura, caqui, cian, violeta, beige, crema, burdeos, bermellón, etc., son sólo unos cuantos de los numerosos matices que podemos discriminar entre los colores, aunque no todas las personas podrían afirmar ser capaces de ello. El mundo de los colores, al igual que otros aspectos perceptivos, está abierto al aprendizaje discriminativo y es también el resultado de influencias culturales que, mediante la creación de categorías perceptivas, nos enseñan a ver el mundo de una forma determinada. Debemos preguntarnos por la naturaleza del conocimiento acerca de los colores porque, en última instancia, el mundo de las categorías respecto al color va a actuar como filtro último a la hora de asignar un nombre a una experiencia particular de color. El problema que ahora se nos plantea es el grado de generalidad o de relativismo particular que cabe esperar en el mundo de las categorías del color.

Durante algún tiempo se pensó en términos de mero relativismo cultural: las personas de distintas culturas aplican nombres distintos a los colores de

33. El concepto de ventana adaptativa que hemos visto al estudiar la constancia de la claridad ofrece un posible ejemplo. Aunque la ventana adaptativa puede estar determinada por factores contextuales de organización de la escena, también puede ser afectada por otros factores como la atención selectiva.


acuerdo con su experiencia. Entre los muchos ejemplos se hizo famoso el proporcionado por el antropólogo Franz Boas sobre el número de palabras que los esquimales tienen para referirse a la nieve. Si eran capaces de discriminar más de doce tipos de nieve distintas era debido a su adaptación al medio ambiente polar y a la necesidad de asignar significación a aspectos que pasan desapercibidos para miembros de otras culturas. La generalización de esta tesis llevó a pensar que la forma en que las distintas culturas fragmentan el espectro luminoso en categorías de color era arbitraria.

Berlín y Kay (1969), dos antropólogos de la universidad de Berkeley, hicieron un estudio sobre los términos básicos del color que demostró la existencia de unas tendencias comunes entre las distintas culturas. Berlín y Kay comenzaron por definir como términos básicos de color aquellos que reuniesen las siguientes condiciones:

l. Debían ser términos formados por un único lexema. Este requisito excluía los nombres compuestos de colores tales como azul marino, azul claro, etc.

2. Debían ser términos referidos preferentemente al color y no a un objeto o material determinado del que el color tomara el nombre. Este requisito excluía términos como dorado, marfil, crema, caqui etc.

3. Los términos debían ser ampliamente utilizados para designar el color de una gran variedad de objetos, lo que excluía términos locales tales como rubio o moreno que sólo se aplican a objetos determinados tales como la piel o el pelo.

4. Los términos debían tener una frecuencia alta de uso en la lengua de la cultura estudiada, excluyendo así los términos demasiado técnicos o sofisticados.

Con esta definición de términos básicos de color, Berlín y Kay estudiaron directamente 20 lenguas diferentes con métodos experimentales y otras 78 por medio del análisis de escritos. Encontraron que en todo el conjunto de lenguas estudiadas se podían discriminar doce términos básicos de color: rojo, verde, amarillo, azul, blanco, negro, gris, marrón, rosa, naranja, púrpura, y un azul claro que en muchas culturas tiene un término único para designarlo. Posteriormente Kay y McDaniel (1978) ampliaron este conjunto de doce a dieciseis para incluir términos muy comunes en varias culturas que hacen referencia a subconjuntos de los doce anteriores. Los cuatro términos añadidos fueron: cálido, que puede referirse a rojo o a amarillo, frío para el azul o verde, claro-cálido, que abarca a blanco o rojo o amarillo, y oscuro-frío, para el negro o azul o verde.

El segundo descubrimiento que Berlín y Kay hicieron fue la utilización de únicamente 22 conjuntos diferentes de colores de entre los millones de conjuntos que pueden realizarse con esos 16 términos básicos para designar los colores. Más aún, entre estos 22 conjuntos Berlín y Kay descubrieron un patrón que podía interpretarse como un orden determinado en el desarrollo de los términos de color. Así, si una lengua determinada tenía solamente dos


términos básicos para designar el color, los términos utilizados eran clarocálido y oscuro-frío; si tenía tres términos básicos, los utilizados eran blanco, cálido y oscuro-frío; si eran cuatro, el oscuro frío se dividía resultando blanco, cálido, negro y frío; si la lengua tenía cinco términos, el que se dividía era el cálido, dando lugar a blanco, rojo, amarillo, negro y frío; finalmente, si la lengua tenía seis términos básicos, se dividía el término frío y los utilizados eran blanco, rojo amarillo, negro, azul y verde. Lejos, por tanto, de un relativismo cultural, los resultados de Berlín y Kay han puesto de manifiesto que los términos básicos de color se mueven en torno a los seis colores fundamentales que Hering había postulado, aunque el modo de agrupamiento en cada cultura sea diferente.

En el caso de las veinte lenguas que Berlin y Kay estudiaron con métodos experimentales, investigaron con especial interés la manera de llevar a cabo la categorización de los colores. Para ello utilizaron un gran número de fichas de distintos colores tomados del libro del color de Munsell y pidieron a los sujetos que las clasificaran en distintas categorías. Encontraron que la tendencia predominante en los participantes era la de agrupar las fichas de colores en torno a un conjunto de colores fundamentales que actuaban como colores focales mientras que los límites entre las diferentes categorías utilizadas eran mucho más difusos. Parece, por tanto, que las categorías conceptuales referentes a los colores están organizadas de forma que unos colores determinados son los más representativos y actúan como prototipo de la categoría, mientras que el resto se categoriza por semejanza con los distintos prototipos que sirven de puntos focales.

Recientes investigaciones llevadas a cabo por Zeki (Zeki & Marini, 1998) han proporcionado importantes indicios sobre las estructuras neuronales que pueden estar implicadas en las fases superiores de procesamiento del color. Recordemos que fueron las investigaciones de Zeki las que relacionaban la constancia del color con el procesamiento que tiene lugar en V4. Recordemos también que en esas investigaciones los estímulos utilizados por Zeki fueron conjuntos de colores al estilo Mondrian. En sus últimas investigaciones, Zeki y Marini han utilizado escenas de objetos reales que en unos casos eran acromáticas y en otros estaban dotadas de color. Además, en este último caso, los colores podían ser apropiados para los objetos representados (fresas rojas, por ejemplo) o ser inapropiados (fresas azules). Utilizaron resonancia magnética funcional para registrar la actividad cerebral de los participantes ante la proyección de las escenas. Los resultados mostraron que, al comparar las activaciones producidas por los objetos con colores apropiados con las producidas por los mismos objetos pero acromáticos, se producía una mayor activación del giro fusiforme pero, en este caso, implicaba a zonas del giro fusiforme que no se activaban ante la presencia de un Mondrian, Otras zonas que también se activaron diferencialmente fueron el giro parahipocampal, situado en la zona media del lóbulo temporal, y el mismo hipocampo. Curiosamente, estas zonas no se activaron cuando los objetos mostraban


colores inapropiados. Zeki ha interpretado estos resultados en el sentido de que estas estructuras neuronales no llevan a cabo un análisis abstracto del color sino que están relacionadas con la interacción del color con los objetos y con la memoria de los colores de los objetos. Es probable que sean estas estructuras las que estén preferentemente relacionadas con la categorización del color.

RESUMEN

Como dijimos al comienzo de este capítulo, el procesamiento del color es un buen ejemplo tanto de la manera en que el sistema visual elabora la representación del medio ambiente que el organismo necesita para su actividad adaptativa, como de la forma en que ha ido avanzando el conocimiento sobre el sistema visual entendido como un sistema perceptivo. Las teorías que en un principio parecían irreconciliables han podido ser valoradas en su justa aportación al descubrir las diferentes fases a través de las cuales el sistema visual procesa el color. Hemos visto que las fases tienen un alto grado de organización serial pero también en cada una de las fases hemos podido ver un alto grado de interacción en paralelo de carácter intramodular, en las primeras fases, e intermodular en las últimas. A medida que el procesamiento del color se hace más complejo, mayor es la intervención de todo el conocimiento a disposición del sistema visual para precisar la información que necesita el orgamsmo.

PERCEPCIÓN VISUAL

:os resultados en el sentido de :abo un análisis abstracto del :ción del color con los objetos •S. Es probable que sean estas ·onadas con la categorización

cesamiento del color es un visual elabora la repre

o necesita para su actividad zando el conocimiento sobre

tivo. Las teorías que en un r valoradas en su justa apor

tas cuales el sistema visual un alto grado de organizahemos podido ver un alto amodular, en las primeras e el procesamiento del ca

de todo el conocimiento información que necesita el

Capítulo 3

PROCESAMIENTO VISUAL INICIAL

INTRODUCCIÓN

En el estudio de la percepción visual, la percepción de la forma ocupa un lugar central. El reconocimiento de los objetos puede estar basado en diferentes características, como el color o la textura de sus superficies, pero es la forma el determinante principal del reconocimiento. En este capítulo vamos a iniciar el estudio de la percepción de la forma. Las investigaciones que vamos a estudiar aquí suelen ser tratadas en muchos libros de texto como teorías diferentes de la percepción de la forma o de la percepción de los objetos pero, como tendremos ocasión de ver, son sólo teorías de las primeras fases del procesamiento de la forma. En este libro, la percepción de la forma ocupa varios capítulos reflejando así la complejidad del tema y los avances alcanzados en la integración teórica de áreas de investigación que podían parecer antagónicas. Muchos de esos avances han sido posibles a partir de las investigaciones que vamos a estudiar en este capítulo que han determinado la forma de pensar que predomina en la actualidad.

El capítulo está organizado en torno a tres aportaciones; la primera proviene de la investigación fisiológica del sistema visual, la segunda de la investigación psicofísica y la tercera de la teoría computacional de la visión. En este capítulo es muy importante apreciar la peculiaridad en la forma de estudiar la percepción que caracteriza a cada aportación y el alcance de cada propuesta. Aunque las distintas aportaciones no sean teorías completas de la percepción de la forma, son determinantes del modo de entenderla debido a que cada una de ellas plantea un punto de partida diferente para entender los primeros pasos del procesamiento que son la base sobre la que construir los posteriores. La exposición que sigue respeta el orden cronológico de aparición de las aportaciones que vamos a estudiar ya que la fisiológica fue la primera y


la computacional la última. Esta forma de exposición nos permitirá recorrer los hitos fundamentales de la investigación sobre percepción visual que han tenido lugar en la segunda mitad del siglo XX.

1. LAS INVESTIGACIONES DE HUBEL Y WIESEL

En 1981 David Hube! y Torsten Wiesel recibieron el premio Nobel de fisiología y medicina por sus trabajos sobre los campos receptivos de las células del córtex estriado 1 • Hube! y Wiesel trabajaron con Stephen Kuffler en la facultad de medicina de la universidad de Harvard. Kuffler descubrió la organización de los campos receptivos de las células ganglionares en términos oponentes entre el centro y el contorno. En el capítulo anterior hemos tenido ocasión de estudiar el funcionamiento de este tipo de células. Hubel y Wiesel trataron de extender la investigación de los campos receptivos a las células de la corteza estriada y encontraron diferentes clases de células que tenían diferentes tipos de campos receptivos. Clasificaron estas células en tres clases con el nombre de células simples, complejas e hipercomplejas.

1.1. Tipos de células

Las células simples se caracterizan por tener campos receptivos con una forma más complicada que las células ganglionares o las del núcleo geniculado del tálamo cuyos campos receptivos son circulares. No obstante, la organización de los campos receptivos continúa teniendo la estructura antagónica centro-contorno en la que tanto uno como otro puede ser excitador (on) o inhibidor (off). Un punto de luz proyectado sobre una zona excitadora (on) es un estímulo suficiente para aumentar la tasa de disparo de una célula y un punto de luz proyectado sobre una zona inhibidora (off) disminuye la tasa de disparo. Cuando los estímulos son mayores que un punto de luz la respuesta de la célula aumenta de forma lineal a medida que aumenta la cantidad de luz que cae sobre una zona excitadora o disminuye a medida que aumenta la cantidad de luz que cae sobre una zona inhibidora. Esta naturaleza lineal de la respuesta es una de las características principales de las células simples.

El estímulo óptimo para una célula simple es aquel que mejor se ajusta a la forma de su campo receptivo y la geometría de los campos receptivos da lugar a diferentes tipos de células simples. La mayor parte tienen campos receptivos alargados y responden preferentemente a líneas o bordes de una determinada orientación y posición en la retina. Unas tienen un área excitadora en un lado y otra área inhibidora en el otro lado por lo que responden preferentemente a bordes de luminancia formados por la transición de luz a oscuridad; por

l. El premio fue compartido por un tercer investigador, Roger Sperry.

PERCEPCIÓN VISUAL

ición nos permitirá recorrer percepción visual que han

YWIESEL

el premio Nobel de fisioloos receptivos de las células del Stephen Kuffler en la facultad

descubrió la organización s en términos oponentes

or hemos tenido ocasión de Hube! y Wiesel trataron de

a las células de la corteza las que tenían diferentes tipos

en tres clases con el nombre

receptivos con una foro las del núcleo geniculado

res. No obstante, la organiendo la estructura antagónica

puede ser excitador (on) o re una zona excitadora (on)

de disparo de una célula y un ora (off) disminuye la tasa de un punto de luz la respuesta que aumenta la cantidad de

a medida que aumenta la Esta naturaleza lineal de la

de las células simples. aquel que mejor se ajusta a la

campos receptivos da lugar tienen campos receptivos

o bordes de una determinada área excitadora en un lado

responden preferentemente ión de luz a oscuridad; por

PROCESAMIENTO VISUAL INICIAL 109

ello se les llama a veces detectores de bordes. Otras células presentan campos receptivos con una zona central alargada, que puede ser excitadora o inhibídora, flanqueada a uno y otro lado por zonas antagónicas. Estas células responden preferentemente a líneas claras u oscuras de una determinada orientación y posición en la retina y son a veces llamadas detectores de líneas o detectores de barras. En general las distintas formas de campos receptivos que se han encontrado son pocas y responden a tipos diferentes de bordes, líneas o barras. Sin embargo, para cada una de estas formas se ha encontrado una gran cantidad de células cada una de las cuales responde a una orientación y posición retiniana particular pero que en conjunto cubren con sus respuestas todas las orientaciones y posiciones posibles en el campo visual. El tamaño de los campos receptivos de las células simples depende de su posición en la retina con relación a la fóvea. En la zona de la fóvea los campos receptivos son más pequeños que en la periferia.

Aún no se conoce con certeza la forma en que las células simples se relacionan con las células ganglionares y con las de los núcleos geniculados del tálamo cuyos campos receptivos son circulares. Hubel (1999) ha propuesto un modelo sencillo como el que aparece en la Figura 3 .1.

FIGURA 3.1. Modelo que muestra la relación entre cuatro células con campos receptivos circu lares y una célula simple (Hube!, 1998). Fuente : David H. Hube!. Ojo,

Cerebro y Visión. 1999. Murcia: Editorial de la Universidad de Murcia.

La figura ilustra las conexiones entre cuatro células con campos receptivos circulares y una célula simple. Cada una de las cuatro células que conectan con la simple tiene un campo receptivo de centro on y contorno off y los centros


de estas cuatro células se encuentran dispuestos a lo largo de una línea. Si suponemos que muchas células como estas cuatro se encuentran conectadas a una célula simple, podemos entender que el campo receptivo de la célula simple consistirá en una región excitadora estrecha y alargada que estará flanqueada por una región inhibidora y que un estímulo luminoso semejante a una línea será capaz de activar a su máximo nivel a esa célula simple. El modelo presentado en la Figura 3.1 es solamente un modelo hipotético, más adelante en este mismo capítulo veremos que existen otras formas de interpretar el funcionamiento de las células que Hubel y Wiesel llamaron «simples».

Las células complejas fueron las primeras en ser descubiertas por Hubel y Wiesel probablemente porque son las más abundantes en la corteza visual estriada; se calcula que el 75% de esta corteza está formada por células complejas. Las células complejas comparten con las células simples la cualidad de responder solamente a líneas que tienen una orientación específica, pero presentan unas diferencias importantes respecto a las células simples:

l. Tienen campos receptivos algo más grandes que las células simples. 2. No responden de forma específica a la posición de una línea dentro del

campo receptivo. Con tal que se mantenga la orientación de la línea, cualquier posición dentro del campo receptivo es capaz de provocar la excitación de estas células.

3. Son muy sensibles al movimiento de las líneas que sirven de estímulo. Las células complejas no responden si son estimuladas encendiendo o apagando pequeños puntos de luz estacionarios. Incluso las líneas estacionarias producen una respuesta débil y no mantenida. Sin embargo, si una línea orientada adecuadamente se mueve a lo largo del campo receptivo, la respuesta de la célula compleja es máxima y se mantiene desde el momento en que el estímulo entra en el campo visual hasta que lo abandona.

4. En consecuencia, la respuesta de las células complejas no es lineal respecto a la cantidad de luz recibida, al contrario que la respuesta de las células simples.

Aunque no se conocen las relaciones entre las células simples y las complejas, la Figura 3.2 presenta un hipotético modelo propuesto por Hube! (1998).

La figura representa una célula compleja que recibe información de tres células simples aunque en la realidad habría que suponer que son muchas más las células simples que convergen en una célula compleja. Los campos receptivos de las células simples tienen todos la misma orientación pero están distribuidos de forma que se solapan sobre la totalidad del campo receptivo de la célula compleja. En un esquema como éste, la célula compleja se activará siempre que su campo receptivo sea estimulado por una línea con la orientación apropiada, pero la excitación de la célula será breve si la estimulación es estática porque solamente un número pequeño de células simples

PERCEPCIÓN VISUAL

a lo largo de una línea. Si ·o se encuentran conectadas :ampo receptivo de la célu~echa y alargada que estará stímulo luminoso semejante

a esa célula simple. El un modelo hipotético, más

otras formas de interpreWieselllamaron «simples>>.

descubiertas por Hube! antes en la corteza visual formada por células com

células simples la cualidad · n específica, pero

las células simples:

que las células simples. de una línea dentro del

la orientación de la línea, vo es capaz de provocar la

que sirven de estímulo. muladas encendiendo o

Incluso las líneas esta-mantenida. Sin embargo,

a lo largo del campo a es máxima y se mantiene

en el campo visual hasta

complejas no es lineal res. que la respuesta de las

lulas simples y las compleuesto por Hube! (1998).

recibe información de tres suponer que son muchas la compleja. Los campos

orientación pero están ad del campo receptivo

la célula compleja se aedo por una línea con la

será breve si la estimuueño de células simples


1 1 - + - + - +

- + - + - +

- + - + - +

~ + - +

V

1

FIGURA 3.2. Modelo que muestra la relación entre tres células simples y una compleja. Fuente: David H. Hubel. Ojo, Cerebro y Visión. 1999. Murcia: Editorial de la

Universidad de Murcia.

disparará ante la presencia del estímulo y estas células pronto se adaptarán. Sin embargo, si el estímulo apropiado se mueve a lo largo del campo receptivo de la célula compleja, un número mayor de células simples disparará sucesivamente, evitando el problema de la adaptación de las células simples y manteniendo de esta forma la excitación sostenida de la célula compleja. Un esquema como este puede explicar el funcionamiento de la mayor parte de las células complejas, aunque existe un pequeño porcentaje de las mismas, entre un 10 y un 20 por ciento en las láminas superficiales de la corteza estriada, que muestran selectividad a la dirección del movimiento de forma que tienden a disparar preferentemente cuando el movimiento del estímulo va en una determinada dirección y no disparan o lo hacen menos intensamente cuando el movimiento es en dirección contraria. Para explicar el comportamiento de este tipo de células se necesitan esquemas más complejos que el expuesto en la Figura 3.2.

Un tercer tipo de células descubiertas por Hube! y Wiesel fueron al principio denominadas hipercomplejas porque parecían poseer un campo receptivo más selectivo que las células complejas. La característica fundamental de este tipo de células consiste en una disminución de su respuesta cuando la longitud de la línea que la estimula aumenta por encima de un límite. Esta


característica es sorprendente porque tanto las células simples como las complejas muestran un aumento en la respuesta cuando aumenta la longitud de la línea que se utiliza como estímulo. Es como si las nuevas células respondieran preferentemente a líneas que presentan una terminación. Hoy este tipo de células suele denominarse células con inhibición finaF porque sabemos que esta característica de responder a líneas con terminación no está exclusivamente asociada a células que presentan características complejas sino también a células simples. En pocas palabras, hoy se tiende a pensar que las anteriormente llamadas células hipercomplejas son grupos particulares tanto de células simples como complejas que presentan una sensibilidad gradual a la presencia de una terminación3 •

1.2. La arquitectura de la corteza estriada

Tanto las investigaciones de Hube! y Wiesel, como investigaciones posteriores derivadas de ellas pusieron de manifiesto, además de los tipos de células que componen la corteza estriada, importantes principios de su organización. Los métodos que se han utilizado han sido muy variados y han avanzado considerablemente desde que Hube! y Wiesel comenzaron a investigar4

• Los principales resultados son los siguientes:

1.2.1. Organización retinotópica. La corteza estriada preserva la topografía propia de la retina en el sentido de que áreas que son adyacentes en la retina proyectan sobre áreas en la corteza que también son adyacentes. La Figura 3.3 presenta en su parte inferior una autorradiografía de la corteza estriada del hemisferio izquierdo de un mono, uno de cuyos ojos había estado expuesto al estímulo que se muestra en la parte superior de la figura. Como se indica en la figura, la imagen de la autorradiografía corresponde al campo visual derecho del estímulo y en ella aparecen tanto las líneas radiales como las líneas semicirculares del estímulo conectadas entre sí con las relaciones topográficas apropiadas. Obsérvese también que la representación de la distancia entre las líneas radiales tiende a igualarse en la autorradiografía a pesar de

2. El término inglés utilizado para su denominación es end-stopped cells. He seguido Ja traducción utilizada por Jos traductores del libro de Hube! (1999).

3. El grado de inhibición final no parece ser una cuestión de todo o nada sino una cuestión de grado (De AngeJis, Ohzawa & Freeman (1995).

4 . Merece la pena mencionar Ja importancia que en este campo ha tenido el desarrollo de técnicas autoradiográficas que se basan en la absorción de azúcar radioactiva por parte de las células más activas. Esta sustancia no es metaboJizada por la célula sino que se acumula en el la, proporcionando así la oportunidad para poder radiografiar los conjuntos de células más activas ante una determinada estimulación, si el animal es sacrificado y las láminas de su corteza estriada estudiadas con técnicas radiográficas apropiadas. La imagen resultante proporciona una representación de la distribución espacial del conjunto de células activadas simultáneamente por la estimulación utilizada.

PERCEPCIÓN VISUAL

células simples como las comdo aumenta la longitud de la nuevas células respondieran

inación. Hoy este tipo de céaF porque sabemos que esta · n no está exclusivamente

complejas sino también a cépensar que las anteriormente · ares tanto de células simdad gradual a la presencia de

investigaciones posteriode los tipos de células

cipios de su organización. variados y han avanzado

'~""a''"'" a investigar4• Los

estriada preserva la topoáreas que son adyacentes en también son adyacentes. La torradiografía de la corteza

de cuyos ojos había estado superior de la figura. Como

corresponde al campo las líneas radiales como

. entre sí con las relaciones rorepresentación de la distanautorradiografía a pesar de

es end-stopped cells. He seguido la (1999).

de todo o nada sino una cuestión

este campo ha tenido el desarrollo de azúcar radioactiva por parte de

la célula sino que se acumula en fiar los conjuntos de células más · ficado y las láminas de su corteza

resultante proporciona una activadas simultáneamente por


que en el estímulo la distancia entre las líneas es muy diferente. Esta diferencia entre las relaciones métricas de la representación en la corteza y en el estímulo se conoce con el nombre de magnificación cortical y es una distorsión característica de la representación retinotópica de la corteza estriada debida a que la zona central de la retina ocupa un área más amplia en la corteza que la zona periférica. Esta distorsión es una consecuencia de la mayor densidad de receptores existente en el centro de la retina en comparación con la periferia y está relacionada con el análisis que la corteza visual realiza en el centro de la retina que es más detallado que en la periferia.

FIGURA 3.3. Autorradiografía del hemisferio izquierdo de un mono mostrando el fenómeno de magnificación cortical. Fuente: David H. Hubel. Ojo, Cerebro y Visión.

1999. Murcia: Editorial de la Universidad de Murcia.

1.2.2. Columnas de dominio ocular. La organización de la corteza estriada en columnas relacionadas con el dominio ocular fue una de las primeras características de su arquitectura que fue descubierta. Si se introduce un electrodo en la corteza estriada de forma perpendicular a su superficie, puede comprobarse que todas las células a lo largo de esa trayectoria responden de forma preferente a la estimulación presentada a un determinado ojo y no lo hacen, o lo hacen en menor medida, a la estimulación presentada al otro ojo. Si el electrodo se introduce de forma oblicua a la superficie, tan en paralelo a la misma como sea posible, el predominio de un ojo sobre el otro en la excitación de las células alterna. Primero predomina un ojo y luego otro y la


secuencia alternante se repite a lo largo de la trayectoria. Estos resultados, típicamente obtenidos con técnicas de registro unicelular, ponen de manifiesto una organización de la corteza en columnas, cada una de ellas formada por conjuntos de células que responden a un ojo con preferencia al otro y todas ellas organizadas de forma alternante respecto al ojo dominante. La Figura 3.4 muestra el esquema de un corte realizado tangentemente a la superficie del área V1 de un mono. El corte muestra la organización alternante de columnas claras y oscuras correspondientes al ojo derecho e izquierdo respectivamente. En general, el tipo de transición brusca que se produce de las zonas claras a las oscuras es propio de la capa 4C de la corteza, en el resto de las capas la alternancia de columnas de dominio ocular es más suave y gradual pasando de columnas con clara preferencia por un ojo a otras en que la preferencia es menor y a otras claramente binoculares antes de llegar a las columnas con preferencia por el otro ojo.

D D

FIGURA 3.4. Esquema de la organización de la dominancia ocular en la corteza visual primaria . Fuente: David H. Hubel. Ojo, Cerebro y Visión . 1999. Murcia: Edito

rial de la Universidad de Murcia.

1.2.3. Columnas de orientación. Como hemos visto anteriormente la preferencia por una determinada orientación es la característica principal tanto de las células simples como de las complejas. La forma en que se organiza esa preferencia a la orientación también presenta una curiosa regularidad. Al igual que la preferencia ocular, la preferencia por una determinada orientación permanece constante si la penetración del electrodo de registro es perpendicular a la superficie de la corteza. Todas las capas de la corteza desde la superficie hasta la sustancia blanca muestran preferencia por una determinada orientación excepto la capa 4 que no muestra preferencia de orientación. Si la penetración del electrodo se hace de forma paralela a la superficie, aparece una secuencia regular de cambios en la preferencia por la orientación de forma que cada vez que el electrodo avanza unas 50 micras se produce un cambio en la preferencia por la orientación de unos 1 O grados de ángulo bien en el sentido de las agujas del reloj bien en sentido contrario. Esta distribución del cambio hace que en un espacio de aproximadamente un milímetro el cambio de preferencia en la orientación sea de unos 180 grados.

PERCEPCIÓN VISUAL

~yectoria. Estos resultados, tínicelular, ponen de manifiesto Fda una de ellas formada por on preferencia al otro y todas

al ojo dominante. La Figura gentemente a la superficie del ación alternante de columnas

~ e izquierdo respectivamente. duce de las zonas claras a en el resto de las capas la suave y gradual pasando

a otras en que la preferencia de llegar a las columnas con

nancia ocular en la corteza y Visión. 1999. Murcia: Edito-

visto anteriormente la preracterística principal tanto forma en que se organiza

una curiosa regularidad. Al r una determinada orienta

electrodo de registro es percapas de la corteza desde la

ncia por una determinada , referencia de orientación. Si

ela a la superficie, apare. por la orientación de

50 micras se produce un os 1 O grados de ángulo bien do contrario. Esta distribumadamente un milímetro el os 180 grados.


1.2.4. Organización modular. Hubel y Wiesel (1968) propusieron una organización funcional de la corteza estriada que resumía las preferencias oculares y de orientación que hemos comentado anteriormente. Según Hube! (1999) las seis capas de la corteza están organizadas en módulos o hipercolumnas que se distribuyen de forma perpendicular a la superficie. Las dimensiones de los módulos varían de una capa a otra5 pero la organización funcio nal es la misma. La Figura 3.5 presenta una idealización de la organización que caracteriza a cada módulo.

FIGURA 3.5. Organización modular de la corteza visual primaria. Fuente: David H. Hubel. Ojo, Cerebro y Visión. 1999. Murcia: Editorial de la Universidad de Murcia.

Como puede verse, la organización del módulo resume la estructura de columnas que hemos comentado en los puntos 2 y 3 anteriormente. Por un lado el conjunto de columnas alternantes de dominio ocular 1 D 1 D ... organizan la información correspondiente al ojo izquierdo y derecho respectivamente. Por el otro lado se muestra la organización de las columnas de orientación especificando los cambios en orientación a los que las distintas columnas son sensibles. En opinión de Hube! y Wiesel, estas unidades funcionales constituyen el mosaico fundamental que organiza la corteza estriada.

Las investigaciones de Hube! y Wiesel han demostrado también que la organización de la corteza visual estriada no sólo depende de factores ligados a la herencia sino también de factores relacionados con el medio ambiente. Estudiando el comportamiento de las células de la corteza estriada de gatos pequeños en condiciones normales y en condiciones de privación visual pudieron comprobar que, si bien existen células que responden selectivamente a la orientación en los recién nacidos, existen también periodos críticos en las primeras semanas de maduración durante los cuales es necesaria la estimulación ambiental para lograr un desarrollo normal en el funcionamiento de las células de la corteza estriada. El periodo crítico no es el mismo para

5. Para la capa 3 Hube! supone que la superficie cortical correspondiente a un módulo debe ser de 2 x 2. En las capas 5 y 6 la superficie debe ser mayor, mientras que en la capa 4C será más pequeña.


todas las propiedades de la estimulación visual que son procesadas por la corteza estriada. En el caso de la sensibilidad a la orientación el periodo crítico oscila entre la primera y la quinta semana de vida. El periodo crítico para el dominio ocular es más tardío, oscilando entre la quinta y la décima semana de vida. Parece que el periodo crítico está relacionado con el nivel que ocupan las células en el sistema visual y tiene lugar antes para aquellas células que ocupan un nivel más bajo en el mismo ya que su maduración es un requisito necesario para el desarrollo de células que operan a un nivel más alto.

Los trabajos de Hube! y Wiesel constituyen una de las principales aportaciones realizadas al estudio de la percepción visual en el siglo veinte. Su influencia en el desarrollo de la teoría de la percepción de los objetos fue enorme ya que sus descubrimientos parecían apoyar a las teorías basadas en detectores de características. En un capítulo posterior veremos detenidamente estas teorías, ahora estudiaremos la segunda aportación importante que desde el campo de la psicofísica se hizo al estudio de la percepción visual. Esta aportación ha sido la principal alternativa teórica a la interpretación que Hube! y Wiesel hicieron de sus descubrimientos.

2. APROXIMACIÓN PSICOFÍSICA

2.1. El análisis de la frecuencia espacial

Para Hubel y Wiesel lo que hacen las células de la corteza estriada es responder de forma selectiva a características estimulares simples tales como la orientación y el movimiento de líneas y bordes. Estas células son detectores de características. A primera vista, esta interpretación parece la más simple y la más inmediatamente ligada a los hecho experimentales. Sin embargo, un análisis más detallado del problema revela un conjunto de dificultades importantes relacionadas con esta interpretación. Por ejemplo, es verdad que una línea luminosa puede aparecer como el mejor estímulo para una determinada célula, pero no se puede descartar que otros estímulos posibles sean también capaces de estimularla. Ningún experimento puede agotar el conjunto de estímulos eficaces posibles para una célula. Por otra parte, suponer que el análisis más elemental del patrón estimular que realiza el cerebro lo hace en términos de líneas y bordes requeriría una teoría de la percepción capaz de mostrar que todo el conjunto de formas y objetos que somos capaces de percibir es analizable o se puede descomponer en términos de líneas y bordes. No se trata por tanto de negar la existencia de células que responden preferentemente a líneas de una determinada orientación; esto es un hecho experimental bien establecido. Se trata de preguntarse si esa respuesta representa el nivel más elemental de análisis de los objetos que el sistema visual realiza.

La teoría de la frecuencia espacial surgió como una alternativa a la teoría de los detectores de características. El núcleo central de esta teoría sostiene

PERCEPCIÓN VISUAL

e son procesadas por la cor·ientación el periodo crítico a. El periodo crítico para el uinta y la décima semana de

con el nivel que ocupan para aquellas células que aduración es un requisito

, a un nivel más alto. de las principales apor-1 en el siglo veinte. Su · n de los objetos fue

a las teorías basadas en veremos detenidamen

rtación importante que de la percepción visual.

ica a la interpretación que

la corteza estriada es ressimples tales como la células son detectores parece la más simple y tales. Sin embargo, un

nto de dificultades impor' es verdad que una

para una determinada posibles sean también

agotar el conjunto de estísuponer que el análisis

lo hace en términos ión capaz de mostrar que aces de percibir es ana

y bordes. No se trata preferentemente a

hecho experimental bien representa el nivel más

realiza.

de esta teoría sostiene


que el análisis más elemental de los objetos que realiza el sistema visual es en términos de componentes de frecuencia espacial. Para esta teoría el patrón estimular debe ser considerado como una onda compleja de intensidad luminosa que es analizada por el cerebro en términos de sus componentes elementales de frecuencia espacial. Las células de la corteza estriada llevan a cabo ese análisis de componentes porque actúan como filtros espaciales que responden selectivamente a una determinada banda de frecuencias espaciales con preferencia a otras frecuencias. Para comprender mejor esta teoría es necesario que recordemos algunos conceptos de física sobre los que se sustenta esta teoría.

2.2. El concepto de frecuencia espacial

Por muy compleja que sea una onda, existe siempre la posibilidad de analizarla en términos de componentes simples llamados ondas sinusoidales. La Figura 3.6. A representa el gráfico de una onda sinusoidal referida al dominio del espacio. En la parte B de la figura aparece el estímulo correspondiente a la onda sinusoidal. El eje horizontal del gráfico de la onda representa el espacio estimular cuyos cambios en intensidad están representados en el eje vertical. El estímulo varía en intensidad a lo largo de la dimensión horizontal con oscilaciones suaves de zonas claras y oscuras de igual amplitud que se repiten en intervalos iguales. Este tipo de estímulo recibe el nombre genérico de enrejado y el representado en la Figura 3.6 es un enrejado sinusoidal en el que las transiciones entre las zonas claras y las oscuras son suaves y continuas. Cuando estas transiciones son bruscas, como es el caso de la Figura 3.7, el enrejado se denomina de onda cuadrada. De la misma forma que las ondas sinusoidales son los elementos más simples en que podemos analizar una onda, los enrejados sinusoidales son los estímulos más simples que podemos utilizar para estudiar la sensibilidad del sistema visual a la frecuencia espacial.

A. Onda S inus oidal 8 - Enrejado Sinusoidal

FIGURA 3. 6. Función de una onda sinusoidal (A) y enrejado sinusoidal (B).

118

-" ~ ~~+-~~~-+-+-+~~ É .:

J>osicíón horizontal

A. Onda Cuadrada

PERCEPCIÓN VISUAL

B. Enrejado de Onda Cuadrada

FIGURA 3.7. Función de una onda cuadrada (A) y enrejado correspondiente a una función de onda cuadrada (B).

Todo enrejado sinusoidal se caracteriza por cuatro parámetros fundamentales: la frecuencia, amplitud y fase de las ondas sinusoidales que lo caracterizan y la orientación del patrón respecto a la vertical.

1. La frecuencia espacial de un enrejado viene dada por la anchura de las zonas claras y oscuras que lo componen. Un enrejado en el que las zonas claras y oscuras son anchas tendrá menor frecuencia espacial que un enrejado en el que las zonas son estrechas ya que el número de ciclos por unidad de distancia en la onda asociada al enrejado será mayor en el segundo caso que en el primero. La unidad de distancia que se utiliza normalmente es el grado de ángulo visual. El concepto de ángulo visual es sencillo y nos permite relacionar todas las medidas con el observador. En la Figura 3.8 puede verse que una flecha (h) colocada cerca del observador (o) produce una imagen retiniana mayor que otra flecha (h') que se encuentra más alejada. Si para cada flecha trazamos dos líneas que intercepten sus dos extremos y converjan en el ojo del observador, tendremos dos ángulos visuales al y a2 tales que al es mayor que a2. Los ángulos, por tanto, están directamente relacionados con el tamaño de la imagen retiniana y éste, a su vez, está directamente relacionado con el tamaño del estímulo e inversamente relacionado con la distancia a la que el estímulo se encuentra. En el caso de la frecuencia espacial se utiliza el número de ciclos por grado de ángulo visual (c/gav), porque esta medida nos indica directamente las características espaciales del estímulo que llega al observador independientemente del tamaño del estímulo o de la distancia a la que se encuentre.

2. La amplitud de onda de un enrejado es la mayor o menor intensidad luminosa de sus zonas claras u oscuras. Un concepto importante derivado de la amplitud es el de contraste que hace referencia a la diferencia entre zonas claras y zonas oscuras y que se define así:

Contraste = (lmax - Imin) 1 (lmax + Imin)

PERCEPCIÓN VISUAL

·ejado de Onda Cuadrada

\) y enrejado correspondiente ldrada (8).

cuatro parámetros fundamensinusoidales que lo caracteri-

dada por la anchura de enrejado en el que las zonas

· espacial que un enrejado ero Je ciclos por unidad de

en el segundo caso que normalmente es el gra

al es sencillo y nos permite En la Figura 3. 8 puede verse

(o) produce una imagen remás alejada. Si para cada

extremos y converjan en el es al y a2 tales que al es

relacionados con el tá directamente relacionado ·o nado con la distancia a la

frecuencia espacial se utiliza (c/gav), porque esta medida

s del estímulo que llega al estímulo o de la distancia a

mayor o menor intensidad to importante derivado de a la diferencia entre zonas


1 1

------ 0 ------~

FIGURA 3.8. Ejemplo de ángulo visual para un objeto situado a distancias d iferentes.

119

Donde Imax es el punto de máxima intensidad e Imin el punto de mínima intensidad luminosa en el enrejado. Se puede ver claramente que el contraste será igual a cero cuando lmax sea igual a lmin y será igual a uno cuando lmin sea cero. Por tanto, el índice de contraste oscila entre cero - cuando no hay diferencias de intensidad luminosa y tenemos un campo uniforme de luz- y uno, cuando la diferencia entre las zonas sea máxima.

3. La fase de un enrejado se refiere a la posición de la oscilación de la onda sinusoidal en un momento determinado que sirve de punto de referencia. La fase se mide en grados en relación con ese punto de referencia. La onda sinusoidal de la Figura 3.6 en el punto en que comienza está en fase de 0°, también llamada fase seno porque es el punto de comienzo de la inflexión en sentido positivo. Si la onda comenzara en el punto de su máximo valor positivo de amplitud se diría que está en fase de 90°, también llamada fase coseno . Si comenzara en el punto de comienzo de la inflexión en sentido negativo estaría en fase de 180° (fase antiseno) y si lo hiciera en el punto de mínimo valor de amplitud estaría en fase de 270° (fase anticoseno). La fase es, por tanto, una medida de posición y puede variar entre O y 360 grados.

4. La orientación de un enrejado se refiere al grado de desviación de la vertical que presentan sus zonas claras y oscuras. Se suele expresar en grados a partir de la vertical y en sentido contrario al de las agujas del reloj.

2.3. El análisis de Fourier

Una de las grandes ventajas que tiene el estudio del patrón de estimulación visual en términos de ondas, es que la teoría de análisis de ondas está bien establecida en física y por lo tanto podemos utilizar esa teoría para investigar la validez y el alcance de esta concepción estimular en la percepción visual. En 1822 el físico y matemático francés Jean Fourier propuso su teorema fundamental sobre las ondas que dice que cualquier onda, tenga la forma que tenga, se puede expresar de manera única como la superposición (suma) de


ondas sinusoidales de frecuencias y amplitudes definidas. La figura 3.9 muestra la aplicación de este teorema al análisis de una onda compleja como es una onda cuadrada. En la fila F se muestra el gráfico de dicha onda. Teóricamente sus componentes armónicos son infinitos en número, pero en la práctica una onda cuadrada puede aproximarse mediante la suma de un número finito de componentes. La fila E en la figura mencionada muestra cómo la suma de los componentes A, B, C y D produce una onda compleja que se aproxima a la onda cuadrada. La adición de armónicos de mayor frecuencia aproximaría la onda compleja al ideal representado en F.

Los componentes de una onda cuadrada son ondas sinusoidales que guardan entre sí un conjunto de relaciones peculiares. El primer componente es el llamado fundamental que consiste en una onda sinusoidal de igual frecuencia y amplitud que la onda cuadrada. El resto de los componentes se llaman armónicos cuya frecuencia es un múltiplo impar de la frecuencia fundamental y cuya amplitud varía en función de su orden. Así, el segundo componente corresponde al tercer armónico y tiene tres veces la frecuencia del fundamental y un tercio de su amplitud, el tercer componente corresponde al quinto armónico y tiene cinco veces la frecuencia del fundamental y un quinto de su amplitud, etc. Es fácil comprender que cada nuevo armónico que se añade contribuye al total una amplitud cada vez más pequeña, por lo que en la práctica la síntesis de una onda cuadrada puede aproximarse de forma bastante satisfactoria utilizando un pequeño conjunto de armónicos aunque en teoría el

A

B

e

D

E

F

3f

/\f\AC\0 v~vvvst

C:. /\. /"\ C\ C\ /\. Í\ f ~~v v~v 7

\/VVVJ f+3f+Sf+7f

1

onda cuadrada

FIGURA 3.9. De A a E se representan los primeros componentes de la onda cuadrada en F.

PERCEPCIÓN VISUAL

:lefinidas. La figura 3.9 muesa onda compleja como es una de dicha onda. Teóricamente nero, pero en la práctica una suma de un número finito de muestra cómo la suma de los >mpleja que se aproxima a la 70r frecuencia aproximaría la

ondas sinusoidales que guar:. El primer componente es el ;inusoidal de igual frecuencia s componentes se llaman arie la frecuencia fundamental

, el segundo componente la frecuencia del fundamen

te corresponde al quinto mental y un quinto de

evo armónico que se añade ueña, por lo que en la prác

de forma bastante saaunque en teoría el

3f

Sf

?f

Sf+?f

mponentes de la onda

PROCESAMIENTO VISUAL INI CIAL 121

número de componentes sinusoidales de una onda cuadrada sea infinito. En la Figura 3.9 podemos ver que la suma de los tres primeros armónicos al fundamental proporciona una buena aproximación a la onda cuadrada aunque necesitaríamos añadir más para hacer regulares los puntos máximos y mínimos.

De la misma forma que una onda cuadrada, la onda compleja correspondiente a la imagen de un objeto puede ser analizada en sus componentes fundamentales. Una idea general del papel que los distintos componentes de frecuencia espacial juegan en la determinación de una imagen, puede obtenerse considerando la Figura 3.1 O en la que aparece en el centro una fotografía de Albert Einstein. La imagen a la izquierda de la fotografía muestra la misma imagen pero una vez que se han eliminado de ella los componentes de frecuencia espacial alta. La imagen de la derecha es el resultado de haber eliminado los componentes correspondientes a las frecuencias espaciales bajas. Como puede comprobarse, los componentes de frecuencia espacial baja proporcionan información sobre los aspectos globales de la imagen, mientras que los de alta frecuencia la proporcionan de los detalles.

Original

a e

FIGURA 3.1 O. La imagen original de Einstein en el centro ha sido filtrada eliminando los componentes de frecuencia espacial alta en la imagen de la izquierda, y los componentes de frecuencia espacial baja en la imagen de la derecha. En la esquina inferior derecha de las imágenes de los extremos está representado el filtro utilizado en cada caso. Fuente: Visual Perception: Physiology, Psychology and Ecology. Vicky Bruce, Patrick R. Green & Mark A. Georgeson. © 1996. Hove, East Sussex: Psychology Press. Reproducida con autorización de Taylor & Francis Books UK.

2.4. El análisis de Fourier como modelo

Hemos visto hasta ahora que la imagen de intensidad luminosa que proporciona un patrón de estimulación visual puede describirse en términos de análisis de ondas y que esta forma de entender el estímulo proporciona un procedimiento elegante y preciso para su estudio. Considerado en sí mismo, la importancia de este hecho para el estudio de la percepción de la forma es


de carácter meramente instrumental. El análisis Fourier nos proporciona un instrumento de análisis del estímulo útil pero sin una significación psicológica particular. Sin embargo, cabe preguntarse si el sistema visual tiene filtros diferencialmente sintonizados a un determinado rango de frecuencias espaciales con preferencia a otras_ Si éste fuera el caso, entonces cabe pensar que la corteza visual se comporta como un analizador Fourier que, a través del funcionamiento de estos filtros, descompone el patrón estimular en sus elementos constituyentes de frecuencia espacial. Esta idea se puede entender mejor por analogía con la forma en que se procesa el color en la retina. En el capítulo del color hemos visto cómo tres receptores que responden diferencialmente a distintas longitudes de onda son suficientes para producir las señales primarias necesarias para codificar el color. En el caso que ahora nos ocupa se trata de asumir la existencia de un conjunto de receptores que responden diferencialmente a distintas frecuencias espaciales de modo que las frecuencias espaciales altas serían procesadas por canales diferentes a los que procesan las frecuencias espaciales medias y bajas. Evidentemente aún quedaría mucho por explicar en todo lo referente a la percepción de la forma pero la existencia de esos hipotéticos filtros de frecuencia espacial sería un primer paso para poner la teoría de la percepción de la forma sobre un sólido fundamento.

Los defensores de la teoría de la frecuencia espacial opinan que esos receptores de frecuencia espacial existen y han proporcionado una evidencia experimental que vamos a estudiar ahora con más detenimiento.

2.5. Evidencia experimental

La evidencia experimental más relevante a favor de la existencia de filtro de frecuencia espacial es de carácter psicofísico. Como hemos visto en capítulos anteriores, la psicofísica es la parte de la investigación psicológica que trata de establecer relaciones entre las características físicas de los estímulos y la experiencia consciente de las personas utilizando métodos comportamentales. La característica principal de los métodos comportamentales es que en lugar de utilizar técnicas invasoras, analizan cuidadosamente la ejecución del sujeto en tareas muy precisas que permiten hacer inferencias sobre la naturaleza de los procesos que intervienen en la tarea. En el capítulo sobre percepción del color hemos visto cómo los métodos psicofísicos de mezcla de colores permitieron hacer inferencias acertadas acerca del número y naturaleza de los receptores del color y de la existencia de procesos oponentes. En el caso que ahora nos interesa se han utilizado tareas de detección para medir el umbral de contraste de los sujetos y ha sido el comportamiento del sistema en situaciones de umbral el que ha permitido inferir la existencia de diferentes filtros de frecuencia espacial.

El umbral de contraste es el contraste mínimo necesario para distinguir un enrejado sinusoidal de una escena de luminancia homogénea. Para poder determinar la cantidad de contraste necesaria para determinar el umbral es frecuente utilizar el método de ajustes como método psicofísico. En este método el sujeto

PERCEPCIÓN VISUAL

isis Fourier nos proporciona un sin una significación psicológica l sistema visual tiene filtros diferango de frecuencias espaciales ·ntonces cabe pensar que la cor;ourier que, a través del funciorón estimular en sus elementos ra se puede entender mejor por Dlor en la retina. En el capítulo ue responden diferencialmente para producir las señales pricaso que ahora nos ocupa se receptores que responden di

s de modo que las frecuencias diferentes a los que procesan

aún quedaría mucho de la forma pero la existenal sería un primer paso para

un sólido fundamento. espacial opinan que esos re

proporcionado una evidencia detenimiento.

hemos visto en capítulos psicológica que trata de

s de los estímulos y la expe-dos comportamentales. La

ntales es que en lugar de la ejecución del sujeto en sobre la naturaleza de los

sobre percepción del color mezcla de colores permitieron y naturaleza de los receptores

. En el caso que ahora nos inedir el umbral de contraste de

ma en situaciones de umbral el filtros de frecuencia espacial. necesario para distinguir un

· homogénea. Para poder deter. ar el umbral es frecuente . En este método el sujeto


experimental controla el contraste hasta que el enrejado resulta mínimamente perceptible. Como valor de contraste correspondiente al umbral suele tomarse el que es capaz de producir un porcentaje de respuesta correctas determinado.

2.5.1. La Función de Sensibilidad al Contraste (FSC)

Si realizamos un experimento psicofísico de medición del umbral de contraste utilizando un variado número de enrejados sinusoidales de diferentes frecuencias espaciales podemos obtener la función del sensibilidad al contraste de un observador determinado. La sensibilidad al contraste es el valor recíproco del umbral de contraste ya que la sensibilidad al contraste de una persona será mayor cuanto menor sea el valor de contraste de su umbral. La función de sensibilidad al contraste es la función que relaciona la sensibilidad al contraste con la frecuencia espacial de los enrejados utilizados. La Figura 3.11 presenta una FSC típica de una persona adulta en condiciones de visión fotópica. Como puede verse, la función suele ser representada en coordenadas logarítmicas y tiene la forma de U invertida. Todos los puntos en la curva representan la sensibilidad máxima para cada frecuencia espacial. El punto óptimo de sensibilidad se sitúa entre los cuatro y los cinco ciclos por grado de ángulo visual y decae progresivamente a medida que aumenta la frecuencia espacial, de forma que por encima de aproximadamente los cincuenta ciclos por grado de ángulo visual no somos capaces de percibir diferencias entre un enrejado y una superficie de luminancia homogénea.

100.0

~ ~

30.0 e o u

"' 'O

"' ;g 10.0 :.0

·¡¡; e Q)

Vl

3.0

1.0 ~--~~~~--.--....--.-~-,...,..,.,.-----,-..,.-,...., 0.3 1.0 3.0 10.0 30.0

Frecuencia Espacial

FIGURA 3.11. Función de sensibilidad al contraste (FSC) .


La función de sensibilidad al contraste permite caracterizar la sensibilidad de un determinado sistema visual. Si el experimento de determinación de umbral de contraste se hiciera en condiciones de visión escotópica la sensibilidad a todas las frecuencias sería mucho menor pero afectaría más a las altas que a las bajas frecuencias porque al faltar la contribución de los conos se perdería la agudeza visual que permite percibir los detalles de un objeto.

2.5 .2. Predicciones a partir de la FSC

La función de sensibilidad al contrate es un instrumento valioso para poder explorar la posible existencia de filtros especialmente sintonizados a un determinado rango de frecuencias espaciales. Campbell y Robson (1968) utilizaron la FSC de sus sujetos experimentales para comparar su sensibilidad a las ondas cuadradas con su sensibilidad a las ondas sunusoidales. El fundamento lógico de sus investigaciones consistía en suponer que, si el sistema visual posee filtros sintonizados a diferentes frecuencias espaciales y realiza un análisis del patrón estimular en términos de componentes sinusoidales, entonces la respuesta correspondiente al umbral de detección de un enrejado de onda cuadrada está determinada por la respuesta de los filtros a los distintos componentes sinusoidales de la onda cuadrada. Una primera predicción de este supuesto es que si comparamos el umbral de detección de una onda cuadrada de 26 c/gav con el de una onda sinusoidal de la misma frecuencia no debe haber ninguna diferencia porque en ambos casos el sistema visual está respondiendo únicamente a una onda sinusoidal de 26c/gav. Aunque la onda cuadrada tiene más componentes sinusoidales, el sistema visual no es sensible a los mismos ya que incluso el armónico de menor frecuencia, que tendrá 78 c/gav, no cae dentro del rango de frecuencias que el sistema visual puede detectar. Por otra parte, si comparamos el umbral de detección de una onda cuadrada de 2 c/gav con el de una onda sinusoidal de la misma frecuencia, entonces el umbral para la detección de la onda cuadrada debe ser más bajo, es decir la sensibilidad más alta, que para la onda sinusoidal porque la onda cuadrada tendrá, además del componente fundamental de 2 c/gav, un armónico de 6 c/gav cuyo umbral de detección es más bajo que el correspondiente al fundamental según la FSC. Campbell y Robson comprobaron que predicciones como éstas eran confirmadas por los datos experimentales y concluyeron que el sistema visual está dotado de filtros sintonizados a rangos determinados de frecuencia espacial.

2.5.3. Los posefectos de frecuencia espacial

Al estudiar el procesamiento oponente del color vimos que, si miramos durante un tiempo prolongado a una superficie de un color fundamental, por ejemplo rojo, y luego cambiamos la mirada hacia una superficie blanca, veremos la superficie blanca coloreada con el matiz complementario, el verde.

p

A ti SI

h b o p ti rr u d

p< dt m

el p< lil

PERCEPCIÓN VISUAL

:rmite caracterizar la sensibilidad de determinación de um

visión escotópica la sensibilidad afectaría más a las altas que a ción de los conos se perdería es de un objeto.

umento valioso para poder te sintonizados a un deter-

ell y Robson (1968) utilizaron su sensibilidad a las ondas

oidales. El fundamento lógico . si el sistema visual posee filtros y realiza un análisis del patrón

es, entonces la respuesta cojado de onda cuadrada está

os distintos componentes sinde este supuesto es

na onda cuadrada de 26 c/gav · no debe haber ninguna

al está respondiendo únicae la onda cuadrada tiene más sensible a los mismos ya que

78 c/gav, no cae dentro ' e detectar. Por otra parte,

da cuadrada de 2 c/gav con entonces el umbral para la es decir la sensibilidad más

cuadrada tendrá, además del de 6 c/gav cuyo umbral de

fundamental según la FSC. como éstas eran confir

que el sistema visual está de frecuencia espacial.

vimos que, si miramos duun color fundamental, por una superficie blanca, ve

complementario, el verde.


A este fenómeno sensorial se le denomina posefecto de color. El posefecto tiene lugar porque los receptores que responden al rojo, debido a la exposición prolongada al estímulo, pierden sensibilidad y se adaptan, es decir se hacen menos sensibles al estímulo. Así, cuando la mirada se centra en la luz blanca, los receptores del rojo responden con menor intensidad que los de su oponente, el verde. Los posefectos, en general, constituyen un fenómeno que proporciona buena información sobre la existencia y naturaleza de distinto tipo de receptores. En el estudio de los filtros espaciales que ahora estudiamos, se ha aplicado también la lógica subyacente a los posefectos para poder inferir la existencia de múltiples filtros espaciales. El razonamiento se entenderá mejor por referencia a la Figura 3.12.

100.0

~ ~ e 30.0 o u r1l

"O r1l

:2 :.0 10.0 ·v; e (lJ Vl

3.0

0.3 1.0 3.0 10.0 30.0

Frecuencia Espacial

FIGURA 3.12. Representación de la función de sensibilidad al contraste como envolvente de filtros hipotéticos.

La figura presenta la posible relación entre la FSC y un conjunto de hipotéticos filtros espaciales. El número de filtros es arbitrario y carece ahora de importancia. Lo que importa es que la figura hace patente que, si existen múltiples filtros espaciales, la FSC es el resultado de la actividad de todos ellos. Técnicamente se dice que es la envolvente que encierra y reúne el comportamiento de muchos más canales cada uno de ellos sintonizado a un rango limitado de frecuencias espaciales.


Supongamos ahora que sometemos a un sujeto experimental a una exposición prolongada de un enrejado sinusoidal de una frecuencia espacial particular. Si a continuación comprobamos la sensibilidad al contraste del sujeto verificando el estado de su FSC6 y lo comparamos con el estado de la FSC previo a la adaptación, podemos sacar conclusiones acerca de la existencia o no de múltiples filtros o canales de frecuencia espacial. Consideremos primero la hipótesis de que no existen múltiples filtros sino que la frecuencia espacial se procesa por un único canal y que la FSC refleja el estado de ese canal. Entonces la adaptación producida por la exposición prolongada al enrejado afectará a todas las frecuencias espaciales y la FSC posterior a la adaptación mostrará una menor sensibilidad, es decir un umbral más alto, para todas las frecuencias espaciales del dominio de la función. Sin embargo, si existen varios canales sintonizados a diferentes frecuencias espaciales, la adaptación producida por la exposición prolongada afectará únicamente a los receptores sintonizados con esa frecuencia por lo que la FSC posterior a la adaptación mostrará una menor sensibilidad únicamente para las frecuencias iguales a las utilizadas en la fase de adaptación, mostrando una especie de bache en la zona correspondiente a esas frecuencias espaciales. Blakemore y Campbell (1969) confirmaron experimentalmente la aparición de baches de sensibilidad en la zona de las frecuencias utilizadas en la fase de adaptación de sus experimentos mientras que la sensibilidad para las frecuencias que no habían sufrido adaptación permanecía sin cambio. Estos datos claramente favorecen la existencia de canales múltiples en el procesamiento de la frecuencia espacial.

2.5 .4. Manipulación de la fase de los enrejados

Otro tipo de experimento favorable a la existencia de múltiples canales o filtros en el procesamiento de la frecuencia espacial ha utilizado el hecho de que la síntesis de dos ondas sinusoidales que están en la misma fase produce una onda compleja cuya amplitud es igual a la suma de las amplitudes de los componentes sinusoidales; pero la síntesis de dos ondas sinusoidales cuyos componentes tienen una diferencia de fase de 180° produce una onda compleja cuya amplitud es igual a la diferencia de las amplitudes componentes. La Figura 3.13 muestra la forma de las ondas de los enrejados utilizados por Graham y Nachmias (1971).

La fila inferior muestra la forma de las ondas complejas utilizadas como estímulo. Las dos primeras filas muestran los componentes sinusoidales utilizados para sintetizar los estímulos. La amplitud y frecuencia de los componentes es la misma para ambos estímulos. Lo único que varía de un estímulo a otro es la secuencia de fase de sus componentes. El razonamiento de Graham

6. El procedimiento es largo y requiere comprobar la sensibilidad del sujeto a varia frecuencias espaciales, incluida la utilizada en la fase de adaptación.

PERCEPCIÓN VISUAL

ujeto experimental a una expode una frecuencia espacial parQsibilidad al contraste del sujeto amos con el estado de la FSC

siones acerca de la existencia o espacial. Consideremos prime-os sino que la frecuencia espa

C refleja el estado de ese canal. osición prolongada al enrejado FSC posterior a la adaptación

n umbral más alto, para todas tmción. Sin embargo, si existen encías espaciales, la adaptación

únicamente a los receptores FSC posterior a la adaptación para las frecuencias iguales a

o una especie de bache en la s. Blakemore y Campbell

de baches de sensibilidad de adaptación de sus expe-

frecuencias que no habían su-• datos claramente favorecen la

ro de la frecuencia espacial.

ncia de múltiples canales o · ha utilizado el hecho de n en la misma fase produce

suma de las amplitudes de los dos ondas sinusoidales cuyos 180° produce una onda com-las amplitudes componentes. e los enrejados utilizados por

complejas utilizadas como mponentes sinusoidales uti

d y frecuencia de los compoco que varía de un estímulo a El razonamiento de Graham

la sensibilidad del sujeto a varia fren.


[\1\f\[\f\í\ '1/\í\í\L'\í\Í ; v~v v~c \J ~~ ~v

~w e A B

127

FIGURA 3.13. La manipulación de la fase hace que la síntesis de los dos componentes A y B produzcan diferentes estímulos ( Graham y Nachmias, 1971).

y Nachmias fue el siguiente: si el sistema visual funciona de acuerdo con un modelo de canal único en el que el estímulo se procesa como una totalidad, el estímulo correspondiente a la onda A será más fácil de detectar que el correspondiente a la onda B ya que el contraste es mayor en A que en B. Sin embargo, si el sistema visual analiza el estímulo respondiendo diferencialmente a sus componentes sinusoidales, entonces los dos estímulos mostrarán el mismo umbral de detección ya que la amplitud y frecuencia de sus componentes es la misma. Los resultados mostraron que el umbral de detección era igual para los dos estímulos.

Existe una gran cantidad de experimentos que muestran de forma convincente la existencia de filtros espaciales. Los que aquí hemos estudiado son un buen ejemplo de distintos procedimientos y razonamientos que merece la pena entender bien. No obstante debe quedar claro que aún no se ha podido aislar esos filtros en el nivel fisiológico. Por ahora son entidades hipotéticas hacia cuya existencia apuntan gran cantidad de resultados experimentales.

2.6. Función de la corteza visual primaria

Algunos autores piensan que las células encontradas por Hubel y Wiesel en la corteza estriada son en realidad filtros espaciales y proponen una interpretación de lo que hacen las células simples y complejas en términos de análisis de frecuencia espacial en lugar de en términos de detectores de características. Tal es el caso de Russell y Karen DeValois, importantes investigadores de la universidad de Berkeley cuyas aportaciones a la investigación del procesamiento oponente del color ya hemos estudiado. En el laboratorio de los DeValois, Albrecht (ver DeValois y DeValois, 1988) estudió cuidadosamente la respuesta de células simples de la corteza visual ante una barra estrecha


blanca y negra. Observó que la respuesta de las células presentaba oscilaciones adicionales a ambos lados de la respuesta principal a la barra tal como se muestra en la Figura 3.14.

1~ l A o 5

10

~ 10 l ¡¡j 5 "' B o o ~ 5 ¡¡; ¡jj10 (f)

Dominio del espacio (CR)

o

o

o

FIGURA 3.14. Respuestas de células simples de la corteza visual ante una barra estrecha blanca y negra. Fuente: Russell L. DeValois & Karen K. DeValois. Spotial

Vision . New York: Oxford University Press, p. 122, fig. 4.14.

Curiosamente este tipo de respuesta es el que se puede predecir a partir de la respuesta que estas células dan a enrejados de diferentes frecuencias espaciales. DeValois y DeValois (1988) han encontrado también campos receptivos de diferentes tamaños, unos grandes que responden a una estructura espacial gruesa y otros pequeños que responden a una estructura espacial fina. Por otra parte existe una correlación entre el tipo de campo receptivo y el número de oscilaciones colaterales que presenta la respuesta de las células. Las células con campos receptivos pequeños tienden a presentar mayor número de oscilaciones que las de campos receptivos más grandes. Los DeValois han interpretado todos estos resultados en el sentido de que la función de al menos algunas células de la corteza visual es analizar la frecuencia espacial del patrón estimular. En opinión de los DeValois estas células serían la realización fisiológica de los filtros espaciales que llevan a cabo un análisis local de las frecuencias espaciales. El análisis se llama local porque está restringido a los pocos grados de ángulo visual que registra el campo receptivo de cada célula. La forma que adoptan estos campos receptivos puede describirse por medio de

PERCEPCIÓN VISUAL

las células presentaba oscilaciol principal a la barra tal como se

D (CR)

corteza visual ante una barra & Karen K. DeValois. Spatial

SS, p. 122, fig. 4.14.

ue se puede predecir a partir de diferentes frecuencias

contrado también campos reue responden a una estructura a una estructura espacial fina. o de campo receptivo y el nú

respuesta de las células. Las a presentar mayor número grandes. Los De Valois han

de que la función de al mer la frecuencia espacial del células serían la realización

bo un análisis local de las freue está restringido a los poreceptivo de cada célula. La

ede describirse por medio de


FIGURA 3.15. Sección transversal de un filtro de Gabor. Este filtro es el producto de un sinusoide y una función de Gauss.

una función de Gabor que es una función equivalente a multiplicar una función sinusoidal por una función normal tal como se muestra en la Figura 3.15.

Obsérvese la semejanza entre la forma de la función de Gabor en esta figura con la respuesta de las células de la Figura 3.14. Los DeValois y sus colaboradores midieron cuidadosamente la respuesta de las células simples y complejas de Hubel y Wiesel a la frecuencia espacial. Encontraron que el grado de respuesta a la frecuencia espacial se extendía en un continuo que iba desde células que tenían un campo receptivo finamente sintonizado a determinadas frecuencias espaciales a células con una sintonía mucho más amplia. En general las células que responden a frecuencias espaciales altas tienen campos receptivos más estrechos que las células sintonizadas a frecuencias espaciales bajas. También suele ocurrir que las células simples tienden a responder a una banda de frecuencias más estrecha que las complejas aunque la diferencia no es muy grande. El grado de selectividad a la frecuencia espacial está correlacionado con el grado de selectividad a la orientación: las células que responden a bandas estrechas de frecuencia espacial también responden a un rango estrecho de orientaciones diferentes y las que responden a un rango amplio de frecuencias espaciales también lo hacen a un amplio rango de orientaciones.

Para los DeValois también la corteza estriada está organizada funcionalmente en módulos, pero han propuesto una ampliación de la idea de Hubel y Wiesel añadiendo una tercera dimensión que es la frecuencia espacial. El módulo cortical sería parecido al de la figura 2.5 pero ampliando la representación de la superficie que muestra la orientación de las líneas. En esta superficie la frecuencia espacial estaría representada desde el centro hacia la periferia de cada orientación. De este modo las bajas frecuencias espaciales estarían representadas en el centro mientras que la representación se desplazaría hacia la periferia a medida que la frecuencia espacial aumentara. Para los


DeValois, por tanto, el hecho de que las células de la corteza estriada procesen frecuencia espacial no es un hecho contrario a la propuesta de Hube! y Wiesel respecto a las mismas sino complementario. También las implicaciones para una teoría de la percepción no necesitan ser antagónicas. En el capítulo sobre la percepción del color vimos que la teoría tricromática y la de los procesos oponentes fueron consideradas antagónicas durante mucho tiempo y posteriormente se pudo ver que eran complementarias a distintos niveles de procesamiento. Es posible que lo mismo pueda ocurrir con las dos interpretaciones que se han dado al funcionamiento de las células de la corteza estriada. Es posible que en un primer nivel de procesamiento tenga lugar un barrido del patrón estimular que lo descomponga en términos de frecuencias espaciales y que los detectores de características representen un nivel de procesamiento posterior. Una propuesta como ésta fue de hecho formulada por David Marr al exponer su primera fase en el procesamiento de los objetos visuales. Pero la propuesta de David Marr estuvo hecha desde una perspectiva de carácter computacional y es este tipo de aproximación el tercer punto de interés de este tema que ahora pasamos a considerar.

3. LA APROXIMACIÓN COMPUTACIONAL

En el capítulo primero vimos que la aproximación computacional ha aportado a la teoría de la percepción entre otras cosas el interés por la especificación precisa de los procesos mediante su formalización en términos de programas. También vimos que la teoría de David Marr fue en su momento un verdadero punto de inflexión dentro de la teoría de la percepción visual, influyendo considerablemente en la forma de pensar acerca de los procesos perceptivos. Al exponer la teoría de Marr, mencionamos tres niveles de organización del procesamiento visual: esbozo primario, el esbozo 2. 1/z -D, y el esbozo 3-D. En este capítulo vamos a estudiar con mayor detalle la fase correspondiente al esbozo primario en el que Marr abordó el problema fundamental que ahora nos ocupa, el referente a la representación perceptiva más elemental o primitiva.

3.1. El esbozo primario

El propósito de la primera fase, llamada esbozo primario, es hacer explícitos tanto los cambios de intensidad de la imagen que proporcionan las vías visuales, como la distribución de esos cambios en la escena y su organización geométrica. La descripción explícita de esos cambios se hace especificando las características primitivas simbólicas de la imagen que, según David Marr, son cuatro: bordes, barras, terminaciones y manchas y los parámetros fundamentales de cada una de esas características primitivas que son: posición, tamaño, orientación y contraste. El punto de partida de esta fase es la imagen

PERCEPCIÓN VISUAL

a corteza estriada procesen ·opuesta de Hube! y Wiesel lién las implicaciones para inicas. En el capítulo sobre nática y la de los procesos te mucho tiempo y postedistintos niveles de proce

on las dos interpretaciones l de la corteza estriada. Es Lenga lugar un barrido del ; de frecuencias espaciales un nivel de procesamiento ormulada por David Marr los objetos visuales. Pero

na perspectiva de carácter r punto de interés de

utacional ha aportapor la especificación

términos de programas. momento un verdadero

visual, influyendo los procesos perceptivos.

les de organización del y el esbozo 3-D. En

correspondiente al esamental que ahora nos elemental o primitiva.

rio, es hacer explícitos orcionan las vías vi

ena y su organización se hace especificando

1 que, según David Marr, y los parámetros fun-

1 • ·vas que son: posición, de esta fase es la imagen


bidimensional proporcionada por los receptores visuales que representa la distribución de luminancia de la escena y que es una representación analógica7 de la misma. El resultado final es una representación simbólica8 formada por los cuatro tipos de características mencionadas que describen los cambios de intensidad y que, organizadas en conjuntos resultantes de la aplicación de principios de agrupamiento, servirán como descripción básica9 a los restantes niveles de procesamiento. Para David Marr, por tanto, el sistema visual se hace simbólico muy pronto, en la primera fase de procesamiento, dando lugar a una descripción de la imagen considerablemente reducida en comparación con la imagen original pero que sigue conservando los aspectos importantes necesarios para el análisis de la imagen.

Para lograr los objetivos del esbozo primario, Marr asume que los mecanismos visuales operan con un conjunto de constricciones o supuestos respecto a la naturaleza de las imágenes. Estos supuestos son de carácter general y hacen referencia tanto a la naturaleza de las superficies en el mundo visual como al modo en que esas superficies se representan en la imagen. Por ejemplo, Marr cree lógico suponer que el mundo visible está compuesto de superficies lisas que tienen funciones de reflectancia cuya estructura espacial podemos descubrir. También piensa que las funciones que describen las superficies pueden hacerlo en escalas diferentes; unas nos describen los aspectos globales de la superficie, otras los aspectos referentes al detalle, etc. En general Marr asume que las superficies constitutivas de las imágenes visuales son estables, tienen un alto grado de homogeneidad y las transiciones de luminancia dentro de ellas tienden a ser suaves y no bruscas. Estos supuestos generales permiten orientar el funcionamiento del sistema en esta primera fase.

El esbozo primario incluye dos subfases. En la primera, llamada esbozo primario bruto, Marr estudió los procesos que permiten pasar de la descripción analógica proporcionada por la distribución de luminancia que describe la escena, a la descripción simbólica basada en las características primitivas. La segunda, llamada esbozo primario completo, está dedicada a la exposición de los principios de organización que permiten agrupar las características primitivas en conjuntos y zonas que estructuran la escena. Dado que la importancia de estos principios de agrupamiento y de organización exige un tratamiento detallado que llevaremos a cabo en el capítulo 6, nos centraremos aquí en la exposición del esbozo primario bruto cuya problemática es la que estamos estudiando en este capítulo.

7. Una representación es analógica cuando, para representar una dimensión de la escena representada, utiliza el mismo tipo de dimensión en la representación. En nuestro caso, la distribución espacial de luminancia de la escena es representada en la distribución espacial de luminancia de las vías visuales. La similitud entre la dimensión representante y la representada es la base para llamar a la representación <<analógica>>.

8. En este contexto <<simbólica» significa que la representación utiliza un conjunto discreto de características para clasificar los cambios de intensidad que son relevantes en la escena.

9. Por esta razón las características suelen recibir el nombre de primitivas.


3.2. El esbozo primario bruto

El punto de partida del procesamiento visual es la imagen más simple que pueden producir el conjunto de nuestros receptores: una representación bidimensional de los distintos niveles de intensidad luminosa que tienen los puntos que la componen10 . Es una representación monocromática, monocular y estática. Podemos imaginarla como la superficie de una televisión en blanco y negro compuesta por puntos elementales o píxeles cada uno de los cuales tiene un nivel particular de intensidad luminosa. Aunque la distribución de los receptores en la retina no tiene la homogeneidad espacial que tienen los píxeles de una pantalla, la diferencia no es relevante para comprender el funcionamiento de esta fase de procesamiento.

El esbozo primario bruto tiene como objetivo proporcionar una descripción de los cambios de luminancia existentes en la imagen en diferentes escalas y clasificar los que sean relevantes en las cuatro categorías de características primitivas que hemos mencionado antes. Tanto David Marr (Marr y Hildreth, 1980) como la mayor parte de los investigadores en inteligencia artificial han prestado especial atención a la clasificación de los bordes, por ello nos centraremos en su estudio y nos servirán como ejemplo en la comprensión del esbozo primario bruto.

A partir de la imagen en nivel de gris, la detección de los bordes tiene lugar por medio de un conjunto de operaciones que pueden ser desglosadas de la forma que a continuación se indica.

3.2.1. Filtrado de la imagen. La imagen es analizada a distintos niveles de detalle, unos más globales y otros más precisos. En este punto Marr y Hildreth incorporan la idea de los filtros espaciales que hemos estudiado anteriormente. Para ellos la forma de los filtros espaciales es parecida al sombrero mexicano propio de una curva normal (gaussiana) bidimensional, y dependiendo del mayor o menor tamaño del campo receptivo de los filtros, se producirá un mayor o menor grado de apariencia difuminada en la imagen. La figura 3.1 O permite captar el resultado de la actuación de estos filtros . La imagen en (a) es la fotografía original, los filtros amplios proporcionan en (b) una imagen más difuminada que la proporcionada en (e) por los estrechos, debido a que son sensibles a las frecuencias espaciales bajas que son las que proporcionan información sobre los aspectos globales de la escena. Por el contrario, los filtros estrechos proporcionan información de los detalles de la imagen ya que son sensibles a las frecuencias espaciales altas. El filtrado de la imagen se puede entender también por referencia a los píxeles de una pantalla de televisión o de un monitor de ordenador. Un filtrado de la imagen es equivalente a sustituir el valor de luminancia de cada píxel por el valor de luminancia promedio de un conjunto de píxeles de su entorno. Cuanto mayor

10. Suele ser llamada imagen en nivel de gris.

PERCEPCIÓN VISUAL

es la imagen más simple que :ores: una representación bidil luminosa que tienen los punmonocromática, monocular y le de una televisión en blanco

cada uno de los cuales . Aunque la distribución de ·dad espacial que tienen los

para comprender el fun-

o proporcionar una descripimagen en diferentes escalas categorías de características

, David Marr (Marr y Hildreen inteligencia artificial

de los bordes, por ello nos jemplo en la comprensión del

tección de los bordes tiene que pueden ser desglosadas

analizada a distintos niveles . En este punto Marr y

que hemos estudiado an-aciales es parecida al som

(gaussiana) bidimensional, y o receptivo de los filtros, difuminada en la imagen.

actuación de estos filtros. La amplios proporcionan en (b)

en (e) por los estrechos, ciales bajas que son las que obales de la escena. Por el

· n de los detalles de espaciales altas. El filtrado

,.Q,,Qnr•' a los píxeles de una or. Un filtrado de la imagen

de cada píxel por el valor de su entorno. Cuanto mayor


sea el número de píxeles que forman el conjunto de puntos que se promedian, más ancho será el filtro. El filtrado de la imagen permite un análisis de la misma escena en diferentes escalas y una determinación de las diferencias en luminancia para cada escala de filtrado de la imagen.

3.2.2. Localización de los puntos de cruce de cero. Para entender suficientemente este segundo paso es conveniente repasar algunos conceptos elementales relacionados con el análisis de imágenes. La Figura 3.16 nos será útil para este propósito.

El apartado A de la figura presenta una imagen sencilla formada por un borde producido por un cambio brusco en la luminancia de la escena. En B la figura ha sido digitalizada, es decir sustituida por una matriz cuyas entradas representan puntos en la imagen y en la que el valor numérico de cada entrada representa la intensidad luminosa de cada punto. Podemos observar que el borde está situado en la parte de la figura en la que se produce la transición desde una intensidad baja (02, en unidades arbitrarias) a una alta (10). En C se presenta el gráfico que muestra la intensidad luminosa para cada punto en la dirección horizontal de la imagen en A.

Unas nociones elementales de cálculo nos enseñan que la derivada de una función en un punto nos informa sobre el cambio de los valores de la función en ese punto. El apartado D de la Figura 3.16 nos presenta el gráfico de la función derivada de la función representada en C. Este gráfico representa el cambio de intensidad que tiene lugar para cada punto en la dirección horizontal de la imagen. En una imagen digitalizada, como la representada en B, se puede hallar la función derivada a lo largo del eje horizontal calculando la diferencia entre los valores de los puntos vecinos a lo largo de dicho eje. En el campo de la inteligencia artificial estos cálculos se llevan a cabo por medio de operadores de bordes como los representados en el apartado E de la Figura 3.16. Un operador de bordes es un esquema de cómputo para integrar los valores de intensidad de un determinado entorno de píxeles adyacentes en la imagen; el resultado del cómputo es un número que nos informa sobre la existencia o no existencia de un borde. Por ejemplo, los operados que se muestran en E indican el peso o signo que debe darse a cada valor de intensidad antes de proceder a la suma de los valores a los que se aplica. El primero de ellos, El, se aplica a conjuntos de dos puntos e indica que el valor de intensidad del primer punto debe ir dotado de signo negativo mientras que el valor de intensidad del segundo es positivo. Al aplicar este esquema de cómputo a dos puntos contiguos lo que se hace es calcular la diferencia entre las intensidades de los dos puntos. Si no hay diferencia el resultado será igual a cero. Si hay diferencia, el número resultante nos indicará la magnitud de la diferencia y el signo la dirección del cambio ya que un número positivo indica un cambio de menos a más intensidad y un negativo indica un cambio de más a menos intensidad. Si se aplica de forma sistemática este operador a la imagen digitalizada del apartado B, comenzando por la parte superior izquierda y

A Ol

02

02

02

02

02

02

02

e 10

o a 't) t':l :2 06 In e: ~ 04 e:

02

00

B F G 02 02 02 10 10 10 10 00 00 00 +8 00 00 00 00 00 +a -8 00 00 02 02 02 10 10 10 10 00 00 00 •8 00 00 00 00 00 +a -a 00 00 02 02 02 10 10 10 10 00 00 00 +8 00 00 00 00 00 +8 -8 00 00 02 02 02 10 10 10 10 00 00 00 +a 00 00 00 00 00 +O -a 00 00 Ol 02 02 10 10 10 10 00 00 00 +8 00 00 00 00 00 +8 -8 00 00 02 02 02 10 10 10 10 00 00 00 +8 00 00 00 00 00 +8 -o 00 00

02 02 02 10 10 10 10

02 02 02 10 10 10 10

00 00 00 +8 00 00 *1 00 00 00 •8 oo o o loo

00 00 +8 -o 00 00 00 00 +8 -o 00 00

E1 BE] T T

E2l•tl-21•11 1

't) t':l :2 In e: QJ .... e:

08

00

•8l H ~ ~ 00

•••• L\!PIIdode<lucedecero ~ e:

-8, 1 1 1 ) 1 1

FIGURA 3.16. Ejemplo del proceso de digitalización de una imagen y de su convolución con dos operadores diferentes. La imagen en A cuya función se representa en C, aparece digitalizada en la matriz B. Mediante la aplicación de un operador de primer orden (El) se obtiene la primera derivada de la imagen en A cuya representación aparece en forma digital en F y en forma gráfica en D. Mediante la aplicación de un operador de segundo orden (E2) se obtiene la segunda derivada

de la imagen en A cuya representación aparece en forma digital en G y en forma gráfica en H.

....... w .¡::..

>-¡;)

m ;:o () m >-¡;) ()

o, z < V: ~ r-

U31UI

PERCEPCIÓN VISUAL

e e

N e o e


procediendo hacia abajo, obtendremos los valores que aparecen en la primera columna de la matriz mostrada en F. El resto de los valores de la matriz se obtiene repitiendo la misma operación de arriba abajo pero comenzando una columna más a la derecha. Obsérvese que todos los valores de la matriz en F son iguales a cero para los puntos en que no hay cambio en los valores de intensidad y son distintos de cero en los puntos en los que se produce el cambio de intensidad con un valor ( + 8) igual a la magnitud de la diferencia en intensidades y un signo apropiado a la dirección del cambio. La operación que acabamos de realizar, consistente en hallar la suma ponderada de sus intensidades para cada dos puntos de la imagen a lo largo de todos los puntos de la imagen, recibe el nombre de convolución de un operador de bordes con una imagen. Obsérvese que si trazáramos el gráfico de los valores de la matriz en F para los puntos de la matriz en la dirección horizontal, el resultado sería igual que el gráfico mostrado en D que es el de la derivada de la función de intensidad.

Un operador como el que acabamos de estudiar recibe el nombre de operador diferencial de primer orden porque calcula la diferencia simple entre píxeles contiguos. El resultado de la convolución del operador con la imagen nos permite detectar los puntos en los que tiene lugar un cambio de intensidad dando lugar a un borde. El borde viene indicado por los valores extremos de la matriz resultante.

El operador mostrado en el apartado E2 de la Figura 3.16 presenta un esquema de cómputo más complejo que el anterior. Es un operador diferencial de segundo orden porque su convolución con una imagen equivale a calcular la segunda derivada de la función de intensidad de la imagen. El apartado G de la Figura 3.16 presenta el resultado de aplicar este operador a la imagen digitalizada en B11 y el apartado H presenta el gráfico de los valores obtenidos en G que corresponden a la segunda derivada de la función de intensidad. Al punto en el que la función pasa por el valor cero cuando baja desde su valor máximo ( + 8) a su valor mínimo (-8) se le llama punto de cruce de cero. En la figura aparece indicado por una flecha. Los puntos de cruce de cero son los indicadores de un borde cuando se utiliza un operador diferencial de segundo orden. Obsérvese que no son puntos de cruce de cero todos los puntos de la imagen en los que el valor de la segunda derivada de la función de intensidad es cero sino sólo aquellos en los que la segunda derivada cruza un valor cero flanqueado por valores extremos. Obsérvese también que los puntos de cruce de cero producidos por un operador diferencial de segundo orden son en la imagen los mismos que muestran un valor extremo como resultado de la aplicación de un operador diferencial de primer orden. La razón para preferir un tipo u otro de operador depende de criterios relacionados con las mayores

11. El mismo resultado que presenta la matriz en G puede obtenerse aplicando el operador El a la matriz F, es decir hallando la derivada de la derivada (segunda derivada) de la función de intensidad.


+

FIGURA 3.17. Forma simétrica circular del operador laplaciano utilizado por Marr y Hildreth.

e o

FIGURA 3.18. Ejemplo de la aplicación del operador laplaciano representado en la Figura 3.17 a una imagen particular. En A aparece la imagen en nivel de gris de una planta situada detrás de una alambrada. En B la imagen resultante de lo convolución de la imagen en A con un operador laplaciano, después de ser filtroda por un filtro gaussiano con una desviación típica equivalente a 8 píxeles. En C se muestran respectivamente en blanco y negro los valores positivos y negativos resultantes de la convolución anterior. En O solamente se muestran los puntos de cruce de cero. Como puede verse, los puntos de cruce de cero proporcionan una buena base sobre la cual determinar los bordes de la imagen. Fuente : David Marr. Vision: A Computational lnvestigation into the Human Representation and

Processing of Visuallnformation . 1982. New York: Henry Holt.

PERCEPCIÓN VISUAL

erador laplaciano utilizado

laplaciano representado en la imagen en nivel de gris

B la imagen resultante de la placiano, después de ser filtra

equivalente a 8 píxeles. En C valores positivos y negativos

se muestran los puntos de cruce de cero proporcionan de la imagen. Fuente: David Human Representation and York: Henry Holt.


o menores ventajas computacionales de cada algoritmo 12, tema complejo que queda fuera de los objetivos de este libro.

Ahora estamos en condiciones de entender un poco mejor la teoría de David Marr respecto al esbozo primario bruto. Para cada imagen filtrada a diferentes niveles de frecuencia espacial se lleva a cabo la convolución de esa imagen con un operador diferencial de segundo orden 13 como el mostrado en la Figura 3.17 con el fin de determinar los puntos de cruce de cero indicadores de la presencia de un borde. La figura 3.18 proporciona un ejemplo del resultado de las fases correspondientes a la diferenciación de la imagen de una planta situada detrás de una alambrada.

En A aparece la imagen en nivel de gris de la planta. En B la imagen resultante de la convolución de la imagen en A con un operador laplaciano, como el de la figura 3.17, después de ser filtrada por un filtro gaussiano con una desviación típica equivalente a 8 píxeles. En C se muestran respectivamente en blanco y negro los valores positivos y negativos resultantes de la convolución anterior. En D solamente se muestran los puntos de cruce de cero. Como puede verse, los puntos de cruce de cero proporcionan una buena base sobre la cual determinar los bordes de la imagen.

FIGURA 3.19. Ejemplo adicional que muestra la relación entre una imagen original (izquierda) y los puntos de cruce de cero resultantes de la convolución de la imagen con un operador laplaciano. Fuente: David Marr. Vision: A Computational lnvestigation into the Human Representation and Processing of Visuaflnformation.

1982. New York: Henry Holt.

12. Las razones que llevaron a Marr y Hildreth a preferir un operador de segundo orden no son universalmente aceptadas. De hecho, algunos de los algoritmos actuales prefieren partir de operadores de primer orden como es el caso de Canny. Una inrroducción interesante al tema de visión en máquinas es la de Ja in, Kasturi y Schunck (1995).

13. El operador de segundo orden utilizado por Mar y Hildreth es más complejo que el explicado en el texto. Utilizaron un operador laplaciano que calcula la segunda derivada de la función de intensidad de la imagen simultáneamente en las dos dimensiones. Al aplicarse junto con un filtro gaussiano produce un operador como el de la figura 3.17. Este operador puede calcular la segunda derivada de una imagen bidimensional en rodas las direcciones en un espacio continuo.


La Figura 3.19 proporciona otro ejemplo del valor informativo que proporcionan los puntos de cruce de cero. La imagen de la derecha muestra los puntos de máximo contraste de la imagen de la izquierda hallados mediante un operador diferencial de segundo orden. En la imagen de la derecha se ha variado la intensidad de las líneas de modo que las que tienen un mayor contraste sean más intensas. Los puntos de cruce de cero son en la teoría de David Marr el principal procedimiento por el que el sistema visual sienta las bases para pasar de una representación continua de carácter analógico a una representación discreta de carácter simbólico.

3.2.3. La determinación de las características. A partir de la determinación de los puntos de cruce de cero y con el fin de llegar a la descripción simbólica final, el sistema visual necesita integrar la información que procede de los filtros de distinto tamaño. Los cambios de luminancia que dan origen a un punto de cruce de cero pueden estar provocados por factores muy diferentes en el mundo físico: cambios en la iluminación de la escena, cambios en la reflectancia de las superficies, en la orientación o distancia de las superficies con respecto al observador, etc. El sistema visual tiene que discriminar qué puntos de cruce de cero corresponden a un mismo fenómeno físico y cuales a fenómenos físicos diferentes. Según David Marr, el sistema visual consigue asignar los puntos a fenómenos físicos integrando la información proporcionada por los puntos de cruce de cero de las distintas escalas que proporcionan los filtros de diferente tamaño. El principio fundamental que orienta esta fase del procesamiento se conoce como supuesto de coincidencia espacial y dice así:

Si en un conjunto de canales independientes, de una gama continua de tamaños (filtrados mediante un operador laplaciano) está presente un segmento de puntos de cruce de cero y este segmento tiene la misma orientación y posición en cada canal, entonces el conjunto de segmentos de puntos de cruce de cero indica la presencia de un cambio de intensidad en la imagen que se debe a un único fenómeno físico (un cambio en la reflectancia, iluminación, profundidad u orientación en la superficie) (Marr, 1982, p. 70).

Si no existiera coincidencia espacial en los distintos canales, probablemente los puntos de cruce de cero tendrían su origen en distintos fenómenos físicos o en distintas superficies. Mediante la aplicación de este y otros supuestos relacionados se acaba logrando, según Marr y Hildreth, la descripción simbólica de la imagen en términos de las cuatro características primitivas: bordes, barras, manchas y terminaciones. La Figura 3.20 muestra la forma que adopta la descripción final del esbozo primario bruto de la imagen de la Figura 3.18. En A y B se muestran los puntos de cruce de cero correspondientes a dos filtros de tamaño diferente; el utilizado en A es más fino que el utilizado en B. En los siguientes apartados la figura muestra el resultado de la integración de ambos filtros para generar un mapa de bordes orientados (D) y de los análisis que originan un mapa de manchas (C) y otro de barras (E). El resultado final

PERCEPCIÓN VISUAL

del valor informativo que proagen de la derecha muestra los la izquierda hallados mediante ~n la imagen de la derecha se o que las que tienen un mayor uce de cero son en la teoría de que el sistema visual sienta las a de carácter analógico a una

·icas. A partir de la determina! de llegar a la descripción simIa información que procede de """'m '•nr•·, que dan origen a un

por factores muy diferentes la escena, cambios en la re-

istancia de las superficies con que discriminar qué puntos

físico y cuales a fenóvisual consigue asignar

¡lvuHdu.vH proporcionada por las que proporcionan los fil-ntal que orienta esta fase del ncidencia espacial y dice así:

de una gama continua de tamal está presente un segmento de

la misma orientación y posición de puntos de cruce de cero

en la imagen que se debe a un iluminación, profundidad

'ntos canales, probablemenen distintos fenómenos físi

'ón de este y otros supuestos ldreth, la descripción simbó

ísticas primitivas: bordes, muestra la forma que adopta la imagen de la Figura 3 .18.

correspondientes a dos filfino que el utilizado en B. tado de la integración de

\LlCJllld•uv~ (D) y de los análisis barras (E) . El resultado final

PRO CESAMIENTO VISUAL INICIAL 139

,6 .... ~ .. y "~ . <? . <"' 1:::1

o e= • < "

o

;~ o.

!'/:>

FIGURA 3.20. Determinación de las características primitivas de la imagen analizada en la Figura 3.18. En A y B se muestran los puntos de cruce de cero correspondientes a dos filtros de tamaño diferente; el utilizado en A es más fino que el utilizado en B. En los siguientes apartados la figura muestra el resultado de la integración de ambos filtros para generar un mapa de bordes orientados (D) y de los análisis que originan un mapa de manchas (C) y otro de barras (E). Fuente : David Marr. Vision: A Computationaf fnvestigation into the Human Representation and

Processing of Visual fnformation . 1982. New York: Henry Holt.

del esbozo primario bruto es un conjunto de cuatro mapas con la descripción de las características, cada una de ellas especificada por los parámetros correspondientes a su posición, orientación, contraste, y tamaño, éste último expresado en términos de longitud y anchura.

3.3. Bases fisiológicas del esbozo primario bruto

Hasta ahora hemos estudiado los aspectos computacionales y algorítmicos de la teoría del esbozo primario bruto de David Marr. Sin embargo en esta etapa de procesamiento visual Marr también prestó atención a los aspectos relacionados con la realización física de estos procesos en el cerebro humano. Especialmente se interesó por los mecanismos capaces de realizar el cómputo de los puntos de cruce de cero. Marr pensó que el campo receptivo de las células ganglionares y de las células del núcleo geniculado lateral del tálamo muestran características similares a las del operador utilizado por ellos que aparece en la Figura 3.17. En el apartado G y H de la Figura 3 .16 hemos visto que los puntos de cruce de cero están flanqueados por valores extremos de la segunda derivada de la función de luminancia. Marr asumió que las células del núcleo geniculado organizadas como aparece en la Figura 3.21, de forma que un conjunto de células con centro off y entorno on estén alineadas


A B

FIGURA 3.21. Mecanismo fisiológico hipotético propuesto por Marr y Hidreth para implementar el procesamiento correspondiente a la detección de puntos de cruce de cero. En A P representa el campo receptivo de una célula geniculada con centro on y entorno off, mientras que Q representa el campo receptivo de una célula con centro off y entorno on . Cuando ambas están activadas es porque se produce un punto de máximo contraste, un punto cero. Una célula Y que reciba esta información y dispare al recibirla actuaría como un detector de puntos de cruce de cero. En B se muestra la forma en que un conjunto de mecanismos como los representados en A alineados entre sí, son capaces de detectar un segmento orientado de puntos de cruce de cero dentro de los límites de orientación delimitados de forma aproximada por las líneas representadas en B. Fuente: David Marr. Vision: A Computationa//nvestigation into the Human Representation

and Processing of Visuallnformation. 1982. New York: Henry Holt.

y adyacentes a un conjunto alineado de células con centro on y entorno off, forman la base para lograr el cómputo de los puntos de cruce de cero.

Siempre que ambas filas de células estén activas simultáneamente se producirá la presencia de puntos de cruce de cero entre ellas. Si otro conjunto de células en un nivel de procesamiento superior recibe información de ambas células y solamente dispara cuando ambas están activas 14 estas células Y actuarán como verdaderos detectores de puntos de cruce de cero. Si a su vez estas células están sintonizadas a orientaciones diferentes y se organizan entre sí en alineamientos de una determinada orientación, tendremos la base para la detección de segmentos de puntos de cruce de cero que, como hemos visto antes, forman en la teoría de Marr la base sobre la cual se lleva a cabo el cómputo de las características primitivas. Para David Marr la función que llevan a cabo las células simples de la corteza estriada es precisamente detectar los puntos de cruce de cero en la forma que acabamos de explicar.

14. Marr las concibe como similares al operador lógico Y (ANO) que en un circuito con dos entradas sólo produce una salida si recibe información por ambas entradas.

PERCEPCIÓN VISUAL

opuesto por Marr y Hidreth para a la detección de puntos de cru

de una célula geniculada con ta el campo receptivo de una

están activadas es porque se cero. Una célula Y que reci

como un detector de puntos e un conjunto de mecanismos son capaces de detectar un

dentro de los límites de orientarepresentadas en B. Fuente:

into the Human Representation . New York: Henry Holt.

con centro on y entorno off, de cruce de cero.

simultáneamente se proentre ellas. Si otro conjunto r recibe información de am-

y se organizan entre tendremos la base para

cero que, como hemos visto la cual se lleva a cabo el cóm-

Marr la función que llevan es precisamente detectar los

de explicar.

Y (AND) que en un circuito con por ambas entradas.


3.4. Valoración de la teoría de David Marr

Como hemos dicho varias veces en este libro, la teoría de David Marr fue la primera teoría computacional de la visión que se propuso con carácter general y que trató de organizar las principales contribuciones que las investigaciones en inteligencia artificial habían aportado al campo de la percepción visual. En el tema que estamos tratando en este capítulo su aportación también fue pionera y el esquema de detección de bordes basado en operadores laplacianos de una gaussiana continúa dominando en los modelos de sistemas biológicos de detección de bordes15 • No obstante en el campo de la visión de máquinas se han desarrollado muchos algoritmos diferentes que resultan más o menos útiles dependiendo de la aplicación a la que se dedica. Más problemática para la teoría de Marr y Hildreth ha resultado la forma en que resuelve el problema de la integración de escalas de puntos de cruce de cero. Sobre este particular Marr y Hildreth nunca ofrecieron un algoritmo preciso y otras aportaciones posteriores parecen preferibles 16

. Sin embargo es conveniente recalcar que la principal aportación de David Marr fue la nueva forma de pensar que introdujo al teorizar sobre la percepción visual apuntando a los problemas centrales que toda teoría debe resolver en cada nivel de procesamiento.

CONCLUSIÓN

En este capítulo hemos visto que en torno a la interpretación de la función de las células de la corteza estriada se han acuñado las principales teorías de la percepción de la forma. A las investigaciones fisiológicas de Hube! y Wiesel siguieron las aportaciones teóricas que desde la psicofísica hicieron investigadores como Campbell, Robson, Blakemore, Graham y los DeValois a favor de la defensa de filtros de frecuencia espacial. La interpretación inicial de Hube! y Wiesel sobre el funcionamiento de las células de la corteza cerebral se hizo en términos de detectores de características entendiendo este término de forma demasiado simple, como la respuesta directa de una célula a las características elementales del estímulo. Cuando la investigación posterior mostró la existencia de células que respondían a características más complejas o incluso a objetos, se perdió la confianza en un tipo de teoría que todo lo resolviera a base de encontrar una célula para cada objeto o parte de un objeto.

La investigación se orientó hacia la búsqueda de una descripción del estímulo que fuera elemental en sus componentes básicos, aplicable de forma generalizada a todo estímulo posible y realizable por las células de la corteza

15. En opinión de Jain, Kasturi y Schunck (1995, p. 181). 16. Véase, por ejemplo, el trabajo de Witkin (1983).


estriada. La gran propuesta de finales de los años sesenta y principios de los setenta del siglo XX fue el análisis de Fourier. Las células de la corteza visual se interpretaron como filtros espaciales sintonizados a componentes elementales de frecuencias espaciales diferentes que llevaban a cabo una descomposición del estímulo en sus componentes de frecuencia espacial. Desde esta perspectiva el análisis de Fourier proporcionaba a la vez un lenguaje para describir el estímulo y una teoría sobre el funcionamiento de la corteza estriada.

Pronto se vio que las dos interpretaciones no tenían que ser necesariamente antagónicas y que quizás ambos tipos de análisis del estímulo tenían lugar pero a diferentes niveles de organización del sistema visual. Pero, si esto era así, 2cómo se relacionaban los dos tipos de análisis? Una respuesta interesante a esta pregunta vino de la aproximación computacional elaborada por David Marr.

Marr obligó a pensar sobre la función de las células de la corteza estriada en un contexto más amplio que el de las teorías anteriores. Obligó a pensar en un contexto de procesamiento de información. La función de esas células era una parte de un proceso más amplio realizado en coordinación con otras fases del procesamiento visual. Por una parte Marr dio la razón a las dos teorías anteriores ya que postuló una fase de filtrado espacial de la imagen anterior a la determinación de las características primitivas. Por otra parte no le dio la razón a ninguna ya que estrictamente el filtrado de la imagen lo situó en las células ganglionares y del cuerpo geniculado lateral del tálamo y la determinación de características en una fase posterior a las células simples de la corteza estriada. El papel de estas últimas era detectar los puntos de cruce de cero en la forma que hemos visto detenidamente. Estas últimas diferencias, sin embargo, no son de importancia fundamental en el contexto de una teoría general de la percepción.

Una conclusión importante de este capítulo es que los conceptos de filtros de frecuencia espacial y detectores de características son los conceptos fundamentales sobre los que se basa gran parte de la teoría de la percepción de la forma en la actualidad. El problema de las relaciones entre estos mecanismos elementales también es un aspecto de gran importancia teórica. En última instancia la solución de David Marr favoreció más directamente a una teoría de la percepción basada sobre la detección de características puesto que el propósito del esbozo primario bruto es, según Marr, obtener una descripción simbólica de características primitivas del mundo físico y sobre la base de esta descripción construir las siguientes etapas del procesamiento visuaP 7. En su teoría, el filtrado de las frecuencias espaciales queda reducido a una mera fase previa de análisis de la escena en diferentes escalas al servicio de la determinación de las características. Sin embargo cabe preguntarse si esta forma de

17. Es conveniente recalcar de nuevo que para Marr la obtención de las características primitivas es el resultado de un complicado proceso de cómputo y no un proceso de detección directa como habían supuesto los primeros fisiólogos.

PERCEPCIÓN VISUAL

)S sesenta y principios de los células de la corteza visual se

¡s a componentes elementales ~ a cabo una descomposición espacial. Desde esta perspec-

1

un lenguaje para describir el e la corteza estriada. no tenían que ser necesaria~ análisis del estímulo tenían el sistema visual. Pero, si esto nálisis? Una respuesta intere·omputacional elaborada por

células de la corteza estriada teriores. Obligó a pensar en

,a función de esas células era coordinación con otras fases io la razón a las dos teorías

·pacial de la imagen anterior vas. Por otra parte no le dio do de la imagen lo situó en lateral del tálamo y la deter

a las células simples de la r los puntos de cruce de

Estas últimas diferencias, en el contexto de una teoría

que los conceptos de filtros son los conceptos funda

de la percepción de la

directamente a una teoría s puesto que el

obtener una descripción físico y sobre la base de esta

miento visuaP 7• En su

reducido a una mera fase al servicio de la determi

ntarse si esta forma de

a obtención de las características y no un proceso de detección


Analizadores de frecuencia espacial local

Analizadores organizados en forma de centro-entorno

143

(Área V1)

(NGL)

FIGURA 3.22. Esquema de procesamiento visual inicial propuesto por Palmer {1999).

jerarquizar los procesos es correcta. Muchas investigaciones actuales sobre distintos aspectos de la percepción visual como son el análisis de la textura de las superficies, de la visión estereoscópica, etc. encuentran mucho más eficaz para sus propósitos partir de una descripción del input en términos de frecuencias espaciales. Palmer (1999) ha propuesto un esquema como el que aparece en la Figura 3.22 que establece una jerarquía de procesos diferente.

En este esquema, el procesamiento más básico y fundamental sería el de análisis de los componentes de frecuencia espacial del estímulo y este análisis serviría de fundamento a los demás. El procesamiento de bordes también necesitaría del análisis de la frecuencia espacial pero sería llevado a cabo de forma modular y en paralelo con otros tipos de análisis de la escena. Las características importantes quedan reducidas en la propuesta de Palmer a los bordes pero incluso el análisis de estos pierde el carácter fundamental que David Marr le concede en su teoría.

En capítulos posteriores estudiaremos la extensión de las ideas básicas que hemos estudiado en este capítulo, a otras fases del procesamiento visual. En este capítulo hemos aprendido los conceptos fundamentales para comprender mejor esas fases.

Capítulo 4

EL ESPACIO TRIDIMENSIONAL

En el capítulo anterior hemos estudiado las principales teorías que tratan de explicar cómo el sistema visual alcanza una representación bidimensional de la escena visual a partir de las diferencias en luminancia. Sin embargo, nuestra visión cotidiana está claramente configurada en tres dimensiones. El espacio visual tiene altura, anchura y profundidad. El problema que se plantea en este capítulo es explicar la forma en que el sistema visual consigue una representación de espacio tridimensional, cómo se logra recuperar la profundidad de la escena visual.

Esta forma de plantear el problema que vamos a tratar en este capítulo no es neutral desde un punto de vista teórico. Está hecha desde una perspectiva constructivista que, como explicábamos en el Capítulo 1, concibe la percepción visual como un conjunto de procesos que, a partir de la información que proporciona la luz, trata de construir una representación de la escena que permita reconocer los objetos y guiar la acción del organismo. Para este modo de entender la percepción, la forma de abordar el procesamiento de la profundidad consiste en buscar en la escena bidimensional las claves, indicadores o indicios que permiten alcanzar una representación tridimensional.

Una importante alternativa al constructivismo es la representada por la perspectiva ecológica ligada sobre todo a las investigaciones de James Gibson. Desde este punto de vista no tiene sentido buscar claves en una representación bidimensional porque la percepción visual no está mediada por una representación sino que es directa. La percepción consiste en la extracción por el observador de la información presente en el estímulo y la información acerca de la profundidad está tan presente en la información proporcionada por el patrón general de estimulación como cualquier otra.

En este capítulo abordaremos en primer lugar el tratamiento de las distintas claves de profundidad. Incluiremos en este tratamiento algunos indicado-


res que han sido descubiertos por Gibson. Aunque hay que reconocer que la categoría de clave no es el marco más adecuado para el tratamiento de estos indicadores, procuraremos que su tratamiento haga justicia a las intencio· nes de la aproximación ecológica. En la segunda parte estudiaremos las dos posturas teóricas que acabamos de mencionar tomando como referencia el fenómeno de constancia del tamaño. De esta forma tendremos oportunidad de conocer el funcionamiento de cada una de las dos teorías ante la explicación de un fenómeno perceptivo concreto. En la tercera y última parte, nos preguntaremos por la posible reconciliación de las dos posturas antagónicas y estudiaremos una interesante y reciente propuesta que puede llegar a conseguir la integración que muchos desean.

1. LAS CLAVES DE PROFUNDIDAD

Se han propuesto diferentes esquemas de clasificación de las distintas claves de profundidad. El esquema que nosotros adoptamos aquí tratará en primer lugar las claves monoculares, que están disponibles para cada uno de los ojos con independencia del otro, y después las binoculares, que resultan de la integración de la información de los dos ojos, como es el caso de la convergencia y de la estereoscopia. Dentro de las claves monoculares, que forman el grupo más numeroso, consideraremos por un lado las claves estáticas, provenientes de una escena visual sin movimiento y, por otro, las claves dinámicas provenientes de una escena visual en movimiento, bien sea porque hay movimiento en los objetos o porque se mueva el observador. Finalmente, dentro de las claves estáticas distinguiremos aquellas que tienen su origen en el funcionamiento mecánico de la musculatura ocular, llamadas claves oculares y las que proporcionan información óptica. Estas últimas constituyen un conjunto de claves que por su estrecha relación con el mundo de la pintura y del dibujo se conocen con el nombre de claves pictóricas.

1.1. Claves monoculares

1.1.1. Claves estáticas

Pueden ser de dos tipos, oculares y pictóricas.

1.1.1.1. Claves oculares

Acomodación. Es un cambio en la forma del cristalino necesario para mantener la imagen del objeto focalizada sobre la retina. Cuando el objeto se encuentra alejado del observador el cristalino tiende a disminuir de grosor y a hacerse más plano con el fin de facilitar el enfoque de los rayos que desde


res que han sido descubiertos por Gibson. Aunque hay que reconocer que la categoría de clave no es el marco más adecuado para el tratamiento de estos indicadores, procuraremos que su tratamiento haga justicia a las intenciones de la aproximación ecológica. En la segunda parte estudiaremos las dos posturas teóricas que acabamos de mencionar tomando como referencia el fenómeno de constancia del tamaño. De esta forma tendremos oportunidad de conocer el funcionamiento de cada una de las dos teorías ante la explicación de un fenómeno perceptivo concreto. En la tercera y última parte, nos preguntaremos por la posible reconciliación de las dos posturas antagónicas y estudiaremos una interesante y reciente propuesta que puede llegar a conseguir la integración que muchos desean.

1. LAS CLAVES DE PROFUNDIDAD

Se han propuesto diferentes esquemas de clasificación de las distintas claves de profundidad. El esquema que nosotros adoptamos aquí tratará en primer lugar las claves monoculares, que están disponibles para cada uno de los ojos con independencia del otro, y después las binoculares, que resultan de la integración de la información de los dos ojos, como es el caso de la convergencia y de la estereoscopia. Dentro de las claves monoculares, que forman el grupo más numeroso, consideraremos por un lado las claves estáticas, provenientes de una escena visual sin movimiento y, por otro, las claves dinámicas provenientes de una escena visual en movimiento, bien sea porque hay movimiento en los objetos o porque se mueva el observador. Finalmente, dentro de las claves estáticas distinguiremos aquellas que tienen su origen en el funcionamiento mecánico de la musculatura ocular, llamadas claves oculares y las que proporcionan información óptica. Estas últimas constituyen un conjunto de claves que por su estrecha relación con el mundo de la pintura y del dibujo se conocen con el nombre de claves pictóricas.

1.1. Claves monoculares

1.1.1. Claves estáticas

Pueden ser de dos tipos, oculares y pictóricas.

1.1.1.1. Claves oculares

Acomodación. Es un cambio en la forma del cristalino necesario para mantener la imagen del objeto focalizada sobre la retina. Cuando el objeto se encuentra alejado del observador el cristalino tiende a disminuir de grosor y a hacerse más plano con el fin de facilitar el enfoque de los rayos que desde

PERCEPCIÓN VISUAL

~ue hay que reconocer que la 1 para el tratamiento de estos haga justicia a las intencio

la parte estudiaremos las dos ~omando como referencia el · a tendremos oportunidad

dos teorías ante la explicatercera y última parte, nos dos posturas antagónicas y que puede llegar a conse-

ión de las distintas claves aquí tratará en primer

para cada uno de los ojos que resultan de la inte

el caso de la convergencia lares, que forman el grupo ves estáticas, provenientes

las claves dinámicas provesea porque hay movimiento

Finalmente, dentro de las su origen en el funciona

claves oculares y las que constituyen un conjunto de

, de la pintura y del dibujo se

necesano para mantina. Cuando el objeto se de a disminuir de grosor y ue de los rayos que desde

EL ESPACIO TRIDIMENSIONAL 147

el objeto llegan al cristalino en paralelo. Sin embargo, cuando un objeto se aproxima al observador, los rayos procedentes del mismo divergen a medida que se acercan al ojo. En este caso el cristalino aumenta su convexidad aumentando de grosor y de esta forma facilita el enfoque de la imagen sobre la retina. Este proceso de cambio en la forma del cristalino se lleva a cabo mediante la acción de los músculos ciliares cuya contracción provoca el aumento de grosor y cuya relajación lo disminuye. Si el sistema visual tiene información sobre la tensión de los músculos ciliares, entonces también puede tener información sobre la distancia a la que se encuentra el objeto focalizado.

Las investigaciones sobre el valor de la acomodación como indicador de distancia han mostrado que solamente es efectivo en distancias cortas, inferiores a los dos metros y medio aproximadamente. Incluso dentro de este rango de distancia, los observadores no utilizan la información sobre distancia que proporciona la acomodación cuando tienen que hacer juicios directos sobre la distancia de un objeto sino al hacer juicios sobre el tamaño de los objetos (Wallach & Floor, 1971). Parece que el sistema visual calcula el tamaño de los objetos tomando en cuenta la información proporcionada por la acomodación.

Un aspecto interesante de este indicador es que proporciona información sobre la distancia absoluta a la que se encuentra un objeto. La mayor parte de los indicadores monoculares de profundidad proporcionan información sobre la distancia relativa de los objetos señalándonos cual de dos o más objetos se encuentra más próximo a nosotros pero no nos informan de la distancia a la que esos objetos están de nosotros. El conocimiento de la distancia absoluta a la que se encuentran los objetos es necesario para poder alcanzarlos con precisión y para moverse en su entorno sin tropezar con ellos.

1.1.1.2. Claves pictóricas

1.1.1.2.1. Perspectiva lineal. En el uso común del lenguaje, se entiende por perspectiva lineal el conjunto de reglas que permite a los artistas crear proyecciones bidimensionales precisas de las formas esquemáticas de objetos tridimensionales. El plano sobre el que se llevan a cabo esas proyecciones se llama plano de proyección y está situado perpendicularmente a la línea de visión que va del observador al objeto. En el estudio de la percepción visual, el término perspectiva lineal hace referencia a las relaciones existentes dentro de la escena visual que subyacen a ese conjunto de reglas y también en parte a la percepción de la distribución espacial.

Una de las reglas más básicas de la perspectiva lineal es la convergencia de paralelas según la cual las líneas paralelas en el espacio tridimensional se representan en dos dimensiones por líneas que convergen hacia un único punto llamado punto de fuga. La Figura 4.1 muestra un ejemplo de perspectiva lineal. La experiencia común de convergencia de las vías de un tren cuando estando entre ellas miramos a lo lejos es también un ejemplo de perspectiva lineal.


Punto de fuga ~

FIGURA 4.1. Ejemplo de perspectiva lineal.

Obsérvese que en la Figura 4.1 el punto de fuga está situado en la línea del horizonte de la superficie que sirve de punto de referencia para dividir el espacio visual en dos zonas, una superior y otra inferior. En general, la línea del horizonte de una superficie es la línea que pasa por dos o más puntos de fuga de conjuntos de líneas paralelas que se extienden en la superficie.

La perspectiva lineal basada en la convergencia de paralelas produce una compresión lateral de las superficies implicadas. La Figura 4.2 muestra el

A B

FIGURA 4.2. En (B) se representa la proyección de la superficie cuadrada (A) inclinada con respecto al eje horizontal .

PERCEPCIÓN VISUAL

( Horizonte

fuga está situado en la línea de referencia para dividir el inferior. En general, la línea

por dos o más puntos de den en la superficie.

cia de paralelas produce una La Figura 4.2 muestra el

B


contorno de una superficie cuadrada que está inclinada con respecto a un eje horizontal en el plano frontal.

La inclinación produce en el observador una proyección trapezoidal de la superficie de forma que el borde que se inclina hacia el observador aparece más largo que el que se inclina lejos del observador provocando una compresión lateral que tiende a concentrarse en el punto de fuga.

La convergencia de paralelas propia de la perspectiva lineal nos permite entender la relación entre el punto de fuga y la orientación de los bordes de una superficie. Si se mide la orientación de un borde por referencia a un marco fijo del medio ambiente, entonces todos los bordes que tienen la misma orientación son paralelos entre sí y la proyección de este conjunto de bordes paralelos en el plano de proyección es un conjunto de líneas que convergen en un único punto de fuga. El punto de fuga de un borde puede concebirse como el término final de la proyección de un borde cuando se extiende infinitamente en la distancia. Existe, por tanto, una relación uno a uno entre el punto de fuga y la orientación de un determinado conjunto de bordes, de forma que para cada orientación determinada de un borde existe un correspondiente punto de fuga y cada punto en el plano de proyección es el punto de fuga de un conjunto de bordes paralelos que tienen la misma orientación. El punto de fuga de un borde contiene, por tanto, información específica sobre su orientación. Esta relación entre punto de fuga y orientación de los bordes no varía aunque cambie el punto de observación; cada punto de fuga permanece fijo en su posición de correspondencia con las orientaciones fijas de los bordes en el medio ambiente. La correspondencia entre los distintos puntos de fuga y la orientación de los bordes, cuyas proyecciones convergen en esos puntos, contribuye a estructurar un entramado de relaciones altamente informativas sobre la organización tridimensional de una escena.

1.1.1.2.2. Altura relativa. La posición de los objetos en relación con la línea del horizonte es un importante indicador de profundidad incluso en escenas en las que la convergencia de paralelas en un punto de fuga no está presente. Generalmente aquellos objetos que se encuentran próximos a la línea del horizonte de una superficie bidimensional son percibidos como más lejanos. La potencia de la altura relativa como clave de profundidad o de distancia depende de la presencia de un marco de referencia que, por lo general, es la línea del horizonte. El efecto de profundidad se acentúa por la presencia de textura dentro del marco de referencia. En ausencia de un marco de referencia, el efecto de profundidad queda prácticamente anulado.

1.1.1.2.3. Perspectiva aérea. Hace referencia a los cambios en contraste y en color que experimenta la percepción de los objetos cuando se encuentran a gran distancia del observador. El contraste tiende a reducirse haciendo que la imagen de los objetos aparezca más borrosa debido a la dispersión de la luz que provocan las partículas de polvo y agua suspendidas en la atmósfera. Con


respecto al color, la lejanía de los objetos tiende a acentuar las tonalidades azuladas debidas también a que las longitudes de onda cortas son más fácilmente perturbadas por las partículas suspendidas en la atmósfera que las longitudes de onda largas y por lo tanto experimentan una dispersión mayor.

1.1.1.2.4. Tamaño relativo. Por lo general, si dos objetos son presentados en el campo visual simultáneamente o en próxima sucesión, aquel que produce una imagen retiniana mayor, parecerá estar más cerca. En la Figura 4.2 la influencia de la perspectiva lineal para producir profundidad en la percepción, se ve reforzada por el tamaño relativo de los dos segmentos horizontales que forman parte del trapezoide. El segmento largo aparece más cercano al observador que el segmento corto. En este ejemplo, los dos segmentos están conectados, pero no es preciso que exista conexión para que esta clave de profundidad tenga efecto.

1.1.1.2.5. Tamaño familiar. Experimentos que han utilizado objetos familiares para los participantes, tales como cartas de una baraja o monedas de uso corriente, han puesto de manifiesto que, si se conoce el tamaño real de un objeto, el tamaño de la imagen proyectada sobre el observador es un buen indicador de la distancia a la que se encuentra el objeto. El tamaño familiar es un ejemplo claro de la influencia que la experiencia puede tener sobre los procesos de percepción.

1.1.1.2.6. Gradiente de textura. Casi todas las superficies tienen una estructura que consta de unidades o elementos, relativamente homogéneos en tamaño y forma, distribuidos por la superficie con relativa regularidad. A la cualidad producida por este tipo de estructura se le da el nombre de textura. La distribución de granos de arena en una playa, la de las piedras en la orilla de un río y la de las baldosas de un cuarto de baño son ejemplos de superficies con texturas diferentes. Por otra parte, podemos definir el término gradiente como la proporción en que una determinada propiedad cambia a lo largo de un continuo. El gradiente de textura hace referencia al cambio gradual que la percepción de la textura de una superficie experimenta a medida que ésta se encuentra más alejada del observador. Los principales cambios afectan al tamaño de los elementos, que se hacen progresivamente más pequeños, y a la densidad de los mismos, que aumenta a medida que la superficie se aleja. La Figura 4.3 muestra en A un ejemplo de superficie en la que el gradiente de textura proporciona una fuerte sensación de profundidad.

Además de informar sobre la profundidad, el gradiente de textura también puede proporcionar información sobre otras características de la superficie, como su orientación en profundidad o su curvatura. En la figura anterior, imagen B, se muestra cómo un cambio en el gradiente puede informar sobre la existencia de una esquina, mientras que en e, la ruptura entre los dos gradientes proporciona información sobre la existencia de un borde. James

EL ES

FIGL

Gib con la e por den la q

fue la e do1

cor sol: bn un dir de ca1

COl


respecto al color, la lejanía de los objetos tiende a acentuar las tonalidades azuladas debidas también a que las longitudes de onda cortas son más fácilmente perturbadas por las partículas suspendidas en la atmósfera que las longitudes de onda largas y por lo tanto experimentan una dispersión mayor.

1.1.1.2.4. Tamaño relativo. Por lo general, si dos objetos son presentados en el campo visual simultáneamente o en próxima sucesión, aquel que produce una imagen retiniana mayor, parecerá estar más cerca. En la Figura 4.2 la influencia de la perspectiva lineal para producir profundidad en la percepción, se ve reforzada por el tamaño relativo de los dos segmentos horizontales que forman parte del trapezoide. El segmento largo aparece más cercano al observador que el segmento corto. En este ejemplo, los dos segmentos están conectados, pero no es preciso que exista conexión para que esta clave de profundidad tenga efecto.

1.1.1.2.5. Tamaño familiar. Experimentos que han utilizado objetos familiares para los participantes, tales como cartas de una baraja o monedas de uso corriente, han puesto de manifiesto que, si se conoce el tamaño real de un objeto, el tamaño de la imagen proyectada sobre el observador es un buen indicador de la distancia a la que se encuentra el objeto. El tamaño familiar es un ejemplo claro de la influencia que la experiencia puede tener sobre los procesos de percepción.

1.1.1.2.6. Gradiente de textura. Casi todas las superficies tienen una estructura que consta de unidades o elementos, relativamente homogéneos en tamaño y forma, distribuidos por la superficie con relativa regularidad. A la cualidad producida por este tipo de estructura se le da el nombre de textura. La distribución de granos de arena en una playa, la de las piedras en la orilla de un río y la de las baldosas de un cuarto de baño son ejemplos de superficies con texturas diferentes. Por otra parte, podemos definir el término gradiente como la proporción en que una determinada propiedad cambia a lo largo de un continuo. El gradiente de textura hace referencia al cambio gradual que la percepción de la textura de una superficie experimenta a medida que ésta se encuentra más alejada del observador. Los principales cambios afectan al tamaño de los elementos, que se hacen progresivamente más pequeños, y a la densidad de los mismos, que aumenta a medida que la superficie se aleja. La Figura 4.3 muestra en A un ejemplo de superficie en la que el gradiente de textura proporciona una fuerte sensación de profundidad.

Además de informar sobre la profundidad, el gradiente de textura también puede proporcionar información sobre otras características de la superficie, como su orientación en profundidad o su curvatura. En la figura anterior, imagen B, se muestra cómo un cambio en el gradiente puede informar sobre la existencia de una esquina, mientras que en e, la ruptura entre los dos gradientes proporciona información sobre la existencia de un borde. James

EL E~

FIGU e

Gibs cons la es porq dens la qL

fu en la ca do1 1

com sobr brea un e dire1 de b cant

come

PERCEPCIÓN VISUAL

nde a acentuar las tonalidades . de onda cortas son más fácilhs en la atmósfera que las lon:ntan una dispersión mayor.

si dos objetos son presentados [)Cima sucesión, aquel que pro·ar más cerca. En la Figura 4.2 ucir profundidad en la percep!os dos segmentos horizontales largo aparece más cercano al

los dos segmentos están para que esta clave de

que han utilizado objetos fade una baraja o monedas de

se conoce el tamaño real de el observador es un buen

el objeto. El tamaño familiar · encia puede tener sobre los

las superficies tienen una es·vamente homogéneos en

on relativa regularidad. A la le da el nombre de textura. la de las piedras en la orilla

o son ejemplos de superficies definir el término gradiente

dad cambia a lo largo de ia al cambio gradual que

ta a medida que ésta es cambios afectan al te más pequeños, y a

ida que la superficie se aleja. · en la que el gradiente de

fundidad. el gradiente de textura tam

características de la superfira. En la figura anterior,

ente puede informar sobre e, la ruptura entre los dos · tencia de un borde. James


FIGURA 4.3. Ejemplos de la información que puede proporcionar el gradiente de densidad de textura sobre la profundidad y la forma de la escena visual.

Gibson, que formuló la aproximación ecológica al estudio de la percepción, consideró que el gradiente de densidad de textura es uno de los aspectos de la estimulación que mayor información proporciona sobre la profundidad porque afecta a la estructura general del patrón estimular. El gradiente de densidad de textura proporciona una escala absoluta de distancia respecto a la que se puede medir toda otra distancia.

1.1.1.2. 7. Sombreado y sombras. La posición relativa existente entre la fuente de la iluminación, las superficies iluminadas y el observador, determina la cantidad de luz que acaba llegando al ojo del último. El término sombreado1 hace referencia a los cambios en el patrón de luminancia que se produce como consecuencia de la variación en el ángulo que forman la luz que incide sobre una superficie y la superficie misma. Existen diferentes tipos de sombreado. El sombreado especular es el propio de superficies brillantes como un espejo y depende fundamentalmente de la posición del observador y de la dirección de la iluminación. El sombreado difuso o Lambertiano es el propio de las superficies mate cuya reflectancia es igual en todas las direcciones. La cantidad de luz reflejada por cada punto de la superficie depende de su orien-

L Utilizamos el término sombreado como traducción de shading, y el término sombra como traducción de shade.


ración respecto a la fuente de luz, siendo máxima en los puntos en que la luz incide perpendicularmente sobre la superficie. Por ello, cuando superficies de la misma reflectancia presentan ángulos diferentes respecto a la misma fuente de iluminación, pueden dar lugar a bordes de iluminación2 • El sombreado es un potente indicador de los aspectos volumétricos de las formas, en particular sus concavidades y convexidades. Gibson (1950) fue uno de los primeros investigadores que llamó la atención sobre el hecho de que la percepción de una escena tiende a organizarse como si estuviera iluminada por una sola fuente de luz y desde arriba. Probablemente este supuesto interpretativo actúa como una constricción en el sistema perceptivo y es el resultado de un largo proceso evolutivo de adaptación al medio terrestre. La Figura 4.4 ilustra la fuerza de este supuesto en un caso relativamente simple.

Los objetos circulares de la fila superior aparecen como bultos convexos que se aproximan hacia el observador, mientras que los de la fila inferior aparecen como pequeñas concavidades que tienden a alejarse del observador. El efecto es perfectamente reversible si el lector da la vuelta a la página. Este cambio se debe al supuesto que estamos comentando de que los objetos circulares están recibiendo la luz de una misma fuente situada sobre ellos. Los objetos circulares iluminados en su parte superior y obscurecidos en su inferior

FIGURA 4.4. El sombreado de los círculos superiores hace que se perciban como objetos esféricos convexos. El sombreado de los círculos inferiores hace que se perciban como oquedades cóncavas. En ambos casos el sistema visual asume que están iluminados desde la parte superior por una única fuente de iluminación. Fuente: Stephen E. Palmer. Vision Science: Photons to Phenomeno/ogy. © 1999. Cambridge,

MA: The MIT Press, p . 245, fig . 5.5.28.

2. Recuérdese la distinción entre bordes de iluminación y bordes de reflectancia que se explicó en el tema del colo r al trata r el tema de la constancia de la claridad .

PERCEPCIÓN VISUAL

en los puntos en que la luz ello, cuando superficies de respecto a la misma fuente inación2

• El sombreado es de las formas, en particular fue uno de los primeros inde que la percepción de una

ada por una sola fuente interpretativo actúa como ltado de un largo proceso ra 4.4 ilustra la fuerza de

como bultos convexos que los de la fila inferior a alejarse del observador. la vuelta a la página. Este

de que los objetos circusituada sobre ellos. Los ob-

y bordes de reflectancia que se de la claridad.


son percibidos como convexos, ya que su patrón de sombreado corresponde al de un objeto esférico iluminado desde arriba. En los obscurecidos en su parte superior e iluminados en su inferior, el patrón de sombreado corresponde al de una concavidad iluminada desde arriba y en consecuencia son percibidos como una oquedad. Ramachandran (1988) ha puesto de manifiesto que el supuesto que parece realmente enraizado en nuestro sistema visual es el de la existencia de una sola fuente de luz. La localización de la fuente depende para su determinación de diferentes factores que interactúan entre sí. La Figura 4.5 presenta un interesante ejemplo proporcionado por este autor.

FIGURA 4.5. Máscaras de Ramachandran. Fotografiadas por su lado cóncavo e iluminadas desde arriba. El sistema visua l las percibe como máscaras presentadas por su lado convexo e iluminadas desde abajo. Fuente : Vilayanur S. Ramachan-

dran. Perceiving Shape from Shading. Scientific American, 259, 2, 76-83.

Las máscaras que aparecen en la figura son en efecto máscaras, pero fo tografiadas por su lado cóncavo, el que se ajusta a la cara de la persona que se la pone, e iluminadas desde arriba. Sin embargo son claramente percibidas como máscaras vistas por su lado convexo e iluminadas desde abajo. El efecto pone de manifiesto la importancia que factores tales como la experiencia previa y el contexto pueden tener en la determinación de nuestra percepción. En este caso, ante un estímulo extraño como es el lado cóncavo de una máscara, nuestro sistema visual prefiere ver caras normales convexas aunque para ello tenga que asumir que la luz viene de abajo. El efecto del contexto puede comprobarse si fijamos nuestra atención sobre los dos círculos que aparecen entre


las dos máscaras. Si aislamos su percepción del influjo de las caras tapándolas, el círculo de la izquierda tiende a percibirse como cóncavo y el de la derecha como convexo, de acuerdo con una percepción que asume que la fuente de luz viene de arriba. Sin embargo, cuando los dos círculos se incluyen en las caras, donde predomina la percepción de la iluminación desde abajo, el cír· culo de la izquierda aparece convexo, parecido a un bulto en la cara, y el de la derecha cóncavo.

Una sombra es una zona de la escena a la que no llega la iluminación por haber sido ésta bloqueada. Cuando un objeto se interpone entre una fuente de iluminación y una superficie, proyecta sobre ésta una sombra que proporciona información sobre la escena tridimensional. La forma de la sombra depende de varios factores: la proximidad de la fuente de iluminación, su dirección, la forma del objeto que proyecta la sombra, el relieve de la superficie sobre la que es proyectada y la posición relativa entre la fuente, el objeto y la superficie. La sombra puede estar unida al objeto o separada del mismo. Las sombras unidas al objeto indican que el objeto está apoyado sobre la superficie.

La Figura 4.6 muestra dos escenas iguales en todo, excepto en la posición de las sombras respecto al objeto que las produce. En A, las sombras están unidas al objeto, lo que provoca la percepción de las esferas como si estuvieran descansando sobre la superficie y alineadas diagonalmente en profundidad de izquierda a derecha. En B las sombras se van separando de los objetos y permanecen alineadas en dirección perpendicular a la línea de visión dando ocasión a una percepción de las esferas como si estuvieran a diferentes alturas respecto de la superficie pero todas ellas situadas en el mismo plano frontal.

B

FIGURA 4.6. Información proporcionada por la sombra proyectada por los objetos. En A las sombras están unidas a los objetos, en B están separadas y su alineación modifica la percepción en profundidad de los objetos. Fuente: Stephen E. Palmer. Vision Science: Photons to Phenomenology. © 1999. Cambridge, MA: The

MIT Press, p. 246, fig. 5.5.30.

PERCEPCIÓN VISUAL

6flujo de las caras tapándolas, rro cóncavo y el de la derecha 1 que asume que la fuente de os círculos se incluyen en las minación desde abajo, el círa un bulto en la cara, y el de

e no llega la iluminación por terpone entre una fuente de

una sombra que proporciona de la sombra depende

iluminación, su dirección, de la superficie sobre la

ente, el objeto y la superfidel mismo. Las sombras

sobre la superficie. do, excepto en la posición

En A, las sombras están las esferas como si estuvie

¡.ua¡;vJL!alll"'"te en profundiseparando de los objetos

a la línea de visión dando vieran a diferentes alturas

en el mismo plano frontal.

proyectada por los objen separadas y su alinea

objetos. Fuente: Stephen E. 1999. Cambridge, MA: The


1.1.1.2.8. Interposición. Los objetos que se encuentran más alejados pueden quedar total o parcialmente ocultos a un observador por la presencia de otros objetos interpuestos en la línea de visión. Cuando un objeto aparece parcialmente encubierto, nuestro sistema visual tiende a percibir como más alejado al objeto tapado y como más cercano al objeto interpuesto. La interposición es uno de los más potentes indicadores de profundidad aunque se limita a proporcionarnos información ordinal sobre la distancia de los objetos en relación al observador. Si el objeto A oculta al objeto B y éste, a su vez, oculta a C entonces C es el más alejado del observador y A es el más cercano. La interposición no nos informa de la magnitud de las distancias entre los objetos y el observador.

1.1.2. Claves dinámicas

Las claves que hemos estudiado son indicios que proporcionan información sobre la profundidad en situaciones estáticas, cuando tanto el objeto observado como el observador están quietos. Sin embargo nuestra percepción cotidiana tiene lugar en un medio en el que con frecuencia nosotros nos movemos en relación a los objetos y los objetos se mueven en relación a distintos marcos de referencia incluidos nosotros mismos. El movimiento del observador y de los objetos da lugar a nuevas claves de profundidad y de distancia que vamos a estudiar a continuación. El estudio de la percepción del movimiento tiene una gran importancia en sí mismo y por ello le dedicamos un capítulo en este libro.

1.1.2.1. Paralaje3 de movimiento. Cuando un observador se mueve en dirección lateral, por ejemplo de derecha a izquierda, con respecto a su campo de visión, los objetos que se encuentran a distancias diferentes proyectan unas imágenes en la retina que se mueven en sentido y a velocidades diferentes. De forma más precisa, podemos definir paralaje de movimiento como el desplazamiento diferencial de las imágenes, proyectadas por distintos objetos, debido a un cambio lateral en la posición del observador y a la distancia relativa de los objetos con respecto al punto de fijación.

Una forma sencilla de entender esta clave de distancia consiste en colocar el dedo pulgar de cada mano a distintas distancias en la línea de visión y alinearlos con un tercer objeto más alejado que sirva de referencia. Si en esa situación, con los dedos y el objeto a distintas distancias en la misma línea de visión y el punto de fijación situado en el objeto más alejado, movemos la cabeza hacia la derecha, notaremos que los dos dedos se mueven hacia la

3. El término paralaje se utiliza con un significado ligeramente diferente en distintos contextos: militar, topográfico, de la astronomía, etc. Algunas veces se utiliza como sinónimo de ángulo visual. El uso que se hace en psicología de la percepción está relacionado con el concepto topográfico en el que paralaje se define como la diferencia en la dirección o emplazamiento en la posición aparente de un objeto debido a una variación del punto de observación.


izquierda en relación con el tercer objeto pero que el dedo más cercano se mueve más lejos y más rápidamente. Si movemos la cabeza hacia la izquierda, el movimiento de los dedos respecto al objeto cambiará de sentido pero, de nuevo, el dedo más cercano se moverá más lejos y más rápidamente. En general, los objetos más cercanos parecen desplazarse más lejos y a mayor velocidad mientras que para los más alejados el desplazamiento es menor y más lento. Sin embargo, el sentido del movimiento no depende únicamente de la distancia a la que se encuentran los objetos sino también de la posición del punto de fijación. Los objetos que están situados en una posición más cercana al observador que aquella en la que cae el punto de fijación, se mueven en sentido contrario al observador, mientras que los situados en una posición más alejada que el punto de fijación se mueven en el mismo sentido que el observador. Si no ha bajado usted los dedos, compruebe este efecto fijando ahora la mirada en el dedo que está entre el objeto que antes servía de punto de referencia y el dedo más cercano a usted. Observe cómo el objeto más alejado se desplaza en el sentido del movimiento de su cabeza, mientras que el dedo más cercano a usted lo hace en sentido contrario.

El paralaje de movimiento es una clave de profundidad muy efectiva a grandes distancias incluso cuando no están presentes otras claves de profundidad. No obstante, su efectividad aumenta cuando la información espacial es rica y proporciona varios puntos de referencia.

1.1.2.2. Flujo óptico. Para Gibson (1950,1966) el análisis de la clave que hemos llamado paralaje de movimiento no es más que una consideración parcial de un patrón global de estimulación que él denominó flujo óptico. Con este término Gibson quiso poner el énfasis en la necesidad de tomar en consideración las transformaciones del patrón global de estimulación cuando un observador se mueve en el medio ambiente. Como vimos anteriormente en el estudio de la textura, también en este contexto Gibson acentuó la importancia de los gradientes de movimiento refiriéndose a los cambios graduales en velocidad y dirección que tienen lugar en la escena visual4

•

La Figura 4. 7 presenta un esquema del flujo óptico de una escena cuando el observador se mueve lateralmente de derecha a izquierda con la mirada fija en el punto central (F) de la escena.

4. Desde un punto de vista estrictamente gibsoniano, tratar el flujo óptico y el gradiente de densidad de textura como «claves» de profundidad representa una forma de minimizar el mensaje alternativo que Gibson quiso dar a su aproximación ecológica. Es más, representa una forma de integrar sus principales aportaciones en un esquema expositivo que Gibson consideró inadecuado. Gibson fue el investigador que puso mayor énfasis en el importante papel que juegan los gradientes y, mediante el concepto de flujo, también acentuó la importancia de los aspectos dinámicos en la percepción. Más adelante tendremos ocasión de estudiar más en detalle su teoría. En el fondo, si hemos optado por incluir el gradiente de densidad de textura y el flujo óptico entre las claves de profundidad, es porque creemos que pueden ser tratadas como tales y porque no compartimos las posturas radicales que Gibson propuso.

El

Fl' zc di

d, tl

d rr p o d 1< V

p

r; d V

f¡

d u t• e e e ¡: f e e ¡.

PERCEPCIÓN VISUAL

que el dedo más cercano se ) S la cabeza hacia la izquiero cambiará de sentido pero, ejos y más rápidamente. En

zarse más lejos y a mayor desplazamiento es menor y

no depende únicamente sino también de la posición , s en una posición más cer

ro de fijación, se mueven situados en una posición el mismo sentido que el

e este efecto fijando que antes servía de punto

cómo el objeto más de su cabeza, mientras que trario.

ndidad muy efectiva a otras claves de profun

la información espacial es

el análisis de la clave que una consideración par

nominó flujo óptico. Con ·dad de tomar en con

e estimulación cuando un vimos anteriormente en el bson acentuó la importan

los cambios graduales en visual4

•

· co de una escena cuando uierda con la mirada fija

el fluj o óptico y el gradiente una forma de minimizar el

¡~v•• v¡;''~" · Es más, representa una <>vn. nc " -" ' 0 que Gibson consid eró

s en el importante papel que ó la importancia de los as-

ón de estudiar más en detalle densidad de textura y el flujo

eden ser tratadas como tales y


-------- ....... eF ---------FIGURA 4.7. Esquema correspondiente al flujo óptico producido por el desplazamiento lateral del observador de derecha a izquierda. Las flechas indican la dirección del flujo óptico y su tamaño la velocidad del mismo tomando como

referencia el punto de fijación.

Las flechas del esquema son vectores que indican, con su punta el sentido de las distintas direcciones que corren paralelas unas a otras, y con su longitud la mayor o menor velocidad del conjunto de puntos organizados en una determinada dirección. Como vimos al hablar de la clave paralaje de movimiento, el sentido del movimiento para todos los puntos que se encuentran por delante del punto de fijación es contrario al sentido del movimiento del observador, mientras que el de los puntos que se sitúan por detrás del punto de fijación es igual que el del observador. Además, el esquema hace explícita la representación del gradiente de velocidad presente en la escena, donde la velocidad se va haciendo menor a medida que las direcciones se aproximan al punto de fijación y aumentan a medida que se alejan del mismo.

El análisis del flujo óptico cuando el movimiento del observador es lateral respecto de la escena no produce resultados muy diferentes del análisis del paralaje de movimiento, aunque es importante tomar en consideración el valor informativo de los gradientes. Una aportación más original de Gibson fue el análisis del flujo óptico cuando el movimiento del observador se dirige directamente hacia un objeto o se aleja de él en el plano frontal. Al acercarse a una superficie u objeto, se produce un fenómeno de expansión óptica consistente en que el punto de fijación permanece estático en la fóvea mientras que el resto de puntos en el campo visual divergen hacia su exterior en todas las direcciones a partir del punto de fijación y a una velocidad que es tanto mayor cuanto más alejados están del punto de fijación. Cuando la velocidad de expansión es alta, el patrón de expansión produce la impresión de que la superficie se echa encima del observador. Por el contrario, cuando el movimiento consiste en alejarse de un punto de referencia, el patrón que se produce es de contracción óptica en el que los puntos del campo visual tienden a converger hacia el punto de fijación (ver Figura 5 .9).


Los patrones de flujo óptico pueden resultar muy complejos y difíciles de analizar en términos matemáticos. Los ejemplos que acabamos de estudiar permiten entender la naturaleza de estas claves de carácter global, que forman parte de la contribución de Gibson al estudio de la percepción espacial.

1.1.2.3. El Efecto de profundidad cinética. No sólo resultan informativos respecto a la distancia o a la profundidad los cambios en el flujo óptico pro· ducidos por el movimiento del observador, también los cambios en el patrón de estimulación producido por el movimiento de un objeto pueden propor· cionar información sobre la profundidad. Un efecto que ha sido muy investigado en la psicología de la percepción visual y que ejemplifica lo que acabamos de afirmar es el efecto de profundidad cinética que Wallach y O'Connell (1953) mostraron por primera vez. Lo entenderemos mejor por referencia a la Figura 4.8

p

1 1 /

1 / / 1 / //

1 / / 1 /

/¡ / o¿¡ /

FIGURA 4.8. Efecto de profundidad cinética. La fuente de iluminación L proyecta sobre la pantalla P la sombra del objeto en forma de T. El observador O, situado por delante de la pantalla, sólo es estimulado por la sombra del objeto y sus trans-

formaciones bidimensionales al rotar.

La situación que genera la estimulación es parecida a la utilizada para producir sombras chinescas. Un objeto, en este caso un palo, colocado perpendicularmente sobre un eje vertical, que puede hacerse rotar, se sitúa entre una fuente de iluminación y una pantalla traslúcida sobre la que se proyecta la sombra del objeto. El observador se encuentra al otro lado de la pantalla de forma que sólo es capaz de ver las sombras del objeto proyectadas en la

E

p

r

S

PERCEPCIÓN VISUAL

uy complejos y difíciles de que acabamos de estudiar arácter global, que forman . percepción espacial.

sólo resultan informativos rios en el flujo óptico pron los cambios en el patrón un objeto pueden proporo que ha sido muy investi: ejemplifica lo que acaba[ que Wallach y O'Connell ws mejor por referencia a

de iluminación L proyecta El observador O, situado bra del objeto y sus trans-

cicla a la utilizada para un palo, colocado per

rotar, se sitúa entre sobre la que se proyecta otro lado de la pantalla bjeto proyectadas en la


pantalla. Cuando el objeto está estático, no se percibe profundidad alguna, solamente la sombra bidimensional del palo. Cuando se hace rotar el objeto en torno al eje vertical, la sombra del palo aparece rotando también en profundidad. Lo realmente curioso en este efecto es que el patrón bidimensional de cambios en la sombra proyectada en la pantalla consiste en una sucesión de líneas que varían en longitud y en orientación pero lo que el observador percibe no son las deformaciones bidimensionales de un conjunto de líneas sino la forma invariante de un palo que rota en profundidad sobre un eje. El hecho es que, de entre las distintas interpretaciones perceptivas que la estimulación puede tener, el sistema visual impone una determinada: la de una forma rígida rotando en profundidad. Parece como si el sistema visual estuviera sesgado a favor de esa forma de percibir mientras los datos que proporciona la estimulación sean consistentes con ella.

Se han dado varias explicaciones de carácter general a este fenómeno. Los psicólogos de orientación empirista opinan que el sesgo está determinado por la experiencia ya que la rotación de formas rígidas es más frecuente en el medio ambiente que las deformaciones plásticas bidimensionales. Los psicólogos de la Gestalt opinan que la interpretación en términos de una forma rígida que rota es más simple. La verdad es que no tenemos un por qué satisfactorio para este efecto, pero el efecto es robusto y demuestra sin lugar a dudas que el sistema visual es capaz de recuperar la forma y el movimiento en profundidad de los objetos a partir de los cambios en longitud y en orientación de formas bidimensionales. El efecto de profundidad cinética es un buen ejemplo del carácter constructivo de la percepción a partir de una estimulación ambigua.

1.2. Las Claves binoculares

Son aquellas que proporcionan información sobre la distancia combinando información procedente de cada uno de los ojos. En este apartado estudiaremos la convergencia binocular y la profundidad estereoscópica.

1.2.1. Convergencia binocular. Cuando fijamos la vista en un objeto, las líneas de visión de cada uno de los ojos convergen en el punto de fijación. Al ángulo formado por estas líneas con vértice en el punto de fijación se le llama ángulo de convergencia. La importancia que este ángulo tiene para la percepción de la profundidad radica en el hecho de que su tamaño varía en función de la distancia a la que se encuentra el punto de fijación. Si el objeto se aproxima a nosotros, el ángulo de convergencia tiende a hacerse mayor, y si el objeto se aleja, el ángulo de convergencia tiende a disminuir.

La convergencia binocular, al igual que la acomodación, es una clave fisiológica porque el tipo de información que proporciona se refiere a los ajustes oculomotores que controlan la posición de los ojos. La Figura 4.9 proporciona ayuda para entender la forma en que la desviación de los ojos necesaria


< C;

FIGURA 4.9. Características geométricas del ángulo de convergencia binocular.

para producir la convergencia binocular puede proporcionar información sobre la distancia a la que se encuentra un objeto.

En la figura, el punto de fijación está en el punto P donde convergen las líneas de visión del ojo derecho D e izquierdo l. La distancia a la que se encuentra el objeto está representada por la línea discontinua (d), mientras que la distancia 1- D corresponde a la distancia interpupilar que en el adulto medio es de unos 65 milímetros. Sobre la base de las relaciones angulares que aparecen en la figura puede calcularse la distancia a la que se encuentra el objeto. De una forma sencilla, pero suficientemente aproximada, puede considerarse la distancia interpupilar como el arco de un círculo y la distancia (d) como su radio, con lo cual resulta que el valor del ángulo e:

e= 651 d

cuando e se expresa en radianes. Obsérvese que el valor de e en esa ecuación puede conocerse ya que es igual a la suma de los ángulos e¡ + ed que son los ángulos correspondientes a la desviación de cada ojo al converger sobre el punto de fijación.

La ecuación que acabamos de ver muestra que el ángulo de convergencia puede ser utilizado por el sistema visual para determinar la distancia al punto de fijación. Ahora cabe preguntarse si de hecho el sistema visual utiliza esa información. La respuesta es afirmativa pero solamente para distancias cortas

PERCEPCIÓN VISUAL

de convergencia binocular.

porcionar información so-

punto P donde convergen I. La distancia a la que se discontinua (d), mientras

upilar que en el adulto e las relaciones angulares ncia a la que se encuentra

te aproximada, puede de un círculo y la distancia del ángulo C:

valor de e en esa ecuación los ci + cd que son los

ojo al converger sobre el

el ángulo de convergencia · r la distancia al punto sistema visual utiliza esa te para distancias cortas


porque la variación en el ángulo de convergencia sólo tiene lugar en distancias no superiores a uno o dos metros. Más allá de los tres metros de distancia la posición de los ojos no cambia por mucho que el objeto se aleje.

Normalmente la convergencia binocular actúa conjuntamente con la acomodación, clave que hemos estudiado anteriormente. A medida que un objeto se aleja, tanto la convergencia como la acomodación varían por eso resulta difícil estudiar el papel de una de las claves y mantener constante la otra. Podría parecer que tapando un ojo al observador anularíamos la influencia de la convergencia y aislaríamos el efecto de la acomodación pero incluso en una situación así continúa funcionando el mecanismo de convergencia. Al parecer, la información proporcionada por la acomodación del cristalino del ojo no tapado es suficiente para guiar al mecanismo de convergencia. En conclusión, tanto la convergencia como la acomodación son claves útiles en distancias cortas y además tienen el valor añadido de proporcionar información sobre la distancia absoluta a la que se encuentra un objeto, cosa que pocas claves de distancia proporcionan.

1.2.2. La estereoscopia

La estereoscopia es una clave que nos proporciona información acerca de la distancia relativa de los objetos sobre la base del desplazamiento lateral que la proyección de un objeto experimenta en las retinas de los dos ojos. En este apartado, primero explicaremos los conceptos que nos ayudarán a caracterizar esta clave, posteriormente expondremos los procedimientos utilizados en su estudio y terminaremos con una aproximación a los mecanismos que la producen. La estereoscopia ha sido una de las claves cuyo estudio ha atraído en mayor medida el interés de los investigadores, por ello merece la pena que le dediquemos una atención especial.

1.2.2.1. Conceptos fundamentales

En la Figura 4.9 la imagen del punto de fijación (P) se proyecta en el centro de la fóvea de cada una de las dos retinas, la derecha y la izquierda. Los puntos de cada retina sobre los que cae la proyección se llaman puntos correspondientes porque, si superpusiéramos la retina de un ojo sobre la retina del otro, los puntos coincidirían. En general, un punto a en la retina derecha y un punto b en la retina izquierda son puntos correspondientes cuando ambos tienen la misma posición en su respectiva retina. No sólo son puntos correspondientes los que, situados en las fóveas, reciben estimulación del punto de fijación, cada punto de una retina tiene su correspondiente punto en la otra. La estimulación de puntos correspondientes en las dos retinas provoca fusión binocular puesto que el objeto es visto como un único objeto en el espacio a pesar de ser dos los puntos estimulados en las retinas.


Horópter. Recibe este nombre el conjunto de puntos en el espacio visual que, dada una determinada fijación ocular, proyectan su imagen en puntos correspondientes de las dos retinas. Hay que notar que el horópter se define en relación al punto de fijación y por lo tanto cambia cuando cambia el punto de fijación. Aún así, desde el siglo diecisiete los investigadores han tratado de estudiar la forma que tiene.

Desde una aproximación teórica, basada en la óptica geométrica, suponiendo que los ojos son esferas perfectas y que rotan en torno a ejes que solamente pasan por el punto nodal de cada ojo5, el horópter longitudinal, que se define en el plano horizontal, está constituido por una circunferencia que pasa por el punto de fijación y por el punto nodal de cada ojo. Esta circunferencia suele conocerse como circunferencia de Vieth-Müller en honor de quienes la propusieron por primera vez. En el plano vertical, el horópter vertical está definido por la recta perpendicular al plano de visión.

Cuando se determina empíricamente el conjunto de puntos del espacio visual que, para una determinada fijación ocular, proyectan su imagen en puntos correspondientes de las dos retinas, los resultados muestran desviaciones sistemáticas respecto a la posición de los puntos determinada teóricamente. La Figura 4.10 muestra con líneas discontinuas las desviaciones tanto para el horópter longitudinal como para el vertical.

Como puede verse, el horópter vertical tiende a estar inclinado en la dirección de la línea de visión, alejándose del observador por encima del punto

Horópter teórico vertical

Punto de fijación

Horópter empirico

Horópter teórico horizontal

FIGURA 4.1 O. Horópter teórico y empírico en los planos horizontal y vertical. Fuente: Stephen E. Palmer. Vision Science: Photons to Phenomenology. © 1999.

Cambridge, MA: The MIT Press, p. 209, fig. 5.3.4.

5. El punto nodal es el punto en que el rayo principal -o no desviado- de luz proveniente de un objeto corta al eje óptico. El punto nodal se encuentra a una distancia de la imagen formada en la retina de aproximadamente 17 mm. En realidad, el ojo humano, como todo sistema general de lentes, tiene dos puntos nodales, pero como la distancia entre ell os es muy pequeña, son tratados como un solo punto.

PERCEPCIÓN VISUAL

) de puntos en el espacio visual royectan su imagen en puntos notar que el horópter se define :ambia cuando cambia el punto s investigadores han tratado de

la óptica geométrica, supoe rotan en torno a ejes que o5

, el horópter longitudinal, tuido por una circunferencia

nodal de cada ojo. Esta cirde Vieth-Müller en honor

el plano vertical, el horópter al plano de visión.

de puntos del espacio viproyectan su imagen en puntados muestran desviaciones s determinada teóricamente. las desviaciones tanto para el

por encima del punto

Horópter teórico horizontal

planos horizontal y vertical. to Phenomenology . © 1999.

209, fig. 5.3.4.

-o no desviado- de luz provetra a una distancia de la imagen

·dad, el ojo humano, como todo la distancia entre ellos es muy


de fijación y acercándose a él por debajo del punto de fijación. El horópter longitudinal tampoco se ajusta a la predicción sino que tiende a quedarse en una posición próxima a la circunferencia de Vieth-Muller pero desviada en dirección a la línea que pasa por el punto de fijación y es paralela a la distancia interocular6

•

Disparidad Binocular. Cuando un punto en el espacio visual no proyecta su imagen en puntos correspondientes de las dos retinas, las imágenes del objeto en cada uno de los dos ojos resultan tanto más diferentes cuanto mayor es el desplazamiento lateral de una proyección respecto de la otra. Este desplazamiento relativo de las dos proyecciones recibe el nombre de disparidad binocular7. El fenómeno puede hacerse patente si repetimos el ejercicio que realizamos al estudiar el fenómeno de paralaje de movimiento. De nuevo podemos alinear nuestros dos pulgares con un tercer objeto más lejano que nos sirva de punto de fijación pero esta vez lo hacemos cerrando el ojo izquierdo y apuntando con el ojo derecho. En estas condiciones, cuando los dedos y el objeto están bien alineados, cerramos el ojo derecho y abrimos el izquierdo. Veremos que los tres objetos han dejado de estar alineados y que los dedos se han desplazado hacia la derecha de la línea de visión, siendo el desplazamiento del dedo más cercano mayor que el del dedo en posición intermedia. La ligera diferencia entre la visión de la escena proporcionada por el ojo derecho y por el izquierdo está ocasionada por las distintas proyecciones que reciben debido a la separación existente entre ellos. Si repetimos el ejercicio pero situando el punto de fijación en el dedo más próximo a nosotros veremos que al cerrar el ojo derecho y abrir el izquierdo tanto el dedo en posición intermedia como el objeto lejano se desplazan a la izquierda de la línea de visión y en este caso el desplazamiento del objeto lejano es mayor que el del dedo en posición intermedia.

El fenómeno de la disparidad binocular es parecido al fenómeno de paralaje de movimiento; de hecho fue denominado paralaje binocular en los comienzos de la psicología experimental. No obstante se diferencian en que el desplazamiento de la imagen en la disparidad binocular está fijado por la distancia interocular, mientras que en la clave de paralaje de movimiento el desplazamiento de la imagen depende de la amplitud del movimiento lateral que realice el observador. Además, en la disparidad binocular el desplazamiento de las imágenes es simultáneo mientras que en la clave de paralaje de movimiento el desplazamiento de las imágenes es sucesivo. Obsérvese, por tanto, que el ejemplo que estamos utilizando de alineamiento de los dedos pulgares con un objeto alejado es, en sentido estricto, un ejemplo de paralaje de movimiento

6. Esta línea es la definición de horópter, propuesta por Aguilonius en 1613, que tuvo vigencia hasta que Vieth primero y Mul ler después propusieron de forma independiente la definición circular aceptada en la actualidad.

7. La disparidad binocular que estudiamos ahora se limita a disparidad en el plano horizontal que es la que puede producir información respecto a la distancia. La disparidad vertical no da lugar a visión en profundidad aunque puede degradar la profundidad proporcionada por la disparidad horizontal.


que produce sucesivamente un desplazamiento de la imagen igual al desplazamiento simultáneo producido por la disparidad binocular.

La disparidad binocular puede proporcionarnos información respecto a la posición de los objetos en el espacio tridimensional, tanto por medio del sentido del desplazamiento que produce, como por la magnitud del mismo. El sentido de la disparidad nos informa de la posición del objeto respecto al punto de fijación. Si repetimos el ejercicio que hemos realizado anteriormente, de alineación de los dedos con un objeto alejado, apuntado ahora la mirada hacia el dedo situado en posición intermedia, veremos que al cerrar el ojo derecho y abrir el izquierdo el objeto lejano se desplaza a la izquierda de la línea de visión mientras que el dedo más cercano se desplaza a la derecha. En general, el desplazamiento de los objetos más próximos que el punto de fijación se produce en sentido contrario al desplazamiento de las imágenes producido por nuestro abrir y cerrar de ojos, y por ello se le da el nombre de disparidad cruzada. Por el contrario, los objetos más alejados de nosotros que el punto de fijación se desplazan en el mismo sentido que el del desplazamiento de las imágenes y por ello la disparidad que producen se denomina no cruzada. La Figura 4.11 presenta la situación de desplazamiento simultáneo de la imagen propia de la disparidad binocular.

En la figura, el punto de fijación está situado en P. Los puntos más cercanos al observador que el punto de fijación, que dan origen a una disparidad cruzada, como es el caso del punto C, producen el desplazamiento de sus proyecciones hacia la zona lateral de las retinas. Por otra parte, los puntos más

F

Ojo izquierdo Ojo derecho

FIGURA 4.11. Desplazamiento de la imagen en la disparidad binocular.

PERCEPCIÓN VISUAL

[a imagen igual al desplazanocular. os información respecto a ional, tanto por medio del or la magnitud del mismo. sición del objeto respecto hemos realizado anterior-

· lejado, apuntado ahora la ta, veremos que al cerrar el desplaza a la izquierda de se desplaza a la derecha.

próximos que el punto de .zamiento de las imágenes or ello se le da el nombre s más alejados de nosotros entido que el del desplazaproducen se denomina no esplazamiento simultáneo

f P. Los puntos más cercan ongen a una disparidad lesplazamiento de sus pro, tra parte, los puntos más

e

disparidad binocular.


alejados del observador que el punto de fijación, que dan origen a disparidad no cruzada, como es el caso del punto F, producen el desplazamiento de sus proyecciones hacia la zona nasal de las retinas.

Finalmente, la magnitud del desplazamiento es un indicador cuantitativo de la distancia a la que se encuentra un objeto: a medida que un objeto se aleja del punto de fijación aproximándose al observador, su disparidad cruzada aumenta, y a medida que un objeto se aleja del punto de fijación alejándose también del observador, su disparidad no cruzada aumenta. El aumento de la disparidad cruzada está, por tanto, asociado con una aproximación del objeto al observador y el aumento de la disparidad no cruzada está asociado con un alejamiento del objeto respecto al observador. Y, a la inversa, la disminución de la disparidad cruzada está asociada con un alejamiento del objeto respecto al observador mientras que la disminución de la disparidad no cruzada está asociada con un acercamiento del objeto al observador.

La disparidad binocular puede producir dos efectos perceptivos diferentes dependiendo de su magnitud. Puede producir estereoscopia o puede producir imágenes dobles que ponen en marcha un proceso de rivalidad binocular. Cuando la disparidad es pequeña, las imágenes de los dos ojos se fusionan en una sola pero situada a una distancia del observador diferente de la distancia que corresponde al horópter. Esta diferencia en profundidad es lo que se denomina estereoscopia. En pocas palabras, podemos definir estereoscopia como la percepción de la profundidad producida por la disparidad binocular. Dependiendo de la dirección de la disparidad los objetos aparecen por delante o por detrás del horópter longitudinal. La disparidad cruzada produce la percepción del objeto por delante del horópter mientras que la disparidad no cruzada produce la percepción del objeto por detrás del horópter. En ambos casos, la dirección de la línea de visión al objeto fusionado es el promedio de las direcciones visuales predichas a partir de las dos imágenes monoculares.

1.2.2.2. Procedimientos estereoscópicos. La investigación de la estereoscopia ha estado relacionada con la invención y utilización de estereogramas, que son pares de imágenes prácticamente iguales pero que difieren en el desplazamiento lateral de sus elementos. Cada imagen del par recibe el nombre de media-imagen. Cuando cada media-imagen estimula un ojo diferente al mismo tiempo, la imagen fusionada produce una ineludible sensación de profundidad. Los estereogramas fueron inventados hacia 1838 por Wheatstone, que también inventó el estereoscopio, aparato que permitía la presentación a cada ojo por separado de los componentes de un estereograma. La Figura 4.12 presenta un ejemplo de estereograma tradicional en el que las dos medias-imágenes están desplazadas hacia el exterior.

Si cada media-imagen es presentada simultáneamente a un ojo diferente8,

se producirá la segregación de la imagen fusionada en tres planos diferentes

8. La percepción estereoscópica de la imagen en la Figura 4,12 puede conseguirse me-


A ~~ • •

B ~ ~ e ~~

• •

D ~ ~ FIGURA 4.12. Ejemplos de estereogramas (A y C) y esquema de su correspondiente experiencia visual (By D). Fuente: Stephen E. Palmer. Vision Science: Photons to

Phenomenology. © 1999. Cambridge, MA: The MIT Press, p. 21 O, fig. 5.3.6.

de profundidad. Los pequeños cuadrados aparecerán por delante de los círculos y estos, a su vez, por delante de los cuadrados grandes. Esta posición relativa de las figuras geométricas se debe a que el desplazamiento de las imágenes del estereograma se ha realizado hacia el exterior (disparidad cruzada). Si el desplazamiento hubiera sido hacia el interior, en sentido nasal (disparidad no cruzada), entonces el orden de aparición de las figuras hubiera sido el inverso; primero los cuadrados grandes, después los círculos y más alejados los cuadrados pequeños9•

diante el siguiente procedimiento. Coloque el libro frente a usted y coloque también un lápiz en el punto medio de las dos medias-imágenes del estereograma. Fije su vista en la punta del lápiz y, sin dejar de mirar a la punta, vaya acercando el lápiz hacia sus ojos. A medida que lo va acercando notará que los dos puntos negros que sirven de referencia debajo de las figuras se convierten en cuatro, debido a la formación de imágenes dobles en cada ojo, y después verá que los dos puntos intermedios se fusionan en uno. En el momento en que se produce la fusión de los puntos intermedios aparecerá de una forma muy nítida la imagen fusionada como si fuera una tercera imagen colocada entre las dos originales. Esta imagen fusionada es la que presenta la segregación de las figuras en profundidad tal como se indica en el texto.

9. La posición relativa de las figuras geométricas en diferentes planos de profundidad no depende solamente del sentido en que tiene lugar el desplazamiento de las imágenes del estereo-

E

d q d o e t(

d

e f L e

r

PERCEPCIÓN VISUAL

esquema de su correspondienVision Science: Photons to Press, p. 210, fig. 5.3.6.

n por delante de los cír-os grandes. Esta posición

desplazamiento de las imá·or (disparidad cruzada).

r, en sentido nasal (disparilas figuras hubiera sido el

los círculos y más alejados

usted y coloque también un lápiz . Fije su vista en la punta del

hacia sus ojos. A medida que lo · referencia debajo de las figuras se

en cada ojo, y después verá que en que se produce la fusión de

imagen fusionada como si fuera fusionada es la que presenta el texto.

planos de profundidad no iento de las imágenes del estereo-


Hasta los años sesenta del siglo pasado, se utilizaron estereogramas tradicionales como el que aparece en la Figura 4.12. Hasta entonces se pensaba que la percepción estereoscópica de la profundidad era la consecuencia de la disparidad retiniana del contorno y de los bordes de cada media-imagen. En consecuencia, se pensaba también que la percepción monocular de la forma era un requisito previo para que tuviera lugar la fusión binocular. Para el sistema visual, el problema fundamental a resolver, que es el llamado problema de la correspondencia, quedaba así muy simplificado.

1.2.2.3. El problema de la correspondencia. Uno de los problemas principales que tiene que resolver el sistema visual para poder llevar a cabo la fusión de las dos imágenes monoculares es determinar qué puntos o partes de la imagen de un ojo corresponden a qué puntos o partes de la imagen del otro ojo. Este es el llamado problema de la correspondencia.

Para la concepción tradicional de la estereoscopia este problema estaba relativamente simplificado por el hecho de que -se suponía- la forma y los bordes de la imagen monocular podían guiar el proceso de fusión de la imagen estereoscópica. La gran revolución en el estudio de la estereoscopia se produjo cuando Bela Julesz (1971) demostró que se podía producir estereoscopia utilizando estereogramas de puntos aleatorios.

1.2.2.4. Estereogramas de puntos aleatorios. Este tipo de estereograma consiste en una pareja de medias-imágenes, cada una de las cuales consiste en miles de puntos colocados aleatoriamente, cuyo desplazamiento lateral produce una fuerte sensación de profundidad cuando las dos medias-imágenes se ven estereoscópicamente. La forma en que Julesz construyó sus primeros estereogramas fue la siguiente. Generó por medio de un ordenador un patrón de puntos en una matriz bidimensional de 100 x 100. Cada celda de la matriz estaba ennegrecida (esto generaba un punto) o se dejaba en blanco de acuerdo con una secuencia puramente aleatoria. Esta matriz era la media-imagen de uno de los ojos, supongamos que el derecho. La correspondiente al otro ojo era idéntica a la anterior excepto que los puntos correspondientes a una pequeña submatriz rectangular situada en el centro habían sido desplazados

grama, también depende del método de convergencia ocular utilizado para fusionar las imágenes. La experiencia perceptiva descrita en el texto en relación con la Figura 4, 12 corresponde al método de convergencia ocular cruzada que se describe en la nota anterior y que consigue la fusión de las imágenes mediante el cruzamiento de los ojos focalizados en un punto de fijación que se aproxima al observador. Con el método de convergencia ocular no cruzada se comienza por aproximar a la cara la imagen en la Figura 4,12 hasta que la nariz toca la página del libro. Con los ojos relajados y sin cruzarlos se va alejando lentamente el libro de la cara. De nuevo se verán cuatro puntos, correspondientes a las imágenes dobles de cada ojo, que posteriormente se fusionan en tres. En ese momento la imagen fusionada situada en medio de las otras dos aparecerá en profundidad pero los planos de profundidad se presentarán en orden inverso al obtenido mediante el método de convergencia ocular cruzada.


FIGURA 4.13. Estereograma de puntos aleatorios.

una columna en sentido lateral. Este procedimiento tiene la virtud de mantener las propiedades relacionales de los puntos de la matriz grande inalterados mientras que proporciona a los puntos de la submatriz una disparidad retiniana correspondiente a una columna. La visión estereoscópica de este este· reograma provoca la percepción de una superficie rectangular (la submatriz) situada a distinto nivel de profundidad que la matriz grande.

La Figura 4.13 presenta un estereograma de puntos aleatorios construido en la forma que acabamos de describir. Si se utiliza un procedimiento de convergencia ocular cruzada para conseguir la fusión de las imágenes, se verá un cuadrado pequeño que se destaca por delante de un fondo formado por el resto de puntos.

Los estereogramas de puntos aleatorios demostraron que la forma y los bordes de la imagen monocular no son necesarios para guiar la resolución del problema de la correspondencia. Es suficiente una mera disparidad de puntos para que se produzca la segregación de una imagen o de una escena en diferentes planos de profundidad. Por otra parte, estos estereogramas también ponen de manifiesto que la estereoscopia no es un resultado tardío en el procesamiento de información visual, que necesite un procesamiento previo de la forma de las imágenes monoculares. Más bien, la estereoscopia, al menos en sus primeras fases, aparece como un proceso que tiene lugar relativamente pronto y que incluso proporciona información sobre la forma de los objetos10 .

1.2.2.5. Características de la estereoscopia humana. La sensibilidad estereoscópica de nuestro sistema visual es muy grande 11 • La investigación expe-

10. La moderna investigación computacional de la visión ha ideado gran cantidad de mode· los para explicar la forma en que el sistema visual puede resolver el problema de la correspondencia a partir de la disparidad binocular de puntos. Esta problemática queda fuera de los límites de este libro. El lector interesado puede encontrar una introducción asequible en R. M . Ruiz (1992).

11. La medición del umbral de estereoscopia puede hacerse de formas muy diversas. Tí pi-

PERCEPCIÓN VISUAL

aleatorios.

tiene la virtud de mantenatriz grande inalterados

·z una disparidad retireoscópica de este este

lar (la submatriz) grande.

aleatorios construiun procedimiento de

de las imágenes, se verá un fondo formado por

que la forma y los guiar la resolución del

ra disparidad de puntos e una escena en diferen

mas también ponen tardío en el procesa. previo de la for

ia, al menos en sus relativamente pronto

de los objetos 10•

La sensibilidad este. La investigación expe-

gran cantidad de mode-lema de la corresponden

queda fuera de los límites de en R. M . Ruiz (1992).

formas muy diversas. Típi-

EL ES PACIO TRIDIMENSIONAL 169

rimental coincide en afirmar que, bajo las mejores condiciones perceptivas, la agudeza estereoscópica se encuentra en el rango de los dos a los seis segundos de ángulo. También se ha encontrado que la sensibilidad es mayor para la disparidad cruzada que para la no cruzada. Con todo, la sensibilidad estereoscópica depende de factores espaciales tales como la excentricidad de los estímulos y la distancia entre los estímulos y el punto de fijación. Para las dos variables, excentricidad y distancia, la sensibilidad disminuye cuando aumentan sus valores.

En el otro extremo, la magnitud de disparidad dentro de la cual se produce estereoscopia está limitada a un área en torno al horópter que se conoce con el nombre de área de fusión de Panum12 . El tamaño de esta área de fusión no es igual para todo el horópter sino que es menor en el entorno del punto de fijación que en la periferia. Es de algo menos de 10 minutos de ángulo para la visión central y alcanza valores por encima de los 30 minutos de ángulo a partir de una distancia de unos 15 grados en la periferia. La Figura 4.14 muestra el área de fusión de Panum y su relación con el horópter.

l Área de Pan u m

Ojo izquierdo Ojo derecho

FIGURA 4.14. Área de fusión de Panum y su relación con el horópter. Obsérvense las proyecciones de distintos puntos en el espacio. Fuente: Margaret W. Matlin & Hugh J. Foley. Sensation and Perception {4. 0 ed.), p. 184, fig. 6.14.a . Publicado por Allyn and Bacon, Boston, MA. © 1997, Pearson Education. Reproducido con

autorización del editor.

camente se pide a los participantes que, con su mirada centrada en un punto de fijación, hagan juicios acerca de la profundidad relativa de dos estímulos situados fuera del horópter.

12. Panum fue un psicólogo alemán que en 1858 aplicó a la percepción del espacio visual la idea de los círculos sensoriales correspondientes que Weber había formulado para la sensibilidad cutánea. De la misma manera que en la piel la estimulación de dos puntos dentro de círculos sensoriales correspondientes producía una única sensación, así la doble estimulación en las retinas dentro de círculos correspondientes daba lugar a fusión binocular.


La figura también muestra las proyecciones de dos puntos en el horópter, uno (F) corresponde al punto de fijación y el otro (A) se encuentra en el horópter pero proyecta fuera de la fóvea_ Obsérvese que las proyecciones de A, que son a y a', proyectan sobre puntos correspondientes en las dos retinas. No ocurre así con el punto B cuyas proyecciones (by b') muestran una considerable disparidad cruzada.

La interpretación clásica del área de Panum ha considerado, siguiendo a este autor, que el área representaba propiedades fijas de una región determinada de la retina. Hoy sabemos que esta concepción es errónea pues tanto el tamaño como la forma del área de Panum dependen tanto de las características del estímulo como del procedimiento utilizado para medirla. Por ejemplo, Schor, Word y Ogawa (1984) encontraron que los objetos grandes tenían áreas mayores que los pequeños y lo mismo ocurría con las imágenes borrosas comparadas con las más nítidas. El área de Panum presenta unas características dinámicas considerables y depende de mecanismos perceptivos de considerable complejidad. Por tanto, las cifras que hemos dado anteriormente sobre sus dimensiones deben tomarse únicamente como una orientación referida a condiciones típicas de medición. En este capítulo no nos detendremos a estudiar los diferentes procedimientos utilizados para su medición.

1.2.2.6. Mecanismos fisiológicos de la estereoscopia. El hallazgo de neuronas en la corteza visual primaria (V1) que respondían de forma selectiva a la disparidad binocular tuvo lugar en 1967 y se debió a las investigaciones de Barlow, Blakemore, y Pettigrew. Con posterioridad se han encontrado células selectivas a la disparidad en otras áreas de la corteza cerebral como V2 y V3 . Como su mismo nombre indica, estas neuronas muestran alta tasa de disparo cuando un determinado estímulo incide en puntos de las dos retinas que no son correspondientes. Unas células responden preferentemente a niveles de disparidad bajos, mientras que otras lo hacen a niveles de disparidad altos. De forma parecida unas responden preferentemente a la disparidad cruzada mientras que otras lo hacen a la no cruzada. De entre las múltiples investigaciones psicofisiológicas sobre la estereoscopia merece la pena destacar, por su cuidadoso carácter cuantitativo, las realizadas recientemente por DeAngelis, Cumming y Newsome (1998, 2000) en el área temporal medial (MT) de monos. Descubrieron que en esta zona existía una clara organización funcional de la estereoscopia que presentaba tres características fundamentales :

l. Las neuronas selectivas a la disparidad estaban organizadas en columnas de acuerdo con valores particulares de disparidad, de forma que las neuronas que mostraban preferencia para una determinada disparidad binocular formaban parte de la misma columna.

2. Las neuronas selectivas a la disparidad estaban agrupadas a lo largo de MT formando como una especie de parches intercalados con otros que no mostraban selectividad a la disparidad.

PERCEPCIÓN VISUAL

dos puntos en el horópter, (A) se encuentra en el ho

f.1Ue las proyecciones de A, dientes en las dos retinas. ' y b') muestran una consi-

1 considerado, siguiendo a as de una región determin es errónea pues tanto el

tanto de las característiJara medirla. Por ejemplo, )S objetos grandes tenían a con las imágenes borro-um presenta unas carac

ecanismos perceptivos de emos dado anteriormente ) ffiO una orientación refe[tulo no nos detendremos

El hallazgo de neuan de forma selectiva a a las investigaciones de han encontrado células

cerebral como V2 y V3. alta tasa de disparo

las dos retinas que no r' ~""-'"'-"'L'- a ni veles de

de disparidad altos. a la disparidad cruzada las múltiples investiga

la pena destacar, por su temente por DeAngelis,

l medial (MT) de moorganización funcional fundamentales:

organizadas en colum' de forma que las

disparidad


3. Finalmente, en los parches con buena selectividad a la disparidad, la disparidad preferida variaba de forma gradual y continua de columna a columna a lo largo de la superficie de MT

Estos resultados indicaban que el área MT contenía un mapa de disparidad binocular, pero DeAngelis y sus colaboradores quisieron comprobar que efectivamente las neuronas pertenecientes a este mapa estaban implicadas en la percepción de la profundidad y para ello estimularon eléctricamente grupos de neuronas mientras los monos realizaban una tarea de discriminación de la profundidad utilizando estereogramas de puntos aleatorios estáticos. El uso de estereogramas estáticos era importante porque MT es un área que también contiene neuronas especializadas en el procesamiento del movimiento. Los resultados mostraron que la microestimulación provocaba un sesgo sistemático en los juicios perceptivos de los monos en la dirección de la disparidad preferida por las neuronas que eran estimuladas. Parece claro, por tanto, que en el área MT se originan señales relevantes para la percepción de la profundidad estereoscópica.

1.2.3. Rivalidad binocular

Hemos visto que la disparidad binocular, siempre que no sobrepase la magnitud indicada por el área de Panum, produce estereoscopia. Cuando la disparidad es grande y sobrepasa los valores de dicha área se producen imágenes dobles aunque por lo general la experiencia consciente de las dos imágenes, fenómeno que se denomina diplopía, no llega a producirse. La razón de que no se produzca se debe a que las imágenes dobles provocan un fenómeno de rivalidad binocular en el que ambas imagen parecen competir por acceder a la consciencia. Cuando los estímulos son pequeños, produciendo un ángulo visual igual o menor a un grado, la rivalidad es total de forma que una imagen domina sobre la otra durante un periodo de tiempo que oscila entre 1 y 4 segundos y durante ese periodo es la única imagen percibida conscientemente. Después la experiencia consciente cambia y la imagen que antes estaba suprimida accede a la consciencia y la que se percibía es suprimida. Así se produce una continua alternancia entre las dos imágenes que se debe probablemente a la fatiga de las neuronas responsables de su respectiva percepción consciente. Cuando los estímulos son grandes, la rivalidad binocular produce una imagen consciente compuesta de trozos o partes pertenecientes a cada una de las dos imágenes.

La visión binocular normal implica tanto estereoscopia como rivalidad binocular. Si en nuestra experiencia visual habitual consciente el campo visual aparece bien unificado, es debido a la acción conjunta de los mecanismos que subyacen a estos dos fenómenos. La estereoscopia fusiona los puntos que se encuentran dentro del área de Panum y la rivalidad binocular resuelve la competición entre imágenes dobles.


1.3. Relación entre las claves de profundidad

Hasta este momento en la exposición de este capítulo, hemos estudiado la aportación de las distintas claves de profundidad considerando cada una de ellas de forma aislada. Obviamente en la percepción ordinaria, todas estas claves actúan de forma conjunta integrando la información que cada una de ellas aporta para lograr una percepción consistente del espacio tridimensio· nal. La percepción de la profundidad está sobredeterminada por el conjunto de factores que hemos estudiado de forma que la ausencia de una clave no es un obstáculo para que el sistema visual pueda obtener una adecuada adapta· ción a la situación estimular tridimensional. Esta sobredeterminación es también un indicador de la importancia que la percepción de la tercera dimensión tiene para la supervivencia del organismo.

Cómo se lleva a cabo la integración de las distintas claves para producir la percepción de la profundidad es un tema poco investigado aún. Las investigaciones de laboratorio han tratado de comparar unas claves con otras con el fin de observar el resultado que las distintas manipulaciones experimentales producen en la percepción visual. Los resultados de estas investigaciones han puesto de manifiesto que las distintas claves pueden relacionarse entre sí de tres formas diferentes: dominancia, compromiso e interacción.

1.3.1. Dominancia. Se produce dominancia de una clave sobre otra cuando el sistema visual ignora la información proporcionada por una clave en favor de la proporcionada por otra clave de profundidad. Un ejemplo conocido que muestra este efecto es la habitación de Ames 13 • En esta habitación, Ames opone la información proporcionada por la perspectiva y la proporcionada por el tamaño familiar. Se trata de una habitación distorsionada de forma trapezoidal como aparece en el esquema de la Figura 4.15 .b.

El observador sólo puede mirar dentro de la habitación a través de un orificio situado estratégicamente en una de las paredes de la habitación. Desde ese punto de vista, la habitación parece rectangular a pesar de que no lo es. Cuando personas de la misma estatura se colocan en distintas posiciones a lo largo de la pared del fondo, el observador inevitablemente percibe a las personas como si estuvieran a la misma distancia y tuvieran estaturas muy diferentes (Figura 4.15 .a). En el caso de esta ilusión, la percepción del observador está dominada por la información que proporciona la perspectiva, que desde el punto de observación predeterminado hace parecer la habitación como rectangular. A pesar de que el tamaño familiar debería igualar el tamaño de

13. Adelbert Ames fue un investigador americano de la percepción visual en la primera mitad del siglo veinte. Realizó numerosas demostraciones perceptivas encaminadas a poner de manifiesto la forma en que las distintas claves perceptivas interactúan con los supuestos que el perceptor aporta en una situación determinada. Perteneció al grupo de los transaccionalistas, investigadores muy influenciados por las ideas de John Dewey y Arthur Bentley.

PERCEPCIÓN VISUAL

idad

ítulo, hemos estudiado la siderando cada una de

· ón ordinaria, todas estas rmación que cada una de del espacio tridimensiorminada por el conjunto

" "'cuu.,a de una clave no es una adecuada adapta-

bredeterminación es tamn de la tercera dimensión

claves para producir la do aún. Las investí-

ulaciones experimentales estas investigaciones han

relacionarse entre sí de

clave sobre otra cuanpor una clave en fa

Un ejemplo conocido En esta habitación, Ames

·va y la proporcionada distorsionada de forma 4.15.b.

a través de un oride la habitación. Desde a pesar de que no lo es. distintas posiciones a lo

ente percibe a las per. ran estaturas muy dife

.,,r,-,.,r,· n del observador la perspectiva, que desde

r la habitación como ría igualar el tamaño de

hceoc:ión visual en la primera encaminadas a poner de con los supuestos que el

de los transaccionalistas, Arthur Bentley.

EL ESPACIO TRIDIMENS IONAL

(a)

• Posición y tamaño real del hombre "mas pequeño"

e Posición y tamaño aparantes del hombre "más pequeño"

O Posición y tamaño real del nombre "mediano"

O Posición y tamaño aparantes del hombre "mediano"

D Hombre "mas grande"

173

\>::¡.,~¿-Paredes -.:., ·. : ,.C:;J aparentes 1 ··:-. \: : :' d 1 1 ••..•• e a sa a .... \~/:'

Mirilla para un ojo (b)

FIGURA 4.15. Habitación distorsionada de Ames. Cuando personas de la misma estatura se colocan en distintas posiciones a lo largo de la pared del fondo, el observador inevitablemente percibe a las personas como si estuvieran a la misma distancia y tuvieran estaturas muy diferentes. Fuente : Stephen E. Palmer. Vision Science: Photons to Phenomenology. © 1999. Cambridge, MA: The MIT Press,

p. 247, fig. 5.5.32.

las personas, esta información es ignorada y el tamaño de las personas queda determinado por el tamaño de la imagen proyectada en la retina, provocando así la ilusión de tamaño que caracteriza a la habitación de Ames.

1.3.2. Compromiso. No siempre se produce el predominio de una clave respecto de otra. A veces, la resultante del conflicto entre las informaciones proporcionadas por las distintas claves es un valor intermedio entre los valores de profundidad proporcionados por cada clave. Por ejemplo, Bruno y Cutting (1988) manipularon valores de cuatro claves diferentes: tamaño relativo, posición respecto al horizonte, oclusión y paralaje de movimiento. Construyeron diferentes estímulos que combinaban los valores de esas claves y solicitaron a los participantes que para cada estímulo evaluaran en una escala de O a 99 la magnitud de la profundidad percibida. Encontraron que el grado de profundidad percibida era el resultado de sumar la información proporcionada por cada una de las claves. En este caso, por tanto, los observadores no se guiaban por una clave ignorando las otras, como ocurre en los casos de dominancia, sino que integraban la información de las claves de acuerdo con una simple regla aditiva. Parece como si la información proporcionada por cada clave fuera independiente de la información proporcionada por las otras y el resultado final se produjera sin ningún tipo de interacción entre las claves.

1.3.3. Interacción. Aunque el compromiso actúa en algunas ocasiones, no puede descartarse la existencia de interacciones entre la información proporcionada por las distintas claves. En el caso de las claves que solamente producen información relativa sobre la profundidad, parece lógico pensar que


necesitan interactuar con alguna clave que proporcione información absoluta sobre la distancia a la que se encuentran los objetos para poder dar lugar a un mapa métrico de profundidad. Por ejemplo, piénsese en la disparidad binocular que es una potente clave de profundidad pero solamente de profundidad relativa respecto al punto de fijación. Considerada de forma aislada la disparidad binocular no proporciona información absoluta de la distancia a los objetos sino que informa sobre las proporciones entre las distancias de los objetos situados en diferentes planos de profundidad. Piénsese también en la convergencia que proporciona información sobre la distancia absoluta pero únicamente de la distancia al objeto que se encuentra en el punto de fijación. La interacción de estas dos claves permite generar un mapa métrico de la profundidad de los objetos en la escena ya que la convergencia binocular proporciona el valor de distancia real a que se encuentra el objeto en el que se fija la vista, y a partir de esta medida se pueden escalar las proporciones de disparidad de profundidad relativa. De esta forma el sistema visual puede conseguir las distancias absolutas a todos los objetos de la escena.

La investigación de la integración entre claves de profundidad casi se ha limitado a constatar la existencia de los tres tipos de procesos que acabamos de estudiar. Aún sabemos muy poco sobre las condiciones que determinan el predominio de un proceso sobre los otros

2. TEORÍAS DE LA PERCEPCIÓN ESPACIAL

Dos aproximaciones teóricas han determinado la investigación sobre percepción espacial en psicología. Las diferencias entre estas aproximaciones no se han limitado a la percepción del espacio sino que responden a discrepancias profundas respecto a los procesos perceptivos en general, sin embargo encuentran su confrontación más clara en el terreno de la percepción espacial y por ello resulta conveniente profundizar su estudio en el contexto de este capítulo. Las dos aproximaciones que vamos a estudiar han recibido nombres diferentes en distintos contextos pero posiblemente la forma más general de denominarlas sea la de aproximación constructivista para una de ellas y aproximación ecológica para la otra. A continuación presentaremos estas dos aproximaciones y para poder contrastar de una forma concreta las diferencias entre los dos puntos de vista, estudiaremos el modo en que cada una de ellas aborda la explicación de un fenómeno relacionado con la percepción de la distancia como es la constancia del tamaño.

2.1. La aproximación constructivista

Es la más antigua de las dos y, aunque hunde sus raíces en el empirismo filosófico, suele considerarse a Helmholtz como padre de la primera formulación científica de la misma. Con posterioridad otros investigadores, como Boring,

PERCEPCIÓN VISUAL

rcione información absoluta ~jetos para poder dar lugar D, piénsese en la disparidad aad pero solamente de proonsiderada de forma aislada ·ión absoluta de la distancia iones entre las distancias de [undidad. Piénsese también 1 sobre la distancia absoluta e encuentra en el punto de te generar un mapa métrico e la convergencia binocular

entra el objeto en el que escalar las proporciones

el sistema visual puede s de la escena. de profundidad casi se ha de procesos que acabamos iciones que determinan el

investigación sobre percepestas aproximaciones no se responden a discrepancias general, sin embargo ende la percepción espacial

dio en el contexto de este diar han recibido nom

ente la forma más general ·vista para una de ellas y

presentaremos estas dos concreta las diferencias

o en que cada una de ellas con la percepción de la

raíces en el empirismo filode la primera formulación

ores, como Boring,


Epstein, Hochberg y Rack entre otros, han contribuido a reformular las ideas centrales que caracterizan esta concepción. Aquí nos centraremos en el estudio de estas ideas centrales sin prestar especial atención a los matices que diferencian a los distintos autores.

Una idea central de la aproximación constructivista es que la percepción tiene lugar por fases que se complementan unas a otras y que de forma conjunta contribuyen a proporcionar la información necesaria. Inicialmente, la información proporcionada por la imagen retiniana o estímulo próximo no es adecuada para determinar por sí sola la percepción. El estímulo próximo es ambiguo y necesita la aportación de información por parte de otros procesos psicológicos, tales como el aprendizaje y la memoria, para resolver esa ambigüedad y proporcionar una percepción adecuada al estímulo distante. En el caso del espacio tridimensional, que ahora nos ocupa, como la retina es una superficie bidimensional, la percepción de un espacio tridimensional no puede ser un fenómeno perceptivo primario sino derivado a partir de la imagen retiniana bidimensional. De ahí la importancia que para la aproximación constructivista tiene el análisis de las claves de profundidad que hemos estudiado. Las claves de profundidad actúan como un contexto interpretativo que nos permite recuperar las características tridimensionales del estímulo distante a partir del núcleo de información proporcionado por la imagen retiniana bidimensional. La forma en que la concepción constructivista explica la constancia del tamaño, nos ayudará a concretar el conocimiento de esta forma de pensar.

2.1.1. La constancia del tamaño

Recordemos las relaciones geométricas que se han explicado en la Figura 3.8 entre el tamaño de los objetos, su distancia respecto al observador, el ángulo visual y el tamaño de la imagen retiniana. Allí veíamos que el ángulo visual, y por consiguiente el tamaño de la imagen retiniana, varía directamente con el tamaño del objeto e inversamente con la distancia a la que se encuentra el objeto. A igual distancia, cuanto mayor es un objeto mayor es el ángulo visual que su imagen proyecta en la retina. Por otra parte, el ángulo visual proyectado por un objeto disminuye a medida que el objeto se aleja del observador.

Si la percepción del tamaño de un objeto estuviera determinada por el tamaño del ángulo visual, los objetos variarían en tamaño percibido cuando variase su distancia al observador. Esto es lo que ocurre cuando la distancia respecto a los objetos percibidos es muy grande. Por ejemplo, si contemplamos el tráfico de una ciudad desde un edificio muy alto, podemos tener la impresión de que el tamaño de los coches es el equivalente al de coches de juguete. Sin embargo, cuando la distancia de los objetos al observador no es muy grande, el desplazamiento en profundidad de los objetos no provoca un cambio en su tamaño percibido a pesar de que el ángulo visual que proyectan disminuye. Por ejemplo, si el lector está en una habitación, puede observar


que el tamaño percibido de un objeto cercano no varía al trasladarlo al extremo más alejado de la habitación a pesar de la innegable reducción que el ángulo visual experimenta. Este fenómeno es el que se conoce con el nombre de constancia del tamaño. De alguna forma el sistema visual compensa la disminución del ángulo visual de forma que la consciencia visual del observador mantiene una experiencia constante del tamaño del objeto.

Para estudiar la constancia del tamaño de una forma controlada, se han realizado muchos experimentos en los que los participantes tienen que comparar el tamaño de objetos a diferentes distancias14

• La Figura 4.16 presenta de forma esquemática los resultados típicos de este tipo de experimentos.

o "O :0 -~ Q) 0..

o u:: ro E ~

Curva teórica de constancia

------¡·-----

---

Curva de resultados empíricos

Curva teórica si se iguala la

imagen retiniana

¡

--

--------------

Distancia

FIGURA 4.16. Esquema de los resultados de un experimento típico de constancia del tamaño.

14. En general el procedimiento consiste en tomar como referencia un objeto determinado que se sitúa cerca del observador. El objeto suele ser una figura geométrica, por ejemplo un triángulo, para evitar que la familiaridad con el tamaño normal de un objeto pueda interferir con el objetivo del experimento; en principio, un triángulo puede tener cualquier tamaño. Como variable se utiliza otro objeto del mismo tipo, en nuestro ejemplo otro triángulo, que se sitúa a mayor distancia y cuyo tamaño puede hacerse aumentar o disminuir. La tarea del observador consiste en ajustar el tamaño del objeto distante hasta que le parezca del mismo tamaño que el objeto cercano de referencia. El tamaño que ha producido el juicio de igualdad es registrado y se repite el proceso durante un determinado número de ensayos man ipulando las distancias a las que se sitúa el objeto variable.

EL

a L: dis me la<

2.:

La el , se Slll

fue dis COl

la inf Pa1 ob.

hir lm

bic do ob

tin pe

PERCEPCIÓN VISUAL

o varía al trasladarlo al exinnegable reducción que el ue se conoce con el nombre

ma visual compensa la disiencia visual del observador lel objeto. a forma controlada, se han rticipantes tienen que com-14. La Figura 4.16 presenta

tipo de experimentos.

-~-·--·--

de

típico de constancia

ferencia un objeto determinado geométrica, por ejemplo un

de un objeto pueda interferir tener cualquier tamaño. Como

otro triángulo, que se sitúa a · . La tarea del observador

del mismo tamaño que el ·cio de igualdad es registrado y manipulando las distanci as a las


En la figura se representa el tamaño percibido en función de la distancia a la que se sitúa el objeto variable. Como puede verse, el tamaño aparente no disminuye en función de la distancia de acuerdo con la variación que experimenta el tamaño de la imagen retiniana, sino que se aproxima mucho más a la curva teórica de constancia.

2.1.2. Tomar en consideración la distancia

La explicación constructivista de la constancia del tamaño ha puesto siempre el énfasis en que el sistema visual evalúa el tamaño de un objeto basándose no sólo en el tamaño del ángulo visual o tamaño de la imagen retiniana sino también en la distancia a que el objeto se encuentra situado. Helmholtz fue el primero en postular que el sistema visual tomaba en consideración la distancia a la que se encontraba un objeto por medio de una inferencia inconsciente. Según Helmholtz, el sistema visual primero registra el tamaño de la imagen retiniana y después modifica esta información de acuerdo con la información disponible acerca de la distancia a la que se encuentra el objeto. Para Helmholtz esta operación tenía lugar de forma inconsciente, sin que el observador cayera en la cuenta de la misma.

La formulación moderna de esta misma idea se conoce con el nombre de hipótesis de la invarianza tamaño-distancia, que se limita a suponer que la imagen retiniana guarda la misma relación con el tamaño y la distancia percibidos que con el tamaño y la distancia fisicos. Si el ángulo visual (a) proyectado por un objeto sobre la retina es directamente proporcional al tamaño del objeto (h) e inversamente proporcional a la distancia (d) a la que el objeto se encuentra, podemos establecer que 15 :

h tan(a) = -

d

La hipótesis de la invarianza tamaño-distancia supone que la imagen retiniana guarda la misma relación con el tamaño percibido (hP) y la distancia percibida (dP) de modo que:

tan(a)

De lo que se deduce que:

15. Esta relación trigonométrica se entenderá mejor tomando como referencia la Figura 3.8.


h P = d P • tan (a) [ 1 ]

Es decir, el tamaño percibido es igual a la distancia percibida multiplicada por la tangente del ángulo visual. Dicho en otros términos, el tamaño percibido es igual al producto de la distancia percibida por el tamaño de la imagen retiniana. En una situación cotidiana, a medida que un objeto se aleja del observador, el ángulo visual producido por el objeto disminuye pero el tamaño percibido permanece constante debido a la relación expresada en la ecuación [1] .

2.1.3. Evidencia a favor de la hipótesis de la invarianza tamaño-distancia

2.1.3.1. La ley de Emmert

La relación que acabamos de ver entre tamaño y distancia percibidos y tamaño de la imagen retiniana predice que, si el tamaño de la imagen retiniana permanece constante, entonces el tamaño percibido es proporcional a la distancia percibida. La comprobación de esta predicción no es fácil porque todo cambio en la distancia a la que se encuentra un objeto conlleva un cambio en ángulo visual y por tanto en el tamaño de la imagen retiniana. Sin embargo existe un fenómeno perceptivo que permite mantener constante el tamaño de la imagen retiniana y cambiar la distancia a la que se percibe un objeto. Se trata del fenómeno de las posimágenes que ya hemos visto en capítulos anteriores.

Observe la Figura 4.17 y fije su vista en el círculo negro del marco izquierdo durante medio minuto. A continuación cambie su vista al cuadrado de la derecha, fije su vista en el punto central y percibirá un círculo del mismo tamaño que el anterior pero de color blanco intenso. Debido a la prolongada

• •

FIGURA 4.17. Posefecto de claridad que ilustra la Ley de Emmert.

PERCEPCIÓN VISUAL

distancia percibida multipliotros términos, el tamaño

ercibida por el tamaño de la dida que un objeto se aleja

el objeto disminuye pero el a la relación expresada en la

de la invarianza

distancia percibidos y tamade la imagen retiniana

ido es proporcional a la disno es fácil porque todo conlleva un cambio en

agen retiniana. Sin embargo r constante el tamaño de

se percibe un objeto. Se trata visto en capítulos anteriores. círculo negro del marco iz

' cambie su vista al cuadrado ·birá un círculo del mismo

Debido a la prolongada

la Ley de Emmert.


exposición al estímulo negro, su visión ha perdido sensibilidad a ese color y ha aumentado la sensibilidad para el color oponente, el blanco. Repita ahora la observación del círculo negro de la izquierda y, después de treinta segundos, fije su mirada en alguna superficie blanca lejana como puede ser una pared de la habitación en que se encuentra. Observará que sobre esa superficie se proyecta un círculo blanco de mayor tamaño que el que vio anteriormente en la parte derecha de la Figura 4.17. Si tiene la oportunidad de repetir la experiencia con superficies de proyección situadas en distintos planos de profundidad desde su posición de observación, comprobará que el tamaño del círculo proyectado en la posimagen aumenta a medida que la superficie sobre la que se proyecta está más alejada de usted. Esta experiencia ilustra la ley enunciada por Emmert en 18 81 que establece que el tamaño aparente de una posimagen es directamente proporcional a su distancia percibida desde el observador.

La ley de Emmert expresa un hecho que se refiere a la variación en tamaño percibido con el cambio de la distancia. Es el fenómeno opuesto a la situación normal en la que un cambio en distancia va acompañado de una constancia en el tamaño percibido. Sin embargo ambas experiencias son la expresión de un mismo principio. Si el sistema visual se comporta como una calculadora que multiplica el tamaño retiniano por la distancia percibida para producir el tamaño percibido, entonces cuando el ángulo visual decrece al aumentar la distancia el producto resultará en la constancia del tamaño. Sin embargo, cuando el ángulo visual permanece constante y se aumenta la distancia, el tamaño aparente aumentará como indica la ley de Emmert para las posimágenes.

2.1.3.2. Percepción del tamaño e indicadores de profundidad

Una forma de estudiar el papel que la distancia aparente juega en la percepción del tamaño consiste en estudiar la relación entre esta percepción y los indicadores de profundidad que hemos estudiado en la primera parte de este tema. Holway y Boring (1941) realizaron una serie de experimentos, que aún hoy se consideran clásicos en este tema, y que proporcionaron interesante información sobre esa relación.

En la situación experimental ideada por Holway y Boring, el observador estaba situado en la intersecciórrde dos largos pasillos que se extendían en forma de L. En uno de los pasillos había un disco de luz que era ajustable en tamaño y que se colocaba a una distancia fija del observador (unos tres metros). El observador tenía el control del tamaño de este disco. En el segundo pasillo se colocaba otro disco de referencia y, en cada ensayo, se variaba la distancia, entre 3 y 36,5 metros, a la que era presentado. Lo peculiar respecto a este segundo disco consistía en que su tamaño era elegido por el experimentador en cada ocasión de forma que el ángulo visual que proyectaba sobre la retina fuera siempre de un grado de ángulo visual. De esta forma el


estímulo próximo en todas las condiciones experimentales era el mismo. La tarea del observador consistía en ajustar el tamaño del primer círculo hasta que le pareciese igual al círculo de referencia. Holway y Boring estudiaron la ejecución de los sujetos bajo las siguientes condiciones de observación visual: a) visión binocular normal; b) visión monocular; e) utilizando una pantalla de reducción, que es simplemente una pantalla opaca con una apertura por la que el observador mira con un solo ojo 16, y d) en una condición similar a la anterior pero eliminando aún más los posibles puntos de referencia mediante la utilización de telas y colgantes oscuros a lo largo del pasillo.

Obsérvese que en esta situación experimental las relaciónes entre ángulo visual, tamaño aparente y distancia son semejantes a las de la posimagen que hemos comentado al hablar de la ley de Emmert. En el experimento de Holway y Boring el ángulo visual proyectado por el estímulo de referencia, y por tanto la imagen retiniana, se mantenía constante. En consecuencia, si los sujetos percibían constancia en el tamaño, hubieran tenido que aumentar el disco de ajuste de la misma forma que los experimentadores aumentaban el tamaño del disco de referencia. Por otra parte, si la degradación de los indicadores de distancia era perfecta, y la única información que los observadores recibían era la proporcionada por el ángulo visual, su ajuste hubiera debido mantenerse constante a lo largo del experimento. Cualquier condición de degradación de las claves que no fuera perfecta pero deteriorase la estimación de la distancia, hubiera tenido que producir ajustes intermedios entre los dos anteriores.

Visión binocular -----+

-·· -·· -·· -·· -·· -·· -·· -·· ... .........

Distancia del Disco de Referencia

Ley de constancia del tamaño

Visión monocular

-·· Pantalla de

..._ reducción

• • ....__ Pasillo oscuro

-+-- Ley del ángulo visual

FIGURA 4.18. Resultados del experimento de Holway y Boring.

16. Se llama de reducción porque elimina o atenúa el papel de algunos indicadores de profundidad. Holway y Boring mantuvieron en esta condición las luces de l pasillo apagadas.

PERCEPCIÓN VISUAL

rimentales era el mismo. La ño del primer círculo hasta flway y Boring estudiaron la iones de observación visual: ~ e) utilizando una pantalla

ca con una apertura por la una condición similar a la

de referencia mediante del pasillo.

las relaciónes entre ángutes a las de la posimagen

ert. En el experimento de el estímulo de referencia, y

En consecuencia, si los tenido que aumentar el tadores aumentaban el

degradación de los indica'ón que los observadores

1, su ajuste hubiera debido ualquier condición de dedeteriorase la estimación intermedios entre los dos

Ley de constancia del tamaño

Visión monocular

Pantalla de . · · · +-- reducción

. . +- Pasillo oscuro

+-- Ley del ángulo visual

Holway y Boring.

de algunos indicadores de proluces del pasillo apagadas.


La Figura 4.18 muestra los resultados experimentales de Holway y Boring. Como puede observarse, bajo las condiciones de observación a) y b) el ajuste efectuado estaba próximo al necesario para mantener la constancia en el tamaño aparente, e incluso la condición a) tendía a exagerar ligeramente el ajuste. En la condición e) el aumento del disco de ajuste, a medida que aumentaba la distancia del disco de referencia, era mucho menor que en las condiciones a) y b). En la condición d), en la que la degradación de las claves de distancia era mayor, la tendencia presente en e) se acentuaba aún más y la función se aproximaba a la constancia típica de una situación en la que el único indicio disponible para el observador era el ángulo visual.

En otros experimentos que se realizaron con posterioridad a los de Holway y Boring, en los que se controló más cuidadosamente la supresión de los indicadores de distancia producidos por la pantalla de reducción (Lichten y Lurie, 1950), se llegó a obtener una función constante de acuerdo con el tamaño del ángulo visual.

Aunque los resultados experimentales que acabamos de comentar ponen de manifiesto la importancia que tiene la consideración de la distancia en la percepción del tamaño, otros experimentos han mostrado también que, a la hora de juzgar el tamaño de los objetos, las personas pueden tomar en consideración varios factores diferentes. Por ejemplo, se ha puesto de manifiesto que las instrucciones respecto al punto de referencia que el observador debe adoptar para emitir sus juicios, pueden influir en la percepción del tamaño. Gilinsky (1955) realizó un experimento en el que presentó a los participantes un triángulo de referencia a diferentes distancias. Les pidió que ajustaran el tamaño de otro triángulo de acuerdo con el tamaño percibido. La manipulación fundamental que Gilinsky introdujo fue las instrucciones bajo las que los observadores realizaron la tarea. Unas instrucciones, que llamaremos objetivas, solicitaban el ajuste del triángulo variable de forma que igualara el tamaño del triángulo de referencia como si ambos fueran medidos con una regla. Otras instrucciones, que llamaremos retinianas, pedían a los observadores imaginar que se tomaban fotografías de los dos triángulos y, por lo tanto, si un triángulo era más distante que otro, produciría una imagen más pequeña. Los resultados mostraron que bajo instrucciones retinianas, el tamaño del triángulo variable disminuía a medida que aumentaba la distancia del triángulo de referencia. Sin embargo, bajo instrucciones objetivas tendían a exagerar la constancia del tamaño. Este fenómeno, que también Holway y Boring encontraron en el experimento expuesto anteriormente, se ha denominado sobreconstancia y ha sido replicado en numerosas ocasiones (Carlson, 1962; Epstein, 1963). Una explicación general bastante aceptada de este fenómeno es que bajo instrucciones objetivas la respuesta del observador está mediada por procesos cognitivos de cálculo e inferencia que llevan a sobreestimar la constancia, mientras que bajo instrucciones retinianas el juicio no está influido por estos factores cognitivos sino que es de naturaleza más directamente perceptiva (Gogel y Da Silva, 1987).


No nos vamos a detener ahora en explorar este problema en detalle. Lo expuesto hasta ahora ilustra de forma bastante extensa cómo se ha llevado a cabo la investigación de la constancia del tamaño desde una perspectiva constructivista y el valor de una explicación de esta constancia mediante la toma en consideración de la distancia percibida. Pasaremos ahora a exponer el punto de vista alternativo representado por la perspectiva ecológica.

2.2. La aproximación ecológica

Este punto de vista es conocido también con el nombre de percepción directa. Fue formulado por James J. Gibson en una serie de escritos (1950, 1966, 1979) y representa una forma de entender la percepción frontalmente en oposición a la postura constructivista que acabamos de exponer.

Para Gibson, el planteamiento clásico del problema de la percepción tridimensional, consistente en buscar claves de profundidad en la superficie bidimensional de la retina, está equivocado y lleva necesariamente a un empobrecimiento del estudio de la percepción. La investigación perceptiva debe tomar en consideración el patrón total de estimulación, no la proyección geométrica de aspectos parciales del estímulo en la retina. La ambigüedad del estímulo, que es para los constructivistas un supuesto fundamental, es fruto de un análisis inadecuado del patrón total de estimulación y no de una insuficiencia del patrón para determinar la percepción.

Gibson pensaba que la óptica geométrica no era el instrumento adecuado para describir el estímulo y las relaciones entre medio ambiente y patrón de estimulación. En su lugar, trató de crear una óptica ecológica cuyo principio fundamental es que la luz del medio ambiente transmite, no sólo energía, sino también información, que es más importante. La luz puede proporcionar información porque está estructurada de una forma determinada en cada uno de los múltiples puntos de vista que el medio ambiente ofrece al observador. Para Gibson el concepto de información está íntimamente ligado al de estructura. La estructuración de la luz en un punto de vista concreto consiste en el conjunto de perspectivas de los objetos que el observador es capaz de captar desde ese punto de vista, incluyendo también las perspectivas cambiantes de los objetos que se mueven. Gibson siempre pensó que la estimulación que continuamente llega a nuestros sentidos es muy rica en información y proporciona continuamente de forma suficiente todo lo necesario para que se produzca la percepción.

Para Gibson, por tanto, el estímulo carece de ambigüedad. Toda la información está presente en la estimulación o, como Gibson prefiere llamarla, la conformación óptica (optic array). En consecuencia, no es necesario recurrir a procesos constructivos de carácter no perceptivo, tales como memoria o aprendizaje, para entender o explicar la percepción. La percepción para Gibson es directa en cuanto que consiste sencillamente en captar la información disponible en la conformación óptica. Ninguna secuencia de procesos es ne-

PERCEPCIÓN VISUAL

:ste problema en detalle. Lo extensa cómo se ha llevado 1año desde una perspectiva esta constancia mediante la Pasaremos ahora a exponer perspectiva ecológica.

ombre de percepción direcrie de escritos (1950 1966

' ' >ercepción frontalmente en os de exponer. blema de la percepción triofundidad en la superficie 'a necesariamente a un emvestigación perceptiva debe mlación, no la proyección 1 retina. La ambigüedad del testo fundamental, es fruto nulación y no de una insu-

~a el instrumento adecuado edio ambiente y patrón de :a ecológica cuyo principio ;mite, no sólo energía, sino uz puede proporcionar in-determinada en cada uno

iente ofrece al observador. amente ligado al de estrucsta concreto consiste en el ervador es capaz de captar Jerspectivas cambiantes de S que la estimulación que ica en información y pro' lo necesario para que se

mbigüedad. Toda la infor~i bson prefiere llamarla, la a, no es necesario recurrir o, tales como memoria o 1. La percepción para Gib: en captar la información :uencia de procesos es ne-


cesaría para construir una representación de los objetos. Lo único necesario para percibir es atender a la información que está en el medio ambiente.

En resumen, la teoría de Gibson es ecológica en cuanto que pone el acento en la riqueza informativa de la estimulación ordinaria por oposición a la estimulación propia de las situaciones experimentales que, por lo general, restringen la información. En una situación estimular propia de la vida cotidiana la totalidad del patrón de estimulación especifica de forma necesaria y suficiente lo que un observador percibe. La teoría de Gibson es una teoría de la percepción directa porque refiere todo lo percibido a la información proporcionada por la estimulación. Evita toda referencia a procesos no perceptivos que puedan completar o interpretar un posible estímulo ambiguo. La información presente en los estímulos nunca es ambigua. Por eso, la tarea de los psicólogos que estudian la percepción debe ser analizar a fondo la estimulación hasta dar con la información particular que determina un fenómeno perceptivo. Veamos como Gibson aplicó esta forma de pensar al análisis de la constancia del tamaño.

2.2.1. La constancia del tamaño desde una perspectiva ecológica

Para Gibson, explicar las constancias perceptivas no es otra cosa que descubrir en la estimulación la información invariante que determina la percepción de esa constancia. No acepta ningún tipo de inferencia inconsciente o proceso mental llevado a cabo por el observador que complemente la información proporcionada por la estimulación.

En el caso de la constancia del tamaño, no considera necesario que el observador tome en consideración la distancia percibida, sino que es el gradiente de densidad de textura el que proporciona la escala absoluta de distancia que va a explicar la constancia. Para Gibson, la percepción del tamaño de los objetos es una función de la cantidad de textura que el objeto oculta al observador. Los elementos de la textura de una superficie que son ocultados por los objetos, proporcionan una escala efectiva de tamaños con respecto a la cual puede percibirse el tamaño de un objeto. Siempre que dos objetos oculten la misma cantidad de elementos de la textura de una superficie, se percibirán como iguales en tamaño. La Figura 4.19 puede ilustrar la idea central de la explicación de Gibson.

El suelo, y su correspondiente gradiente de textura, que se hace más denso a medida que aumenta la distancia, es la escala respecto a la cual se valora el tamaño de los objetos. Los objetos se perciben como iguales en tamaño, a pesar de la distancia, porque cada uno de ellos oculta la misma cantidad de textura. La relación entre el tamaño del objeto y la cantidad de elementos de textura ocultados por el objeto no cambia y es este invariante el responsable de la constancia del tamaño.


FIGURA 4.19 . Explicación de la constancia del tamaño según Gibson.

2.2.2. Resultados experimentales

El tipo de experimentación que Gibson aduce en favor de su teoría ha consistido en demostrar la constancia del tamaño en situaciones fuera del laboratorio y poco propicias a facilitar los cálculos que supone la teoría constructivista. Por ejemplo, en uno de sus experimentos (Gibson, 1950) colocó estacas a distintas distancias del observador en un campo de unos 800 metros de largo. La altura de las estacas podía variar entre 39 y 257 centímetros. La tarea de los observadores consistía en escoger, de entre un conjunto de estacas graduadas que tenía detrás, aquella que más se aproximara a la que en cada ensayo tenía que estimar. En estas condiciones, y sobre todo para las distancias más alejadas, el tamaño de la imagen retiniana es tan pequeño que el cálculo del tamaño percibido, tal como propone la teoría constructivista, resulta prácticamente imposible. A pesar de ello, Gibson encontró que los observadores mantenían la constancia del tamaño incluso en los casos en que las estacas estaban más alejadas. A partir de datos como estos, Gibson concluyó que la explicación de la constancia del tamaño no necesita complicados cálculos basados en la distancia percibida sino que es mucho más simple suponer que los observadores prestan atención a la cantidad de elementos de la textura del terreno que cada objeto cubre y que responden directamente a esta característica.

Aunque no cabe duda de que la explicación de la constancia del tamaño que Gibson propone, resalta un aspecto importante del problema, no parece

PERCEPCIÓN VISUAL

tamaño según Gibson.

favor de su teoría ha consituaciones fuera del !abo

que supone la teoría caostos (Gibson, 1950) colocó campo de unos 800 metros

39 y 257 centímetros. de entre un conjunto de

más se aproximara a la que · nes, y sobre todo para las tiniana es tan pequeño que e la teoría constructivista,

, Gibson encontró que los incluso en los casos en que como estos, Gibson con-

no necesita complicaque es mucho más simple

la cantidad de elementos de e responden directamente a

la constancia del tamaño te del problema, no parece


que pueda adoptarse como una explicación general del fenómeno. Para que la oclusión de la textura pueda informar sobre el tamaño relativo de los objetos, se necesitan unas condiciones bastantes restrictivas que por lo general no se dan en la percepción ordinaria. Por ejemplo, es necesario que los objetos cuyos tamaños se van a comparar se presenten sobre la textura de la misma superficie. Si no es así, o si la superficie no presenta una marcada textura, no es posible establecer una comparación entre los objetos. Además, los elementos que componen la textura de la superficie sobre la que están situados los objetos, deben ser del mismo tamaño. Si la textura es irregular, con unos elementos mayores que otros, no es posible percibir constancia del tamaño sobre la base del número de elementos que los objetos ocultan. En la percepción ordinaria es frecuente que estas condiciones no se cumplan, sin embargo el fenómeno de constancia del tamaño sigue produciéndose.

En resumen, no parece que las relaciones que Gibson descubrió entre el tamaño de los objetos y la oclusión de la textura de la superficie sobre la que los objetos aparecen, sea una explicación general del fenómeno de constancia del tamaño. Hay que tomar en consideración otros factores entre los que probablemente se encuentra la distancia percibida que tanto ha interesado a los constructivistas.

En esta sección del capítulo, no pretendemos estudiar a fondo todos los problemas relacionados con la constancia del tamaño. Más bien, hemos utilizado la polémica suscitada en torno a la constancia del tamaño como un ejemplo concreto que nos ha permitido entender la forma en que las dos principales teorías de la percepción del espacio tratan de explicar un fenómeno perceptivo. De este modo es posible entender mejor las teorías mismas. Ahora nos interesa volver sobre esas teorías para preguntarnos si son necesariamente tan antagónicas como a veces son presentadas en los textos de psicología de la percepción.

3. POSIBLE RECONCILIACIÓN

Son muchos los investigadores de la percepción que han considerado muy importante conseguir armonizar las dos posturas que acabamos de exponer (e.g. Haber, 1985; Hatfield, 1988). Neisser (1994) propuso la existencia de tres sistemas perceptivos diferentes. Un sistema especialmente dedicado al control de la acción del organismo en el medio ambiente. Un segundo sistema especializado en la discriminación e identificación de objetos y situaciones familiares. Y un tercer sistema encargado de la percepción interpersonal, de las situaciones de interacción social con otros seres humanos.

El primero de los sistemas propuestos por Neisser presenta unas características similares a las que Gibson propuso para el sistema perceptivo visual en general. Y el segundo tiene unas características similares a las que los cons-


tructivistas han propuesto como propias de la percepción visuaP7• Si la pro· puesta de Neisser fuera correcta nos encontraríamos con que las dos teorías, que estamos estudiando en este capítulo, podrían tener razón, en cuanto que cada una de ellas estaría acentuando las características propias de uno de los sistemas de percepción visual. Ambas teorías, a su vez, estarían equivocadas en cuanto que pretenden generalizar para un único sistema de percepción visual las características propias de uno de los subsistemas.

Obsérvese que la propuesta de Neisser no carece de antecedentes en la historia de la investigación perceptiva. En el capítulo sobre el color veíamos que durante casi un siglo la teoría tricromática y la teoría de los procesos opo· nentes pugnaron por prevalecer en la explicación de la percepción del color. Durante ese tiempo todos los investigadores se veían más o menos impelidos a elegir entre una u otra teoría. Hoy existe prácticamente un acuerdo general sobre la validez de ambas teorías. El problema se resolvió cuando se pudo es· tablecer que en el procesamiento del color había varias fases y que, mientras que la teoría tricromática tenía razón al describir el procesamiento en el nivel de los receptores, la teoría de los procesos oponentes la tenía si se tomaba en consideración el tipo de procesamiento que tenía lugar en las células ganglio· nares y en el núcleo geniculado del tálamo. ¿Hay razones para pensar que en el caso de la percepción del espacio podemos estar en una situación semejante? ¿Hay razones para pensar que el sistema visual procesa la información espacial de forma diferente dependiendo de que el acto perceptivo vaya dirigido al control de la acción o a la discriminación e identificación de los objetos?

Joel Norman, de la Universidad de Haifa en Israel, ha propuesto recientemente (Norman, 2002) que las vías visuales dorsal y ventral, que la fisiología ha descrito (Ungerleider & Mishkin, 1982), corresponden a dos sistemas visuales con características similares a los postulados por Neisser, de forma que la vía dorsal formaría un sistema especializado en el control visual de la conducta motora, mientras que la vía ventral sería un sistema preferentemente dedicado al reconocimiento e identificación de los objetos. Norman ha elaborado también de forma articulada el paralelismo entre la aproximación ecológica y el funcionamiento del sistema visual dorsal, por una parte, y, por otra parte, el de la aproximación constructivista y el funcionamiento del sistema visual ventral. En la última parte de este capítulo nos detendremos a exponer con un poco más de detalle la propuesta de Norman.

3.1. Los sistemas visuales dorsal y ventral

Ungerleider y Mishkin (1982) fueron los primeros investigadores que presentaron evidencia experimental a favor de la existencia de dos vías funcio-

17. Aunque la hipótesis de un tercer sistema relacionado con la percepción social es realmente interesante y merece atención, su tratamiento queda fuera de los límites impuestos a este libro.

PERCEPCIÓN VISUAL

1ercepción visuaP 7• Si la pro~mos con q~e las dos teorías, ~ tener razon, en cuanto que lísticas propias de uno de los su vez, estarían equivocadas fmico sistema de percepción tbsistemas. :arece de antecedentes en la IÍtulo sobre el color veíamos la teoría de los procesos opon de la percepción del color. ·eían más o menos impelidos icamente un acuerdo general resolvió cuando se pudo es

. varias fases y que, mientras el procesamiento en el nivel

·mes la tenía si se tomaba en . lugar en las células gangliorazones para pensar que en

en una situación semejanprocesa la información es-

acto perceptivo vaya dirigientificación de los objetos?

1, ha propuesto recien-1 y ventral, que la fisiolo

onden a dos sistemas os por Neisser, de forma en el control visual de la

un sistema preferentemenlos objetos. Norman ha o entre la aproximación

dorsal, por una parte, y, y el funcionamiento del ítulo nos detendremos a

de Norman.

investigadores que preia de dos vías funcio-

con la percepción social es realde los límites impuestos a este

EL ESPACIO TRID IMENSIONAL 187

nalmente diferenciadas en la corteza visual del mono. La vía ventral que proyectaba desde la corteza occipital hasta la corteza temporal inferior, y la vía dorsal que proyectaba también desde la corteza occipital hasta la corteza parietal posterior. La lesión de la corteza temporal inferior izquierda del mono, le incapacitaba para discriminar entre objetos sobre la base de la forma . Por otra parte, la lesión de la corteza parietal posterior izquierda impedía que los animales discriminaran sobre la base de la posición. Ungerleider y Mishkin sugirieron que la vía ventral era una vía preferentemente dedicada a la discriminación e identificación de objetos, mientras que la vía dorsal estaba especializada en la localización de los mismos. A partir de entonces ha sido frecuente llamar a las dos vías visuales la vía del <<que» y la vía del <<donde» para referirse a la vía ventral y a la dorsal respectivamente.

Desde la propuesta inicial de Ungerleider y Mishkin, la investigación tanto con personas como con monos ha obligado a reinterpretar la función de las dos vías. Una de las reinterpretaciones que mayor influencia tiene en la actualidad es la propuesta por Milner y Goodale (1995). Para estos autores, tanto la vía ventral como la vía dorsal procesan información sobre las características de los objetos y sobre sus relaciones espaciales. Lo que diferencia a las dos vías es el uso que hacen de esa información. La vía ventral se especializa en el procesamiento de las características permanentes de los objetos y de sus relaciones, permitiendo así la formación de representaciones perceptivas a largo plazo. Estas representaciones cumplen una función básica para poder identificar los objetos y para poder clasificarlos. La finalidad primaria del procesamiento que tiene lugar por esta vía es la acumulación de conocimiento acerca de los objetos que nos rodean.

A su vez, el procesamiento que tiene lugar en la vía dorsal tiene que ver preferentemente con la información cambiante momento a momento acerca de la localización y de la disposición de los objetos con respecto a los efectores que el sujeto utiliza. Su función básica tiene que ver con el control visual on-line de las habilidades motoras, como pueden ser, por ejemplo, los movimientos de la mano a la hora de alcanzar o coger un objeto. Este sistema dorsal puede considerarse como una extensión cortical de los módulos que controlan los movimientos guiados visualmente en los vertebrados y que implican estructuras subcorticales tales como los colículos superiores y el núcleo pulvinar del tálamo.

La Figura 4.20 presenta un esquema de las estructuras corticales principalmente implicadas en cada una de las dos vías en el cerebro del mono. A partir de V1, la vía ventral incorpora a V4 y termina en las zonas temporales TE y TEO, mientras que la vía dorsal se encamina hacia la corteza parietal implicando zonas temporales mediales como MT y MST y las zonas parietales posteriores.

Milner y Goodale han proporcionado gran cantidad de información experimental a favor de la diferenciación funcional de estos sistemas. Experimentos con ratas y monos han mostrado una clara disociación entre los dos sistemas.


r c . .. .,:. ..... .... , .... ,

V1a ventral ("que")

FIGURA 4.20. Resumen de las principales áreas corticales en el cerebro del macaco que participan en las dos vías de procesamiento visual. La vía dorsal especializada en información espacial ("donde") y la vía ventral especializada en la identificación y reconocimiento de objetos ("que"). Fuente: Adaptación de la figura 5.1 O de la obra Cognitive Neuroscience: the Biology of Mind, 2. 0 ed. Michael S. Gazzaniga, Richard B. lvy & George R. Mangun. © 2002 New York: W.W. Norton and Company, lnc. Reproducida con autorización de W.W. Norton and Company, lnc.

Sin embargo, nos vamos a detener en la exposición de ejemplos tomados de la neuropsicología humana que nos permitirán entender la forma en que la disociación de los sistemas que ahora estudiamos se manifiesta en las personas.

3.2. Las disociaciones neuropsicológicas

En la investigación neuropsicológica, a la hora de hacer inferencias sobre los mecanismos responsables de una determinada disfunción, es conveniente distinguir entre dos tipos de disociaciones funcionales posibles. En el caso de la disociación simple, lo que se observa en los pacientes18 con un daño cerebral concreto es una deficiencia en un tipo de tarea determinada cuando su ejecución se compara con un grupo de control formado por personas sin ese daño cerebral. Además, para establecer la existencia de una disociación simple es necesario utilizar una tarea de control en la que el grupo de pacientes y el de control no difieran. Este requisito es el mínimo requerido para asegurar que la disfunción es específica al daño y no el resultado de una deficiencia

18. Puede tratarse de un grupo de pacientes o de casos individuales. Los conceptos de disociación simple o doble se aplican tanto a investigaciones de grupo como a investigaciones de caso único.

PERCEPCIÓN VISUAL

les en el cerebro del macavisual . La vía dorsal especiali

especializada en la idente: Adaptación de la figura

f Mind, 2. 0 ed. Michael S. GazNew York: W.W. Norton and . Norton and Company, lnc.

de ejemplos tomados de la la forma en que la di

manifiesta en las personas.

hacer inferencias sobre los ,~~·~""'' es conveniente dis

posibles. En el caso de la S

18 con un daño cerebral inada cuando su ejecu-

por personas sin ese daño una disociación simple es

grupo de pacientes y el requerido para asegurar

o de una deficiencia

'duales. Los conceptos de dipo como a investigaciones de


generalizada producida por el mismo. Por ejemplo, la Figura 4.2l.A ilustra el caso que ahora estamos tratando. En ella se compara un paciente o grupo de pacientes con daño en la zona occipito-parietal, con un grupo de control en dos tareas, una de carácter perceptivo y otra de coordinación visomotora. Los resultados probablemente mostrarán que los grupos no difieren en la tarea perceptiva pero sí en la tarea de coordinación, en la que el grupo de pacientes será inferior al grupo de control.

A. Disociación Simple Tareas

(% Correctas)

Grupos Perceptiva Coordinación v-m

• Lesión en zona occipito-parietal

90%

• Control 90%

B. Disociación Doble Tareas

(%Correctas)

65%

95%

Grupos Perceptiva Coordinación v-m

• Lesión en zona occipito-parietal

• Lesión en zona occipito-temporall

·Control

90%

55%

90%

65%

95%

95%

FIGURA 4.21. Patrón de datos característico de una disociación simple (A) y de una disociación doble (B).

Las disociaciones simples nos pueden poner en la pista de una determinada asociación entre un área determinada del cerebro y una función psicológica concreta. Sin embargo, la disociación simple no puede establecer de forma clara la existencia de esa asociación. La razón fundamental para ello es que tiene problemas de interpretación inevitables. Uno de los más importantes radica en el supuesto de que las dos tareas son igualmente sensibles a las diferencias entre el grupo de pacientes y el grupo de control. Este supuesto suele fallar en muchas ocasiones porque no es fácil igualar las tareas en nivel de dificultad o en grado de sensibilidad para los dos grupos. Por ejemplo, la tarea de coordinación visomotora puede requerir mayor capacidad


de concentración que la perceptiva. Si el daño en la zona parietal posterior produce una deficiencia en concentración, los pacientes pueden mostrar un patrón de ejecución semejante al de la Figura 4.2l.A, pero no debido a un problema específico de coordinación sino debido a un problema más general de concentración.

Los problemas interpretativos que presenta la disociación simple quedan prácticamente resueltos si se logra establecer una disociación doble. En el caso de la disociación doble es necesario encontrar un paciente o grupo de pacientes que presente un patrón de disociación opuesto al encontrado en el primer grupo de pacientes. La Figura 4.2l.B ilustra el caso de disociación doble que ahora nos interesa tratar. En la figura vemos que el nuevo grupo de pacientes con lesiones en la zona occipito-temporal, no difiere de los controles en la tarea de coordinación pero sí en la perceptiva. En resumen, en un caso de disociación doble, la comparación de los dos grupos de pacientes añade evidencia a favor de la especificidad de la disfunción ya que en la tarea en la que el primer grupo fracasa, el otro no difiere de los controles y, al revés, donde fracasa el segundo grupo, el primero no presenta deficiencia alguna.

Ahora podemos preguntarnos si de hecho existe una doble disociación entre grupos de pacientes con lesiones en la vía ventral, pero no en la vía dorsal, y pacientes con lesiones en la vía dorsal, pero no en la vía ventral, cuando comparamos su ejecución en tareas perceptivas y en tareas de coordinación visomotora. La respuesta es afirmativa.

3.2.1. Percepción sin coordinación visomotora

Es un hecho bien conocido en la literatura clínica neuropsicológica que los pacientes con daño en la corteza parietal posterior pueden presentar problemas para dirigir visualmente acciones tales como coger un objeto o dirigir un movimiento hacia una posición determinada del espacio. El término ataxia óptica es el utilizado para describir este tipo de deficiencia. Los pacientes con problemas de ataxia óptica, sin embargo, no suelen presentar problemas para describir la posición relativa de los objetos en el espacio. Por eso, no parece que la deficiencia tenga que ver con la percepción del espacio en sí misma sino con la interacción visomotora.

Algunos de estos pacientes son también incapaces de girar sus manos para alcanzar un objeto o de acertar con la apertura adecuada de sus dedos cuando tratan de coger un objeto. A pesar de ello, son perfectamente capaces de describir el tamaño de esos objetos o su orientación. De nuevo, el problema no reside en describir el tamaño o la orientación sino en utilizar de forma adecuada la información. Estos síntomas también muestran que el problema no está exclusivamente ligado al espacio sino que afecta a otras características de los objetos como son su tamaño, forma y orientación.

Además de presentar una clara disociación entre una percepción preservada y una coordinación alterada, los problemas de coordinación, que pueden

PERCEPCIÓN VISUAL

·n la zona parietal posterior acientes pueden mostrar un .2 l.A, pero no debido a un >a un problema más general

a disociación simple quedan ha disociación doble. En el :rar un paciente o grupo de il opuesto al encontrado en ustra el caso de disociación vemos que el nuevo grupo

poral, no difiere de los con-erceptiva. En resumen, en

los dos grupos de pacientes isfunción ya que en la tarea e de los controles y, al revés, resenta deficiencia alguna.

una doble disociación pero no en la vía dor-

o en la vía ventral, cuando en tareas de coordinación

neuropsicológica que los r pueden presentar proble

un objeto o dirigir un espacio. El término ataxia

"'"-''-'·''-'."· Los pacientes con presentar problemas para

io. Por eso, no parece

a otras características ón.

una percepción preservacoordinación, que pueden


presentar los pacientes con daño parietal posterior, también presentan un alto grado de disociación entre sí. Algunos pacientes son incapaces de utilizar información visual para controlar la postura de sus manos pero no presentan problema alguno a la hora de controlar la dirección en que inician un movimiento de alcance de un objeto. Otros pacientes presentan el patrón opuesto. Algunos pacientes no son capaces de dirigir la mirada hacia un objeto de forma precisa pero no tienen problema en calibrar la apertura de sus dedos al intentar cogerlo. Otros pueden no tener problemas oculomotores concretos pero son incapaces de guiar visualmente su mano hacia un objeto. En general, existen buenas razones para pensar que los mecanismos de control motor están altamente especializados Qeannerod, 1997) pero ahora nos basta con acentuar la fuerte disociación que estos pacientes muestran entre el daño de una coordinación visomotora determinada y la preservación de la percepción visual de la información que debería guiar la acción.

3.2.2. Coordinación visomotora sin percepción

El lado contrario de la doble disociación ha tardado más en ser detectado pero está hoy bien documentado gracias a las investigaciones de Milner, Goodale y colaboradores. Particularmente interesante es el caso de la paciente DF que vamos a analizar con más detalle.

DF es una mujer que, a la edad de 34 años, sufrió un daño cerebral irreversible como consecuencia de un casi total envenenamiento por inhalación de monóxido de carbono. Después de recobrar el conocimiento, DF era incapaz de reconocer las caras de sus familiares y amigos, y tampoco podía reconocer la forma de objetos familiares. Era incluso incapaz de percibir la diferencia entre un cuadrado y un triángulo. Al mismo tiempo, no tenía problemas para reconocer a las personas por la voz o los objetos mediante el tacto. Su problema era exclusivamente visual.

El diagnóstico de agnosia perceptiva visual en el caso de DF está reforzado por características adicionales. No es capaz de dibujar un objeto que se le presenta visualmente pero puede hacerlo si se le pide que lo dibuje de memoria. Que no se trata de un problema sensorial, lo demuestra el hecho de que DF puede discriminar colores, y puede detectar objetivos definidos por cambios en luminancia que aparezcan incluso a una distancia de 30 grados en la periferia visual. Una característica básica que DF ha perdido es la capacidad para detectar la orientación de los objetos. Ante una prueba de discriminación de enrejados no es capaz de diferenciar su orientación aunque sí es capaz de discriminar su frecuencia espacial; de hecho, su función de sensibilidad al contraste es normal por encima de los 5 c/gav aunque es ligeramente inferior a la sensibilidad normal para las bajas frecuencias. El problema con la orientación no parece tener su origen en la corteza visual primaria porque todas las pruebas que se le han hecho mediante el uso de potenciales corticales muestran que el procesamiento en esta área permanece intacto.


Las primeras pruebas neuroanatómicas que se hicieron a DF mostraron que el daño cerebral que padecía era bastante difuso, característica bastante frecuente en casos de anoxia. No obstante, estudios posteriores que utilizaron resonancia magnética mostraron que las zonas ventrolaterales de la corteza occipital estaban particularmente afectadas mientras que la corteza visual primaria estaba bien preservada. Parece, por tanto, que el problema fundamental de DF es de naturaleza perceptiva y está preferentemente relacionado con la percepción de la forma. A pesar de que es capaz de procesar la luminancia y el color, no es capaz de percibir formas cuyos contornos estén definidos por diferencias en luminancia o en color. Lo mismo ocurre si los contornos están definidos por diferencias en la dirección del movimiento o en los planos de profundidad. Los principios gestálticos fundamentales de proximidad o semejanza tampoco están operativos en el sistema visual de DF.

Lo más notable en el comportamiento visual de DF es que, a pesar de su profunda deficiencia en la visión de la forma, es capaz de utilizar la información basada en el tamaño, la forma y la orientación de los objetos para controlar una amplia gama de movimientos guiados visualmente. DF es capaz de elevar la mano para estrechar la de la persona a la que es presentada. Muestra una aptitud perfecta para alcanzar la manilla de la puerta que quiere abrir, aunque se trate de una situación nueva. Puede andar fácilmente sin ayuda por una habitación o un patio sorteando los obstáculos que encuentra en su camino. Más aún, puede alcanzar y agarrar con gran precisión un objeto situado delante de ella, a pesar de que poco antes era incapaz de identificar ese objeto. En una prueba tipificada a la que fue sometida, DF se situó a una distancia desde la que una persona sin daño cerebral podía ver perfectamente una ranura grande, parecida a la de un buzón de correos, cuya orientación podía variar. El examinador dio a DF una tarjeta grande y le pidió que, desde el lugar donde se encontraba, girara la tarjeta hasta hacerla coincidir con la orientación de la ranura. DF no pudo llevar a cabo esta tarea. A continuación, el examinador le pidió que insertara la tarjeta por la ranura y DF lo realizó sin problema alguno.

Otras muchas pruebas, parecidas a la que se acaba de exponer, han demostrado claramente que DF puede utilizar información para controlar su comportamiento a pesar de que no es capaz de discriminar o identificar esa información cuando se le pide que la describa.

En resumen, casos como el de DF y casos como los de ataxia óptica muestran entre sí las características propias de una doble disociación. DF, cuyas lesiones se centran en la zona ventrolateral de la corteza occipital, muestra claros problemas perceptivos mientras que su capacidad para utilizar la información visual para controlar sus acciones permanece intacta. En el caso contrario, las personas con ataxia óptica, y de forma general los pacientes con daño en la corteza parietal posterior, no muestran problemas perceptivos cuando tienen que describir los objetos que se les presentan, pero tienen graves problemas para actuar sobre esos objetos guiados por la información que parecen percibir.

PERCEPCIÓN VISUAL

se hicieron a DF mostraron ~fuso, característica bastante .os posteriores que utilizaron ventrolaterales de la corteza tras que la corteza visual prique el problema fundamen'rentemente relacionado con az de procesar la luminancia Dntornos estén definidos por ~curre si los contornos están vimiento o en los planos de !ntales de proximidad o seisual de DF. de DF es que, a pesar de su :apaz de utilizar la informaón de los objetos para conisualmente. DF es capaz de que es presentada. Muestra la puerta que quiere abrir,

fácilmente sin ayuda por que encuentra en su cami

un objeto situado de identificar ese objeto.

se situó a una distancia des-perfectamente una ranura "-".a'-•vu podía variar. El

' que, desde el lugar donde con la orientación de la

uación, el examinador le sin problema alguno. de exponer, han de

ación para controlar su riminar o identificar esa

los de ataxia óptica muesdisociación. DF, cuyas

rteza occipital, muestra dad para utilizar la in

intacta. En el caso general los pacientes

problemas perceptivos ' sentan, pero tienen gra

par la información que


Sobre la base del estudio de casos clínicos como los que acabamos de ver, y de experimentos con animales que han producido disociaciones similares, Milner y Goodale han propuesto la existencia de vías visuales especializadas que ofrecen un serio apoyo a las propuestas de Neisser y de Norman.

3.3. La propuesta de Norman

A partir de los trabajos de Milner y Goodale, Joel Norman ha dado un paso más proponiendo una diferenciación más explícita de los dos sistemas de percepción visual y relacionando los dos sistemas con las teorías constructivista y ecológica.

3.3 .1. Características de los dos sistemas

Norman ha enumerado una serie de características que permiten contrastar las diferencias de los dos sistemas perceptivos. Son las siguientes:

a) Función. Aunque los dos sistemas analizan la estimulación visual, difieren en el objetivo de sus respectivos análisis. Mientras el sistema ventral analiza la información para reconocer e identificar los estímulos, el sistema dorsal lo hace para guiar visualmente el comportamiento del organismo.

b) Sensibilidad. Los dos sistemas muestran una sensibilidad diferente para las frecuencias espaciales y temporales. El sistema ventral es más sensible a las frecuencias espaciales altas, mientras que el sistema dorsal lo es a las frecuencias temporales altas. Dicho de otra forma, el sistema ventral está más preparado para procesar los detalles de una escena mientras que el dorsal es más sensible a los aspectos globales que proporcionan las frecuencias espaciales bajas. En compensación, el sistema dorsal es mejor a la hora de percibir el movimiento.

e) Memoria. El sistema ventral mantiene una estrecha relación con el sistema de memoria con el fin de poder llevar a cabo el reconocimiento y la identificación de los objetos y de los acontecimientos. El sistema dorsal no dispone de una memoria a largo plazo, simplemente necesita una memoria de corta duración que permita la integración de la información on line.

d) Velocidad. El sistema dorsal es más rápido. Este hecho es debido a que este sistema recibe preferentemente proyecciones del sistema magnocelular, mientras que el sistema ventral recibe preferentemente proyecciones parvocelulares que son de conducción más lenta.

e) Consciencia. El sistema ventral está más directamente relacionado con la toma de consciencia de la información que el sistema dorsal. Como hemos visto anteriormente, la paciente DF es capaz de utilizar para con-


trolar sus actos información visual que no es capaz de percibir de forma consciente. Parece, por tanto, que el sistema dorsal puede funcionar con bastante precisión de forma inconsciente, mientras que la identificación y la discriminación requieren un nivel de consciencia más alto.

f) Marco de referencia y métrica. Para reconocer e identificar objetos el sistema ventral necesita un marco de referencia alocéntrico. El procesamiento de la información que lleva a cabo este sistema necesita, por tanto, alcanzar una representación del objeto centrada en el objeto mismo. Sin embargo, para alcanzar, agarrar y, en general, interactuar con los objetos, necesitamos marcos de referencia centrados en el sujeto que nos permitan calcular, por ejemplo, cuanto tenemos que alargar el brazo, o cual debe ser la separación entre los dedos pulgar e índice si queremos alcanzar una taza, etc. Por eso, el sistema visual dorsal necesita marcos de referencia egocéntricos. De forma parecida, el sistema dorsal necesita tener información sobre la distancia absoluta a la que se encuentran los objetos, mientras que al sistema ventral le es suficiente con tener información relativa de las posiciones de los objetos.

g) Input visual. Norman incluye otros dos aspectos que diferencian a los dos sistemas. Por una parte, el sistema ventral está especializado en la visión central controlada por la fóvea, mientras que el sistema dorsal lo está para la visión periférica. Estas características están ligadas a las proyecciones magno y parvo celulares mencionadas anteriormente. Por otra parte, los dos sistemas también difieren en su grado de dependencia respecto a distintas claves a la hora de procesar la profundidad. Mientras que el sistema dorsal sufre considerablemente cuando se ve obligado a trabajar exclusivamente con claves monoculares, el sistema ventral no se ve tan disminuido por este hecho.

A pesar de las diferencias que acabamos de enumerar, debe tenerse en cuenta que ambos sistemas llevan a cabo operaciones semejantes en el sentido de que ambos operan con formas, tamaños y distancias de los objetos. Lo importante es caer en la cuenta de que la finalidad de los respectivos procesamientos es diferente, de ahí que la primera diferencia enumerada, la que hace referencia a la función es la más determinante de todas. Obviamente en las personas en las que la visión funciona normalmente, estos dos sistemas actúan de forma integrada e intercambian continuamente la información entre sí. Son las situaciones experimentales o clínicas, que nos permiten observar la disociación de los dos sistemas, las que proporcionan información acerca de la especialización característica de cada uno de ellos.

3.3 .2. Relación entre los dos sistemas y las teorías perceptivas

Después de haber explicitado las características de los dos sistemas visuales, estamos en mejores condiciones para entender la propuesta de Joel Norman.

S

r S

t

e 1-t

PERCEPCIÓN VISUAL

o es capaz de percibir de forma stema dorsal puede funcionar iente, mientras que la identifinivel de consciencia más alto. onocer e identificar objetos el ferencia alocéntrico. El proce:abo este sistema necesita, por objeto centrada en el objeto rar y, en general, interactuar

eferencia centrados en el sujeo, cuanto tenemos que alargar ntre los dedos pulgar e índice

el sistema visual dorsal ne-e forma parecida, el sistema distancia absoluta a la que se

ventral le es suficiente de los objetos.

<l~LJ\..\..LV~ que diferencian a los está especializado en la

ntras que el sistema dorsal rísticas están ligadas a

mencionadas anteriormente. en su grado de depen

de procesar la profundidad. rablemente cuando se ve

enumerar, debe tenerse en semejantes en el sentido

de los objetos. Lo de los respectivos procesaia enumerada, la que hace

e todas. Obviamente en las estos dos sistemas actúan la información entre sí.

e nos permiten observar la onan información acerca de

las teorías perceptivas

de los dos sistemas visuales, · propuesta de Joel Norman.


La propuesta fundamental que hace es que una teoría completa de la percepción visual necesita una aproximación dual que incorpore las características diferenciales tanto del sistema ventral como del sistema dorsal. Para Norman, el problema de las aproximaciones constructivista y ecológica es que han tomado la parte por el todo. El constructivismo ha entendido la percepción como un proceso de construcción progresiva de una representación encaminada a reconocer e identificar objetos. Como acabamos de ver, estas parecen ser funciones especializadas del sistema ventral. Por otra parte, la postura ecológica de Gibson ha entendido la percepción como un proceso de extracción directa de la información que proporciona el medio con el fin de dirigir la actividad del organismo. También hemos visto que estas parecen ser las funciones especializadas del sistema dorsal. Otras características de los sistemas que hemos enumerado anteriormente también encajan con los principales supuestos de cada una de las teorías. Por ejemplo, la teoría de Gibson trata de evitar a la hora de explicar los fenómenos perceptivos, la implicación de la memoria y de otros procesos cognitivos, mientras que para los constructivistas el papel de la memoria es esencial para subsanar la pobreza del estímulo. También en este punto ambas posiciones pueden tener razón si tenemos en cuenta que el reconocimiento e identificación de objetos que lleva a cabo el sistema ventral exige una activa participación de la memoria, mientras que el control on-line de la acción que caracteriza al sistema dorsal no necesita la implicación de la memoria.

A la luz de la información proporcionada por casos neuropsicológicos como el de la paciente DF, merece la pena señalar la verosimilitud que el concepto de propiedad funcional (affordance) propuesto por Gibson, adquiere como realidad estimular. Como vimos en el Capítulo 1, según Gibson, las propiedades funcionales de los objetos del medio ambiente son propiedades que el sistema visual extrae directamente de la estimulación para controlar su comportamiento. Para Gibson la captación de esas propiedades funcionales no requiere la categorización previa de un objeto sino que es independiente de ella. En el caso de DF hemos visto que su sistema dorsal intacto le permitía actuar adecuadamente respecto a objetos que su sistema ventral dañado era incapaz de reconocer.

No podemos analizar en detalle todas las implicaciones de la propuesta de Norman. Sí creemos que su propuesta es muy interesante y que merece una seria consideración. La propuesta de Norman no sólo proporciona un posible marco de unificación de teorías fuertes pero aparentemente irreconciliables, sino que sugiere interesantes hipótesis que pueden guiar la investigación futura en distintos campos de la percepción visual. Terminaremos este capítulo considerando en mayor detalle su aportación concreta a los problemas que hemos tratado en este capítulo, las claves de profundidad y la constancia del tamaño.


3.3.2.1. Las claves de profundidad

Para Norman, tanto el sistema ventral como el dorsal son capaces de procesar la estructura tridimensional del espacio. Sin embargo, mientras que el sistema ventral lo hace preferentemente a través de claves monoculares de naturaleza pictórica, el sistema dorsal lo realiza a través de la captación de invariantes y la utilización de claves binoculares tales como la estereoscopia. Norman ha propuesto que se reserve el término clave para clasificar a los indicadores utilizados por el sistema ventral y que se utilice el término invariante para clasificar a los utilizados por el sistema dorsal. Las principales diferencias entre claves e invariantes serían, según Norman, las siguientes:

a) Son procesadas por distintos centros cerebrales, las vías ventral y dorsal como ya hemos explicado.

b) La extracción de información invariante está incorporada en la configuración física (hardwired) del sistema dorsal, mientras que las claves son de carácter algorítmico y, por tanto, más susceptibles de cambio en el grado de información que proporcionan para el análisis del medio ambiente visual.

e) Los invariantes son extraídos directamente, sin recurso a procesos adicionales. Por el contrario, las claves sirven de base a procesos de inferencia más o menos consciente.

d) Los invariantes son probablemente innatos mientras que las claves son probablemente aprendidas.

Norman apoya su propuesta en abundantes observaciones que sólo podemos apuntar brevemente. Por un lado aduce numerosas observaciones con pacientes neuropsicológicos con lesiones en la vía ventral, como por ejemplo el de la paciente DF que hemos descrito anteriormente. Al parecer, para el control de las acciones que los pacientes con lesiones en la vía ventral llevan a cabo sin problema alguno, es crucial la utilización de invariantes binoculares, tales como la estereoscopia, y de invariantes de movimiento. Por otro lado, su propuesta también se apoya en experimentos realizados con personas sin daño cerebral en los que se ha comprobado que existe una disociación entre las respuestas que los observadores dan a una misma estimulación, dependiendo del sistema utilizado para responder. Por ejemplo, Aglioti, De Souza y Goodale (1995) demostraron que ante una estimulación ilusoria como la provocada por la llamada ilusión de Ebbinghaus 19

, que puede observarse en la Figura 4.22, los observadores mostraban una clara influencia de la ilusión cuando se les pedía que juzgaran el tamaño de los dos círculos centrales. Sin

19. En la ilusión de Ebbinghaus el observador tiende a percibir el tamaño del círculo central rodeado por pequeños círculos, mayor que el de l círculo central rodeado por círcu los grandes, a pesar de que el tamaúo de ambos es el mismo.

PERCEPCIÓN VISUAL

[Sal son capaces de procesar rgo, mientras que el sistema ¡ monoculares de naturaleza la captación de invariantes

J la estereoscopia. Norman a clasificar a los indicadores término invariante para claDrincipales diferencias entre uientes:

rales, las vías ventral y dor-

stá incorporada en la confirsal, mientras que las claves

susceptibles de cambio en para el análisis del medio

sin recurso a procesos adibase a procesos de infe-

mientras que las claves son

bservaciones que sólo poerosas observaciones con

ventral, como por ejemplo mente. Al parecer, para el

en la vía ventral llevan a de invariantes binoculares, ovimiento. Por otro lado,

izados con personas sin una disociación entre estimulación, depen

' Aglioti, De Souza ulación ilusoria como la

, que puede observarse en ara influencia de la ilusión dos círculos centrales. Sin

ibir el tamaño del círculo central rodeado por círculos grandes,


embargo, si se les pedía que cogieran los círculos centrales, y se medía la amplitud de la apertura de los dedos al cogerlos, se podía comprobar que la ilusión de tamaño no producía efecto alguno. Mientras que la emisión del juicio de tamaño estaba probablemente mediada por la información consciente proporcionada por el sistema ventral, el control de la acción de coger lo estaba por la información no consciente proporcionada por el sistema dorsal. Era como si la ilusión pudiera engañar al ojo pero no a la mano.

o 000 o o

o

FIGURA 4.22. Ilusión de Ebbinghaus.

3.3.2.2. La percepción del tamaño

El experimento que acabamos de mencionar ilustra también el hecho de que los factores que determinan la percepción del tamaño pueden ser diferentes según intervenga en su percepción el sistema ventral o el dorsal. Aunque no se conocen bien los factores que determinan una ilusión como la de Ebbinghaus, es probable que se deba a procesos de inferencia que toman en consideración diferentes aspectos de la escena visual tal como postulan los constructivistas. En la medida en que el sistema dorsal no se ve afectado por estos factores, la ilusión tampoco tiene efecto sobre la acción de coger los círculos.

Norman ha puesto mayor énfasis en la importancia que tiene una concepción dual como la que él propone para explicar el fenómeno de sobreconstancia que expusimos en el apartado 2.1.3.2. Vimos que un factor importante en la producción de este fenómeno eran las instrucciones objetivas dadas al observador, que ponen en juego mayor cantidad de procesos cognitivos de inferencia, estimación y familiaridad. Cuanto mayor es la influencia de estos procesos, mayor es la implicación del sistema visual ventral. Sin embargo, bajo instrucciones retinianas, más directamente relacionadas con lo percibido


y con menos implicación cognitiva, es probable que la estimación del tamaño dependa de la información más directamente proporcionada por los invariantes. En este caso, la constancia es más precisa y no se produce un efecto de sobreconstancia.

Aún es pronto para poder valorar una propuesta como la de Norman. Sin embargo hemos visto que hay razones para tomarla en consideración e investigar su alcance. Como ya dijimos anteriormente no sería la primera vez que teorías aparentemente opuestas cuando son propuestas como teorías generales de un determinado campo de investigación perceptual, resultan compatibles cuando se acierta a delimitar el campo de aplicación de cada teoría. En lo referente a la percepción visual del espacio, la propuesta de Norman aparece como una corriente de aire fresco que puede ayudar a integrar posiciones vividas durante décadas como irreconciliables.

Capítulo 5

PERCEPCIÓN DEL MOVIMIENTO

En la vida diaria interactuamos constantemente con objetos en movimiento (animales, coches, personas). Nosotros mismos cambiamos de posición frecuentemente, movemos alguna parte de nuestro cuerpo, o movemos los ojos en distintas direcciones aún cuando permanezcamos inmóviles. En todos estos casos podemos percibir movimiento, ya sea causado por el desplazamiento de los objetos en el espacio, o debido a nuestro propio movimiento. Pero también podemos percibir movimiento bajo determinadas condiciones, aunque no haya desplazamiento físico por parte de los objetos ni del observador. En el presente capítulo analizaremos cómo se percibe el movimiento en cada una de estas circunstancias.

La percepción del movimiento es particularmente importante para el desenvolvimiento de los organismos en el entorno. Las consecuencias que podría tener, por ejemplo, la imposibilidad de percibir un coche que circula a gran velocidad por la calle que estamos intentando atravesar o el movimiento de otros vehículos cuando vamos conduciendo, serían nefastas para la supervivencia. En el caso anterior, la percepción del movimiento proporcionaría información crucial sobre la dirección y velocidad de los objetos del medio ambiente, pero ésta no es su única función. Coren, Ward y Enns (2001) señalan otras funciones importantes de la percepción del movimiento relacionadas con los siguientes aspectos: 1) la posibilidad de seguir la trayectoria de los objetos mediante movimientos oculares apropiados; 2) la formación de objetos mediante la separación de la figura y el fondo, por ejemplo, agrupando las partes que se mueven en una misma dirección y segregando el objeto del fondo inmóvil mediante el principio de destino común que se verá en el capítulo de Organización perceptiva; 3) la extracción de la forma del objeto y su estructura tridimensional a partir del patrón de movimiento de la imagen, obteniendo diversas perspectivas del objeto proporcionadas por


el movimiento del objeto o el movimiento del observador, que se vio en el capítulo dedicado a percepción del espacio y 4) la identificación del objeto a partir del movimiento como, por ejemplo, la identificación de un ave a partir del movimiento de sus alas.

Para que la interacción de los organismos con los objetos en movimiento sea eficaz es imprescindible que éste se perciba de manera adecuada. Quizás por esta importante razón de adaptación, el sistema visual es extraordinariamente sensible a la percepción del movimiento; y quizás debido a su importancia, la investigación sobre percepción del movimiento ha sido una de las áreas que más desarrollo ha alcanzado en el campo de la percepción visual en los últimos años y en la que se ha producido una mayor integración desde las diversas perspectivas teóricas, psicofísica, biológica y computacional (Watanabe, 1998). Junto a los diversos tipos y características de la percepción del movimiento, en el presente capítulo examinaremos también algunas de las líneas de investigación más relevantes desarrolladas en relación con este problema.

1. MOVIMIENTO REAL

Cuando se percibe movimiento como consecuencia del desplazamiento de un objeto o un punto en el espacio, nos referimos a movimiento real. Existen muchos desplazamientos de los objetos que no podemos percibir porque están por debajo de nuestro umbral de detección del movimiento. Por ejemplo, el movimiento de la luna, o el de la aguja que marca las horas en el reloj, son tan lentos que no los podemos percibir; únicamente podemos inferir que dichos objetos se han movido cuando después de transcurrido un tiempo observamos que han cambiado de posición en el espacio.

1.1. Umbrales de detección del movimiento

La investigación clásica en percepción del movimiento se centró fundamentalmente en determinar los umbrales de detección del movimiento utilizando como estímulos puntos que se desplazaban vertical u horizontalmente en el campo visual. El umbral de detección del movimiento se define como la magnitud mínima de distancia (para el umbral de desplazamiento) ó de velocidad (para el umbral de velocidad) que puede detectar un observador cuando examina un objeto en movimiento continuo. Las investigaciones pioneras en este campo se deben a Aubert (1886), quien utilizó como estímulos en sus experimentos, puntos o líneas luminosos que se desplazaban horizontalmente a una velocidad constante sobre un fondo que consistía en un dispositivo que giraba. Los resultados de Aubert mostraron que el umbral de detección del movimiento variaba, según se tratara de un movimiento absoluto (des-


el movimiento se capta en la periferia visual se pueden observar fenómenos paradójicos, que parecen ir en contra de lo esperado. Uno de estos fenómenos, denominado la << paradoja de Aubert-Fleisch>>, consiste en la impresión de que un objeto se mueve más lentamente cuando se fija la vista en él y se capta en la fóvea, que cuando se fija la vista en un objeto inmóvil y el objeto en movimiento se percibe en la periferia visual. Si la sensibilidad al movimiento es máxima en la fóvea y decrece a medida que el movimiento se capta en la parafóvea y la periferia, sería de esperar el resultado contrario, es decir la percepción de que un objeto se mueve más rápidamente cuando se fija la vista en él. Lo que se produce en este caso es una infravaloración de la velocidad. En el cuadro que se presenta a continuación se pude encontrar la demostración perceptiva de este efecto.

Demostraciones de efectos paradójicos

Resalte de la percepción del movimiento en la periferia visual

Los efectos paradójicos se producen porque aunque la sensibilidad al movimiento es mayor en la fóvea. sin embargo el movimiento captado en la periferia visual «resalta» más que el que se capta en la fóvea (LeGrand, 1967) . Para comprobar esta afirmación observe los dedos de la mano justo por delante del libro; a continuación, estire el brazo hacia la derecha e intente mirar de lado los dedos. Observará que casi no puede percibirlos mientras permanecen quietos. Sin embargo, si los mueve no tendrá ninguna dificultad en percibir el movimiento.

Paradoja de Aubert-Fieischl

Una demostración aproximada sobre este fenómeno sería la siguiente. Sitúese frente a una pared, y extienda un brazo. A continuación, cierre los ojos y mueva varias veces el brazo hac ia la derecha y la izquierda a una velocidad moderada. Tras unos minutos. abra los ojos y mire a la pared. Intente determinar la velocidad a la que se mueve la mano y la trayectoria que sigue el brazo {la distancia que recorre). A continuación, coja un bolígrafo y realice los mismos movimientos que antes pero fíjese exclusivamente en el bolígrafo e intente seguirlo con la vista (visión en la fóvea) . Advertirá que el movimiento de la mano parece que se mueve de forma más lenta ahora y que la trayectoria es más corta que cuando se miraba a la pared (visión periférica) .

2. ILUSIONES DE MOVIMIENTO

En este apartado examinaremos distintos tipos de movimiento percibido en ausencia de desplazamiento físico del objeto.

PERCEPCIÓN DEL MOVIMIENTO 203

2.1. Posefectos de movimiento

Son fenómenos que se producen tras la observación prolongada de un movimiento continuo y constante, en los que la dirección del movimiento percibido inicialmente cambia y se percibe en sentido contrario, y su velocidad decae gradualmente. Ejemplos de este tipo de fenómenos son:

-Ilusión de la cascada: Si se observa una cascada fijando la vista en un punto estacionario como una roca o una rama que sobresalgan del agua, durante un minuto o más y, a continuación se dirige la mirada hacia el paisaje que la rodea o cualquier objeto inmóvil, se percibe un movimiento en dirección hacia arriba, es decir, en dirección contraria a la dirección del movimiento del agua de la cascada al caer. - Posefecto de la espiral o ilusión de la espiral de Plateau: Si se fija la vista durante un minuto o más, en una espiral dando vueltas (por ejemplo sobre una peonza) y después se fija la vista en un objeto inmóvil, el movimiento percibido inicialmente se percibirá en sentido contrario; si en el percepto inicial la espiral se expandía hacia afuera, se percibirá contrayéndose hacia dentro y viceversa. Esta experiencia se puede realizar fácilmente dibujando una espiral sobre una cartulina y colocándola sobre un tocadiscos. Después de observarla durante un minuto o más se fija la vista sobre un objeto inmóvil y se puede percibir el movimiento en dirección contraria. -Movimiento paradójico: La percepción de movimiento paradójico se puede producir observando la lista de créditos de una película mientras se fija la vista en un objeto sin movimiento del fondo de la pantalla del televisor. Si después de esta observación, se cambia la mirada a un objeto inmóvil se percibe el movimiento hacia abajo; es decir, en dirección contraria al movimiento de la lista de créditos. Se denomina movimiento paradójico porque se percibe el posefecto de movimiento, pero no se percibe un cambio en la posición percibida de los objetos que se mueven (Palmer, 1999).

La explicación más aceptada sobre los posefectos de movimiento es que están causados por la adaptación de los detectores de movimiento sintonizados a la dirección del movimiento que se está observando. Si se está observando un movimiento en dirección hacia abajo como el del agua en una cascada, durante un determinado período de tiempo, los detectores específicos de esa dirección (hacia abajo) se llegan a adaptar como consecuencia de la exposición a una estimulación continua y continuada y la sensibilidad decrece. Por ese motivo, cuando posteriormente se fija la vista en otro objeto, se pueden activar los detectores específicos de otras direcciones de movimiento, dando la impresión de que se produce un movimiento en dirección contraria. La evidencia para esta interpretación procede de estudios que indican que las


células del área V1 que responden a una dirección específica del movimiento también se adaptan mejor a esa dirección que a otras; o que los posefectos no se producen cuando se provoca rivalidad binocular presentando a cada ojo movimientos en direcciones distintas. Según esta explicación, las áreas del cortex implicadas en la percepción del movimiento serían las responsables de los posefectos de movimiento (Britten et al., 1996; Celebrini y Newsome, 1994).

2.2. Movimiento auto-cinético

Es una ilusión de movimiento que se produce en ausencia total de desplazamiento del objeto. Consiste en la percepción del desplazamiento lento y continuo de un punto luminoso estacionario, cuando se observa en total oscuridad durante un período de tiempo prolongado (más de dos minutos). El movimiento cambia de dirección aproximadamente cada diez segundos (Le Grand, 195 6) . La ilusión no se produce cuando se observa bajo condiciones que permiten observar que el punto luminoso es inmóvil, por ejemplo cuando se ilumina parte de la sala donde se observa el punto. El efecto disminuye cuando se coloca algún objeto cercano al punto de luz, posiblemente porque proporciona un marco de referencia que permite percibir que el punto luminoso permanece inmóvil.

En condiciones naturales se puede observar la ilusión si se fija la vista en una única estrella sobre un cielo homogéneo. El movimiento auto-cinético se percibe con mayor claridad cuando el foco de la luz es de baja intensidad, se observa con un sólo ojo o existe fatiga o somnolencia. El lector puede observar el movimiento auto-cinético si se sitúa en una habitación completamente oscura y coloca una luz muy tenue, por ejemplo, una linterna muy pequeña, a una distancia de unos dos metros. Después de un periodo temporal, observará que la luz se desplaza en una dirección determinada.

2.3. Movimiento inducido

Se trata de una ilusión de movimiento en un objeto inmóvil como consecuencia de la presencia simultánea de otro objeto en movimiento, que generalmente es de mayor tamaño y circunda al primero. En nuestra experiencia diaria podemos encontrar numerosos ejemplos de este tipo de ilusión: como la percepción de desplazamiento en la luna a través de las nubes cuando hay viento, cuando lo que realmente se mueve en este caso son las nubes, ya que el sistema visual humano no es capaz de detectar el movimiento de la luna por ser demasiado lento. Otros ejemplos serían la sensación de que nuestro tren se mueve cuando en realidad se está moviendo el tren de al lado, o la impresión de que un edificio alto se tambalea cuando se observa desde abajo en un día de viento en el que las nubes se desplazan con rapidez.


Para que se perciba movimiento inducido es necesaria la presencia de al menos dos objetos en el campo visual y uno de ellos tiene que estar en movimiento. El desplazamiento del objeto en movimiento en relación con el objeto que permanece estacionario es el origen del movimiento inducido (Mack, 1986). La ilusión se percibe más fácilmente cuando los objetos se presentan sobre un fondo homogéneo.

El movimiento inducido fue descubierto por Duncker (1929). Presentó como estímulo un punto luminoso rodeado por un rectángulo también luminoso sobre un fondo homogéneo, una habitación completamente oscura. Observó que si el rectángulo se desplazaba en una dirección determinada, por ejemplo hacia la izquierda, se percibía el punto desplazándose en la dirección contraria (hacia la derecha) y viceversa. (Véase la Figura 5.2).

FIGURA 5.2. Situación experimental que origina movimiento inducido. El estímulo consiste en un rectángulo luminoso situado sobre un fondo negro que se desplaza en una determinada dirección (en este caso hacia la izquierda). El percepto resultante es el movimiento del punto luminoso en sentido contrario al movimiento

del rectángulo.

Es posible inducir movimiento utilizando diversos procedimientos: a) El ejemplo más simple de movimiento inducido se produce cuando se presentan en el campo visual únicamente dos puntos, uno de ellos en reposo y el otro en movimiento. En esta situación se puede percibir desplazamiento en un único punto o en los dos. Según Duncker, se percibe movimiento en los dos puntos únicamente cuando el movimiento real del punto que se desplaza está por encima del umbral (no es demasiado lento); en el caso contrario, es decir cuando el movimiento real no se detecta, sólo se percibe el movimiento inducido. b) Cuando se presentan simultáneamente dos objetos en el campo visual, uno de los cuales es de mayor tamaño y rodea al otro, con independencia de cual


de los dos objetos se desplace y siempre que el movimiento real esté cercano o por debajo del umbral de detección, se percibirá únicamente el movimiento del objeto situado en el centro hacia el exterior. Si el movimiento está por encima del umbral y el objeto en movimiento es el circundante, se percibirá el movimiento de los dos objetos. El objeto circundante y de mayor tamaño actúa como marco de referencia para el otro objeto.

Se han propuesto diversas explicaciones sobre el movimiento inducido. Según Duncker (1929), la percepción del movimiento inducido se produce como consecuencia del desplazamiento relativo de los objetos en el campo visual. Si uno de los objetos rodea al otro, tiene mayor tamaño, etc., actuaría como el fondo sobre el cuál se percibe el movimiento. Si este objeto se mueve, inducirá que el objeto estacionario se perciba en movimiento debido a que se produce un cambio relativo en las posiciones de los dos objetos. Por su parte, Wallach (1959) afirma que el movimiento inducido podría deberse a que el sistema visual es más sensible al movimiento relativo entre dos objetos que al movimiento de un único objeto. En opinión de Rock (1983), cuando el movimiento relativo entre dos objetos está por encima del umbral, es decir cuando se puede detectar la mayoría de las veces, y el movimiento absoluto de cada objeto está por debajo del umbral, es decir, cuando el movimiento de cada uno de los objetos es demasiado lento para que se pueda detectar, el sistema visual asume que el objeto más grande y que rodea al más pequeño es un objeto inmóvil, y asigna el movimiento al objeto más pequeño y que está rodeado por el otro. Esta afirmación se apoya en que el movimiento inducido desaparece o no se produce bajo las siguientes condiciones: a) cuando el movimiento del objeto circundante está por encima del umbral, en este caso se percibe el movimiento de ambos objetos y b) cuando se introduce alguna condición que permite observar el movimiento del objeto circundante (por ejemplo, cuando se ilumina la habitación), en este caso no se observa movimiento inducido en el objeto más pequeño, sino únicamente el desplazamiento del objeto circundante.

2.4. Movimiento aparente

En 1912, Wertheimer publicó un artículo sobre el movimiento aparente o estroboscópico que los historiadores consideran como el inicio de la Psicología de la Gestalt (Boring, 1942; Pastare, 1971). En su experimento, que tuvo como sujetos experimentales a Kohler y Koffka, Wertheimer presentaba como estímulos dos líneas paralelas verticales separadas por una distancia de un centímetro. Se observaron distintos fenómenos que dependían fundamentalmente del intervalo temporal entre la presentación de las líneas (Véase Figura 5.3 ). Cuando el intervalo era largo (200 milisegundos o más) se percibía una sucesión de líneas sin ningún tipo de movimiento (primero una y después la otra). Si el intervalo temporal era muy corto (menos de 30 milisegundos), las dos líneas se percibían simultáneamente. En ninguno de los dos casos se


percibía movimiento. Cuando el intervalo temporal de presentaoon entre las dos líneas era intermedio, entre 30 y 60 milisegundos, se observaba un movimiento parcial, la primera línea parecía trasladarse hasta aproximadamente la mitad de la distancia que la separaba de la otra línea, y la segunda línea parecía recorrer el resto de la trayectoria. Finalmente, alrededor de los 60 milisegundos, se percibía movimiento, como si realmente cada línea se desplazara hacia la posición que ocupaba la otra. A este fenómeno de percepción del movimiento en ausencia de un desplazamiento físico del objeto, se le denominó movimiento aparente o movimiento óptimo. También se descubrió en estos experimentos el movimiento << FÍ>> o <<movimiento puro >> , que aparecía en el intervalo temporal entre 60 y 200 milisegundos y que tenía como consecuencia la percepción de movimiento sin que se viera el objeto que se movía, de aquí el nombre de movimiento puro.

A

'Q/

'Q/ 'Q/

Intervalo temporal entre el encendido de A y el de B

Menos de 30 milisegundos

Entre 30 y 60 milisegundos

Entre 60 y 200 milisegundos

Más de 200 o 300 milisegs.

B

'Q/

'Q/ 'Q/

PERCEPTO

Iluminación simultánea de A y B sin movimiento

Movimiento parcial

A A B B ___,.. ~

Movimiento ilusorio

A B

Iluminación sucesiva de A y B sin movimiento

FIGURA 5.3. Parámetros temporales de alternancia de encendido de las luces que determinan la producción de movimiento aparente.


2.4.1. Condiciones que determinan la percepción del movimiento aparente

El descubrimiento del movimiento aparente no sólo tuvo importancia en el desarrollo de la Teoría de la Gestalt, sino que tuvo una enorme repercusión en la Psicología Experimental y numerosos investigadores se dedicaron a analizar el fenómeno. Por ejemplo, Korte (1915) analizó detalladamente las condiciones que permiten la aparición del movimiento aparente, variando la intensidad de los estímulos (1), la distancia entre estímulos (DEE) y el intervalo temporal entre los mismos (lEE). Sus resultados pusieron de manifiesto las siguientes relaciones entre estas tres condiciones que producen movimiento aparente y se conocen como las <<leyes de Korte» (Boring, 1942), aunque algunos autores no las consideran como verdaderas leyes (Anstis, 1986).

- Si se mantiene constante el intervalo temporal entre estímulos (lEE), la distancia óptima para obtener movimiento aparente varía directamente con la intensidad de los estímulos, una mayor distancia requeriría una intensidad mayor y viceversa. -Si se mantiene constante la distancia entre estímulos (DEE), el valor óptimo del intervalo temporal entre estímulos (lEE) para que se produzca movimiento aparente varía inversamente con la intensidad de los estímulos, un mayor lEE requeriría una intensidad menor y viceversa. - Si se mantiene constante la intensidad de los estímulos (1), el valor óptimo de la distancia entre estímulos (DEE) varía directamente con el intervalo entre estímulos (lEE), una mayor distancia requeriría un lEE mayor y viCeversa.

Hasta ahora hemos considerado una situación experimental en la que se generaba movimiento aparente a partir de la presentación de dos estímulos luminosos. Pero ¿qué ocurre cuando se presentan más de dos estímulos y se aplica la alternancia de encendido que daba lugar a la percepción de movimiento aparente? En la Figura 5 .4.A, se ejemplifica una disposición estimular más compleja en la que simultáneamente se presentan varias luces que se encenderían en dos tiempos diferentes T1 y T2 con una tasa de alternancia adecuada para que se observara movimiento aparente. Cuando se presenta esta situación se percibe el movimiento indicado en B, es decir un movimiento en línea recta de izquierda a derecha. Sin embargo, ésta no es la única trayectoria posible. En C, se presentan las posibles trayectorias de movimiento, que además podrían aumentar a medida que aumenta el número de estímulos. ¿Por qué se percibe la trayectoria descrita en B y no las representadas en C o cualquier combinación de éstas?. Esta situación representa el problema de la correspondencia (Rechea, 1992, Ullman, 1979), en movimiento aparente, y parece que se debe a la adopción por parte del sistema visual de determinadas reglas fijas como la proximidad espacial y temporal entre estímulos. Es decir,


1 A. DISPOSICIÓN ESTIMULAR 1

Tiempo 1 Intervalo temporal Tiempo 2

o o o o o o

1 B. PERCEPTO 1

le. PERCEPTOS POSIBLES 1

FIGURA 5.4. Ilustración del problema de la correspondencia. Ante la presentación de la disposición estimular presentada en A se percibe la trayectoria del movimiento representada en B, aunque todas las trayectorias indicadas en C son

posibles.

se percibe movimiento entre los estímulos que presentan distancias más cortas o entre trayectorias que requieren menos tiempo (Dawson, 1991).

Aunque la experimentación sobre movimiento aparente se ha realizado utilizando estímulos muy simples, en nuestra experiencia cotidiana encontramos numerosos ejemplos de movimiento aparente. Por ejemplo, los anuncios luminosos que presentan figuras en movimiento, las imágenes del cine, televisión o pantalla del ordenador son fenómenos de movimiento aparente. En todas estas situaciones percibimos movimiento, pero lo que en realidad se está presentando como estímulo es una escena inmóvil que es sustituida por otra después de un período de tiempo determinado. La tasa de cambio de la escena es de aproximadamente 24 veces por segundo en el cine, treinta veces por segundo en la televisión y sesenta en la pantalla del ordenador.


2.4.2. Tipos de movimiento aparente

Braddick (1974) diferencia dos tipos de movimiento aparente: Movimiento de corto alcance, es el que se percibe cuando se observan películas en el cine, vídeos o en la pantalla del ordenador. Se caracteriza por desplazamientos cortos (menos de .25° de ángulo visual) y tasas de alternancia rápidas (de 20 a 80 milisegundos). Se percibe monocularmente (con un sólo ojo) y con anterioridad a la integración de la información procedente de los dos ojos y al análisis de la forma y el color. En el laboratorio, este tipo de movimiento se estudia mediante una técnica denominada cinematograma de puntos aleatorios, que consiste en colocar puntos al azar en cada una de las escenas que componen una determinada secuencia, y analizar -a través de la manipulación de distintas variables (por ejemplo, el desplazamiento vertical u horizontal de los puntos en escenas sucesivas)- qué intervalos espacio-temporales dan lugar a la percepción del movimiento.

Movimiento de largo alcance. Es el movimiento que se percibe en los experimentos descritos en la Teoría de la Gestalt y en los anuncios luminosos. Se puede observar cuando las distancias son largas (más de 20° de ángulo visual) y el período temporal de alternancia entre estímulos mayor de 200 milisegundos. Se da en etapas de procesamiento más tardías, es binocular y requiere la integración de la información de los dos ojos, la formación de unidades perceptivas por medio de la organización perceptiva (del tipo de los agrupamientos estudiados en el capítulo 6) así como un análisis de la forma y el color.

La propuesta teórica de Braddick ha sido puesta en cuestión posteriormente mediante sugerencias que indican que el análisis del movimiento podría ser más complejo. En primer lugar, algunos autores señalan que, dado que los estímulos utilizados en los experimentos sobre movimiento de corto y largo alcance son tan diferentes, es posible que lo que reflejen las diferencias entre los dos tipos de movimiento sean respuestas diferentes de un único proceso a la estimulación diferente, en lugar de la actuación de dos procesos distintos. Por otra parte, los resultados de estudios psicofísicos posteriores indican que el sistema visual podría realizar tres tipos diferentes de análisis del movimiento (Lu y Sperling, 1995, 1996). Los dos primeros, que realizarían un procesamiento de abajo-arriba se corresponderían con el movimiento de corto alcance. En los dos sistemas, el sistema de primer orden, cuya información básica es la luminancia y el sistema de segundo orden, cuya información básica es la textura, se detectaría el movimiento a través de circuitos simples de detección del movimiento. Los sistemas de análisis del movimiento de primer y segundo orden se caracterizan además por ser monoculares, sensibles y rápidos. El tercer tipo de sistema de análisis del movimiento, que se correspondería con el movimiento de largo alcance propuesto por Braddick, se caracteriza por ser binocular, poco sensible y lento, pero es más versátil que los sistemas de primer y segundo orden y puede analizar cualquier tipo


de estimulación. De acuerdo con Lu y Sperling, este sistema utilizaría tanto procesos de abajo-arriba como de arriba-abajo en los que intervendría la atención, que puede determinar el que se perciba o no movimiento así como la dirección del mismo.

3. MECANISMOS FISIOLÓGICOS

3.1. Detectores del movimiento

Todavía no se conocen con exactitud los mecanismos fisiológicos que subyacen a la percepción del movimiento; sin embargo, dado el notable desarrollo que han alcanzado estos estudios examinaremos algunas de las aportaciones realizadas hasta el momento. Una de las primeras preguntas, en relación con los mecanismos neuronales que subyacen a la percepción del movimiento, es si existen neuronas especializadas en la detección de la dirección del movimiento. A partir de los años 60, utilizando la técnica de registros unicelulares, se identificaron neuronas sensibles al movimiento en una determinada dirección en los sistemas nerviosos de distintos organismos: ranas (Maturana, Lettvin, MacCulloch y Pitts, 1960), palomas (Maturana y Frenk, 1963 ), conejos (Barlow, Hill Y Levick, 1964 ), ardillas (Michael, 1966), gatos (S tone y Fabian, 1966) y monos (Hube! y Wiesel, 1965). Además, la ubicación de las neuronas sensibles al movimiento es diferente según la escala filogenética . En organismos más inferiores en la escala (por ejemplo, los conejos), aparecen en las células ganglionares de la retina, indicando que el procesamiento del movimiento sería fundamentalmente periférico, mientras que en organismos más evolucionados como los gatos, únicamente un 1% de las células ganglionares son sensibles al movimiento y no se han encontrado neuronas ganglionares sensibles al movimiento en los monos (Rodieck, 1979), lo que indicaría que en los organismos superiores en la escala filogenética, el movimiento se procesa a un nivel más central.

La evidencia sobre la existencia de detectores de la dirección específica del movimiento en humanos procede de estudios psicofísicos sobre posefectos de movimiento (Sekuler, 1975). El posefecto de movimiento de la cascada sugiere que, como consecuencia de una exposición continuada a una estimulación, determinadas neuronas llegan a fatigarse y la fatiga puede sesgar el sistema hacia el movimiento en dirección opuesta.

El posefecto de la cascada se estudió experimentalmente mediante una técnica denominada «adaptación selectiva>> (Sekuler, 1975). Mediante esta técnica se expone a los sujetos durante un período de tiempo prolongado a un estímulo en movimiento; por ejemplo, un patrón de líneas que se desplaza en una determinada dirección. La exposición prolongada al estímulo produce una disminución en la sensibilidad a la dirección del movimiento observado bajo estas condiciones (Hunzelmann y Spillman, 1984). Sin embargo, el decli-


ve en la sensibilidad no se generaliza a otras direcciones o velocidades distintas de las observadas bajo condiciones de exposición prolongada (Dawson y DiLollo, 1990; Sekuler, 1975). Los datos obtenidos con la aplicación de esta técnica apoyan la existencia de neuronas sensibles al movimiento y sintonizadas a una dirección y/o velocidad específica.

Los estudios realizados para determinar la ubicación de los detectores de la dirección del movimiento en humanos indican que éstos no son periféricos y que se encuentran en el córtex visual. Mitchell et al (1975), presentaron un estímulo adaptador (movimiento en una determinada dirección) a los observadores en un sólo ojo y obtuvieron posefecto de movimiento a una dirección específica. El supuesto básico del que partían era que si los detectores de la dirección del movimiento estaban ubicados en la retina no debería producirse transferencia del posefecto de movimiento al ojo que no había sido estimulado; es decir, el posefecto de movimiento debía aparecer exclusivamente en el ojo en el que se había producido fatiga mediante la presentación prolongada del estímulo adaptador. Sin embargo, los resultados mostraron que se producía el posefecto en los dos ojos. Este resultado indicaría una transferencia del posefecto de movimiento de un ojo al otro, que únicamente se explicaría si los detectores estuvieran situados en el córtex visual, en donde se combina la información sensorial de los dos ojos. A su vez, esta interpretación se ve reforzada por el hecho de que para que se produzca transferencia de los posefectos de movimiento binocular entre los ojos es necesaria una buena visión binocular, ya que la transferencia no se produce en observadores con visión binocular deficiente posiblemente debido a la falta de detectores de este tipo (Mitchel et al., 1975); y también por la necesidad de que exista fusión binocular para que se produzcan posefectos de movimiento ya que cuando cada ojo observa movimiento en direcciones distintas no se produce el posefecto de movimiento (van der Zwan & Wenderoth, 1994).

3.2. Análisis cortical del movimiento

Otros investigadores se han ocupado de examinar si se produce un análisis cortical del movimiento. En relación con este problema se conoce que la mayoría de las células del área V1 son sensibles al movimiento de barras y bordes. Esto se ha determinado examinando si son sensibles a una dirección específica. Si es así, su tasa de disparo será mayor ante esa dirección específica que ante otras direcciones (Hubel y Wiesel, 1979). Además, el grado de especificidad de las neuronas suele ser grande y algunas de ellas responden de forma selectiva no sólo a una determinada dirección del movimiento sino también a una determinada velocidad (Maunsell y Van Essen, 1983).

Sin embargo, en el área V1 parece que únicamente se responde a un desplazamiento de la imagen en la retina; el procesamiento de aspectos más complejos del movimiento se realiza en zonas más especializadas, fundamentalmente las áreas MT y MST del lóbulo temporal (Snowden, 1994) que se


pueden observar en la Figura 4 .20. La evidencia sobre el papel desempeñado por estas dos áreas en la percepción del movimiento procede de dos campos: los estudios sobre el efecto de lesiones experimentales producidas en los primates y algunos estudios clínicos en humanos (revisados en Logothetis, 1994 ). En los estudios realizados con primates se produce una lesión experimental inyectando sustancias que destruyen determinados centros nerviosos y se analiza el efecto en la ejecución en tareas de detección del movimiento y otras funciones perceptivas (forma, color contraste, etc.). Los resultados de estos estudios muestran que la ejecución en una tarea de detección de la dirección del movimiento se deteriora sensiblemente cuando se produce una lesión en una pequeña parte del área MT como consecuencia de la inyección de una toxina. Sin embargo, si el estímulo se presentaba en una parte distinta a la lesionada, la ejecución era normal. Por otra parte, la lesión no afectaba a la ejecución en tareas distintas a la detección del movimiento como podía ser la percepción del color. La importancia de estas áreas en la percepción del movimiento se ha puesto de manifiesto también en estudios clínicos procedentes del campo de la Neuropsicología (revisados en Zeki, 1991), que indican cómo las lesiones en esta parte del cerebro dejan intactas la percepción de la forma o el color pero dificultan o impiden totalmente la percepción del movimiento. En lugar de percibir movimiento, estos pacientes perciben instantáneas en las que los objetos cambian bruscamente de posición, perciben que el objeto cambia de posición pero no el desplazamiento de una posición a otra distinta.

4. MODELOS DE DETECCIÓN DEL MOVIMIENTO

Aunque se conoce que algunas células del cortex visual responden de manera selectiva a la dirección del movimiento, como ya se vio en el apartado dedicado a las investigaciones de Hubel y Wiesel en el capítulo 3, el mecanismo por el que se responde de esa forma es desconocido. Para analizar este problema se han desarrollado modelos de detección del movimiento; a continuación y a modo de ejemplo examinaremos dos de ellos.

Algunos modelos proponen básicamente un tipo de detectores que comparan la percepción de un estímulo (por ejemplo un borde) visto en una posición determinada (A) y en un tiempo (t1), con ese mismo estímulo en una posición distinta (B) y en otro tiempo (t2). La única diferencia entre estos modelos radica en la forma en que se establece la comparación.

Reichardt (1957) desarrolló el primer modelo sobre la disposición y funcionamiento de las neuronas sensibles a la dirección y velocidad del movimiento en insectos. Un esquema del modelo se presenta en la Figura 5.5.


1 Estímulo 1----~

FIGURA 5.5. Modelo de detección del movimiento propuesto por Reichardt (1961 ).

El modelo propone la intervención de varias unidades neuronales: a) las neuronas representadas por A y B son receptores visuales contiguos, que se comportarían como células corticales simples, células que responden a líneas o bordes que presentan una determinada orientación y posición; b) las neuronas representadas en C realizan la función de comparar las señales que provienen de A y de B.

El supuesto básico del modelo es el siguiente: cuando un estímulo (por ejemplo, una luz o un borde) se desplaza a lo largo de una serie de receptores contiguos, por ejemplo de izquierda a derecha, éste se detectará en el primer receptor visual (en este caso A) de la misma forma que en el segundo (B) pero con una demora temporal (dt) que está determinada por la distancia entre los receptores A y B, y por la velocidad de desplazamiento del objeto. En la unidad C, se comparan las señales neuronales que provienen de A y de B. Si las dos señales llegan al mismo tiempo, la unidad de comparación e responderá, señalando movimiento del estímulo. Cada sistema (A y B) está sintonizado a una dirección específica del movimiento. El sistema representado en la Figura 5.5, señalará la presencia de movimiento hacia la derecha (de A hacia B) porque el movimiento en dirección contraria (de B hacia A) producirá señales que no llegan al mismo tiempo, es decir, señales que no están sincronizadas. Además de la sintonización a una determinada dirección, las unidades neuronales A y B están sintonizadas a una determinada velocidad que puede influir en la sincronización. Es decir, la velocidad puede determinar que las señales


procedentes de A y B lleguen o no al mismo tiempo. Dado que la coincidencia temporal entre ambas señales depende de la cantidad de demora temporal de la señal de la célula A, cuando el estímulo presenta mayor velocidad, se necesitarán demoras temporales más cortas para sincronizar las señales. Van Santeen y Sperling (1996) modificaron el modelo de Reichardt con la finalidad de que pudiera proporcionar una explicación para la detección del movimiento en humanos aunque no nos detendremos aquí en su descripción.

1 Estimulas componentes 1 1 Dirección del movimiento 1

A B 1 Movimiento local 1

9UID Estimulo A

Estimulo B

J Estimulo compuesto J JMovimiento globaiJ

Estimulo compuesto Jf

FIGURA 5.6. Modelo de detección del movimiento propuesto por Adelson y Movshon ( 1982).

Adelson y Movshon (1982) propusieron un modelo en dos etapas para explicar el movimiento en patrones complejos formados por enrejados, como los que se han visto en el apartado dedicado al análisis de la frecuencia espacial en el capítulo 3, que se desplazan en direcciones distintas (véase Figura 5 .6). Según esta propuesta teórica, las unidades de la primera etapa computarían la dirección del movimiento de cada enrejado componente, es decir computarían movimiento local. Las unidades que actúan en la segunda etapa combinarían la información de los enrejados componentes para extraer la dirección del patrón compuesto; es decir, computarían movimiento global. La evidencia a favor de este modelo procede de un estudio realizado por Derrington y Suero (1991). Por otra parte, los estudios realizados por Movshon et al. (1986) muestran que, cuando se presenta este tipo de estímulos, deter-


minadas células del área V1 responden a la dirección de los componentes, al movimiento local, pero no responden a la dirección del patrón compuesto, al movimiento global; mientras que las células del área MT responden a ambos tipos de movimiento global y local. Los resultados parecen indicar que el procesamiento en la primera etapa se desarrollaría en el área V1 mientras que, en la segunda etapa, el procesamiento se llevaría a cabo en el área MT.

5. PERCEPCIÓN DE ACONTECIMIENTOS

Los estudios sobre percepción de acontecimientos o sucesos analizan los cambios percibidos en la estructura del estímulo a través del tiempo Qohansson, 1978). Los estímulos en este contexto son mucho más complejos que los analizados hasta ahora y consisten en secuencias de movimiento.

5 .1. Percepción de la causalidad

La investigación pionera en este campo fue realizada por Michotte (1946) en sus trabajos sobre percepción de la causalidad y se centró en el examen de las condiciones que determinan que un acontecimiento se perciba como causa de otro acontecimiento. Un ejemplo ilustrativo es el que se puede observar en el movimiento de las bolas de billar; cuando una bola golpea a otra y la segunda se mueve, se percibe que el movimiento de la primera bola es la causa del desplazamiento de la segunda. Lo mismo ocurre con la percepción de acontecimientos, si un objeto en movimiento colisiona con un objeto inmóvil y éste comienza a moverse en la misma dirección del primero, se percibirá que el movimiento del primer objeto es causa del movimiento del segundo.

El planteamiento básico de Michotte parte de la consideración de que se puede percibir directamente la conexión causal entre determinados tipos de acontecimientos sin necesidad de recurrir a la intervención de experiencias previas. Para que esto se produzca es necesario que se cumplan las siguientes condiciones: 1) la presencia de dos objetos, A y B; 2) que el movimiento de uno de los objetos se perciba en primer lugar; 3) que el impacto del objeto A sobre el objeto B se perciba en la fóvea, para lo cual es conveniente que el observador fije su vista en el objeto B; 4) que no existan discontinuidades pronunciadas entre tiempo, espacio y dirección del movimiento. En general, las condiciones límite para percibir la causalidad serían las siguientes: a) cuando el tiempo transcurrido entre el impacto de A sobre B y el comienzo del movimiento deBes menor que 100 milisegundos; b) cuando A no alcanza completamente a B sino que quedan separados por una distancia mínima y e) cuando la dirección del movimiento deBes algo diferente de la del movimiento de A. Sin embargo cuando estas discontinuidades se acentúan no se percibe la causalidad.


Michotte, utilizando como estímulos unos cuadraditos que se observaban a través de una ranura en una pantalla, identificó una serie de condiciones que permiten la percepción de distintos tipos de causalidad dependiendo de la dirección del movimiento, su velocidad y el tiempo transcurrido desde la colisión de los dos objetos y el comienzo del movimiento del segundo. Los tres tipos de efecto identificados por Michotte se pueden observar en la Figura 5. 7.

Movimiento de A Colisión A y B Resultado

1. Efecto de lanzamiento

o e-. 2. Efecto de arrastre

3. Efecto de disparo

o e-. FIGURA 5.7. Efectos de lanzamiento, arrastre y disparo, identificados por

Michotte en el estudio de la percepción de la causalidad .

En 1, se muestra el efecto de lanzamiento, que presenta la siguiente secuencia: A y B se presentan inmóviles, movimiento de A hacia B, colisión de A y B, parada de A y movimiento de B. Para que se perciba este efecto se requieren las siguientes condiciones: la dirección del movimiento de B debe ser aproximadamente igual a la de A y la velocidad de desplazamiento de B, debe ser menor o aproximadamente igual a la de A. En 2 se presenta el efecto de arrastre cuya secuencia es: desplazamiento de A hacia B, colisión de A y B y desplazamiento de A y B unidos. Las condiciones necesarias para que se pueda percibir el efecto de arrastre son que se perciba previamente el movimiento de A y la percepción del movimiento conjunto de A y B. Finalmente en 3, se presenta el efecto de disparo, que se produce cuando la velocidad de desplazamiento de B, después de la colisión, es superior a la que presenta A, y la <<impresión>>, en términos de Michotte, es que el objeto B sale disparado como resultado de su colisión con A.

A pesar de la afirmación de Michotte de que la percepción de acontecimientos era directa y posiblemente innata, los resultados de estudios poste-


riores, en los que se utilizaron los mismos estímulos y condiciones experimentales, revelaron la existencia de diferencias individuales en la percepción de los efectos de lanzamiento, arrastre y disparo, lo que sugiere que la percepción de la causalidad podría estar influida por experiencias anteriores de los observadores (Boyle, 1960; Beasley, 1968).

5 .2. Movimiento biológico

La línea de investigación sobre percepción del movimiento biológico, o movimiento de los organismos, ha sido desarrollada fundamentalmente por Johansson (1976) quien diseñó un ingenioso procedimiento para estudiar el movimiento del cuerpo humano. El procedimiento consistió en vestir a unos actores completamente de negro y colocar unos discos luminosos en sus articulaciones (hombros, codos, muñecas, caderas, ingles, rodillas y tobillos); véase la Figura 5 .8. El actor o actores, permanecían inmóviles y realizaban una serie de movimientos, como correr, andar, hacer flexiones, bailar, etc. en una habitación completamente oscura. Estos movimientos fueron filmados en una película que se presentó posteriormente a unos observadores para examinar si eran capaces de distinguir los distintos movimientos realizados por los actores, a partir de la observación de los focos luminosos situados en las articulaciones. Los resultados mostraron que los observadores podían distinguir perfectamente los movimientos (andar, flexionar, bailar, etc.) Sin embargo, no podían distinguir la forma (el cuerpo humano) cuando el actor permanecía inmóvil en distintas posturas; en este caso percibían un conjunto de luces colocadas más o menos al azar sobre un fondo oscuro.

FIGURA 5.8. Ejemplo de estímulo utilizado en los estudios sobre percepción del movimiento biológico. La figura representa dos personas bailando.


En la misma línea, Runeson y Fryckholm (1981) analizaron la estimación de levantamiento de pesos a partir de los movimientos que realizaban los actores. El procedimiento consistió en la observación de una secuencia de conductas en la que unos actores simulaban un levantamiento de pesos o lanzaban sacos de arena, utilizando la técnica ideada por Johansson. La tarea de los observadores consistió en estimar el peso a partir de los movimientos que realizaban los actores. Los resultados obtenidos con este procedimiento, proporcionaron un índice fiable de la estimación del peso.

La evidencia sobre la percepción del movimiento biológico procede de estudios posteriores utilizando técnicas similares que han permitido la identificación del sexo del actor en función de la forma de caminar, la forma de caminar propia o la de personas conocidas (Cutting y Profitt, 1981). Las investigaciones en las que se ha empleado esta técnica muestran que los bebes de cuatro meses son capaces de percibir el movimiento biológico (Bertenthal, 1991). Por último, estudios recientes han identificado neuronas selectivas al movimiento biológico en monos (Oram y Perret, 1994) y un aumento en la actividad del surco temporal en humanos ante la observación de estímulos similares a los descritos en las investigaciones sobre percepción del movimiento biológico (Bonda et al., 1996).

5.3. Movimiento propio y flujo óptico

El estudio del movimiento propio se ha desarrollado fundamentalmente en el marco de la teoría de la percepción directa, propuesta por Gibson (1966, 1979) que constituye un acercamiento teórico muy diferente a los considerados hasta ahora, por lo que examinaremos brevemente algunos aspectos generales de la teoría de la percepción directa que son relevantes para el análisis de la percepción del movimiento propio.

Desde el punto de vista de Gibson, lo importante en p"ercepción es descubrir las estructuras de información presentes en el medio ambiente (la conformación óptica en el caso de la modalidad visual). En su opinión, y a diferencia de la mayor parte de las teorías perceptivas, el análisis de los mecanismos de procesamiento no es importante ya que si se conoce bien la información real que pueden usar los observadores, los modelos de procesamiento de la información resultan innecesarios. Uno de los supuestos básicos de la teoría de la percepción directa es que el factor determinante en la percepción es la interacción directa del observador y el objeto físico observado. Por ello, cualquier tipo de discusión sobre atributos del estímulo próximo, transformación de la estimulación o codificación sensorial, carece de sentido. En base a lo anterior, el modelo propuesto por Gibson, en relación con la percepción visual, constituye un intento para determinar la forma en que la luz reflejada en los objetos físicos transmite información acerca del medio ambiente.

El estímulo para Gibson es la conformación óptica, conjunto de rayos de luz que incide sobre el observador en un punto de observación determinado. Además, considera que en la generación del percepto, el factor casi exclusivamente


determinante es el estímulo. Por ello, en la teoría de la percepción directa, el observador atiende a la conformación óptica pero no le otorga un significado. El significado viene determinado por el estímulo, por la escena ambiental. La conformación óptica, contiene además información invariante sobre los cambios de intensidad que proporcionan información acerca del ambiente del que procede la luz, delimitando contornos o bordes, que permitirán la percepción. Los invariantes consisten en características relativamente permanentes de la situación a pesar de los movimientos del observador.

Por otra parte, los movimientos del sujeto cambian el punto de vista desde el que se observan los objetos y, en consecuencia, también se produce un cambio en la conformación óptica. El cambio en el patrón estimular, producido como consecuencia del desplazamiento de los observadores o del movimiento de la cabeza o los ojos, denominado flujo óptico, que se ha visto en el capítulo 4, es el que proporciona información acerca de la naturaleza del movimiento. El flujo óptico proporciona dos tipos de información: información sobre la distancia o perspectiva del movimiento e información sobre el movimiento propio. Esta información permite el control visual de la locomoción, la postura y la dirección, la evitación de obstáculos, etcétera.

La percepción del movimiento propio depende del análisis del cambio continuo en la imagen retiniana a medida que nos desplazamos en el espacio o movemos la cabeza o los ojos. En la Figura 5.9 se presenta un ejemplo de la situación más simple de flujo óptico, en la que el observador fija la vista en un punto (punto de fijación) en el que está situado un objeto determinado y se desplaza para aproximarse al objeto o retrocede. En el primer caso, cuando se camina hacia adelante y se fija la vista en un objeto situado al frente, el patrón estimular característico es el que se representa en la Figura 5.9 .A, en el que la flechas representan un patrón de flujo óptico de expansión a medida que el observador se acerca al objeto. En B, se presenta un ejemplo de patrón de flujo óptico de contracción; este cambio en el patrón estimular se produciría cuando el movimiento es de retroceso. Patrones de flujo óptico mucho más complejos se generarían cuando el observador mueve los ojos o la cabeza al mismo tiempo que se desplaza.

Según Gibson, en la situación representada en la Figura 5.9, la dirección del movimiento vendría indicada por el denominado foco de expansión óptica que se sitúa en el centro del patrón de flujo. Por otra parte, el foco de expansión también puede aportar información acerca de la distancia a la que se encuentra el objeto. Debido a la expansión, cuando nos dirigimos hacia un lugar determinado a una velocidad constante, el tamaño de la imagen retiniana del objeto aumenta rápidamente a medida que nos acercamos; esto permite determinar el << tiempo de impacto» con el objeto y evitar colisiones. El estudio de este efecto tiene importantes aplicaciones en distintos campos, tales como la conducción de automóviles, seguridad vial, deportes, etc.

Las investigaciones que permitieron el descubrimiento del patrón de flujo óptico se realizaron durante la Segunda Guerra Mundial cuando Gibson dise-


1 A. Patrón de flujo óptico de expansión 1 1 B. Patrón de flujo óptico de contracciónl

FIGURA 5.9. Patrones de flujo óptico de expansión (A) y contracción (B).

ñaba pruebas para pilotos. Observó que cuando una película filmada desde la cabina de un avión mientras aterrizaba, se proyectaba después en una pantalla plana, se producía una deformación sistemática de la imagen de la superficie del suelo. Sin embargo, cuando presentó la película a observadores ajenos a la investigación, éstos indicaron que no observaban ninguna deformación en la imagen, sino que percibían su propio movimiento en una dirección determinada.

Estudios posteriores han intentado demostrar el uso del flujo óptico por parte de los observadores en relación con diversos aspectos del movimiento propio. Por ejemplo, Warren, Morris y Kalish (1988) presentaron a los observadores una serie de películas en las que, mediante puntos que se desplazaban en el espacio, se simulaban los distintos patrones de flujo óptico que se generarían al caminar en distintas direcciones. La tarea del observador consistía en proporcionar un juicio de dirección, indicando si se dirigía hacia la derecha o hacia la izquierda de un objetivo situado en distintos lugares de la línea del horizonte. Los resultados mostraron que los observadores fueron muy precisos en sus respuestas, incluso cuando los patrones de flujo estaban formados por muy pocos puntos, lo que indicaría que el sistema visual puede determinar la dirección a partir del flujo óptico.

También se ha examinado si los mecanismos de expansión óptica informan de la aproximación a un objeto o posición determinados. Algunas investigaciones realizadas con pilotos muestran que los más eficaces al realizar una tarea de simulación de aterrizajes, es decir, los que necesitaban realizar menos maniobras y menos correcciones para aterrizar, eran aquellos que presentaban mayor sensibilidad a los cambios de tamaño.

Por otra parte, los resultados de diversos trabajos (revisados en Warren, 1998) han aportado otras características importantes como son: la percepción de trayectorias curvas a partir del flujo óptico; que la percepción de la dirección a partir del flujo óptico es independiente de la posición retiniana (con la excepción de una ligera ventaja en la fóvea) y que la información


efectiva no es el foco de expansión per se sino el patrón de flujo global que lo define (Warren, 1998).

Finalmente, los resultados de investigaciones sobre mecanismos fisiológicos (revisados en Tanaka, 1998) indican que las células del área MST responden ante situaciones estimulares características del flujo óptico como desplazamientos en el área frontal, rotaciones, y patrones de expansión y contracción.

RESUMEN

La percepción del movimiento es extraordinariamente importante para una interacción adecuada del organismo con los objetos de su entorno. Se puede percibir movimiento bajo distintas circunstancias. Cuando la percepción del movimiento es causada por el desplazamiento del objeto se denomina movimiento real. Las investigaciones clásicas sobre movimiento real se han centrado fundamentalmente en la determinación de los umbrales de movimiento. Por otra parte, bajo el término <<ilusiones de movimiento>> se hace referencia a la percepción del movimiento bajo distintas condiciones en las que no existe desplazamiento del objeto. Los posefectos de movimiento, el movimiento auto-cinético, el movimiento inducido y el movimiento aparente, constituyen ejemplos de ilusiones de movimiento. La percepción de acontecimientos, hace referencia a la percepción de movimientos complejos y encadenados, como la que se experimenta en la percepción de la causalidad, el movimiento biológico y el movimiento propio. Finalmente, los estudios realizados sobre mecanismos neuronales implicados en la percepción del movimiento indican por una parte, la existencia de detectores especializados en la dirección del movimiento y, por otra parte, a nivel cortical, la intervención de las áreas MT y MST del lóbulo temporal en la percepción del movimiento.

Capítulo 6

PERCEPCIÓN DE LA FORMA l. ORGANIZACIÓN PERCEPTIVA

En el capítulo 3 hemos visto que algunas teorías consideran la extracción de rasgos o características simples (bordes, puntos, rayas, etc.) como un primer paso en la obtención de la descripción simbólica de la escena, propia del proceso perceptivo. Según estas teorías, la extracción de características simples constituiría un primer nivel en el proceso perceptivo y un paso previo a la percepción del objeto. Habitualmente no percibimos un mundo formado por bordes, rayas, puntos, etc., a no ser que hayamos sido entrenados específicamente para ello, o a menos que en alguna situación experimental se nos proporcionen instrucciones para hacer precisamente esto. Lo que normalmente percibimos es un mundo formado por objetos estructurados, es decir, escenas mucho más complejas que las características o rasgos simples. Si el lector levanta la vista y observa lo que está en su entorno inmediato, la habitación en la que está leyendo, podrá percibir sin ninguna dificultad la mesa sobre la que trabaja y los diversos objetos situados en ella (lápices, papeles, otros libros, etc.). Si además, se asoma a la ventana podrá percibir casas, árboles y personas que transitan por la calle. La percepción de objetos constituye un nivel superior a la simple detección de características en el proceso perceptivo.

La percepción de objetos del mundo real nos parece obvia y no nos plantea problemas a no ser que padezcamos deficiencias visuales o neurológicas, sin embargo es un proceso complejo y de difícil explicación. La estimulación que incide en los millones de fotorreceptores de la retina es energía electromagnética, luz reflejada desde los objetos reales del medio ambiente. Esta energía forma una imagen en la retina, imagen retiniana, que consiste en una distribución bidimensional (un mosaico) de luz de diferentes intensidades y longitudes de onda. La información contenida en la imagen retiniana es ambigua y no está organizada, es decir, no contiene objetos tal y como los


percibimos. ¿Cómo es posible entonces, que podamos tener en los objetos percibidos un reflejo tan exacto de los objetos del mundo real a partir de la información contenida en la imagen retiniana? Este es el problema básico en la percepción de la forma y su objetivo de estudio es comprender los procesos por medio de los cuales el sistema visual genera la experiencia perceptiva de un objeto a partir de la información contenida en la imagen retiniana.

Sin embargo, los procesos que subyacen a la experiencia perceptiva no se pueden identificar con los fenómenos de la percepción de la forma. Los fenómenos de los que se ocupa la percepción de la forma, son el resultado del proceso perceptivo, incluyen tanto la experiencia perceptiva del observador como los datos obtenidos mediante la utilización de tareas experimentales en el agrupamiento, segregación de la textura, discriminación de formas, etc. (Uttal, 1988). En los capítulos dedicados a percepción de la forma se examinarán algunos ejemplos de fenómenos (experiencias perceptivas y datos obtenidos mediante procedimientos experimentales) que constituyen el resultado de los procesos perceptivos y, a partir de los cuales, se puede inferir la actuación de una serie de mecanismos y procesos que el sistema visual utiliza para extraer, interpretar y dar significado a la información sobre los objetos del entorno. Uno de estos mecanismos, la organización perceptiva, facilita la extracción de regularidades presentes en los objetos naturales, permitiendo así la segregación y agrupamiento de la estimulación necesarias para la percepción del objeto. Otros procesos nos facilitan el desenvolvimiento en el entorno. Entre estos, los procesos de detección, nos permiten descubrir la presencia de uno o varios objetos en el entorno (por ejemplo, si caminamos en la oscuridad es importante que podamos descubrir la presencia de obstáculos en nuestro camino) . Un proceso más complejo que el anterior es el de discriminación que nos permite diferenciar un objeto de otro y, de este modo, seleccionar la información relevante en un momento determinado o para realizar una acción específica. Por ejemplo, si estamos conduciendo un automóvil es necesario discriminar las señales que indican un peligro de aquellas otras señales que indican simplemente una información, esto puede realizarse simplemente discriminando la forma o el color de las señales de peligro de la forma o el color de las otras señales. Finalmente, los procesos más complejos, identificación y reconocimiento, permiten determinar con exactitud el objeto en cuestión; por ejemplo, para abrir la puerta de nuestra casa es imprescindible no sólo distinguir unas llaves de otras sino también identificar y reconocer la llave apropiada, e implican la intervención de otros procesos psicológicos como la representación en la memoria de una imagen determinada.

Los procesos de detección, discriminación y reconocimiento están jerarquizados en cuanto a su funcionamiento y al grado de información estimular que requieren (Sekuler y Blake, 1994 ). En relación con el funcionamiento, los procesos más complejos requieren la intervención de los más simples. No podemos discriminar un objeto de otro si previamente no lo hemos de-

PERCEPCIÓN DE LA FORMA l. ORGANIZACIÓN PERCEPTIVA 225

tectado, tampoco podemos reconocer un objeto si previamente no lo hemos detectado y lo hemos diferenciado de otros objetos presentes en el entorno. En cuanto a la jerarquía en el grado de información que requieren los procesos, los más complejos requieren información estimular más precisa que los procesos más simples.

Con fines didácticos examinaremos, en primer lugar, y en el presente capítulo, la organización perceptiva; en el próximo capítulo los procesos de detección y discriminación de formas visuales y en el capítulo 8 el proceso de reconocimiento de objetos y caras. Esta planificación de los capítulos no implica que los distintos procesos actúen por separado ni que se consideren como compartimentos estancos; por el contrario, la tendencia actual en gran parte de las investigaciones es considerar la interrelación entre todos ellos.

1. ORGANIZACIÓN PERCEPTIVA

La definición de organización perceptiva difiere de unos autores a otros en función de su posición teórica. Examinemos alguna de ellas. Los defensores de la Teoría de la Gestalt la definen como aquél conjunto de factores o condiciones que permiten la constitución del objeto percibido (Kanizsa, 1979, 1980). Para Pomerantz y Kubovy (1986) es el proceso que permite la percepción de determinadas relaciones entre elementos estimulares discretos e inconexos y que a la vez determina su interpretación. Palmer (1999) define la organización perceptiva como la estructuración de los elementos de la información visual en unidades perceptivas más amplias, como los objetos y las relaciones entre los mismos. Sekuler y Blake (1994) la consideran como un proceso que permite extraer regularidades presentes en los objetos naturales, que el sistema visual utiliza para organizar la estimulación ambigua. Finalmente, desde una perspectiva más amplia, la organización perceptiva se considera como un conjunto de procesos necesarios para extraer regularidades de la imagen y representarlas en un formato útil para procesos posteriores como los implicados en el reconocimiento del objeto (Wagemans y Kolinski, 1992).

A pesar de estas diferencias, lo que es común a todas las posturas teóricas es la preocupación por dar respuesta a dos preguntas básicas que se han planteado los científicos desde los inicios de la Psicología Experimental en relación con la percepción de la forma. En primer lugar, para poder percibir un objeto es necesario distinguirlo del contexto así como de otros objetos presentes en el mismo ¿cómo se segregan las unidades estimulares unas de otras para dar lugar a la percepción de objetos distintos y diferenciados? Por otra parte, si la información en la imagen retiniana es ambigua ¿cómo se agrupan los elementos estimulares discretos e inconexos para dar lugar a unidades perceptivas más amplias como objetos o superficies?


1.1. Principios de organización perceptiva

En relación con estas dos preguntas, la Psicología de la Gestalt desarrolló una serie de principios que describen la forma en que se llevan a cabo dos mecanismos básicos de la organización perceptiva: la segregación de objetos, o percepción de la figura y el fondo, y el agrupamiento de elementos estimulares discretos e inconexos en unidades perceptivas más amplias o agrupamiento perceptivo.

1.1.1. Principios de segregación de la figura y el fondo

La segregación de objetos consiste básicamente en la percepción de una figura que se destaca sobre un fondo y se considera como el tipo de organización perceptiva más elemental. Fue descubierta por Rubín en 1915 a partir de sus trabajos con figuras reversibles como la presentada en la parte superior de la Figura 6_1, en la que se puede percibir una copa o dos caras_ En esta figura se pueden diferenciar dos regiones, una región blanca que corresponde a la figura de la copa, y otra negra, la correspondiente a las caras. Las dos regiones están delimitadas por un contorno (límite entre la parte blanca y la negra).

A B

FIGURA 6.1. En la parte izquierda se representan figuras reversibles similares a las de Rubin ( 1915) . Obsérvese como cambia el percepto a medida que aumenta el tamaño de la zona blanca de la zona central . Ésta se percibe mejor como figuro cuando el tamaño es más pequeño (A) que cuando es más grande (C). Fuente: Stanley Coren, Lawrence M. Ward & James T. Enns. Sensation and Perception . 1994. Toronto: Harcourt Broce College Publishers, Thomson lnternational, fig . 10.1 O. En la parte derecha se representa un dibujo de Shepard ( 1990). En este dibujo se percibe al mismo tiempo el candelabro y el rostro de frente pero no se puede percibir al mismo tiempo la palmatoria y los dos rostros de perfil. Fuente: Roger N.

Shepard. Mind Sights. 1990. New York: Henry Holt.

PERCEPCIÓN DE LA FORMA I. ORGANIZACIÓN PERCEPTIVA 227

Obsérvese que cualquiera de las dos partes representada en esta figura puede actuar de figura o de fondo dependiendo de que el sistema visual asigne el contorno a una de las dos regiones (Rock, 1986). Si se asigna el contorno a la parte blanca se percibirá la copa como figura. Por el contrario, si se asigna a la parte negra se percibirán las caras. Sin embargo, es imposible percibir las dos partes como figura o como fondo a la vez. Si se percibe la copa como figu ra no se pueden percibir las caras al mismo tiempo, sino que éstas se perciben como fondo. Por el contrario, si se perciben las caras como figura, la copa pasa apercibirse inevitablemente como fondo. En la parte inferior de la figura si se percibe un candelabro se puede percibir a la vez una cara de frente, pero resulta difícil percibir las dos caras de perfil. A su vez, si se perciben las dos caras de perfil resulta muy difícil percibir el candelabro. Otros ejemplos de este principio lo encontramos en algunas obras de arte como las conocidas obras de Escher1 en las que se alterna la percepción de figuras (véase Figura 6.2).

FIGURA 6.2. Figuras reversibles de Escher. Fuente: M. C. Escher y J. L. Locher. The World of Escher. Amsterdam: Meulenhoff, figs. 122 y 247. © 2006 The M. C. Escher

Company-Holland. Todos los derechos reservados www.mcescher.com

l. En el libro editado por Locher (1988), The world of M. C. Escher, se presentan numerosos ejemplos de figuras reversibles.


Las investigaciones de Rubín consistieron en observaciones y descripciones fenomenológicas sobre las impresiones de los observadores cuando se les presentaban estímulos como los descritos anteriormente denominados figuras reversibles. A partir de aquí desarrolló una serie de descripciones sobre las características diferenciales de la figura y el fondo según los cuales, la figura y el fondo se diferencian en los siguientes aspectos: a) la figura tiene carácter de objeto, el fondo no; b) la figura tiene forma, el fondo no la tiene. La forma de la figura procede del contorno que la delimita, por ejemplo en las figuras reversibles presentadas en la parte superior de la Figura 1 la asignación del contorno a la parte blanca o negra determina que dicha parte se perciba como figura; e) la figura tiene color de superficie mientras que el fondo es menos denso; d) la figura está localizada frente al fondo; e) resulta más fácil discriminar figuras entre sí que fondos; f) la figura se conecta más fácilmente a significados que el fondo.

Rubín y posteriormente otros investigadores, establecieron a partir de sus investigaciones, las condiciones estimulares que permiten predecir qué partes del campo visual se percibirán como figura o como fondo. Estas condiciones estimulares fueron denominadas por los psicólogos de la Gestalt <<principios de organización de la figura y el fondo>> (Cuadro 6.1). Ejemplos de estos principios se presentan en la Figura 6.3.

. i

. ~

J

• t ~ ~ J

A B e

D E F

FIGURA 6.3. Ejemplos de la actuación de los principios de segregación de la figura y el fondo. Según estos principios, tenderán a percibirse como figura las áreas envueltas (A), simétricas (B), convexas (C), las que presenten orientación vertical-horizontal, un menor tamaño relativo y mayor contraste con el contorno global(partes más oscuras de D, E y F). Por e l contrario, tenderán a percibirse como fondo las áreas envolventes, asimétricas, cóncavas, las que presenten orientación oblicua, un tamaño relativo mayor y un menor contraste con el con-

torno global.

PERCEPCIÓN DE LA FORMA J. ORGANIZACIÓN PERCEPTIVA 229

CUADRO 6.1. Principios de organización gura-fondo

Áreas envolventes y envueltas. Las áreas envueltas tenderán a percibirse como gura y las envolventes como fondo.

Simetría. Las áreas que presentan simetría en su eje vertical tenderán a percibirse como guros con mayor facilidad que las que no la presentan.

Áreas convexas y cóncavas. Las áreas convexas tenderán a percibirse como guros con mayor probabilidad que las cóncavas.

Orientación. Las áreas orientadas vertical-horizontalmente se perciben como guros con mayor facilidad que las oblicuas.

Tamaño relativo. Las áreas de menor tamaño tenderán a percibirse como gura con prioridad a aquellas que presenten un tamaño mayor.

Contraste. Las áreas que presenten mayor contraste con el contorno global se percibirán más fácilmente como guros que aquellas que presenten menos contraste.

1.1.2. Principios de agrupamiento perceptivo

Los principios de agrupamiento perceptivo fueron desarrollados por Wertheimer (1925), quien advirtió que, a igualdad de otras circunstancias, los elementos estimulares discretos e inconexos cuando se presentan simultáneamente tienden a percibirse como patrones o unidades perceptivas más amplios o distintos, en función de determinadas propiedades. Es decir, se trata de la reunión de determinados elementos estimulares que comparten alguna propiedad común en unidades perceptivas distintas.

Por ejemplo en la parte superior de la Figura 6.4, la organización percibida es ambigua porque en este caso puede percibirse desde un cuadrado formado por puntos hasta distintas organizaciones alternativas: filas, columnas o diagonales de puntos, aunque la percepción de estas organizaciones alternativas requiera un esfuerzo y no sea tan evidente como la primera. Sin embargo los elementos estimulares discretos se pueden agrupar en función de una serie de principios (Cuadro 6.2). En la figura 6.4 se presentan algunos ejemplos de estos principios.

Más recientemente, Palmer (1992), ha sugerido una clasificación de los principios de agrupamiento perceptivo: principios de agrupamiento intrínseco, en los que se encuadrarían la mayoría de los principios clásicos formulados en la Teoría de la Gestalt, y según los cuales, los elementos estimulares discretos se agrupan en unidades perceptivas más amplias o distintas en función de su proximidad, semejanza en color, forma, tamaño, etc. Principios de agrupamiento extrínseco, en los que los elementos estimulares discretos se agrupan y forman unidades perceptivas distintas en función de la actuación de elementos externos añadidos al estímulo inicial. Por ejemplo, el hecho de encerrar los elementos estimulares discretos en una figura geométrica, puede determinar que se agrupen (principio de región común), o, el hecho de que se conecten

230

A B

---·

gggggg 000000 QOOQOO 000000 000000

e

o<>oo; o o o

E

F

ooo o

00

PERCEPCIÓN VISUAL

o-o<> ooa

FIGURA 6.4. Ejemplos de principios de agrupamiento perceptiva. La organización en la parte superior es ambigua. Los elementos se agrupan por semejanza en color (A), tamaño (B) y forma (C) . En D los e lementos se agrupan por proximidad. En E, se presenta un ejemplo de agrupamiento por buena continuidad, aunque todas las organizaciones presentadas en la gura son posibles, tenderán a agruparse los elementos estimulares que parezcan seguir la misma dirección formando curvas suaves (parte central de la gura) . En F, se presentan ejemplos de los principios de cierre y destino común (las echas indican el movimiento de los puntos, que se agruparían en base a l movimiento común). Finalmente en G, se presentan algunos ejemplos de principios de agrupamiento extrínseco: conexión

de elementos en la parte superior y región común en la parte inferior.

los distintos elementos, puede producir que se perciban como una unidad (principio de conexión o cohesión de elementos). Estos dos principios de agrupamiento extrínseco han sido propuestos por Palmer y Rock (1994) (Véase Figura 6.4 ). Finalmente, los principios de agrupamiento también pueden diferenciarse en virtud de la cohesión del percepto resultante de su actuación. Por ejemplo, en algunos principios de agrupamiento intrínseco como semejanza y proximidad y en el principio extrínseco de región común, se forman agregados perceptivos en los que los elementos se perciben con una relativa independencia, mientras que en el principio intrínseco de buena continuación y en el extrínseco de conexión se percibe un objeto más cohesionado (Palmer, 1999).


CUADRO 6.2. Principios de agrupamiento perceptivo

Proximidad. Los elementos más próximos tienden a agruparse entre sí formando unidades perceptivas distintas. Semejanza. Los elementos más semejantes tenderán a agruparse entre sí. La semejanza puede ser de forma, color, tamaño, orientación etc. y la conjunción de varias dimensiones llevará a un agrupamiento más o menos potente . Cierre. Las formas cerradas tienden a percibirse con preferencia a las formas abiertas. Buena continuación. Se tiende a percibir cambios suaves en la estimulación con preferencia a cambios pronunciados. Destino común. Los elementos que presentan una misma pauta de movimiento se percibirán como formando una misma unidad perceptiva.

Como hemos señalado anteriormente, los principios de organización perceptiva propuestos por los psicólogos de la Gestalt han sido considerados por algunos autores como regularidades que utiliza el sistema visual para organizar la información ambigua (Sekuler y Blake, 1994 ). Estas regularidades, además, constituyen propiedades de los objetos. Cuando observamos una mesa la distinguimos como figura en un entorno determinado (figura-fondo), la percibimos como un objeto compacto formado por distintos elementos (tablero, patas, travesaños, etc.); a su vez percibimos las uniones de estos elementos (proximidad), las partes que son similares y diferentes (tablero frente a patas); y seguimos percibiendo la mesa como un único objeto aun en el caso de que uno de los travesaños esté despegado (cierre).

1.1.3. Limitaciones de la Teoría de la Gestalt

La principal aportación de la Gestalt al estudio de la percepción fue la observación de determinados fenómenos perceptivos y la descripción de las condiciones bajo las cuales se percibe una determinada organización. Sin embargo se han señalado una serie de limitaciones en relación con este planteamiento teórico2

•

Una primera limitación está en relación con la propia formulación de los principios de organización perceptiva. Los principios de organización perceptiva formulados por los gestaltistas han sido considerados vagos e imprecisos por algunos autores (Hochberg, 1974). Esta limitación presenta varias consecuencias importantes: la primera de ellas consiste en que los principios no se apliquen siempre de la misma forma ante los mismos fenómenos. Por ejemplo, en las figuras reversibles o ambiguas, el esfuerzo del observador en dirigir la atención hacia una parte determinada del estímulo puede hacer que se inviertan las relaciones entre la figura y el fondo percibiéndose lo que

2 . En Luna (1992) se ofrece un análisis más detallado de estos aspectos.


en un principio aparecía como figura como fondo y viceversa. Una segunda consecuencia consiste en que se puedan aplicar principios de organización perceptiva que presentan una contraposición teórica a un mismo patrón estimular. Por ejemplo, frecuentemente los principios de simetría y convexidad, que intervienen en la segregación de la figura y el fondo, entran en conflicto, prevaleciendo generalmente el principio de convexidad sobre el de simetría, lo cual iría en contra del principio teórico de la Gestalt según el cual se percibirá la organización más simple posible.

Una segunda limitación está en relación con el hecho de que los principios son meramente descriptivos y no se ha desarrollado una teoría general que proporcione una explicación sobre los mismos. La falta de explicación de los principios se ha atribuido, a la escasa experimentación desarrollada por los teóricos de la Gestalt y a la metodología utilizada que consistió fundamentalmente en la utilización de demostraciones fenomenológicas. Este procedimiento consistía en presentar a los observadores un patrón como el de la parte superior de la Figura 6.4, que no produce un agrupamiento determinado, y patrones semejantes a los que se presentan en la misma figura (A, B, C y D) y en los que se puede percibir una organización determinada, en virtud del agrupamiento de los elementos en base a determinadas propiedades (color, tamaño, forma y proximidad) y los observadores tenían que informar de la organización percibida en cada uno de ellos. Este procedimiento presenta el inconveniente de que, al estar basado en la impresión subjetiva de los observadores, ante la presentación de los estímulos, no permite determinar objetivamente el que una respuesta sea o no correcta, ni obtener datos numéricos que permitan contrastar las teorías (Palmer, 2003).

Sin embargo, en relación con las críticas a la metodología hay que señalar por una parte, que algunos autores consideran las demostraciones de la Gestalt como auténticos experimentos (Rock, 1994 ). Según Rock, la manipulación en los estímulos puede considerarse como una variable independiente, mientras que la variable dependiente consistiría en el percepto que se obtiene como consecuencia de esta manipulación. Por otra parte, se han desarrollado métodos de cuantificación como los que se examinan más adelante en el apartado de métodos cuantitativos en el estudio del agrupamiento, que permiten paliar algunas de las dificultades señaladas (Kubovy, 1986, 1994, Kubovy y Gephstein, 2003)

Con independencia de estas consideraciones críticas, es importante resaltar que algunos de los problemas planteados por la Psicología de la Gestalt siguen considerándose problemas fundamentales en el ámbito de la percepción. El estudio de las relaciones entre el todo y las partes, los efectos de superioridad del objeto y de superioridad configuracional, el procesamiento de aspectos globales y locales de los patrones visuales jerárquicos, la segregación perceptiva en base a la textura y las relaciones entre mecanismos de selección atencional y organización perceptiva, constituyen algunos ejemplos del interés actual de los investigadores en los problemas planteados en el seno


de la Teoría de la Gestalt reflejado en el notable volumen de investigación desarrollado desde los años 80, hasta el momento actual.

2. DESARROLLOS POSTERIORES EN EL ESTUDIO DE LA ORGANIZACIÓN PERCEPTIVA

La mayoría de las investigaciones posteriores sobre organización perceptiva, en lugar de centrarse en la descripción de fenómenos perceptivos o en las condiciones que los determinan, han intentado aportar explicaciones teóricas basadas en la ejecución en tareas experimentales. A continuación examinaremos algunos ejemplos de estas investigaciones.

2.1. Investigaciones sobre la segregación de la figura y el fondo

Las investigaciones desarrolladas posteriormente sobre la percepción de la figura y el fondo han dedicado menos atención a las diferencias fenomenoló gicas entre estas dos regiones del campo visual y se han centrado en el análisis de los mecanismos que las diferencian y en tratar de encontrar una explicación a este fenómeno basada en el procesamiento de la información.

2.1.1. Componentes de frecuencia espacial y segregación de la figura y el fondo

En relación con el primer aspecto, diferenciación funcional en la percepción de la figura y el fondo, Julesz (1978) sugirió sistemas o mecanismos diferentes de procesamiento para la figura y el fondo. Partiendo de las descripciones fenomenológicas propuestas por la Teoría de la Gestalt que afirman que la figura está más articulada y tiene carácter de objeto, mientras que el fondo no presenta estas características, y de la predicción de que la región del campo visual que presente más detalles se percibirá como figura, Julesz propuso que el procesamiento de la figura se caracterizaría por un análisis de los detalles de la imagen, mientras que el procesamiento del fondo se caracterizaría por un análisis de estructuras más globales. Actualmente, como ya se ha mencionado en el capítulo 3, conocemos a través de los resultados de diversos estudios psicofísicos (Marr y Poggio, 1979; Graham, 1980), que la zona espectral que contiene frecuencias espaciales altas contiene información sobre los detalles de la imagen (características de grano fino), mientras que la zona espectral que contiene frecuencias espaciales bajas lleva información sobre aspectos globales de la imagen (características de grano grueso) 3 .

3. Para un tratamiento en profundidad de estos aspectos véase Sierra-Vazquez (1992) .


Tomando como punto de partida lo anterior, algunos investigadores han tratado de analizar si existe una asociación entre los componentes de frecuencia espacial de las imágenes y la percepción de la figura y el fondo. Wong y Weisstein (1983) diseñaron una situación experimental en la que presentaban líneas nítidas (características de grano fino de la imagen) o borrosas (características de grano grueso de la imagen) en las dos regiones de una figura reversible, en concreto la figura de la copa y las caras de Rubin. La tarea de los sujetos consistía en detectar líneas nítidas o borrosas cuando se presentaban en el contexto de la figura o en el del fondo. En la parte superior de la Figura 6.5 se presenta la región del campo visual (A, B o C), en la que se presentaba la línea a detectar. Cuando se presentaba en A, la copa era la figura, cuando se presentaba en B y C, las caras eran la figura. Los resultados mostraron que las líneas nítidas, que presentarían componentes de alta frecuencia espacial, se detectaban mejor en el contexto de una figura que en el de un fondo. Por el contrario, cuando la línea era borrosa, es decir presentaba componentes de baja frecuencia espacial, se detectaba mejor en el contexto de un fondo.

En un estudio posterior Klymenko y Weisstein (1986) analizaron la influencia de los componentes de frecuencia espacial en la percepción de la figura y el fondo. Utilizaron también figuras reversibles pero además rellena-

--

FIGURA 6.5. Figuras reversibles utilizadas en los experimentos de Wong y Weisstein ( 1983) y Klymenko y Weisstein ( 1986) . Fuente de la figura inferior: Stanley Coren, Lawrence M. Ward & James T. Enns. Sensation and Perception . 1994. Toronto: Har-

court Broce College Publishers, Thomson lnternational, fig. 1 0.20.


ron las regiones correspondientes a la figura y el fondo con enrejados sinusoidales de distinta frecuencia espacial (Véase parte inferior de la Figura 6.5). Registraron el número de veces que cada región se percibía como figura y como fondo en función de que se hubiera rellenado el espacio con enrejados de altas o bajas frecuencias espaciales. Los resultados indicaron que la región rellena con enrejados de alta frecuencia espacial (las caras en el ejemplo presentado aquí) se percibían como figura un mayor número de veces.

Los resultados anteriores y otros similares apoyan la hipótesis de una diferencia funcional entre la percepción de la figura y el fondo según la cual cada proceso sería responsable de un tipo de procesamiento visual y sensible a diferentes tipos de información (Weisstein y Wong, 1988). El análisis de la figura se caracterizaría por una inspección detallada de las áreas más pequeñas del campo visual y la información relevante en este caso serían los detalles y los contornos. El análisis del fondo sería responsable de la extracción de la información global del campo visual.

2.1.2. Asignación unilateral de bordes

En relación con el segundo aspecto, explicación de la segregación de la figura y el fondo basada en el procesamiento de la información, una serie de autores han considerado qué tipo de procesos, preatencionales o atencionales, intervienen en el análisis de la figura.

Driver y Baylis (1996), intentaron determinar el papel de la asignación de bordes a la región de la figura o a la del fondo. Como hemos visto anteriormente, cuando se observa la figura de la copa y las caras de Rubin se percibe un único objeto, o bien la copa o las caras, pero no las dos figuras a la vez. Los teóricos de la Gestalt atribuían este hecho a que el sistema perceptivo impone un orden en la estimulación.

Sin embargo, Driver y Baylis proponen que los bordes que dividen regiones adyacentes del campo visual se asignan unilateralmente, es decir, se asignan a un único lado. Este supuesto fue puesto a prueba en una serie de experimentos en los que se presentaban estímulos similares a los presentados en la Figura 6.6.

En estos estímulos, un borde (línea quebrada entre la zona clara y oscura) divide la zona delimitada por el rectángulo en dos partes, una más pequeña y oscura y una más grande y clara. El borde se puede asignar a cualquiera de las dos regiones del estímulo, la figura o el fondo, y una vez asignado a una de las partes se denomina contorno que delimita la figura, si se asigna a ésta, o contorno que delimita el fondo, si se asigna al fondo.

Por otra parte, y de acuerdo con los principios de organización de la figura y el fondo postulados por la Teoría de la Gestalt, el tamaño relativo y el contraste determinarían que la parte más pequeña y con mayor contraste del estímulo tienda a percibirse como figura y la parte más grande y con menor contraste como fondo. Por lo tanto, en los estímulos (A) y (B), presentados


A B

L5 LJ e D

c=J r=J E F

FIGURA 6.6. Estímulos similares a los utilizados en los experimentos de Driver y Baylis ( 1996).

en la Figura 6.6, la parte más pequeña y oscura se percibiría como figura y la parte más grande y clara se percibiría como fondo.

En los experimentos se presentaba en primer lugar un estímulo similar a los representados en (A) y (B), denominado estímulo previo, y una vez desaparecía el estímulo previo se presentaba inmediatamente uno de los estímulos de comparación (C, D, E, ó F). La tarea de los observadores consistía en comparar si los bordes (línea quebrada) del estímulo previo y de comparación, eran iguales o diferentes. Por ejemplo, en la Figura 6.6, si el estímulo previo era (A), el estímulo de comparación (C) presentaría un borde igual al asignado a la figura y el estímulo (E) presentaría un borde diferente; mientras que los bordes presentados en (D) y (F) corresponderían al fondo (D, presentaría un borde igual al del fondo y F un borde diferente). Lo contrario ocurriría si se presentara (B) como estímulo previo, puesto que en este caso, la parte pequeña situada a la derecha tendería apercibirse como figura, por lo que los estímulos (D) y (F) serían los estímulos de comparación para la figura (D, sería el igual y F el diferente) y los estímulos (C) y (E) para el fondo (C, igual y E, diferente).

Se proporcionaron instrucciones a los observadores para que atendieran exclusivamente al borde como si se presentara una única línea quebrada prescindiendo del resto del estímulo, tanto en el estímulo previo como en el de comparación. Sin embargo, de acuerdo con la hipótesis de asignación unilateral de los bordes, se predijo que la atención selectiva a la línea quebrada resultaría imposible dado que siempre se percibiría una figura delimitada por


un contorno, en lugar de un borde aislado representado por una línea quebrada. En base a lo anterior se predijo que los observadores rendirían mejor en la tarea de comparación cuando los estímulos de comparación correspondieran a las figuras que cuando correspondieran a fondos. La predicción se basa en que, según esta hipótesis, el borde se asigna a un único lado y, de acuerdo con la manipulación realizada sobre el estímulo previo, la parte más pequeña se percibiría como figura desde el principio, por lo que sería más fácil reconocer el contorno que la delimita en la tarea de comparación. Es decir, se produciría una ventaja en el reconocimiento del contorno que delimita la figura desde el momento en que ésta se presenta como estímulo previo. Esta predicción sólo podría mantenerse en el caso de que los observadores no atendieran exclusivamente a la línea quebrada que divide el estímulo en dos partes y la asignaran a una de ellas. Si atendieran únicamente a la línea quebrada, la ejecución en la tarea de comparación de contornos, sería igual en los dos casos, puesto que la ventaja de asignar el borde a la figura cuando se presenta el ensayo previo desaparecería, y los juicios de comparación de contornos serían iguales.

Los resultados obtenidos sugieren que, los observadores asignaron el borde a un único lado del campo visual, el correspondiente a la figura. Esta operación tuvo consecuencias en la ejecución, los sujetos rendían mejor (empleaban menos tiempo y cometían menos errores) cuando juzgaban si el contorno de la figura era igual al de comparación, que cuando juzgaban si el contorno correspondiente al fondo y el de comparación eran iguales. Resultados obtenidos con estímulos en los que se definía la figura en base a otros principios de organización, como simetría y convexidad, confirmaron la hipótesis de asignación unilateral de bordes. Como conclusión, los autores sugirieron que la asignación de los bordes que dividen la figura y el fondo es unilateral y espontánea y no depende de la atención.

2.1.3. Influencia de los procesos de reconocimiento en la segregación de la figura y el fondo

Finalmente examinaremos una posición teórica que constituye un reto a uno de los principios aceptados tradicionalmente en el estudio de la percepción. La mayoría de las teorías de la percepción visual han defendido que la segregación de la figura y el fondo constituyen un paso previo al proceso de reconocimiento del objeto (Biederman, 1987; Marr, 1982; Palmer & Rock, 1994 ). Parece obvio, que para poder reconocer un objeto, es necesario previamente segregar ese objeto del fondo o de otros objetos presentes en el campo visual y, una vez hecho esto, compararlo con una representación en la memoria. Esta afirmación ha sido puesta en cuestión por Lowe (1987) y fundamentalmente a través de las investigaciones de Peterson y colaboradores.

Peterson, Harvey y Weidenbacher (1991) presentaron estímulos reversibles, en los que se podía invertir la figura y el fondo. Se trataba de un rectángulo que contenía una parte central negra rodeada por unas partes laterales


en blanco, parecido al estímulo de la copa y las caras de Rubín. La tarea de los sujetos consistía en observar los estímulos durante un determinado periodo de tiempo e informar cada vez que se produjera una inversión, es decir siempre que la región del campo visual que se estaba percibiendo como figura cambiara a fondo o viceversa. En una serie de ensayos se proporcionaban instrucciones a los observadores para que intentaran ver la parte central como figura; en otra serie de ensayos se instruía a los observadores para que intentaran ver las partes laterales como figura. Los resultados mostraron que los observadores percibían la parte central como figura un mayor número de veces. En otra serie de ensayos manipularon los estímulos de manera que las dos partes del mismo estuvieran igualadas en los factores que determinan la formación de la figura como área, tamaño relativo, etc., pero las zonas correspondientes a la figura (parte oscura del estímulo) y al fondo (partes laterales blancas del estímulo) en algunas ocasiones se parecían a un objeto familiar y en otras no se presentaba esta propiedad (véase Figura 6. 7). Los resultados indicaron que las zonas del estímulo que se parecían a objetos familiares se percibían con mayor frecuencia como figura. Sin embargo, al presentar los mismos estímulos en una posición invertida, en la que ya no podían ser reconocidos como objetos familiares, el efecto desaparecía. Los autores interpretaron estos resultados como evidencia a favor de que el procesamiento de objetos familiares puede comenzar con anterioridad a que se haya completado la segregación de la figura e influir en ésta. Resultados similares se obtuvieron

FIGURA 6.7. Estímulos similares a los utilizados en los experimentos de Peterson (1994).


consistentemente en otros experimentos (Peterson y Gibson, 1993, Peterson, Bradley y Gibson, 1994).

A raíz de estos resultados propusieron un modelo para los procesos de reconocimiento prefigura!, según el cual los procesos de reconocimiento que contribuyen a la segregación de la figura y el fondo actuarían sobre los bordes (cambios abruptos en intensidad, representados por las líneas que separan las partes blanca y negra de los estímulos presentados en la Figura 6. 7) que dividen el campo visual y no sobre los contornos ya asignados a la figura o el fondo. Una vez detectados los bordes, los procesos de reconocimiento actuarían sobre las zonas situadas a ambos lados de los mismos influyendo en la segregación de la figura y el fondo. El modelo no supone que el proceso completo de reconocimiento de la figura se complete con anterioridad a la segregación de la figura y el fondo, sino que algunos procesos de reconocimiento actúan en paralelo al proceso de segregación de las dos partes del campo visual (Peterson, 1994, 2000, Peterson, Bradley y Gibson, 1994). Esta propuesta es compatible con la teorías del reconocimiento basadas en la detección de bordes (Biederman, 1983; Marr, 1982) que veremos en el capítulo de reconocimiento visual, la diferencia entre ambas radica en el hecho de que estas últimas teorías consideran que la segregación de la figura y el fondo es un proceso previo al de reconocimiento de las formas visuales mientras que la teoría de Peterson es interactiva.

2.2. Investigaciones sobre agrupamiento perceptivo

Las investigaciones experimentales sobre agrupamiento perceptivo se iniciaron en la década de los 504

• En este apartado nos centraremos en algunos desarrollos más recientes centrados en el procesamiento de la información, examinando algunos estudios sobre agrupamiento perceptivo desarrollados en el ámbito de la Psicología Cognitiva y algunas contribuciones realizadas desde la teoría computacional de la visión.

2.2.1. Agregados perceptivos y configuraciones

El agrupamiento perceptivo de elementos estimulares discretos e inconexos permite la formación de dos tipos distintos de unidades: agregados perceptivos y configuraciones (véase Figura 6.8). Agregados perceptivos, son unidades perceptivas formadas en base al agrupamiento de elementos discretos e inconexos que presentan una propiedad común (elementos semejantes, próximos, etc.) Rack (1986). Configuraciones, son unidades perceptivas distintas a los elementos de que están formadas y en la que se percibe la relación entre las partes. De la percepción de estas relaciones surgen propiedades emergentes

4. Un desarrollo más amplio de estos trabajos pioneros puede consultarse en Luna (1992).


que son distintas a los elementos componentes, y que no se pueden explicar en base a los mismos. Por ejemplo, la percepción de un rostro no es siempre la misma, aunque todas las caras posean los mismos elementos: dos ojos una boca una nariz, etc. (Kubovy, 1986; Kubovy y Pomerantz, 1981).

En la parte superior de la Figura 6.8 se presentan los elementos estimulares discretos, dos paréntesis abiertos a la derecha o a la izquierda. En A, se presenta un ejemplo de agregados perceptivos, en este caso los elementos estimulares discretos se agrupan por proximidad. En B, se presentan ejemplos de configuraciones. Como puede observarse, el agrupamiento de los elementos discretos da lugar a unidades perceptivas distintas y diferenciadas. Además la percepción de relaciones entre los elementos discretos da lugar al surgimiento de propiedades emergentes como la simetría en el estímulo 4 )(, repetición en 1 ((y 2 }} y la simetría y el cierre en el estímulo 3 ( ).

Se han considerado como propiedades emergentes los siguientes tipos: relaciones entre los elementos componentes de los estímulos que dan lugar a simetría, cierre, repetición, reflexión, intersección, y conjunción de elementos (Garner, 1981); relaciones espaciales entre los contornos, como la intersección de líneas y los extremos de las mismas; la orientación tridimensional de las superficies; las claves pictóricas de profundidad; la dirección de la iluminación de la escena; y la percepción de profundidad estereoscópica. (Coren, Ward y Enns (2001). Sin embargo, esta enumeración no agota el número de propiedades emergentes y es posible que en el transcurso de futuras investigaciones se descubran algunas otras no contempladas hasta el momento.

( )

2 2

(~ )~ (( )) 3 4 4

(~ )~ )( A B

FIGURA 6.8. Ejemplos de elementos estimulares discretos (parte superior), agregados perceptivos (A) y configuraciones (B).


Tomando como punto de partida esta distinción examinaremos las investigaciones desarrolladas por Pomerantz sobre agrupamiento perceptivo. Uno de los supuestos básicos de los que parte Pomerantz (1981) es la consideración del agrupamiento como una operación efectuada sobre los estímulos. En consecuencia, sus efectos pueden reflejarse en la ejecución en tareas experimentales y esto permite obtener una medida del agrupamiento a través de la ejecución en dichas tareas.

El primero de los trabajos que vamos a examinar está en relación con el problema de la configuración de los estímulos (Pomerantz y Garner, 1973). El supuesto general fue el siguiente: cuando en un patrón estimular los elementos componentes se organizan en una configuración, debería resultar muy difícil o imposible el procesamiento independiente de los elementos del patrón estimular por separado. En consecuencia, se predijo que la atención selectiva a los elementos componentes de la configuración sería muy difícil o imposible cuando los elementos componentes forman una configuración. Los estímulos utilizados fueron los paréntesis presentados en la Figura 6.8. Los estímulos se dibujaron en tarjetas y la tarea de los sujetos consistía en clasificarlas en dos grupos, de acuerdo con las instrucciones que les proporcionaba el expe-

1 ESTÍMULOS 1

¡coNDICIONES EXPERIMENTALES 1

CONTROL

WJ[ill 1 ATENCIÓN SELECTIVA 1

WJ[ill [illlli] FIGURA 6.9. Estímulos y condiciones experimentales utilizados en los experimentos

de Pomerantz y Garner ( 1973).


CUADRO 6.3. Condiciones experimentales (Pomerantz y Garner, 1973)

CONDICIÓN DE CONTROL

En esta tarea se presenta en cada ensayo uno de los dos posibles estímulos y cada estímulo se asocia a una respuesta diferente. Requiere una discriminación entre dos estímulos que difieren en un único elemento componente: el paréntesis situado a la derecha o a la izquierda. Ejemplo: Clasificar el estímulo 1 ((en un grupo, y el estímulo 3 ( ) en otro (véase Figura 6.9). Por lo tanto, para realizar eficazmente la tarea bastaría con atender selectivamente al paréntesis situado a la derecha de los estímulos puesto que es el único que permite diferenciar el estímulo 1 del estímulo 3, ya que los otros paréntesis son iguales.

CONDICIÓN DE ATENCION SELECTIVA

En esta tarea se presenta en cada ensayo uno de los cuatro estímulos posibles. Dos de los estímulos se asignan a una respuesta y los otros dos a una respuesta d iferente. (Véase figura 6.9) Requiere una discriminación entre pares de estímulos que difieren en los dos elementos componentes que forman el estímulo. Ejemplo: Clasificar en un mismo grupo los estímulos 1 ((y 3 ( ) y los estímulos 4 )(y 2)) en otro grupo. (Véase Figura 6.9).

El elemento componente al que habría que atender para realizar la discriminación es la orientación (apertura) del paréntesis situado a la izquierda en cada estímulo: en los estímulos 1 (( y 3 ( ) el paréntesis situado a la izquierda está abierto hacia la derecha, (: en los estímulos 4 )( y 2 )) está abierto a la izquierda, ). Por lo tanto, para realizar eficazmente la tarea bastaría con atender selectivamente al paréntesis situado a la izquierda de los estímulos puesto que es el único que permite diferenciar los estímulos 1 y 3 de los estímulos 2 y 4.

rimentador. De igual modo se les indicaba que atendieran exclusivamente al elemento componente que permitía discriminar un estímulo de otro y que ignoraran los demás. Las condiciones experimentales se presentan en el cuadro 6.3 y Figura 6.9.

Los resultados mostraron que los estímulos se clasificaron más rápidamente en la condición de control que en la de atención selectiva. Este resultado refleja que la atención selectiva a los elementos componentes del estímulo por separado resultó imposible, ya que si se hubiera atendido exclusivamente al elemento componente relevante para realizar la discriminación, los tiempos de clasificación hubieran sido iguales en las condiciones de control y atención selectiva. En opinión de los autores, los resultados indican que los estímulos se agruparon percibiéndose como un todo y no como elementos componentes del estímulo.


En un segundo estudio transformaron los estímulos rotando 90° el elemento derecho. Las tareas fueron exactamente iguales a las del estudio citado. Los resultados mostraron que el tiempo empleado en las dos condiciones (control y atención selectiva) era similar y, en consecuencia, los elementos estimulares no se agruparon y se percibían como elementos separados. Sin embargo, otros autores (Rock, 1986), consideran una interpretación alternativa a estos resultados. En opinión de este autor, los estímulos presentados en este experimento son agregados perceptivos. En este caso, como hemos señalado anteriormente, los paréntesis se agrupan por proximidad y se perciben como una unidad, aunque no forman configuraciones como en el estudio anterior. Por lo tanto, lo que indican los resultados en este caso, es que se puede atender selectivamente a los elementos estimulares cuando se agrupan formando agregados perceptivos pero esto no es posible cuando los elementos estimulares se agrupan formando configuraciones, como en el primer experimento citado, que presentan propiedades emergentes y determinan que el estímulo se perciba como un todo con una forma propia de la que no se pueden aislar los elementos.

2.2.2. Cuantificación del agrupamiento perceptivo

Estudios recientes han tratado de cuantificar el agrupamiento perceptivo. La importancia de los métodos cuantitativos para determinar el agrupamiento perceptivo reside en la posibilidad de obtener una medición precisa de los efectos del agrupamiento sobre todo en aquellos casos en que la aplicación del método fenomenológico no permite determinar con claridad los efectos, o cuando existen contradicciones entre la descripción del estímulo basada exclusivamente en la descripción fenomenológica y la ejecución en tareas experimentales.

Kubovy y Wagemans (1995), determinaron cuantitativamente la potencia de distintos tipos de agrupamiento midiendo la probabilidad de respuesta a estímulos que presentaban organizaciones ambiguas como los presentados en la Figura 6.10.A. En este tipo de estímulos se pueden percibir distintas organizaciones como cuadrados, rectángulos rombos, líneas con distinta orientación, etc. En el estímulo presentado en la Figura 6.10.A, los elementos estimulares (puntos) se pueden agrupar y, como consecuencia se percibirían líneas que presentan distinta orientación como se puede observar en la Figura 6.10A.B (las líneas grises indicarían las posibles orientaciones). Los sujetos realizaron una tarea de elección forzosa en la que observaban cada uno de los estímulos ambiguos durante un periodo de exposición relativamente breve (300 milisegundos), y a continuación elegían una de las cuatro posibles respuestas representadas en la Figura 6.1 O A. C. Este procedimiento permitía calcular, tras un elevado número elevado de ensayos, la probabilidad de percibir cada tipo de agrupamiento.


Beck y Palmer (2002), desarrollaron una tarea para medir el agrupamiento en la que se presenta una fila de elementos estimulares formada por elementos distintos, por ejemplo círculos y cuadrados, que se alternan con la excepción de uno que se repite para inducir agrupamiento (véase Figura 6.10.B). La tarea de los observadores consiste en identificar el elemento adyacente que se repite presionando una llave de respuestas si es un cuadrado o una llave distinta si es círculo. La potencia del agrupamiento se examinó presentando tres condiciones: una condición de control, en la que los círculos y cuadrados estaban situados a la misma distancia uno de otro, y, dos condiciones experimentales en las que los elementos estimulares se agrupaban por proximidad bien dentro de cada grupo, o entre grupos (véase Figura 6.10.B). Los resultados indicaron que el elemento que se repite se identificaba más rápidamente en la condición intragrupo que cuando los elementos a agrupar estaban situados en grupos distintos. Se obtuvieron resultados semejantes utilizando principios de agrupamiento distintos como semejanza, color, región común y conexión de elementos, lo que indica la validez de la tarea para cuantificar el agrupamiento perceptivo.

A. Procedimiento experimental de Kubovy y Wagemans (1995)

CD . . . . .

B. El procedimiento experimental de Palmer y Beck

Condición intragrupo

1 OD OD 00 D 1

Condición intergrupo

1 OD OD DO D 1

Condición de control

iooooooo

FIGURA 6.1 O. Ejemplos de métodos de medida del agrupamiento perceptivo. (Adaptado de Kubovy y Wagemans, 1995; Palmer, 1999).

PERCEPCIÓN DE LA FORMA I. ORGANIZACIÓN PERCEPTIVA

2.2.3. Teoría computacional de la visión y agrupamiento perceptivo

245

La actuación de los principios de organización perceptiva han sido considerados en el marco de la teoría computacional de la visión. David Marr (1976) diseñó un programa de ordenador con la finalidad de examinar que es lo que sucede una vez que se ha obtenido la descripción de características de nivel inferior. A través de una imagen de entrada y la descripción de sus características simples el programa aplicaba los principios de agrupamiento perceptivo para identificar las estructuras perceptivas que se obtenían a partir de la reunión de determinados elementos que compartían propiedades comunes.

En la Figura 6.11 puede observarse el procedimiento seguido. En A se presenta la imagen de un oso de peluche que constituye la imagen de entrada, en B se presentan los niveles de gris de la imagen de entrada, en C se muestra una versión abreviada de la descripción de características simples, es decir, se presentan únicamente segmentos en una posición y orientación determinadas (con fines didácticos se prescinde del tipo de características, línea, borde,

A B

o E F

FIGURA 6.11. Procedimiento de agrupamiento perceptivo mediante el programa de D. Marr (1976). (Explicación en e l texto). Fuente: llona Roth & Vicki Bruce. Perception and Representation. 1995 (2. 0 ed.). Buckingham: Open University Press/

McGraw-Hill Publishing Company, p. 104, fig. 2.16.


FIGURA 6.12. Procedimiento de agrupamiento perceptivo mediante el programa de D. Marr con claves de reconocimiento (1976). (Explicación en el texto) . Fuente: llana Roth & Vicki Bruce. Perception and Representa/ion. 1995 (2. 0 ed.). Bucking-

ham: Open University Press/McGraw-Hill Publishing Company, p. 105. fig. 2.17.

abertura, y de la información sobre contraste y borrosidad). En esta imagen el sistema visual detectaría muchas características situadas en posiciones distintas y con una determinada orientación. Sin embargo persistiría la ambigüedad en el estímulo. El resultado de la aplicación de los principios de agrupamiento por el programa se presenta en la parte inferior de la figura. Como puede observarse se identifican una serie de estructuras perceptivas diferentes en base al agrupamiento de características que comparten alguna propiedad común. En D, la estructura del contorno global del osito presenta un agrupamiento de características simples basado en el principio de buena continuación. En E, la estructura correspondiente a ojos y nariz presenta un agrupamiento de características en base a los principios de semejanza y proximidad; finalmente, en F, la estructura correspondiente al hocico muestra la actuación del principio de cierre y reúne las características simples que forman una figura ovalada. Todas estas estructuras se obtuvieron sin un conocimiento previo por parte del programa acerca de las estructuras que estaba buscando con la aplicación de los principios de agrupamiento perceptivo.

Sin embargo hay imágenes que no permiten la extracción de determinadas estructuras a menos que se le proporcione información al programa acerca de lo que se está buscando. En la Figura 6.12, se presenta un ejemplo. La parte superior de la figura muestra la imagen de entrada, y los niveles de gris de esa imagen. La parte intermedia presenta las estructuras identificadas en base al


agrupamiento. Como puede observarse, el programa no extrajo estructuras diferentes para las dos hojas situadas en el recuadro en la imagen de niveles de gris, sino que aparecían como un único objeto. Posiblemente esto se debió a que los niveles de gris en esa zona eran muy homogéneos (Frisby, 1978) y no permitían una diferenciación clara de las líneas. Marr resolvió el problema «indicándole» al programa que los segmentos adyacentes de la imagen pertenecían a dos objetos diferentes, o sea, proporcionándole información correspondiente a procesos de reconocimiento; de esta forma, el programa extrajo las estructuras representadas en la parte inferior de la Figura 6.12.

En el ámbito teórico de la visión espacial inicial que se ha examinado en el capítulo 3, los fenómenos de organización perceptiva se consideran como un resultado natural del funcionamiento del sistema visual humano. Desde esta perspectiva se ha planteado la cuestión del papel desempeñado por los canales psicofísicos en la percepción visual de la forma. En esta línea, Ginsburg (1986) mantiene que la percepción visual de la forma se basa en un procesamiento espacial y que los principios de organización perceptiva son un resultado del filtrado espacial de las imágenes estimulares. Este proceso se puede observar en la Figura 6.13. La aplicación de un filtro paso-bajo a las imágenes, que elimina la información sobre altas frecuencias, presentadas en la parte izquierda de la Figura 6.13, produce como resultado las imágenes de la derecha, en las que se percibe una organización. En la Figura 6.13, la letra R inicial inmersa en un fondo de ruido (puntos aleatorios) se percibe en la derecha como una letra R con mayor nitidez frente a un fondo más tenue que en la imagen de la izquierda (principio de segregación figura-fondo). En B, los cuadrados se organizan en columnas (principio de proximidad).

A

8 mmlr.':"'1 lmm L:..:J

FIGURA 6.13. Imágenes fi ltradas de Ginsburg ( 1986). Explicación en el texto).


2.3. Segregación de la textura

En el apartado correspondiente a la segregación de la figura y el fondo hemos visto como la asignación del contorno a una de las regiones del patrón estimular determinaba la percepción de la figura o el fondo. En este caso, el contorno se delimita en base a diferencias intensas de color o brillo y define una segregación en el patrón estimular: la región correspondiente a la figura y la región correspondiente al fondo. La asignación de contornos en base a diferencias de brillo o color no es la única forma de producir segmentaciones en el patrón estimular. También se puede lograr esta segregación en base a las diferencias en las texturas de los estímulos.

Texturas son patrones visuales formados por conjuntos de pequeños elementos repetidos y distribuidos sobre un área ya sea aleatoriamente o en una posición aproximadamente regular. En los patrones que se presentan en la Figura 6.14, se perciben pequeñas figuras que difieren en color (blanco o negro), forma (cuadrado o círculo), tamaño (grande o pequeño) o distintas combinaciones de estas dimensiones Obsérvese que aparentemente los diferentes grupos de textura establecen un contorno o límite entre las diferentes regiones del patrón estimular. Este contorno o límite es puramente subjetivo, no responde a una realidad física presente en la estimulación.

00000 00000 00000 00000

Forma

•••oo •••oo •••oo •••oo Forma y color

ooo•• ooo•• ooo•• ooo••

Color

00000 ooooo 00000 00000

Forma y tamaño

00000 00000 00000 00000

Tamaño

•••DD •••oo •••oo •••oo

Forma, color y tamaño

FIGURA 6.14. Segregación de regiones texturadas en base a una o varias dimensiones (explicación en el texto).


2.3.1. Procedimiento experimental

Los trabajos iniciales sobre segregación de texturas trataron de determinar si la segregación de regiones en los patrones texturados se producía en base a la actuación del principio de agrupamiento por semejanza. La hipótesis inicial establecía que una región del patrón estimular se segregaría más fácil y rápidamente cuando los elementos locales de que estaba formada fueran muy similares (agrupándose entre sí) y, a la vez, se diferenciaran del resto de los elementos del patrón. (Beck, 1966, Olson y Attneave, 1970).

Como ejemplo vamos a examinar uno de los trabajos clásicos sobre segregación de la textura realizados por Beck (1966). Presentó patrones texturados como los de la Figura 6.15, en los que los elementos diferían sólo en la forma (T vs. L), en la forma y la dirección (T vs. L inclinada), únicamente en la orientación (T vs. T inclinada) y sólo en la posición horizontal-vertical (T vs. T invertida). La tarea de los observadores consistía en indicar cuál era la región que se segregaba del resto del patrón estimular. Los resultados mostraron que el factor fundamental para la segregación de regiones en base a la textura era la diferencia en orientación o inclinación más que la diferencia en forma. Estos resultados son comprometedores para la explicación de una segregación en base al agrupamiento por semejanza, dado que, al menos conceptualmente, son más semejantes las formas cambiadas de orientación o inclinación que dos formas diferentes (T vs. L).

Los resultados de estudios posteriores (Beck, 1982, Beck, Prazdny y Rosenberg, 1983)) indicaron que la segregación de regiones en base a la textura se produce más fácil y rápidamente cuando los elementos que la forman difieren en orientación, tamaño o luminancia y menos rápidamente cuando difieren únicamente en forma.

FIGURA 6. 15. Estímulos uti lizados en los experimentos de Beck ( 1966), sobre segregación de regiones en base a la textura. {Adaptado de Beck, 1966). (Explicación

en el texto).


2.3.2. Teorías

Una aproximación algo diferente al estudio de la segregación de la textura es la de Bela Julesz quien trató de averiguar cuales eran los atributos o propiedades de los patrones texturados que permiten discriminar unas regiones de otras. Propuso una teoría, conocida como Teoría de los textones, en la que sugería que la segregación rápida y sin esfuerzo (automática) de la textura estaba determinada por una serie de características locales fundamentales, denominadas textones, a los que el sistema visual sería especialmente sensible Oulesz, 1981). Aunque la propuesta inicial del número de textones era más amplia, los resultados de distintas investigaciones han permitido acotar su número a los siguientes: a) los extremos de las líneas, b) las intersecciones de líneas y e) manchitas alargadas con una longitud, color y orientación determinados.

La segregación inmediata de la textura estaría determinada por dos factores: la diferencia en la naturaleza de los textones (diferencia de textones) y las diferencias en el número (densidad) de los textones en los patrones texturados (véase Figura 6.16). Posteriormente Julesz y Bergen (1983) desarrollaron un modelo en el que distinguen dos sistemas: a) un sistema preatencional, en el que la información se procesaría en paralelo, rápidamente y sin el concurso de la atención y que se correspondería con un procesamiento inicial y b) un sistema atencional, que se correspondería con una etapa de procesamiento más tardío, en el que la información se procesa en serie, más lentamente y requiere atención a determinadas características del patrón estimular. Los textones se-

~t¿"'~lL~/'I"'lL ~lL/'I/'I~Ll""l177'1 lL~/'1"' ¿]~[7""11'\: 7'11'\:lL~[7"J¿]~~ 7'17'1~lL"J[7~¿]t¿ lLlL/'11'\:~lLI'\:~lL ~lL"'/'IlL~/'11'\:lL l'\:71~lL711'\:lL~71 711'\:lL711'\:71~lLI'\:

A

Ulf1J2f1J5Ul2f1J5 5c5Ulo0110°5 11Jlil52°01 10 o2 252f1J01°oi0Ul 5 lil e: nJ ~ o 1 o o 111J Ul f1J 2 f1J ~ lil 2 f1J 5 525Lfllilf1J5lillJl nJLflS2211J5 tn JlJ 5Ul211J211J5Ul2

B

FIGURA 6.16. Segregación de regiones de textura a partir de diferencias en textones (en este caso, definidos por la presencia o no de terminaciones en los elementos que forman las regiones texturadas). En la parte (A) de la figura se puede percibir una figura cuadrada formada por formas cerradas que no presentan terminaciones (triángulos) rodeada por una región formada por elementos (flechas) que presentan tres terminaciones. En la parte (B), la segregación de la figura situada en la misma posición que en A es mucho más difícil porque los elementos que componen el patrón no presentan diferencias en textones. Fuente: Stanley Coren, Lawrence M. Ward & James T. Enns . Sensation and Perception. 1994. Toron-

to: Harcourt Broce College Publishers, Thomson lnternational, fig . 1 0.18.

PERCEPCIÓN DE LA FORMA l. ORGANIZACIÓN PERCEPTIVA

A

00000 00000 00000 Lilililili Lilililili

B

e.Aeo li .A.Ae oo .Aee OLi e.Aelili .A e .AfiO

e

.A006e O.A.Ae6 OA.Oe6 .AO.A6e .AO.Alie

251

FIGURA 6.17. Segregación de regiones texturadas en base a características simples {forma o color) o a la combinación de éstas. La segregación de la región

texturada es más difícil en C que en A y B.

rían los elementos básicos o primitivas perceptivas en el sistema preatencional que determina la segregación inmediata de la textura. El sistema preatencional detectaría diferencias locales en el número y naturaleza de los textones y en base a esto se produciría la segregación automática de la textura. Los patrones texturados que presenten propiedades diferentes a las que definen los textones serían ignorados por el sistema preatencional y únicamente se detectarían por medio de un examen detallado del patrón estimular y atención a determinadas características del mismo para poder percibir los límites de la texturas.

Sin embargo la teoría y el modelo propuestos por Julesz y Bergen no están exentos de problemas. Los resultados de investigaciones posteriores indican que todos los textones no son igualmente eficaces a la hora de determinar los límites que permiten la segregación de la textura. Por lo general, las diferencias en color tienen preponderancia sobre las diferencias en forma en la segregación de la textura (Enns, 1986). Por otra parte, aunque Julesz considera que las interacciones entre textones contribuirían a la segregación de la textura, los resultados de Treisman y Gelade (1980) revelan que la segregación de la textura es automática y sin esfuerzo cuando los elementos en las regiones de los patrones texturados difieren en una única dimensión (por ejemplo color o forma) pero no cuando difieren en una combinación de dimensiones (véase Figura 6.17). En este último caso se requiere un mayor escrutinio para que se puedan percibir los límites de la textura.

La teoría de los textones proporciona una forma de identificar y describir la naturaleza de los elementos discriminables que permitirían la segregación de la textura pero no explican en base a qué procesos o mecanismos se lleva a cabo la segregación de la textura. Algunos modelos desarrollados posteriormente establecen que los canales de frecuencia espacial desempeñan un papel


fundamental en la segregación de la textura (Caelli, 1985, 1993; Beck, 1987; Beck, Sutter & Ivry, 1987). Los resultados de los trabajos de Beck (1987), Su· tter, Beck y Graham (1990) constituyen evidencia que apoyaría este plantea· miento y sugieren que, en determinados patrones, la segregación de la textura estaría determinada por la respuesta de los canales de frecuencia espacial a las diferentes regiones texturadas del patrón estimular.

RESUMEN

En los capítulos dedicados a percepción de la forma se estudian una serie de mecanismos y procesos utilizados por el sistema visual para extraer, ínter· pretar y otorgar significado a la información sobre los objetos del entorno. Entre estos mecanismos, en el presente capítulo nos hemos centrado en la organización perceptiva, que facilita la extracción de regularidades presentes en los objetos naturales. Los psicólogos de la Gestalt desarrollaron una serie de principios en relación con los mecanismos básicos de la organización perceptiva: los procesos de segregación de la figura y el fondo y el agrupamiento de elementos estimulares discretos en unidades perceptivas más amplias. Los principios relacionados con la segregación de la figura y el fondo especifican que tenderán a percibirse como figura las áreas envueltas, simétricas, convexas, con orientación horizontal-vertical, las que presenten un menor tamaño y un contraste mayor con el contorno global. Por otra parte, los principios de agrupamiento perceptivo postulan que, manteniendo constantes el resto de los factores, tenderán agruparse los elementos estimulares que estén más próximos; compartan propiedades (forma, color, tamaño) y compartan dirección o movimiento. En la actualidad, los problemas señalados en el contexto de la Teoría de la Gestalt siguen considerándose importantes en el ámbito de la percepción, aunque la metodología utilizada en el estudio de la organización perceptiva ha sufrido importantes cambios.

Los desarrollos posteriores en el estudio de la segregación de la figura y el fondo, más que en la descripción fenomenológica, se ha centrado en el análisis de los mecanismos que los diferencian y en tratar de encontrar una explicación en términos de procesamiento de la información. Las investigaciones sobre las relaciones de los componentes de frecuencia espacial con la segregación de la figura y el fondo, asignación unilateral de bordes y la influencia de los procesos de reconocimiento en la segregación de la figura y el fondo, constituyen ejemplos de líneas de investigación actuales en este campo. Las investigaciones en relación con el agrupamiento perceptivo se han centrado en varios aspectos como la relación entre agrupamiento perceptivo y atención selectiva; la elaboración de medidas cuantitativas sobre los efectos del agrupamiento, y la identificación de estructuras perceptivas a partir de características simples mediante programas que permiten aplicar los principios de agrupamiento perceptivo.

Capítulo 7

PERCEPCIÓN DE LA FORMA 11. DETECCIÓN Y DISCRIMINACIÓN DE FORMAS VISUALES

1. DETECCIÓN DE FORMAS VISUALES

Como se ha señalado en el capítulo anterior, los procesos de detección permiten descubrir la presencia de objetos o propiedades de los estímulos en el entorno. Como procedimiento general en una tarea estándar de detección, se presenta a los observadores determinadas formas visuales (patrones formados por puntos, figuras geométricas, etc.) bajo condiciones de degradación que hacen que la tarea resulte difícil, y se les pide que indiquen la presencia o ausencia del objeto. Con el fin de incrementar la dificultad de la tarea, se utilizan diversos procedimientos que permiten degradar los estímulos presentados; por ejemplo, se reduce el tiempo de exposición de los estímulos, se reduce el contraste, se enmascaran los estímulos o se presentan formas visuales incompletas. La diferenciación del objeto en relación al contexto puede realizarse sobre la base de color, movimiento, forma, profundidad, etcétera.

En este capítulo nos centraremos exclusivamente en aspectos relacionados con las formas visuales, prescindiendo de otros aspectos como la detección de la energía (luminancia, etc.), que se examina en el capítulo dedicado a psicofísica. Como ejemplo para ilustrar la actuación de los procesos de detección hemos seleccionado la detección de formas visuales en un contexto de puntos aleatorios y la detección de la simetría. Un tema propio de este punto, la detección del contraste se ha examinado en el capítulo 3.


1.1. Detección de patrones de puntos

Una de las líneas de investigación dedicadas al estudio del proceso de detección de las formas visuales ha sido desarrollada por Uttal en sus investigaciones desde principios de los años 70 (Uttal, 1975, 1983, 1987, 1988).

1.1.1. Procedimiento de enmascaramiento visual

El procedimiento utilizado consiste básicamente en la presentación de estímulos (patrones visuales formados por puntos) a los que se superpone un patrón de ruido, también formado por puntos pero distribuidos aleatoriamente. Este procedimiento se conoce en Psicología como <<procedimiento de enmascaramiento visual>>. La superposición del patrón de ruido al patrón original enmascara el estímulo original degradándolo de tal forma, que la tarea de detección resulta muy difícil (véase Figura 7.1). Cuando se presenta el patrón o forma visual sin degradar (línea de puntos en la parte A de la Figura 7.1 ), el estímulo se detecta perfectamente, incluso cuando la duración de la exposición de los estímulos es muy breve. Cuando se presenta el patrón degradado (parte B de la Figura 7.1) resulta considerablemente más difícil detectar la línea recta de puntos presentada en el patrón original. El grado de degradación en el estímulo original, cuando se superpone una máscara, depende del número de elementos que componen la máscara. En la parte C de la Figura 7.1, se puede observar cómo el aumento en el número de puntos en el patrón de ruido que enmascara el patrón original, produce a su vez un aumento en la dificultad de detección del patrón.

El procedimiento desarrollado por Uttal, es particularmente adecuado para el estudio del efecto de la organización espacial de los elementos discretos que forman el patrón sobre la percepción de la forma visual ya que los

· 0 0·0 ·0·0 0·0 0·0 0 0 C· ·0 0 0 ·0 0·0·0·0;0·0·0·0·

0 · 0 ·0 0 0·0 o 0 ·0 0 0 ·0· ·0·0·~·0·0·0·0·0·0·0·0·0·

·•·•·•·•·•·•·•·• .... •· · 0·0 0 · 0 0·0·0 0·0·0·0 0· 0·0 ·0 0·0·0·0·0·0 0 0 ·0·

·0 0·0 · 0 0·0·0·0·0 0·0·0· ·0·0 0·0·0·0·0·0 0·0·0 0

A

·0·0·0·0·0·0·0·0 0·0·0·0· ·0·0·0·0·0 0 · 0 ·0· 0 ·0· 0·0· · 0 0·0·0 0 ·0 0 0·0 0·0 0· ·0·•·•·0 0···· 0·0·•·0·0· ·•·• •·•·•·• ·•·•·• ·•·•·•· · 0·0·0·•·0·0·0·• · 0·0·0·0·

0 · 0 · 0 · 0·0 · 0 ·0· 0 •0 >0•0 • 0• ·0·0·0 · 0·0·0·0·0·0·0·0·0 ·0·0·0·0·0·0·0·0·0·0·0·0

B

·0·0·0·0 0·0·0 0·0 0·0·0· ·0· 0 ·0·0·0 ·0·0 ·0 0 ·0· 0·0 ·

0 ·0·0· • ·0·0· • ·0· • ·0·0·0· •·0 · •·0·•·•·0 · • · •·0 • ·0·

·•·•·•·• ·•·• ·• •·•·• •·•· ·0·•·0·•·0·0·· •·• · 0·0·0 · -o·o·•·o · •·o 0-e-0 • •·o · 0·0·0·0·0 0·0 0·0 · 0 0·0·

· 0·0·0 · 0·0 0·0·0 0 ·0·0 ·0 ·

e

FIGURA 7.1. Ilustración del procedimiento de enmascaramiento visual en el estudio del proceso de detección de patrones formados por puntos. En A se representa una línea recta formada por puntos negros. En B y e se ha superpuesto al patrón original, un patrón de puntos distribuidos al azar (máscara). Obsérvese cómo la facilidad de detección de la línea recta disminuye cuando se superpone la máscara. Además, la disminución es mayor en e que en B, debido al mayor

número de puntos que forman la máscara.(Adaptado de Uttal, 1975) .

PERCEPCIÓN DE LA FORMA Il. DETECCIÓN Y DISCRIMINACIÓN 255

patrones de puntos pueden considerarse como formas no familiares. La lógica que subyace al procedimiento radica en la consideración de que los puntos aislados, o elementos locales de la estimulación, no aportan suficiente información para determinar la percepción de la forma visual. Únicamente a partir de una configuración de puntos, con una determinada organización espacial, se puede detectar una forma o patrón visual.

Además, no todas las configuraciones de puntos son igualmente apropiadas a la hora de detectar el patrón visual. Se ha constatado empíricamente, que algunas se detectan más fácilmente que otras cuando se mantienen constantes otros factores importantes como el número de puntos (densidad del patrón) o la distancia entre ellos (espaciamiento del patrón). Es decir, lo importante para la detección de las formas visuales es la geometría global de la configuración de puntos, mientras que las características locales son secundarias.

1.1.2. Factores que afectan a la detectabilidad de las formas visuales

El núcleo más importante de estudios sobre el proceso de detección se ha dedicado a determinar los factores que contribuyen a la detectabilidad de los patrones o formas visuales compuestos por puntos. Se estudiaron dos tipos de patrones: líneas y figuras geométricas. En la Figura 7.2 se presentan ejemplos de algunos estímulos y manipulaciones realizadas en los experimentos.

l. Por lo que respecta a las líneas de puntos (véase parte A de la Figura 7.2), se analizó el efecto del número de puntos sobre la detectabilidad del patrón. Los resultados indicaron que las líneas se detectaban mejor cuando el patrón estaba formado por un número determinado de puntos (cinco puntos). Se detectaba peor cuando estaba formado por menos puntos, y no se obtenía una mejora considerable en la detección cuando el patrón estaba formado por más de cinco puntos (Uttal, Bunnell & Corvin, 1970).

Otro de los factores considerados como variable independiente fue la orientación de las líneas. Se presentaron líneas compuestas por siete puntos en cuatro orientaciones diferentes: vertical, horizontal y oblicuas (inclinadas hacia la derecha y hacia la izquierda). No se encontraron diferencias en la detección de líneas en función de sus distintas orientaciones, por lo que los autores concluyeron que la detección es independiente de la orientación de los patrones (Uttal, 1975). También se examinó si la detección dependía del tipo de configuración de puntos (líneas rectas, curvas, etc.). Por lo general los resultados muestran que se detectan mejor las líneas rectas que las configuraciones que presentan curvatura o ángulos (Uttal, 1973a, 1975). Uttal sugiere que los resultados obtenidos se deben a la actuación de la regla de periodicidad lineal, según la cual, las líneas rectas formadas por puntos constituyen el estímulo más potente en la detección de formas visuales ya que el sistema visual es especialmente sensible a la detección de líneas rectas.


1 Factores que afectan a la detectabilidad de patrones de puntos 1

0 EJEJEJ[J ... ... .. . . .

EJEJDD . . . . . . . . . . . . .. .. . . . .

..... EJDD ~ . . . . . . .. . . . . . . . . . . . . . . . . . . . . . . ...... . . . . . ... @] . . . ..... :····· . . . .. . . . . . . . . . . . . . . . . . . . . . . . . . . . . ..... . . . . . ...... . ..... @] . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

FIGURA 7.2. Ejemplos de estímulos y manipu laciones experimentales en las investigaciones de Uttal. En A se presentan ejemplos de las variables número de puntos y tipo de configuración {recta, curvilínea y angular); en B, de la eliminación de puntos en los ángulos, lados y a leatoriamente en distintas partes de la figura, en C, de la variable orientación y en D, del grado de organización de los patrones.

{Adaptado de Uttal, 1975).

2. Entre los factores que pueden afectar a la detectabilidad de las figuras geométricas (polígonos formados por puntos, véase parte B de la Figura 7.2) se han estudiado los siguientes: a) partes fundamentales en la detección de los polígonos. Para analizar este problema se produjo una distorsión en distintas partes de un triángulo mediante la eliminación de puntos en los lados, ángulos o se eliminaron algunos puntos aleatoriamente en la figura completa (véase Figura 7.2.B) y se examinó en qué condición de las tres citadas se detectaba mejor el triángulo. Los resultados mostraron que la eliminación de puntos en los ángulos del triángulo empeoraba ligeramente la detección del patrón; además el empeoramiento era más drástico cuando se distorsionaban los lados del triángulo eliminando puntos en los lados. Este resultado podría deberse a que la distorsión de los lados afecta a la geometría global del patrón dificultando su detección (Uttal, 1971).

b) Al igual que en la detección de líneas de puntos, otro de los factores examinados fue el efecto de la orientación de las figuras sobre la detectabili-

PERCEPCIÓN DE LA FORMA II. DETECCIÓN Y DISCRIMINACIÓN 257

dad. Para comprobar si este factor era importante en la detección de figuras geométricas se realizaron experimentos con estímulos similares a los presentados en la Figura 7.2.C. Los resultados indicaron que la detección es independiente de la orientación de las figuras, por lo que este factor no parece tener relevancia en la detección de patrones visuales formados por puntos en general.

e) Finalmente, una serie de estudios han tratado de determinar el efecto de la organización global del patrón sobre la detección. La organización del patrón es importante porque afecta directamente a la geometría global de las formas visuales. Los resultados indican que la detección de los patrones formados por puntos es afectada por la organización de la figura, se detectan mejor las formas regulares (cuadrados) que las irregulares (paralelogramos); así como por el grado de organización del patrón, se detectan más fácilmente los patrones más organizados que los menos organizados (véase Figura 7.2.0).

1.2. Detección de la simetría

Antes de examinar la detección de la simetría describiremos brevemente qué es un patrón simétrico. El término patrón simétrico hace referencia a la invarianza de una configuración de elementos bajo determinadas transformaciones. La categoría de patrones simétricos en geometría es amplia t Sin embargo aquí nos centraremos exclusivamente en aquellos tipos de simetría relevantes en el estudio de la percepción: a) patrones simétricos generados por medio de la transformación de reflejo o simetría bilateral, b) patrones simétricos generados por la transformación de traslación o simetría traslacional; e) patrones simétricos generados por cambio en la orientación o simetría rotacional (véase Figura 7.3). A continuación se examinan los tipos de patrones simétricos y procedimientos experimentales más utilizados en el estudio de la detección de la simetría.

1.2.1. Patrones estimulares y procedimientos experimentales

La detección de la simetría ha preocupado a los investigadores desde los inicios de la Psicología Experimental. En el tratado de E. Mach << El análisis de las sensaciones>> publicado en 1906, ya encontramos una descripción de los distintos tipos de simetría y observaciones relacionadas con la detección de los mismos. En la Figura 7.3, se presentan los distintos tipos de patrones simétricos descritos por Mach, generados por transformaciones de reflejo, traslación y cambio en la orientación del patrón original. Arriba aparece un objeto. En A, el reflejo en espejo del objeto original sobre un eje vertical genera simetría bilateral o simetría en espejo. En B, la repetición del objeto original

l. Para un análisis en profundidad de la simetría en general, véase Weyl (1951).


A B e

pppp

FIGURA 7.3. Estímulos originales de E. Mach para ilustrar los distintos tipos de simetría. En A se presenta un ejemplo de simetría bilateral (simetría en espejo); en B, simetría traslacional (repetición y desplazamiento del patrón original); en C, simetría rotacional (cambio en la orientación del patrón original. (Adaptado de Mach, 1906) . En la parte inferior se presentan motivos ornamentales que ilustran

los mismos tipos de simetría.

produce simetría traslacional (generada por traslación del objeto original). Y por último en C, el objeto original se presenta en una orientación diferente, generando simetría rotacional. En la parte inferior se presentan los mismos tipos de simetría en un patrón ornamental.

Mach también observó que los diferentes tipos de simetría se detectan de diferente forma, resultando más fácil la detección de la simetría bilateral que la obtenida por traslación o rotación de los patrones originales. En la misma línea, Julesz (1971) observó que la simetría bilateral se detectaba automáticamente y sin esfuerzo, mientras que la detección de la simetría en patrones generados por traslación o rotación requería un escrutinio detallado de los patrones.

Posteriormente, en diversos estudios experimentales se ha tratado de determinar qué tipo de simetría es más saliente. En estos estudios generalmente se utilizan como estímulos patrones simétricos formados por elementos discretos (puntos, líneas, etc.) o figuras geométricas que difieren en el tipo de simetría que presentan y el procedimiento experimental consiste en presentar los estímulos durante un periodo de exposición breve (generalmente menos de 160 milisegundos) y medir el tiempo empleado en detectarlos.

Por lo general, los resultados confirman que la simetría bilateral se detecta más rápidamente que la simetría obtenida por rotación (Palmer & Hemenway, 1978; Royer, 1981) o por traslación (Corballis & Roldan, 1974;


Baylis & Driver, 1994, 1995). Algunos autores sugieren como posible explicación al mayor relieve de la simetría bilateral la posibilidad de comparar las dos regiones contiguas al eje de simetría. El hecho de que la simetría bilateral sea más saliente y se detecte más rápidamente, no significa que los otros tipos de simetría no se detecten. No obstante, la mayoría de los estudios sobre detección de la simetría se han centrado en la simetría bilateral, por lo que, en este apartado examinaremos únicamente este aspecto.

En los estudios sobre detección de la simetría bilateral se han utilizado estímulos muy variados, desde patrones no familiares como figuras, polígonos y patrones texturados aleatorios hasta patrones muy familiares como caras o figuras subrayadas. En la Figura 7.4 se presentan algunos ejemplos.

D[ZSJD .. . . . . . . .

: . . . .. : A B

lXXI o

. . ·... "

... F

E

. . . .

e

FIGURA 7.4. Ejemplos de estímulos utilizados en los estudios sobre detección de la simetría.

Por lo que respecta a los procedimientos experimentales se han utilizado también una gran variedad de ellos (Tyler, 2002), entre los más utilizados se encuentran: a) procedimientos psicofísicos, como el procedimiento de determinación del umbral de duración de detección de la simetría en el que se determina el tiempo mínimo necesario para detectar la simetría o la tarea de de determinación del umbral de contraste, en el que se determina el contraste mínimo necesario para detectar la simetría; tareas de tiempo de reacción, en las que se mide el tiempo empleado en la detección; tareas de precisión en


las que se observa el porcentaje de detecciones correctas; tareas de discriminación de la orientación, en las que se mide la precisión en la detección del eje de simetría y tareas de discriminación de patrones simétricos, en las que se degrada el patrón superponiendo ruido (es un procedimiento similar al de enmascaramiento visual que se ha descrito en el apartado de detección de puntos aleatorios).

1.2.2. Factores que influyen en la detección de la simetría

a) Un factor que puede afectar a la detección de la simetría es la posición que ocupa el patrón en el campo visual. Un aspecto considerado en relación con este factor es la presentación central o periférica del patrón, es decir, que la posición del patrón coincida o no con el punto de fijación. Los resultados de los estudios que han examinado este aspecto indican que la influencia de la posición central del patrón sobre la detección de la simetría depende del tipo de estímulo utilizado. Cuando se utilizan estímulos simples como las figuras aleatorias presentadas en la Figura 7.4 que contienen frecuencias espaciales bajas, la detección de la simetría no se ve afectada por la posición central del patrón en el campo visual. Por el contrario, cuando se presentan estímulos complejos, como patrones texturados (Véase Figura 7.4) que contienen frecuencias espaciales altas, la detección de la simetría se ve facilitada por la posición central del patrón y deteriorada a medida que se aleja desde esta ubicación hacia posiciones más periféricas. A partir de lo anterior, Julesz (1971) sugirió la intervención de dos mecanismos diferentes en la detección de la simetría: un mecanismo que extraería globalmente las relaciones simétricas existentes en el patrón cuando los estímulos contienen frecuencias espaciales bajas y un mecanismo de comparación punto por punto de todos los elementos del patrón cuando los estímulos contienen frecuencias espaciales altas.

b) Una forma distinta de analizar la actuación del mecanismo de detección ha consistido en observar si existen diferencias en la detección de patrones perfectamente simétricos con respecto a patrones que presentan ligeras distorsiones. En este tipo de estudios se suele presentar a los observadores tres tipos de patrones: patrones perfectamente simétricos, patrones con una ligerísima distorsión de la simetría y patrones aleatorios (no simétricos) que se presentan como distractores y los observadores tienen que detectar los patrones simétricos y no simétricos (algunos ejemplos, se presentan en la Figura 7.4). Los resultados de Barlow y Reeves (1979) utilizando este procedimiento muestran que el mecanismo de detección de la simetría es muy potente ya que se pueden detectar distorsiones mínimas en los patrones. Wagemans y cols. (1992) observaron el efecto sobre la detección de una distorsión en el patrón simétrico producida por la observación del patrón desde un punto de vista no frontal como el que se puede observar la Figura 7.4.F. Los resultados obtenidos utilizando este procedimiento mostraron que el tiempo de reacción

PERCEPCIÓN DE LA FORMA !T. DETEC CIÓN Y DISCRIMINACIÓN 261

en la tarea de detección de patrones simétricos aumentaba a medida que la distorsión en el patrón era mayor.

e) La detección de la simetría también puede ser afectada por el agrupamiento perceptivo de los elementos estimulares que componen el patrón. La evidencia empírica que apoya esta afirmación procede de estudios en los que se han utilizado como estímulos patrones similares a los presentados en la Figura 7.5.

En la parte superior de la Figura 7.5, se presentan dos patrones simétricos (A y B) formados por líneas orientadas y un patrón simétrico formado por puntos (C). En la parte inferior, se presenta un patrón no simétrico (D) semejante a los anteriores pero en el que se ha producido una distorsión de la simetría desplazando algunos elementos estimulares y un patrón aleatorio no simétrico (E).

Con el fin de examinar la influencia del agrupamiento perceptivo sobre la detección de la simetría, Locher y Wagemans (1993) utilizaron patrones similares a los presentados en la Figura 7.5, formados por líneas en distintas orientaciones (vertical, horizontal y oblicuas) o compuestos por puntos. En este tipo de patrones, la orientación de las líneas contribuye a determinar la organización del patrón global; en las figuras formadas por líneas, se percibiría un patrón global simétrico orientado verticalmente y otro orientado horizontalmente. Sin embargo, en el patrón formado por puntos, se percibiría agrupamiento pero no se percibiría un patrón orientado ya que los puntos, al carecer de orientación, no determinan que se perciba una orientación clara del patrón global. El planteamiento del estudio era que si la orientación de las líneas (elementos estimulares) contribuía a la detección de la simetría en el patrón global, la ejecución en la tarea de detección de la simetría (tiempo de

A

1 1 11 11

111 111 1 1

11 1 111 11 11

1 1

D

B

-- - -

- - ---- -- - - -

E

e

• • • • • • • • • • • • • • • • • • • • • • • • • • • • • • • • •

FIGURA 7.5. Ejemplos de estímulos utilizados en los estudios sobre el efecto del agrupamiento en la detección de la simetría.


detección y precisión) sería mejor en los patrones formados por líneas que en los formados por puntos. Por el contrario, si el mecanismo de detección de la simetría actuaba sobre la base de la comparación de la información del patrón agrupada espacialmente, no habría diferencias entre los patrones agrupados formados por líneas o por puntos. Los resultados indicaron que la ejecución en la tarea de detección de la simetría se veía facilitada cuando los los elementos estimulares que formaban los patrones se agrupaban espacialmente, con independencia de que fueran líneas orientadas o puntos.

d) Finalmente, examinaremos el factor más estudiado en relación con la detección de la simetría: la orientación del eje de simetría. Como hemos señalado al principio de este apartado, la observación de que la simetría reflejada sobre el eje vertical es más potente se debe a E. Mach. El primer estudio experimental dedicado a analizar la influencia de la orientación del eje de simetría sobre la detección de la misma se debe a Goldmeier (1937). En sus experimentos se presentaba a los observadores un patrón estimular con simetría bilateral horizontal y vertical. A continuación se presentaban dos estímulos de prueba, uno de ellos presentaba simetría sobre el eje vertical, el segundo era simétrico sobre el eje horizontal. La tarea de los observadores consistía en indicar cuál de los dos estímulos de prueba se parecía más al patrón presentado en primer lugar. Los resultados indicaron que los observadores elegían el patrón de prueba que presentaba simetría a partir del eje vertical.

En otra serie de experimentos se ha comparado la detección de la simetría bilateral sobre el eje vertical con simetría bilateral sobre los ejes horizontal y oblicuos. Un ejemplo representativo de este tipo de experimentos es el realizado por Palmer y Hemenway (1978). El objetivo de su investigación consistía en analizar el efecto de la presentación de figuras con diversos grados de simetría en varias orientaciones diferentes. Los patrones estimulares presentados diferían en dos variables: grado de simetría y orientación (Véase Figura 7.6). Con respecto al grado de simetría se presentaron patrones que presentaban: a) simetría sobre un único eje (vertical, horizontal u oblicuo), b) simetría doble (sobre dos ejes), e) simetría cuádruple (sobre cuatro ejes) y figuras casi simétricas. Con relación a la orientación, los patrones se presentaban en una orientación: a) vertical (0°), horizontal (90°) y oblicuas (45° y -45°). La tarea de los observadores consistía en presionar una llave de respuesta si el patrón presentado les parecía simétrico y otra distinta si les parecía asimétrico. Los resultados revelaron que la simetría se detectaba mejor cuando los patrones presentaban una orientación vertical, en segundo lugar en la orientación horizontal y por último en las orientaciones oblicuas. Por otra parte, también se manifestó un claro efecto de los grados de simetría detectándose mejor los patrones con mayor grado de simetría. En la misma línea, los resultados obtenidos por Barlow & Reeves, 1975; Royer, 1981; Wagemans, Van Gool y d'Ydewalle, 1992 y Wenderoth, 1994, 1997, confirman la prioridad de detección de la simetría reflejada sobre el eje vertical.


0' 90' 45' - 45'

A

B {}

FIGURA 7.6. Estímulos que presentan distintos grados de simetría en distintas orientaciones (vertical 0°), horizontal (90°) y oblicuas ( 45° y -45°). En A. los estímulos presentan simetría bilateral (sobre un único eje); en B, simetría doble (sobre dos ejes);

en C. simetría cuádruple (sobre cuatro ejes). (De Luna, 1987).

A raíz, de los resultados que ponen de manifiesto la primacía de la simetría bilateral, se han propuesto varios modelos que intentan explicar los resultados obtenidos en los experimentos sobre detección de la simetría. Palmer y Hemenway (1978) propusieron un modelo de un proceso que actuaría en dos etapas. En la primera etapa, se realizaría un análisis tosco y se seleccionaría un posible eje de simetría sobre el cual se refleja el patrón. En una segunda etapa, se compararían las dos mitades del patrón y, con fundamento en esta comparación, se determinaría si el patrón es o no simétrico.

Jenkins (1983) propuso que la detección de la simetría se llevaría a cabo mediante tres procesos: el primero de ellos detecta si la orientación del patrón es uniforme; el segundo proceso agrupa los elementos que forman el patrón alrededor del eje, formando de esta manera una estructura más amplia, por último el tercer proceso determina si la estructura obtenida en el proceso anterior es simétrica. El problema que subyace a los dos modelos citados es que ambos pueden considerarse más bien como estrategias a utilizar por los sujetos ante determinadas tareas utilizadas en experimentos concretos que como teorías que expliquen la detección de la simetría bilateral en general.

2. DISCRIMINACIÓN DE FORMAS VISUALES

Al principio del capítulo anterior hemos señalado que los procesos de discriminación permiten establecer una diferenciación entre objetos o formas visuales. Son procesos más complejos que los de detección analizados en el apartado


anterior. Para advertir las diferencias o semejanzas entre dos o más objetos es necesario, en primer lugar, detectarlos y, a continuación establecer una comparación entre los mismos basada en alguna propiedad de los objetos.

Con el fin de ejemplificar la dinámica de estos procesos consideremos brevemente una tarea sencilla de discriminación, la tarea denominada igual-diferente. En este tipo de tareas se presenta a los observadores dos objetos y se les pide que indiquen, bien verbalmente o presionando una llave de respuestas, si los objetos presentados son iguales o diferentes. Para poder realizar esta tarea con eficacia, los observadores tienen que detectar los objetos presentados, realizar una comparación entre los estímulos con la finalidad de determinar si presentan alguna propiedad que los diferencia o no y, por último, emitir un juicio de diferencia o igualdad.

Vemos pues, que incluso en una tarea tan simple varios procesos interactúan con el de discriminación para producir una respuesta. El proceso de detección asegura que se perciban los estímulos; si éstos no se perciben no se podría realizar una discriminación. Una vez percibidos los objetos, el proceso de discriminación permite que los objetos puedan diferenciarse sobre la base de la presencia de determinadas propiedades. Además, para realizar la comparación entre los estímulos se requiere que la información sobre los objetos se almacene durante un periodo breve de tiempo. Finalmente, los observadores tienen que emitir un juicio sobre la igualdad o desigualdad de los estímulo presentados, en los que interviene un proceso de decisión.

El punto central para llevar a cabo la discriminación, es la percepción de las propiedades de los estímulos que permiten establecer una diferencia o una semejanza entre los mismos. Por esta razón, la mayoría de las investigaciones sobre discriminación de objetos o formas visuales se han centrado en la identificación de las propiedades que son relevantes para la diferenciación. A continuación examinaremos algunos de los acercamientos a este problema.

2.1. Propiedades componentes y globales de los estímulos

Al describir los procesos de discriminación veíamos que una característica fundamental de estos procesos era la percepción de las propiedades estimulares que contribuyen a la diferenciación de objetos y formas visuales. En este apartado vamos a considerar algunas de estas propiedades y su contribución a la discriminación. Examinaremos en primer lugar la teoría de Garner sobre las propiedades de estímulo y, en segundo lugar, dos líneas de investigación desarrolladas a partir de esta teoría que han tenido una repercusión en el estudio de las propiedades que regulan la discriminabilidad de los estímulos.

Garner (1974, 1978a) desarrolló una teoría descriptiva de las propiedades estimulares en la que distingue entre propiedades componentes y propiedades globales de los estímulos. Las propiedades componentes constituyen los atributos del estímulo y son fundamentalmente dimensiones y características. Dimensiones son aquellas propiedades del estímulo que se presentan siempre


con un nivel positivo. Además, los niveles de una dimensión deben cumplir el requisito de ser mutuamente excluyentes. Es decir, se dan en un grado o en otro, y ese grado o nivel es lo que define la dimensión en un estímulo determinado. Por ejemplo, en la Figura 7.7 se presenta un conjunto de estímulos formados a partir de la combinación de dos dimensiones: forma y tamaño. La dimensión forma presenta dos niveles: círculo y cuadrado. La dimensión tamaño presenta también dos niveles: grande y pequeño. Un estímulo específico se define sobre la base de la presencia de determinados niveles en cada dimensión, por ejemplo, cuadrado grande o círculo pequeño. Los niveles que definen los estímulos son mutuamente excluyentes, un estímulo específico no puede ser a la vez grande y pequeño ni círculo y cuadrado.

1 DIMENSIONES 1 1 CARACTERÍSTICAS 1

D o D o

IL l J • TCFE • • FIGURA 7.7. Ilustración de las propiedades componentes de los estímulos. En la parte izquierda se representa un conjunto de estímulos generado a partir de la combinación de dos dimensiones: forma y tamaño, que a su vez difieren en color del conjunto presentado en la parte inferior. En la parte derecha se representa un

conjunto de estímulos generado a partir de características.

Características son las propiedades componentes que se dan en un único nivel en los estímulos (es decir se dan o no se dan). Por ejemplo, en la Figura 7. 7, se presenta una serie de estímulos formados por una línea vertical a la que se le ha añadido la característica (línea horizontal) en el extremo superior, inferior, o en ambos. Las diferencias más importantes entre dimensiones y características se refieren a la presencia de niveles, las dimensiones poseen niveles, mientras que las características no los poseen; y a la posibilidad de eliminar o no alguno de estos elementos componentes sin que el estímulo global quede afectado, la eliminación de una dimensión como la forma o el tamaño tendría como consecuencia la eliminación del estímulo, mientras que la eliminación de una característica no implica la eliminación del estímulo.


Las propiedades globales se refieren a la figura como un todo y son todos simples (estímulos en los que se describen todos sus componentes), plantillas (prototipos)) y propiedades configuracionales (estímulos definidos por las relaciones espaciales entre las propiedades componentes que da lugar al surgimiento de propiedades emergentes). De las propiedades globales examinaremos únicamente las configuracionales, por ser las que se han estudiado en relación con el proceso de discriminación de formas visuales.

Las propiedades componentes y configuracionales están presentes al mismo tiempo en el estímulo. Por ejemplo, en la parte superior de la Figura 7.8 se presenta a la izquierda cuatro líneas con distintas orientaciones (horizontal, vertical y oblicuas). A la derecha se presentan cuatro figuras (cuadrado, rombo, cruz y aspa) que se han generado a partir de una serie de combinaciones de las líneas anteriores. Las líneas que forman las figuras son las propiedades componentes del estímulo, las relaciones espaciales entre las propiedades componentes (simetría, repetición de líneas, paralelismo, intersección, cierre), que determinan el que las figuras se configuren de una determinada manera son las propiedades configuracionales. Ambos tipos de propiedades

Propiedades componentes y configuracionales

1 D + --/ () X """ Efecto de superioridad del objeto

--

/""" --

~~ -- ---- --

/1

111 "''111 A B e

Efecto de superioridad configuracional

/ ""' V~ /1 ~

""" ""' "':]~ ~ ~

A B e

FIGURA 7.8. Ilustración de las propiedades componentes y configuracionales de los estímulos (parte superior). Ejemplo de estímulos utilizados en el estudio del efecto de superioridad del objeto (parte intermedia) y efecto de superioridad configu-

racional (parte inferior).


pueden contribuir a la discriminabilidad de las figuras presentadas en la parte derecha, como veremos más adelante.

La simple descripción de las propiedades de los estímulos no nos proporciona información sobre los procesos de discriminación ni sobre la contribución de las distintas propiedades a la diferenciación de formas u objetos visuales. Para conocer esto examinaremos dos líneas de investigación encaminadas a analizar qué papel desempeñan las propiedades del estímulo en el proceso de discriminación. El estudio de las propiedades de los estímulos relevantes para determinar su discriminabilidad se ha centrado principalmente en dos aspectos: 1) el análisis de las interacciones entre las propiedades componentes (dimensiones del estímulo) y 2) el examen de qué tipo de propiedades (componentes o configuracionales) domina el proceso de discriminación.

2.1.1. Relaciones entre dimensiones estimulares

El estudio de las relaciones entre las dimensiones del estímulo se ha centrado en el análisis de la forma en que se combinan determinadas dimensiones físicas. Shepard (1964) advirtió que algunas dimensiones físicas del estímulo se combinan de tal manera, que no es posible percibirlas por separado, es decir, tienden a percibirse como una unidad. Un ejemplo representativo de estas dimensiones serían la saturación, la claridad y el matiz que se perciben como un color único. Además el cambio en una de estas dimensiones produciría un cambio cualitativo en el estímulo que daría lugar a la percepción de un color distinto al original. Por el contrario, otras dimensiones diferentes, como la forma y el tamaño de una figura geométrica cualquiera, se combinan de tal manera que se pueden percibir y analizar como dimensiones separadas de ese estímulo aunque las dos dimensiones contribuyan conjuntamente a la definición de ese estímulo específico. Garner (1974, 1978b, 1983) denominó a estas interacciones, integral y separable respectivamente. También identificó un tercer tipo de interacción, que denominó configuracional, cuando las dimensiones físicas se combinan de forma que se sigue percibiendo la identidad de las dimensiones originales pero, a partir de su combinación, surgen propiedades cualitativamente diferentes a las de las dimensiones originales; por ejemplo, la altura y anchura de un rectángulo se combinan dando lugar a áreas y formas. La importancia del estudio de las relaciones entre dimensiones para la discriminación de formas visuales radica en que dichas relaciones pueden influir en la semejanza percibida de los estímulos y, por lo tanto, afectar de manera diferencial a la discriminabilidad.

El procedimiento empleado para analizar las relaciones entre distintas dimensiones consiste en comparar la ejecución, en diversas condiciones experimentales y establecer un diagnóstico a partir de la ejecución en las mismas. En los experimentos, generalmente se presentan subconjuntos de cuatro estímulos formados por dos dimensiones y se proporciona instrucciones a los ob-

268

1 CONDICIONES EXPERIMENTALES 1

11 CONTROL!

PERCEPCIÓN VISUAL

1.1. DiscriminaCIÓn en base a la forma 1.2.Discriminaciónenbasealtamaño

[BJ r~2-. VA- R-IAC-,16-N -CO-RR- ELA- C- 10-NA-D-,A 1

13. VARIACIÓN ORTOGONAL 1

3 .1. Discriminación en base a la forma

3.2. Discriminaciónenbaseal tamar'io

FIGURA 7.9. Ejemplos de condiciones experimentales utilizadas en los estudios sobre relaciones entre dimensiones estimulares.

servadores para que los clasifiquen de forma distinta en diversas condiciones experimentales (véase Figura 7.9).

En la Figura 7.9, se presenta en la parte superior, un conjunto de cuatro estímulos formados por dos dimensiones: forma y tamaño. Cada una de las dimensiones presenta dos valores; círculo y cuadrado en la dimensión forma y grande y pequeño en la dimensión tamaño. Por lo tanto cada estímulo específico se puede definir a partir de los niveles de cada dimensión que presenta. El estímulo 1, está definido por el nivel círculo de la dimensión forma y el nivel pequeño de la dimensión tamaño, el estímulo 2, por los niveles cuadrado y pequeño, el estímulo 3 por los niveles círculo y grande, y el estímulo 4


por los niveles cuadrado y grande. La tarea de los observadores consiste en clasificar cada estímulo individual, presionando una llave de respuestas. La variable dependiente es la latencia. Igualmente, en la Figura 7.9, se presentan ejemplos de las distintas clasificaciones que deben realizar los observadores en las diversas condiciones experimentales. Los números indican el estímulo específico que se puede presentar en un ensayo determinado. En A y B, indican el subconjunto o conjunto de estímulos que se pueden presentar en cada bloque de ensayos, dependiendo de la condición experimental (control, variación correlacionada, variación ortogonal) y del tipo de discriminación que se requiera (discriminación basada en la forma, el tamaño o a ambos).

En la condición de control, se presentan dos estímulos en cada bloque de ensayos y el observador debe clasificar cada estímulo específico presentado en cada ensayo en grupos distintos, de acuerdo con las instrucciones que se le proporcionan, por ejemplo, en el caso l. l. presionando la llave de respuestas representada como A en la Figura) cuando se presenta el estímulo 1 y otra distinta (representada como B) cuando se presenta el estímulo 2. Los estímulos presentados en esta condición varían únicamente en un nivel de una dimensión, mientras que la otra dimensión permanece constante, por lo que la ejecución en esta condición se considera como línea de base con la cual se compara la ejecución en las otras condiciones. En la parte l. l. de la Figura se presenta un ejemplo de clasificación basada en los dos niveles de la dimensión forma, manteniendo constante el tamaño. En la parte superior se presenta un bloque de ensayos en el que se varía la forma y se mantiene constante el tamaño pequeño; y la en la parte inferior, un bloque de ensayos en el que se varía la forma y se mantiene constante el tamaño grande. En ambos casos, los observadores deben presionar una llave de respuestas cuando se presenta el círculo y otra distinta cuando se presenta el cuadrado. En 1.2. se presentan ejemplos de clasificación basados en el tamaño, manteniendo constante la forma.

En la condición de variación correlacionada, se presentan igualmente dos estímulo en cada bloque de ensayos. A diferencia de los estímulos presentados en la condición de control, en esta condición las dos dimensiones varían de forma relacionada. En 2 la parte izquierda, se requiere discriminar un círculo pequeño de un cuadrado grande; en la parte derecha, se requiere discriminar un cuadrado pequeño de un círculo grande. La clasificación individual de cada estímulo específico en cada uno de los bloques de ensayos representados en las partes derecha e izquierda, puede realizarse a partir de la forma, al tamaño o a ambos. Si la latencia en esta condición es menor que en la condición de control, o en la de variación ortogonal, se dice que se ha producido una ganancia debida a la redundancia, es decir, al hecho de que las dos dimensiones varíen en la misma dirección.

Finalmente, en la condición de variación ortogonal, a diferencia, de las anteriores, se presentan los cuatro estímulos en cada bloque de ensayos y las dos dimensiones varían de forma independiente. En 3.1, la discriminación se realizaría a partir de la forma, y el tamaño varía. En este caso, los observa-


dores tendrían que presionar la misma llave de respuestas cuando el estímulo que se presenta en cada ensayo es círculo, ya sea grande o pequeño (estímulos 1 y 3 ), y una llave distinta cuando se presenta un cuadrado grande o pequeño (estímulos 2 y 4). Cuando la discriminación se realiza con base en el tamaño como se indica en 3.2, los observadores tendrían que responder con una llave cuando el estímulo presentado en un ensayo determinado tiene un tamaño pequeño, ya sea círculo o cuadrado (estímulos 1 y 2) y con una llave distinta cuando el tamaño del estímulo es grande (estímulos 3 y 4 ). Para realizar la tarea con eficacia en esta condición, los observadores deben atender exclusivamente a la dimensión relevante para realizar la discriminación ignorando la dimensión irrelevante. Por ejemplo, si se indica en las instrucciones que se discriminen los estímulos a partir de la forma, los observadores deben atender exclusivamente a la forma e ignorar el tamaño de los estímulos. Si la latencia en esta condición es mayor que en la condición de control o en la de variación correlacionada, se dice que se ha producido una interferencia de la dimensión irrelevante en el procesamiento de la dimensión relevante.

El diagnóstico para considerar las dimensiones como integrales o separables, se establece a partir de los resultados en estas condiciones experimentales (la ejecución se mide en tiempo empleado al realizar las tareas). Las dimensiones se consideran separables cuando en las condiciones de control, variación correlacionada y variación ortogonal se presentan latencias similares. Estos resultados indicarían que es posible la atención selectiva a cada una de las dimensiones por separado, sin que la variación en la otra dimensión interfiera en la ejecución. Las dimensiones se consideran integrales cuando en la condición de variación correlacionada se presentan latencias más cortas que en la condición de control, y en la condición de control latencias más cortas que en la de variación ortogonal (Garner, 1974, 1976, 1983; Pomerantz et al. 1989).

Basándose en la evidencia empírica obtenida utilizando distintas dimensiones y en modalidades sensoriales diferentes (para una revisión véase Treisman, 1986; Pomerantz y Lockhead, 1992), algunos autores proponen que los estímulos separables se procesarían analíticamente a partir de sus dimensiones, mientras que los integrales se procesarían como un todo unitario sobre la base de su semejanza global y sólo posteriormente se analizarían sus dimensiones componentes (Garner, 1974; Kemler-Nelson, 1993). Esto implica que en el primer caso la diferenciación perceptiva entre las dimensiones es posible y en el segundo caso no. Esta afirmación ha sido cuestionada posteriormente. Aunque no entraremos aquí en la polémica teórica sobre la dicotomía procesamiento global/analítico2, si creemos conveniente señalar una matización que es importante para el proceso de discriminación de la forma. Melara (1992) y Melara, Marks y Potts (1993b) señalan que el hecho de que diferentes dimensiones presenten una semejanza, bien sea en la percepción o

2 . Un tratamiento actual de este problema se presenta en Hummel (2003).

PERCEPCIÓN DE LA FORMA TI. DETECCIÓN Y DISCRIMINACIÓN 271

incluso en determinados modos de respuesta, no implica que no se puedan diferenciar entre sí. Los resultados de sus experimentos indican que presentando estímulos muy similares que sólo diferían mínimamente en una de las dos dimensiones que interactuaban, por ejemplo, saturación y brillo, los observadores eran capaces de identificar la dimensión que había sido cambiada. Por lo tanto, el que se perciba semejanza entre dimensiones no excluye que se puedan percibir también sus diferencias Melara y Day (1992).

2.1.2. Contribución de las propiedades componentes y configuracionales en la discriminación

La segunda línea de investigación ha tenido como principal objetivo el estudio de la influencia de las propiedades componentes y configuracionales de los estímulos sobre la discriminación de formas visuales. Como ejemplos de esta línea de investigación examinaremos el análisis de la contribución relativa de las propiedades estimulares en la discriminación de las formas visuales, y los efectos de superioridad configuracional y del objeto.

a) Con el fin de analizar qué tipo de propiedades estimulares es más importante para la discriminación de las formas visuales Kimchi (1994) diseñó los estímulos utilizados en la parte superior de la Figura 7.8. En un primer experimento se presentaron las líneas representadas en la parte superior izquierda de la Figura 7.8 que difieren exclusivamente en su orientación (vertical, horizontal y oblicuas). La tarea consistía en discriminar la orientación de las líneas. Las líneas se presentaban por pares, de modo que a lo largo del experimento aparecían todas las posibles combinaciones dos a dos de estas cuatro orientaciones. Los resultados mostraron que la discriminación entre líneas que presentaban orientaciones vertical y horizontal era más fácil que cuando presentaban orientaciones oblicuas.

En un segundo experimento se presentaron los estímulos situados en la parte superior derecha de la Figura 7.8. Estos estímulos se generaron a partir de la combinación de las líneas presentadas a la izquierda lo que permitía manipular las propiedades componentes y configuracionales de los estímulos. Por ejemplo, el cuadrado y el rombo presentan propiedades componentes distintas (la orientación vertical-horizontal de las líneas en el cuadrado vs. las oblicuas en el rombo) pero presentan la misma propiedad configuracional de cierre. Por el contrario, el cuadrado y la cruz presentan idénticas propiedades componentes (orientaciones horizontales y verticales en ambos casos) y distintas propiedades configuracionales (cierre en el cuadrado e intersección en la cruz). La tarea era idéntica a la del experimento anterior y los sujetos tenían que discriminar todas las posibles combinaciones de las cuatro figuras (cuadrado vs. rombo, cuadrado vs. cruz, etc.). Los resultados mostraron que los estímulos que mejor se discriminaban eran los que presentaban propiedades configuracionales distintas y esto con independencia de que las propiedades

2 7 2 PERCEPCIÓN VISUAL

componentes de esos estímulos fueran iguales o no. Se discriminaban peor los estímulos que presentaban propiedades configuracionales iguales.

b) Los efectos de superioridad del objeto y superioridad configuracional se han considerados también como indicativos de la predominancia de las propiedades globales de los estímulos en la discriminación. El efecto de superioridad del objeto fue puesto de manifiesto en los estudios de Weisstein y Harris (1974). En sus experimentos utilizaron como estímulos figuras semejantes a las presentadas en la parte intermedia de la Figura 7.8: líneas en distinta orientación presentadas solas (A) o en el contexto de líneas horizontales y verticales que formaban un patrón bidimensional (B) o un objeto tridimensional (C) . La tarea de los observadores consistía en indicar cual de las dos líneas oblicuas aparecía en el estímulo presentado en cada ensayo. Los resultados indicaron que las líneas oblicuas se discriminaban mejor cuando se presentaban en el contexto de un objeto (C) que cuando se presentaban incluidas en un patrón bidimensional (B) o solas (A).

El efecto de superioridad configuracional hace referencia a la mejor ejecución en la discriminación de líneas y estímulos simples cuando se presentan en un contexto estimular que permite la formación de determinadas configuraciones que cuando se presentan aislados. El efecto se observó en los estudios de Pomerantz, Sager y Stoever (1977) en los que se utilizaron estímulos semejantes a los presentados en la parte inferior de la Figura 7.8 y en los que los que se presentaban cuatro estímulos tres de ellos en la misma orientación y uno en distinta orientación. Los estímulos podían ser líneas presentadas solas o formando parte de distintas configuraciones (en el presente ejemplo flechas o triángulos). La tarea de los observadores consistía en indicar la posición del estímulo que presentaba distinta orientación, y que podía presentarse en una de las cuatro esquinas de la pantalla. Los resultados mostraron que el tiempo de reacción empleado en la tarea de discriminación era menor cuando las líneas formaban parte de una configuración que cuando se que se presentaban solas.

Los resultados de estos y otros estudios sugieren que las propiedades configuracionales de los estímulos son más relevantes para realizar la discriminación que las p ropiedades componentes (Kimchi, 1994, Kimchi & Bloch, 1998; Luna, Ruiz y Fernández Trespalacios, 1985, 1986; Pomerantz, 1991; Pomerantz y Pristach, 1989; Pomerantz, Sager y Stoever, 1977).

2.2. Primacía del procesamiento de la información global y local

En la misma línea del apartado anterior, aspectos de los estímulos que influyen en la discriminación de las formas visuales, en este apartado examinaremos el problema de la primacía de las características globales o locales en patrones visuales jerárquicos. Este problema se ha analizado experimentalmente a par-


tir de los trabajos pioneros de Navon (1977, 1981, 1983) y tuvo su planteamiento inicial en el marco teórico de la Psicología de la Gestalt, a través del análisis de las relaciones entre el todo y las partes en percepción visual.

2.2.1. Hipótesis de la primacía global

Navon (1977) realizó una serie de investigaciones que consideraremos como experimentos de referencia en el estudio de este problema. Diseñó unos estímulos, que permitían la independencia de las características globales y locales así como el control del relieve y familiaridad de las mismas. Los estímulos consistían en patrones jerárquicos, letras grandes (nivel global) formadas por letras pequeñas (nivel local). Los estímulos eran congruentes cuando la identidad de las letras grandes y pequeñas era la misma (por ejemplo, letras A grandes formadas por letras A pequeñas). Los estímulos eran incongruentes cuando la identidad de las letras grandes y pequeñas era diferente (por ejemplo letras A grandes formadas por letras H pequeñas) (véase Figura 7.10.A)

Utilizó dos condiciones de atención: en la condición de atención selectiva al nivel global, los sujetos tenían que atender exclusivamente a las letras grandes, ignorando las pequeñas (por ejemplo tenían que pulsar una llave de respuestas cuando aparecía la letra global A y otra distinta cuando aparecía la

A B

RRRRR HHHHH [[[[[[ uuuuuu R R H H [ u RRRRR HHHHH [ u R R H H [ u R R H H [[[[[[ uuuuuu H H R R u u [ [

H H R R u u [ [

HHHHH RRRRR u u [ [

H H R R u u [ [

H H R R uuuuuu [[[[[[

FIGURA 7.1 O.A. Letras compuestas utilizadas en los experimentos sobre primacía del procesamiento de la información global y local. Las letras grandes constituyen el nivel global. Las letras pequeñas, el nivel local. Los estímulos que presentan la misma letra en los dos niveles son congruentes. Los que presentan letras distintas son incongruentes. B: Letras compuestas con excentricidad controlada, que permiten presentar la información global (letras grandes} y la información local

(letras pequeñas} a la misma distancia de la fóvea.


H); en la condición de atención selectiva al nivel local, se instruía a los sujetos para que atendieran únicamente a las letras pequeñas ignorando las grandes (por ejemplo tenían que pulsar una llave de respuestas cuando aparecía la letra local A y otra distinta cuando aparecía la H).

Los resultados revelaron dos efectos importantes: ventaja global, tiempos de reacción más cortos ante el nivel global que ante el nivel local e interferencia unidireccional, en la situación de incongruencia (cuando la identidad de las letras globales y locales es diferente) la identificación del nivel global no se vio interferida por la presencia de letras locales diferentes, es decir, los tiempos de reacción a los estímulos congruentes e incongruentes fueron similares. Por el contrario, la identificación de las letras locales fue interferida por la presencia de letras globales distintas en la situación de incongruencia (los tiempos de reacción a los estímulos incongruentes fueron más largos que a los estímulos congruentes). Estos resultados fueron interpretados por el autor como apoyo a la hipótesis de primacía global en el procesamiento de las formas visuales.

2.2.2. Factores que afectan a la primacía del procesamiento

Investigaciones posteriores pusieron de manifiesto que el efecto de primacía global podía estar afectado por algunas variables que limitaban la generalidad de este principio, entre las más relevantes destacaremos las siguientes:

l. Densidad del patrón estimular. Martín (1979), varió la densidad de los elementos locales que formaban el patrón global, presentando patrones densos (patrón global formado por muchos elementos locales) o poco densos (patrón global formado por pocos elementos locales). Encontró que cuando el patrón global era denso, se obtenía primacía global. Por el contrario, cuando el patrón global estaba formado por pocos elementos locales, se producía primacía local.

2. Calidad de la forma. Hoffman (1980) manipuló la calidad de las letras globales y locales introduciendo una degradación en los estímulos (eliminando algunos de los trazos que formaban las letras) tanto en las letras globales como en las locales. Los resultados de este experimento mostraron primacía global cuando se degradaban las letras locales. Sin embargo, cuando se degradaban las letras globales se producía un efecto de primacía local.

3. Tamaño de los estímulos. Kinchla y Wolfe (1979) examinaron la influencia del tamaño de los estímulos sobre la primacía global/local del procesamiento. Utilizaron una tarea de atención dividida y presentaron estímulos de varios tamaños que oscilaban desde 4.8° a 22° de ángulo visual. Encontraron primacía global cuando los tamaños de los estímulos eran pequeños (menos de 7° de ángulo visual), en los tamaños intermedios (entre 7° y 10° de


ángulo visual) no hubo diferencia en los tiempos de reacción a los niveles global y local. Cuando los estímulos eran grandes (más de 10° de ángulo visual) se producía primacía local. De acuerdo con los autores, estos resultados sugerirían que el tamaño absoluto de los estímulos desempeña un papel crucial en la primacía del procesamiento y que determina una transición desde una primacía global a una local. Sin embargo, en un estudio posterior Lamb y Robertson (1990) mostraron que la transición en la primacía del procesamiento en función del tamaño de los estímulos dependía del contexto (conjunto de tamaños presentados) más que del tamaño absoluto de los estímulos. Cuando el conjunto era de tamaños pequeños (de 1.5° a 6°) el cambio de primacía global a primacía local se producía entre 1.5° y J 0

, mientras que cuando el conjunto era de tamaños grandes (de J 0 a 8°) la transición se producía entre J 0 y 6°. Por lo tanto no se podía considerar el tamaño absoluto de los estímulos como determinante del cambio en la primacía del procesamiento.

4. Posición retiniana de la información global y local. En opinión de Navon y Norman (198J), los dos estudios citados adolecen de un problema que ha podido sesgar los resultados. En ambos se utilizaron como estímulos letras compuestas (letras H, E y S grandes formadas por las mismas letras pequeñas) presentadas en el centro de la pantalla. En esta condición, las letras locales situadas en la barra central de las letras globales caen siempre en la fóvea o cerca de lá fóvea, mientras que las letras globales caen en la parafóvea y se van desplazando hacia la periferia retiniana con el aumento del tamaño. Es bien conocido, que la agudeza visual es máxima en la fóvea y decrece gradualmente con el aumento en excentricidad (distancia a la fóvea). Por lo tanto, la utilización de este tipo de estímulos presentados centralmente ha podido favorecer el procesamiento del nivel local.

Para obviar este problema, Navon y Norman utilizaron una tarea de atención selectiva y presentaron estímulos grandes y pequeños en los que la excentricidad de las características globales y locales era idéntica (letras C, véase Fig. 7.10 B). Sus resultados revelaron ventaja global (los tiempos de reacción al nivel global fueron más cortos que ante el local) en las dos condiciones de tamaño. Dado que tanto las tareas como los estímulos utilizados eran distintos en los dos tipos de estudio comentados más arriba, no se podía conocer a qué se debían las diferencias en los resultados. En una serie de trabajos, Luna y colaboradores (Luna, Marcos-Ruiz y Merino, 1995; Merino y Luna, 1997) utilizaron una tarea de atención selectiva y presentaron dos tipos de estímulos: estímulos con igual excentricidad (C's de Navon y Norman, 198J) y estímulos con diferente excentricidad (H's y S's utilizados por Kinchla y Wolfe, 1979, y Lamb y Robertson, 1990). Los resultados mostraron que el aumento en el tamaño de los estímulos sólo producía una transición hacia la primacía local cuando la excentricidad estaba desigualada (estímulos Hs y Ss) pero no cuando la información global y local se presentaba en la misma posición retiniana (estímulos Cs). Este resultado se encontró tanto con patrones


densos (Luna et al., 1995; como con patrones con pocos elementos locales (Merino y Luna, 1997).

5. Duración de la exposición de los estímulos. Paquet y Merikle (1984) examinaron el efecto de la duración de la exposición de los estímulos sobre la primacía del procesamiento en estímulos que presentaban desigual excentricidad. Presentaron los estímulos durante 10, 40 y 100 mseg. Los resultados revelaron que se producía interferencia del nivel global sobre el local únicamente en la duración de la exposición más breve. Por otra parte, la variable duración de la exposición no parece afectar a la ventaja global cuando se utilizan valores de duración de la exposición moderadamente breves, los resultados de Luna (1993), Merino y Luna (1997) y Navon (1991), utilizando estímulos con excentricidad controlada, indican que únicamente el efecto de interferencia es afectado por la duración de la exposición: a mayor duración de la exposición se obtiene una menor interferencia entre los dos niveles. Sin embargo, estudios posteriores muestran que el efecto de ventaja puede acentuarse cuando la duración de la exposición es muy breve (10 msec.) (Luna, Merino y Villarino, 2002, 2003).

En líneas generales, parece ser que las variables mencionadas afectan a la primacía del procesamiento global cuando la excentricidad de la información global y local es desigual y sesga el procesamiento hacia el nivel local. Estos efectos se eliminan o reducen cuando la excentricidad de los dos niveles es la misma.

2.2.3. Origen de la primacía del procesamiento

Hasta la fecha no se ha determinado con claridad el origen de la primacía del procesamiento. Diversos autores sugieren un origen perceptivo y afirman que la primacía global está mediada por el contenido de los componentes de frecuencia espacial de los estímulos (Badcock, Whitworth, Badcock & Lovegrove, 1990; Hughes, Fendrich & Reuter-Lorenz, 1990, LaGasse, 1993; Shulman Y Wilson, 1987). Los resultados de diversos estudios indican que la eliminación de los componentes de baja frecuencia espacial mediante distintos tipos de filtrado elimina o reduce el efecto de primacía global (LaGasse, 1993; Lamb & Yund, 1993, 1996, Shulman & Wilson, 1987). Sin embargo esta afirmación se ha visto oscurecida por resultados que indican una disociación entre los dos efectos que determinan la primacía del procesamiento. Los resultados de algunos estudios tanto en sujetos normales (Lamb & Robertson, 1989; Navon & Norman, 1983; Paquet, 1992) como en pacientes con lesiones cerebrales (Lamb, Robertson & Knight, 1989, 1990; Robertson & Lamb, 1991; Robertson, Lamb & Knight, 1988) que indican que en algunas ocasiones se produce ventaja global y no interferencia o viceversa, sugieren mecanismos diferentes para estos dos efectos. La ventaja estaría determinada por un mecanismo perceptivo! mientras que la interferencia estaría asociada a un mecanismo atencional (Navon y Norman, 1983; Lamb & Robertson, 1990; Robertson, 1996). Posiblemente,


los dos mecanismos intervienen en este fenómeno, pero es necesaria más investigación para determinar la contribución específica de cada uno de ellos.

2.3. Teoría de integración de características

Cualquier lector habrá experimentado que, en algunas ocasiones, la localización de un objeto en un contexto determinado (por ejemplo un determinado libro en una estantería repleta de libros), le resulta extremadamente fácil y rápido, mientras que en otras ocasiones, le resulta muy difícil y prácticamente tiene que examinar uno a uno los objetos hasta encontrar el objetivo. Es decir, algunas discriminaciones resultan muy fáciles y otras extremadamente difíciles. A continuación examinaremos una teoría que puede contribuir a explicar estas diferencias, la Teoría de integración de características (TIC) desarrollada por A. Treisman y colaboradores desde los años 80 (Treisman, 1982; 1985; 1986a, 1988; Treisman y Gelade, 1980; Treisman y Patterson, 1984; Treisman y Schmidt, 1982). En este apartado nos centraremos fundamentalmente en aquellos aspectos más directamente relacionadas con el proceso de discriminación de formas visuales.

La teoría de integración de características representa una posición teórica diferente a los dos acercamientos descritos hasta ahora y tiene sus raíces en el estructuralismo. Al igual que en este acercamiento teórico, el punto de partida del planteamiento de Treisman y colaboradores en la TIC es que, aunque fenomenológicamente percibimos un mundo estructurado en objetos, el proceso de percepción del objeto parte del análisis de características simples y componentes estimulares. Es decir, el sistema visual procesa inicialmente características aisladas que sólo posteriormente se organizan en formas u objetos integrados. Uno de los supuestos básicos en la TIC es que las características simples3 se procesan de forma automática, mientras que los objetos requieren la focalización de la atención. Existe evidencia fisiológica y comportamental que apoya esta posición teórica. La evidencia fisiológica se ha examinado en el capítulo 3 al considerar la aproximación teórica del análisis inicial de características y los trabajos de Hubel y Wiesel, la evidencia comportamental se examina a continuación.

2.3.1. Evidencia comportamental

No todas las características físicas funcionan como características simples. Por ello, los autores han tratado de identificar las características funcionales extraídas por el sistema visual. El procedimiento básico ha consistido en insertar

3. Antes de entrar en más detalles sobre la TIC, es conveniente aclarar qué entiende Treisman por dimensiones y características con el fin de evitar confusiones con la propuesta de Garner sobre estos términos. La definición de características de Treisman se corresponde con un nivel determinado de una dimensión (por ejemplo el nivel rojo de la dimensión color) en la definición de Garner (1 978), no con lo que Garner define como una característica.


una serie de características en tareas experimentales y ver si se comportan de acuerdo con una serie de predicciones. A continuación consideraremos algunos ejemplos.

l. Tarea de búsqueda visual: consiste en detectar un determinado objetivo entre una serie de distractores, por ejemplo, detectar un círculo negro entre círculos blancos. La TIC predice que, en este tipo de tarea, los objetivos que puedan discriminarse de los distractores a partir de una característica simple, se detectarán automáticamente sin intervención de la atención, la búsqueda se llevará a cabo en paralelo y, por último, la detección no se verá afectada por el número de distractores, es decir la detección del objetivo será indepen· diente del número de distractores. En la parte superior de la Figura 7.11, se presenta un ejemplo de búsqueda visual de un objetivo (círculo negro) entre una serie de distractores (círculos blancos). El objetivo, en este caso, se puede discriminar de los distractores a partir de una característica simple (nivel negro de la dimensión color) diferente a las que presentan los distractores (nivel blanco de la dimensión color). Como puede observarse el objetivo resalta de los distractores y se discrimina fácilmente tanto en el caso de haya pocos distractores (A) como cuando los distractores son más numerosos (B).

Por el contrario, cuando el objetivo está definido por una conjunción de características, por ejemplo, cuando el objetivo es un círculo negro entre una serie de distractores que son triángulos negros y círculos blancos; es decir, que se han unido las características forma y color para formar el objetivo, la teoría predice que será necesaria la intervención de la atención para detectarlo, la búsqueda será serial y el número de distractores afectará a la detección del objetivo. El objetivo, en este caso, presenta características comunes con los distractores, en consecuencia la discriminación será más difícil que en el

A

.. o o .. . o .. e

o o o 00 oOO o • o o o

B

o

FIGURA 7.11. Ilustración de la tarea de búsqueda visual . (Explicación en el texto).


caso anterior, y además, la dificultad en la discriminación aumentará, a medida que aumenta el número de distractores, como puede observarse en las partes C y D de la Figura 7.11.

2. Segregación de la textura. En este caso la teoría predice que cuando dos regiones del campo visual se puedan discriminar en base a una característica simple su segregación será automática. Por el contrario, cuando las diferentes texturas estén formadas por conjunciones de características simples, la segregación de las regiones texturadas requerirá más escrutinio (véase Figura 6.16 del capítulo anterior).

3. Formación de conjunciones ilusorias. Cuando se presta atención a otros objetos presentes en el campo visual o la atención esta sobrecargada, la teoría predice que la combinación de las características simples para formar un objetivo dará lugar a conjunciones ilusorias. Conjunciones ilusorias son combinaciones erróneas de características simples. Treisman y Schmid (1982) presentaron a los sujetos dos dígitos y una serie de letras (X roja, T azul y O verde) en una tarea de atención dividida en la que tenían que responder tanto a los dígitos como a las letras. Al responder los sujetos combinaban erróneamente las características de las letras (por ejemplo, T roja o X verde) .

Los resultados obtenidos con estas y otras tareas han confirmado, en general, las predicciones teóricas (Treisman, 1985; Treisman y Gelade, 1980, Treisman y Schmid, 1982). Como un intento de integrar los resultados se ha desarrollado, a través de varias etapas, el modelo de percepción del objeto, (Treisman, 1988, 1993).

2.3.2. Modelo de percepción del objeto

El modelo propuesto por Treisman y colaboradores se presenta en la Figura 7.12. El supuesto básico en este modelo es que las características se registran y codifican en módulos especializados, de forma automática, en paralelo y sin atención localizada. Cada módulo consta de mapas distintos de características para cada dimensión y para cada valor de la dimensión que codifica (es decir, si se codifica la dimensión forma, un mapa distinto para cada uno de los valores: cuadrado, rombo, círculo, etc.).

Los supuestos de la forma de actuación del modelo aplicados a una tarea de búsqueda visual son los siguientes: 1) Cuando se activa uno de los mapas se detecta automáticamente la característica. 2) Cuando la búsqueda visual se realiza sobre un objetivo que requiere la localización y unión de características, la atención juega un papel fundamental.

La atención selecciona en un << mapa especializado de localizaciones» la localización de los límites de las características, sin que esto implique la detección de las mismas. Cuando la atención se focaliza sobre una posición determinada del mapa de localizaciones, se recupera de forma automática la información sobre qué características están activadas y en qué posición, por medio de las conexiones de las diferentes localizaciones en los módulos. El ni-


FIGURA 7.12. Esquema del modelo de integración de características de Treisman. (Adaptado de Treisman, 1988, 1993).

vel más elevado en el modelo representa la recombinación de las propiedades que se han extraído a partir de cada módulo especializado y que permiten, en último término, la percepción de objetos, escenas y eventos.

El modelo puede explicar la mayor parte de la evidencia empírica obtenida en el laboratorio de Treisman (Treisman, 1982; Treisman y Gelade, 1980; Treisman y Patterson, 1984; Treisman y Schmidt, 1982; Treisman y Shouter, 1985, Treisman y Gormican, 1988), sin embargo encuentra dificultades para explicar los resultados obtenidos en contextos diferentes y sobre todo cuando las características se definen a partir de posefectos visuales (Houck y Hoffman, 1986), frecuencia espacial con dirección del contraste y del color (Nakayama & Silverman, 1986) y características espaciales (Cavanagh, 1987). Por otra parte, resultados de distintos estudios muestran que determinadas combinaciones de características simples pueden detectarse automáticamente sin la intervención de la atención (Nakayama y Silver, 1986). Modificaciones posteriores de la teoría han admitido la detección automática de combinaciones de características simples cuando estas últimas presentan grandes diferencias entre sí y, por lo tanto, se pueden discriminar con facilidad .

Finalmente, y en relación con el supuesto de independencia de los módulos que procesan las características simples, resultados de estudios recientes indican que algunos módulos interactúan. Kubovy, Cohen y Hollier (1999)

PERCEPCIÓN DE LA FORMA !l. DETECCIÓN Y DISCRIMINACIÓN 281

realizaron una serie de estudios con el fin de examinar la supuesta independencia de los módulos que procesan las características simples de forma y color. Desarrollaron un procedimiento experimental denominado <<Detección de la Gestalt» en el que se presentaban como estímulos una serie de patrones texturados utilizando un procedimiento de presentaciones visuales rápidas (Véase parte inferior de la Figura 7.13. Los estímulos se manipularon de forma que el límite que divide las dos regiones segregadas del patrón estimular estaba determinado a partir de color (A), forma (B), forma y color (C) conjunción de las características simples de forma y color (D), o a la relación ortogonal de las características en el patrón estimular (E), en estos dos último caso se generaban dos límites distintos una determinado por la forma y otro por el color (véase parte superior de la Figura 7.13).

La tarea de los sujetos podía consistir en una tarea de detección en la que tenían que detectar el límite de la textura, indicando si lo percibían o no en un determinado ensayo; o en una tarea de localización, en la que tenían que indicar si el límite era horizontal o vertical. Los resultados mostraron que cuando la información que recibían era consistente, es decir, cuando el límite entre las dos regiones texturadas estaba definido a la vez por color y forma

1 Estímulos 1

•••oo 00000 oo••• ••••• 00000 •••oo 00000 o o••• ••••• 00000 •••oo 00000 oo••• 00000 00000 •••oo 00000 oo••• 00000 ••••• •••oo 00000 oo••• 00000 ••••• A B e D E

FIGURA 7.13. Paradigma de detección de la Gestalt (Adaptado de Kubovy, Cohen y Hollier. 1999) .


(patrón C), se detectaba mejor que cuando la información era inconsistente como en los patrones D y E, indicando que los módulos que procesan el color y la forma no eran independientes e interactuaban. Por lo tanto, uno de los supuestos fundamentales del modelo queda en entredicho a partir de estos resultados.

No obstante, a pesar de las limitaciones señaladas, que requieren una modificación en determinados aspectos de la teoría, es innegable la influencia que ha tenido la TIC en el desarrollo de la investigación en atención visual y percepción del objeto.

RESUMEN

En el presente capítulo se han examinado algunos ejemplos de fenómenos y procedimientos experimentales de cuyos resultados se puede inferir la actuación de los procesos de detección y discriminación de formas visuales. En relación con la detección de formas visuales, se han examinado dos aspectos: la detección de patrones de puntos y la detección de la simetría; otro aspecto fundamental en relación con este proceso, la detección del contraste se ha examinado en el capítulo 3. Los patrones de puntos, constituyen un estímulo muy idóneo en los estudios sobre detección debido a que son formas no familiares y, por lo tanto, no están contaminados por este factor. Se describe el paradigma de enmascaramiento visual, que es el más utilizado en este contexto y se examinan los factores que afectan a la detectabilidad de las formas visuales como orientación de las líneas, orientación del patrón, etc. En la detección de la simetría se examinan tres tipos de simetría. Simetría bilateral, traslacional y rotacional, y se presentan algunos ejemplos de la evidencia empírica en relación con qué tipo de simetría resulta más saliente en percepción, así como los factores que influyen en la detección de la simetría.

En relación con la discriminación de formas visuales, se examinan una serie de aspectos que contribuyen a la diferenciación de formas visuales como la descripción de las propiedades componentes y globales de los estímulos, el estudio de las relaciones entre las dimensiones estimulares y el papel desempeñado por las propiedades componentes y configuracionales de los estímulos en la discriminación. En la misma línea, se examina en el apartado siguiente la influencia de las características globales y locales en la discriminación de patrones visuales jerárquicos. Finalmente, y desde una posición teórica distinta a las dos anteriores, se presentan aquellos aspectos de la teoría de integración de características (TIC) relacionados con la discriminación de formas visuales, como es la ejecución en tareas de búsqueda visual y segregación de los límites de la textura en función de que el objetivo o los límites estén definidos en base a características simples o conjunción de las mismas. En último lugar se presenta el modelo de percepción del objeto y se señalan algunos problemas en relación con esta propuesta teórica.

Capítulo 8

RECONOCIMIENTO VISUAL

INTRODUCCIÓN

En este capítulo analizaremos el problema del reconocimiento visual centrándonos en el reconocimiento de objetos y caras. Uttal (1988) define el reconocimiento como la acción de clasificar, categorizar o conceptuar un determinado estímulo como miembro de una clase de estímulos. El proceso de reconocimiento es más complejo que los de detección o discriminación que se han examinado en el capítulo anterior. El único requisito en la detección, es advertir la presencia de un estímulo; en la discriminación, para poder percibir las semejanzas y diferencias entre estímulos, se añadía un requisito de memoria (una vez atendido el primer estímulo es necesario recordarlo para poder realizar la comparación con el segundo estímulo) y, por último, el reconocimiento requiere el recuerdo de una o varias clases de estímulos. Además, también requiere la asignación de significado al objeto, ya que la acción de clasificar, categorizar o conceptuar depende más del significado que se asigna al objeto que de las características físicas del mismo, que son prioritarias en la detección y la discriminación.

El reconocimiento visual es posiblemente uno de los problemas más complejos en percepción visual, pero también uno de los más cruciales, dado que el proceso de reconocimiento es fundamental para el desenvolvimiento de los seres humanos en su interacción con el medio ambiente. En la vida cotidiana nos encontramos con una amplia variedad de objetos, personas, animales; reconocemos caracteres alfabéticos que difieren en su forma, tamaño, orientación etc., y, sin embargo, no somos conscientes de realizar un esfuerzo notable para reconocerlos; no advertimos la dificultad del proceso de reconocimiento.

No obstante, si consideramos lo que ya anteriormente hemos señalado en relación con el proceso perceptivo en general, la dificultad se hace patente;


ccomo es posible que podamos reconocer esta diversidad de estimulación cuando la imagen de que se parte es una imagen bidimensional y estática en la retina, en definitiva, un patrón de luz que incide sobre los órganos sensoriales de la visión? Más aún, seguimos reconociendo los objetos del mundo real aunque se produzcan desplazamientos por parte del objeto o del observador, cuando cambia la fuente de iluminación o la orientación del objeto, cuando el objeto es ocultado parcialmente por otro que se superpone, etc., y, sin embargo, seguimos reconociendo los objetos sin dificultad y con una notable rapidez, aproximadamente 100 o 200 milisegundos (aunque son necesarios unos 100 milisegundos más para ser conscientes de ello (Treisman y Kanwisher, 1998).

El objetivo de este capítulo consiste en examinar algunas de las propuestas teóricas en relación con el problema del reconocimiento visual. Aunque resulta necesario advertir desde el principio, que en la actualidad no se dispone de ningún modelo de reconocimiento que pueda resultar tan potente y eficaz como el sistema de reconocimiento visual de los seres humanos.

1. RECONOCIMIENTO DE OBJETOS

La mayoría de las teorías sobre el reconocimiento visual de objetos acepta que el mecanismo básico consiste en la comparación de la imagen de un objeto con una representación del objeto almacenada en la memoria. Para entender lo anterior, consideremos un ejemplo. Cuando buscamos nuestro coche en un aparcamiento, tendremos que comparar la imagen que estamos viendo con una representación almacenada en la memoria de un objeto (nuestro coche) que responde a unas determinadas características como forma, color, modelo, matrícula etc., con el fin de obtener el reconocimiento final de nuestro coche frente a todos los demás.

Para comprender cómo se lleva a cabo la comparación, habrá que conocer en primer lugar, qué tipo de procesos permiten derivar una descripción adecuada de la imagen, en segundo lugar, cómo se almacenan esas descripciones y finalmente, cómo se realiza la comparación. Es decir habrá que conocer la relación entre los procesos visuales de descripción de la imagen y los procesos cognitivos que permiten realizar la comparación. (Logothetis y Seinberg, 1996). A continuación examinaremos distintas propuestas teóricas en relación con el reconocimiento visual de objetos.

1.1. Comparación de plantillas

Las primeras investigaciones sobre reconocimiento visual, se centraron en el reconocimiento de patrones bidimensionales relativamente simples, como letras y números. Una de las propuestas iniciales sobre el modo en que se

RECONOCIMIENTO VISUAL 285

reconocen estos patrones consistía en suponer que para cada carácter alfanumérico debería haber una plantilla almacenada en la memoria con la cual se comparaba el patrón.

Una posible forma de reconocimiento, consistiría en comparar la imagen correspondiente a un patrón visual nuevo con la plantilla almacenada en la memoria y determinar si éste encaja o no en la plantilla. Es decir, el reconocimiento de un patrón nuevo, no familiar o conocido, se realizaría comparándolo con la plantilla y viendo si se ajusta o no a la misma. Cuanto más se ajustara el patrón a la plantilla, mayor probabilidad de que se reconociera. El procedimiento se ilustra en la Figura 8 .l.

Reconocimiento por comparación de plantillas

FIGURA 8.1. Reconocimiento del objeto por comparación de plantillas.

El procedimiento de comparación de plantillas, sería útil para el reconocimiento de patrones cuya forma básica es relativamente constante, es decir, cuando no presenta demasiadas variaciones. Por ejemplo, para que las máquinas o los cajeros automáticos reconozcan talones bancarios mediante plantillas, las formas básicas de los números se representan siempre con los mismos caracteres, tamaño y posición. El reconocimiento de caracteres alfanuméricos utilizando plantillas, resulta mucho más complicado cuando las formas básicas, tamaño y posición varían. Es mucho más difícil que el escáner reconozca los caracteres de un texto escrito a mano que los de un texto escrito con una letra estándar en el ordenador. Finalmente, la comparación de plantillas no sería útil para reconocer patrones complejos u objetos naturales, debido a la complejidad y variaciones que éstos presentan.

Los problemas que presenta este procedimiento están fundamentalmente relacionados con su falta de economía. Si tuviéramos que comparar con una plantilla la forma de la letra P que se presenta en la Figura 8.2, el proceso


p p p p p l

p p p 1) p p

p p p LP p

' FIGURA 8.2. Ejemplos de formas básicas correspondientes a la letra p .

sería interminable, debido a la gran variedad de formas básicas que pueden existir sobre la letra p. Es más, para realizar la comparación necesitaríamos tener almacenadas en la memoria infinidad de plantillas (una para cada una de las formas básicas) y el proceso de reconocimiento visual sería lento y costoso. Por otra parte, el reconocimiento no sería posible cuando los patrones cambiasen de orientación, tamaño o posición, o cuando existiera alguna deformación en los mismos.

Una posible solución a este problema requeriría que las imágenes de los objetos fueran sometidas previamente a un proceso de normalización, por medio del cual se ajustaran al tamaño, orientación, etc. y, una vez normaliza-

1 Normalización en orientación y tamaño !

Orientación Tamaño

FIGURA 8.3. Proceso de normalización en orientación y tamaño previo a la comparación con la plantilla.


dos, se compararan con las plantillas almacenadas (véase Figura 8.3). Una forma de obtener esta normalización consiste en complementar la descripción del objeto con información sobre la distancia del objeto y la orientación en relación con el observador (Rack, 1983 ); y los resultados de algunos estudios muestran la eficacia de este procedimiento (Epstein & Hatfield, 1978).

1.2. Análisis de características

Una postura teórica diferente, contempla la posibilidad de que el sistema visual disponga de detectores específicos de características geométricas simples como líneas verticales, horizontales y oblicuas; ángulos, curvas, etc. En este caso, el reconocimiento se obtendría mediante la detección de las características definitorias de un patrón determinado. Por ejemplo, la presencia de una línea horizontal situada en la parte superior y otra horizontal unida a la anterior en su centro, determinaría el reconocimiento de la letra T.

El primer modelo de reconocimiento basado en las características, denominado <<pandemonium>>, fue desarrollado por Selfridge (Selfridge, 1959; Selfridge y Neisser, 1960) y alcanzó un reconocimiento posterior a partir de los resultados de las investigaciones de Hubel y Wiesel (1962) examinadas en el capítulo 3, que mostraron la capacidad de respuesta selectiva por parte de células del cortex visual del mono y el gato a determinadas características estimulares (líneas de una anchura específica y bordes orientados de una forma determinada).

En el modelo del pandemonium, cada número o letra se representa internamente por una lista de características locales que definen su forma (líneas verticales, horizontales y oblicuas, ángulos rectos, curvas, etc.). Por ejemplo, las características locales de una H, serían dos líneas verticales, una horizontal y cuatro ángulos rectos. Cuando se presenta un patrón nuevo se hace una lista de sus características y se compara en paralelo (todas a la vez) con las listas de características de patrones conocidos almacenadas en la memoria. Si el patrón nuevo se ajusta a alguna de las características se reconoce y se clasifica como perteneciente a una determinada categoría.

El sistema consta de una serie de mecanismos o <<demonios >> 1, cada uno de los cuales realiza una función específica. Los <<demonios de la imagen>> cumplen la función de formar una representación interna del patrón estimular. Los <<demonios de las características>> analizan la imagen y responden únicamente cuanto está presente la característica a la que son sensibles (unos responden ante líneas verticales, otras ante ángulos, etc.). Los << demonios cognitivos >> , son responsables del reconocimiento de patrones específicos, por ejemplo una letra o un número determinados. Su forma de actuar consiste

l. Selfridge utilizó este término porque no estaba interesado en la implementación física de este mecanismo Investigaciones posteriores indican que los «demonios >> de Selfridge pueden corresponder a determinadas estructuras neurales.


en recoger las respuestas anteriores y buscar combinaciones de características que definen el patrón de cuyo reconocimiento son responsables. Si encuentran una serie de características pertinentes en relación con un patrón determinado, envían su información al <<demonio de la decisión>> que tiene como función proporcionar la respuesta final sobre el reconocimiento.

Sin embargo el mecanismo de reconocimiento propuesto por el modelo del pandemonium no es aplicable en muchos casos. Veamos un ejemplo, para reconocer la letra E tendríamos según este modelo, una lista de características que respondería a una línea vertical y tres líneas horizontales más cortas. El problema es que la lista de características no es suficiente para facilitar el reconocimiento. Con las mismas características pertenecientes a la letra E se podrían reconocer otras figuras como las representadas en la Figura 8.4 y que contienen las mismas características de la E pero situadas en una posición espacial diferente. Por lo tanto, sería necesario especificar las relaciones entre las características elementales. Una dificultad mayor para este modelo, estaría en relación con el reconocimiento de objetos naturales (animales, caras, árboles, etc.) y patrones más complejos que los caracteres alfanuméricos. Definir un patrón complejo, como por ejemplo un insecto, en base a este tipo de características resultaría imposible, como también lo sería recombinar las características elementales de un patrón de esta naturaleza para llegar a una identificación global del mismo.

La propuesta que analizaremos a continuación permite resolver algunos de los problemas citados en relación con los modelos de plantillas y características.

E _F-[l:

FIGURA 8.4. Distintas combinaciones de las características (una línea vertical y tres horizontales) que podrían definir la letra E.


1.3. Descripciones estructurales

Las descripciones estructurales incluyen además de la descripción de las características de un patrón, las relaciones entre las mismas y su disposición espacial; de esta forma, se superan algunas de las dificultades comentadas anteriormente. Por ejemplo, la descripción estructural de la letra E consistiría en la lista de una línea vertical, cuatro ángulos rectos y tres línea horizontales que se unen a la línea vertical en la parte superior, intermedia e inferior. De esta forma, la especificación de las relaciones entre las características así como su disposición espacial, permite la comparación de los patrones nuevos con las representaciones almacenadas, obviando la ambigüedad de los procedimientos anteriores.

Sin embargo, la descripción estructural no garantizaría el reconocimiento del objeto en situaciones en las que se produce un cambio en la imagen debido al movimiento del sujeto o del objeto, es decir, a la observación desde puntos de vista diferentes. Las descripciones estructurales deben incluir, por lo tanto, algo más que una lista de características y de sus relaciones espaciales, con el fin de que se pueda reconocer un objeto cuando se producen estos cambios.

Una propuesta en relación con este problema es la de las descripciones estructurales basadas en el objeto, que incluye en la descripción, el marco de referencia perceptivo o eje intrínseco del objeto (Palmer, 1999). De esta forma, al especificar la relación de las partes del objeto con el eje principal del mismo, se mantiene la constancia del objeto.

Cuando la relación entre el objeto y el marco de referencia permanece constante, el reconocimiento del mismo es posible a pesar de los cambios en

A D ,ffi, R A~B / ................ /

B / [ / ......

[ r-1 r-1 D ~~ 1 ~

[ B

·W" 8 ,W, D

FIGURA 8.5. Figura geométrica de un objeto {casa), definida por la posición de su centro y la orientación de sus ejes horizontal y vertical, que constituyen sus marcos de referencia . El objeto se sigue reconociendo a pesar de los cambios en tama-

ño, posición u orientación .


o

FIGURA 8.6. Efecto de distintos marcos de referencia sobre la percepción de un cuadrado y un diamante.

la imagen cuando se produce un cambio en la orientacwn o determinadas transformaciones. Es decir con la adopción de un marco de referencia intrínseco o centrado en el objeto, el reconocimiento pasa a ser independiente de las transformaciones, así como de los cambios en el punto de vista. La casa de la Figura 8.5, se representa por una figura geométrica definida por la posición de su centro y la orientación de sus ejes horizontal y vertical, que constituyen sus marcos de referencia intrínsecos. De esta forma, se pueden codificar las relaciones espaciales entre las partes del objeto y el eje principal del mismo y se puede reconocer el objeto cuando se producen cambios de tamaño, posición u orientación.

La excepción a esta regla la constituyen aquellos casos en que existan marcos de referencia alternativos; cuando esto ocurre, el reconocimiento dependerá del marco de referencia seleccionado. Por ejemplo, las figuras presentadas en la parte superior de la Figura 8.6 se perciben como un cuadrado y un diamante respectivamente. Sin embargo, cuando se presentan alineados en una diagonal, como en la parte intermedia, pueden percibirse de las dos formas (cuadrados y diamantes); finalmente, cuando se incluyen en un rectángulo, como en la parte inferior, la ambigüedad desaparece.

No obstante, la representación basada en el objeto, a saber, la utilización de un sistema de coordenadas espaciales centrado en el objeto, como hemos visto en la propuesta de descripciones estructurales basadas en el objeto, no resuelve todos los problemas apuntados en relación con el reconocimiento. Este modelo de reconocimiento presenta problemas cuando existe una gran variedad de objetos pertenecientes a una misma clase, cuando el objeto se dobla por alguno de sus ejes, o cuando se les añade alguna parte. En todos estos casos, no se puede obtener un buen ajuste cuando se compara una representación de estas características con los modelos almacenados en la memoria.


1.4. Teoría de Marr y Nishihara

La teoría de Marr Y Nishihara (1978), Marr (1982), al igual que la propuesta que acabamos de considerar, es una teoría del reconocimiento basada en ejes de coordenadas, y se desarrolló en el contexto de la Inteligencia Artificial.

La teoría intenta ofrecer una explicación sobre cómo se transforman los patrones estimulares en una representación simbólica en la que se explicitan la forma, orientación, posición, movimiento, etc. de los objetos. Este proceso se desarrolla a través de varias etapas, en las que se generan distintas descripciones del estímulo (esbozo primario, esbozo 2 1J2 D y modelo 3 D). La teoría establece también una distinción entre la contribución del procesamiento visual inicial, en el que se generaría el esbozo primario y el esbozo 2 1/2 D, y la contribución de procesos posteriores o más tardíos (que llevarían al modelo 3 D).

En las dos primeras etapas, el procesamiento es de bajo nivel y no implica ningún proceso de interpretación. En la primera de ellas se crea una representación inicial o <<esbozo primario», en la que se describe la imagen como una serie de cambios de intensidad que representan bordes, manchas, barras, y su distribución geométrica (sus respectivas posiciones y orientaciones). El resultado de esta primera etapa llevaría a una representación de estructuras más globales (gradientes de densidad, contornos y texturas de las superficies) denominada «esbozo primario completo>> que constituye una representación más refinada que la anterior.

En la segunda etapa, se obtiene una representación denominada esbozo 2 Y2 D, que aporta información sobre la distancia relativa de las partes de la superficie al observador, su orientación en relación con la línea de visión y la presencia de discontinuidades en la superficie. Es una descripción de la superficie del objeto desde el punto de vista del observador. Esto implica que cuando se produce un desplazamiento del sujeto o del objeto, la representación cambia, por lo que todavía resulta inadecuada para la comparación con los modelos almacenados en la memoria. Una representación basada en el punto de vista del observador no es adecuada para describir el objeto, porque se necesitaría un modelo almacenado en la memoria para cada uno de los puntos de vista posibles.

Para solucionar el problema anterior y mantener la constancia en el reconocimiento del objeto, Marr (1982) y Marr y Nishihara (1978) proponen una tercera etapa de procesamiento tardío, en la que se genera una descripción, denominada modelo 3 D, definida a partir de un sistema de coordenadas basado en los ejes naturales del objeto, lo que permite mantener la descripción del objeto en relación al marco de referencia, cuando se producen cambios en el punto de vista desde el que se observa.

Los autores, proponen una organización modular de las descripciones del objeto (en la que los mecanismos de procesamiento son independientes) y una representación del objeto basada en primitivos volumétricos que se pueden localizar en los objetos y analizar en términos de ejes de coordenadas.


Los primitivos volumétricos son los conos generalizados, que consisten en las superficies generadas a partir del movimiento de una sección transversal a lo largo de un eje principal. La sección puede variar en tamaño pero su forma permanece constante. (Véase Figura 8. 7). No todos los objetos pueden describirse mediante conos generalizados. Objetos como vasos, jarrones, pirámides, y algunas partes del cuerpo, podrían describirse mediante este sistema, pero no podrían ser descritos mediante conos generalizados otros objetos como rostros, árboles o plantas.

Eje

FIGURA 8.7 . Ejemplo de conos generalizados.

En la Figura 1.3 del capítulo 1, se ilustra cómo se representaría la figura humana según esta propuesta. El cilindro grande de la izquierda, es un modelo 3 D global con su eje de coordenadas incorporado, que permite especificar las posiciones, longitudes y orientaciones del resto de de las partes del cuerpo (cabeza, tronco y extremidades). A su vez se representan modelos 3D, de más bajo nivel en la organización jerárquica que, a su vez, permiten especificar las posiciones, longitudes y orientaciones de las partes, y de esta forma se procedería hasta llegar a la representación de la mano situada a la derecha. De esta forma, cuando un objeto se desplaza, las partes del objeto cambian en relación al punto de vista pero se mantiene constante la relación de las partes con el eje natural del objeto.

La teoría propuesta por Marr y Nishihara es un modelo de Inteligencia Artificial, no un modelo capaz de explicar el reconocimiento visual humano, por ello sus aplicaciones en el campo de la Psicología son limitadas o prácticamente


inexistentes. Por otra parte, hay muchos objetos naturales y más complejos en los que los primitivos volumétricos propuestos por Marr y Nishihara no son aplicables. Ya que en esta teoría no se asume la influencia del conocimiento previo (procesos de arriba-abajo) sobre el proceso de reconocimiento, el modelo propuesto daría lugar a errores a la hora de reconocer este tipo de objetos.

1.5. Modelo de reconocimiento por componentes

El modelo propuesto por Biederman (1987) y ampliado posteriormente en Hummel y Biederman (1992), constituye una extensión del de Marr y Nishihara aplicado al reconocimiento humano. El modelo de reconocimiento por componentes parte de una idea similar a la de los modelos de reconocimiento de palabras mediante los fonemas. La propuesta básica es un modelo de reconocimiento basado en un conjunto finito de primitivos y sus posibles combinaciones, que permiten especificar los objetos.

Biederman, propone como primitivos, o unidades básicas para el reconocimiento de los objetos, un conjunto finito (aproximadamente 36) de formas volumétricas simples, que denomina <<geones>>. Propone cuatro tipos de geones básicos: esferas, cilindros, bloques y cuñas, para obtener primitivos tridimensionales a partir de imágenes de entrada bidimensionales. Biederman considera que los geones son características invariantes desde cualquier punto de vista, y pueden utilizarse como material para la construcción de las representaciones tridimensionales (véase Figura 8.8).

1 Geones 1

Cilindros

Bloques

1 Objetos 1

L]e~ 9 FIGURA 8.8. Geones y objetos formados a partir de los mismos

{adaptado de Biederman, 1987).


El supuesto perceptivo fundamental de la teoría es que los geones pueden diferenciarse sobre la base de propiedades perceptivas de la imagen bidimensional que son independientes del punto de vista que se adopte. Es decir, serían propiedades que facilitarían la constancia del objeto cuando se observa desde distintos ángulos. Entre las propiedades propuestas se incluyen algunos principios de organización perceptiva como los estudiados en el capítulo 6 que permiten el reconocimiento de objetos complejos en base a componentes simples.

La teoría sugiere además, una serie de relaciones estructurales entre los componentes que permitirían generar múltiples objetos. Por lo tanto, la representación de un objeto consistiría en una descripción estructural que especifica la relación entre los componentes del objeto (orientación, tamaño relativo y unión de los componentes).

Biederman adopta como base perceptiva para explicar la generación de geones, una propuesta teórica formulada por Lowe (1985), que relaciona la organización perceptiva y el reconocimiento de patrones. El supuesto básico del que se parte es que el sistema visual humano ha desarrollado la capacidad de detectar determinadas organizaciones perceptivas de los elementos de la imagen como simetría, alineamiento, conexión, etc., que no son accidentales. Es decir, organizaciones que no surgen por casualidad y que se corresponden con propiedades significativas de los objetos.

Las propiedades no accidentales (fundamentalmente, simetría, paralelismo, rectitud/curvatura, conexión y coterminación), serían las responsables de mantener la constancia del objeto, por ejemplo, la simetría en el objeto se proyectaría en la imagen aunque se adoptaran puntos de vista diferentes. En el modelo de reconocimiento por componentes, las propiedades no accidentales se consideran como características, de manera que un borde recto en la imagen es probable que se corresponda con un borde recto en el objeto del cual se ha derivado la imagen. Además, las propiedades no accidentales son invariantes, es decir, su correspondencia con el objeto permanece a pesar de los cambios en el punto de vista. El principio básico de organización es que el sistema visual considera que determinadas propiedades de los bordes de la imagen bidimensional constituyen una evidencia de la presencia de esas mismas propiedades en los objetos tridimensionales. Por ejemplo, un borde recto en la imagen bidimensional, sugeriría la presencia de un borde recto en el objeto tridimensional a partir del cual se ha derivado la imagen.

El reconocimiento por componentes procedería de la siguiente forma: el primer paso consistiría en la extracción de borde a partir de los cambios en luminancia. A partir de la información contenida en los bordes, se extraerían las propiedades no accidentales de la imagen como simetría, conexión, paralelismo, rectitud/curvatura y coterminación, que sirven para identificar los geones. En paralelo al paso anterior, se llevaría a cabo un proceso de división del objeto en regiones cóncavas, cuyo objetivo es identificar los geones que componen el objeto. El resultado de las etapas anteriores permitiría especificar el tipo de


geones, su posición en la escena, así como las relaciones espaciales entre los mismos, como tamaño, posición relativa, orientación, etc. Hasta este punto el procesamiento procedería de abajo-arriba. Una vez activada la descripción de los geones del objeto, se activaría la descripción de los geones almacenados en la memoria y se llevaría a cabo el proceso de comparación en paralelo, que conduce finalmente a la identificación del objeto (véase Cuadro 8.1).

CUADRO 8.1

Activación de geones y relaciones entre los mismos: Determinación de

los componentes

Activación de los modelos del objeto: Comparación de los componentes con

las representaciones del objeto

Una serie de estudios experimentales han intentado verificar el funcionamiento del modelo (Biederman, 1987). Un primer grupo de estudios se dedicó a examinar si el reconocimiento del objeto era más rápido y preciso cuando se presentaban sólo los geones básicos del objeto o cuando se presentaba el objeto perfectamente detallado. Para examinar este problema, se dibujaron objetos comunes completos, con todos sus componentes dibujados; incompletos, en los que a los objetos representados en los dibujos les faltaba algún componente esencial; y objetos más complejos representados con múltiples componentes (véase parte superior de la Figura 8.9). Los dibujos se presentaron a los sujetos durante 100 milisegundos y éstos tenían que nombrar el objeto. Los resultados indicaron que el tiempo de reacción empleado por los sujetos en la tarea de nombrar objetos era aproximadamente igual en los dibujos de objetos simples completos e incompletos. Por otra parte,


el tiempo de reacción cuando los sujetos tenían que nombrar los dibujos de objetos más complejos fue más corto que en los dos casos anteriores. Estos resultados apoyan la hipótesis del modelo de reconocimiento por componentes que afirma que los objetos pueden identificarse correctamente a partir de una serie limitada de geones básicos. Por otra parte, el hecho de obtener una ligera ventaja en el tiempo de reacción ante los objetos complejos (formados por un mayor número de componentes) se interpretó también como prueba a favor del supuesto de que cuantos más geones contenga un objeto, más rápidamente se llevará a cabo la comparación con las descripciones almacenadas sobre los geones en la memoria.

Un segundo grupo de estudios se dedicó a examinar el efecto de la degradación del estímulo sobre el reconocimiento de los objetos. Utilizando el mismo procedimiento experimental que en los estudios anteriores, se presentaron dibujos completos de los objetos junto con dibujos en los que se degradaron partes fundamentales para la identificación de los geones (propiedades no accidentales) o partes que no la afectaban (véase parte inferior de la Figura 8.9). Los resultados mostraron que el reconocimiento empeoraba considerablemente cuando el estímulo presentaba una degradación que afectaba a las

~ ~ ~ \) / '- '

2 r -'~ n v·

( .... ~

FIGURA 8.9. Ejemplos de estímulos utilizados en los experimentos de Biederman para verificar el funcionamiento del modelo de reconocimiento por componen

tes (adaptado de Biederman, 1987).


propiedades no accidentales (dibujos de la taza y la copa presentados en la parte derecha) porque en ese caso no se podían identificar los geones componentes del objeto. Cuando la degradación no afectaba a las propiedades no accidentales como en los dibujos de la parte intermedia, se podían identificar los geones a partir de la información existente y reconocer el objeto.

El modelo propuesto por Biederman es más flexible y más apropiado para el reconocimiento humano que el propuesto por Marr y Nishihara y se puede aplicar a una gama más amplia de objetos. Por otra parte, presenta la ventaja de que permite contrastar algunas de las hipótesis y, como hemos señalado anteriormente, los resultados son consistentes con el modelo. Sin embargo, esta teoría también presenta algunas dificultades. El principal problema está en relación con la propuesta artificial de los 3 6 geones y la determinación de sus relaciones espaciales.

No existe hasta el momento ninguna evidencia empírica que apoye la sugerencia de que los geones propuestos constituyan la base fundamental para categorizar los objetos, aunque los trabajos de Tanaka (1996), utilizando un procedimiento de degradación progresiva del estímulo, han encontrado células en la corteza inferotemporal de macacos que responden a patrones simples volumétricos de extraordinario parecido a los geones propuestos por Biederman. Estas investigaciones podrían aportar credibilidad a la conjetura de Biederman.

1.5 .1. Modelo PDP de la teoría del reconocimiento por componentes

En los modelos PDP, que se han mencionado en el capítulo 1, se considera que el reconocimiento consiste en la activación de una red formada por unidades de computación artificiales similares a las neuronas, que procesan la información de forma distribuida y en paralelo. En este punto y, a modo de ejemplo de estos modelos, expondremos brevemente el modelo JIM desarrollado por Hummel y Biederman (1992), que constituye una implementación de la teoría de reconocimiento por componentes que se ha visto en el punto anterior, aunque este modelo en concreto presenta poco paralelismo debido a que cada una de las capas presenta una fase de complejidad progresiva, que implica una clara secuencialidad.

El modelo JIM es una red neuronal conexionista de siete capas, cuya arquitectura funcional se representa en la Figura 8.10.

En la primera capa (L1), formada por un mosaico de células sintonizadas a la orientación y cuyos campos receptivos se solapan, se extraerían los bordes. En la segunda capa (L2), se extraerían tres tipos de características: vértices, ejes de simetría y manchas, que permiten discriminar entre distintos tipos de geones y especificar sus atributos. En la capa 3 (L3 ), se codifican los atributos de los geones, como la forma de su eje principal (recta o curva), si


~ ~

~ ~

FIGURA 8.1 O. Modelo de reconocimiento JIM (adaptado de Hummel y Biederman, 1 992).

existe paralelismo (lados paralelos o no paralelos), orientación burda (vertical, horizontal, oblicua), aspecto (alongado o achatado) forma de la sección (recta o curva), tamaño (grande o pequeño), posición horizontal (de derecha a izquierda), posición ertical (que varía de arriba abajo), etc. De esta forma, cada geón queda definido por el valor que presenta en cada uno de estos atributos. Las capas cuarta y quinta (L4 y L5) reciben la información sobre la posición en el campo visual, tamaño y orientación de los geones, que procede de las células de la capa L3. En L4 y L5, se especifican las relaciones espaciales entre los geones: orientación, posición y tamaño relativo. Las células de la capa 6 (L6} reciben las unidades de salida de L3 y L5, que constituyen una descripción estructural de un objeto en términos de los geones que lo componen y las relaciones entre los mismos y responden a conjuntos de células activadas de esas capas. Estas unidades representan el conjunto de todas las descripciones de geones posibles. La activación de estas unidades se corresponde con la etapa de identificación de geones del modelo de reconocimiento por componentes descrito en el punto anterior. Finalmente, en la capa 7 (L7), las células responden a los objetos definidos en base a grupos de células de la capa anterior (L6}.


2. RECONOCIMIENTO DE CARAS

En este apartado examinaremos el reconocimiento de caras, analizando si es idéntico al del objeto o si, por el contrario, presenta características específicas. El reconocimiento de caras constituye un importante aspecto del reconocimiento visual fundamentalmente por la naturaleza de la estimulación que presenta aspectos peculiares y distintos a los presentados en el reconocimiento de objetos. Por una parte, como vimos en el capítulo dedicado a detección y discriminación de formas visuales al considerar las configuraciones, la relación entre los elementos componentes de la cara (ojos, boca, nariz, etc.) da lugar a la formación de una configuración en la que se percibe el estímulo como un todo que presenta características propias e independientes de las de sus elementos componentes. Por ello permite investigar qué tipo de propiedades estimulares son determinantes en el reconocimiento. Por otra parte, las caras son estímulos biológica y socialmente importantes, aportando información sobre características relevantes de las personas con las que se interactúa como edad, sexo, expresión, estado de ánimo, y dirección de la mirada, que pueden influir en el aprendizaje y la interacción social.

El procedimiento experimental básico utilizado en este tipo de estudios, consiste en presentar como estímulos caras construidas artificialmente, en las que se pueden variar las características que forman el rostro (por ejemplo, se puede cambiar la forma de la nariz, el color de los ojos, la forma y el color del pelo, etc.). Las tareas más utilizadas suelen ser las tareas igual-diferente, en las que los sujetos deben comparar dos caras, o algún componente de las mismas, y señalar si son iguales o no, y tareas de reconocimiento, en las que deben señalar si la cara se había presentado anteriormente.

2.1. Procesamiento de las características componentes de las caras

Las primeras investigaciones sobre reconocimiento de caras realizadas en los años 70, partían del supuesto teórico de que el sistema visual analizaba las caras basándose en las características que las componen (ojos, boca, nariz, etc.) y a partir de aquí se realizaba una descripción de la cara sobre la base de estas características (por ejemplo, ojos azules, nariz afilada, labios gruesos, etc.). La pregunta básica que surgió en este contexto fue si las diferentes características de las caras se procesaban por separado o si, por el contrario, se procesaban como una unidad perceptiva, en la que se producía una interacción en la percepción de las características, de forma que la percepción de los ojos fuera influida por la percepción de la forma de la nariz o el color del pelo, etcétera.

Como ejemplo de este tipo de investigaciones examinaremos el estudio clásico de Bradshaw y Wallace (1971). Estos autores construyeron caras variando algunas características en cada una de ellas. En la Figura 8.11 se puede


observar el procedimiento utilizado. En a, se presenta la cara que se toma como punto de partida; en b, se presenta una cara en la que se modifican la nariz y la barbilla: en e, se modificaron además de las anteriores características, el pelo y la boca y finalmente en d, todo lo anterior, los ojos, y las líneas de la cara. Este procedimiento de generación de estímulos es muy parecido al utilizado en el reconocimiento por parte de testigos en ámbitos policiales.

FIGURA 8.11 . Ejemplo de estímulos utilizados en los estudios sobre reconocimiento de caras. Fuente : llana Roth & Vicki Bruce. Perception and Representation. 1995 (2. 0 ed.). Buckingham: Open University Press/McGraw-Hill Publishing Company,

p. 144, fig. 3.1.

La tarea de los observadores consistía en proporcionar juicios igual-diferentes sobre dos caras presentadas secuencialmente, es decir, se presentaban dos caras en intervalos sucesivos y los observadores debían indicar si eran iguales o diferentes. Los resultados mostraron que el tiempo empleado en emitir un juicio sobre las diferencias de caras era más corto cuanto más características diferentes se presentaban en las caras (por ejemplo, las latencias eran más cortas cuando se comparaban las caras a y d, que cuando se comparaban a y b). Los autores concluyeron que las características de las caras se procesaban de forma independiente y secuencial y no como una unidad perceptiva. Según esto, los observadores inspeccionarían el pelo en primer lugar, seguido


2.3. Procesamiento configuracional de las caras

Los resultados de Sergent (1984) indican que las características componentes de las caras no se procesan independientemente; sin embargo, no permiten determinar el proceso que subyace al reconocimiento. Estudios posteriores, que examinaremos a continuación, se han centrado en analizar si el procesamiento global de las caras se debe exclusivamente a la interacción de las características componentes o al hecho de que éstas no se representan independientemente en la descripción que el sistema visual hace de las caras. El hecho de que no se representen de manera independiente, indicaría que se procesan como una configuración en el sentido de la Gestalt, como se ha visto en el capítulo 6 dedicado a la organización perceptiva. Es decir, la percepción de las características componentes junto con sus relaciones espaciales determinaría un nuevo percepto que sirve como base para el reconocimiento.

El supuesto anterior fue examinado por Tanaka y Farah (1993) que partieron de la siguiente hipótesis: si las características componentes se representan independientemente en la descripción que el sistema visual hace de la cara, entonces el reconocimiento de las mismas por separado será igual cuando se presenten aisladamente que cuando se presenten en el contexto de una cara. Por el contrario, si la representación de las características no es independiente, se reconocerán peor cuando se presenten aisladamente que cuando se presenten en el contexto de una cara. El procedimiento utilizado fue el siguiente: se presentaron a los observadores una serie de caras y durante una serie de ensayos tenían que asociar las caras con un nombre determinado (por ejemplo, una determinada cara se asociaba con el nombre de Juan, otra diferente con el de Enrique, etc.). Una vez aprendidos los nombres de las caras, se presentaba dos pruebas de reconocimiento: en una de ellas, reconocimiento de características componentes en un contexto, se presentaban como estímulos caras que diferían en una única característica (por ejemplo, la nariz) y los observadores tenían que indicar si esa característica pertenecía o no a la cara asociada con un nombre determinado en la etapa anterior (por ejemplo, si pertenecía a la cara de Juan). En la otra prueba, reconocimiento de características componentes presentadas aisladamente, se presentaban dos características diferentes (por ejemplo, dos tipos de nariz) y los observadores debían indicar cuál de ellas pertenecía a una cara determinada (por ejemplo, al igual que en el caso anterior si pertenecía a la cara de Juan).

Los resultados indicaron que el reconocimiento de características componentes era peor cuando éstas se presentaban aisladamente que cuando se presentaban en el contexto de caras. Los autores concluyeron que la representación de caras está basada en una descripción global de la imagen que lleva a un mejor reconocimiento de las características componentes en el contexto global de la cara. Resultados similares se obtuvieron en Tanaka y Sengco (1997). Estos resultados difieren de los encontrados con estímulos diferentes


como objetos, palabras o caras invertidas, que se reconocen con igual precisión cuando se presentan aisladas o en un contexto global.

Los estudios citados sugieren que las caras se almacenan globalmente en la memoria, ahora bien, no responden a la pregunta de si las caras se perciben globalmente. Sin embargo, éste es un aspecto muy importante dado que las diferencias en el reconocimiento de caras con respecto a otras formas visuales como caras invertidas, objetos o palabras, sugiere que la representación visual de las caras realizada inicialmente en la percepción, puede ser diferente de la representación de otras formas visuales.

Con el fin de examinar este supuesto Farah, Wilson, Drain y Tanaka (1998) realizaron una serie de experimentos en los que incorporaron dos paradigmas perceptivos en lugar de paradigmas de memoria. En el primero de ellos, paradigma de atención selectiva, se presentaban dos caras simultáneamente y los observadores tenían que indicar si una determinada característica (por ejemplo, la boca) era igual o diferente en las dos caras. Es decir, los observadores tenían que atender exclusivamente a una determinada característica e ignorar todas las demás para realizar la tarea. La lógica que subyace a la tarea es la siguiente: si el sistema visual proporciona una descripción explícita de las características componentes de las caras, entonces será posible comparar las características presentadas en las dos caras sin ninguna interferencia por parte del resto de características (por ejemplo, comparar las dos narices sin que el resto de características interfiera). Por el contrario, si la representación que proporciona el sistema visual es una representación global (una representación de la cara completa) las características a comparar sufrirán interferencia por parte del resto de las características componentes (ojos, nariz, pelo, etc.). Como condición de control se presentaron las mismas caras invertidas, de forma que se mantuvieran las propiedades geométricas (con excepción de la orientación) pero no fuera posible una representación global del estímulo. Los resultados mostraron una mayor interferencia en la comparación de características cuando las caras se presentaron en posición recta que cuando se presentaron invertidas.

El segundo paradigma utilizado fue de enmascaramiento, las máscaras presentadas podían ser características componentes de las caras o caras completas, y su finalidad era examinar cuál de estos aspectos distorsionaba más la percepción de caras. El planteamiento subyacente era que si las caras se perciben como un todo la representación de las características componentes desempeñaría un papel poco importante en el reconocimiento y, por lo tanto, las máscaras formadas por caras completas distorsionarían más el reconocimiento que las máscaras formadas por características componentes. En los experimentos se presentaron además otras formas visuales como palabras, objetos y caras invertidas, con el fin de examinar si los efectos eran específicos de la percepción de caras o generales en todos los casos. Los resultados mostraron que la ejecución en la tarea fue peor cuando la máscara era una cara que cuando estaba formada por características componentes.


En conjunto, los resultados de los experimentos mostraron que la percepción de caras estaba menos basada en la descomposición de partes, es decir, era más global, que la del resto de formas visuales presentadas. Los resultados anteriores sugieren que las características componentes de las caras no se procesan o codifican de forma independiente sino como una configuración en la que se perciben los componentes (ojos, boca, nariz, etc.) así como la relación entre los mismos y, además, los cambios en la configuración influyen en el reconocimiento de las características componentes (Tanaka y Farah, 2003).

3. DIFERENCIAS ENTRE EL RECONOCIMIENTO DE CARAS Y OBJETOS

Una vez examinadas las características del reconocimiento de objetos y caras cabe preguntarse si los mecanismos que intervienen en el reconocimiento de estos tipos de patrones visuales son los mismos o si, por el contrario, los mecanismos de reconocimiento son específicos para cada tipo de patrón.

En la actualidad no se conoce todavía si estos mecanismos son iguales o diferentes. No obstante, se dispone en este momento de evidencia empírica que sugiere que el reconocimiento de caras podría ser un tipo especial de reconocimiento visual. La evidencia procede de distintos tipos de estudios:

A nivel experimental, los resultados de algunos estudios sugieren que las caras se procesan como un todo, mientras que los objetos y caras invertidas se procesan en base a sus componentes (Tanaka y Farah, 2003 ). Los resultados sobre reconocimiento de patrones invertidos muestran una mayor distorsión en el reconocimiento de caras que en el de objetos. Si se observa la fotografía de un rostro o grupo de rostros familiares en posición recta, no observamos ninguna dificultad en reconocerlos, pero si se invierte la posición, la dificultad resulta muy notable. La comparación entre la distorsión que se produce en el reconocimiento de caras y objetos cuando se presentan invertidos muestra que aunque el reconocimiento de objetos se distorsiona cuando se presentan invertidos, el empeoramiento es mucho mayor cuando se tiene que reconocer caras invertidas (Yin, 1969). A partir de estos resultados encontrados en los estudios iniciales, se ha intentado analizar si las caras invertidas se procesan

· de forma diferente a las caras presentadas en posición recta. Los resultados de diversos estudios indican algunas variaciones importantes. La primera de ellas, es que cuando las caras se presentan invertidas sus características componentes se procesan independientemente y no como una configuración (Bartlett y Searcy, 1993) (Véase Figura 8.12). La segunda, que las características relacionales (relaciones espaciales entre las características componentes) se distorsionan cuando las caras se presentan invertidas (Bruyer y Coget, 1987; Endo, 1986; Valentine, 1988) o con un cambio en la orientación mayor que noventa grados (McKone, Martini y Nakayama, 2001). Finalmente, resul-


FIGURA 8.12. Fotografías de rostros familiares en posición invertida. Fuente: llana Roth & Vicki Bruce. Perception and Representation. 1995 (2.0 ed.). Buckingham:

Open University Press/McGraw-Hill Publishing Company, p. 153, fig . 3.4.

tados más concluyentes que los anteriores muestran que la configuración se distorsiona más que las características componentes cuando se presentan en caras invertidas (Rhodes, Brake & Atkinson, 1993) y que este efecto se debe a un déficit en la codificación de la información configuracional (Freire, Lee & Symons, 1999; Murray, Rhodes y Schuchinsky, 2003).

A nivel de substrato neuronal, los estudios realizados con registros unicelulares en primates, muestran respuestas selectivas a las caras por parte de neuronas situadas en el girus fusiforme del cortex inferotemporal (Gross, 1992; Gross et al., 1993).

A nivel neuropsicológico, los estudios realizados con pacientes que presentan lesiones cerebrales, muestran una disociación entre el reconocimiento de objetos y caras. Las lesiones en el girus fusiforme del cortex inferotemporal en el hemisferio derecho, generalmente causan prosopagnosia (incapacidad para reconocer caras) pero prácticamente no afectan al reconocimiento de objetos. La misma lesión en el hemisferio izquierdo, causaría incapacidad para reconocer objetos, pero deja casi intacta la capacidad para reconocer caras (una revisión sobre estos aspectos se presenta en Moscovitch, Winocur y Behrmann, 1998). Los resultados procedentes de estudios neuropsicológicos que indican la existencia de mecanismos específicos en el reconocimiento, concuerdan con los datos obtenidos con registros unicelulares en monos citados anteriormente, así como con estudios realizados con humanos mediante la aplicación de técnicas de registro electrofisiológico (Allison et al., 1999; Bentin et al., 1996; Liu et al. 2000).


Finalmente, la evidencia procedente de estudios en los que se han utilizado técnicas de neuroimagen indica la existencia de distintos componentes modulares en el reconocimiento visual (Kanwisher et al, 2001). Los estudios iniciales utilizando la técnica de tomografía por emisión de positrones (PET), indicaron que determinadas regiones de la vía ventral se activaban cuando se realizaba una tarea de reconocimiento de caras (Haxby et al., 1994). Los mismos resultados se obtuvieron utilizando la técnica de resonancia magnética funcional (fMRI), que permitía localizar la activación de forma más precisa en dos áreas, el giro fusiforme y el sulcus temporal superior (Puce et al., 1996). Estudios posteriores realizados por Kanwisher et al. (1997) permitieron determinar que una pequeña región del giro fusiforme derecho, se activa selectivamente durante la percepción de caras y no durante la percepción de objetos.

Para algunos autores, los resultados anteriores parecen indicar que el reconocimiento visual se lleva a cabo por medio de la actuación de mecanismos especializados en determinados tipos estimulación y no mediante un sistema general y común para todos los tipos de estímulo (Kanwisher et al. 2001) . Sin embargo otros autores defienden que la especialización es «Superficial» ya que el cortex visual contiene un gran número de áreas que responden selectivamente a determinados estímulos (Tanaka, 1996) pero las computaciones que se realizan en estas áreas son muy semejantes (Ishai, et al., 1999).

Capítulo 9

APÉNDICE METODOLÓGICO

1. PSICOFÍSICA CLÁSICA

Para la mayoría de los historiadores, la figura que representa el nacimiento de la Psicología Experimental es Wundt, fundamentalmente porque fue el creador del primer laboratorio de Psicología. Sin embargo, el papel que desempeñó Fechner en el surgimiento y posterior desarrollo de esta ciencia, a través de sus trabajos teóricos y de investigación en el ámbito de la Psicofísica, fue tan importante que algunos autores consideran las investigaciones realizadas en Psicofísica como una influencia decisiva en el desarrollo de la Psicología Experimental.

Dos factores influyeron decisivamente en la aparición de la Psicofísica: Por una parte, el contexto que permitió el desarrollo de la investigación, fue el clima intelectual imperante a mediados del siglo xrx, volcado hacia la observación, la medida y la experimentación, y que Boring (1942) califica como «el comienzo de la era de la ciencia>>. Por otra parte, el objeto de estudio de la Psicología, en esta época, se centró en los acontecimientos de la experiencia consciente (D'Amato, 1970). Estos dos factores propiciaron el surgimiento y desarrollo de la Psicofísica, a partir de los trabajos pioneros de Fechner, cuyo objetivo fundamental consistió en investigar las leyes que permiten determinar las relaciones entre la experiencia sensorial (dominio psicológico) y la estimulación (dominio físico).

Las aportaciones concretas de Fechner en su obra Elementos de Psicofísica, publicada en 1860, y que algunos autores consideran como la primera piedra de la construcción de la Psicología Experimental (Boring, 1942), se centran en tres aspectos fundamentales:

l. El desarrollo de métodos psicofísicos para la Cuantificación de los umbrales absoluto y diferencial. El umbral absoluto se define como el valor de


la dimensión física, por encima y por debajo de la cual, se detecta o no se detecta el estímulo; o la cantidad mínima de estimulación capaz de producir una sensación (por ejemplo, intensidad de una luz por debajo de la cual el estímulo no se percibe nunca y por encima de la cual se percibe siempre). El umbral diferencial es el incremento mínimo en la estimulación que permite detectar un cambio en la sensación; por ejemplo, la diferencia mínima en la longitud de dos líneas permite detectar que una es más larga que la otra.

2. El estudio de la medida de la dimensión psicológica, para lo cual construyó una escala, cuyo valor cero se estableció en base al umbral absoluto y, se adoptó como unidad de medida las diferencias apenas perceptibles (d.a.p.), que constituyen el correlato psicológico del umbral diferencial, asumiendo la igualdad de éstas.

3. El establecimiento de las relaciones entre el dominio psicológico y el dominio físico a través de la formulación de su ley, según la cual la intensidad de la sensación es proporcional al logaritmo de la intensidad del estímulo.

S= K log (I)

Donde S es la magnitud de la experiencia subjetiva, I la intensidad del estímulo o magnitud física y K una constante que depende de la dimensión. Esto supone que para que la sensación aumente en progresión aritmética, la intensidad del estímulo debería aumentar en progresión geométrica.

Los métodos y procedimientos utilizados en el campo de la Psicofísica han ido parejos al ámbito teórico en el que se postulan las leyes y la clasificación usual ha sido la dicotomización entre métodos psicofísicos indirectos y directos.

1.1. Métodos psicofísicos indirectos

Los métodos indirectos, son los utilizados en el contexto de la psicofísica fechneriana en relación con la determinación de los umbrales absoluto y diferencial. Los dos umbrales se definen estadísticamente aunque no existe ninguna definición estadística que sea satisfactoria con independencia del método que se utilice (D'Amato, 1970; Gescheider, 1985). Los métodos indirectos más utilizados son el de los estímulos constantes, el método de los límites y el del error promedio.

1.1.1. Método de los estímulos constantes

Se denomina de esta manera porque en este método se presenta siempre un conjunto fijo de estímulos elegido de antemano.

APÉNDICE METODOLÓGICO 309

Determinación del umbral absoluto

El procedimiento básico para la determinación del umbral absoluto en el método de los estímulos constantes consiste en la presentación repetida, a lo largo de la sesión experimental, de un estímulo graduado en un rango de 5 a 9 valores diferentes de intensidad. El requisito en relación con este rango de valores de intensidad es que el valor más bajo de los utilizados no debe producir casi nunca sensación, mientras que el valor de intensidad más alto debe producirla casi siempre. Por ejemplo, suponiendo que el estímulo presentado sea un tono con distintos niveles de intensidad, el tono de intensidad más baja no debe oírse casi nunca y el tono de intensidad más alta debe percibirse casi siempre. Para determinar estos dos valores extremos de intensidad, se requiere una serie de presentaciones previas con el fin de determinar el valor de intensidad más bajo y más alto de la escala. El resto de los estímulos debe presentar intensidades intermedias entre los dos estímulos extremos, de forma que unas veces produzcan sensación y otras no.

Una vez realizada la selección de los valores de intensidad de los estímulos que se van a presentar en el experimento, el procedimiento consiste en la presentación de cada valor de intensidad del estímulo en un orden aleatorio 100 o más veces. La tarea del observador consiste en decir si detecta o no detecta el estímulo ante cada presentación.

En cada ensayo, el observador indica si ha percibido o no el estímulo. Se anotan las respuestas y se calcula la proporción de respuestas <<SÍ>> o respuestas en las que el observador ha detectado el estímulo. Cuando se utiliza este procedimiento, los resultados se representan en la denominada función psicométrica (véase Figura 9.1), en la que la intensidad del estímulo se representa en el eje horizontal (abscisa) y la proporción de respuestas <<SÍ>>, en el eje vertical (ordenada). Convencionalmente se toma como valor del umbral absoluto el valor de intensidad correspondiente al estímulo que se ha detectado un 50% de las veces.

Se puede determinar el valor del umbral absoluto mediante un procedimiento gráfico, uniendo por medio de líneas la proporción correspondiente al 50% de detección con el valor de intensidad del estímulo en el que se ha alcanzado ese porcentaje de detección. Aplicando este procedimiento gráfico a los resultados hipotéticos de un experimento presentados en la Figura 9.1, el umbral absoluto correspondería al estímulo que presenta un valor de intensidad de 170.

Determinación del umbral diferencial

La determinación del umbral diferencial con este método se lleva a cabo mediante un procedimiento en el que se presenta al observador dos tipos de estímulo. Uno de ellos, denominado estímulo estándar, se mantiene con la misma intensidad durante todo el experimento y es el estímulo sobre el que se


100

90

~ 80

70 m C1l 60 -m C1)

50 ::l a. m 40 C1) ... C1) 30

'O ~ o 20

10

o 110 125 140 155 170 185 200 215 230

Intensidad del estimulo

FIGURA 9. 1. Determinación del umbral absoluto por el método de los estímulos constantes.

va a averiguar el umbral diferencial. El otro tipo de estímulo es el denominado estímulo de comparación o de prueba. La intensidad de este último varía a lo largo de los ensayos presentados en la sesión experimental. Generalmente se utiliza un rango de 5 a 9 valores de intensidad, que deben presentar una distancia igual a lo largo de la escala física. El requisito en relación con el rango de valores estimulares es que el estímulo que presenta un valor de intensidad más bajo y el que presenta un valor más alto se juzguen casi siempre como mayores y menores, respectivamente, que el estímulo estándar. Por otra parte, la aplicación de este método requiere un equilibrio entre los valores de intensidad más bajos y más altos que el estándar, es decir, el número de estímulos con intensidad más alta y más baja que el estándar debe ser aproximadamente igual. Por ejemplo, si se selecciona como estímulo estándar una línea cuya longitud es de 5 centímetros, el estímulo de comparación podría tener un rango de valores de intensidad de 1, 2, 3 y 4 centímetros para el rango de intensidades más bajas que el estándar y 6, 7, 8 y 9 centímetros para el de intensidades más altas.

La tarea del observador consiste en juzgar si el estímulo de comparación presentado en un determinado ensayo es mayor, o menor que el estándar. Se registran las respuestas <<mayor» que el estándar, y se calcula su frecuencia y su proporción. A partir de aquí se representa la función psicométrica. El estímulo de comparación que se juzga el 75% de las veces como mayor que el estímulo estándar se toma como umbral superior. El estímulo de comparación


que se juzga el25% de las veces como mayor que el estímulo estándar se toma como umbral inferior. El estímulo de comparación que se juzga el 50% de las veces como mayor que el estímulo estándar se corresponde con el punto de igualdad subjetiva (PIS).

En los resultados hipotéticos presentados en la Figura 9.2, el umbral superior correspondería al estímulo que presenta una intensidad de 200; y el umbral inferior al estímulo que presenta una intensidad de 140. El umbral diferencial (UD) se calcula de acuerdo con la siguiente fórmula UD = (Us-Ui)/2; en el presente ejemplo, 200-140/2 = 30. La diferencia entre Us y Ui constituye el intervalo de incertidumbre (li); en este ejemplo Ii = 60.

-... 100 ra

"C 90 1: ra iií 80 (1) :::l 70 CT ... o 60 >-ra

~ 50 1/) 40 ra .... 1/)

30 (1) :::l a. 1/) 20 (1) ... (1) 10

"C ~ o o

110 125 140 155 170 185 200 215 230

Intensidad del estímulo

FIGURA 9.2. Determinación del umbral diferencial por el método de los estímulos constantes.

En este apartado se ha descrito cómo se determinan los umbrales absoluto y diferencial mediante un procedimiento gráfico. El cálculo de los umbrales absoluto y diferencial mediante el método de los estímulos constantes, puede realizarse también mediante métodos matemáticos 1•

El método de los estímulos constantes presenta el inconveniente de que requiere mucho tiempo para determinar el umbral al utilizar un rango muy amplio de intensidades del estímulo, algunas de las cuales, sobre todo las

l. El lector interesado puede consultar éstos en Blanco (1996) y j a1íez (1 992).


situadas en los extremos supenor e inferior, ofrecen poca información en relación con el umbral.

1.1.2. Método de los límites


La determinación del umbral absoluto, utilizando este método, se lleva a cabo presentando los estímulos en series ascendentes y descendentes que se van alternando sucesivamente. En las series ascendentes, se presenta en primer lugar un estímulo muy por debajo del umbral, un estímulo que no produce sensación nunca, y se va aumentando gradualmente su valor de intensidad hasta llegar a un determinado límite en el que el observador comienza a de-

TABLA 9.1. Determinación del umbral absoluto con el método de los límites

Intensidad Tipo de serie: Ascendente (A), Descendente (D)

del estímulo A D A D A D A D A D

lSO Sí Sí Sí

140 Sí Sí Sí Sí Sí

130 Sí Sí Sí Sí Sí Sí Sí Sí

120 No Sí Sí Sí No Sí No Sí Sí No

110 No No No No No Sí No Sí Sí

lOO No No No No No No No

90 No No No No No No

80 No No No No No

70 No No No

60 No No

so No

40 No

Puntos de l2S llS llS llS l2S lOS 125 105 105 125

transición

Punto de transición media aritmética de la intensidad de los dos estímulos entre los que se produce una transición en la respuesta. Umbral absoluto = Media aritmética de los puntos de transición; en este ejem-plo, (1130/10)=113.

APÉNDJCE METODOLÓGJCO 313

tectar el estímulo. Cuando se alcanza el límite se finaliza la serie. Si la serie es descendente el procedimiento es el contrario, se presenta un estímulo muy por encima del umbral, un estímulo que produce sensación siempre, y se va disminuyendo su intensidad gradualmente a través de los ensayos hasta que llega a un límite en el que el sujeto indica que no percibe el estímulo. Los puntos de transición (punto en el que se produce un cambio en la respuesta de <<SÍ>> a <<No>> o viceversa) de varias series se promedian para determinar el umbral absoluto.

En la Tabla 9.1 se puede observar el procedimiento seguido referido a resultados hipotéticos de un experimento.


Por lo que respecta al umbral diferencial, el procedimiento consiste en presentar dos pares de estímulos: el estímulo estándar, cuya intensidad se mantiene constante, y el estímulo de comparación, cuya intensidad se varía en series ascendentes y descendentes. El observador debe indicar si el estímulo de comparación es igual, mayor o menor que el estándar. Las series ascendentes comienzan con estímulos de comparación que se juzgan como menores que el estándar y en los ensayos siguientes se aumenta la intensidad del estímulo de comparación de manera progresiva hasta que se juzga mayor que el estándar. En este punto se interrumpe la serie y se procede a presentar la siguiente. Normalmente se produce una transición en la que el observador responde igual que el estándar antes de que se observe la transición a mayor que el estándar. Con las series descendentes se procede de la misma forma. En la Tabla 9.2 se puede observar el procedimiento para unos resultados hipotéticos, en los que se supone que la intensidad del estímulo estándar tiene un valor = 100.

Para cada serie se obtiene el punto de transición inferior (Ti), punto correspondiente al valor de intensidad del estímulo en el que la respuesta cambia de menor a igual y el punto de transición superior (Ts) en el que el cambio es de mayor a igual. En algunos casos los observadores no utilizan la categoría igual con lo que el Ts = Ti. A continuación se calcula la media aritmética, sumando los valores de Ts y Ti de todas las series y dividiendo por el número de series para determinar los límites superior e inferior, Us y Ui.

Finalmente se aplican las fórmulas para calcular: - el intervalo de incertidumbre que es la diferencia entre Us y Ui, Ii

Us-Ui = 110-88 = 22. -el umbral diferencial (UD), que indica el incremento mínimo requerido

para que se pueda percibir una diferencia entre estímulos, UD = (Us - Ui)/2 = (110-88)/2 = 11. En este caso se necesitan 11 unidades para percibir un cambio entre estímulos.

- el punto de igualdad subjetiva (PIS), en el que se percibe el estímulo de prueba y el estándar como iguales, PIS = (Us + Ui)/2 = (110 + 88)/2 = 99.


TABLA 9.2. Determinación del umbral diferencial con el método de los límites

Intensidad Tipo de serie: Ascendente (A) ,Descendente (D) del estímulo de prueba A D A D A D A D A

150 + + + +

140 + + + +

130 + + + +

120 + + + = + +

110 = = + = + = + =

lOO (Es) = = = = = - + = =

90 = - = = = = - =

80 - = - = - -

70 - - - - -

60 - - - - -

50 - - - - -

Ts 11 5 115 105 115 105 125 95 105 115 Us=llO Ti 85 95 75 85 75 105 85 95 85 Ui=88

UD= (Us-Ui) 1 2 = 11 O- 88 1 2 = 11

D

+

+

+

+

+

=

-

105

95

- el error constante (EC), error de estimación cometido al comparar los estímulos, EC =PIS-Es= 99-100 = -1 (el valor negativo indica una subestimación del estímulo de prueba en relación con el estándar, un valor positivo indicaría lo contrario).

Este método, reduce los valores de intensidad de los estímulos y los concentra en unos pocos valores en torno al umbral por lo que requiere utilizar un menor número de estímulos y presenta la ventaja de ser más rápido que el anterior; sin embargo, presenta el inconveniente de que sólo los dos últimos estímulos de cada serie aportan información acerca del umbral. Por otra parte, cuando se utiliza el método de los límites es necesario controlar dos tipos de error: el error de habituación y el error de anticipación. El error de habituación se produce por la tendencia de los observadores a proporcionar la misma respuesta que han proporcionado en los ensayos anteriores y, por lo tanto, podrían seguir dando la misma respuesta aun cuando ya se ha producido un cambio en la sensación (Por ejemplo, en una serie descendente, tende-


rían a contestar Sí, mientras que en una serie ascendente tenderían a contestar No). El error de habituación tendría como consecuencia un valor del umbral menor en las series descendentes ya que el observador sigue proporcionando la respuesta Sí más allá del punto en el que deja de percibir el estímulo. Por el contrario, en los ensayos ascendentes el valor del umbral sería mayor, ya que el observador seguiría proporcionando la respuesta No en algunos ensayos, a pesar de haber percibido ya el estímulo. El procedimiento adecuado para controlar el error de habituación consiste en presentar el mismo número de series ascendentes y descendentes; de esta forma, se anula el sesgo propio de cada tipo de serie. El error de anticipación se produce cuando el observador, a través de su experiencia con las series, advierte que en algún momento su sensación tiene que cambiar y anticipa este cambio. Por ejemplo, si se presenta siempre el mismo estímulo para iniciar una serie ascendente, el observador, después de su experiencia con varias series, puede conocer el número de respuestas No hasta que alcanza el umbral y utilizar este número para estimar la posición del umbral. El procedimiento para controlar el error de anticipación consiste en variar aleatoriamente el primer estímulo de cada serie.

1.1.3. Método de los ajustes o error promedio

El método de los ajustes es prácticamente igual al método de los límites, pero a diferencia de los anteriores, en este método es el observador el que controla la variación en el estímulo que permite la medida de los umbrales. Esto requiere como condición para su aplicación que el estímulo pueda graduarse fácilmente.


Para determinar el umbral absoluto, la tarea del observador consiste en ajustar el estímulo, disminuyendo su intensidad en algunos ensayos hasta que no lo detecta o aumentándola en otros ensayos hasta que lo detecta. El procedimiento es igual al del método de los límites, pero en este caso, el observador es el que manipula la intensidad del estímulo. En la Tabla 9.3 se presenta un ejemplo referido a resultados hipotéticos de un experimento, en el que el observador disminuye la intensidad del estímulo cuando lo detecta claramente, hasta llegar a un punto límite x en el que casi no lo detecta; o aumenta la intensidad del estímulo cuando no lo percibe, hasta llegar a un punto límite x a partir del cual produce un cambio en la dirección del ajuste.


TABLA 9.3. Determinación del umbral absoluto por el método de los ajustes

Intensidad Ensayo del estímulo 1 2 3 4 5

150 Disminuye

140 Disminuye

130 Disminuye Disminuye

120 Disminuye Disminuye Disminuye

110 Disminuye Disminuye Disminuye Disminuye

lOO X X Disminuye Disminuye X

90 Aumenta Aumenta X X Aumenta

80 Aumenta Aumenta Aumenta Aumenta

70 Aumenta Aumenta

60 Aumenta Aumenta

50

40

Umbral en cada lOO lOO 90 90 lOO ensayo

Umbral absoluto = Media aritmética de los UA de todos los ensayos; en el pre-sente ejemplo, (480/5)=96


El umbral diferencial se establece mediante los ajustes de la intensidad del estímulo de comparación que realiza el observador hasta que iguala al estímulo estándar. En algunos ensayos, la intensidad del estímulo de comparación es muy superior a la del estímulo estándar, por lo que el observador debe disminuirla hasta que es igual a la intensidad del estándar. Por el contrario, en otros ensayos, la intensidad del estímulo de comparación es muy inferior a la del estándar, y el observador debe aumentarla hasta que las dos intensidades sean iguales. En la Tabla 9.4, se ilustra el procedimiento, a partir de resultados hipotéticos.


TABLA 9.4. Determinación del umbral diferencial por el método de los ajustes

Intensidad Ensayo del estímulo de prueba l 2 3 4 5

150 Disminuye

140 Disminuye

130 Disminuye Disminuye



lOO Es = = Disminuye =

90 Aumenta = =

80 Aumenta Aumenta

70 Aumenta Aumenta

60 Aumenta Aumenta

50

40

Ajuste lOO lOO 90 90 lOO

Umbral diferencial = Desviación típica de los ajustes = 5.477 Intervalo de incertidumbre (li) = 2UD = 2 (5.477) = l 0.95 PIS= Media aritmética de los ajustes en los ensayos (480/5) = 96 EC = PIS-Es = 96-l 00 = -4

Limitaciones de los métodos psicofísicos indirectos

El problema general que se plantea con la utilización de los métodos indirectos es que éstos únicamente proporcionan una medida de la cantidad de energía estimular necesaria para producir un cambio en la respuesta de los observadores, no una medida de la sensación. Las limitaciones señaladas a la propuesta de Fechner han sido muy numerosas. Por una parte, los experimentos realizados en el campo de la psicoacústica demostraron que las d.a.p. no son siempre iguales (Stevens, 1936) . Por otra parte, la evidencia empírica pone de manifiesto que el umbral puede variar: a) entre sujetos en la misma situación experimental (por ejemplo, ante la misma situación experimental, los sujetos más cautos pueden responder menos veces que detectan el estímulo que los menos cautos que responden más veces que lo detectan aunque no esten seguros de ello); b) intra sujetos en diversas situaciones experimentales (como las variaciones en el umbral de un mismo sujeto debidas a la práctica,


la fatiga, la motivación, etc.), e) dependiendo del método que se utilice para obtenerlo y d) el umbral puede presentar variaciones como consecuencia del efecto de variables motivacionales manipuladas mediante instrucciones (por ejemplo, cuando se instruye a los sujetos para que respondan <<SÍ>> únicamente cuando estén absolutamente seguros de haber detectado el estímulo, a diferencia de cuando se les instruye para que respondan arriesgándose a adivinar). Finalmente, los resultados de diversos experimentos psicofísicos pusieron de manifiesto que la función de Weber (S 1 I = K) en la que Fechner basó su ley, y según la cual el incremento del estímulo necesario para percibir un cambio en la sensación es proporcional a la intensidad del estímulo, presenta variaciones en las distintas modalidades sensoriales y en los valores más bajos del rango estimular. Esto unido a la desigualdad de las d.a.p. pone en entredicho la validez de la ley formulada por Fechner.

Sin embargo, la investigación que se ha generado a partir de los problemas planteados por Fechner en el ámbito de la Psicología Experimental, difícilmente se igualará por su extensión y su continuidad en la historia de la investigación psicológica, a pesar de las limitaciones señaladas.

La problemática en torno al umbral iniciada por Fechner, ha generado un importante núcleo de investigaciones. Los primeros intentos para soslayar el problema de la variabilidad en el umbral consistieron en la adopción de un criterio estadístico y en determinar el umbral absoluto en base al valor de intensidad del estímulo que se detecta un 50% de las veces. Por otra parte, para paliar los efectos de las actitudes y motivaciones de los sujetos, se introdujeron ensayos en blanco, o ensayos en los que no se presenta el estímulo. En este contexto, al igual que en la TDS que examinaremos más adelante, se denomina ruido (R) a los ensayos en los que no se presenta el estímulo, y señal + ruido o simplemente señal (SR) a los ensayos en los que se presenta el estímulo). La tarea a realizar por los observadores consiste en contestar «Sí» o «No» ante la presentación de cada estímulo sobre la base de que lo haya detectado o no. Con la utilización de este procedimiento, en el que generalmente se presenta el mismo número de ensayos SR que de ensayos R mezclados aleatoriamente, se intenta que el único indicio para que el sujeto elabore la respuesta sea la proporcionada por su propio sistema sensorial (Tudela, 1981) y, por lo tanto, permite controlar que los observadores falseen las respuestas intencionadamente (por ejemplo, en una prueba auditiva para renovar el permiso de conducir el observador puede contestar muchas veces que detecta el tono que se presenta como estímulo, aunque no lo detecte, para evitar un diagnóstico de dificultad auditiva que le podría impedir obtener la renovación), y también que cometan sesgos (por ejemplo, cuando los sujetos contestan «SÍ» muchas veces ante la presentación de ensayos en blanco, están cometiendo un sesgo).

La ejecución en las tareas de detección con inclusión de «ensayos en blanco» permiten analizar la ejecución de los sujetos relacionando la tasa de aciertos (porcentaje de respuestas «Sí» ante la presentación de SR) con la de falsas


alarmas (porcentaje de respuestas <<SÍ>> ante la presentación de R) y observar, de esta forma, si se produce un sesgo en la respuesta o si se detecta la señal cuando se presenta realmente. Por ejemplo, supongamos que se ha realizado un experimento para determinar el umbral absoluto y los resultados de dos observadores diferentes (A y B) han sido los siguientes: una tasa de aciertos del 80% igual para ambos observadores (A y B) y una tasa de falsas alarmas del20% para el observador A e igual al 75% para el observador B. Aunque la tasa de aciertos es idéntica en los dos observadores, la elevada tasa de falsas alarmas en el observador B podría indicar que el observador B ha cometido un sesgo hacia la respuesta Sí, es decir, que ha respondido Sí en muchos ensayos en los que no se presentaba el estímulo. Una forma de corregir este sesgo consiste en aplicar una fórmula que tenga en cuenta la <<tendencia a adivinar» como la que se aplica en la corrección de pruebas objetivas de varias alternativas de respuesta:

donde P es el porcentaje real de aciertos, P Ac es el porcentaje de aciertos y P FA

el porcentaje de falsas alarmas. En el caso que estamos considerando:

pObservador A = (80- 20)/(100-20)= .75 p Observadorb = (80- 75)/(100-75)= .20

Por lo tanto, aunque la tasa de aciertos sea igual en ambos observadores, no se puede interpretar de la misma manera. Los resultados obtenidos aplicando la fórmula de corrección estarían más próximos a la tasa de aciertos real de los observadores.

De igual manera, y con el fin de subsanar los problemas señalados en relación con el umbral, se desarrollaron teorías que contemplan la actuación, no sólo del proceso sensorial, sino también del proceso de decisión en la determinación de la respuesta. Los trabajos más representativos en este campo los constituyen la formulación de la Teoría del Umbral Alto por parte de Blackwell (1963), la Teoría del Umbral Bajo (Atkinson, 1963; Luce, 1963) y la aplicación de la Teoría de Detección de Señales a la Psicofísica (Tanner y Swets, 1954; Green y Swets, 1966; MacMillan y Creelman, 1991; McNicol, 1972).

1.2. Teorías del umbral

La teoría del umbral alto propuesta por Blackwell (1963) asume la teoría clásica en la que se defiende que sólo cuando se traspasa el umbral de sensación se producirá sensación y no se producirá en el caso contrario. El supuesto básico en relación con el proceso sensorial es que ante la presentación de la señal (SR) se producirá sensación con una probabilidad determinada (p), y no


sensación con la probabilidad complementaria (1-p). Por otra parte, cuando se presenta ruido (R) no se traspasa el umbral, y, en consecuencia, no se producirá sensación, por lo que la probabilidad de que se produzca sensación ante la presentación de R será O, y la probabilidad de que se produzca no sensación ante la presentación de R será 1.

Con respecto a la actuación del proceso de decisión, se asume que el sistema optará por responder <<SÍ>> siempre que se ha producido sensación (por lo tanto, la probabilidad será 1), y responder << No>> en el caso contrario (por lo que la probabilidad será 0). Por otra parte, en el caso de que el resultado del proceso sensorial sea no sensación, se responderá <<SÍ>> (tendencia a adivinar) con una determinada probabilidad (g) y No con la probabilidad complementaria (1-g). La secuencia de acontecimientos se puede observar en la Figura 9.3.

Las predicciones de la teoría que establecen una relación lineal entre la tasa de aciertos y la de falsas alarmas, se confirman únicamente en muy pocos casos a través de la experimentación (Gescheider, 1985).

La teoría del umbral bajo propuesta por Luce (1963) se encamina a superar algunas de las dificultades de la propuesta anterior. El supuesto básico con respecto al proceso sensorial es que tanto la presentación de SR como la de R, producirán sensación con una determinada probabilidad y no sensación

1 ÁRBOL DE SECUENCIA DE ACONTECIMIENTOS DE LA TEORÍA DEL UMBRAL ALTO 1

1 PROCESO SENSORIAL 1 1 PROCESO DE DECISIÓN 1 1 RESPUESTA 1

<---- SÍ

sensación

< NO

SEÑAL (SR)

< SÍ

no sensación

1 -g NO

SÍ

SÍ

NO

RUIDO(R)

~ < SÍ

no sensación

1. g NO

SÍ

NO

Tasa de aciertos: P(Si/SR) = p + g (1 - p)

Tasa de falsas alarmas= P(Si/R) = g

FIGURA 9.3. Secuencia de acontecimientos propuesta por la Teoría del umbral alto.


con la probabilidad complementaria (las probabilidades son además diferentes ante la presentación de SR y R). Por lo tanto, se considera que el umbral es traspasado, en algunas ocasiones ante la presentación de R. En la Figura 9.4 se puede observar la secuencia de acontecimientos. En relación con el proceso sensorial: ante la presentación de SR, se producirá sensación con una determinada probabilidad (p) y no sensación con la probabilidad complementaria (1-p); y ante la presentación de R, se producirá sensación con una determinada probabilidad (q) y no sensación con la probabilidad complementaria (1-q). En relación con el proceso de decisión: Si se ha producido sensación, la respuesta será afirmativa con una probabilidad determinada (f) y negativa con la probabilidad complementaria (1-f). Si no se ha producido sensación la respuesta será Sí con una probabilidad (g) y No con la probabilidad complementaria (1-g).

Por lo tanto, en esta teoría, con respecto al proceso de decisión, se puede dar el caso de optar por la respuesta <<SÍ>> o <<No>>, tanto si se ha producido sensación como en el caso contrario, por lo que la regla de decisión es más flexible que en la propuesta anterior y además se contempla la influencia de variables motivacionales (incentivos) en el proceso de decisión. La manipu-

1 ÁRBOL DE SECUENCIA DE ACONTECIMIENTOS DE LA TEORÍA DEL UMBRAL BAJO 1

SEÑAL (SR)

RUIDO (R)

1- q

1 PROCESO SENSORIAL 1 1 PROCESO DE DECISIÓN 1

~si sensación ~

1-f NO

no sensación -< 1 -g

si

NO

sensación

<si

1-f NO

nosensación < Si

1-g NO

Tasa de aciertos: P(Si/SR) = pf + (1 - p) g

Tasa de falsas alarmas= P(Si/R) = qf + (1 - q) g

1 RESPUESTA 1

si

NO

si

NO

si

NO

si

NO

FIGURA 9.4. Secuencia de acontecimientos propuesta por la Teoría del umbral bajo.


lación de estas variables, como información sobre la probabilidad de presentación de SR y R, y ganancias-pagos asociadas con respuestas correctas e incorrectas, puede inducir sesgos en las respuestas en los dos sentidos. Los experimentos que han manipulado estas variables, confirman, en general las predicciones de la teoría (Luce, 1963; Gescheider, 1985).

Como hemos señalado anteriormente, la principal dificultad en relación con las teorías del Umbral es que la variación en la medida del umbral puede estar producida no sólo por los cambios en la sensibilidad de los observadores sino también por la motivación y las expectativas. A pesar de los distintos intentos teóricos y metodológicos desarrollados para solucionar este problema, la solución no es completamente satisfactoria. La teoría que vamos a considerar a continuación ofrece una solución más adecuada.

2. TEORÍA DE DETECCIÓN DE SEÑALES (TDS)

El procedimiento más potente en Psicología Experimental para el análisis de la precisión en la respuesta es el desarrollado en la Teoría de Detección de Señales. Esta teoría surgió en el ámbito de la ingeniería en relación con la detección de señales electromagnéticas en presencia de ruido (Peterson, Birsdall y Fox, 1954)y se desarrolló en la época de la guerra fría debido a la necesidad de desarrollar mecanismos de detección de señales muy débiles que permitieran descubrir los objetivos enemigos Qáñez, 1992). La introducción de la TDS en Psicología se debe a Tanner y Swets (1954) a través de sus investigaciones en el contexto de la Psicofísica. Aunque los primeros desarrollos en Psicología se produjeron en el ámbito de la psicofísica, la técnica se puede aplicar al análisis de la ejecución en otros campos (memoria, atención, aprendizaje, psicodiagnóstico, etc.) en cuanto que permite determinar no sólo el nivel de detección del estímulo, sino también el criterio adoptado por el sujeto para llevar a cabo su respuesta.

2.1. Descripción de la TDS

En la TDS se presentan dos clases de estímulos: uno de los estímulos, denominado señal o señal + ruido (SR) habitualmente es un estímulo de intensidad muy débil que se presenta sobre un fondo de ruido (R) que constituye el segundo estímulo y en el que no está presente la señal. Por ejemplo, sobre un fondo de ruido blanco de 20 dB (R) se presenta en un número determinado de ensayos como señal (SR) un tono de 1000Hz y 25 dB. Los ensayos en los que se presenta únicamente el ruido blanco son los ensayos R, los ensayos en los que se presentan ambos son los ensayos SR y la tarea del observador consiste en indicar en cada ensayo si se ha presentado la señal o no.

La TDS prescinde del concepto de umbral y supone que ante cualquier estimulación SR o R, el resultado del proceso sensorial consiste en una sen-


sación que puede adoptar múltiples valores. Cada uno de estos valores tiene una probabilidad de ocurrencia diferente ante la presentación de SR y ante la presentación de R. Además, considera que el sistema sensorial está sometido a fluctuaciones, por lo que el nivel de la sensación puede que varíe ante la presentación del mismo estímulo, adoptando distintos valores, o, por el contrario que sea idéntico ante la presentación de SR y R. Por otra parte, la TDS considera que en una tarea de detección interviene un proceso relacionado con el funcionamiento del sistema sensorial, cuyo resultado es una sensación de una determinada intensidad, y otro en relación con el proceso cognitivo o proceso de decisión, cuyo resultado es la respuesta.

En relación con el proceso sensorial, la TDS supone que la sensación puede ser producida tanto por la presentación de SR como por la de R y además, en ambos casos la sensación es de la misma naturaleza. Cuando se presenta SR, el conjunto de valores de sensación será distinto a cuando se presenta R. Además, cuando la señal es más intensa que el ruido, las sensaciones que suscite SR serán superiores a las que suscite R. Los valores más altos de sensación se producirán con una mayor probabilidad ante la presentación de SR y los más bajos con mayor probabilidad ante la presentación de R, aunque esto no excluye que en determinados ensayos puedan darse valores altos y bajos de sensación en ambos casos. Por lo tanto, lo que diferenciará al valor de sensación cuando se presenta SR y R es su distribución de probabilidad. Cuando se presenta SR, los valores de sensación tendrán una distribución de probabilidad determinada y cuando se presenta R otra distinta. En la Figura 9.5, se ilustran las ideas centrales de la TDS bajo el supuesto de que las distribuciones sean normales.

El índice del proceso sensorial es d' que se define como la distancia entre las distribuciones de SR y R. d' se verá afectada exclusivamente por variables que influyen en la intensidad de SR y R. En función del grado de solapamiento entre las distribuciones pueden ocurrir los siguientes casos: 1) Cuando las

1 Proceso sensorial!

1 Proceso de decisión 1 (

Distribución de R

Respuesta No

Distribución de SR

X Sensación

FIGURA 9.5. Ilustración de las principales ideas propuestas por la Teoría de detección de señales.


distribuciones de SR y R están completamente separadas, los valores de sensación de cada una de ellas no están asociados con la otra, por lo que la detección sería fácil y perfecta. 2) En el caso contrario, cuando las distribuciones de SR y R están totalmente superpuestas, los valores de sensación tendrían la misma probabilidad de provenir de la distribución de SR que de la de R, por lo que la detección sería imposible. 3) Cuando las distribuciones de SR y R están parcialmente solapadas, se presenta una zona de incertidumbre en la que los valores de sensación pueden provenir tanto de la distribución de SR como de la de R. Este último caso es el importante para la TDS, cuando la distancia entre las distribuciones de SR y R es grande, el valor de d' será mayor que cuando la distancia es pequeña.

En relación con el proceso de decisión, la TDS supone que el observador selecciona un criterio y a partir de aquí el proceso actúa de una forma determinista seleccionando la respuesta <<Sí» siempre que se supere el valor del criterio y <<No» en el caso contrario. La selección del criterio puede realizarse de dos formas. En la primera de ellas (criterio e), el observador puede seleccionar un punto sobre el eje de sensación, una vez seleccionado este punto el segmento de la derecha corresponderá a SR y asociado a la respuesta <<Sí» y el de la izquierda a R y estará asociado a la respuesta <<NO>> (Véase Figura 9. 6). En la segunda, el observador establece el criterio en base a la razón de verosimilitud o cociente entre las distribuciones de probabilidad de SR y R, en este caso se supone que el observador conoce y es capaz de tomar en consideración estas funciones.

En la Figura 9.6, se representa el criterio C en el segmento que divide el eje de decisión en dos partes (respuesta «SÍ» y respuesta «NO>>) y cada una de

.. Distribución de R Distribución de SR

P(No/SR) P(Sí/R)

.. Respuesta No Criterio

Respuesta Sí

FIGURA 9.6. Ilustración de la relación entre el punto correspondiente al criterio (C) y la determinación de la respuesta del observador.


las distribuciones de sensación producidas por SR o R en dos zonas. Por lo que respecta a la distribución de la señal SR, la zona correspondiente a esta distribución y que está situada a la derecha del criterio, representa la proporción de casos en que el observador responde <<SÍ>> ante la presentación de SR, o sea, la tasa de aciertos P(Sí/SR). Por otra parte, la zona correspondiente a la distribución de SR que está situada a la izquierda del criterio, representa la proporción de casos en los que el observador responde <<NO >> ante la presentación de SR, es decir la tasa de fallos P(No/SR). Por lo que respecta a la distribución de ruido R, la zona correspondiente a esta distribución y que está situada a la derecha del criterio, representa la proporción de casos en que el observador responde <<SÍ>> ante la presentación de R, o sea la tasa de falsas alarmas, P(Sí/R). Finalmente, la zona correspondiente a la distribución de R y situada a la izquierda del criterio representa la proporción de casos en los que el sujeto responde <<NO >> ante la presentación de R, es decir, la tasa de rechazos correctos, P(No/R).

2.2. Índices correspondientes al proceso sensorial (d') y al proceso de decisión

El procedimiento experimental en una tarea de detección presenta aleatoriamente a lo largo de cada sesión experimental dos tipos de ensayos: ensayos en los que se presenta la señal más ruido (SR), que generalmente consiste en un estímulo de intensidad débil presentado sobre un fondo de ruido, y ensayos en los que se presenta ruido (R) (que no es necesariamente ruido acústico sino cualquier estimulación que pueda afectar al sistema sensorial). La tarea del sujeto consiste en responder <<SÍ>> o <<NO>>, según crea que ha detectado la señal o no, es decir, actúa basado en una variable de evidencia y decide si la evidencia favorece la hipótesis de que se ha presentado SR o R. La tarea descrita se denomina Tarea Sí/No, existen otras tareas distintas como tareas de clasificación, elección múltiple, etcétera2 •

Los resultados obtenidos con la tarea de detección, se analizan mediante una matriz de resultados 2 x 2 que permite relacionar la situación estimular (SR o R) con la respuesta del sujeto (<<SÍ>> o <<No»), (Véase Cuadro 9.1) En las celdillas de la matriz se obtienen cuatro resultados experimentales en relación con la variable dependiente precisión en la respuesta: Aciertos, cuando se presenta SR y el sujeto contesta <<SÍ>> . Rechazos correctos, cuando se presenta R y el sujeto contesta <<No>>. Falsas Alarmas, cuando se presentaR y el sujeto contesta <<SÍ>> . Fallos, cuando se presenta SR y el sujeto contesta <<No>> .

Los dos primeros resultados corresponden a las respuestas correctas y los dos segundos a los errores. Las probabilidades de estos resultados se calculan

2. Un desarrollo deta llado de las mismas se puede consultar en McMillan y Creelman (1991) .


CUADRO 9.1. Matriz de resultados 2 x 2

Estímulo Respuesta

Sí No

SR Aciertos Fallos

R Falsas alarmas Rechazos correctos

dividiendo la frecuencia correspondiente a cada celdilla por el número de ensayos SR o R respectivamente, (Véase Cuadro 9.2). Así se obtiene la tasa correspondiente de aciertos, P(Sí/SR); rechazos correctos, P(No/R); falsas alarmas, P(Sí/R); y fallos, P(No/SR).

Las probabilidades correspondientes a los ensayos en los que se ha presentado SR (tasa de aciertos y fallos) son complementarias. Una vez conocida la tasa de aciertos, la tasa de fallos está determinada. Lo mismo ocurre con las probabilidades correspondientes a los ensayos en los que se ha presentado R, una vez que se conoce la tasa de falsas alarmas la tasa de rechazos correctos está determinada. Sin embargo, las probabilidades correspondientes a la tasa de fallos y rechazos correctos son independientes entre sí, y, lo mismo ocurre con las probabilidades correspondientes a la tasa de aciertos y falsas alarmas, por lo que sólo es necesario tomar en consideración dos de ellas. En TDS, se consideran únicamente la tasa de aciertos y la de falsas alarmas. Para ilustrar lo anterior, supongamos que se ha realizado un experimento de detección en el que se ha presentado 100 veces la señal + ruido (SR) y 100 veces ruido (R). Los resultados en la matriz serían los siguientes:

CUADRO 9.2. Cálculo de las tasas de aciertos, fallos, falsas alarmas y rechazos correctos

Estímulo Respuesta

Sí No

SR Aciertos (30) Fallos (70)

R Falsas alarmas ( 15) Rechazos correctos (85)

Tasa de aciertos P(SI/SR)= 30/100=0,30 Tasa de fallos P(No/SR)= 70/100=0,70 Tasa de falsas alarmas P(Sí/R)= 15/l 00= O, 15 Tasa de rechazos correctos P(No/R)= 85/100= 0,85


A partir de la tasa de aciertos P(Sí/SR) y de falsas alarmas P(Sí/R), y sobre la base de los supuestos de la TDS, se calculan el índice del proceso sensorial d' y el índice del proceso de decisión criterio e o {3. A continuación veremos, a partir del ejemplo anterior, cómo se calculan estos índices (suponiendo que se cumplen las condiciones de distribución normal e igual varianza). El procedimiento a seguir sería el siguiente:

l. Cálculo del índice de sensibilidad d'

A. Distribución correspondiente a la señal: 1 . Calcular la tasa de aciertos P(Sí!SR) = (30/100)= 0.3 2. Buscar en las tablas de la distribución normal: - la puntuación típica correspondiente a la tasa de aciertos, z(Sí!SR) = 0.525 -el valor de la ordenada Y en ese punto, Yz(Sí/SR)= 0.348

B. Distribución correspondiente a R l . Calcular la tasa de falsas alarmas P(Sí/R) = 15/100= 0.15 2. Buscar en las tablas de la distribución normal: - la puntuación típica correspondiente a la tasa de falsas alarmas, z(Sí/R) =

1,037 el valor de la ordenada Y en ese punto, Yz(Sí!R)= 0.233

C. Calcular el índice de sensibilidad d' según la fórmula, d'= z(SÍ/R)- z(Sí/ SR) = 1.037- 0.525 = 0.51.

- Un valor de d' igual a cero indicaría una falta de discriminación y valores elevados que la detección ha sido buena. En raras ocasiones se pueden presentar valores negativos, que responden generalmente a que los observadores contestan lo contrario de lo que tendrían que contestar.


11. Cálculo del criterio

A Cálculo del criterio e, referido al eje de sensación:

Representar en la distribución de SR la puntuación z(SÍ/SR) = .525, y trazar el criterio e de forma que sea perpendicular a dicho punto. En este caso el criterio e está referido a la media de la distribución de la señal. De la misma forma, representar en la distribución de R la puntuación z(Sí/R)= 1.037, y trazar el criterio e de manera que sea perpendicular a este punto. En este caso el criterio e, está referido a la media de la distribución de R.

Aplicar la fórmula e= -0.5[z(Sí/SR)+z(Sí/R)]=-0.781.

B. Cálculo del criterio sobre el eje de la razón de verosimilitud 13 (beta):

Calcular 13 según la formula, 13 = Yz(Sí!SR)/Yz(S/R) = 0.348/0.233 = 1 ,49 Un valor del criterio igual a uno indica un punto de selección del criterio

que no está sesgado, mientras que valores superiores a uno indican un criterio estricto y valores inferiores a uno un criterio laxo.

La TDS considera que los índices del proceso sensorial y el proceso de decisión son independientes y, por lo tanto, afectados por variables distintas. El índice del proceso sensorial, d', está afectado por variables sensoriales que inciden en la distancia entre las distribuciones de SR y R, como la intensidad de los estímulos, cuanto mayor sea la intensidad mayor será el valor de d'. Por otra parte, el índice del proceso de decisión, está afectado por el conocimiento por parte de los sujetos de la frecuencia relativa de SR y R (probabilidades a priori) y por variables motivacionales (incentivos, ganancias y pérdidas asociados a respuestas correctas y errores, etc.). De esta forma la TDS permite la obtención de dos medidas: la medida de la sensibilidad del observador, independiente del criterio y que además permanece prácticamente invariante con diversos procedimientos psicofísicos y tareas de detección; y la medida y control del criterio que utiliza el observador para tomar decisiones sobre la presencia o ausencia de una señal.

En la Figura 9.7 se puede observar cómo diferentes condiciones afectan de forma distinta a los índices el proceso sensorial y el proceso de decisión. En la figura se presentan las curvas separadas para que se observe mejor el efecto.


Variables que afectan a los índices del procesos sensorial y de decisión

Efecto de la intensidad de SR sobre d'

[ A. SR débil

"d._: 1 1

1 Distribución de R 1

1 B:SR intensa 1

l_____d'-1 1

lf\ lf\ 1

Media 1

Distribución de SR

lf\ Media

Efectos de los incentivos sobre la adopción del criterio

1 A. Criterio laxo 1

Criterio 1 Distribución de R 1

Media

Media

• ~~~?~~~ión de falsas

D Proporción de aciertos

'1 A-. C-n-'te-rio-es_tri_cto'[

Criterio No Si

329

FIGURA 9.7. Ilustración de la forma en que distintas variables podrían afectar a los procesos sensorial y de decisión.

2.3. Curva ROC

La TDS permite establecer la relación entre la tasa de aciertos y falsas alarmas y obtener además una medida del cambio de criterio de decisión del observador en función de las instrucciones que proporciona el experimentador, a través del análisis de la curva ROC (Swets, 1973 ). El procedimiento consiste en variar las instrucciones que influyen sobre la conducta de decisión del observador, mediante indicaciones de que adopte un criterio gradualmente más estricto o más laxo. De esta manera, se obtiene una tasa de aciertos y falsas alarmas distintas para cada conjunto de instrucciones que determinan un punto diferente en el gráfico y la unión de estos puntos da lugar a la representación


de la curva ROC. Ésta proporciona información sobre la posición del criterio de decisión del observador en función de las instrucciones proporcionadas. Dado que los parámetros físicos de la estimulación se mantienen constantes, aunque se varíen las instrucciones, el índice correspondiente al proceso sensorial, d', no varía y es independiente de la posición del criterio de decisión.

En la Figura 9.8 se presentan los resultados hipotéticos de dos situaciones que pueden influir en el cambio de criterio, y una situación en la que se ha variado tanto el criterio como la intensidad de SR y R, que puede afectar, a su vez, al índice de sensibilidad d'. En A, se supone que se han proporcionado instrucciones para adoptar un criterio laxo, intermedio o estricto. Cada una de estas condiciones produciría una tasa distinta de aciertos y falsas alarmas que genera los tres puntos diferentes de la curva ROC. El punto situado más a la izquierda correspondería a un criterio muy estricto, en el que las tasas de aciertos y falsas alarmas son bajas. El punto situado más a la derecha correspondería a un criterio muy laxo en el que ha aumentado considerablemente la tasa de aciertos pero también la de falsas alarmas. Finalmente, el punto intermedio se correspondería con una tasa de aciertos y falsas alarmas intermedias entre las anteriores. En B, se presenta un ejemplo en el que se han generado cinco puntos distintos a base de la información proporcionada a los sujetos sobre las probabilidades a priori. Finalmente, en C, se presenta una familia de curvas del tipo de las que predice la TDS. La distancia entre las curvas estaría

A

P (si 1 R)

e

0.5 1.0 P(si 1 R)

B

FIGURA 9.8. Curvas ROC generadas en función de distintas condiciones.


determinada en este caso por la separación entre las distribuciones de SR y R. A medida que aumenta esta separación, la detección es más perfecta y la curva se acerca a la esquina superior izquierda. La diagonal representa el caso en que las distribuciones de SR y R están totalmente solapadas, la tasa de aciertos es igual a la de falsas alarmas, y la detección no es posible.

Las aplicaciones de la TDS en Psicología han sido muy numerosas, su utilidad como técnica para separar la ejecución en procesos de detección y discriminación de los factores de sesgo implícitos en estos procesos la han convertido en un valioso instrumento en la investigación en percepción (Green y Swets, 1966; Swets, 1992).

3. MÉTODOS DE CONSTRUCCIÓN DE ESCALAS SENSORIALES

El problema general que se plantea con la utilización de los métodos indirectos es que no permiten obtener una medida directa de las sensaciones. Como vimos anteriormente, estos métodos únicamente proporcionan una medida de la cantidad de energía estimular necesaria para producir una inflexión en la respuesta de los sujetos; es decir, proporcionan una medida de la cantidad de energía estimular necesaria para detectar un estímulo, en cuyo caso la inflexión en la respuesta sería pasar de no sensación a sensación (umbral absoluto) o para establecer una diferencia entre un estímulo y otro, en cuyo caso la inflexión consistiría en pasar de sensación a más o menos sensación (umbral diferencial). Por lo tanto, no proporcionan una panorámica completa del funcionamiento del sistema sensorial, ya que la medición se realiza exclusivamente sobre la entrada que recibe el sistema sensorial (el estímulo físico) y no sobre su salida, sobre la respuesta que éste proporciona.

Sin embargo, para establecer una escala de los atributos sensoriales es necesario tener en cuenta la salida del sistema sensorial (la sensación) ya que ésta no presenta una relación puntual con los cambios en la intensidad del estímulo, tal y como predecía la ley de Fechner. En relación con este aspecto, el desarrollo experimentado por la acústica a principios del siglo XX permitió probar algunas predicciones de la ley. Por ejemplo, según la ley de Fechner, un sonido de una intensidad doble que otro sonido debería producir una sensación que fuera también dos veces la correspondiente al primer sonido; sin embargo, los resultados mostraron que ambos sonidos podían producir una sensación prácticamente igual. Por eso, para determinar de qué forma aumenta la sonoridad cuando aumenta la intensidad del estímulo, es necesario tener en cuenta tanto la entrada (estímulo físico) como la salida (sensación subjetiva) del sistema sensorial, con la finalidad de determinar experimentalmente las relaciones exactas entre las variaciones en la intensidad del estímulo y las sensaciones, o la relación funcional entre el estímulo físico y la respuesta psicológica.


Los desarrollos posteriores más representativos en relación con el problema de los métodos psicofísicos se deben a Stevens (1953, 1955, 1971, 1975), quien intentó medir directamente la magnitud de las sensaciones a través de los juicios cuánticos proporcionados por los sujetos.

3 .1. Métodos directos

Los métodos directos se clasifican generalmente en función del tipo de escala que se obtiene con la aplicación de los mismos. Habitualmente en los libros de texto se describen los métodos directos que dan lugar a escalas nominales, ordinales, de intervalo o de razón. En este capítulo examinaremos exclusivamente aquellos métodos más utilizados en psicofísica3 •

3 .1.1. Estimación de magnitud

En este método se presentan estímulos de diferente intensidad a los observadores y éstos deben realizar estimaciones numéricas sobre la magnitud de la sensación que produce cada uno de ellos. El procedimiento básico en el método de estimación de magnitud, adopta dos modalidades: en una de ellas se presenta un estímulo de intensidad fija (denominado estímulo de referencia) y el experimentador comunica que la sensación producida por dicho estímulo tiene un determinado valor numérico, por ejemplo 10, este valor es denominado módulo. En los siguientes ensayos, se presenta una serie de estímulos diferentes al estímulo de referencia (del orden de 15 a 20 estímulos presentados aleatoriamente en cada sesión experimental, y en un orden diferente para cada observador) y la tarea del observador consiste en asignar números a la sensación producida por cada uno de los estímulos en relación con el valor de sensación del estímulo de referencia. Si, a juicio del observador, la magnitud de la sensación producida por un estímulo determinado es el doble de la producida por el estímulo de referencia le asignará el valor 20, si es la mitad 5, etc. La segunda modalidad consiste en presentar los estímulos aleatoriamente y el observador emite el juicio sobre la magnitud de la sensación asignando igualmente valores numéricos. En este caso el experimentador no proporciona ningún valor como módulo, sino que son los propios sujetos los que lo establecen.

Los resultados con ambos procedimientos suelen ser muy parecidos. Generalmente se realizan dos o tres sesiones con cada observador con el fin de obtener dos o tres estimaciones por cada estímulo. Los resultados de todos los observadores se combinan para determinar la escala utilizando como promedios la mediana o la media geométrica. No es aconsejable utilizar la media

3 . Un tratamiento más extenso de los métodos directos se puede consultar en Blanco (1996).


aritmética ya que este promedio es muy sensible a estimaciones espurias (valores muy altos o muy bajos y poco representativos)

3.1.2. Producción de magnitud

En el método de producción de magnitud, se proporciona al observador el valor numérico correspondiente a la magnitud de sensación producida por un estímulo determinado y la tarea del observador consiste en manipular la intensidad de otros estímulos, de forma que igualen a la magnitud de sensación que se le ha proporcionado en cada ensayo. La aplicación de este método presenta como requisito indispensable que los estímulos varíen de forma continua.

Estos dos últimos métodos han sido los más utilizados en la construcción de escalas directas en psicofísica. Los resultados obtenidos con los métodos de estimación y producción de magnitud se representan gráficamente para obtener la denominada <<función psicofísica» (véase Figura 9 .9).

100.-----------------------~

50

Producción de magnitud

5

30 40 50 60 70 80 90 100

Intensidad del estímulo (en dB)

FIGURA 9.9 . Resultado de la aplicación de los métodos de estimación de magnitud (círculos blancos) y producción de magnitud (círculos negros). (Adaptado de

Gescheider, 1985).

Como puede observarse en esta figura, las funciones psicofísicas obtenidas mediante la aplicación de los métodos de estimación y producción de magnitud difieren ligeramente, la pendiente de la recta es más pronunciada en el método de producción de magnitud que en el de estimación de magnitud. Esto se debe a un efecto de << regresión hacia la media>> en los juicios que


proporcionan los observadores y consiste en la tendencia por parte de los observadores a evitar los juicios extremos, muy altos o muy bajos, aun en el caso de que hayan percibido correctamente. Es decir, cuando los sujetos estiman magnitudes, tienden a evitar los valores numéricos extremos de sensación (representados en la ordenada), mientras que cuando producen magnitudes tienden a no utilizar valores extremos en el ajuste del estímulo (representados en la abscisa); de aquí las diferencias en las pendientes de las rectas en las funciones psicofísicas obtenidas con ambos métodos. Por otra parte, la concordancia entre los resultados obtenidos con los dos métodos proporciona un índice de validez de la escala, por lo que es muy aconsejable utilizarlos juntos en los experimentos.

3.2. La ley psicofísica potencial

La utilización de los métodos directos de construcción de escalas por parte de Stevens culminó en el desarrollo y formulación de la ley potencial (Stevens, 1957), casi un siglo después de la propuesta por Fechner. En la <<ley psicofísica>> formulada por Stevens, la relación entre la magnitud de la sensación y la intensidad del estímulo es una función potencial del tipo

S= ceK

donde S es la magnitud de la sensación; e, es una constante arbitraria que determina la unidad de la escala; E, es la intensidad del estímulo y k, es el exponente que varía en función de las modalidades sensoriales y las condiciones estimulares. El tamaño del exponente k, determina a su vez la forma que adopta la función potencial (véase Figura 9.10.A). Si el valor de k = 1 (como en el caso de la longitud aparente en el gráfico) la función es lineal, indicando que la longitud percibida es proporcional a la intensidad del estímulo (longitud real). Si el valor de k > 1, como en el caso del electrochoque en el gráfico, la función aparece positivamente acelerada, indicando que la sensación aumenta muy rápidamente a medida que se incrementa el estímulo, excepto en los valores muy bajos. Finalmente, cuando k < 1, como en el caso de la estimación del brillo, la forma de la función es negativamente acelerada, indicando que la sensación de brillo crece más lentamente que el aumento en la intensidad del estímulo. Un procedimiento útil para conocer si los resultados de un experimento determinado producen una función potencial consiste en transformar en logaritmos los valores de la ecuación y representarlos gráficamente en coordenadas logarítmicas. Si la transformación logarítmica de los datos tiene como resultado una función lineal, se puede afirmar que los datos se ajustan a una función potencial (Véase Figura 9.10.B).


e ·O ·¡:; ro (f) e

"' (f)

~

"' "' "' .a ·¡:: O) ro

:::;:

e ·O ·¡:; ro (f) e

"' (f)

~

"' "' "' =ª e O) ro :::;:

80

70

60

50

40

30

20

10

o 10 20

A

30 40 50 60 70 80

Intensidad del estímulo

B

4

Intensidad del estimulo

335

90 100

FIGURA 9 .lO. Forma que adopta la función potencial según el valor del exponente k. En la parte A los ejes se han representado en una escala lineal; en la parte

B. en una escala logarítmica (adaptado de Gescheider, 1985) .

3.3. Método de ajuste de modalidades sensoriales y validez de la ley psicofísica potencial

Los métodos conducentes a escalas de razón requerían que los observadores poseyeran una cierta destreza en el manejo de los números a la hora de proporcionar juicios cuánticos sobre la magnitud de sus sensaciones. En consecuencia, la validez de la ley potencial podía depender de este factor. Para obviar este problema y determinar la validez de la ley potencial, Stevens diseñó una nueva técnica, el procedimiento de ajuste de modalidades sensoriales distintas, en el que no se requería que los observadores proporcionaran juicios numéricos sobre la magnitud de sus sensaciones. El procedimiento consiste en presentar un estímulo correspondiente a una modalidad sensorial determina-


O Ajustes del ruido a la vibración

D Ajustes de la vibración al ruido

Ruido (en dB)

FIGURA 9.11. Funciones de igual sensación obtenidas con la técnica de emparejamiento entre modalidades (adaptado de Gescheider, 1985).

da (por ejemplo, un sonido). A continuación, se presenta un segundo estímulo correspondiente a una modalidad sensorial diferente (por ejemplo, una vibración aplicada en la palma de la mano) y se pide a los observadores que modifiquen la intensidad del segundo estímulo hasta que las sensaciones producidas por los dos estímulos, el sonido y la vibración táctil, les parezcan iguales.

En la Figura 9.11 se presentan los datos correspondientes a un experimento en el que se utilizó la técnica descrita, obteniendo los emparejamientos en la magnitud de sensación para los valores de intensidad del estímulo descritos en los ejes vertical (vibración en dB) y horizontal (ruido sonoro en dB). Este tipo de gráficos recibe el nombre de función de igual sensación.

La validez de la ley potencial puede determinarse estableciendo predicciones a partir de la aplicación del método de estimación de magnitud a dos modalidades sensoriales por separado. Si la función potencial obtenida para cada una de ellas es la correcta, la función de igual sensación que se obtiene aplicando el método de ajuste de modalidades debería ser también una función potencial. La técnica de ajuste entre modalidades se ha utilizado en gran número de investigaciones para validar la ley potencial y los resultados de numerosos experimentos proporcionan un fuerte apoyo a esta ley (Stevens, 1975).

La ley potencial es aplicable a cualquier continuo que presente variaciones cuantitativas en la magnitud sensorial. Por ejemplo, en continuos como el brillo, las sensaciones se pueden cuantificar y los observadores pueden emitir juicios sobre la cantidad de brillo. Estos continuos se denominan protéticos. A diferencia de los anteriores, en los continuos metatéticos, las sensaciones varían de forma cualitativa, por ejemplo, un cambio en la longitud de onda de un estímulo luminoso puede provocar un cambio en la apariencia de azul


a verde. En este caso los observadores emitirían juicios sobre la cualidad no sobre la cantidad y la ley potencial no se podría aplicar.

3.4. Limitaciones de la propuesta de Stevens

A pesar del numeroso volumen de investigación derivado de esta corriente teórica y del gran volumen de resultados en apoyo de la ley de Stevens (D'Amato, 1970; Stevens, 1975), la corriente de la <<nueva psicofísica>> no está exenta de problemas.

Por lo que respecta a la medida, el problema estriba en determinar qué es lo que se mide con la utilización de los métodos directos. Una de las críticas se ha centrado en la utilización de números en el método de estimación de magnitud. Este problema se intentó resolver apelando a que en el método de ajuste de modalidades no se utilizan números y los resultados son, en general, equiparables a los obtenidos con el método de estimación de magnitud. Sin embargo, el mismo Stevens pareció aceptar el hecho de que la medida directa obtenida con el último método no es tan directa (Krueger, 1989).

En relación con la adecuación de la ley potencial como una descripción de los resultados psicofísicos, Ekman y Sjoberg (1965) señalan que la ley potencial sólo se mantiene cuando se utilizan métodos directos, y tampoco en este caso, se mantiene de forma invariable. En este sentido los resultados de los experimentos de Hood y Finkelstein (1979) sobre estimación del brillo muestran que la ley potencial no describe de manera adecuada los datos, y en los de Luce y Mo (1965) sobre estimación de peso, los resultados se desvían sistemáticamente de la ley potencial. En opinión de McKenna (1985), el hecho de que se obtenga una función potencial únicamente con métodos directos cuestiona la validez de la ley. Por otra parte, y en relación con este mismo aspecto, parece que existe una controversia en relación con los datos individuales. Mientras que en los experimentos de Stevens y Guirao (1961), la ley parece que describe de manera adecuada este tipo de datos, en otros experimentos ocurre lo contrario (Friedes y Phillips, 1966). Por lo tanto, la ley psicofísica potencial ofrecería una descripción empírica razonable, pero no perfecta, de la relación entre la intensidad de los estímulos y los juicios sobre la magnitud de las sensaciones (McKenna, 1985).

3.5. Interpretación de la ley potencial

3. 5 .1. 1 nterpretación sensorial

Basándose en los datos anteriores, Stevens (1970) consideraba la ley potencial como un reflejo de la actividad del sistema sensorial. Los receptores sensoriales transducirían la energía que incide sobre los órganos de los sentidos y el tamaño del exponente k, reflejaría las diferencias entre los sistemas senso-


riales. Por ejemplo, el exponente en el caso del brillo es 0.33 y para el shock eléctrico 3.5; estas diferencias en el tamaño de los exponentes reflejarían las diferencias existentes entre los dos sistemas sensoriales. Desde este punto de vista, la ley potencial se debería a procesos biológicos periféricos.

Sin embargo, numerosos datos contradicen esta interpretación. Si la ley potencial se debiera exclusivamente a la actuación de procesos periféricos, no se vería afectada por factores ajenos al procesamiento sensorial (Baird, 1997). Es decir, el exponente de la función potencial no debería variar por la influencia de factores no sensoriales. Los resultados de algunas investigaciones muestran todo lo contrario ya que el exponente de la ley potencial varía en función de factores como: 1) la posición del estímulo de referencia en el rango de valores estimulares utilizados; el exponente es menor cuando el estímulo de referencia se elige de entre los estímulos más débiles o más intensos que cuando presenta una intensidad intermedia (Hellman & Zwislocki, 1961); 2) el rango de intensidades presentadas en el experimento (Poulton, 1989) y 3) la posición del estímulo de referencia en la serie estimular (Engen & Ross, 1966). Estos resultados, que hacen referencia al efecto del contexto estimular sobre el exponente de la ley potencial, han llevado a elaborar interpretaciones diferentes.

3.5 .2. Interpretaciones cognitivas

Las interpretaciones alternativas de la ley potencial consideran exclusivamente la actuación de procesos cognitivos. Warren (1969, 1981) en su interpretación del correlato físico, señala que los juicios que emiten los observadores no son juicios sobre la magnitud de las sensaciones sino juicios sobre los estímulos. En opinión de Warren, los sujetos al emitir juicios toman como base determinados atributos físicos de los estímulos relacionados con la magnitud sensorial. Por ejemplo, cuando estiman que un sonido es el doble de intenso que otro estímulo de referencia, su juicio se basa en que les parece que está más cercano que el estímulo de referencia. Es decir, basan su juicio en un atributo físico (la distancia) a partir de las relaciones aprendidas previamente sobre la distancia de la fuente del sonido y su intensidad. Lo mismo ocurriría al emitir juicios sobre el brillo; el observador tomaría en consideración la distancia entre el objeto y la fuente de iluminación sobre la base de experiencias previas. En opinión de Baird (1997), la interpretación de Warren se basa en una suposición falsa, puesto que asume que los observadores estiman la distancia visual con precisión. Sin embargo, la estimación de la distancia visual está influenciada igualmente por el contexto y otros factores que afectan a los juicios psicofísicos (Baird, 1970; Baird & Wagner, 1991).

En la misma línea, Poulton (1968, 1989) en su hipótesis sobre el rango de valores estimulares, señala que lo que refleja el tamaño del exponente de la función potencial son variaciones en las condiciones experimentales, y no diferencias en los sistemas sensoriales. Entre las condiciones que pueden afectar


al tamaño del exponente señala el rango de valores estimulares utilizado, el valor del estímulo estándar y el módulo seleccionado, que constituyen factores de sesgo de los juicios.

En conclusión, no existe actualmente un acuerdo en relación con la interpretación de la ley potencial, sobre todo cuando las interpretaciones se polarizan, aludiendo exclusivamente a factores sensoriales o factores cognitivos. En relación con este punto, Baird (1997) señala que la interpretación de la ley depende de numerosos factores que incluirían tanto atributos sensoriales como factores cognitivos (contexto estimular e instrucciones proporcionadas a los sujetos).

4. TIEMPO DE REACCIÓN (TR)

Una de las variables dependientes más utilizada en el estudio de la percepción es el tiempo de reacción, es decir, el tiempo transcurrido entre la presentación (inicio) del estímulo y el inicio de la respuesta. Sin embargo, a pesar de que en la actualidad se utiliza con profusión no siempre ha sido así.

El desarrollo histórico en el estudio de la cronometría mental presenta varias etapas bien definidas (Meyer et al., 1988). La <<prehistórica>> comprende las etapas anteriores a 1850. Aunque en este periodo se desarrollan las primeras técnicas de medida de los procesos mentales en el ámbito de la astronomía (Bessel, 1823), sin embargo los resultados obtenidos tienen poca repercusión. Prueba de ello es que en el ámbito de la fisiología, la característica general de la etapa es una actitud negativa por parte de los científicos ante la posibilidad de medición de la tasa de conducción nerviosa, basada en la creencia de que ésta presenta los mismos rangos que la velocidad de la luz.

Es a partir de 1850, con los primeros trabajos de Helmholtz (1850) sobre la utilización del TR para la medida de la conducción nerviosa, cuando comienza la etapa <<dorada» en el estudio del tiempo de reacción. Curiosamente, las únicas referencias a este trabajo aparecen como notas en una publicación de 1850 y obtuvieron una gran difusión gracias a que el artículo se tradujo al inglés en 1853 (Woodworth, 1938).

La aportación de Helmholtz tuvo una gran repercusión, fundamentalmente por dos razones: Primera, porque propició el inicio real de la cronometría mental en la Psicología Experimental. Segunda, porque la cronometría mental va unida a la fisiología, tendencia que encontraremos en los trabajos más recientes en el análisis de la problemática del TR como variable dependiente. En esta época se llevan a cabo aportaciones fundamentales como el desarrollo del método de substracción de Donders (1868) o la aplicación de las curvas de velocidad y precisión al estudio de los movimientos motores, realizada por Woodworth (1899).

No obstante, el notable desarrollo experimental sobre este problema se vio frenado hasta aproximadamente 1900, por la crítica devastadora de Kül-


pe al supuesto de aditividad, que sostenía que el hecho de eliminar o añadir procesos podría tener una influencia en la configuración de todos ellos. A pesar de esto, los estudios sobre tiempo de reacción no desaparecen totalmente en esta época. Prueba de ello, es que aunque en dos obras representativas de la Psicología Experimental como son el Handbook of Experimental Psychology (Stevens, 1951) y el Method and Theory of Experimental Psychology (Osgood, 1953) no se trata el estudio del tiempo de reacción; sin embargo, tanto en la obra de Titchener (1901, 1905) en la de Woodworth de 1938, como en la posterior de Woodworth y Schlosberg (1954), el estudio del TR está representado como contenido relevante de la Psicología Experimental.

Pero es a partir de 1969 con la traducción del trabajo de Donders <<Sobre la velocidad de los procesos mentales>>, y la publicación del trabajo de Saul Stenberg sobre las ampliaciones del método de Donders, cuando se produce un <<renacimiento» en el estudio del tiempo de reacción y éste alcanza un fuerte protagonismo como medida de ejecución. Este protagonismo ha estado muy influido por la naturaleza de la investigación en Psicología Cognitiva (Pachella, 1974).

4.1. Tareas de TR

Las tareas clásicas en los experimentos sobre TR son las descritas por Donders en el artículo citado anteriormente y que dio lugar al desarrollo de esta medida. En la tarea de tiempo de reacción simple, se presenta en el experimento un único estímulo, por ejemplo un destello luminoso, y el observador tiene que dar una respuesta (presionar una llave de respuesta, decir sí, etc.) tan pronto como lo haya percibido. La medida del tiempo de reacción en cada ensayo del experimento se determina en relación al tiempo transcurrido desde el inicio del estímulo (destello luminoso) hasta el inicio de la respuesta. Según Donders, en esta tarea únicamente estaría implicado el proceso de detección.

En la tarea de tiempo de reacción de elección, se pueden presentar dos o más estímulos en cada ensayo (por ejemplo una luz roja, una azul y otra verde) y el observador tiene que responder de manera diferente a cada una de ellas (por ejemplo, presionando una llave de respuesta ante la presentación de la luz roja, otra llave diferente cuando se presenta la luz azul y otra distinta cuando se presenta la luz verde). Donders suponía que en este caso, los procesos implicados serían detección, discriminación y selección de respuesta, puesto que ante la presentación de los estímulos de distinto color el observador debe responder de forma diferente seleccionando la respuesta adecuada a ese estímulo (presionar la llave de respuesta correspondiente a cada estímulo).

En la tarea de tiempo de reacción selectivo, se presentan en el experimento dos o más estímulos, por ejemplo una luz roja y una luz azul. El observador tiene que presionar una llave de respuesta únicamente ante el estímulo que le indique el experimentador en las instrucciones (por ejemplo, la luz roja) y no tiene que responder cuando se presenta la luz azul. La medida del TR, en este caso, es el


tiempo transcurrido desde la presentación del estímulo al que hay que responder (luz roja) hasta el inicio de la respuesta. En opinión de Donders, los procesos implicados en esta tarea serían detección del estímulo y discriminación.

4.2. Problemática específica del tiempo de reacción

La problemática del tiempo de reacción se puede considerar desde dos vertientes (Pachella, 1974). Por una parte, aquellos aspectos relacionados con el TR como medida, que permiten una interpretación adecuada de los resultados de los experimentos en los que se utiliza como variable dependiente; y por otra, un aspecto más teórico como es el conocimiento de los procesos psicológicos básicos y la contrastación de las predicciones que los modelos de procesamiento de la información realizan sobre la duración de estos procesos.

4.2.1. La medida del TR

Dada la profusión con la que se utiliza el TR como variable dependiente en Psicología, podría parecer a primera vista, que esta medida se considera como universalmente válida y que los parámetros que permiten obtener una medida fiable y una interpretación adecuada están claramente definidos. Sin embargo esta primera impresión es engañosa, y el hecho de utilizar el TR como variable dependiente en los experimentos debe tener en cuenta una serie de problemas, que pueden distorsionar la interpretación posterior de los resultados.

El primer problema a tener en cuenta en la medida del tiempo de reacción, es determinar aquellos parámetros y condiciones que producen variaciones en la variable dependiente TR, y que permiten una interpretación adecuada del mismo. Tradicionalmente la línea de investigación que se ha ocupado de determinar estos parámetros, se ha centrado en el análisis de la distribución de los estímulos y las respuestas, intervalos entre ensayos, efecto de la precisión sobre la velocidad y viceversa, etc. (Pachella, 1974). A continuación, se analizarán los problemas más importantes y se examinarán las posibles soluciones en relación con la problemática citada.

l. El primer problema, apuntado por Pachella (1974), está en relación con la definición operativa del TR y se traduciría en la pregunta sobre qué estamos midiendo cuando utilizamos el TR como variable dependiente en un experimento.

La definición operativa más aceptada sobre el TR, es el intervalo temporal entre la presentación del estímulo y el inicio de la respuesta. En opinión de Pachella, en esta definición, a menos que se expliciten los términos implicados, pueden presentarse problemas, dado que sus efectos pueden confundirse con los efectos de las condiciones experimentales. Por ejemplo, el término presentación del estímulo, puede resultar ambiguo y carente de significación psicológica cuando consideramos las diferencias entre presentación del estí-


mulo simultánea o sucesiva; en modalidades sensoriales que presentan características temporales distintas (como es el caso de visión y audición, etc.). De igual manera, la definición del inicio de la respuesta, debe tener en cuenta aquellos aspectos sensoriales que pueden influenciar su puesta en marcha.

2. Un segundo problema se presenta en relación con las distribuciones del tiempo de reacción. La situación ideal en un experimento que utilice el TR como variable dependiente es que la respuesta del sujeto refleje la cantidad de tiempo mínima requerida para realizar una respuesta correcta. Por esto se eliminan del análisis de datos las puntuaciones de TR correspondientes a una respuesta incorrecta. Sin embargo, a menudo nos encontramos en los resultados de los experimentos tiempos adulterados (excesivamente cortos o excesivamente largos) que pueden distorsionar la interpretación de los resultados.

Si, en base a los tiempos adulterados, la distribución es muy asimétrica, el promedio de los TR, que es el estadístico más utilizado en la mayoría de los experimentos, nos aporta escasa información, dado que la medida obtenida está muy influida por los valores extremos.

Los procedimientos para eliminar este problema son variados; sin embargo, no están exentos de problemas. El criterio en algunas investigaciones consiste en eliminar las puntuaciones más altas o más bajas, según un rango prefijado de antemano. Este procedimiento presenta el problema de que si no se define previamente por qué se adopta un criterio determinado, la elección del mismo es arbitraria, y se puede perder información interesante.

Una alternativa diferente consiste en utilizar la mediana como promedio; sin embargo, este procedimiento presenta el problema de que destruye la distribución estándar del tiempo de reacción y la interpretación de los resultados se modifica. Un problema más grave relacionado con el uso de la mediana se presenta cuando se comparan condiciones experimentales con desigual número de ensayos (Miller, 1988). En este caso se produce un sesgo cuando el tamaño de la muestra de medianas es pequeño, debido al error aleatorio de obtener con mayor probabilidad una muestra de medianas, cuyo percentil verdadero no está cercano al 50%.

Un procedimiento más adecuado consiste en transformar las puntuaciones del TR en puntuaciones de latencia media (diversos procedimientos se presentan en Tukey, 1977), cualquiera de las transformaciones propuestas por Tukey elimina los valores adulterados y convierte la distribución de la latencia en una distribución simétrica, permitiendo la interpretación de los datos de manera adecuada.

4.2.2. Técnicas de velocidad y precisión

Las relaciones entre TR y errores, que se han descrito en el apartado de medida como posibles fuentes de error en la interpretación de los resultados, se han utilizado como medidas combinadas de ejecución para examinar los procesos psicológicos básicos implicados en el TR (Pachella, 1974).


El procedimiento experimental consiste en diseñar condiciones que acentúen la velocidad o la precisión. Sperling y Dosher (1986) señalan dos procedimientos básicos: a) procedimiento clásico de TR, aportando además, una matriz de pagos para la velocidad y penalizaciones por los errores y b) procedimiento de tiempo límite, en el que la respuesta debe darse en un tiempo predeterminado con la finalidad de evitar penalizaciones si se supera este tiempo.

La forma de inducir velocidad consiste en aumentar los pagos por responder rápido y las penalizaciones por los errores; acortar el tiempo límite, y disminuir el intervalo temporal de señal para la respuesta, en los dos procedimientos respectivamente. Con el fin de acentuar la precisión, se aumenta la penalización por cometer errores, se aumenta el tiempo límite y se aumenta la duración de la señal para la respuesta, en cada uno de los procedimientos. Los resultados de la precisión se representan en función del TR y la función obtenida presenta una curva que representa un crecimiento continuo desde un nivel base hasta que se alcanza la asíntota.

5. TÉCNICAS Y PROCEDIMIENTOS EXPERIMENTALES EN EL ESTUDIO DE LA PERCEPCIÓN

Los procedimientos y técnicas utilizadas en el estudio de la Percepción han sido muy variados. Los procedimientos psicofísicos, se utilizan fundamentalmente en aquellas investigaciones encaminadas a determinar la sensibilidad de los mecanismos del sistema perceptivo. El procedimiento básico en este contexto consiste en la determinación del umbral de detección de las dimensiones físicas del estímulo. Los procedimientos descritos en los apartados de métodos psicofísicos, junto con los paradigmas de adaptación, enmascaramiento, y suma sub-umbral, que veremos a continuación, desarrollados en relación con la teoría de los canales múltiples se utilizan fundamentalmente en el acercamiento psicofísico (Sierra-Vazquez, 1992).

El método de adaptación selectiva consiste en reducir la sensibilidad de un estímulo (estímulo de prueba) mediante la exposición previa y prolongada a otro estímulo (estímulo adaptador). La reducción en la sensibilidad es mayor cuando los dos estímulos presentan semejanzas en alguna dimensión -por ejemplo, orientación, frecuencia espacial, distancia espacial- y es mínima cuando son muy diferentes en todas las dimensiones (Braddick, Campbell y Atkinson, 1978).

El procedimiento de enmascaramiento consiste en la presentación simultánea de dos estímulos, uno de los cuales (estímulo que enmascara) reduce la sensibilidad del otro (estímulo de prueba) que presenta características parecidas al primero, por lo que para detectarlo es necesario elevar el umbral en aquella dimensión estimular que presenta semejanzas con las del estímulo que enmascara.


Por último, el procedimiento de suma subumbral, consiste en la presentación simultánea de dos estímulos, uno de los cuales (estímulo subumbral) aunque no se percibe aisladamente, eleva o reduce el umbral del otro estímulo (estímulo de prueba).

Los procedimientos experimentales se utilizan básicamente en la línea de investigación cuyo objetivo fundamental es contrastar las predicciones teóricas acerca de la relación entre los hechos y los procesos perceptivos básicos, en función de las manipulaciones sistemáticas de las variables estimulares. En este ámbito, los procedimientos son tan variados que resulta casi imposible enumerarlos. Sin embargo, pueden establecerse varias categorías que englobarían los procedimientos experimentales más específicos como los de detección, discriminación, identificación y categorización descritos anteriormente en otros capítulos de este libro.

RESUMEN

En este capítulo se han examinado los métodos y técnicas más utilizados en el estudio de la percepción. En primer lugar, se ha destacado cómo desde los inicios de la Psicología se ha intentado medir la experiencia perceptiva. Los desarrollos sobre la medida se han llevado a cabo en el ámbito de la Psicofísica, rama de la Psicología que se ha ocupado del estudio de las relaciones entre los estímulos físicos y las sensaciones que el observador experimenta cuando es expuesto a dichos estímulos. Los principales métodos desarrollados en el ámbito de la psicofísica fechneriana para determinar los umbrales absoluto y diferencial son el método de los estímulos constantes, el método de los límites y el método de los ajustes. En segundo lugar, se ha descrito la Teoría de detección de señales, en el marco de la cual se ha desarrollado el instrumento más potente en relación con la medida de precisión de la respuesta y que proporciona la forma de calcular índices independientes en relación con los dos procesos, el proceso sensorial y el proceso cognitivo o de decisión, que inciden en la ejecución en una tarea de detección. En tercer lugar, se han analizado los métodos de construcción de escalas sensoriales, desarrollados en el contexto de la <<nueva psicofísica>> y denominados métodos directos, fundamentalmente los métodos de estimación y producción de magnitud y el método de ajuste de modalidades sensoriales. También se ha analizado una de las variables dependientes más utilizadas en los experimentos: la medida de latencia o tiempo de reacción. Finalmente se han considerado brevemente las técnicas y procedimientos experimentales más utilizados en los distintos ámbitos de investigación en Psicología de la percepción.

GLOSARIO

Acierto: Respuesta <<Si>> ante la presentación de SR. Agregados perceptivos: Unidades formadas sobre la base del agrupamiento de elementos

con una propiedad común. Atributos: Según la teoría clásica de la percepción, aspectos de una sensación que per

miten su descripción. Pueden variar de forma diferente pero no tienen existencia independiente.

Beta (B): En TDS, índice del proceso de decisión. Valor de la razón de verosimilitud que determina la elección de una respuesta.

Borde: Cambio abrupto en intensidad entre dos regiones del campo visual. Bordes de iluminación: Cambios bruscos en luminancia que el sistema visual atribuye a

cambios en la iluminancia de la escena. Bordes de reflectancia: Cambios bruscos en luminancia que el sistema visual atribuye a

cambios en la claridad de las superficies de la escena. Brillo: Atributo de la sensación visual determinado por la luminancia percibida. Campo perceptivo: En general hace referencia a la totalidad de la escena visual perci

bida. En la escuela de la Gestalt se consideraba análogo a los campos magnéticos o eléctricos.

Campo receptivo: Es la región de la retina cuya estimulación aumenta o disminuye la tasa de disparo de una determinada neurona.

Campo visual: Todas las partes del medio ambiente que estimulan los ojos en un momento determinado.

Cancelación de matiz: Procedimiento experimental psicofísico para analizar los procesos oponentes.

Característica simple: Atributos de una forma que permiten distinguirla de otras (por ejemplo, orientación o color).

Características componentes: Elementos discretos de la cara que se refieren exclusivamente a las partes que la componen y pueden definirse sin hacer referencia a otras partes del estímulo (por ejemplo, boca, nariz, etc.).

Características primitivas: Unidades elementales e irreductibles de una representación. Características relacionales: Relación entre las características componentes que forman

la configuración. Categorización del color: Proceso cognitivo de asignación de una categoría a una repre

sentación perceptiva de color.


Categorización perceptiva: Proceso cognitivo de asignación de significado a una representación perceptiva.

Células complejas: Células de la corteza visual primaria cuyos campos receptivos son más grandes que los de las células simples, admiten mayor variabilidad que éstas en la orientación de los estímulos y son sensibles al movimiento. Su respuesta no es lineal respecto de la cantidad de luz recibida.

Células con inhibición final: Células de la corteza visual primaria que se caracterizan por una disminución de su respuesta cuando la longitud de la línea que la estimula aumenta por encima de un límite. Responden preferentemente a líneas que presentan una terminación.

Células hipercomplejas: Denominación anticuada de las células con inhibición final. Células simples : Células de la corteza visual primaria cuyos campos receptivos respon

den a características elementales de los objetos tales como líneas o bordes con una determinada orientación y ubicación. Su respuesta lineal a la cantidad de estimulación recibida es una de sus principales características.

Chunk: Unidad del conocimiento adquirido por el sujeto en el proceso de codificación según G. Miller.

Ciencia Cognitiva: Empresa multidisciplinaria para el estudio de la cognición en la que intervienen la psicología cognitiva, la neurociencia, la inteligencia artificial, la lingüística computacional, la antropología y la filosofía de la mente.

Claridad: Atributo de la sensación visual determinado por la reflectancia percibida. Claves: Indicadores que proporcionan información sobre la profundidad. Claves binoculares: Claves de profundidad que requieren los dos ojos para ser usadas. Claves dinámicas: Claves de profundidad producidas por el movimiento del observador

en relación con los objetos o de los objetos respecto a distintos marcos de referencia. Claves estáticas: Claves de profundidad proporcionadas por una escena sin movimiento. Claves monoculares: Claves de profundidad que sólo requieren de un ojo para ser usadas. Claves oculares: Claves de profundidad estáticas que tienen su origen en el funciona-

miento mecánico de la musculatura ocular. Claves pictóricas: Claves de profundidad estáticas que proporcionan información óp

tica. Codificación del color: Conjuntos de procesos implicados en la generación de la repre

sentación del color. Colores acromáticos: Colores cuyo aspecto está determinado por los cambios en la di

mensión de claridad. Colores complementarios: Parejas de colores cuya mezcla de luces en proporciones ade

cuadas produce un color acromático. Colores cromáticos: Conjunto de colores espectrales y no espectrales. Colores espectrales: Colores cuyo matiz está relacionado con una determinada longitud

de onda. Colores no espectrales: Colores cuyo matiz está relacionado con una mezcla de longi

tudes de onda. Componente fundamental: El componente sinusoidal de frecuencia más baja de una onda. Componentes armónicos: Componentes sinusoidales de una onda cuya frecuencia es un

múltiplo entero de la frecuencia fundamental. Composición espectral: Determinación de los componentes ondulatorios del espectro

luminoso. Conexión excitatoria: La existente entre dos unidades de procesamiento cuando la acti

vación de la primera unidad provoca un aumento en la activación de la segunda.

GLOSARIO 347

Conexión inhibitoria: La existente entre dos unidades de procesamiento cuando la activación de la primera unidad provoca una disminución en la activación de la segunda.

Conexionismo: Aproximación teórica dentro de la ciencia cognitiva caracterizada por la utilización de modelos basados sobre la construcción de redes neurales.

Configuración: Unidades perceptivas basadas en la percepción de la relación espacial entre los elementos que las componen.

Conformación óptica ambiental: Concepto acuñado por Gibson que hace referencia al patrón global de estimulación.

Conjunción ilusoria: Percepción de un objeto en el que se produce una combinación errónea de características simples procedentes de dos objetos (por ejemplo, percepción de un cuadrado verde cuando se presentan círculos verdes y cuadrados rojos).

Conos generalizados: Superficies generadas a partir del movimiento de una sección transversal (que puede variar en tamaño pero no en forma) a lo largo de un eje principal.

Conos L: Receptores preferentemente sensibles a las longitudes de onda larga del espectro luminoso.

Conos M: Receptores preferentemente sensibles a las longitudes de onda media del espectro luminoso.

Conos S: Receptores preferentemente sensibles a las longitudes de onda corta del espectro luminoso.

Constancia de la claridad: Fenómeno perceptivo consistente en el mantenimiento de la claridad de los objetos a pesar de los cambios en la iluminación.

Constancia del color: Fenómeno perceptivo consistente en el mantenimiento del color de los objetos a pesar de los cambios en la estimulación física.

Constancia del objeto: invariancia en la apariencia del objeto cuando se observa desde distintos puntos de vista.

Constancia del tamaño: Fenómeno perceptivo consistente en el mantenimiento de la percepción del tamaño de los objetos a pesar de los cambios en la distancia a la que se observan los mismos.

Continuos metatéticos: Continuos en los que las sensaciones varían de manera cualita-tiva.

Continuos protéticos: Continuos en los que las sensaciones varían de manera cuantitativa. Contorno: Borde que delimita una figura. Contracción óptica: Movimiento convergente desde todas las direcciones de los puntos

del campo visual hacia el punto de fijación que permanece estático. Contraste: Diferencia en luminancia entre dos zonas del campo visual. Contraste simultáneo: Fenómeno perceptivo consistente en cambios en la percepción

del color debido al contexto. Convergencia binocular: Clave binocular de profundidad determinada por el tamaño

del ángulo de convergencia. Convergencia de paralelas: Regla de la perspectiva lineal según la cual las líneas para

lelas en el espacio tridimensional se representan en dos dimensiones por líneas que convergen hacia el punto de fuga.

Convergencia ocular cruzada: Procedimiento de fusión de las dos medias-imágenes de un estereograma mediante la convergencia de los ojos en un punto de fijación que se aproxima al observador.

Convergencia ocular no cruzada: Procedimiento de fusión de las dos medias-imágenes de un estereograma mediante la convergencia de los ojos en un punto de fijación que se aleja del observador.


Convolución: Transformación matemática en la que un filtro y una imagen se combinan mediante una secuencia de multiplicación y suma.

Croma: Nombre que recibe la dimensión de saturación en el sistema de clasificación de Munsell.

d': En TDS, índice del proceso sensorial. Distancia entre las medias de las distribuciones de señal (SR) y ruido (R).

Daltonismo: Deficiencia cromática caracterizada por la imposibilidad de discriminar entre el rojo y el verde.

Descomposición recursiva: Propiedad de los sistemas de procesamiento que permite subdividir un sistema en subsistemas componentes de forma reiterada hasta alcanzar los componentes elementales.

Descripción fenomenológica: Tipo de introspección defendido por la escuela de la Gestalt que consistía en describir los datos inmediatos de la consciencia de la forma más objetiva posible.

Detectores de características: Entidades biológicas o tecnológicas capaces de codificar aspectos elementales de la forma de los objetos.

Deuteranopía: Discromatopsia debida a la carencia de receptores M. Diagrama de cromaticidad: Sistema de coordenadas para representar los colores basado

sobre la contribución proporcional de cada luz primaria al total de la mezcla. Diagrama de flujo: Esquema abstracto que representa la secuencia de fases de procesa

miento en la resolución de un problema o de una tarea. Diferencia apenas perceptible (D.a.p.) : Diferencia en el nivel de sensación entre dos

estímulos separados por un umbral diferencial. Correlato subjetivo del UD. Diplopía: Experiencia consciente de imágenes dobles. Discromatopsia: Deficiencia cromática causada por la ausencia de un tipo de receptor

cromático. Disociación doble: Deficiencias diferenciales entre dos grupos de pacientes con lesiones

cerebrales distintas en la ejecución de dos tipos de tareas (A y B) en comparación con un grupo de control. Cada grupo de pacientes se diferencia de los controles únicamente en la ejecución de una de las dos tareas, pero mientras un grupo de pacientes lo hace en A, el otro lo hace en B. La disociación doble requiere la comparación de tres grupos (dos de pacientes y uno de control) en dos tareas diferentes.

Disociación simple: Deficiencia en la ejecución de un tipo de tarea, en comparación con una tarea de control, en pacientes con daño cerebral cuando su ejecución se compara con la de un grupo de control. La disociación simple requiere la comparación de dos grupos (uno de pacientes y otro de control) en dos tareas diferentes.

Disparidad binocular: Diferencia en las imágenes monoculares producidas por la proyección de puntos del campo visual situados fuera del horópter.

Disparidad cruzada: Desplazamiento en sentido lateral en cada retina de la proyección de los puntos del campo visual situados entre el punto de fijación y el observador.

Disparidad no cruzada: Desplazamiento en sentido nasal en cada retina de la proyección de los puntos del campo visual situados con respecto al observador en una posición más alejada que el punto de fijación.

Disposición óptica: Conjunto de rayos de luz que incide sobre el observador en un pun-to de vista determinado.

Distancia absoluta: Distancia desde un objeto al observador. Distancia relativa: Distancia entre los objetos de una escena. Distribución de probabilidad de R: Representación gráfica de la probabilidad de un

valor de sensación ante la presentación de R.

GLOSARIO 349

Distribución de probabilidad de SR: Representación gráfica de la probabilidad de un valor de sensación ante la presentación de SR.

Distribución espectral: Función que describe la cantidad de luz correspondiente a cada longitud de onda luminosa existente en una fuente de luz.

Ecuación del color: Expresión que determina la relación entre las cantidades de luces primarias necesarias para igualar un color de prueba.

Efecto de profundidad cinética: Percepción de la forma tridimensional de un objeto en movimiento producida por los cambios graduales y sucesivos en la longitud y en la orientación de su sombra.

Egocéntrico: Marco de referencia perceptivo establecido en coordenadas centradas en el observador.

Empirismo: Postura filosófica que defendía que todo conocimiento procede de la experiencia sensorial.

Energía específica de los nervios: Doctrina que defendía que cada sensación está determinada por la actividad específica de los nervios sensoriales con independencia del tipo de estimulación.

Enmascaramiento visual: Degradación en la percepción de un estímulo por superposición de una máscara.

Enrejado: Estímulo visual caracterizado por cambios periódicos de luminancia en una única dimensión.

Enrejado de onda cuadrada: Enrejado en el que los cambios periódicos de luminancia son bruscos.

Enrejado sinusoidal: Enrejado en el que los cambios periódicos de luminancia son suaves y continuos.

Error constante: Error de estimación que se comete al comparar los estímulos estándar y de comparación.

Esbozo 2D: Según David Marr, fase de procesamiento visual que analiza la información sobre la orientación y profundidad de las superficies visibles en coordenadas centradas en el observador.

Esbozo primario bruto: Primera subfase del esbozo primario en la teoría de David Marr cuyo objetivo consiste en lograr una descripción simbólica de la escena sobre la base de características primitivas.

Esbozo primario completo: Segunda subfase del esbozo primario en la teoría de David Marr cuyo objetivo consiste en agrupar las características primitivas en conjuntos y zonas mediante principios de organización perceptiva.

Esbozo primario: Primera fase de procesamiento visual en la teoría de David Marr cuyo objetivo consiste en hacer explícitos los cambios de intensidad de la imagen bidimensional de luminancia así como su distribución y organización geométrica.

Espectro luminoso: Parte del espectro electromagnético capaz de estimular los receptores visuales.

Estado de activación: Nivel de excitación o inhibición de una unidad de procesamiento de una red neuronal como resultado de las entradas que recibe.

Estereograma: Pares de imágenes prácticamente iguales pero que difieren en un pequeño desplazamiento lateral de sus elementos.

Estereoscopia: Percepción de la profundidad producida por la disparidad binocular. Estímulo distante: Propiedades físicas de los objetos percibidos. Estímulo estándar: Estímulo de intensidad constante que actúa como base para la com

paración con los estímulos de prueba. Estímulo funcional: Estímulo que realmente influye en la conducta del organismo.


Estímulo nominal: Es el estímulo definido y manipulado por el investigador. Estímulo próximo: Propiedades de la estimulación que actúa sobre los receptores. Estímulos de comparación o prueba: Estímulos que varían en una dimensión física de

forma gradual y que se comparan con el estándar. Estructuralismo: Escuela psicológica que estableció el estudio de los elementos (sensa

ciones) de la consciencia como objeto de la psicología. Estructuras perceptivas: Agrupamiento de características que comparten alguna propie

dad común. Expansión óptica: Movimiento divergente en todas direcciones de los puntos del campo

visual a partir del punto de fijación que permanece estático. Fallo: Respuesta <<NO» ante la presentación de SR. Falsa alarma: Respuesta «SÍ>> ante la presentación de R. Fase de una onda: Es la posición de la oscilación de una onda en un momento determi

nado de su ciclo que se toma como punto de referencia. Figura: Región del campo visual delimitada por contornos. Filtros espaciales: Mecanismo cuya respuesta depende de la frecuencia espacial del es

tímulo. Flujo óptico: Clave de profundidad determinada por las transformaciones del patrón

global de estimulación cuando un observador se mueve en el medio ambiente. Fondo: Región del campo visual que circunda la figura. Fotometría: Sistema de medición de la energía luminosa. Fotón: Unidad de medida de la cantidad de luz. Frecuencia espacial: Frecuencia expresada en términos del número de ciclos de cambio

en luminancia por unidad de ángulo visual correspondiente a un patrón visual. Función de Gabor: Función resultante de la multiplicación de una función sinusoidal

por una función normal. Función de igual sensación: Gráfico que representa los resultados de la aplicación de la

técnica de ajuste de modalidades. Función de output: Función que determina la correspondencia entre el estado de acti

vación de las unidades de procesamiento de una red neuronal y la salida (output) del sistema.

Función de sensibilidad al contraste: Función que relaciona la sensibilidad al contrasta con la frecuencia espacial.

Función psicométrica: Relación funcional entre una variable física y una dimensión psicológica (por ejemplo, entre el grado de concentración de sal en el agua y el sabor).

Funcionalismo probabilista: Concepción teórica de la percepción que acentúa la importancia de estudiar situaciones ecológicamente válidas y de los procesos de aprendizaje perceptivo.

Fusión binocular: Percepción de un único objeto en el espacio visual producido por la fusión de las imágenes monoculares de cada ojo.

Geón: Según la teoría de reconocimiento por componentes, son los componentes primitivos a partir de los cuales se construyen los objetos perceptivos.

Gradiente: Cambio gradual y sistemático en una dimensión de la estimulación. Gradiente de textura: Clave de profundidad determinada por el cambio gradual que el

tamaño de los elementos de una superficie y la densidad de los mismos experimentan en función de su distancia al observador.

Gradientes de movimiento: Cambios graduales en velocidad y dirección del movimiento que tienen lugar en la escena visual.

Habitación de Ames: Sala distorsionada para observar la contraposición entre la in-

GLOSARIO 351

formación proporcionada por la perspectiva y la proporcionada por el tamaño familiar.

Homogeneidad: Propiedad de la ecuación del color según la cual la igualación se mantiene cuando los dos términos de la ecuación se multiplican por una constante.

Horópter: Conjunto de puntos en el espacio visual que proyectan su imagen en puntos correspondientes de las dos retinas.

Horópter longitudinal: Horópter definido en el plano horizontal. Horópter vertical: Horópter definido por la recta perpendicular al plano de visión. Igualación de color: Procedimiento experimental para estudiar la mezcla de luces. Igualación escotópica: Procedimiento experimental para determinar la sensibilidad del

sistema de visión escotópico. Iluminancia: Cantidad de luz visualmente efectiva que incide sobre una superficie. Imagen retiniana: Distribución bidimensional de luz de varias intensidades y longitudes

de onda en la retina. Inferencia inconsciente: Hipótesis formulada por Helmholtz para explicar las constan

cias perceptivas y que hace referencia a la forma en que el sistema visual aplica el principio de verosimilitud.

Información (Gibson): Especificidad respecto a una determinada característica de la estimulación.

Información (procesamiento de información): Conocimiento sobre el medio ambiente adquirido por el observador.

Información (teoría de la información): Concepto estadístico definido como una fun-ción monótona inversa de la probabilidad de que un mensaje sea emitido.

Información global: Disposición de las partes de una figura. Información local: Detalles de la figura. Interacción configuracional: Combinación de dimensiones físicas del estímulo queman

tienen la identidad de las dimensiones originales y además dan lugar al surgimiento de propiedades cualitativamente diferentes.

Interacción integral: Combinación de dimensiones físicas del estímulo que se perciben conjuntamente.

Interacción separable: Combinación de dimensiones físicas del estímulo que se perciben como dimensiones separadas.

Interposición: Clave de profundidad determinada por la ocultación que los objetos cercanos al observador ejercen sobre los más alejados que están situados en la misma línea de visión.

Intervalo de incertidumbre: Diferencia entre el umbral superior (Us) e inferior (Ui). Invarianza tamaño distancia: Hipótesis explicativa de la constancia del tamaño en la

teoría constructivista. Invariantes: Según la teoría de la percepción directa, características de la situación esti

mular que permanecen constantes a pesar de los movimientos del observador. Isomorfismo psicofísico: Principio formulado por la teoría de la Gestalt según el cual

existe una perfecta correspondencia entre los acontecimientos físicos del funcionamiento cerebral y los acontecimientos mentales.

Ley de Fechner: Ley psicofísica que establece que la intensidad de una sensación es una función logarítmica de la intensidad del estímulo.

Ley potencial: Ley psicofísica formulada por Stevens que establece que la magnitud de la sensación varía en función de la intensidad del estímulo físico elevado a una potencia.

Leyes psicofísicas: Leyes que describen las relaciones entre un estímulo físico y una respuesta psicológica en el sistema sensorial.


Límite de la textura: Línea subjetiva que delimita regiones de diferente textura. Línea de visión: Línea que une el punto de fijación con el observador. Línea del horizonte: Línea de referencia que divide el espacio visual en dos zonas, una

superior y otra inferior. Longitud de onda: Distancia recorrida hasta que la función de onda se repite. Longitud de onda dominante: Es la que predomina en la determinación del matiz de

un color. Luminancia: Cantidad de luz visualmente efectiva emitida por una fuente de luz extensa. Magnificación cortical: Distorsión característica de la representación retinotópica de la

corteza visual primaria debida a que la zona central de la retina ocupa un área más amplia en la representación cortical que la zona periférica.

Marco de referencia: Conjunto de coordenadas sobre las que se centra una representación perceptiva.

Máscara: Patrón de ruido que se superpone a un estímulo produciendo una degradación del mismo.

Matiz: Cualidad que permite diferenciar un color de otro. También, dimensión de clasificación de los colores.

Media-imagen: cada una de las imágenes que componen un estereograma. Metámeros: Colores que se perciben con el mismo matiz a pesar de tener distinta com

posición espectral. Método substractivo: Método para el estudio del tiempo de reacción desarrollado por

F. C. Donders. Métodos directos: Métodos psicofísicos que permiten la medida de la sensación a partir

de los juicios cuánticos que proporcionan los observadores. Métodos indirectos: Métodos que permiten la cuantificación de los umbrales absoluto y

diferencial a partir de la ejecución de los observadores. Mezcla de luces (mezcla aditiva de colores): Mezcla de colores cuyo resultado es igual a

la suma de la cantidad de luz de las luces primarias que la componen. Mezcla de pigmentos (mezcla substractiva): Mezcla de colores cuyo resultado depende

preferentemente de la reflectancia de los pigmentos que se mezclan. Modelo 3 D: Según David Marr fase de procesamiento visual que analiza la representa

ción de las formas y de su organización espacial en un marco de referencia centrado en el objeto mismo.

Módulos: Componentes de un sistema que presentan una organización especializada del trabajo al modo de una subrutina en un programa de ordenador.

Movimiento aparente: Movimiento percibido en objetos inmóviles separados espacialmente que se iluminan sucesivamente bajo condiciones temporales apropiadas.

Movimiento biológico: Movimiento percibido cuando se observa el desplazamiento de los organismos.

Movimiento de corto alcance: Movimiento aparente en el que la distancia y el periodo temporal entre los estímulos son cortos (distancia menor que .25° de ángulo visual y periodo temporal menor de 80 milisegundos).

Movimiento de largo alcance: Movimiento aparente en el que la distancia y el periodo temporal entre los estímulos son relativamente largos.

Movimiento inducido: Percepción de movimiento en un objeto estático como consecuencia del desplazamiento del fondo o de un objeto de mayor tamaño que lo circunda.

Movimiento óptimo: Movimiento aparente en el que se percibe una luz desplazándose entre dos posiciones.

Movimiento propio: Movimiento del observador.

GLOSARIO 353

Movimiento puro: Percepción de movimiento sin que se perciba el objeto que se mueve. Movimiento real: Desplazamiento físico del objeto en el tiempo. Nivel algorítmico: Nivel de análisis que especifica cómo se llevan a cabo los procesos

de un sistema. Nivel computacional: Nivel de análisis que especifica de forma abstracta el problema

que un sistema de procesamiento de información tiene que resolver. Nivel de implementación: Nivel de análisis que se interesa por la tecnología que utiliza

un sistema de procesamiento de información. Niveles de análisis: Diferentes puntos de vista desde los que se puede estudiar un sistema

complejo de procesamiento de información. Nueva psicofísica: Corriente psicofísica que utiliza métodos directos en la medición de

las sensaciones. Objeto del mundo real: Entidad física que posee unas determinadas propiedades como

localización, volumen y forma. Objeto percibido: Representación psicológica del objeto físico que afecta en un determi

nado momento a los receptores sensoriales del organismo que percibe. Onda sinusoidal: Onda cuyas oscilaciones positivas y negativas se alternan sucesivamen

te manteniendo constante su amplitud y su longitud de onda. Operaciones elementales: Operaciones simples e irreductibles en el procesamiento de

la información. Óptica ecológica: Alternativa propuesta por Gibson a la óptica geométrica según la cual

la descripción de los estímulos debe hacer referencia a la información proporcionada por los estímulos, así como a las propiedades funcionales de los mismos.

Óptica geométrica: Rama de la óptica fundada en el principio de propagación rectilínea de la luz, así como en las leyes de la reflexión y la refracción.

Organización modular: Organización en módulos o mecanismos de procesamiento independientes.

Organización perceptiva: Procesos que permiten la extracción de regularidades presentes en los objetos naturales.

Paralaje binocular: Forma arcaica de denominar a la disparidad binocular. Paralaje de movimiento: Clave de profundidad determinada por el desplazamiento dife

rencial de las imágenes proyectadas por distintos objetos debido a un cambio lateral en la posición del observador y a la distancia relativa de los objetos respecto del punto de fijación.

Paralelismo psicofísico: Principio filosófico de carácter dualista que establece un isomorfismo entre los acontecimientos físicos y los mentales.

Parámetro estimular: Aspecto de la estimulación susceptible de medida. Patrón de activación: Patrón formado por los diferentes estados de activación de las

unidades de procesamiento de una red neuronal. Patrón de conectividad: Patrón formado por las diferentes fuerzas de las conexiones

existentes entre las unidades de una red neuronal. Patrón total de estimulación: Conjunto estructurado de la escena visual. Percepción: Experiencia consciente de los objetos y de las relaciones entre los mismos. Percepción de acontecimientos: Cambios percibidos en la estructura del estímulo a tra-

vés del tiempo. Percepción directa: Denominación que recibe la teoría de la percepción propuesta por

James J. Gibson. Periodos críticos: Periodos de tiempo durante las primeras semanas de maduración del

sistema visual en los cuales es necesaria la estimulación ambiental para lograr un desarrollo adecuado en el funcionamiento de la células de la corteza estriada.


Perspectiva aérea: Clave de profundidad determinada por los cambios en contraste y en color asociados a la distancia.

Perspectiva lineal: Clave de profundidad pictórica basada en la convergencia de paralelas.

Plantillas: Representaciones globales de una figura (algo así como un molde hueco o un patrón de estarcido).

Posefecto de color: Experiencia sensorial de un color resultante de la exposición prolongada a su complementario.

Posefectos de movimiento: Fenómenos producidos tras una observación prolongada de la estimulación, en los que la dirección del movimiento percibido inicialmente cambia y se percibe en sentido contrario.

Primitivos/as: Unidades elementales de información sobre la forma disponibles en la representación. Constituyen el tipo de información que la representación recibe de procesos más iniciales.

Primitivos/as perceptivos/as: Elementos estimulares básicos que actúan como elementos componentes en estímulos más complejos (por ejemplo, las formas volumétricas de Biederman).

Primitivos/as volumétricos/as: Características primitivas de una representación tridimensional.

Principio de Pragnanz (principio mínimo): Establece que: en situaciones en las que son posibles varias interpretaciones de la escena visual, el sistema perceptivo impone la interpretación más simple.

Principio de verosimilitud: Afirma que: percibimos aquellos objetos y acontecimientos que, bajo condiciones normales, serían los que produjeran el conjunto de estimulación sensorial efectiva que estamos recibiendo.

Problema de la correspondencia: Problema computacional relacionado con la determinación de la correspondencia entre los puntos estimulados en las dos retinas.

Procesamiento de abajo a arriba (bottom up): Procesamiento constituido por un conjunto de operaciones que actúan sobre los datos que proporciona el input para construir representaciones progresivamente más complejas.

Procesamiento de arriba abajo (top clown): Procesamiento constituido por un conjunto de operaciones en el que las representaciones más complejas actúan mediante feedback sobre las más simples.

Procesamiento de información: Aproximación teórica dentro de la psicología cognitiva que analiza los procesos mentales como una serie de estadios semejantes a los componentes de un programa de ordenador.

Procesamiento en paralelo: Procesamiento en el que los procesos componentes actúan simultáneamente y con independencia unos de otros.

Procesamiento oponente: Principio fundamental del procesamiento del color en las vías nerviosas de conducción visual. Procesos de codificación del color mediante pares de colores complementarios.

Procesamiento serial: Procesamiento llevado a cabo secuencialmente en el que cada proceso recibe como entrada la salida del proceso que le precede y no empieza a funcionar hasta que el proceso anterior ha finalizado.

Procesos automáticos: Procesos que se ponen en funcionamiento ante la sola presencia del estímulo apropiado de forma innata o como resultado de la práctica.

Procesos controlados: Procesos bajo el control de la atención. Procesos de codificación: Procesos responsables de la generación de representaciones

mentales.

GLOSARIO 355

Procesos de detección: Procesos que permiten detectar la presencia de objetos en el entorno.

Procesos de discriminación: Procesos que permiten diferenciar un objeto de otro. Procesos de reconocimiento e identificación: Procesos que permiten determinar con

exactitud de que objeto se trata. Propiedad funcional (affordance): Concepto acuñado por Gibson para referirse a los in

variantes de la estimulación que están en consonancia con el cuerpo del observador. Propiedades componentes: Atributos del estímulo. Propiedades configuracionales: Relaciones espaciales entre los atributos del estímulo

que da lugar al surgimiento de propiedades emergentes. Propiedades emergentes: Propiedades del estímulo que surgen como resultado de la

relación entre los elementos componentes en una configuración, sin que dicha propiedad esté presente en los elementos componentes. (Por ejemplo, la percepción de la inclinación o de las orientaciones horizontal y vertical en una línea de puntos, en la que los elementos componentes (puntos) carecen de orientación.

Propiedades globales: Propiedades que se refieren al estímulo como un todo. Propiedades no accidentales: Características o aspectos de la estructura de la imagen

que se corresponden con propiedades significativas de los objetos y no dependen del punto de vista.

Protanopía: Discromatopsia debida a la carencia de receptores L. Prototipo: Aspecto perceptivo más representativo de una categoría de color. Psicofísica: Rama de la Psicología en la que se estudia las relaciones entre los estímulos

físicos y las sensaciones que experimenta el observador cuando es expuesto a dichos estímulos.

Psicología cognitiva: Aproximación teórica en la psicología que establece el estudio de los procesos mentales como objeto de investigación de la disciplina.

Punto de fijación: Punto en el que convergen las líneas de visión de cada uno de los dos OJOS.

Punto de fuga: Punto en la línea del horizonte en el que convergen la representación bidimensional de líneas paralelas en el espacio tridimensional.

Punto de vista: Angula desde el que se observa un objeto. Punto nodal: Punto en el que el rayo principal de luz proveniente de un objeto corta al

eje óptico. Puntos correspondientes: Puntos que tienen la misma posición en cada una de las dos

retinas. Pureza de excitación: Aspecto de la estimulación física determinante de la saturación de

un color. R G B: Sistema de descripción de los colores basado sobre el rojo, verde y azul como

colores primarios. Racionalismo: Postura filosófica que defendía la posibilidad del conocimiento cierto

fundamentado en la razón. Radiometría: Sistema de medición de la energía. Rayo de luz: Concepto básico de la óptica geométrica utilizado para describir la trayec

toria de la estimulación visual entre el objeto y el observador. Rechazo correcto: Respuesta <<NO >> ante la presentación de R. Redes neuronales: Conjunto de unidades elementales de procesamiento similares a las

neuronas del cerebro conectadas entre sí de forma excitatoria o inhibitoria. Reflectancia: Cociente entre la cantidad de luz emitida (Luminancia) y la cantidad de luz

recibida (Iluminancia) por una superficie.


Refracción de la luz: Cambio de dirección de un frente de ondas luminosas al atravesar oblicuamente la interfase entre un medio y otro en el que su velocidad de propagación es distinta.

Región texturada: Grupo de elementos segregado en base a diferencias en la textura. Regla de activación: Función que determina el estado de activación de las unidades de

procesamiento de una red neuronal como resultado de las entradas que recibe. Regla de aprendizaje: Función que determina la fuerza de una conexión entre las unida

des de una red neuronal como resultado de la práctica. Representación distribuida: Representación en la que la correspondencia entre las enti

dades del mundo representado y las unidades de la representación es múltiple. Cada unidad en la representación puede representar varias entidades del mundo representado y cada entidad del mundo representado puede ser representada por varias unidades en la representación.

Representación local: Representación en la que la correspondencia entre las entidades del mundo representado y las unidades de la representación es uno a uno.

Retinex: Mecanismo hipotético de cómputo de razones de luminancia para explicar la constancia del color en la teoría de E. Land.

Rivalidad binocular: Competición entre dos imágenes monoculares distintas por preva-lecer en la percepción consciente.

Rodopsina: Fotopigmento encontrado en los bastoncillos. Saturación: Grado de pureza cromática que presenta un color. Sensación: Elemento fundamental de la percepción según la teoría clásica de la percep

ción. En la actualidad se utiliza para designar a la experiencia consciente producida por un estímulo que varía en una única dimensión física.

Sensibilidad al contraste: Capacidad de percibir el contraste. Es el valor recíproco del umbral de contraste.

Símbolo físico: Entidad física capaz de designar o significar otra entidad. Simetría bilateral: Simetría generada a partir del reflejo del patrón original sobre un

eJe. Simetría rotacional: Simetría generada a partir del cambio de orientación del patrón

original. Simetría traslacional: Simetría generada a partir de la repetición y traslación del patrón

original. Sistema sensorial: Sistema mediante el cual los organismos obtienen información del

medio ambiente. Sistemas perceptivos: En general hace referencia a los sistemas responsables de las dis

tintas modalidades sensoriales. En la teoría de Gibson se consideran como totalidades dinámicas estructuradas cuya capacidad de captar información y propiedades funcionales sobrepasa la de sus componentes.

Sobreconstancia: Fenómeno de sobreestimación del tamaño de los objetos cuando se instruye al observador a ser objetivo en su estimación.

Sombra: Zona de la escena visual a la que no llega la iluminación por haber sido ésta bloqueada por un objeto interpuesto.

Sombreado: Clave de profundidad determinada por los cambios en el patrón de luminanCJa.

Sombreado difuso: Es el propio de las superficies mate cuya reflectancia es igual en todas las direcciones.

Sombreado especular: Sombreado propio de las superficies brillantes. Depende de la posición del observador y de la dirección de iluminación.

GLOSARIO 357

Superposición (Ley aditiva de Grassman): Propiedad de la ecuación del color según la cual la igualación se mantiene cuando a los dos términos de la ecuación se les suma una constante.

Tamaño familiar: Clave de profundidad determinada por el tamaño recordado de los objetos.

Tamaño relativo: Clave de profundidad determinada por el tamaño del ángulo visual producido por los objetos.

Tarea de elección forzosa: Procedimiento experimental en el que se presenta a los observadores varios estímulos de los que deben elegir uno en función de determinadas propiedades.

Tarea de tiempo de reacción de elección (tarea de discriminación): Tarea en la que el observador debe responder con una respuesta diferente a cada uno de los estímulos presentados.

Tarea de tiempo de reacción selectivo (tarea responda/no responda o go/non go): Tarea en la que se presentan dos o más estímulos y el observador sólo debe responder a uno de ellos.

Tarea de tiempo de reacción simple (tarea de detección): Tarea en la que el observador debe responder a un único estímulo con una única respuesta.

Teoría computacional simbólica: Teoría cognitiva basada sobre sistemas de símbolos físicos.

Teorías interactivas: Teorías cognitivas que toman en consideración tanto el procesamiento de abajo a arriba como el de arriba hacia abajo.

Textones: Determinadas propiedades estimulares que permiten la segregación de la textura.

Texturas: Patrones formados por conjuntos de pequeños elementos repartidos y distribuidos sobre un área.

Tiempo de reacción: Tiempo transcurrido desde el inicio del estímulo al inicio de la respuesta.

Transaccionalismo: Aproximación teórica al estudio de la percepción que defiende una interacción mutua entre la estimulación y la conducta en los organismos.

Transducción: Transformación de energía en otra distinta. Tricromaticidad: Principio fundamental del procesamiento del color en los receptores. Tritanopía: Discromatopsia debida a la carencia de receptores S. Umbral absoluto: Cantidad mínima de intensidad del estimulo capaz de producir una

sensación. Umbral de contraste: Contraste mínimo a partir del cual puede distinguirse un enrejado

de una escena homogénea en luminancia. Umbral diferencial: Cantidad mínima de cambio en la estimulación necesaria para pro

ducir un cambio en la sensación. Unidades ocultas: Unidades de procesamiento de una red neuronal cuya función es

modificar las conexiones entre las unidades de entrada y de salida en función de la información que reciben tanto de las unidades de input como de otras unidades ocultas a las que se encuentran conectadas.

Univarianza: Respuesta de la rodopsina a la cantidad de luz independientemente de su longitud de onda.

Valor: Nombre que recibe la dimensión de claridad en el sistema de clasificación de Munsell.

Valores triestímulo: Cantidad de luces primarias necesarias para igualar un color de prueba.


Vía K: Vía koniocelular de transmisión de la información visual. Vía M: Vía magnocelular de transmisión de la información visual. Vía P: Vía parvocelular de transmisión de la información visual. Visión escotópica: Visión nocturna, determinada por el sistema de receptores de bas

toncillos. Visión fotópica: Visión diurna, determinada por el sistema de receptores de conos.

Documents

La Percepcion Visual