Download pdf - Filosofia de La Fisica. Lawrence Sklar

D ESDE los viejos tiempos

«Ir A m ate les , lisua y filosofía son dos maneras de acercarse a la

« iiiiipirnsióM ilrl mundo que se han desarrollado en conexión mutua. Más

«|iir i'u.ili|iner olra disciplina científica, la física ha presionado sobre los

limites «le nuestro conocimiento más general acerca de las estructuras

pmlunilas del entendimiento y de la realidad, por lo que posee muchos

puntos comunes con el pensamiento ontológico y epistemológico,

tradicionalmente objeto de la filosofía. LAWRENCE SKLAR traza un

mapa de las áreas principales en la que se plantean cuestiones

fundamentales de filosofía del conocimiento del mundo físico. FILOSOFÍA

DE LA FISICA estudia la estructura del espacio, el tiempo y el

movimiento, la geometría del mundo y el tipo de entidades fundamentales

que lo constituyen. Aborda también el problema de la probabilidad y el

carácter aleatorio de los procesos básicos de la naturaleza, y termina con un

examen de las implicaciones ontológicas y epistemológicas de la mecánica

cuántica, la teoría más precisa y fecunda de cuantas han existido nunca, así

como la más extraña y difícil de conjugar con la imagen del mundo del

sentido común. También en Alianza Editorial, «Sobre la realidad de los

cuantos», de J. M. Jauch (AU 428), y «El debate de la teoría cuántica», de

Franco Selleri (AU 453).

Alianza Editorial

Filosofía de la física

Lawrence Sklar


Versión española

de Rosa Álvarez Ulloa

Alianza Editorial

Título original: P hilosophy o f Physics

Reservados todos los derechos. De conformidad con lo dispuesto en el art. 534-bis del Código Penal vigente, podrán ser castigados con penas de multa y privación de libertad quienes reprodujeren o plagiaren, en todo o en parte, una obra literaria, artística o científica fijada en cualquier tipo de soporte sin la preceptiva autorización.

© Westview Press, Inc., 1992 © Ed. cast.: Alianza Editorial, S. A., Madrid, 1994

Calle Juan Ignacio Luca de Tena, 15; 28027 Madrid; teléf. 741 66 00 ISBN: 84-206-2797-6 Depósito legal: M. 38.916-1994Impreso en Lavel. Los Llanos, C/ Gran Canaria, 12. Humanes (Madrid) Printed in Spain

PatyRubby

ÍNDICE

Agradecimientos ............................................................................. 11

1. In t r o d u c c ió n : L a f i lo s o f ía y la s c ienc ias f ís ic a s ..................... 13

La relación de la ciencia a la filosofía .................................. 13

Física moderna y filosofía ..................................................... 16

Filosofía de la física y filosofía general ................................. 22

Finalidad y estructura de este lib ro ...................................... 24

2. E spa c io , t ie m po , m o v im ie n t o ................................................... 27

Problemas filosóficos tradicionales del espacio y el tiempo.. 27

El debate entre Newton y Leibniz ....................................... 38

Del espacio y el tiempo al espacio-tiempo .......................... 47

La gravedad y la curvatura del espacio-tiempo ................... 67

¿Cómo conocemos la verdadera geometría del mundo? .... 85

¿Qué clase de entidad tiene el espacio-tiempo? .................. 109

Lecturas adicionales .............. ................................................ 138

3. L a INTRODUCCIÓN DE LA PROBABILIDAD EN LA FÍSICA .................. 141

Los filósofos acerca de la probabilidad y la explicación es

tadística ................................................................................... 141

9

De la termodinámica a la mecánica estadística ................... 164

El problema de la irreversibilidad y las tentativas de resol

verlo ........................................................................................ 180

El problema de «la dirección del tiempo» ............................ 216

Lecturas adicionales .............................................................. 227

4. L a IMAGEN CUÁNTICA DEL MUNDO ................................................... 231

La base experimental de la teoría cuántica .......................... 231

Primeras tentativas de interpretar la teoría: el principio de

incertidumbre ........................................................................ 241

¿Qué es la medición en la teoría cuántica? .......................... 260

El problema de las variables ocultas y el determinismo..... 292

La inseparabilidad de los sistemas ....................................... 307

Lecturas complementarias .................................................... 324

5. R efle x io n e s sobre la in t e r d e p e n d e n c ia de la f ilo so fía y

la c ie n c ia ................................................................................. 327

B ib l io g r a f ía ...................................................................................................... 335

Índice a n a lít ico ............................................................................. 341

10 Indice

AGRADECIMIENTOS

En un trabajo de esta clase, concebido como un examen del

estado actual del campo, las fuentes de influencia intelectual son de

masiado numerosas para mencionarlas en una sección de agradeci

mientos. Las lecturas sugeridas al final de los tres capítulos principa

les indicarán al lector dónde he encontrado las fuentes de muchas

ideas importantes en la filosofía de la física.

Las discusiones mantenidas con muchas personas a lo largo de

los años me han ayudado a poner en orden mis ideas sobre los tópi

cos que presento aquí. Jim Joyce y Bob Batterman han sido de gran

ayuda, y de John Earman, Clark Glymour, David Malament, Paul

Horwich, y Michael Friedman he aprendido mucho.

Michele Vaidic fue de inestimable ayuda a la hora de confeccio

nar el manuscrito. Spencer Carr y los dos referees de Westview Press

me ayudaron mucho a mejorar el primer borrador del manuscrito,

especialmente en lo que a estilo y organización se refiere. A Marian

Safran, redactora jefe, le agradezco mucho la ayuda proporcionada

en llevar el manuscrito a su forma final.

Parte de la investigación que contribuyó a reunir el material del

capítulo 3 fue subvencionada por la National Science Foundation,

cuya ayuda agradezco sinceramente. También debo dar gracias a la

Universidad de Michigan por una beca que contribuyó a sufragar al

gunos de los costes de la preparación del manuscrito*

Lawrence Sklar11

Capítulo 1

INTRODUCCIÓN: LA FILOSOFÍA Y LAS CIENCIAS FÍSICAS

La relación de la ciencia a la filosofía

La demarcación entre las ciencias naturales y la filosofía ha sido un

proceso largo y gradual dentro del pensamiento occidental. En un

principio la indagación en la naturaleza de las cosas consistía en una

amalgama de lo que hoy concebiríamos como filosofía: consideracio

nes generales del tipo más amplio sobre la naturaleza del ser y la na

turaleza de nuestro acceso cognitivo al mismo, y lo que hoy se consi

deraría característico de las ciencias específicas: la acumulación de

hechos observacionales y la formulación de hipótesis generales y teó

ricas que los expliquen. Si atendemos a los restos fragmentarios de

las obras de los filósofos presocráticos, encontramos no sólo impor

tantes e ingeniosas tentativas de aplicar la razón a amplias cuestiones '

metafísicas y epistemológicas, sino también los primeros conatos de

teorías físicas, si bien extraordinariamente imaginativas, sobre la na

turaleza de la materia y sus aspectos cambiantes.

En la época de la filosofía griega clásica podemos ya apreciar una

cierta disociación de las dos disciplinas. En sus obras metafísicas,

Aristóteles está haciendo exactamente lo mismo que harían los filóso

fos hoy día. Pero en la mayoría de sus obras biológicas, astronómicas

y físicas, encontramos métodos de investigación que nos son hoy día

familiares en la práctica de los científicos.

13

14 Filosofía de la física

A medida que las ciencias especiales, como la física, la química y

la biología, han ido multiplicándose, dominando cada vez más recur

sos y desarrollando metodologías sumamente individualizadas, han

demostrado poseer capacidad para describir y explicar las caracterís

ticas fundamentales del mundo en el que vivimos. Debido al éxito de

los practicantes de las ciencias especiales, muchos se preguntan si

aun queda algo que los filósofos puedan hacer. Algunos filósofos

creen que hay dominios de investigación radicalmente diferentes a

los de las ciencias particulares, por ejemplo, la indagación en la natu

raleza de Dios, de «ser ello mismo» o de alguna otra cosa. Otros filó

sofos han buscado de diversas maneras un dominio distinto de inves

tigación para la filosofía más estrechamente vinculado a los recientes

y sofisticados desarrollos de las ciencias naturales.

Una concepción todavía más antigua, cuya popularidad fue dis

minuyendo con el paso de los siglos, aunque sin llegar a desaparecer

totalmente, sostiene que hay una forma de conocer el mundo cuyo

fundamento no necesita descansar en la investigación observacional

o experimental, el método de las ciencias específicas. Esta vieja con

cepción se vio influida en parte por la existencia de la lógica pura y

las matemáticas, cuyas verdades firmemente establecidas no parecen

descansar para su justificación en un fundamento observacional o ex

perimental. Desde Platón y Aristóteles a Leibniz y otros racionalistas,

pasando por Kant y los idealistas, y llegando hasta nuestros tiempos,

ha perdurado la esperanza de que, siendo lo suficientemente inteli

gentes y reflexivos, podríamos establecer un cuerpo de proposiciones

descriptivas del mundo, si bien conocidas con la certeza con la que

afirmamos conocer las verdades de la lógica y las matemáticas. Esto

sería creíble con independencia de cualquier soporte inductivo de

los hechps particulares de la observación. Si este cuerpo de conoci

miento estuviese a nuestra disposición, ¿no sería el objetivo anhelado

durante siglos por la disciplina tradicionalmente llamada filosofía?

Una concepción más contemporánea sostiene que el papel de la

filosofía es servir, no ya de. fundamento para las ciencias o como ex

tensión de ellas, sino antes bien de observador crítico de las mismas.

La idea aquí es que las disciplinas científicas particulares usan con

ceptos y métodos. Las relaciones entre unos conceptos y otros, aun

que implícitas en el uso que la ciencia hace de ellos, podrían no estar

claras de manera explícita para nosotros. En este caso sería tarea de

la filosofía el esclarecimiento de estas relaciones conceptuales. De

Introducción: la filosofía y las ciencias físicas 15

nuevo, las ciencias particulares emplean métodos específicos para ge

neralizar de los datos observacionales a las hipótesis y a la teoría. El

cometido de la filosofía es, desde esta perspectiva, describir ios méto

dos que las ciencias utilizan y explorar el terreno para justificar estos

métodos. Es decir, compete a la filosofía mostrar que se trata de los

métodos adecuados para hallar la verdad en la disciplina científica en

cuestión.

Pero, ¿está claro desde alguna de estas dos perspectivas que la fi

losofía y la ciencia puedan ser diferenciadas una de la otra en una

forma más rotunda? Muchos insinúan que no. En las ciencias especí

ficas, las teorías se adoptan a veces no sólo por ser consistentes con

los datos observacionales, sino también por otros motivos como el

grado de simplicidad, el poder explicativo u otras consideraciones

que se cree que contribuyen a su plausibilidad intrínseca. Cuando

advertimos esto, comenzamos a perder confianza en la idea de que

hay dos reinos muy diferentes de proposiciones, aquéllas respaldadas

sólo por los datos y aquéllas respaldadas sólo por la razón. Muchos

metodólogos contemporáneos, como W. V. Quine, mantendrían que

las ciencias naturales, las matemáticas y hasta la lógica pura forman

un continuo unificado de creencias sobre el mundo. Todas ellas, afir

man estos metodólogos, están indirectamente respaldadas por los

datos observacionales, pero todas ellas contienen asimismo elemen

tos de apoyo «racionales». Si esto es cierto, ¿no formaría incluso la fi

losofía, entendida como las verdades de la razón, parte integrante asi

mismo del todo unificado? Esto es, ¿no sería también la filosofía

simplemente un componente del cuerpo de las ciencias especiali

zadas?

Cuando preguntamos por la adecuada descripción y justificación

de los métodos de la ciencia, parece que esperamos que los resulta

dos específicos de las ciencias particulares entren de nuevo en juego.

¿Cómo podríamos entender la aptitud de los métodos de la ciencia

para conducirnos a la verdad sin ser capaces de demostrar que estos

métodos poseen efectivamente la fiabilidad que se les ha atribuido?

Y ¿cómo podríamos hacer esto sin emplear el conocimiento sobre

cómo es el mundo que nuestra mejor ciencia disponible nos ha reve

lado? ¿Cómo podríamos, por ejemplo, justificar nuestra confianza en

la observación sensorial en la ciencia si nuestro entendimiento de los

procesos perceptivos, un entendimiento que descansa en la física, la

neurología y la psicología, no nos garantizase que la percepción, en la


forma que se utiliza para probar las teorías científicas, era efecti

vamente una buena guía hacia la verdad sobre la naturaleza del

mundo?

Es en la discusión de las teorías más fundamentales y generales

de la física donde la indistinción de la frontera entre las ciencias na

turales y la filosofía se hace más evidente. Dada la clara ambición de

estas teorías por describir el mundo natural en sus aspectos más fun

damentales y generales, no resulta sorprendente que los tipos de ra

zonamiento aplicados en el desarrollo de estas teorías sumamente

abstractas parezcan a veces más próximos al razonamiento filosófico

que a los métodos empleados en llevar a cabo una investigación cien

tífica más limitada y particular. Más adelante, cuando exploremos los

conceptos y métodos utilizados por la fi'sica en el estudio de sus

cuestiones más fundamentales, veremos una y otra vez cómo puede

no estar claro en absoluto si estamos explorando cuestiones de la

ciencia natural o cuestiones de la filosofía. De hecho, en este domi

nio de nuestra exploración de la naturaleza del mundo, la distinción

entre las dos disciplinas se torna muy confusa.

Física moderna y filosofía

Nos será de ayuda echar una mirada preliminar a algunas de las for

mas en que los resultados de la física moderna han afectado a las

cuestiones filosóficas. Esto puede suceder cuando un estudio teórico

en física ejerce presión contra lo que se ha considerado que son lími

tes de su dominio de indagación. Consideremos, por ejemplo, la cos

mología moderna. El modelo más ampliamente aceptado de la es

tructura a gran escala de nuestro universo es el big bang. En él se

traza la evolución del universo actual hacia atrás en el tiempo, con

un contraimiento de las dimensiones espaciales del universo en esa

dirección temporal de retroceso. Una gran parte de la estructura y di

námica actuales del universo puede ser aparentemente explicada si

suponemos que el universo se ha desarrollado de una manera explo

siva a partir de una singularidad en un tiempo finito en el pasado. Es

decir, parece que en algún momento del pasado (del orden de como

mucho unas cuantas decenas de billones de años atrás) toda la mate

ria del universo estaba concentrada «en un punto» del espacio (o,

mejor aún, el espacio mismo estaba concentrado en esa forma).


Pero semejante modelo del universo obviamente da lugar a cues

tiones asombrosas que parecen llevarnos más allá de los modos de

búsqueda de una respuesta que nos son familiares en la discusión de

cuestiones de causalidad a la escala astronómica. Si el estado actual

del universo puede retrotraerse en el tiempo a través de una serie de

causas y efectos a la singularidad inicial, ¿qué podemos hacer enton

ces para continuar el proceso de pregunta-y-respuesta de la ciencia y

buscar la explicación causal de la existencia y naturaleza de ese mis

mo estado inicial singular? Sencillamente, no tenemos claro qué tipo de respuesta explicativa podríamos dar a una pregunta como, «¿por

qué tuvo lugar el big bang y por qué se dio en la forma que lo hizo?

Hemos, por así decirlo, rebasado el ámbito de las respuestas explica

tivas del tipo familiar. La cadena de razonamiento causal regresivo de

un estado a un estado anterior postulado como causa suficiente pare

ce detenerse en la singularidad inicial del big bang.Esto no significa que no se pueda imaginar algo parecido a una

explicación de la ocurrencia y naturaleza del big bang, sólo que en

este punto parece que los modos de pensamiento científicos habitua

les han de ser complementados con otros modos familiares al filóso

fo. Lo que se cuestiona es la naturaleza misma de nuestra demanda

de una explicación, el tipo de contestación que podríamos esperar

como respuesta a dicha demanda. Aquí la física y la filosofía parecen

converger, pasando las cuestiones específicas sobre la naturaleza del

mundo a estar inextricablemente entrelazadas con cuestiones de un ti

po más metodológico acerca precisamente de qué tipo de descripción

y explicación del mundo puede esperarse propiamente de la ciencia.

Otra presión a «filosofar» en la física contemporánea proviene de

que los cambios en nuestra imagen física del mundo exigen una revi

sión radical de nuestra conceptualización del mismo. Cuando inten

tamos acomodar los desconcertantes datos observacionales que nos

abocaron a las nuevas revoluciones científicas, descubrimos pronto

que muchos de nuestros preciados conceptos para tratar con el mun

do dependen para su viabilidad de la presencia de ciertas caracterís

ticas estructurales en nuestra imagen del mundo. En algunos casos se

trata de características cuya existencia ni siquiera advertimos hasta

que son cuestionadas por las nuevas teorías físicas revolucionarias.

Pero, una vez que estas características de nuestra imagen teórica son

puestas en tela de juicio, los conceptos que dependen de ellas dejan

de funcionar para nosotros como lo han hecho hasta entonces y


debemos revisar nuestros conceptos. Pero semejante revisión concep

tual es justamente la clase de cosa que nos impone una investigación

típicamente filosófica del significado mismo de los conceptos que he

mos estado utilizando todo el tiempo y de las revisiones de significa

do necesarias para acomodar el nuevo entendimiento conceptual del

mundo.

Consideremos, por ejemplo, la revisión de nuestro concepto del

tiempo implicada por la teoría especial de la relatividad. Por razones

que analizaremos más tarde, la adopción de esta teoría exige que di

gamos muchas cosas sobre el tiempo que parecen ser manifiestamen

te absurdas. Dos sucesos que ocurren al mismo tiempo para un «ob

servador» pueden, en esta teoría, no ser simultáneos para algún otro

observador en movimiento con respecto al primero. El mismo orden

temporal de algunos sucesos (sucesos que no son causalmente conec

tables entre sí) puede invertirse con respecto a observadores diferen

tes. Sin embargo, nuestro anterior concepto del tiempo suponía, casi

inconscientemente, que lo que es simultáneo para un observador es

simultáneo para todos, y que si el suceso a es anterior al suceso b, esto es un hecho «absoluto» para todos los observadores.

La naturaleza de la nueva teoría del espacio y el tiempo, trayen

do consigo sus conceptos revolucionarios, nos impone una profunda

reconsideración de todo lo que conformaba nuestras viejas presupo

siciones teóricas y nuestro viejo aparato conceptual. Dicha reconside

ración nos lleva a examinar con detenimiento justamente lo que en

nuestra concepción anterior estaba fundado en la experiencia y lo

que se presuponía sin razón o justificación. Y los cambios revolucio

narios nos imponen el deber de explorar detenidamente la forma en

que los conceptos dependen de la estructura teórica en la que se en

cuentran inmersos, y cómo los cambios en esa estructura pueden le

gítimamente exigir una renovación conceptual de nuestra parte.

Como veremos, al pasar de la teoría especial a la teoría general de la

relatividad, necesitaremos estructuras todavía más noveles del espa

cio y el tiempo. Será posible considerar al menos la posibilidad de

mundos en los que, por ejemplo, un suceso dado se encuentre, en un

sentido perfectamente coherente, en su propio pasado y futuro. Cla

ramente, esta clase de cambio cuenta como una revolución concep

tual. El entendimiento de justamente cómo pueden darse dichas re

voluciones conceptuales, y de lo que ocurre exactamente cuando una

tiene de hecho lugar, es el tipo de problema apropiado para la inves


tigación filosófica. La filosofía queda ahora integrada en la teoriza

ción física.

Otro ejemplo más de la clase de revolución científica conceptual

que exige que la reflexión filosófica pase a formar parte de la prácti

ca científica concierne al impacto de la teoría cuántica en nuestras

nociones tradicionales de causalidad. Una gran parte de nuestra cien

cia presuponía la idea de que cada suceso podía ser explicado aso

ciándolo de una forma legal con alguna condición anterior del mun

do. Dicha suposición era en muchos sentidos un principio guía en la

búsqueda de explicaciones científicas cada vez más globales de los

fenómenos de la experiencia. Si un suceso parecía no responder a

ninguna causa, sólo podía ser un reflejo de nuestra ignorancia, del

hecho de que aún no habíamos hallado la causa cuya existencia

estaba asegurada por el principio general de que «todo suceso tiene

una causa».

Pero, según veremos, muchos han afirmado que este principio no

puede seguir siendo considerado como verdadero en un mundo des

crito por la mecánica cuántica. ¿Qué tipo de teoría podría decirnos

que hay sucesos no causados en el mundo, sucesos para los que la

búsqueda de una causa determinante subyacente es una empresa

abocada al fracaso? La respuesta no es una cuestión sencilla. El fallo

de la causalidad universal implicado por la mecánica cuántica es par

te de una revuelta conceptual mucho más profunda a la que nos he

mos visto forzados por esta teoría. De hecho, pocos de los que han

explorado las cuestiones con detenimiento piensan que alguna de las

descripciones del mundo ya construidas llegará a hacer justicia a los

hechos que la mecánica cuántica nos dice que encontraremos en el

mundo. Ideas básicas sobre lo que constituye «la realidad objetiva»,

como opuesta a nuestra experiencia subjetiva de ella, devienen pro

blemáticas a la luz de esta asombrosa teoría. Una vez más (y éste es el

único comentario que haré aquí), la naturaleza revolucionaria de los

datos de la experiencia y de la teoría construida para dar cuenta de

ellos en la física moderna nos impone el tipo de examen crítico y de

tenido del papel desempeñado (algunas veces sólo implícita e incons

cientemente) por ciertos conceptos fundamentales en nuestras viejas

teorías. Además, esa misma naturaleza revolucionaria requiere un

examen filosófico detenido sobre la forma en que lat revisión de la

teoría nos impone una revisión de la estructura conceptual. Los tipos

de pensamiento y razonamiento familiares en contextos filosóficos


pasan a ser parte integrante de la ciencia en el contexto de las revo

luciones conceptuales.

La filosofía ha sido también integrada en la práctica científica de

la física moderna mediante la irrupción en la teorización científica de

un tipo de crítica epistemológica que antes sólo se encontraba en la

filosofía. La física anterior descansaba en suposiciones sobre qué po

día constituir datos legítimos para fundamentar la inferencia a teorías

físicas y qué podía constituir reglas legítimas de inferencia por las

que uno pasaba de las compilaciones de datos observados a las hipó

tesis generalizadas y a las teorías postuladas. Con frecuencia se deja

ba a los filósofos la tarea de desentrañar las suposiciones implícitas

hechas por las ciencias, de esclarecer su naturaleza y examinar su le

gitimidad. Pero en la física moderna se ha hecho ineludible para los

teóricos, como parte de su práctica científica, el explorar estas cues

tiones básicas concernientes a nuestras razones para aceptar y recusar

hipótesis. Los trabajos de Einstein en la teoría de la relatividad y de

Bohr en la mecánica cuántica son particularmente reveladores de

esta nueva corriente epistemológica.

En su artículo seminal sobre la teoría especial de la relatividad,

por ejemplo, A. Einstein afronta una serie de dificultades teóricas y

observacionales sumamente complejas de la física existente. Su forma

de abordar estos problemas se funda en una discusión extraordina

riamente original y brillante de la pregunta, «¿cómo podemos deter

minar si dos sucesos separados espacialmente ocurren o no al mismo

tiempo?». Esta exploración en la base evidencial e inferencial de

nuestra legítima postulación teórica conduce a Einstein al núcleo

central de su nueva teoría, la relatividad de la simultaneidad respecto

al estado de movimiento del observador. Si bien Einstein deriva, de

hecho, de sus postulados básicos algunas consecuencias observacio

nales asombrosamente nuevas y de importancia fundamental, mu

chos de sus resultados predichos estaban contenidos en la teoría an

terior de H. Lorentz. Pero incluso para estas consecuencias, el

trabajo de Einstein constituye un avance de una importancia funda

mental. Vistas desde su nueva perspectiva, las fórmulas anteriores ad

quieren un significado completamente diferente. Es esencial observar

que esta nueva perspectiva se funda en un examen filosófico-crítico

de la base evidencial de nuestras inferencias teóricas. Sorprendente

mente, como veremos más adelante, un examen epistemológico críti

co muy similar de otras teorías más antiguas se encuentra en el pro-


pió núcleo de la otra teoría fundamental de Einstein sobre el espacio

y el tiempo: la teoría general de la relatividad.

La mecánica cuántica nos proporciona otro ejemplo principal de

cómo la crítica epistemológica juega un papel crucial en la física mo

derna. La cuestión sobre la naturaleza del proceso de medida, el pro

ceso mediante el que un observador exterior explora un sistema físi

co con la intención de determinar su estado, resulta fundamental

para un entendimiento del significado de las fórmulas centrales de la

mecánica cuántica. Desde los primeros comienzos de esta teoría, las

cuestiones sobre lo que es observable jugaron un importante papel

conceptual. Más tarde, las tentativas llevadas a cabo para entender

consecuencias tan curiosas de la teoría como el denominado Princi

pio de Incertidumbre exigieron, una vez más, un examen crítico de

aquello que podía ser determinado observacionalmente. Por último,

las tentativas de entender el marco de trabajo conceptual fundamen

tal de la teoría llevaron a Niels Bohr a afirmar que la nueva teoría fí

sica exigía una revisión extraordinariamente radical de nuestras ideas

tradicionales sobre la relación entre lo que sabemos del mundo y lo

que de hecho es el caso sobre él. La idea misma de una naturaleza

objetiva del mundo independiente de nuestro conocimiento sobre el

mismo fue atacada en el programa de Bohr. Una vez más, ideas pre

viamente familiares en el contexto de la filosofía pasaron a formar

parte de la física. En filosofía, la negación de la objetividad y las vin

dicaciones a favor de varias doctrinas de la relatividad o de la subje

tividad para el mundo son una vieja historia.

La interacción entre la filosofía y la física no comenzó con estas

teorías del siglo XX. Como veremos, hubo cuestiones filosóficas entre

lazadas con los primeros desarrollos de la dinámica (especialmente

en I. Newton). En el siglo XIX, los debates filosóficos desempeñaron

un papel crucial en el desarrollo de la nueva teoría atómico-molecu-

lar de la materia. Otras polémicas de cariz filosófico fueron importan

tes para establecer la base conceptual de la teoría del electromagne

tismo, con su invocación del «campo» como un componente

fundamental del mundo físico. Pero la física moderna ha llevado sus

exploraciones hasta los mismos límites del mundo. Al hacer esto, ha

forzado el aparato conceptual adecuado para tratar con cuestiones

más limitadas. La física, en su intento de hacer justicia a los comple

jos e inesperados fenómenos revelados por las técnicas experimenta

les modernas, exige la revisión radical de conceptos anteriormente


no cuestionados. Las nuevas teorías demandan un examen de las ba

ses evidencíales e inferenciales tras sus postulados. En consecuencia,

la física teórica moderna se ha convertido en un foro en el que los

modos filosóficos de pensamiento son un componente esencial del

progreso físico. Es este entrelazamiento de la física y la filosofía lo

que vamos a explorar.

Filosofía de la física y filosofía general

Acabamos de ver algunas de las razones por las que la filosofía ha ad

quirido importancia para quienes se preocupan por la naturaleza de

la teoría física. Podría ser de ayuda explicar también porqué el estu

dio de los fundamentos de la teoría física y de sus aspectos filosófi

cos reviste valor para los filósofos que no se interesan específicamen

te por la naturaleza de la física. A mí me gustaría sugerir que los

problemas investigados por los filósofos de la física y los métodos

que emplean para explorar estos problemas pueden arrojar luz sobre

cuestiones filosóficas más generales asimismo.

Los filósofos de la ciencia están interesados en cuestiones tales

como la naturaleza de las teorías científicas, la manera en que éstas

explican los fenómenos del mundo, la base evidencial e inferencial

de estas teorías y la forma en que esa evidencia puede ser utilizada

para respaldar justificadamente o desalentar la creencia en una hipó

tesis. Podemos lograr un mayor discernimiento explorando estas

cuestiones más generales en el contexto de teorías específicas de la

física contemporánea. El vasto alcance de las teorías y su naturaleza

sumamente explícita proporcionan un contexto en el que muchas

cuestiones de la filosofía general de la ciencia, de lo contrario bastan

te vagas, se hacen más «fijas» cuando centramos nuestra atención en

estas teorías físicas especiales.

Al estar las teorías sumamente formalizadas, el lugar que en ellas

ocupan conceptos cruciales está sencilla y claramente delimitado. Las

cuestiones sobre el significado de los conceptos cruciales, su elimina-

bilidad o irreducibilidad, sus relaciones definitorias y otras más, pa

san a ser sometidas a un examen riguroso. Dicho examen es más difí

cil de realizar cuando se trata de los conceptos más «relajados» de

ciencias no tan bien formalizadas. Como también veremos, la rela

ción de la estructura postulada teóricamente a los hechos obser-


vacionales de los que es inferida está particularmente clara en mu

chos de los casos de la física formalizada. En las teorías del espacio y

el tiempo, por ejemplo, el propio contexto de teorización científica

presupone nociones bastante definidas de lo que ha de considerarse

como «hechos accesibles a la inspección observacional directa», los

cuales han de proporcionar la totalidad del soporte evidencial de la

teoría. Así, cuestiones sobre si la totalidad de dichos hechos podría

seleccionar un único competidor teórico viable, respaldándolo frente

a todos sus contendientes, son tratadas en una forma iluminadora,

una de la que carecemos en el contexto científico general. En este úl

timo contexto no hay una noción clara de los límites de la observa

ción, ni una clara delimitación de la clase de posibles alternativas

teóricas a considerar. Si exploramos cuestiones tales como la elimina-

bilidad o no eliminabilidad de los conceptos teóricos o el grado al

que las elecciones teóricas están condicionadas por los hechos obser

vacionales en el contexto de las teorías fundamentales de la física, te

nemos una forma de tratar con estas cuestiones metodológicas gene

rales: examinamos casos específicos que confieren una agudeza

especial a las cuestiones filosóficas. El discernimiento logrado en este

dominio, más formalizable y delimitado, puede resultar de provecho

a quienes están involucrados en cuestiones más amplias.

Estas consideraciones pueden de algún modo ser generalizadas.

Los filósofos que se ocupan de las cuestiones generales de la metafí

sica, la epistemología y la filosofía del lenguaje descubrirán que la ex

ploración de cuestiones en estos campos, al ser las cuestiones ejem

plificadas en los casos particulares concretos de la teoría física,

arrojará luz sobre las formas adecuadas de tratar con las cuestiones

generales. No se puede avanzar mucho en el entendimiento de las es

tructuras específicas de las teorías físicas parciales sin utilizar los re

cursos aportados por quienes exploran las cuestiones más generales y

fundamentales de la filosofía. Lo que es más, no se puede realizar

ningún claro progreso en estas áreas más generales sin ver cómo se

comportan los métodos y las soluciones generales cuando se aplican

a casos específicos. Y los casos específicos de los fundamentos filosó

ficos de la teoría física fundamental son, de nuevo, particularmente

adecuados como casos prueba de las vindicaciones filosóficas gene

rales. ,

Una última cuestión relacionada merece un momento de aten

ción. Uno encuentra con frecuencia en la literatura afirmaciones muy


.11 revidas de que la física contemporánea ha resuelto decisivamente

viejos debates filosóficos de una vez por todas. «La mecánica cuánti

ca reiuta la afirmación de que todos los sucesos tienen una causa» es

un ejemplo frecuente. Algunas veces, asombrosamente, los dos ban

dos de un debate filosófico sostienen que una teoría resuelve un pro

blema en su favor. Así, se ha argüido que la teoría general de la rela

tividad resuelve decisivamente la cuestión de la naturaleza del

espacio. Pero algunos arguyen que refuta el sustantivismo, mientras

otros arguyen que resuelve el debate ¡en favor de esa doctrina! Vindi

caciones tan burdas e incompetentes son decepcionantes porque las

cuestiones son complejas y los razonamientos a menudo frustrante-

mente sutiles y opacos. Bajo dichas circunstancias, las vindicaciones

de una victoria decisiva de cualquier tipo deberían ser tratadas al

menos con cierto escepticismo.

Tendremos que tener un cuidado especial con las conclusiones

filosóficas derivadas de los resultados físicos. En analogía con el Prin

cipio G IG O de la ciencia de los computadores («garbage in, garbage

out») [«basura in, basura out»], podemos llamar a esto el Principio

MIMO: «metafísica in, metafísica out». No hay duda de que cual

quier vindicación filosófica debe ser reconciliada con los mejores re

sultados de la ciencia física a nuestra disposición. Ni hay duda algu

na de que el progreso de la ciencia ha proporcionado un útil

antídoto contra mucho dogmatismo en la filosofía. Pero al examinar

lo que la física nos dice sobre las cuestiones filosóficas, debemos te

ner siempre presente preguntar si se han insertado presuposiciones

filosóficas en la propia teoría. Si descubrimos que dichas presuposi

ciones han sido incluidas en la propia teoría, debemos de estar prepa

rados para examinar detenidamente la cuestión de si esa forma de

presentar la teoría es la única forma en la que sus resultados científi

cos podían haber sido acomodados o si pudiera haber otras presupo

siciones que nos llevarían a derivar conclusiones filosóficas bastante

diferentes en caso de formar parte de la teoría.

Finalidad y estructura de este libro

Por último, ofreceré unas pocas observaciones sobre la finalidad y la

estructura de este libro. La investigación sistemática y exhaustiva de

cualquiera de los principales problemas de la filosofía es una tarea

Introducción: la filosofía y las ciencias físicas

larga y ardua. Un dominio de los contenidos de''l»»J&tí¿i*sí\í funda

mentales de la física contemporánea requiere un estudio preSuJk del

difícil y extenso cuerpo de las matemáticas, ya que las teorías están a

menudo gestadas en el poderoso y abstracto lenguaje de la matemáti

ca contemporánea. El estudio de los elementos físicos especiales de

las teorías debe añadirse al trasfondo matemático. Por encima de

esto, la indagación filosófica requiere un conocimiento firme de mu

chos aspectos de la filosofía analítica contemporánea: la metafísica, la

epistemología, y la filosofía del lenguaje.

Un intento de hacer plena justicia a cualquiera de los problemas

centrales de la filosofía en una obra introductoria como la presente

está claramente fuera de toda cuestión. Nuestra finalidad aquí, antes

bien, es suministrar al lector un mapa de carreteras de las áreas don

de se encuentran los problemas centrales en el campo. El libro se

centra en lo que, a mi entender, parecen ser las cuestiones más im

portantes de la filosofía de la física. Muchos otros tópicos interesan

tes apenas serán tocados y algunos serán dejados completamente a

un lado, con la intención de dirigir toda la atención posible a las

cuestiones más cruciales y centrales.

En lo que a los tópicos considerados respecta, proporciono un

bosquejo o resumen de las principales características de las teorías fí

sicas que interaccionan más crucialmente con la filosofía. M i propósi

to es ofrecer un tratamiento suficientemente claro y conciso de estas

cuestiones a fin de conducir al lector interesado a través de los cami

nos, en ocasiones laberínticos, seguidos por los debates centrales. Los

capítulos 2, 3 y 4 están complementados con una guía comentada de

la literatura. El lector interesado en seguir con detalle las cuestiones

esbozadas en el texto encontrará en estas secciones de referencia una

guía a los materiales de fondo básicos en matemáticas, física y filoso

fía, así como una guía a las discusiones contemporáneas más impor

tantes del problema específico. Las secciones de referencia no están

concebidas como un examen exhaustivo de la literatura sobre cual

quiera de los temas tratados (una literatura en ocasiones muy exten

sa) sino, antes bien, como una guía selectiva de los materiales más

útiles para hacer avanzar al lector de una forma sistemática.

Pese a haber intentado incluir en las secciones de referencia ma

terial accesible a aquellos que no dispongan de unos conocimientos

básicos extensos de matemáticas y física teórica, no he excluido ma

terial que requiera conocimiento en estas áreas para su comprensión.


El material que requiere un conocimiento bastante modesto de este

tipo (digamos al nivel medio de una licenciatura) está señalado con

(*). El material que requiere una mayor familiaridad con los concep

tos y métodos técnicos está señalado con (**)■

Las tres áreas principales que exploraremos en este libro son las

concernientes al espacio y tiempo, a las teorías probabilísticas y esta

dísticas de tipo «clásico», y a la mecánica cuántica. Esto nos permiti

rá examinar muchas de las áreas problemáticas actuales más asom

brosas y fundamentales en la filosofía de la física. Otra área principal

será tratada sólo incidentalmente, aunque introduce de suyo muchas

cuestiones sumamente interesantes que han sido sólo parcialmente

exploradas. Se trata de la teoría general de la materia y su constitu

ción tal y como es descrita por la física contemporánea. Las cuestio

nes que derivan de la postulación del campo como un elemento bási

co del mundo, de problemas en la teoría de la constitución de la

materia a partir de sus microconstituyentes en una jerarquía descen

dente que nos lleva a través de las moléculas y los átomos a las partí

culas elementales (y quizá más allá), y de la teoría fundamental de las

propias partículas elementales serán tocadas solamente de paso al

ocuparnos de las tres áreas de problemas centrales mencionadas más

arriba.

Capítulo 2

ESPACIO, TIEMPO, MOVIMIENTO

Problemas filosóficos tradicionales del espacio y el tiempo

Cuestiones acerca del conocimientoLos grandes filósofos de la Grecia Antigua confrontaron el problema

de entender qué significa tener conocimiento del mundo. ¿Cuáles

son los fundamentos, se preguntaron, y cuáles los límites de nuestra

capacidad de conocer cómo es realmente el mundo que nos rodea?

No es sorprendente que esta empresa, dirigida a intentar distinguir el

conocimiento verdadero de la mera opinión, comenzase examinando

las creencias ordinarias sobre aquello que, al entender de la persona

racional corriente, podía constituir un conocimiento bien fundado.

Había, claro está, muchas creencias particulares compartidas

acerca de la existencia y de la naturaleza de los objetos individuales

del mundo que hallamos en nuestra vida cotidiana. Pero, ¿había tam

bién verdades generales sobre el mundo que pudieran asimismo ser

conocidas, verdades sobre todos los objetos o características de un ti

po dado?

Algunas verdades generales parecía que podían ser establecidas

por generalización de nuestra experiencia cotidiana. Así, parecía po

der inferirse de la observación que las estaciones del año seguirían

perpetuamente su curso habitual. Que las rocas caían, que el fuego

27


ascendía, que los seres vivos procreaban y después, tras un proceso

de maduración, perecían, y muchas otras verdades generales forma

ban parte de un haber común de creencias. Pero la reflexión crítica

demostró que en la observación, expuesta como estaba a la ilusión y

al error de percepción, no se podía con frecuencia confiar. Y con fre

cuencia se halló que las creencias generales derivadas de la experien

cia dejaban de ser válidas cuando se añadían nuevas experiencias.

Además, las verdades derivadas parecían carecer de exactitud y pre

cisión, salvo en esferas de la experiencia tan reducidas como la de la

astronomía, donde se observaba una regularidad más perfecta y per

manente que la hallada en la experiencia de las cosas terrenales ordi

narias.

No obstante, en su búsqueda en pos de las verdades generales

acerca de la estructura fundamental del mundo, los griegos también

contaron con las teorías de los primeros grandes filósofos especulati

vos. Entre las muchas teorías generales principales que se propusie

ron estaba que todas las cosas están formadas por un pequeño núme

ro de sustancias básicas; que el cambio debe explicarse por el

reordenamiento de los átomos invariables; que el mundo es funda

mentalmente inmutable o, por el contrario, que está en flujo constan

te. Pero, si bien estas teorías fundamentales del universo eran apasio

nantes y profundas, parecían carecer de la clase de soporte evidencial

que podría persuadir a un escéptico a aceptarlas como verdaderas.

Sus proponentes, por supuesto, las defendieron, unas veces invocan

do burdas verdades generales derivadas de la observación, otras afir

mando abiertamente que podían llevar al convencimiento por el pro

ceso del razonamiento puro. Pero ninguna doctrina gozó de

aceptación universal, es decir, ninguna doctrina probó ser verdadera

por una evidencia incuestionable.

¡Y entonces se hizo la geometría! Aquí uno parecía contar con un

cuerpo de aserciones de significado completamente claro, aserciones

sobre la naturaleza del mundo que eran exactas y precisas y de las

que se podía saber si eran verdaderas con certeza. Ejemplos de esta

clase de verdades son que al duplicar la longitud de un lado de un

cuadrado su área queda multiplicada por cuatro, y que el cuadrado

de la longitud de la hipotenusa de un triángulo rectángulo es la suma

de los cuadrados de las longitudes de los otros dos lados. Éstas y

otras afirmaciones de la geometría poseían una claridad y una certeza

no presente en ningún otro tipo de enunciados sobre el mundo.

Espacio, tiempo, movimiento 29

Esta certeza existía porque las proposiciones de la geometría po

dían ser demostradas, un hecho que había sido descubierto por los

griegos poco antes de la gran era de la filosofía griega clásica. Las

proposiciones podían ser derivadas por razonamiento puramenteTó-

gico a partir de primeros principios, axiomas o postulados, que pare

cían verdaderos en sí mismos a la mente razonable. El razonamiento

utilizado procedía seguro intuitivamente de no llevar de una verdad

a una falsedad. Uno partía de verdades tan obvias como que dos

puntos fijos determinaban una, y solo una, recta que contenía a los

dos y que iguales sumados a iguales daban iguales. Entonces, por una

cadena de razonamientos en la que cada paso era una transición de

una proposición a otra proposición que conducía a uno de‘ manera

autoevidefite de una verdad a otra, se podía finalmente alcanzar una

conclusión cuya verdad quedaba entonces garantizada con seguridad.

Éstas eran las verdades acerca d^ la compleja estructura geométrica

del mundo.

Tan asombrosa es esta característica de la geometría, su capaci

dad de aportarnos un conocimiento sobre la estructura del mundo

avalado por una inferencia incuestionable a partir de verdades bási

cas, simples e incuestionables, que todo otro tipo de conocimiento

putativo les pareció a los filósofos a lo más un tipo de conocimiento

de segunda clase. El conocimiento fundado en los sentidos estaba su

jeto a los familiares tipos de errores sensoriales —percepción errónea

e ilusión. Y el conocimiento que surgía por vía de generalización a

partir de los datos concretos de la sensación contaba con un doble

inconveniente, la posibilidad de error sensorial y la posibilidad de

que nuestras inferencias generalizadoras pudieran de suyo conducir

nos de la verdad a la falsedad. Mientras la preservación de la verdad

de las inferencias puramente lógicas que nos conducían de los postu

lados básicos a los teoremas geométricos parecía estar garantizada

por la intuición, las reglas para trascender la experiencia de los senti

dos y pasar a afirmaciones generales sobre la naturaleza parecían ca

recer de dicha garantía avalada por la intuición.

Para muchos, la creencia fundada en la observación sensorial y

en la inferencia a partir de ésta se convirtió simplemente en un preli

minar al establecimiento de un conocimiento auténtico por el méto

do «geométrico». Los filósofos insistieron durante mucho tiempo en

el ideal de que, sólo con ser lo suficientemente inteligentes, podría

mos algún día construir un edificio de conocimiento que compren-


diese todos los campos de investigación, la física de la naturaleza, la

psicología de la mente, incluso los principios básicos de la moral que

rigen las verdades de lo bueno y lo malo, así como de lo correcto y

lo incorrecto, al descubrir en todos estos campos sus primeros princi

pios, verdaderos en sí mismos, análogos a los axiomas de la geome

tría. Podríamos entonces derivar a partir de estos primeros principios

el conjunto entero de verdades en cada área, de la misma forma que

los teoremas de la geometría se siguen por la lógica solamente de los

postulados geométricos básicos.

Con la creciente influencia de la observación y del experimento

en la fundamentación de la ciencia que surgió tras la revolución

científica, y dada la incapacidad para formular una «geometría» de la

naturaleza y la moral, la gente se volvió escéptica respecto a la conve

niencia del modelo geométrico para la estructura del conocimiento

científico. En su lugar, los modelos del conocimiento basados en la

observación y la generalización a partir de ésta se hicieron más atrac

tivos, al menos para la mayoría de los filósofos.

David Hume sugirió que, de hecho, no podía existir un conoci

miento auténtico del mundo fundado en la autoevidencia intuitiva y

la inferencia lógica. Dicho conocimiento infalible, sugirió, sólo podía

ser conocimiento de proposiciones «vacías», proposiciones verdade

ras sólo en virtud de la definición de sus términos (tal como la pro

posición de que ningún soltero está casado). Toda proposición verda

dera, llena de contenido, podía conocerse, si es que podía, sólo con

dependencia de los sentidos y por la generalización de los mismos

que nos condujo a las creencias en las relaciones causales en el mun

do. En particular, Hume negó toda posibilidad a la metafísica, la ra

ma de la filosofía que se ocupa de establecer verdades profundas y

generales acerca de la naturaleza del mundo sobre la base del razona

miento puro únicamente.

La respuesta de Immanuel Kant a Hume fue especialmente im

portante.. Pese a coincidir con Hume en el rechazo escéptico de la

mayor parte de la metafísica tradicional, Kant reservó una pequeña

parte de ésta como constituida por aserciones verdaderamente llenas

de contenido, establecidas sin referencia alguna a la observación o al

experimento. Que semejantes verdades llenas de contenido pudieran

ser conocidas por la razón pura, argumentaba, quedaba demostrado

por la existencia de las dos ramas de la verdad matemática pura, la

geometría y la aritmética. Estas dos disciplinas consistían en verdades


de las que ninguna persona racional podía dudar y que habían sido

establecidas por medio de la razón pura únicamente. Pero las verda

des de estas disciplinas, pensó, no eran del tipo «vacío» evidentemen

te. No forma parte del significado de «triángulo» que los ángulos in

teriores de un triángulo sumen 180° en el mismo sentido que forma

parte del significado de «soltero» que un soltero no esté casado.

Kant sostenía que semejantes verdades llenas de contenido, que

podían ser establecidas por la razón, existían porque reflejaban la es

tructura del aparato perceptivo y cognitivo de nuestras mentes con el

que aprehendíamos la naturaleza del mundo. Decía que una porción

limitada de la metafísica tradicional, la cual incluía aserciones tales

como «todo suceso tiene una. causa», compartía con la geometría y

con la aritmética la cualidad de poseer un contenido verdadero y, pe

se a ello, ser cognoscible con independencia de la observación y del

experimento. Lo importante acerca de estas afirmaciones generales

para nuestros propósitos es el papel que en ellas juega la geometría.

Aun cuando la esperanza en una física, una psicología o una ética

fundada en la razón pura sea vana, ¿no persiste la teoría del espacio

— la geometría— , junto a la aritmética, como un cuerpo de conoci

miento que no se funda en una generalización de los hechos concre

tos observados que nos proporcionan los sentidos?

Muchos intentaron en los años posteriores a Kant justificar el pa

recer de Hume de que sólo podía demostrarse que las aserciones

que contenían enunciados verdaderamente informativos sobre el

mundo fuesen correctas mediante su confrontación con los datos de

la experiencia observacional. El estatus problemático de la geometría

y la aritmética recibió una gran dosis de atención, pues, si Hume te

nía razón, las disciplinas matemáticas podrían versar sobre el mundo

o podrían ser conocidas por la razón pura, pero nunca ambas cosas a

la vez. Algunos intentaron mostrar que esas disciplinas podían rete

ner su estatus de cognoscibilidad con independencia de la experien

cia observacional, pero sólo porque estaban libres de un contenido

verdaderamente informativo. Varias tentativas de mostrar que la ver

dad matemática era el resultado de la lógica pura, combinada con la

definición de los términos matemáticos en el vocabulario puramente

lógico, se vieron suscitadas de esta forma.

Otros buscaron, por el contrario, preservar el contenido verdade

ramente informativo de las ciencias matemáticas, pero rechazar la

pretensión kantiana de que pudieran ser establecidas por cualquier


proceso <Je razonamiento puro que las hiciera, a diferencia de las

ciencias ordinarias, inmunes a la confrontación con la observación

como prueba definitiva de su credibilidad. J. S. Mili, por ejemplo, ar

guyo que incluso las proposiciones de la aritmética eran establecidas

por un proceso de generalización a partir de los resultados de obser

vaciones particulares. Podía parecer que las leyes básicas de la arit

mética poseían un tipo de certeza autogarantizada. Pero esto era una

ilusión. Nosotros derivamos las leyes de la aritmética de nuestra ex

periencia sensorial. Esta experiencia, sin embargo, nos es tan familiar

y está tan extendida que nos lleva a pensar erróneamente que las le

yes de la aritmética no precisan de ninguna confirmación empírica.

De hecho, Mili pensó que, al igual que las leyes de la física y la quí

mica, las leyes de la aritmética sólo podían ser establecidas por gene

ralización a partir de la experiencia empírica.

Algunos teóricos del conocimiento reflexionaron sobre el modo

en que nuestras creencias forman una red compleja de aserciones, al

gunas de las cuales son invocadas siempre que la sensatez de creer

en algunas de las otras es cuestionada. También observaron el grado

al que nuestras creencias deben estar fundadas en principios de infe

rencia, tales como aceptar como razonable la teoría más simple que

podamos imaginar en consonancia con los datos empíricamente rele

vantes. Los teóricos también argumentaron que estos principios pare

cían inteligibles y justificables sólo si se admitía un conjunto ya exis

tente de creencias que permanecían irrebatibles por el momento.

Veían con escepticismo la utilidad de cualquier distinción rígida en

tre proposiciones cognoscibles mediante la razón pura y aquellas cog

noscibles sólo con dependencia de los datos experimentales. De he

cho, muchos veían con escepticismo la posibilidad de dividir

nuestras creencias, como Hume quería hacer, en dos grupos: aquellas

que son verdaderas por convención (o por definición o por el mero

significado de los términos) y aquellas con un contenido informativo

genuino.

Desde esta perspectiva, todas nuestras creencias forman parte de

un tejido sin costuras de creencia teórica. Cada proposición contiene

elementos de convención y elementos de objetividad. En opinión de

estos filósofos, cada proposición confronta la experiencia sensorial

sólo cuando se une a un amplio cuerpo de creencias aceptadas. Sólo

como parte de una estructura teórica general puede ser una proposi

ción probada por la experiencia o confirmada por ella. Es este cuer


po de creencias aceptadas, afirmaban, lo que fundamenta nuestros

principios de legítima inferencia científica.

No va a ser tarea nuestra en este libro examinar las diferentes op

ciones en alguna profundidad. En lugar de ello exploraremos más

adelante el impacto de los cambios en el lugar ocupado por la geo

metría en las matemáticas y en la física que influyeron en, y se vieron

influidos por, el problema más general de los fundamentos de la legí

tima creencia científica. Ya hemos indicado que la existencia tempra

na de la geometría como cuerpo ideal de un conocimiento verdade

ramente científico sobre el mundo condujo a muchos filósofos a

limitar el conocimiento auténtico a aquél que pudiera ser establecido

por una impecable derivación lógica a partir de primeros postulados

autoevidentes e incuestionables. El descubrimiento y la exploración

por los matemáticos de alternativas a la familiar geometría euclídea,

que había reinado como la única geometría matemática durante mu

chos siglos, y la posterior aplicación de las recién descubiertas geo

metrías alternativas a las teorías físicas que intentaban describir el

mundo real fueron influencias clave sobre los filósofos que buscaron

polemizar con las cuestiones planteadas por el conflicto entre Kant y

Hume y llevadas adelante por otros. Estas eran las cuestiones concer

nientes al fundamento último de nuestra creencia científica sobre el

mundo y a la medida en que esa creencia era responsable de los

datos evidencíales particulares de la observación y del experimento.

Cuestiones acerca de la naturaleza de la realidad

La geometría es la ciencia descriptiva del espacio. Pero, ¿qué clase de

cosa es el espacio? O mejor dicho, ¿cómo podemos integrar la espa-

cialidad del mundo en nuestra concepción global sobre la clase de

cosas y propiedades que existen? Es evidente que la espacialidad es

uno de los aspectos más generales y fundamentales del mundo según

lo experimentamos y según construimos su naturaleza por inferencia

a partir de dicha experiencia. En nuestro lenguaje y práctica corrien

tes nos sentimos plenamente contentos con el uso que hacemos de

nociones espaciales tales como distancia, contención espacial, y conti

nuidad y discontinuidad en el espacio, cuando tratamos con las im

portantes estructuras que rigen el mundo material que nos rodea.


Pero cuando intentamos reflexionar sobre lo que el espacio es en y

por sí mismo nos vemos desconcertados.

Quizá lo primero que nos venga a la mente es que el espacio es

una suerte de «continente» de la materia del mundo. Pensamos en

las cosas como existentes en el espacio, de hecho, en un único espa

cio total que contiene todas las cosas materiales del mundo. Pero in

cluso esta idea de contención causa perplejidad, pues parece que el

espacio contiene objetos en virtud de la coincidencia virtual de los

objetos con los trozos del espacio mismo. Un objeto ocupa la parte

de espacio en la que se encuentra. Esto es claramente una clase de

contención diferente a la de, pongamos, un objeto contenido en una

caja.

Se nos ocurre de manera natural que podemos imaginar un mun

do vacío de todas las cosas materiales, pero conservando aún una cla

se de realidad. Se trataría de un espacio vacío esperando a ser llena

do, o parcialmente llenado, por trozos de materia. Esta idea de

espacio como una clase de entidad, el continente fijo e invariable de

las cosas materiales ordinarias que pueden llegar a ser y dejar de ser

y pueden sufrir cambios en su naturaleza, está probablemente pre

sente en el diálogo de Platón en el Timeo acerca del espacio como

«receptáculo» del ser material.

Pero, ¿qué clase de cosa o sustancia singular es esta fantasmal en

tidad. el espacio mismo? Nos sentimos ciertamente con derecho a

hablar de «el espacio vacío entre las estrellas» o, incluso, a imaginar

el espacio completamente vacío de un mundo en el que toda la ma

teria fue de alguna forma destruida como por arte de magia. Pero,

¿qué clase de cosa es esta sustancia que pretendemos llamar «espacio

vacío»? ¿Se trata de un único objeto particular del que forman parte

ciertos espacios, como el espacio de una habitación, al igual que un

trozo de pan forma parte de una barra entera? Esta cosa, el espacio,

tiene características, por ejemplo, las características descritas por las

verdades de la geometría. No obstante, nuestra intuición nos dice

que pl espacio mismo es demasiado diferente de la materia ordinaria,

demasiado insustancial, para poder ser considerado como una cosa

en el mundo, junto a las cosas ordinarias que se encuentran en el es

pacio. Pero, ¿de qué otra manera podemos ver la cuestión?

Aristóteles hablaba de «lugar». Es difícil descifrar lo que tenía en

mente exactamente, pero parece como si por lugar entendiese el con

torno o límite de un trozo de materia. El movimiento es cambio de


lugar, ya que un objeto cambia la superficie que lo limita por otra.

Pero, ¿significa esto que el espacio es alguna cosa adicional sobre y

por encima de la materia contenida en él? Uno presiente que Aristó

teles está intentando escapar a esa conclusión, pero que no sabe qué

esquema conceptual poner en su lugar. Pronto examinaremos la prin

cipal tentativa llevada a cabo por los filósofos posteriores para encon

trar un esquema conceptual que haga justicia a las afirmaciones que

queremos hacer sobre objetos que existen en el espacio, que ocupan

un lugar, que son capaces de cambiar de lugar, etcétera, y que haga

también justicia a nociones intuitivas tales como la posibilidad de un

espacio desprovisto de materia. Esa propuesta posterior intentará

también evitar el escándalo de pensar en el espacio como un compo

nente adicional del ser que puede tener una realidad independiente

de la existencia misma de la materia en él.

Si el espacio nos causa perplejidad, el tiempo nos desconcierta

todavía más. Nuestra intuición nos dice de nuevo que todo lo que

ocurre en el mundo ocurre en el tiempo. Aun cuando pensemos al

gunas veces que nuestros estados mentales subjetivos podrían no

estar en el espacio (¿dónde, por ejemplo, se localizan los pensamien

tos?), pensamos que incluso nuestros pensamientos deben producirse

en algún momento en el tiempo. Tenemos la impresión de que hay

un único tiempo en el que ocurre todo lo que ocurre, abarcando

cualquier proceso extenso una parte del tiempo total del mundo.

Algo similar al aspecto de continente del espacio parece ser cierto

también para el tiempo. Los tiempos de procesos que ocupan tiempo

coinciden con momentos del «tiempo mismo». Y, pensamos, es posi

ble imaginar intervalos de tiempo en los que no se dan acontecimien

tos materiales. ¿No podemos imaginar un mundo en el que toda la

materia y sus manifestaciones hubieran desaparecido, pero en el que

el tiempo proseguiría como siempre lo había hecho?

Pero si concebir el espacio como una «cosa» es extraño, mucho

más extraño es concebir el tiempo como una «entidad» en el sentido

ordinario. Pero si puede haber un flujo del tiempo aun cuando la

materia cese de existir, ¿no debemos reconocer al tiempo un tipo de

ser independiente de la existencia de las cosas ordinarias del mundo

y de sus cambios ordinarios en el tiempo?

Otras conexiones entre temporalidad y ser nos dejan más perple

jos todavía. Parece que pensamos que la existencia misma de las

cosas ordinarias está vinculada al tiempo en una forma que no lo está


al espacio. Si algo existió en el pasado, pero no existe ahora, pensa

mos que no existe en absoluto, propiamente hablando. Y lo mismo

puede decirse de los objetos futuros que todavía no existen. Pero,

como san Agustín indicó, el presente es un instante evanescente de

tiempo, que hace que nos preguntemos cómo podemos decir con

propiedad de las cosas, dada su naturaleza temporal, que tienen una

existencia. A diferencia del espacio, el tiempo parece tener un aspec

to asimétrico. El pasado y el futuro nos parecen muy diferentes, con

el pasado como una realidad fija, si bien desaparecida, y el futuro

como algo, quizá, sin una clase determinada de ser hasta que ocurre.

Otras características de la temporalidad de las cosas desconcerta

ron tanto a los antiguos filósofos que algunos se volvieron completa

mente escépticos respecto a la realidad del tiempo y a su cambio

concomitante. Zenón de Elea propuso argumentos tratando de mos

trar que las nociones ordinarias de tiempo estaban plagadas de con

tradicciones. ¿Cómo podía darse algo semejante al movimiento, por

ejemplo, si en cualquier instante particular un objeto estaba en repo

so en el espacio que ocupaba en ese momento? Sucede que algunos

de los argumentos con los que Zenón pretendió poner de manifiesto

ciertas contradicciones internas en las nociones mismas de tiempo y

movimiento serían ahora juzgadas falaces. No obstante, los dilemas

que Zenón planteó en otros argumentos proporcionan todavía un

punto de partida ventajoso a la discusión de cuestiones tales como

los esquemas conceptuales correctos para tratar la noción de espacio

y tiempo como continuos y del concepto de movimiento. Muchos lo

gros valiosos en filosofía, así como el desarrollo de las matemáticas

apropiadas para tratar el movimiento, se han visto inspirados por las

tentativas de resolver los enigmas planteados por Zenón.

Aristóteles sorprende de nuevo al lector moderno con su pene

tración, aun cuando, desde la perspectiva moderna, lo que tiene que

decir pueda ser interpretado de una multiplicidad de maneras. Aris

tóteles concibe el tiempo como algo distinto al movimiento, o cam

bio de las cosas materiales, así como el espacio no puede ser identifi

cado con los objetos que hay en él. Pero, señala, sin movimiento o

cambio no tendríamos conciencia alguna del paso del tiempo. Así, en

una forma paralela a su noción de lugar como espacialidad de los

cuerpos, distinto al cuerpo pero sin existir como entidad indepen

diente separada de los cuerpos en el mundo, habla del tiempo como

una medida del movimiento y del cambio. Pero queda sin aclarar jus-


tamente qué se supone entonces que es el tiempo. Es algo que de

pende de las cosas y de sus movimientos y cambios, pero no es esos

movimientos y cambios. ¿Qué es entonces?

El desconcierto sobre la naturaleza del espacio y del tiempo se

debe en gran parte a su doble papel como proveedor de un foro, tan

to para la evolución de los fenómenos físicos, como para los conteni

dos de lo que intuitivamente consideramos como nuestra conciencia

subjetiva o privada. Los filósofos argumentaron con frecuencia que

mientras los objetos físicos y sus procesos tenían lugar en el espacio y

en el tiempo, los contenidos mentales de nuestras mentes existían

sólo en el tiempo. Sin embargo, sentimos que un modo espacial es

apropiado incluso para describir, pongamos, los contenidos visuales

de nuestros sueños. El gato soñado y el felpudo soñado pueden ser

irreales como objetos auténticos, pero el gato soñado puede parecer-

nos que está sobre el felpudo de una forma similar al menos a como

pensamos que un gato real puede estar sobre un felpudo real. Algún

tipo de espacialidad parece, pues, formar parte integrante incluso de

nuestros fantasmas mentales.

Seguramente, además, los sucesos de nuestros sueños ocurren en

un orden temporal, aun cuando estemos convencidos de que se trata

de un orden en el tiempo de acontecimientos irreales. No obstante,

parece haber de nuevo algunas diferencias entre el espacio de lo

mental y su temporalidad. El espacio en el que existen el gato y el

felpudo soñados parece no estar en «ningún lugar» en lo que con

cierne al espacio real. Parece tratarse de una clase de espacio separa

do del espacio de las cosas físicas. Pero los procesos soñados nos pa

recen ocurrir en el mismo tiempo que el tiempo que comprende los

sucesos físicos. El sueño del golpe con el coche ocurrió después de

que me fuera a dormir y antes de que despertara, en el mismo orden

temporal en que estuve echado en la cama. Pero el espacio del golpe

ilusorio con el coche no puede ser adaptado a ningún lugar real, ni

siquiera al espacio real de mi cabeza donde el mecanismo de mi sue

ño, mi cerebro, está localizado.

Como veremos, no existe una solución sencilla al problema de

poner en un esquema coherente un modelo sobre la naturaleza del

tiempo y del espacio que haga justicia a las intuiciones que acabamos

de examinar. Nuestro relato debería explicar en qué consiste la natu

raleza del espacio y el tiempo. ¿Qué tipo de ser poseen y cómo se re

laciona su ser con el de las cosas y procesos más ordinarios que ocu


pan espacio y acaecen en el tiempo? ¿Cómo hace justicia esta natura

leza del espacio y el tiempo a nuestras intuiciones sobre la espaciali-

dad y la temporalidad, ya sea de los acontecimientos físicos del mun

do o de los contenidos de nuestra experiencia subjetiva? Y, por

último, ¿qué es lo que en la naturaleza del espacio y el tiempo nos da

acceso al conocimiento que decimos poseer sobre su naturaleza, una

clase de conocimiento que algunos consideraron el modelo mismo

de la certeza que podíamos obtener sobre el mundo generada por

nuestra razón pura únicamente?

El debate entre Newton y Leibniz

En el siglo xvil, la filosofía del espacio y el tiempo se convirtió en

una cuestión central de la metafísica y la epistemología. La discusión

alcanzó un punto culminante en el importante debate entre G. W.

von Leibniz, el gran filósofo y matemático alemán, y Newton, el gran

físico y matemático inglés. En su debate se perfilaron dos teorías con

trarías acerca del lugar del espacio y el tiempo en el mundo, y mu

chas de las cuestiones fundamentales que en los años posteriores

ocuparon a los filósofos interesados en el espacio y el tiempo reci

bieron su formulación más clara.

Leibniz ofreció una descripción del espacio y el tiempo que por

fin presentaba un claro entendimiento de cómo la teoría podía, al es

tilo aristotélico, negar al espacio y al tiempo un tipo de ser indepen

diente sobre y por encima del ser de las cosas materiales ordinarias y

de los acontecimientos materiales, pero podía conservar para el espa

cio y el tiempo un lugar crucial en la estructura del mundo. En la fi

losofía «profunda» de Leibniz, su verdadera metafísica, se niega la

existencia per se de la materia, así como la del espacio y el tiempo. En

este Leibniz esotérico, el mundo está constituido por entidades fun

damentales de tipo mental, las mónadas, que existen en un total ais

lamiento unas de otras, sin siquiera interaccionar por medio de la

causalidad. Cada mónada contiene dentro de su naturaleza una ima

gen completa del universo entero, lo cual explica cómo, sin interac

ción, pueden mostrar una evolución coherente en el tiempo.

Debemos dejar a un lado esta concepción leibniziana «profunda» del

mundo que, si bien es extraña, ha sido defendida de formas ingenio

sas e importantes. Su concepción menos profunda, exotérica, del es


pació y el tiempo posee una suerte de estatus intermedio entre la

concepción que dota de existencia a la materia, al espacio y al tiem

po, y la última concepción monadológica.

En esta posición intermedia puede suponerse la existencia de ob

jetos materiales y de sucesos materiales. ¿Qué son entonces el espa

cio y el tiempo? Consideremos dos sucesos cualesquiera que imagi

namos como acontecimientos instantáneos entre las cosas materiales.

Los sucesos tienen una relación temporal entre sí, siendo el primer

suceso posterior a, simultáneo con, o anterior al segundo suceso en el

tiempo. Podemos avanzar aún más a una relación cuantitativa entre

los sucesos, estando el primer suceso separado del segundo en el

tiempo por algún intervalo-temporal definido, que podría ser positi

vo, cero o negativo. La idea sencilla de Leibniz es que el tiempo es

justamente la colección de todas las relaciones temporales de esa ín

dole entre los sucesos. Si no hubiera sucesos, no habría relaciones, de

manera que el tiempo en el sentido indicado carece de una existen

cia independiente de los sucesos en él. Pero las relaciones entre los

sucesos son una componente real del mundo (desde esta perspectiva

exotérica). Así, sería erróneo decir que no hay en absoluto una tal

cosa como el tiempo.

Si consideramos todas las cosas del mundo en un tiempo dado,

vemos relaciones espaciales entre ellas. Las cosas se encuentran a

ciertas distancias unas de otras y en ciertas direcciones unas respecto

de otras. La colección de todas estas relaciones espaciales entre los

objetos del mundo en un tiempo dado es lo que es el espacio. De

nuevo, no hay ningún continente, ningún espacio mismo, esperando

a ser ocupado por objetos. Tan sólo están los objetos y las innumera

bles relaciones espaciales que mantienen entre sí.

La analogía con las relaciones de parentesco nos puede ayudar a

ver esto con mayor claridad. Cualquier gran familia consiste en un

número de personas. Éstas se encuentran relacionadas entre sí en las

formas conocidas. A puede ser padre de B, C primo-hermano de D, etcétera. ¿De qué «materia» está hecha la realidad de una gran fami

lia? Respuesta: de las personas en la familia. Pero, claro está, las rela

ciones que unen a estas personas constituyen aspectos perfectamente

reales del mundo. ¿Podríamos, pues, pensar que las relaciones existen

con independencia de las personas? ¿Podría haber un tipo de «espa

cio relacional» que existe en y por sí mismo, esperando a ser ocupa

do por personas? Semejante conversación es manifiestamente absur-

■10 Filosofía de la física

tía. Mués bien, dice Leibniz, lo mismo que sucede con el «espacio re-

lacional», sucede con el espacio ordinario. Hay cosas y hay relaciones

espaciales entre las cosas. Pero no hay ningún continente que exista

independientemente, el espacio mismo, de la misma forma que no

hay nada que exista independientemente, el «espacio relacional».

Todo suceso que acontece en el mundo material o mental está

relacionado en el tiempo con todo otro suceso. Y todo objeto mate

rial está relacionado espacialmente con todo otro objeto material.

Estas dos familias de relaciones comprenden, pues, toda la realidad.

Pero existen como una colección de relaciones entre los sucesos y las

cosas sustanciales del mundo, no como sustancias independientes

ellas mismas.

Vaya, esto no es tan sencillo. ¿Qué es de los momentos de tiem

po cuando no ocurre nada? ¿Qué es de las regiones desocupadas del

espacio donde no hay nada? ¿Deberíamos negar sencillamente su

realidad? Leibniz sugiere un medio que nos permite mantener estas

nociones como legítimas sin dejar de ser relacionistas. Consideremos

el espacio vacío entre el lugar donde nos encontramos y una estrella.

No hay nada que mantenga con nosotros la relación espacial de estar

a medio camino entre nosotros y la estrella. Sin embargo, algo podría tener esa relación espacial con nosotros y con la estrella. Así pues,

podríamos imaginar los lugares desocupados como relaciones espa

ciales que algo podría poseer con los objetos del mundo pero que en

realidad no son poseídos por nada. El espacio es, dice Leibniz, «en

cuanto a posibilidad», el conjunto de relaciones espaciales entre las

cosas. De manera que la familia de relaciones contiene relaciones

tanto posibles como reales. Podríamos incluso pensar en restaurar la

noción de un espacio totalmente vacío en esta forma. Aun cuando no

hubiera objetos reales, podría haber objetos, y si los hubiera, presen

tarían relaciones espaciales entre sí. Así pues, el espacio totalmente

vacío, que para los antirrelacionistas es una noción inteligible, podría

convertirse para el relacionista en la colección de las relaciones posi

bles (pero no reales) que los objetos materiales posibles (pero no re

ales) podrían presentar entre sí, si tales objetos existiesen. Si el tole

rar tales «relaciones en posibilidad» significa dejar el juego en manos

de los antirrelacionistas, sigue siendo una cuestión de debate filo

sófico.

Leibniz no propone simplemente su descripción relacionista del

espacio y el tiempo de manera dogmática como una alternativa a la


concepción según la cual el espacio y el tiempo son cosas con una

existencia independiente. La concepción del continente parece consi

derar el espacio como un tipo de sustancia. Las cosas existen en el

espacio, según esta concepción, por coincidir con un trozo limitado

de sustancia espacial. Pero, afirma Leibniz, dicha concepción está

plagada de dificultades.

Imaginemos que existe el espacio vacío y a Dios intentando deci

dir dónde colocar al universo material en el espacio. No hay razón al

guna para poner al universo en un lugar y no en otro. Como cada

punto o región del «espacio mismo» es igual a cualquier otto punto o

región, no podría haber un motivo por el que elegir un lugar para el

mundo material frente a otro. Pero Leibniz cree que todo hecho

debe tener una razón suficiente para darse. Como la ubicación del

universo material en el espacio mismo no puede tener tal razón sufi

ciente, no puede darse tal cosa. Pero la concepción del espacio como

continente, y no como mero conjunto de relaciones espaciales entre

las cosas, entraña la existencia de ubicación en el espacio mismo. Por

lo tanto, dicho espacio continente no puede existir.

Leibniz argumenta además que no habría ninguna diferencia ob

servacional por estar el mundo material ubicado en un lugar del es

pacio mismo y no en otro, pero sostiene que un hecho semejante (la

ubicación en el espacio mismo) sin consecuencias observacionales no

es realmente un hecho. De hecho, haciendo uso del principio según

el cual un mundo posible que es exactamente igual en todas sus ca

racterísticas a otro mundo posible debe ser el mismo mundo posible,

arguye que la propia noción de espacio mismo es incoherente. Si el

espacio mismo existiese, podría haber dos espacios posibles exacta

mente iguales, excepto en la diferente ubicación en el espacio mismo

del mundo material en cada uno de dichos mundos posibles. Pero tal

diferencia de ubicación en el espacio mismo no es una diferencia re

al. No puede haber, pues, dos mundos posibles semejantes y, por

consiguiente, la teoría del espacio mismo como continente, según la

cual podría haber dos mundos posibles semejantes, debe estar equi

vocada.

La postura relacionista leibniziana es, pues, que concebir el espa

cio como una cosa por derecho propio conduce a la incoherencia.

Además, el concebirlo como la colección de todas las relaciones es

paciales entre las cosas materiales nos permite decir todo lo que ne

cesitamos decir que es coherente sobre la espacialidad del mundo.


La descripción relacionista es, pues, la que deberíamos adoptar. Y

una concepción similar del tiempo como la familia de las relaciones

temporales entre los sucesos materiales se supone que da al traste

con toda conversación sobre el «tiempo mismo» como una entidad

constituyente del mundo.

Pero hay objeciones abiertamente filosóficas al relacionismo, es

pecialmente al tipo de relacionismo que recurre a relaciones posibles.

Para el relacionista, la estructura del espacio, tal y como es revelada

por la geometría, es la estructura de la colección de todas las relacio

nes espaciales posibles entre los objetos. Pero ¿cuál es el «fundamen

to» de esta estructura de posibilidades? Con esto quiero decir lo si

guiente: Si pensamos en la mayoría de las posibilidades físicas, éstas

son comprensibles sólo debido a alguna estructura real subyacente.

Un trozo de sal, por ejemplo, aun cuando no se haya disuelto, contie

ne la «posibilidad» de pasar a la solución. Es, decimos, soluble. Pero

esta solubilidad estriba en la constitución real del trozo de sal no di

suelta por iones. En el caso de la estructura del espacio mismo, que

los relacionistas entienden como la estructura que describe la colec

ción de todas las relaciones espaciales posibles, ¿cuál es la realidad

subyacente que fundamenta este orden entre posibilidades, si no es

la estructura del «espacio mismo» como los antirrelacionistas ima

ginan?

El oponente de Leibniz, el gran físico Newton, fue un antirrela-

cionista. Newton considera al espacio y al tiempo como algo más que

meras relaciones espaciales y temporales entre los objetos y sucesos

materiales. Qué era exactamente este algo más, no podía decirlo con

seguridad. Considera que es algo similar a la sustancia, pero en oca

siones prefiere pensar que es un atributo o propiedad, de hecho una

propiedad de Dios. Aunque aporta algunos argumentos puramente fi

losóficos en contra del relacionismo leibniziano, Newton es famoso

principalmente por sostener que los resultados de la observación y

del experimento pueden refutar de manera concluyente la doctrina

relacionista.

En la física desarrollada por Newton a partir de los trabajos ante

riores de Galileo y otros, hay un claro contraste entre movimientos

inerciales y movimientos no inerciales. Los movimientos inerciales se

considera que son movimientos de un objeto con una velocidad

constante, esto es, con una velocidad invariable y en una dirección

fija. Ahora bien, para un relacionista, nociones tales como «velocidad

Espacio, tiempo, movimiento •43

invariable» y «dirección fija» pueden ser entendidas solamente en re

lación a un marco de referencia determinado por algunos objetos

materiales. Algo que está en reposo en relación a la superficie de la

tierra, por ejemplo, está en rápido movimiento en una dirección que

varía constantemente en relación a un sistema de referencia fijo, pon

gamos, en el sol. Pero, arguye Newton, la noción de movimiento no

inercial no es la de un movimiento «meramente relativo», sino la de

un movimiento que es «absoluto».

¿Por qué? Los movimientos no inerciales generan «fuerzas» que

se ponen de manifiesto en efectos demostrables. El agua en un cubo

giratorio desborda la pared del cubo. Los pasajeros se balancean ha

cia delante o hacia atrás cuando un tren acelera o frena para parar. Si

dos trenes se encuentran en aceleración relativa, podría suceder que

los pasajeros en uno de los trenes sintieran la aceleración mientras

que los del otro no sintieran nada en absoluto. Por ejemplo, un tren

puede estar parado en la estación, mientras el otro está frenando pre

cipitadamente. No obstante, ambos trenes están acelerando uno con

respecto al otro. La única explicación posible para la asimetría entre

los trenes es que existe una aceleración «absoluta», aceleración que

es cambio de velocidad no sólo en relación a algún sistema de refe

rencia material arbitrario.

Newton sostiene que dichos efectos inerciales serán los mismos

en todo lugar y en todo tiempo a lo largo del universo. Después de

todo, tales efectos inerciales son justamente los que evitan, por ejem

plo, que los planetas se precipiten sobre el sol. Así, la aceleración, la

aceleración absoluta, genera efectos observables. Pero la aceleración,

incluida la aceleración absoluta, es aceleración relativa a algo. Si no

puede ser entendida como una aceleración relativa a los objetos ma

teriales ordinarios del mundo, sólo puede ser entendida como una

aceleración relativa al «espacio mismo». Así, el espacio mismo no es

simplemente un «continente» de objetos, un modo algo torpe quizá

de referirse al hecho de que las cosas materiales están relacionadas

espacialmente unas con otras. Es un objeto que entra en una relación

causal con los objetos materiales. Así como el movimiento relativo de

un ladrillo y una ventana hace que el ladrillo rompa la ventana, así la

aceleración relativa de los pasajeros y el espacio mismo se manifiesta

mismamente en las fuerzas inerciales generadas como resultado de

dicho movimiento relativo.

Aunque concebir el tiempo como un tipo de «objeto» resulta me

II Filosofía de la física

nos convincente que en el caso del espacio mismo, el tiempo debe,

según Newton, ser también absoluto en un sentido importante. Para

el relacionista, la medida del paso del tiempo es algún cambio o mo

vimiento en una cosa material. En relación a un reloj, un proceso po

dría ser regular, con algún suceso recurrente en intervalos iguales de

tiempo. En relación a otro reloj diferente, sin embargo, el mismo pro

ceso podría parecer irregular. Éste será el caso a no ser que el segun

do reloj sea «regular» según los criterios del primer reloj. Para el rela

cionista no hay una medida «absoluta» del paso del tiempo, tan sólo

la elección de algunos relojes como preferidos debido a la simplici

dad de nuestra descripción del mundo en su medida del tiempo.

Ahora bien, el movimiento acelerado da lugar a efectos no presentes

en el movimiento no acelerado. Y esta aceleración es absoluta. Pero

el movimiento acelerado en una línea recta puede ser representado

como no acelerado si se elige una medida de tiempo suficientemente

singular, una que haga parecer uniforme a la velocidad, acelerando y

retardando la medida del tiempo en función del cambio de veloci

dad del objeto. Pero la aceleración real es absoluta, de manera que la

medida del tiempo debe ser asimismo absoluta. Hay un tiempo «en

sí mismo» que «fluye uniformemente con independencia de la medi

da de los relojes particulares». Los buenos relojes se ajustan a este

tiempo absoluto; los malos relojes no lo hacen.

Con Newton, pues, un nuevo elemento es introducido en el viejo

debate filosófico entre aquellos que considerarían el espacio y el tiem

po como constituyentes autónomos del mundo y aquellos que verían

en ellos un compendio meramente de relaciones entre las cosas fun

damentales del mundo, los objetos materiales y sus cambios. Para el

newtoniano, el espacio y el tiempo son elementos teóricos postulados,

cuya existencia debe presuponerse para poder explicar los fenómenos

a nuestro alcance en el nivel observacional-experimental.

Las reacciones a la transformación que sufrió con Newton el vie

jo debate filosófico fueron múltiples y variadas a lo largo de los dos

siglos que siguieron a sus argumentos. Las propuestas tempranas que

intentaron encontrar una explicación para los fenómenos newtonia-

nos y que postularon solamente las cosas materiales y las relaciones

entre éstas de los relacionistas, fracasaron. El mismo Leibniz admitió

que era esencial tener una idea de «cuál es el objeto que se mueve»

en los movimientos relativos. Él buscó una explicación de esta distin

ción en el objeto sobre el que actuaba la causa del movimiento.


Muy pronto se hizo evidente que la doctrina de Newton tenía

consecuencias peculiares. Dado que el «espacio mismo» existía, la

posición de un objeto en el espacio mismo y el movimiento unifor

me de un objeto con respecto al espacio mismo eran características

reales del mundo, aun cuando, a diferencia de la aceleración del

objeto con respecto al espacio mismo, no dieran lugar a ningún fe

nómeno observacional. Algunos resultados de la física sugerían que

el movimiento uniforme absoluto podría entrañar fenómenos de ti

po óptico, en lugar de mecánicos, como detectables; como vere

mos, estas conclusiones resultaron ser erróneas. Propuestas poste

riores, planteadas tras las innovaciones en nuestras ideas .sobre el

espacio y el tiempo inspiradas en la teoría de la relatividad, postu

laron nociones del espacio y el tiempo que iban a permitir definir

la aceleración absoluta, pero no la posición espacial y la velocidad

absolutas.

En el siglo xix, el filósofo y físico E. Mach intentó, una vez más,

reconciliar los resultados de la física newtoniana con el enfoque rela

cionista del espacio y el tiempo. Señaló el importante hecho de que

la velocidad de rotación de la tierra, determinada mediante la obser

vación de las estrellas fijas, y la velocidad de rotación absoluta de la

tierra, determinada mediante experimentos puramente mecánicos,

dependientes de las fuerzas generadas por la rotación, eran la misma.

¿Podría esto sugerir un origen para las fuerzas inerciales, uno no ima

ginado por Newton? Supongamos que la aceleración de un objeto

material con respecto a otro genera fuerzas, al igual que la velocidad

relativa de dos partículas cargadas genera una interacción magnética.

Supongamos que esta fuerza es sumamente independiente de la sepa

ración de los objetos, pero dependiente de sus masas. ¿No debería

mos imputar las fuerzas generadas por las aceleraciones, que Newton

atribuyó a la interacción causal entre el objeto prueba y el espacio

mismo, a la aceleración relativa del objeto prueba respecto a las es

trellas fijas o, mejor dicho, respecto al promedio de materia «infor

me» del universo? Si esto fuera así, ¿no estaríamos en posición de re

conciliar los hechos observacionales que Newton utilizó para

defender la existencia de un tipo de espacio sustancial, con un rela-

cionismo leibniziano para el que todas las posiciones, velocidades y

aceleraciones eran características de una cosa material en relación a

otra cosa material?

Al final del siglo XIX, pues, la situación era más o menos la si-

4<) Filosofía de la física

guíente: todos coincidían en que había dos vastas dimensiones de la

realidad, todas las cosas materiales existentes en el espacio y todos

los acontecimientos, materiales o mentales, que se daban en el tiem

po. La estructura de estos foros del mundo se conocía. El tiempo po

día ser visto como un simple continuo unidimensional. El espacio era

una estructura tridimensional descrita por la familiar geometría euclí-

dea. Parecía que podíamos conocer esta estructura por inferencia a

partir de primeros principios cuya verdad era, de alguna manera, in

cuestionable, esto es, cuya verdad era dada a la persona racional por

algún tipo de razón pura. La naturaleza de estos continentes de todas

las cosas y acontecimientos no estaba clara desde una perspectiva fi

losófica. Los sustantivistas en la línea de Newton contendieron con

los relacionistas, que llevaron a sus últimas consecuencias las ideas

de Leibniz. Otros, como el filósofo Kant, para quien el espacio y el

tiempo eran estructuras organizadoras de la mente por las que dotá

bamos a la sensación de una horma comprensible, mantuvieron dife

rentes concepciones metafísicas.

El espacio y el tiempo podían ser descritos matemáticamente,

como podía serlo el movimiento de las cosas materiales en el espa

cio con el paso del tiempo. La caracterización mediante leyes de este

movimiento en los términos de la cinemática (la descripción del mo

vimiento) y la dinámica (su explicación en términos de fuerzas) cons

tituyó la disciplina central de la física. Un aspecto de esta teoría físi

ca era la necesidad en ella de distinguir las clases preferidas de

movimiento inercial de los movimientos acelerados que generaban

fuerzas inerciales. Esto proporcionó el núcleo del argumento cientí

fico newtoniano de la concepción sustantivista de la naturaleza del

espacio.

Mientras la aceleración con respecto al espacio mismo tenía con

secuencias observables, la posición en el espacio mismo y la veloci

dad uniforme con respecto al espacio mismo carecían de dichos con

comitantes observacionales. Pero existía la esperanza de que, por

medio de fenómenos ópticos, pudiera determinarse el estado de re

poso en el espacio mismo. La tentativa de determinar el estado de re

poso con respecto al espacio mismo por medio de experimentos con

luz es lo que condujo a las asombrosas revisiones de nuestras ideas

sobre el espacio y el tiempo en el trabajo del gran físico Albert Eins

tein. La posibilidad de otras ideas puramente filosóficas sobre la na

turaleza del espacio y el tiempo había existido anteriormente a su tra


bajo, pero fue a la luz de sus logros y con las ideas suministradas por

ellos que se exploró la mayor parte de la filosofía contemporánea so

bre el espacio y el tiempo. En los apartados «Del espacio y el tiempo

al espacio-tiempo» y «La gravedad y la curvatura del espacio-tiempo»

esbozaré las noveles teorías del espacio y el tiempo propuestas por

Einstein y retomaré entonces la filosofía del espacio y el tiempo en el

contexto de estas nuevas teorías físicas.

Del espacio y el tiempo al espacio-tiempo

Los orígenes de la teoría especial de la relatividadHemos visto que mientras Newton postulaba «el espacio mismo»

como el objeto de referencia en relación al cual las aceleraciones ge

neraban fuerzas inerciales observables, se creía que el movimiento

uniforme con respecto al espacio mismo carecía de consecuencias

observables. Esto se seguía de la famosa observación de Galileo se

gún la cual, en un laboratorio cerrado, uno no podía decir cuál era el

estado de movimiento uniforme del laboratorio mediante la realiza

ción de un experimento mecánico. No obstante, seguía siendo conce

bible que otros fenómenos, no mecánicos, dependieran en alguna

forma del movimiento uniforme del aparato con respecto al espacio

mismo. Este movimiento se manifestaría entonces en alguna conse

cuencia observacional.

En el siglo XIX surgió una cierta esperanza al respecto al demos

trarse que la luz era radiación electromagnética. Según la teoría de la

electricidad y el magnetismo debida a J. C. Maxwell, las ondas elec

tromagnéticas, de las que las ondas luminosas son sólo una especie,

tienen una velocidad definida con respecto a un observador. Esta ve

locidad debería ser la misma en todas direcciones y ser independien

te de la velocidad de la fuente de luz con respecto al observador. Un

observador en reposo en un tanque de agua determinará una veloci

dad del sonido en el agua que es la misma en todas las direcciones.

Esta velocidad del sonido será completamente independiente del

movimiento de la fuente del sonido en el agua. Una vez que la onda

de agua se ha generado, su velocidad depende solamente de las pro

piedades del agua por la que viaja la onda. Lo mismo debería suce

der con la luz, recibiendo el medio de transmisión de la luz (la mate-


fin i|iif es para la luz lo que el agua para el sonido) el nombre de

«ctcr».

Un observador que se mueva a través del agua en el tanque no

verá la misma velocidad del sonido en todas las direcciones, ya que

estará aproximándose al sonido en una dirección y alejándose del

mismo en la dirección opuesta. Así pues, un observador en movi

miento con respecto al éter debería ser capaz de detectar este movi

miento, incluso si es un movimiento uniforme, no acelerado, midien

do la velocidad de la luz en todas las direcciones. Si se supone que

un observador en reposo en el éter estará en reposo en uno de los

sistemas inerciales de la mecánica en el que no se generan fuerzas

mecánicas inerciales, resulta plausible identificar el éter con el espa

cio mismo de Newton. En el siglo XIX siempre se hizo esta suposición

y, reinterpretada, sigue siendo correcta en la teoría de la relatividad.

Podríamos, pues, utilizar experimentos con luz para determinar nues

tro movimiento uniforme con respecto al espacio mismo.

A fin de detectar cuál estado de movimiento uniforme era el

estado de reposo en el éter o en el espacio mismo se diseñó una serie

de ingeniosos experimentos. Éstos consistían en radiar luz desde un

punto a lo largo de diferentes trayectorias y en llevar a continuación

la luz a su punto de partida. La luz debería tardar diferentes cantida

des de tiempo en recorrer las diferentes trayectorias, dependiendo de

la longitud de las trayectorias y del estado de movimiento del apara

to en el éter. Cambiando la orientación del aparato, o dejando que el

movimiento de la tierra lo haga por nosotros según gira en torno a su

eje o viaja en su órbita alrededor del sol, se modificarían los tiempos

relativos que la luz tarda en recorrer las diferentes trayectorias. D i

chas variaciones en el tiempo podrían ser detectadas en la fuente de

luz por un observador, que observaría un corrimiento de la posición

de las líneas de interferencia, líneas alternantes de luz y oscuridad

que se generan cuando los dos rayos de luz retornantes se encuen

tran y sus regiones de intensidad variable se suman o se restan entre

sí. (Véase la figura 2.1.)

Cuando estos experimentos se llevaron a cabo, no se pudo apre

ciar, para consternación de quienes los realizaron, ninguna diferencia

observable en los tiempos de recorrido de la luz. Era como si la luz

viajase a una velocidad fija, la velocidad para la luz predicha por la

teoría en el sistema de referencia en reposo en el éter, en cualquier

laboratorio que estuviese en movimiento uniforme. (Estos «resulta-


V

F ig u ra 2.1. E l experimento de Michelson-Morley. Un haz de luz es dividido en dos haces en el espejo semiplateado B. Un haz se dirige al espejo C donde es reflejado, el otro al espejo D. Si el aparato se está moviendo a través del éter, el medio de transmisión de la luz conjeturado por la vieja teoría ondulatoria, en la dirección mostrada

por la flecha v, la luz debería tardar más tiempo en recorrer el camino ABC de longitud l que lo que tarda en recorrer el camino BDB, también de longitud l. Si el aparato se gira entonces 90 grados, la diferencia en el tiempo a lo largo de los caminos se

invierte. Pero cuando el experimento se lleva a cabo no se detecta semejante cambio. Esto sigue siendo cierto incluso si la longitud del camino BC se toma diferente a la longitud BD. En general, ningún experimento de ida y vuelta pone de manifiesto el

movimiento del laboratorio a través del éter.

dos nulos» no son válidos, dicho sea de paso, cuando el aparato está

en movimiento no uniforme. La rotación puede ser detectada, por

ejemplo, mediante un giroscopio anular de láser, que detecta el cam

bio en la velocidad de la luz en direcciones opuestas alrededor de

una trayectoria circular a medida que el laboratorio gira.) Ahora bien,

podría parecer que este sorprendente resultado nulo se debiese a al


guna peculiaridad de la luz o del electromagnedsmo. Sin embargo, si

se reflexiona sobre porqué la velocidad de la señal habría de variar

cuando el laboratorio está en movimiento con respecto al medio de

transmisión de la señal, uno se da pronto cuenta de que aquí se está

cuestionando una intuición muy fundamental sobre el movimiento.

La intuición es que si corremos, por ejemplo, tras una cosa en movi

miento, ésta se moverá más despacio respecto a nosotros que respec

to a alguien que no se hubiera unido a la carrera.

Uno podría intentar hallar una explicación a estos sorprendentes

resultados de muchas formas posibles. Una sugerencia fue que la tie

rra arrastraba consigo en su movimiento al éter local, de manera que

la porción de éter junto a la tierra se encontraba siempre en reposo

con respecto a la tierra y al aparato. Dicha propuesta, sin embargo,

terminaría entrando en conflicto con observaciones astronómicas

bien fundadas.

Una serie de teorías compensatorias fueron concebidas para ex

plicar los inesperados resultados nulos. Si suponemos que la longitud

del aparato se contrae en la dirección de su movimiento con respecto

al éter, y suponemos además que todos los procesos físicos medidos

por los relojes del aparato se ralentizan cuando estos relojes se ponen

en movimiento respecto al éter, uno podría entonces justificar como

una apariencia la manifiesta igualdad de la velocidad de la luz en

todas las direcciones. Aunque la luz estuviese efectivamente movién

dose a diferentes velocidades con respecto al aparato en diferentes

direcciones, las consecuencias observacionales esperadas de ello que

darían totalmente anuladas por los cambios inducidos (por el movi

miento del aparato a través del éter) en los componentes del aparato

que uno utilizó para determinar las velocidades — intervalos de lon

gitud y de tiempo medidos por medio de reglas y relojes— . El resul

tado neto sería por consiguiente ¡la imposibilidad una vez más de de

tectar por algún medio el movimiento uniforme con respecto al

espacio!'

Fue la brillante sugerencia de Einstein tomar la apariencia de

que la luz tiene la misma velocidad en todas las direcciones en cual

quier estado de movimiento uniforme como un indicativo de la reali

dad. ¿Porqué no postular, argüyó, que lo que parece ser el caso a te

nor de los experimentos de ida y vuelta es realmente el caso? Para

todo observador en movimiento uniforme, la luz en el vacío viaja a la

velocidad predicha por la teoría del electromagnetismo en todas las


direcciones. Es importante observar lo radical que es esta propuesta.

Si un rayo de luz está alejándose de un observador en una dirección

dada con una velocidad c, y un segundo observador está viajando en

la dirección de la luz propagada con, pongamos, una velocidad v con

respecto al primer observador, consideraremos que la luz está viajan

do con una velocidad c, y no con una velocidad c~ v como nos dice

la intuición, también con respecto al segundo observador.

¿Cómo podía ser esto? El núcleo del argumento de Einstein es

una crítica penetrante de la noción de simultaneidad para sucesos a

una distancia uno de otro. ¿Qué significa que dos acontecimientos a

una distancia espacial uno de otro ocurran al mismo tiempo? En el

pensamiento preeinsteiniano suponemos sencillamente que si dos

sucesos ocurren al mismo tiempo para un observador, ocurrirán al

mismo tiempo para todos los observadores. Es el cuestionamiento

de esta última noción lo que constituye la diferencia principal entre

el espacio y el tiempo según la concepción anterior y el espacio-

tiempo según la así denominada teoría especial de la relatividad de

Einstein.

Einstein argumenta que, si vamos a determinar la velocidad de la

luz en una dirección dada, podríamos pensar en soslayar los resulta

dos nulos de los experimentos de ida y vuelta midiendo directamen

te la velocidad de la luz desde un punto A, a otro B. Pero solamente

podríamos hacer esto si pudiésemos determinar la distancia entre los

puntos y el tiempo que la luz necesita para ir de A a B, siendo la ve

locidad la distancia dividida por el tiempo. Pero para obtener el in

tervalo de tiempo entre la emisión y la recepción de una señal de luz

hemos de ser capaces de sincronizar relojes en los dos puntos de ma

nera que señalen «cero» en el mismo momento. ¿Cómo podría llevar

se a cabo esta sincronización?

Si pudiéramos transportar un reloj instantáneamente de A a B, podríamos establecer la sincronización simplemente sincronizando

dos relojes en A y moviendo uno de ellos instantáneamente a B. Pero, según Einstein, los objetos no pueden ser transportados de un

lugar a otro en un tiempo cero. Einstein supone, de hecho, que la ve

locidad de la luz en el vacío es una velocidad límite por encima de la

cual nada puede viajar. Pero entonces, ¿porqué no sincronizar dos

relojes en A, mover uno a una u otra velocidad hasta B, y suponer

que cuando un reloj en A lee el valor n y el reloj en B lee n, los dos

sucesos son simultáneos?


En este punto debemos recordar el objeto de intentar establecer

la simultaneidad para sucesos distantes. Nuestro propósito con ello

era poder determinar la velocidad de la luz desde A hasta B. Y que

ríamos hacerlo de manera que pudiésemos soslayar el problema de

los resultados nulos obtenidos en los experimentos de ida y vuelta,

un fenómeno explicado combinando la idea de que la luz tiene dife

rentes velocidades en las diferentes direcciones con las afirmaciones

compensatorias sobre cómo las reglas se contraen y los relojes se

atrasan cuando se mueven con respecto al éter. Recordemos que el

objeto de los experimentos de ida y vuelta era determinar en primer

lugar cuál era el estado de movimiento en el que la velocidad de la

luz era realmente la misma en todas las direcciones, para poder de

terminar a continuación cuál era el estado de movimiento que estaba

realmente en reposo en el éter o en el espacio mismo.

Pero si la teoría compensatoria es correcta, los relojes transporta

dos desde A hasta B no estarán, en general, sincronizados en B. ni

aun cuando lo hubieran estado en A. Pues, en su movimiento desde

A hasta B, viajarán por lo general a diferentes velocidades con res

pecto al éter y sufrirán por consiguiente diferentes cantidades de «ra-

lentización». Claramente, el reloj más apropiado para determinar la

sincronización de relojes en A y B será uno que haya sido trasladado

muy lentamente en relación al éter y haya sufrido en consecuencia

una distorsión mínima en su movimiento. Pero para saber qué reloj

es éste, tendríamos que saber qué estado de movimiento era el

estado de reposo en el éter, ¡justo lo que estábamos intentando deter

minar en primer lugar!

Supongamos que conociéramos qué estado de movimiento es

taba en reposo en el éter. Como la luz viaja, en relación al éter, con

la misma velocidad en todas las direcciones, una sencilla manera de

sincronizar los relojes en A y en B sería enviando una señal de luz

desde A que fuese reflejada en B y regresara a A. Como la luz tardó

el mismo tiempo en ir desde A hasta B y desde B hasta A, el suceso

en A simultáneo con la reflexión en B podría ser tomado como el su

ceso en A a medio camino en el tiempo entre la emisión y la recep

ción de la señal de luz en A según la medida de un reloj en reposo

en A. Pero, dice Einstein, hasta donde los experimentos de ida y

vuelta llegan, es como si la luz tuviera esta misma velocidad en todas

las direcciones sin importar cuál sea el estado de movimiento unifor

me del observador. Supongamos que la luz viaja realmente a la mis-


F i g u r a 2.2. La definición de simultaneidad por Einstein y la relatividad de la simultaneidad. OS representa los sucesos en la historia vital de un observador, un observador que permanece en una posición x constante según transcurre el tiempo /. O S representa la historia vital de otro observador que se mueve (respecto a OS) hacia la izquierda. Como e está a medio camino en el tiempo de O a r, los sucesos consistentes en emitir y recibir un haz de luz reflejado en el suceso e, S, considerando que la velocidad de la luz es igual hacia y desde e, considera que é es simultáneo con e. Por un

razonamiento similar, S' considera que e* es simultáneo con e porque está a medio camino en el tiempo desde O a /. Pero como una señal causal puede partir de e' y llegar a tanto S como S" coinciden en que e y e* no pueden ser simultáneos. En relatividad, los sucesos son o no simultáneos sólo en relación a un «sistema inercial de

movimiento» elegido como el de S o el de S .

ma velocidad en relación a cualquier observador en movimiento uni

forme. Cada uno de dichos observadores puede entonces utilizar el

método de la luz reflejada para determinar cuáles son los sucesos

que acontecen al mismo tiempo que otros sucesos.


Es fácil ver que, si elegimos esto como nuestra definición de si

multaneidad para sucesos distantes, habrá observadores que discre

parán sobre qué pares de sucesos tienen lugar al mismo tiempo, se

gún puede verse en la figura 2.2 y en su explicación. Entonces, ¿qué

observador tiene razón en sus atribuciones de simultaneidad? De

acuerdo con la teoría del éter, solamente el observador en reposo en

el éter. Los demás se ven burlados al suponer que la luz viaja a la

misma velocidad en todas las direcciones en relación a sus laborato

rios, cuando esto no es así. De acuerdo con Einstein, todos los obser

vadores tienen razón en sus atribuciones de simultaneidad. Sucede

simplemente que no hay tal cosa como «ocurrir al mismo tiempo», si

no solamente «ocurrir al mismo tiempo en relación a un estado parti

cular de movimiento uniforme». Podemos reconciliar los resultados

nulos de los experimentos de ida y vuelta con la suposición galileana

de que todos los observadores en movimiento uniforme ven los mis

mos fenómenos físicos abandonando sencillamente la noción intuiti

va de que existe una noción absoluta, no relativa, de «ocurrir al mis

mo tiempo».

Podemos paliar algo la extrañeza de esta conclusión si examina

mos el concepto de «estar en el mismo lugar». Imaginemos dos ob

servadores en movimiento uno respecto al otro. El primer observa

dor recibe un golpe en la cabeza en dos momentos diferentes.

¿Ocurrieron los golpes «en el mismo lugar»? «Sí», dice el observador

que ha sido golpeado, «los dos ocurrieron donde se encontraba la

parte superior de mi cabeza». «No», dice el otro observador, «uno

ocurrió cerca de mí y el otro muy lejos». ¿Quién de los dos tiene ra

zón? A no ser que uno crea en «el espacio mismo» de Newton, en re

lación al cual uno, y solo uno. de los observadores puede estar real

mente en reposo, ¿porqué no decir que «en el mismo lugar» es sólo

una noción relativa? Dos sucesos pueden darse en el mismo lugar en

relación a un observador y en lugares diferentes en relación a otro en

movimiento respecto al primero. Y, si Einstein está en lo cierto, suce

de exactamente igual con «al mismo tiempo».

Para hacernos una idea completa de la imagen del espacio y el

tiempo propuesta por Einstein necesitamos una suposición más. Ésta

comprende la afirmación de que todos los lugares y direcciones en el

espacio y el tiempo son similares, pero va más allá al hacer una supo

sición que equivale a postular que la estructura espacio-temporal del

mundo es «plana». Nosotros examinaremos esta noción de «planari-


dad» con más detalle en «La gravedad y la curvatura del espacio-

tiempo». Lo que se necesita suponer es la linearidad de las relaciones

de las separaciones espacial y temporal para un observador con res

pecto a las de otro observador. Con este postulado adicional se cons

truye una estructura del espacio y el tiempo en la que observadores

en movimiento relativo entre sí atribuirán separaciones espaciales de

unos sucesos a otros muy diferentes, y atribuirán también separacio

nes temporales entre sucesos muy diferentes. Las separaciones espa

ciales y temporales atribuidas a un par de sucesos por un observador

pueden, no obstante, ser calculadas a partir de las atribuidas a dicho

par por otro observador en movimiento respecto al primero, por me

dio de las denominadas transformaciones de Lorentz, fórmulas origi

nalmente derivadas en el contexto de las anteriores teorías compen

satorias.

Aunque las distancias espaciales y temporales entre dos sucesos

variarán de un observador a otro, es importante observar que una

consecuencia de los postulados básicos de la teoría es que otra canti

dad, el denominado cuadrado del intervalo entre los sucesos, tendrá

un valor invariante: será el mismo para todos los observadores en

movimiento uniforme. Esta cantidad puede ser calculada a partir de

la separación temporal entre los sucesos en el sistema referencial de

un observador, t, de la separación espacial en ese mismo sistema de

referencia, x, y de la velocidad de la luz, c, por medio de la fórmula:

P = x2 - x2t2. Mientras t y x variarán de un observador a otro, P permanecerá igual para todos ellos. Un paso crucial en esta prueba se

apoya en el hecho de que todos los observadores atribuyen a la luz la

misma velocidad invariante, c.

E l espacio-tiempo de MinkowskiTodas las consecuencias de la teoría de Einstein para una nueva con-

ceptualización del espacio y el tiempo pueden ser resumidas en la

noción del espacio-tiempo de Minkowski, el escenario de todos los

procesos físicos en la teoría de la relatividad especial. La idea básica

ahora es partir de las posiciones de sucesos-puntuales como los cons

tituyentes fundamentales de los que está construido el espacio-tiem

po. Uno puede imaginarlos como posiciones posibles de aconteci

mientos que son instantáneos y carecen de extensión espacial. Estos


sucesos-puntuales ocupan el lugar de los puntos espaciales y de los

instantes temporales de la teoría prerrelativista. Las estructuras bási

cas impuestas sobre el conjunto de estos puntos espacio-temporales

es lo que constituye el marco de trabajo de la nueva imagen del espa

cio y el tiempo. (Véase la figura 2.3).

t

F ig u r a 2.3. Algunos elementos del espacio-tiempo de Minkouiski. La línea t representa

un observador inercial, siendo o un suceso en la vida de ese observador. La línea x representa los sucesos simultáneos a o para el observador. A y B representan señales de luz que llegan a o desde el pasado y que parten de o hacia el futuro. Los sucesos de las regiones I y II están tan lejos de o en el espacio y tan próximos al mismo en el tiempo que una señal tendría que viajar más rápido que la luz para conectar un suceso de dicha índole con el suceso o. Se supone generalmente que no existen semejantes señales. Los sucesos de las regiones I I I y IV son sucesos conectables al suceso o por señales causales que viajan a una velocidad menor que la de la luz.

57

Los pares de posiciones de sucesos tienen un intervalo definido,

invariante y absoluto en la estructura. Para un observador dado en

un estado particular de movimiento uniforme, puede derivarse una

separación espacial definida y un intervalo temporal definido entre

los sucesos, pero los valores obtenidos serán relativos al estado de

movimiento particular del observador.

Dos sucesos cuyo intervalo de separación tiene el valor cero son

tales que una señal de luz en el vacío emitida en un lugar-tiempo po

dría llegar al otro lugar-tiempo. Observad que «intervalo» difiere de

distancia espacial en que sucesos diferentes pueden tener intervalos

de separación cero. Dichos sucesos se dice que tienen una .separa

ción cero o de tipo luz. Los sucesos cuyo intervalo al cuadrado es ne

gativo se encuentran lo suficientemente próximos en el espacio y lo

suficientemente distantes en el tiempo para que las señales que se

propagan más despacio que la luz puedan llegar desde uno hasta el

otro. Se dice que tienen una separación de tipo temporal. Los pares

de sucesos cuyo intervalo al cuadrado es positivo están demasiado

separados en el espacio y demasiado próximos en el tiempo para que

una señal que viaje a la misma o a menor velocidad que la de la luz

pueda conectarlos. Si admitimos que la luz es la señal límite más rá

pida, los sucesos no pueden ser conectados por ningún proceso cau

sal y se dice entonces que tienen una separación de tipo espacial. Si

escogemos un suceso como origen, la clase de sucesos con una sepa

ración cero de dicho origen divide el espacio-tiempo en una región

interior y otra exterior de sucesos con una separación de tipo tempo

ral y sucesos con una separación de tipo espacial del suceso origen.

Esta clase divisoria de sucesos con una separación de tipo luz respec

to al suceso origen consta de una componente futura y una pasada.

Juntas forman los denominados «conos de luz» del suceso origen.

(En realidad son conos solamente en un espacio-tiempo de dos en

vez de tres dimensiones espaciales reales.)

En el espacio plano ordinario de la geometría euclídea existen

las líneas rectas. El espacio-tiempo de Minkowski también tiene tra

yectorias rectilíneas. Si los intervalos entre los puntos de la trayecto

ria geodésica son de tipo espacial, la trayectoria representa una línea

recta espacial. Esta última es una línea recta en el espacio en un

tiempo, el cual se obtiene a partir del espacio-tiempo eligiendo un

observador en movimiento uniforme y tomando como espacio en un

tiempo para este observador una colección de sucesos que sean


todos simultáneos en su sistema de referencia. Las líneas rectas cuyos

sucesos tienen separación cero representan las trayectorias de los ra

yos de luz viajando en un vacío. Las líneas rectas de tipo temporal

representan las trayectorias a través del espacio en el tiempo de partí

culas con movimiento uniforme.

En un diagrama podríamos representar a un observador en re

poso en un sistema de referencia con movimiento uniforme median

te una línea recta vertical. Cualquier otro observador con movi

miento uniforme que coincida con nuestro primer observador en el

suceso origen estaría representado por una línea recta inclinada un

cierto ángulo respecto a la vertical. Es importante reconocer que la

elección de la recta vertical no comporta ningún significado físico.

Solamente si contásemos con una noción newtoniana acerca de

quién está realmente en reposo en el espacio mismo tendría un sig

nificado real el representar a un observador siempre en el mismo

lugar y a los otros observadores con movimiento uniforme de mane

ra que cambiasen de lugar con el tiempo. Pero el espacio-tiempo de

Minkowski carece de la noción de un observador en movimiento

uniforme con velocidad real cero, ya que todas las velocidades uni

formes se encuentran físicamente apareadas en esta imagen espacio-

temporal.

Una vez elegido un observador en movimiento uniforme, pode

mos también representar mediante una línea recta en el diagrama

todos aquellos sucesos simultáneos con el suceso origen en relación

al estado de movimiento de dicho observador. En el diagrama, esta

línea recta representa realmente «un espacio en un tiempo» para el

observador, el cual es, por supuesto, tridimensional. Pero debemos

suprimir dos dimensiones espaciales para poder dibujar el diagrama

en un plano; por lo tanto, todo «un espació en un tiempo» euclídeo

tridimensional, plano e infinito, es representado por una línea. Para

el observador en movimiento respecto a nuestro primer observador,

una línea,recta diferente representará todos los sucesos simultáneos

con el suceso origen en relación al estado de movimiento de este

nuevo observador. Se necesita una línea diferente porque los sucesos

simultáneos con el suceso origen serán diferentes para cada observa

dor y lo que se toma como espacio en el instante del suceso origen

depende del estado de movimiento de un observador. Puede mos

trarse fácilmente que la línea de simultaneidad (el espacio en un

tiempo) para el segundo observador representada en el diagrama ten


dría que estar inclinada respecto a la línea de simultaneidad del pri

mer observador.

Ya observamos cómo, en las teorías compensatorias diseñadas

inicialmente para explicar los resultados nulos de los experimentos

de ida y vuelta, se postulaba que las longitudes de objetos en movi

miento con respecto al éter se contraían y que los relojes en movi

miento con respecto al éter se atrasaban. En el espacio-tiempo de

Minkowski no hay, por supuesto, ningün éter. Pero la contracción

de longitudes y la dilatación temporal se dan. Supongamos que una

barra de un metro de longitud se encuentra en reposo en un sistema

de referencia dotado de movimiento uniforme. En cualquier otro

sistema de referencia con movimiento uniforme se medirá una longi

tud de la barra menor que un metro. Supongamos que un reloj se

encuentra en reposo en un sistema de referencia dotado de movi

miento uniforme. Un observador en cualquier otro sistema de refe

rencia con movimiento uniforme dirá que dicho reloj «corre más

despacio», es decir, tarda más de un segundo en marcar un segundo

en su esfera.

Lo que es sorprendente es que la contracción de longitudes, así

como la dilatación temporal, sean perfectamente simétricas. Yo veo

más cortas las barras de un metro en reposo en tu sistema de refe

rencia (estando los dos en movimiento relativo), pero tú ves más cor

tas las barras de un metro en mi sistema de referencia. Y la ralentiza-

ción de los relojes es igualmente simétrica. Pese a la apariencia de

inconsistencia, no hay ninguna, pues los intervalos de longitud y de

tiempo son ahora relativos a un observador y las afirmaciones he

chas son perfectamente consistentes. Evidencia directa de la existen

cia real de estos fenómenos la encontramos, por ejemplo, en el tiem

po de vida medio — inexplicablemente dilatado en términos

prerrelativistas— de las partículas inestables que se crean en las

capas altas de la atmósfera y se observan en la superficie de la tierra.

Únicamente la ralentización relativa de sus procesos de desintegra

ción, debido a su alta velocidad respecto a nosotros, puede dar

cuenta del fenómeno.

Este resultado de la relatividad da lugar a una gran variedad de

paradojas, contradicciones aparentes que en realidad no son tales, al

gunas de las cuales pueden encontrarse en cualquier libro estándar

sobre relatividad. Por ejemplo, un hombre que porta una pértiga en

tra en un cobertizo por uno de sus lados y sale por el otro. Cuando


la pértiga está en reposo respecto al cobertizo, tiene la misma longi

tud que el cobertizo. Como la pértiga en movimiento es más corta

que el cobertizo, alguien puede cerrar las dos puertas al corredor

mientras éste y la pértiga se encuentran dentro del cobertizo. Pero

para el corredor, el cobertizo es más corto que la pértiga, de mane

ra que esto es claramente imposible. La clave está en pensar en el

orden temporal en que ocurren los sucesos desde las diferentes

perspectivas del corredor y del observador en reposo en el coberti

zo. Para el hombre en reposo en el cobertizo ambas puertas están

cerradas mientras el corredor se encuentra con la pértiga en el co

bertizo. El corredor ve la puerta más distante abierta y su pértiga

sale del cobertizo antes de que la puerta más próxima se haya ce

rrado.

El espacio-tiempo de la relatividad especial, el espacio-tiempo de

Minkowski, requiere que hagamos otra distinción sobre el tiempo

que no se da en la teoría prerrelativista. Hemos observado cómo un

observador cualquiera atribuirá un cierto intervalo temporal entre

dos sucesos, y cómo este intervalo variará de un observador a otro.

Éste es denominado el intervalo temporal coordenado entre los suce

sos relativo al observador en cuestión. Otra noción de tiempo surge

cuando consideramos a alguien que se mueve desde un suceso (un

lugar en un instante) hacia algún otro suceso (un lugar diferente en

un tiempo diferente) a lo largo de alguna trayectoria espacio-tempo-

ral, a través de una sucesión de lugares-en-un-instante. Supongamos

que este agente transporta un reloj que se ajusta a cero en el primer

suceso. Este reloj marcará un valor definido en el suceso final. Segu

ramente todos los observadores coincidirán en cuál es dicho valor,

porque todos estarán de acuerdo en la coincidencia de la lectura de

dicho valor por el reloj con el suceso final, ya que se trata de sucesos

en el mismo lugar y no hay relatividad de la simultaneidad en este

caso. Este tiempo es denominado el tiempo propio entre los dos su

cesos.

Pero el tiempo propio transcurrido entre dos sucesos variará de

pendiendo de la trayectoria espacio-temporal por la que se transporta

el reloj de un suceso al otro. Este fenómeno no cuenta con ningún

precedente en la física prerrelativista. De hecho, puede demostrarse

fácilmente que el tiempo transcurrido en un reloj transportado de un

suceso a otro será máximo cuando la trayectoria seguida desde el pri

mer suceso al segundo sea una de movimiento uniforme, no acelera

61

do. Éste es el fundamento de la famosa paradoja de los gemelos, se

gún la cual si un gemelo permanece en un sistema de referencia con

movimiento uniforme mientras el otro realiza un viaje por el espacio

y el tiempo que entrañe movimiento acelerado, pero que lo lleve de

vuelta a coincidir con el gemelo que se ha quedado en casa, el geme

lo aventurero será más joven — mostrará, por ejemplo, un menor en

vejecimiento biológico— que su gemelo cuando los dos se encuen

tren de nuevo. Evidencia de que este efecto de la relatividad es real

la encontramos en las partículas inestables lanzadas por los canales

circulares de los aceleradores. El número de partículas desintegradas

es mucho menor entre ellas que entre sus partículas paisanas en un

grupo que permanece en reposo en el laboratorio entre el instante en

el que coinciden por primera vez y el instante en el que vuelven a

coincidir. Como de costumbre, no se trata de una contradicción en

la teoría, sólo de fenómenos que no habíamos esperado, un resulta

do de la sorprendente naturaleza del espacio-tiempo. (Véase la figu

ra 2.4.)

Ya observamos cómo la mecánica newtoniana se conformaba al

principio de Galileo de que todos los fenómenos físicos parecerían

iguales a cualquier observador en un estado de movimiento unifor

me, si bien el hecho de que el laboratorio de uno estuviese en movi

miento acelerado se revelaría en consecuencias observables. La vieja

teoría de la mecánica, una vez trasladada al nuevo espacio-tiempo re

lativista, deja de satisfacer este principio. De aquí que Einstein desa

rrollase una nueva mecánica que reconcilia la relatividad galileana de

los fenómenos mecánicos con la nueva imagen del espacio-tiempo. El

fundamento de esta teoría es simple. La vieja mecánica obedecía ta

les principios como la conservación de la energía, la conservación del

impulso y la conservación del momento angular. Éstos son considera

dos ahora el resultado de simetrías fundamentales de la estructura es

pacio-temporal (en particular, del hecho de que todos los puntos es

pacio-temporales son estructuralmente semejantes, como lo son todas

las direcciones espacio-temporales). Estas simetrías se dan también en

el nuevo espacio-tiempo, por lo que podemos mantener las viejas re

glas de conservación y derivar de ellas la nueva mecánica. En la nue

va mecánica, por ejemplo, se encuentra la famosa consecuencia de la

relatividad de la equivalencia entre masa y energía, a saber, que

cuanta más energía cinética posea un objeto, mayor será su resisten

cia a ser acelerado aún más por una fuerza.


F ig u r a 2.4. La paradoja de los gemelos. S es un observador que permanece inercial y transporta un reloj desde el suceso o al suceso o'. E l tiempo transcurrido en el reloj se representa por las esferas de reloj situadas a la izquierda. S ‘, originalmente en reposo con respecto a S, se acelera a la derecha, viaja a la derecha con una velocidad

uniforme, invierte la dirección del movimiento relativo, regresa a la posición de 5 y acelera de nuevo para terminar en reposo en relación a S en la posición o'. E l tiempo

transcurrido en un reloj transportado por S ’ se representa por las esferas de reloj situadas a la derecha. La relatividad especial predice que habrá transcurrido menos tiempo en el reloj transportado por S ' a lo largo del camino acelerado de o a o' que en el reloj de S.

También indicamos que Einstein supuso que la velocidad de la

luz en el vacío era la velocidad máxima de propagación de una señal

cualquiera. Semejante postulado encaja muy bien en la nueva imagen

espacio-temporal.


a S bF ig u r a 2.5. La relatividad del orden temporal de los sucesos en la relatividad especial. O es

un observador inercial. O ' es otro observador inercial que se mueve a la derecha en

relación a O. La linea S es la clase de sucesos que O considera simultáneos con el suceso a. La linea S ' es la clase de sucesos que O ' considera simultáneos con el suceso a. Para O el suceso c es posterior al suceso b y por consiguiente posterior al suceso

a. Pero para O ', el suceso c es anterior al suceso b ' y por consiguiente anterior al suceso a. Semejante inversión del orden temporal puede darse sólo para sucesos, como

el suceso a y el suceso c, que no son causalmente conectables uno al otro.

Podemos, por ejemplo, encontrar pares de sucesos, A y B, y de

observadores 01 y 02, tales que A es anterior a B en relación a 01 y

B es anterior a A en relación a 02. Pero éstos serán siempre sucesos

que tienen una separación de tipo espacial. Esto significa, suponien

do la velocidad límite de la luz, que los sucesos tendrán un orden en

el tiempo diferente en relación a dos observadores sólo si los sucesos

no pueden ser conectados por ninguna señal causal. Los sucesos que


pueden ser conectados por una señal causal, viajando a la misma o a

menor velocidad que la de la luz, serán observados en el mismo or

den temporal por todos los observadores, si bien el tiempo transcu

rrido entre ellos variará de un observador a otro. (Véase la figura 2.5.)

Se ha señalado que no es necesario mantener el postulado de la

velocidad límite de la luz para contar con una teoría consistente en

la que el espacio-tiempo sea el espacio-tiempo de Minkowski, el es-

pacio-tiempo de la relatividad especial. Si uno simplemente insiste en

que las condiciones del mundo sean tales que se eviten paradojas

causales, uno puede tolerar «taquiones», señales causales a velocida

des mayores que la de la luz. La condición de consistencia es necesa

ria puesto que la postulación de taquiones en el espacio-tiempo de

Minkowski dejaría un margen para lazos causales cerrados, en los

que un suceso se causa a sí mismo. Si se pudieran elegir libremente

las condiciones iniciales, se podría generar una situación paradójica

(me doy un tiro antes de apretar el gatillo que dispara la bala). No

obstante, dichas velocidades superlumínicas nunca han sido detecta

das y las versiones estándar de la relatividad especial adoptan el pos

tulado de la luz como señal causal máxima junto a la estructura del

espacio-tiempo de Minkowski con su velocidad de la luz invariante

para todos los observadores inerciales.

Nada en el espacio-tiempo de la relatividad especial, según he

mos observado, juega el papel íntegro del espacio de Newton. Para

Newton, el espacio mismo aportaba un verdadero criterio de lo que

significa para un objeto estar realmente en reposo, pese a no deri

varse consecuencias empíricas del movimiento uniforme respecto al

espacio mismo. En el espacio-tiempo de Minkowski no hay nada

que proporcione un criterio sobre cuándo dos sucesos que no son

simultáneos entre sí están «en el mismo lugar». Carece por consi

guiente de sentido preguntar si un objeto permanece en un mismo

lugar a lo largo del tiempo, aun cuando tiene pleno sentido preguntar

si la posición relativa de un objeto, es decir, la posición respecto a

otros objetos materiales tomados como sistema de referencia, perma

nece invariable en el tiempo. Pero la distinción entre estar realmente

en movimiento uniforme, o no, se conserva en este espacio-tiempo.

El que la trayectoria de una partícula material a través del espacio-

tiempo, la trayectoria de tipo temporal que representa la sucesión de

lugares-tiempo que el objeto ocupa, sea o no una línea recta, esto es,

el que sea una de las trayectorias de tipo temporal que constituyen

65

una geodésica del espacio-tiempo, es una cuestión que tiene perfecto

sentido.

La distinción, pues, entre que un objeto esté en movimiento uni

forme o que esté en movimiento acelerado — representado por una

trayectoria curva de tipo temporal en el diagrama del espacio-tiem-

po— sigue siendo absoluta, en el sentido de que esta distinción no

tiene nada que ver con el movimiento del objeto en cuestión respec

to a otros objetos materiales. Al contrario, esta distinción está deter

minada por el movimiento de un objeto en relación a las estructuras

del espacio-tiempo mismo. En la física newtoniana, el movimiento

verdaderamente acelerado se ponía de manifiesto por la presencia

(en el laboratorio acelerado) de fuerzas inerciales que actuaban sobre

los objetos y estaban supuestamente generadas por la aceleración de

los objetos en relación al espacio mismo. En la relatividad especial, la

aceleración real se manifiesta en ésta y en otras formas también. Ya

observamos, por ejemplo, cómo los resultados nulos en los experi

mentos de ida y vuelta se obtenían sólo cuando uno de dichos expe

rimentos se realizaba con luz en un laboratorio en movimiento uni

forme. En un aparato acelerado, la luz invertirá tiempos en recorrer

las trayectorias que revelan la existencia de la aceleración absoluta

del dispositivo experimental. Aunque no hay tal cosa, entonces,

como «estar en el mismo lugar» si no es en relación a algún estándar

material, el «estar en movimiento uniforme» tiene, en la relatividad

especial, tanta significación real en un sentido absoluto como lo tiene

en la teoría newtoniana.

El espacio-tiempo neo-newtonianoUna vez que se hubo construido el espacio-tiempo de Minkowski de

la relatividad especial, se observó que uno podía volver atrás y cons

truir un espacio-tiempo apropiado para la teoría newtoniana anterior,

un espacio-tiempo que tuviera algunas ventajas sobre la noción de es

pacio mismo tradicionalmente postulada en la física newtoniana. Las

principales intuiciones proceden de darse cuenta de que la mejor ru

ta sistemática para construir un espacio-tiempo apropiado a lo que se

considera como cantidades observables postuladas por cualquier teo

ría dada es tomar las posiciones de sucesos como elementos primiti

vos y construir a continuación el espacio-tiempo dotando de una es

tructura al conjunto de las posiciones de sucesos.


En la física newtoniana, la noción de simultaneidad para sucesos

separados se presupone como una noción absoluta. Así, para cons

truir nuestro nuevo espacio-tiempo de la física newtoniana dotamos a

la colección de posiciones de sucesos de un intervalo temporal defi

nido entre cualquier par de sucesos. Cuando este intervalo es cero,

los sucesos son simultáneos. En el espacio-tiempo de Minkowski de

la relatividad espacial, los espacios son colecciones de sucesos simul

táneos en relación a un observador dado. Se supone que estos espa

cios «relativos» tienen la estructura tridimensional ordinaria descrita

por la geometría de Euclides. En el espacio-tiempo newtoniano revi

sado, con su noción absoluta de simultaneidad, podemos, de nuevo,

considerar los espacios como colecciones de sucesos simultáneos.

Así, cada suceso estará en un único espacio y se supone, de nuevo,

que el espacio es un espacio euclídeo tridimensional.

En el contexto newtoniano, como en la relatividad especial, lo

que hace las veces de trayectoria del movimiento uniforme de un ob

jeto es una noción bien definida. Así, imponemos a este nuevo espa

cio-tiempo newtoniano una condición similar a la impuesta al espa

cio-tiempo de Minkowski: Debe haber una noción definida de

trayectorias rectilíneas que representen las posibles trayectorias del

movimiento a través del-espacio y en el tiempo de partículas que se

mueven libre y uniformemente. Ahora bien, Newton supuso que

existía una cosa tal como un suceso aconteciendo «en el mismo lu

gar» que otro suceso no simultáneo. Si imponemos esa estructura,

una noción definida del mismo lugar para sucesos no simultáneos, al

espacio-tiempo que estamos construyendo, formaremos la imagen del

espacio absoluto de Newton para el espacio y el tiempo. Pero esto

nos daría características del mundo sin consecuencias empíricas, tales

como la magnitud de la velocidad uniforme de un objeto con respec

to al «espacio mismo». Sin embargo, si dejamos a un lado esa estruc

tura del «mismo lugar en tiempos diferentes», obtenemos un nuevo

espacio-tiempo, denominado algunas veces el espacio-tiempo galilea-

no, y otras el espacio-tiempo neo-newtoniano. En este espacio-tiem

po, el movimiento uniforme absoluto está bien definido, pero la

igualdad absoluta de lugar a través del tiempo no lo está.

En esta nueva imagen del espacio-tiempo, las aceleraciones abso

lutas existen y tienen consecuencias observables, pero no existe nada

parecido a la velocidad absoluta de un objeto. Esto es justamente lo

que queremos. La necesidad sentida por los físicos de un nuevo en


foque del espacio y el tiempo con el que hacer frente a los asombro

sos y desconcertantes resultados de los experimentos ópticos de ida

y vuelta condujo a profundas intuiciones sobre cuáles eran los com

ponentes de la imagen del espacio y el tiempo que poseíamos intuiti

vamente y que, en una forma refinada, sostenían el mundo de la

ciencia newtoniana. Confrontando los nuevos hechos experimentales

y construyendo el aparato conceptual que los justificase, los físicos

lograron nuevas maneras de examinar posibles teorías para dar cuen

ta de los viejos hechos observacionales postulados. Como veremos, la

existencia de estas nuevas estructuras para describir y explicar las ca

racterísticas espacio-temporales del mundo tuvo un importante efec

to en nuestro entendimiento filosófico de la naturaleza del espacio y

el tiempo y de nuestro acceso al conocimiento sobre su naturaleza.

Pero, antes de considerar estas cuestiones, examinaremos un segun

do cambio revolucionario en nuestras concepciones sobre la natura

leza del espacio y el tiempo provocado una vez más por la fértil ima

ginación científica de Einstein.

La gravedad y la curvatura del espacio-tiempo

Gravedad y relatividad

En su obra magna, los Principia, Newton propuso una teoría que ex

plicaba, entre otras cosas, el movimiento de los planetas alrededor

del sol y sus órbitas elípticas, que había sido tan cuidadosamente

descrito por J. Kepler. La teoría que da cuenta de este movimiento

tiene dos componentes. Una es la teoría de la dinámica de Newton,

la teoría general que relaciona los movimientos con las fuerzas que

actúan sobre los objetos en movimiento. Esta teoría, fundada en la

suposición subyacente de un espacio absoluto y de un curso absoluto

del tiempo, incorpora el principio de Galileo según el cual los obje

tos sobre los que no actúa ninguna fuerza permanecen en un estado

constante de movimiento uniforme. Postula, además, que el cambio

de movimiento (la aceleración) será proporcional a las fuerzas que ac

túan sobre un cuerpo e inversamente proporcional a la tendencia in

trínseca de un cuerpo a oponer resistencia a los cambios de movi

miento, su así denominada masa inercial.


La otra componente de la teoría de Newton concierne a la fuerza

responsable de los movimientos observados de los cuerpos astronó

micos (y de otros muchos fenómenos, como la forma en que los cuer

pos caen hacia la superficie de la tierra, o las mareas). Apoyándose

una vez más en la importante observación de Galileo de que, dejan

do a un lado la resistencia del aire, todos los objetos sufren una ace

leración uniforme hacia la tierra cuando están en caída libre cerca de

su superficie, Newton postula una fuerza general de la gravedad ac

tuando entre todos los objetos materiales. La gravedad es siempre

una fuerza atractiva. La intensidad de la fuerza ejercida entre los

cuerpos se considera que es proporcional a la masa inercial de cada

cuerpo e inversamente proporcional al cuadrado de la distancia entre

ellos. La Tercera Ley del Movimiento de Newton afirma que la fuer

za ejercida por un cuerpo sobre un segundo cuerpo será compensada

por una fuerza de igual intensidad — pero dirigida en sentido contra

rio— ejercida por el segundo cuerpo sobre el primero.

El hecho de que la fuerza aumenta en proporción a la masa iner

cial, pero la resistencia del cuerpo a la aceleración es también pro

porcional a la masa inercial, produce directamente el resultado de

Galileo según el cual todos los cuerpos sufren una misma aceleración

cuando son sometidos a la fuerza gravitacional ejercida por algún

cuerpo fijo, siempre que los cuerpos prueba estén situados en el mis

mo lugar respecto al objeto que ejerce la fuerza gravitacional. New

ton demostró que las leyes de la dinámica junto a la ley de la fuerza

gravitacional por él postuladas conducen a las leyes de Kepler sobre

el movimiento planetario o, mejor dicho, a una versión ligeramente

modificada de las mismas.

No debería sorprender, pues, que Einstein, una vez que hubo de

mostrado la necesidad de un nuevo sistema dinámico y construido

uno consistente con el nuevo espacio-tiempo de la relatividad espe

cial, abordara el problema de la construcción de una nueva teoría de

la gravedad. Esta teoría, que se necesita claramente, debe ser consis

tente con las nuevas ideas sobre el espacio-tiempo. La teoría de New

ton, por ejemplo, considera que la interacción gravitacional entre

cuerpos es instantánea, mientras la relatividad considera que todas

las señales se propagan a una velocidad menor que, o igual a, la de la

luz. Se puede construir una gran variedad de alternativas a la teoría

newtoniana compatibles con el nuevo espacio-tiempo relativista. De

hecho, un programa en curso en la física experimental se ocupa de


probar cada una de estas alternativas frente a las demás, buscando

posibles observaciones que permitan eliminar algunas de las posibili

dades. Pero la novel teoría gravitacional que mejor ha respondido a

los experimentos, y la que presenta una mayor elegancia teórica, es la

propia teoría de Einstein. Ésta se denomina la teoría general de la re

latividad. Es también la teoría que postula una naturaleza para el

mundo que reviste un gran interés para los filósofos. Dedicaré el res

to de esta sección a esbozar algunas de las ideas que condujeron a

Einstein a esta novel teoría de la gravedad, la cual, como veremos,

constituye una novel teoría de la estructura del espacio-tiempo mis

mo. Perfilaré algunos de los constituyentes básicos de la teoría y ex

ploraré algunas de las consecuencias de la misma que son de impor

tancia para el filósofo.

Einstein parte de la observación por Galileo de que la acelera

ción inducida por la gravedad en un objeto es independiente del ta

maño y de la constitución del objeto. La gravedad se distingue de

cualquier otra fuerza por poseer este efecto universal. Consideremos

el caso en el que un objeto es acelerado por un objeto gravitatorio si

tuado a una distancia lo suficientemente grande para que el campo

gravitacional sea efectivamente constante dentro del laboratorio.

Einstein hace notar que un pequeño objeto prueba en un laboratorio

se vería acelerado respecto a ese laboratorio en la misma forma exac

tamente en que lo haría si no hubiese ninguna fuerza actuando sobre

el objeto prueba y, en su lugar, el laboratorio mismo estuviese siendo

acelerado uniformemente en la dirección opuesta a la de la acelera

ción de la partícula. En este segundo caso, cualquier objeto prueba

de cualquier masa o composición parecería acelerar uniformemente

con respecto al laboratorio. Es la universalidad de la gravedad lo que

nos permite reemplazar la fuerza gravitacional por una aceleración

del sistema de referencia.

Quizá, sugiere Einstein, todos los efectos de la gravedad podrían

duplicarse mediante una aceleración semejante del laboratorio. Esto

conduce a la hipótesis de que la gravedad tendrá efectos sobre cosas

diferentes a la materia formada por partículas. Si dirigimos un rayo

de luz a través de un laboratorio en movimiento acelerado espera

mos que el rayo siga una trayectoria que no es recta en relación al la

boratorio. ¿No desviaría, entonces, la gravedad los rayos de luz que

pasan cerca de un cuerpo gravitacional?

Quizá más sorprendente es la conclusión de que deberíamos es


perar que la gravedad afectase las mediciones de los intervalos espa

ciales y temporales, como revelan los relojes y las reglas de medir

idealizados. El argumento a favor del efecto temporal es el más senci

llo de construir y de seguir. Imaginaros un laboratorio acelerado con

un reloj en su extremo superior y un reloj idéntico en su extremo

inferior. Se envían señales desde el reloj inferior al superior y se

comparan las velocidades de emisión de las señales, según son de

terminadas por el reloj inferior, con las de recepción, según son

determinadas por el reloj superior. En el momento en el que una se

ñal emitida desde la parte inferior alcanza la parte superior, el reloj

superior estará moviéndose respecto al sistema de referencia en mo

vimiento uniforme en el que se encontraba en reposo el reloj inferior

cuando la señal fue emitida. Arguyendo, bien a partir del efecto de

dilatación temporal de la relatividad especial, bien a partir del deno

minado efecto Doppler, el cual muestra en un contexto prerrelativis-

ta cómo una señal emitida por una fuente a una frecuencia determi

nada parecerá tener una frecuencia menor cuando es observada por

alguien en relación al cual la fuente se encuentra en movimiento, es

plausible afirmar que el reloj inferior parecerá atrasar cuando es me

dido con el reloj superior. Esto es, la frecuencia con que la señal es

recibida por el reloj superior es menor que la frecuencia con que fue

emitida según la medición del reloj inferior. (Véase la figura 2.6.)

Pero, ahora, consideremos el laboratorio no acelerado con todos

sus aparatos en reposo situados en un campo gravitacional. Según el

argumento de Einstein (a menudo llamado el Principio de Equiva

lencia), deberíamos esperar que el reloj situado más abajo en el cam

po gravitacional pareciera atrasar al reloj localizado más arriba. O b

servemos que esto no tiene nada que ver con la fuerza gravitacional

sentida por cada uno de los relojes sino, antes bien, está determinado

por cuánto más abajo en la «colina» gravitacional se encuentra un re

loj respecto al otro. Así, deberíamos esperar que la gravedad tuviese

un efecto en nuestra medida de los intervalos temporales. Pueden

darse argumentos similares, aunque mucho más complicados, que

nos hacen esperar que la gravedad afecte también a las mediciones

espaciales.

Considerados conjuntamente, estos argumentos movieron a Eins

tein a hacer la sorprendente sugerencia de que la forma de tratar con

la gravedad en un contexto relativista era considerarla no como un

campo de fuerzas actuando en el espacio-tiempo sino, en vez de ello,


como una modificación de la propia estructura geométrica del espa

cio-tiempo. En presencia de gravedad, argüyó, el espacio-tiempo no

es «plano», sino «curvo». Para saber lo que esto significa, empero,

debemos examinar brevemente la historia de la geometría según ha

sido desarrollada por los matemáticos.

(a) (b)

IF ig u r a 2.6. E l corrimiento al rojo gravitacional. (a) Representa un laboratorio acelerado con un reloj en el suelo y otro sujeto al techo. Debido a que una señal emitida

desde el reloj del suelo se recibe en el reloj del techo cuando el laboratorio está en

movimiento con una velocidad relativa al sistema de movimiento en el que se emitió

la señal (debido a la aceleración del laboratorio), el reloj del techo registrará que el reloj del suelo «atrasa» de manera muy parecida a como un observador escucha un

pitido que se aleja con una intensidad menor de la que se escucharía si el pitido estu

viese estacionario con respecto al observador. La relatividad general postula que un resultado similar se obtendrá en un laboratorio no acelerado, pero fijo, en un campo

gravitacional — como en (b)— . Un reloj situado más abajo en el campo gravitacional será registrado como «atrasando» por un reloj situado más arriba en el potencial gravitacional. Esto es el denominado corrimiento al rojo gravitacional. Señala una de las

maneras en que puede considerarse que la gravedad afecta a la estructura métrica del espacio-tiempo.


La geometría no-euclídeaLa geometría ordinaria, en la forma en que Euclides la formalizó, de

riva todas las verdades geométricas de un pequeño conjunto de pos

tulados básicos, supuestamente autoevidentes. Aunque la axiomatiza-

ción por Euclides de la geometría no es, de hecho, completa (es

decir, suficiente en sí misma para permitir que se lleven a cabo todas

las derivaciones sin presuponer otras premisas subyacentes u ocul

tas), puede ser completada en esta forma. Durante mucho tiempo

existió un gran desconcierto en torno al denominado postulado de

las paralelas de Euclides. Éste equivale a la afirmación de que por un

punto no situado sobre una recta puede trazarse una, y solo una, rec

ta que se encuentre en el plano común a la recta y al punto dados y

que no intersecte a la recta dada en ninguna dirección con indepen

dencia de cuanto se extiendan las rectas. A los geómetras les pareció

que este postulado carecía de la autoevidencia de las otras hipótesis

más simples (tales como «iguales sumados a iguales dan iguales», y

«dos puntos determinan una recta que pasa por ellos»). ¿Podría este

postulado «sospechoso» derivarse de los otros postulados, resultando

superfluo como suposición independiente? Si uno pudiera demostrar

que la negación del postulado de las paralelas era inconsistente con

los otros postulados, podría demostrar que tal derivación era posible

por el método de reductio ad absurdum. Pero, ¿podía demostrarse

esto?

La negación del postulado de las paralelas puede tomar dos di

recciones. El postulado dice que existe una, y solo una, paralela por

un punto, y para negar esto podría afirmarse que no existe ninguna

paralela o que hay más de una. En 1733 G. Saccheri demostró que el

postulado de las no paralelas era, de hecho, inconsistente con el resto

de los axiomas, al menos si éstos se interpretaban en la forma habi

tual. Pero no fue capaz de demostrar que la negación de las muchas

paralelas también era inconsistente. Hacia el siglo XIX, J. Bolyai, N. I.

Lobachevsky y K. F. Gauss habían reconocido que se podían cons

truir geometrías consistentes que adoptaban los postulados de Eucli

des pero presentaban un postulado de muchas paralelas en lugar del

postulado de las paralelas de Euclides. B. Riemann demostró enton

ces que, si se modificaba ligeramente la interpretación de los otros

axiomas, podía también construirse una nueva geometría, con un

postulado de no paralelas en lugar del postulado de las paralelas de


Euclides, que fuese lógicamente consistente. Las reinterpretaciones

necesarias son que: «Dos puntos determinan una recta» debe enten

derse de manera que en ocasiones haya más de una línea recta conte

niendo un par de puntos dados, y «Una línea puede extenderse arbi

trariamente en las dos direcciones» debe entenderse como afirmando

que una línea no encontrará ningún punto final si se prolonga, pero

no implicando que una línea completamente extendida tenga longi

tud infinita.

Posteriormente se vio que, si estas nuevas geometrías no-euclí-

deas eran consideradas como geometrías bidimensionales planas, po

dían ser interpretadas en una forma euclídea como la geometría de

las curvas de distancia más corta (geodésicas) sobre superficies bidi-

mensiondes curvas. En particular, la geometría axiomática riemannia-

na era justamente la geometría de las figuras construidas con arcos

de circunferencias máximas sobre la superficie de una esfera. Pero,

¿qué podía entenderse por geometrías no-euclídeas tridimensionales

lógicamente consistentes, o eran éstas, si bien lógicamente consisten

tes, absurdas por otras razones?

Gauss llevó la geometría un paso más allá con el desarrollo de

una teoría general de las superficies curvas bidimensionales. Estas se

caracterizan por un número — conocido como la curvatura gaussia-

na— en cada punto. La forma en que esta curvatura varía con la dis

tancia, medida a lo largo de las curvas dibujadas sobre la superficie,

determina la forma de la superficie curva. Gauss imaginó estas super

ficies curvas inmersas en el espacio euclídeo ordinario de tres dimen

siones. Un importante resultado de su trabajo, sin embargo, fue que

se podían caracterizar algunos de los aspectos de la curvatura (curva

tura «intrínseca») por medio de cantidades que podían ser determi

nadas por una hipotética criatura bidimensional confinada a la super

ficie curva y ajena por completo a la existencia de un espacio

tridimensional en derredor. Desde esta nueva perspectiva resultó que

las geometrías descritas por los viejos sistemas de axiomas podían ser

entendidas como casos especiales. La geometría euclídea bidimensio

nal, la geometría del plano, es la geometría de la superficie cuya cur

vatura gaussiana es cero en todo lugar. La geometría riemanniana, la

geometría de las superficies bidimensionales esféricas, es sencillamen

te la geometría de una superficie cuya curvatura gaussiana es cons

tante y positiva. La geometría de Bolyai-Lobachevsky es la geometría

de una superficie bidimensional cuya curvatura gaussiana es la mis-


ma en cada punto y negativa. La curvatura negativa es característica

de un punto como el que hallamos en el centro de un paso de mon

taña, donde la superficie se curva «en direcciones opuestas» a lo lar

go de diferentes caminos que pasan por él.

Riemann siguió entonces adelante y generalizó la teoría de Gauss

de las superficies curvas a espacios de un número arbitrario de di

mensiones. Mientras Gauss daba por sentado que las superficies en

cuestión se hallaban inmersas en un espacio euclídeo plano, Riemann

no hizo tal suposición. Después de todo, un resultado del trabajo de

Gauss era que algunos aspectos de la curvatura serían accesibles a

una criatura bidimensional ajena al espacio circundante. La geome

tría riemanniana general se ocupa de estos aspectos de la curvatura,

los aspectos intrínsecos. (Esta geometría riemanniana general de los

espacios curvos «-dimensionales no debe ser confundida con la geo

metría axiomática riemanniana anterior.) La suposición básica de esta

geometría es que el espacio curvo «-dimensional puede ser aproxima

do en regiones suficientemente pequeñas por un espacio euclídeo,

plano, «-dimensional. En el caso de superficies curvas en el espacio

plano tridimensional, estas superficies aproximativas pueden ser re

presentadas por planos tangentes a la superficie curva en un punto

dado; los planos también Se encuentran contenidos en el espacio tri

dimensional circundante. En el caso de un espacio curvo riemannia-

no general «-dimensional, se postula la existencia de estos «planos

tangentes» solamente en el sentido de que, en lo que a las caracterís

ticas «-dimensionales intrínsecas respecta, el espacio curvo «-dimen

sional puede ser aproximado en un punto dado por un espacio euclí

deo, plano, «-dimensional.

¿Cuáles son algunas de las características de los espacios curvos?

¿Cómo podría, por ejemplo, una criatura tridimensional que habitase

en un espacio curvo tridimensional descubrir que su espacio era, en

efecto, curvo? La curvatura intrínseca se pone de manifiesto en la

medida de -las distancias. Una criatura «-dimensional puede realizar

un número suficiente de mediciones de distancias entre puntos para

asegurarse de que no había forma de que estos puntos pudieran estar

localizados en un espacio plano «-dimensional y tener las distancias

mínimas entre ellos a lo largo de curvas que tienen los puntos de las

criaturas. Por ejemplo, un examen de las distancias aéreas más cortas

entre ciudades de la Tierra nos podría decir que la superficie de la

Tierra no era plana, sino que se aproximaba a la de una esfera. En un


espacio curvo «-dimensional, las curvas de distancia más corta, las

denominadas geodésicas del espacio, ya no son las líneas rectas que

serían si se tratase de un espacio plano. Estas líneas son también las

líneas de «menor curvatura» en el espacio. Intuitivamente, esto signi

fica que las líneas, pese a no ser rectas debido a la curvatura del es

pacio, no se desvían de la rectilineidad más de lo que les obliga la

curvatura del espacio mismo.

La curvatura puede manifestarse en otras formas también. Por

ejemplo, si tomamos un segmento dirigido (un vector) y lo movemos

a lo largo de una curva cerrada en un espacio plano, de manera que

permanezca en todo momento tan paralelo como sea posible a sí mis

mo según lo vamos moviendo, cuando retornemos al punto de parti

da, el vector apuntará en la misma dirección en ese punto que cuan

do comenzamos. Pero en un espacio curvo, semejante transporte

paralelo de un vector a lo largo de un lazo cerrado modificará, en ge

neral, la dirección del vector, de manera que al final del transporte

apuntará en una dirección diferente a la dirección con la que partió

al comienzo del viaje.

Un espacio plano tridimensional tiene una extensión infinita y

tiene un volumen infinito. Un plano euclídeo tiene extensión infinita

y área infinita. Pero la superficie intrínsecamente curva de una esfera,

aunque no tiene límites, tiene un área finita. Una criatura bidimen-

sional que habitase en una superficie esférica podría pintar la superfi

cie. Nunca encontraría un límite a la superficie. Pero después de un

tiempo finito habría concluido el trabajo, habiendo pintado toda la

superficie. De manera similar, una criatura tridimensional que habite

en el espacio curvo tridimensional que es análogo a la superficie esfé

rica, que habite en una así denominada tri-esfera, podría llenar la re

gión de plástico espumoso. Aunque nunca encontrase una pared que

limitase el espacio, terminaría el trabajo en un tiempo finito, habien

do llenado todo el volumen del espacio tridimensional con una canti

dad finita de espuma plástica.

Parece claro, pues, que la noción de un espacio curvo «-dimen

sional, incluyendo la de un espacio curvo tridimensional, no es sólo

lógicamente consistente, sino que no tiene evidentemente nada de

absurda. Siempre y cuando nos ciñamos a las características intrínse

cas de la curvatura, no estamos haciendo la suposición de que el es

pacio está inmerso en un espacio plano circundante de un mayor nú

mero de dimensiones. Y las características de la curvatura intrínsecas


al espacio pueden claramente ser averiguadas mediante técnicas di

rectas por una criatura que viva en el espacio. ¿No podría darse el

caso, pues, de que el espacio tridimensional real de nuestro mundo

fuese curvo, y no el espacio plano caracterizado por los postulados

básicos de la geometría euclídea tridimensional? Tales especulacio

nes acompañaron naturalmente el descubrimiento de las nuevas geo

metrías.

E l uso de las geometrías no-euclídeas en la física9

En el siglo xix se especuló con la posible realidad del espacio curvo.

W. Clifford, por ejemplo, sugirió que era concebible que la materia

consistiera efectivamente de regiones pequeñas de espacio sumamen

te curvo en un espacio tridimensional que fuese plano a gran escala.

Era evidente que una curvatura del espacio a gran escala sólo podría

ser detectada a las escalas más grandes, astronómicas, pues la expe

riencia de generaciones nos había demostrado lo bien que funciona

ba la geometría euclídea tridimensional plana en nuestras descripcio

nes del mundo. Efectivamente, funcionaba bien para mediciones del

tipo ordinario e, incluso, en la descripción de cosas tales como la es

tructura del sistema solar.

No obstante, solamente con la nueva teoría relativista de la gra

vedad de Einstein, la teoría general de la relatividad, la geometría

curva pasó a formar parte esencial de una teoría física plausible. Ya

hemos visto que uno podía argüir con plausibilidad que la gravedad

afectaría dinámicamente a todos los objetos en la misma forma, con

independencia de su tamaño y constitución. Así, un objeto material

que, en ausencia de gravedad u otras fuerzas, seguiría una trayectoria

con dirección y velocidad uniformes, seguiría una trayectoria diferen

te c*n presencia de la gravedad. Pero el cambio de trayectoria depen

dería solamente del campo gravitacional y de la posición y velocidad

iniciales del objeto. No dependería de la masa del objeto o del mate

rial del que había sido hecho. Esta independencia del efecto de la

gravedad respecto al tamaño y estructura del objeto es lo que hace

posible la «geometrización» del campo gravitacional.

Cuando se la combina con los argumentos a favor de un efecto

gravitacional sobre las características métricas del mundo, según son

determinadas por reglas y relojes, la idea de tratar la gravedad como

77

una curvatura deviene plausible. Pero no es un espacio curvo lo que,

al menos de una manera fundamental, Einstein postula, sino, en su

lugar, un espacio-tiempo curvo. En el espacio-tiempo de Minkowski

de la relatividad especial, las partículas libres describían líneas rectas

de tipo temporal, las geodésicas de tipo temporal del espacio-tiempo.

Ahora, sugiere Einstein, hemos de pensar en las partículas sobre las

que sólo actúa la gravedad como partículas «libres» que se desplazan,

no ya según líneas rectas de tipo temporal, sino según las geodésicas

curvas de tipo temporal de un espacio-tiempo que es curvo. Un re

sultado fundamental de la geometría de Riemann es que por un pun

to en una dirección dada pasa una única trayectoria geodésica. En

los espacios riemannianos, las geodésicas son las trayectorias de cur

vatura mínima y las de distancia más corta (localmente) al mismo

tiempo. Dada la nueva métrica del espacio-tiempo, es más convenien

te tomar como fundamental la definición de «menor curvatura» de

las geodésicas. En el espacio-tiempo, si uno especifica una dirección

en un punto, especificará simultáneamente una dirección espacial y

una velocidad en cada dirección. Así, la geodésica de tipo temporal

que pasa por un punto en una dirección dada corresponderá a la es

pecificación de la posición inicial y de la velocidad inicial de una

partícula. La trayectoria determinada por la geodésica será entonces

única. Y esto es justamente lo que queremos para la gravedad ya que,

dadas una posición y una velocidad iniciales, la trayectoria de cual

quier partícula en un campo gravitacional es la misma. La luz, que en

la relatividad especial recorre las geodésicas nulas rectilíneas del es-

pacio-tiempo de Minkowski, recorre ahora las geodésicas nulas del

espacio-tiempo curvo, geodésicas que no serán, en general, líneas rec

tas. (Véase la figura 2.7.)

Uno podría determinar la curvatura de un espacio-tiempo si

guiendo las trayectorias de las partículas y de los rayos de luz «li

bres», es decir, partículas y rayos de luz que actúan bajo la sola in

fluencia de la gravitación, considerada ahora simplemente como la

curvatura del espacio-tiempo. Pero uno podría también, al menos en

principio, determinar la estructura de la curvatura realizando un nú

mero suficiente de mediciones de las separaciones espacial y tempo

ral de los sucesos y reuniendo estas mediciones en el intervalo de se

paración, que es la métrica del espacio-tiempo. La relatividad general

postula que el espacio-tiempo así determinado coincidirá con el obte

nido siguiendo los movimientos geodésicos de las partículas y de los


(a) (b)F i g u r a 2 .7 . Movimiento en un campo gravitacional a lo largo de las geodésicas curvas. En (a) el espacio-tiempo es visto como «plano». La linea recta t representa la trayectoria que una partícula «libre» seguiría a través del espacio-tiempo y la línea recta l la trayectoria de un rayo de luz «libre». Bajo la influencia de una fuerza como la gravedad, la partícula y el rayo de luz recorrerán trayectorias curvas tales como t' y /'. Pero éstas son vistas como desviaciones de las trayectorias más rectas en el espacio- tiempo. En (b) las trayectorias rectas han desaparecido. En su lugar el espacio-tiempo es visto como «curvo» en la presencia de gravedad, siendo t ' y /' las trayectorias de

partículas y rayos de luz «libres» (es decir, partículas y rayos de luz sobre los que no

actúa ninguna fuerza no gravitacional), ahora consideradas geodésicas, o trayectorias más rectas posibles en el espacio-tiempo curvo.

rayos de luz, utilizando relojes y reglas para hacer que las mediciones

temporales y espaciales se vean también afectadas por el campo gra

vitacional, en el sentido de que ellos miden adecuadamente estas

cualidades métricas en el espacio-tiempo curvo.

La teoría gravitacional tradicional presentaba dos partes: una es

pecificaba la acción de la gravedad sobre objetos prueba; la otra es

pecificaba la clase de campo gravitacional que sería generado por

una fuente de gravedad. En la vieja teoría, la gravedad era una fuerza

que aceleraba de igual manera a todos los objetos materiales situados

en el mismo lugar de un campo gravitacional. En la nueva teoría, la

gravedad es la estructura del espacio-tiempo curvo. Afecta a las partí

culas y a los rayos de luz haciendo que ahora describan geodésicas

curvas nulas y de tipo temporal en el espacio-tiempo, y afecta a los

instrumentos de medida espacial y temporal idealizados.


¿Qué sucede con el segundo aspecto de la teoría, el que especifi

caba qué tipo de campo gravitacional sería generado por una fuente

de gravedad? En la vieja teoría, cualquier objeto masivo genera un

campo gravitacional. En la nueva teoría relativista, la gravedad está

asociada con la energía de masa del mundo material. Las ecuaciones

de campo de la relatividad general poseen en el miembro de la iz

quierda una expresión matemática que caracteriza la curvatura del

espacio-tiempo. En el miembro de la derecha presentan una expre

sión que caracteriza la forma en que la energía de masa se distribuye

en el espacio-tiempo, el denominado tensor de energía-momento.

Esta ecuación es la que relaciona la gravedad, ahora el espacio-tiem

po curvo, con sus fuentes en ia energía de masa no gravitacional. (El

«no gravitacional» es importante porque el campo gravitacional pro

piamente dicho, el espacio-tiempo curvo, también posee energía de

masa.) Sería un error pensar en la materia como «causante» del cam

po gravitacional en un sentido simplista, porque para conocer el

miembro de la derecha de la ecuación, el cual describe cómo la ener

gía de masa se distribuye en el espacio-tiempo, es preciso postular

una estructura de espacio-tiempo. La ecuación nos dice si un espa

cio-tiempo dado es compatible con una distribución postulada de

energía de masa en ese espacio-tiempo. Solamente cuando la ecua

ción es satisfecha, tanto por la estructura espacio-temporal postulada,

como por la distribución de energía de masa postulada en esa estruc

tura, el mundo postulado es un mundo posible en la nueva teoría.

Es interesante que, dada la ecuación de campo, se siga la ley di

námica de la gravedad —que las partículas materiales puntuales «li

bres» recorren geodésicas de tipo temporal. A diferencia de la teoría

de Newton, la ley dinámica de la gravedad no necesita ser postulada

como una ley independiente, sino que puede ser derivada de la ecua

ción de campo básica.

Si aceptamos esta nueva teoría del espacio-tiempo curvo de la

gravedad, confrontamos entonces la tarea de intentar, como habitan

tes del mundo, determinar su estructura espacio-temporal actual. La

teoría nos dice que la geometría del espacio-tiempo debe estar corre

lacionada con la distribución de materia y energía en ese espacio-

tiempo. Y la estructura espacio-temporal en cuestión se hace mani

fiesta a través de las trayectorias geodésicas curvas de los rayos de luz

no obstaculizados y de las partículas «libres», así como por medio de

intervalos espaciales y temporales determinados por reglas de medir


(o cimas en un mundo curvo) y relojes idealizados. Naturalmente,

si el espacio-tiempo muestra alguna curvatura, lo hará en las escalas

astronómicas, pues nosotros disponemos de una amplia experien

cia empírica para asegurar que en las mediciones locales, a peque

ña escala, la geometría plana minkowskiana funciona adecuada

mente.

Algunos efectos de esta «gravedad», entendida ahora «como cur

vatura espacio-temporal», se manifiestan en la escala del sistema

solar. Se considera que los planetas describen geodésicas en un espa

cio-tiempo curvado por la presencia de un sol masivo. Esto introduce

leves modificaciones en el movimiento kepleriano de los planetas ex

plicable por la teoría newtoniana. Sabemos que la curvatura espacio-

temporal, incluso del sistema solar, es pequeña. Las trayectorias de

los planetas en el espacio-tiempo se desvían ligeramente de las geo

désicas rectilíneas (que no deben confundirse con las elipses espacia

les, obviamente curvadas, que describen). Pero el efecto de la curva

tura es superponer a las familiares trayectorias elípticas de los

planetas pequeños efectos adicionales, tales como un desplazamiento

(respecto a un sistema inercial fijo en el sol) del punto de mayor

aproximación del planeta al sol en su órbita, un desplazamiento que

puede ser detectado en el caso del planeta Mercurio.

Otros efectos métricos de la gravedad pueden también observarse

en una escala relativamente pequeña, en particular, el atraso de un re

loj respecto a otro, si el primer reloj está situado por debajo del se

gundo en un potencial gravitacional. Pero es en las grandes escalas

cosmológicas donde se encuentran las nuevas y más interesantes pre

dicciones de la teoría y donde son posibles las más fascinantes mani

festaciones de las consecuencias observacionales de la curvatura del

espacio-tiempo. Aquí uno trata con universos modélicos sumamente

idealizados, de los que pueden derivarse conclusiones teóricas. Lo

que se espera, por supuesto, es que al menos algunas de estas imá

genes idealizadas del mundo a escala cosmológica se aproximen lo

bastante a la realidad para proporcionarnos una idea del mundo que

descubrimos en nuestras observaciones astronómicas del espacio pro

fundo. Por ejemplo, se supone habitualmente que la materia del uni

verso puede considerarse distribuida uniformemente y que la distri

bución es la misma en todas las direcciones del espacio en el mundo

cosmológico. Esta suposición está siendo actualmente sometida a un

intenso escrutinio observacional.


Una gran variedad de posibles universos espacio-temporales ha

sido explorada por los teóricos. En muchos de ellos, la estructura de

continuidad del universo difiere de la de los universos de la física re

lativista especial o newtoniana. En algunos universos, por ejemplo,

pueden existir trayectorias de tipo temporal cerradas, colecciones de

sucesos tales que, cuando un observador los va siguiendo de suceso

en suceso, regresa en algún momento al suceso inicial. Otros espacio-

tiempos, aunque no tan patológicos causalmente, pueden hallarse

próximos a contener en su seno semejantes trayectorias curvas cerra

das. Otros espacio-tiempos peculiares llevan incorporada una no-

orientabilidad. Se encuentran dados la vuelta, como la conócida ban

da de Móbius, una superficie bidimensional girada inmersa en el

triespacio. (Véase la figura 2.8.)

F i g u r a 2.8, Un espacio no orientable. La banda de Mdbius es el ejemplo más sencillo

de espacio no orientable, en este caso de dimensión dos. B y B' representan figuras orientadas que no podrían ser transformadas la una en la otra si estuviesen dibujadas sobre una superficie plana normal. Pero si tomamos B y la movemos alrededor de la banda torcida de Móbius, podemos llevarla de vuelta en algún momento a Q de manera que coincida con B'. Esto pone de manifiesto la naturaleza no orientable de la superficie. En el espacio-tiempo, la no orientabilidad puede ser espacial, temporal o

espacio-temporal.

En un mundo espacio-temporal no-orientable semejante puede

resultar imposible hacer una distinción global entre objetos dextrógi-

ros y levógiros, pudiendo un objeto dextrógiro transformarse en uno

levógiro en el mismo lugar mediante un viaje por el espacio-tiempo.

O bien, puede que se carezca de orientabilidad temporal, lo cual ha

ce imposible determinar globalmente cuál es la dirección temporal

del «pasado» y cuál la del «futuro» en un suceso puntual.


En algunos espacio-tiempos, los observadores pueden dividir el

espacio-tiempo en espacios-en-un-tiempo. Esto significa que en

estos mundos, para un observador en un estado determinado de

movimiento, el espacio-tiempo puede ser seccionado en espacios

tridimensionales de sucesos a los que se puede asignar un tiempo

específico en un orden temporal de validez universal. Para otros

espacio-tiempos, una segmentación semejante del espacio-tiempo

en «secciones simultáneas» de tri-espacios-en-un-tiempo es imposi

ble. Cuando dicha segmentación del espacio-tiempo en espacios-

en-un-tiempo es posible, los espacios pueden ser espacios curvos

tridimensionales del tipo estudiado por Riemann en su generaliza

ción de la geometría gaussiana de las superficies curvas. Un univer

so de esta índole, el modelo de Einstein, posee un tiempo que se

extiende indefinidamente en el pasado y en el futuro. Para un ob

servador en cada tiempo el mundo espacial existe como una esfera

cerrada tridimensional de tamaño finito y constante. Los universos

de Robertson-Walker están formados por espacios-en-un-tiempo de

curvatura constante, pero la curvatura puede ser positiva, cero o

negativa. El parámetro de tamaño en estos espacios puede variar

con el tiempo, convirtiéndolos en modelos plausibles de universos

big bang que presentan, .como parece ser el caso de nuestro univer

so según se desprende de los datos observacionales, un punto sin

gular en el que toda la materia del mundo está comprimida en un

punto espacial.

Es más, la curvatura espacio-temporal ayuda a explicar los datos

posibles de la experiencia en otra área: la descripción de las singulari

dades generadas por la materia colapsante de estrellas masivas. Éstos

son los famosos agujeros negros, regiones del espacio-tiempo tan cur

vadas por la presencia de materia sumamente densa que la luz no

puede escapar desde la región de espacio-tiempo interior al espacio-

tiempo exterior en las inmediaciones del punto singular de colapso

de la estrella. Los modelos de dichas regiones del espacio-tiempo,

fuertemente curvadas localmente, correspondientes a estrellas colap-

sadas con una carga eléctrica y/o con rotación, así como la clase ori

ginal estudiada, aportan casos de estudio fascinantes de los efectos

peculiares que puede tener la gravedad como curvatura espacio-tem

poral. Aunque la evidencia procedente de la observación todavía no

es concluyente, parece que algunos de los generadores de radiación

fuertemente energética en el cosmos, por ejemplo, los cuásares y los


núcleos de las denominadas galaxias activas, podrían muy bien ser

agujeros negros semejantes.

E l espacio-tiempo curvo y la gravedad newtonianaCuando discutimos la transición del espacio y el tiempo al espacio-

tiempo al formularse los fundamentos de la teoría especial de la rela

tividad, observamos que, una vez construido el espacio-tiempo de

Minkowski como el espacio-tiempo apropiado a la relatividad espe

cial, los científicos se dieron cuenta de que se podía utilizar la noción

de espacio-tiempo para construir un espacio-tiempo que en algunos

aspectos se adaptase a la física de Newton mejor que su propio espa

cio y tiempo absolutos. Este fue el espacio-tiempo galileano o neo-

newtoniano. A la luz de la descripción de la gravedad como espacio-

tiempo curvo, la teoría general de la relatividad, se hizo evidente que

también en la imagen prerrelativista uno podía redescribir la grave

dad por medio de un espacio-tiempo curvo. En este marco prerrelati

vista, la gravedad no tiene los efectos sobre las mediciones de espa

cio y tiempo que tiene en la versión relativista, ni se tiene en modo

alguno en cuenta el efecto de la gravedad en la luz. En lugar de ello,

son los familiares efectos dinámicos de la gravedad los que se trans

forman en la curvatura del espacio-tiempo.

En esta imagen, el tiempo es lo mismo que fue para Newton.

Hay un intervalo de tiempo definido y absoluto entre dos sucesos

cualesquiera. Sucesos que son todos simultáneos forman espacios-en-

un-tiempo. Estos son, como lo eran para Newton, espacios euclídeos

tridimensionales planos. Al igual que en el espacio-tiempo neo-new-

toniano, no existe una noción no-relativa de dos sucesos no-simultá

neos en un mismo lugar, por lo que este espacio-tiempo carece de la

noción absoluta de igualdad de la posición en el tiempo y de veloci

dad absoluta de Newton. Pero, así como en la concepción neo-new-

toniana había geodésicas de tipo temporal que correspondían a las

posibles trayectorias de partículas moviéndose libremente, así tam

bién hay geodésicas de tipo temporal en esta nueva imagen espacio-

temporal. Sin embargo, mientras las geodésicas de tipo temporal de

la imagen neo-newtoniana eran trayectorias rectilíneas de partículas

moviéndose uniformemente (partículas sobre las que no actúan fuer

zas y se mueven, por la ley de inercia, con velocidad constante), aho

84 Filosofía-de la física

ra las geodésicas de tipo temporal son líneas curvas. Éstas resultan

ser las trayectorias de partículas «libres» en el nuevo sentido dimana

do de la teoría de la gravedad de Einstein, esto es, partículas sobre

las que no actúa ninguna otra fuerza más que la gravedad.

Una vez más, la fuerza gravitacional es eliminada de la teoría en

favor de la gravedad como curvatura de las geodésicas de tipo tem

poral, de manera que las partículas sienten el efecto de la gravedad,

no por verse desviadas de su movimiento geodésico por la fuerza del

objeto gravitatorio, sino, en su lugar, por seguir las trayectorias geo

désicas «libres» en el espacio-tiempo, trayectorias ahora curvas debi

do a la presencia del objeto gravitatorio que actúa como «fuente» de

curvatura del espacio-tiempo. Al igual que en la teoría de Einstein, es

únicamente el efecto uniforme de la gravedad sobre un objeto prue

ba, el hecho de que todos los objetos afectados por la gravedad su

fren el mismo cambio en su movimiento con independencia de su

masa o de su constitución, lo que permite esta «geometrización» de

la fuerza gravitacional. Este espacio-tiempo curvo de la gravedad

newtoniana no es, como el espacio-tiempo de Minkowski o el espa-

cio-tiempo curvo de la teoría general de la relatividad, un espacio-

tiempo riemanniano (o pseudo-riemanniano); pues, a diferencia de los

espacio-tiempos de la relatividad especial y general, carece de estruc

tura métrica espacio-temporal. Hay un intervalo temporal definido

entre dos sucesos cualesquiera. En el caso de sucesos simultáneos,

hay una separación espacial definida entre dos sucesos cualesquiera.

En este sentido, este espacio-tiempo posee una métrica del tiempo y

una métrica del espacio. Pero, por contraste con el caso relativista,

no existe ningún intervalo espacio-temporal entre un par de sucesos.

La curvatura se revela solamente en la no rectilineidad de las geodé

sicas de tipo temporal, y no en alguna característica métrica del espa-

cio-tiempo.

Resumen

El desarrollo de las elegantes teorías de Einstein, que intentan hacer

justicia a los sorprendentes hechos observacionales sobre el compor

tamiento de la luz, las partículas libres y las reglas y los relojes de

medida, nos proporciona, pues, dos revoluciones en nuestras concep

ciones del espacio y el tiempo. Primero, el espacio y el tiempo son

85

reemplazados por la noción unificada de espacio-tiempo, en relación

a la cual los aspectos espaciales y temporales del mundo pasan a ser

derivados. Segundo, la noción de curvatura es invocada con el fin de

hallar un lugar natural para los efectos de la gravedad en dicha ima

gen espacio-temporal del mundo.

Sin duda, tales revoluciones en nuestra perspectiva científica so

bre lo que son realmente el espacio y el tiempo deberían llevar a un

profundo replanteamiento de las cuestiones típicamente filosóficas

sobre el espacio y el tiempo. ¿Cómo deberíamos considerar el estatus

de nuestras pretensiones de conocimiento sobre la estructura del es

pacio y el tiempo en este nuevo contexto en el que, por primera vez,

un número de propuestas posibles y diferenciadas sobre la estructura

del espacio y"el tiempo están al alcance de nuestra inspección cientí

fica? Y ¿qué efecto deberían tener dichas estructuras noveles del es

pacio y el tiempo en nuestras concepciones sobre la naturaleza meta

física del espacio y el tiempo? En particular, ¿qué efecto deberían

tener estas revolucionarias concepciones científicas en el debate tra

dicional entre sustantivistas y relacionistas? Es a estas cuestiones filo

sóficas a las que vamos a prestar atención a continuación.

¿Cómo conocemos la verdadera geometría del mundo?

Concepciones cambiantes acerca de nuestro conocimiento de la geometría

Ya señalamos anteriormente la actitud cambiante de la comunidad

filosófica y científica ante la cuestión del fundamento ideal para

nuestro conocimiento del mundo que siguió a la revolución científi

ca del siglo x v ii. Primero se pensó que una proposición podía cono

cerse con un tipo de certeza que se seguía de la sola razón pura; des

pués se impuso gradualmente la idea de que nuestro conocimiento

del mundo — las verdades generales y teóricas acerca de la naturale

za de las cosas— podía sólo ser inferido a partir de verdades funda

mentales sobre el mundo. Esta inferencia era fiable, pero falible. La

creencia en estas verdades fundamentales descansaba en los datos

suministrados por los sentidos a través de la observación y del expe

rimento.

Pero la geometría siguió siendo una espina clavada en este enfo


que empirista de la teoría del conocimiento. Supongamos que la geo

metría nos aporta verdades acerca de la naturaleza del mundo que

reconocemos como tales porque se siguen por cierta inferencia lógica

de verdades fundamentales cuya verdad es evidente en sí misma y

cognoscible para la razón pura. La geometría puede ser reconocida

entonces como verdadera con independencia de la observación y el

experimento. ¿No hay, pues, un campo de conocimiento acerca del

mundo por lo menos que no necesita de la garantía de los datos de

los sentidos, sino que podría afianzarse por el pensamiento puro sola

mente? Y si la geometría fuese una disciplina de esta índole, ¿no se

ría posible que en algún momento todo nuestro conocimiento físico

llegara a descansar en dicho fundamento epistémico superior?

El descubrimiento de las geometrías no-euclídeas contribuyó a

menoscabar las pretensiones de este tipo. Si la geometría euclídea no

era la única geometría posible, ¿cómo podía uno afirmar que las ver

dades de la geometría podían ser conocidas con independencia del

experimento? ¿No se revelaba la estructura del espacio en la geome

tría, así como cualquier otra estructura física que pudiera ser descrita

por una cualquiera de un número de teorías alternativas incompati

bles? En tal caso, ¿no deberíamos apoyarnos en la observación, como

hacemos en otras ciencias, para averiguar cuál de las posibles teorías

describe verdaderamente la estructura del mundo?

Los defensores de la concepción según la cual la geometría euclí

dea describía la naturaleza del mundo intentaron algunas veces cues

tionar la propia consistencia lógica de las geometrías no-euclídeas.

Esa táctica pronto fracasó, pues no tardaron en crearse pruebas de

consistencia relativa para las geometrías axiomáticas no-euclídeas.

Estas pruebas demostraron que podíamos estar seguros por pura ló

gica de que si las geometrías no-euclídeas eran inconsistentes, tam

bién lo era la geometría euclídea. En consecuencia, las geometrías

no-euclídeas eran al menos tan respetables desde un punto de vista

lógico como la euclídea. Los kantianos pudieron continuar defen

diendo por otras razones que la geometría euclídea era la verdadera

geometría del mundo, manteniendo, como lo hicieron, que la verdad

de la geometría euclídea tenía un tipo de necesidad que transcendía

la necesidad de las verdades cuya verdad se debía solamente a la ló

gica. Veremos en un momento una réplica a ellos. En general, sin em

bargo, quienes estaban familiarizados con la existencia de las nuevas

geometrías, estaban convencidos de que la geometría del mundo,


como su química o su física, era algo sobre lo que sólo el experimen

to nos podía informar.

Como hemos visto, solamente en el contexto relativista comenza

ron las geometrías no-relativistas a jugar, de hecho, un papel impor

tante en la física teórica. La ruta partió del espacio y tiempo newto-

nianos, y continuó a través del espacio-tiempo de la relatividad

especial hasta el espacio-tiempo curvo de la teoría general de la rela

tividad. En cada fase de transición los hechos empíricos, los resulta

dos de la observación y del experimento, jugaron un papel decisivo.

La postulación del espacio-tiempo de Minkowski, el espacio-tiempo

de la relatividad especial, descansaba sobre el sorprendente descubri

miento de que, hasta donde llegaban los experimentos de ida y vuel

ta, la velocidad de la luz parecía ser la misma en todos los estados

inerciales de movimiento y en todas las direcciones. Por otro lado, el

hecho de que la velocidad de la luz fuese la velocidad máxima de

propagación de las señales causales desempeñó también un papel im

portante en la fundamentación de la teoría, y esto fue también un he

cho de experiencia observacional. Además, estaban todos los hechos

predichos en relación a la teoría especial, como los relativos a los

tiempos de vida aparentes de las partículas inestables en movimiento

respecto al observador, al aumento aparente de masa inercial con el

aumento de la velocidad, y otros, que una y otra vez se tomaban

como confirmación experimental de la nueva imagen espacio-tem

poral.

También en el paso a la relatividad general jugaron un papel cen

tral los hechos revelados por la observación, primero al sugerir la

nueva teoría, y después al confirmarla. Los hechos observacionales,

conocidos por Galileo, sobre cómo la gravedad actuaba sobre los ob

jetos con independencia de su tamaño y constitución, sugirieron ini

cialmente a Einstein la idea de tratar la gravedad como una caracte

rística geométrica del espacio-tiempo. Las predicciones sobre la

desviación de las trayectorias curvas de los rayos de luz cerca de ob

jetos gravitacionales y las velocidades relativas de los relojes ideales

en lugares diferentes de un potencial gravitacional se toman como

confirmación de la teoría. Otra confirmación basada en hechos pro

cede de los sutiles cambios predichos en las órbitas de los planetas

respecto a las trayectorias predichas por la teoría newtoniana. A la

larga se espera poder realizar observaciones a escala astronómica,

pongamos, de agujeros negros, o incluso a escala cosmológica, ponga

KH Filosofía de la física

mos, di- los clirios observacionales de la estructura globalmente cur

vada do la geometría del universo, para seguir probando las predic

ciones de la leona y, si se encuentra que concuerdan con la predic

ción, para confirmar su verdad.

¿No es evidente, pues, que los empiristas tienen razón? Uno pue

do imaginar un sinnúmero de teorías sobre la naturaleza del mundo.

Pero sólo la observación y el experimento nos podrán decir cuál teo

ría es la correcta. Esto es tan cierto para la geometría como lo es para

la física, la química, la biología o la psicología. Es la observación,

pues, la que ha de decidir cómo es realmente la geometría del mun

do. Cualquier esperanza de conocer la geometría del mundo con cer

teza e independientemente de la observación y el experimento es fa

laz. Pero, ¿están las cosas tan predeterminadas?

El convencionalismo de PoincaréQue no lo están fue lo que el gran matemático Henri Poincaré sugi

rió en un brillante análisis del estatus del conocimiento geométrico.

Su estudio precedió a las revoluciones de la relatividad, pero iba a

arrojar mucha luz sobre el estatus de la geometría en estas nuevas

teorías. Poincaré comienza presentando en una serie de ensayos una

prueba de consistencia relativa para una geometría no-euclídea, refu

tando cualquier afirmación de que dichas nuevas geometrías deban

ser desestimadas por ser lógicamente inconsistentes. Después consi

dera la afirmación kantiana de que la geometría euclídea es la geome

tría necesariamente correcta del mundo. De acuerdo a dicha vindica

ción, la necesidad de la geometría se basa en el hecho de que el

espacio es un componente de nuestra percepción del mundo y la

geometría euclídea describe la estructura de lo percibido que es

aportado a la percepción por la mente perceptora. Poincaré arguye

que el espacio de la física, el espacio en el que se dan los aconteci

mientos materiales, debe ser diferenciado de cualquier «espacio per-

ceptual», tal como el denominado campo visual de la percepción vi

sual. Arguye, de hecho, que no sabemos de la existencia o naturaleza

del espacio físico por ningún conocimiento perceptual directo, sino,

antes bien, por inferencia de lo que percibimos directamente. Son,

afirma, el orden y la regularidad de las partes de nuestra experiencia

perceptual de los fenómenos, lo que nos lleva a presuponer que esta

89

experiencia tiene un origen causal en los acontecimientos físicos, los

cuales no son de por sí componentes inmediatos de la conciencia

perceptual. Inferimos la existencia del mundo físico, incluido el espa

cio físico, y su naturaleza como una hipótesis explicatoria para dar

cuenta del orden y de la regularidad que experimentamos en nues

tras percepciones directas. Dicha inferencia es, pues, inferencia a par

tir de una hipótesis. Y ninguna de dichas hipótesis puede tener una

necesidad de ser generada a partir de unos supuestos «principios es

tructurales de lo percibido directamente», porque la hipótesis versa

sobre lo físico y lo inferido, y de ninguna manera sobre el contenido

de la percepción directa. •

En este punto, uno espera que Poincaré proponga que la geome

tría encuentra su soporte en la inferencia razonable a partir de los

datos de la observación y que uno podría, de hecho, descubrir que

las geometrías no-euclídeas se ajustaban mejor a los datos observacio

nales que la euclídea. Pero, en lugar de ello, nos sorprende con un

argumento en el sentido de que la geometría euclídea no puede ser

refutada por ningún tipo de experiencia. Arguye, de hecho, que siem

pre consideraremos a la geometría euclídea como la geometría del

mundo. Esta tiene, pues, un tipo de necesidad, pero la necesidad es

sólo cuestión de determinación convencional por nuestra parte, no

un reflejo de un hecho metafísico acerca del mundo.

El argumento de Poincaré descansa en una famosa parábola.

Imaginemos científicos bidimensionales confinados en un disco pla

no euclídeo finito. Ellos intentan determinar la geometría de su mun

do transportando reglas de medir de un lugar a otro. Pero los enga

ñamos. Les damos instrumentos de medir que se expanden y

contraen con los cambios de temperatura — todos en la misma ra

zón— y ajustamos la temperatura del disco de manera que las reglas

se contraigan a longitud cero en su periferia. Con un decaimiento

adecuado de la temperatura desde el centro al borde del disco, es fá

cil inducirles a engaño haciéndoles pensar que están viviendo en una

superficie bidimensional infinita lobachevskiana negativamente cur

vada. Si intentasen valerse de la luz para averiguar la geometría de su

mundo, pondríamos un medio con un índice de refracción variable

sobre la superficie, curvando las trayectorias de los rayos de luz de

tal forma que se verían de nuevo engañados. Así, son burlados al

pensar erróneamente que su geometría es no-euclídea, cuando no lo

es. (Véase la figura 2.9.)


T = 0

F ig u r a 2.9. La parábola de Poincaré. Los habitantes bidimensionales están confinados en el interior de un disco ordinario en el plano euclídeo. Éstos están equipados con

varas de medir cuya longitud varía con la temperatura en una forma lineal. La temperatura en el centro del disco es T R 2, donde R es el radio del disco y T es una constante. En cualquier punto del disco la temperatura es T(R2 — r2) donde res la distancia del punto en cuestión al centro del disco. En el borde del disco, pues, la temperatura se hace cero y las varas de medir se contraen a longitud cero. E s fácil mostrar que si los habitantes consideran que la longitud de sus varas de medir es constante, llegarán a la conclusión de que viven en un plano lobachevskiano curvo que tiene una curvatura negativa constante y se extiende al infinito.

Pensemos ahora en nosotros mismos en nuestro mundo tridi-

mensioríal. Con independencia de las mediciones que hagamos utili

zando reglas y rayos de luz (o partículas libres o relojes, si es la geo

metría del espacio-tiempo lo que estamos determinando), ¿no podría

suceder que cualquier apariencia de no-euclidicidad en la geometría

se debiera a campos de dilatación y contracción y a campos que des

vían los rayos de luz y las partículas de sus trayectorias geodésicas, en

lugar de a una desviación genuina del espacio de su euclidicidad?


Ahora bien, en el caso de las criaturas bidimensionales, supone

mos que nosotros tenemos la última palabra sobre lo que realmente está ocurriendo. Pero en caso de pretender determinar la geometría

de nuestro mundo, ¿qué es lo que debe marcar la diferencia entre

una geometría real no-euclídea y un mundo euclídeo con campos

distorsionantes que afectan incluso a los aparatos de medida idealiza

dos? La sugerencia de Poincaré es que no hay nada en los hechos

implicados que determine cuál de las hipótesis es la «correcta». Nos

corresponde a nosotros decidir qué descripción dar al mundo. La

«verdadera» geometría del mundo es una cuestión de decisión o con

vención por nuestra parte. Como veremos, dicha afirmación admite

interpretaciones muy diferentes.. Poincaré pasa a sugerir que, dado

que la geometría euclídea es más simple que la no-euclídea, siempre

elegiremos la primera como la «verdadera» geometría del mundo,

restaurando la euclidicidad como característica necesaria del mundo,

si bien una que es sólo «convencionalmente necesaria». Por supues

to, mucha gente ha advertido desde entonces que podría resultar

más sencillo describir el mundo en términos no-euclídeos, si con ello

se lograse simplificar el resto de la teoría, y que ésta es la elección he

cha (si es que es una elección) en, pongamos, la relatividad general

con su espacio-tiempo curvo.

Pero el argumento principal de Poincaré es claro. La evidencia

que podemos acumular mediante la observación y el experimento re

quiere una explicación teórica. Pero las hipótesis que ofrecemos para

explicar los hechos observacionales tienen una estructura que encie

rra un número de elementos. Podemos suscribir una propuesta acer

ca de la constitución de una parte de esta estructura a la vista de

datos cualesquiera, siempre que estemos dispuestos a postular un

número suficiente de cambios en otra parte de la estructura. Con in

dependencia de lo que nuestros experimentos muestren, podemos

elegir la geometría euclídea, por ejemplo, siempre que estemos dis

puestos a postular lo necesario para que un campo físico dilate y

contraiga las reglas, desvíe las ondas luminosas, etcétera. Por consi

guiente, afirma Poincaré, es una cuestión, no de hecho, sino de con

vención el que una geometría, y no otra, describa el espacio (o espa

cio-tiempo) del mundo.


Respuestas a PoincaréHa habido una variedad muy amplia de respuestas a la vindicación

de Poincaré, una vindicación que cuestionaría no solamente la idea

de que podemos determinar la geometría del mundo por inferencia a

partir de la observación y el experimento, sino también la posibilidad

general de llegar a conclusiones definitivas sobre la estructura del

mundo apartadas de la observación directa. Una clase de respuestas

niega la premisa fundamental del argumento de Poincaré, esto es,

que uno puede aislar un conjunto de supuestos hechos sobre el

mundo como hechos de observación pura y situar luego estos hechos

en algún dominio de «percepciones en la mente», siendo todas las

aserciones físicas cognoscibles, si esto es posible, sólo sobre la base

de algún tipo de inferencia. Algunos negarían que un tal dominio de

lo percibido directamente sea inteligible, arguyendo que el conjunto

de nuestras percepciones no lo son de algunos «datos sensoriales en

la mente», sino del mundo físico. Negarían la existencia de cosas ta

les como objetos cognoscibles para la percepción con independencia

de una teoría postulada sobre el mundo. ¿Podemos creer seriamente

que el espacio en el que vemos mesas y sillas no es el espacio físico,

sino un «espacio visual» que no pertenece en modo alguno al domi

nio de la ciencia física?

Más importante aún, esas personas negarían normalmente la afir

mación de que hay hechos sobre el mundo inmunes en principio a

ser comprobados por «observación directa» o por «experimentación

directa». Para la tesis de Poincaré es crucial que hechos tales como

que el espacio del mundo sea realmente plano o curvo puedan sólo

conocerse por medio de una inferencia. No pueden ser determinados

por ningún tipo de inspección directa. Esta inmunidad de los hechos

geométricos a la observabilidad hace posible las teorías alternativas,

las cuales «salvan los fenómenos observables». Y esta inmunidad se

encuentra en la raíz del argumento de Poincaré de que nunca podre

mos afirmar legítimamente que conocemos la geometría del mundo

(excepto, claro está, estipulándolo convencionalmente).

Pero muchos han mostrado su escepticismo a que un tal reino

del ser inmune por siempre a la inspección directa pueda ser postula

do. Si ya negamos una vez un reino de lo directamente inspecciona

do «en la mente», considerando que cosas tales como mesas y árbo

les son visibles para nosotros, ¿no nos convence un resbaladizo

93

argumento de que en principio todas las cosas pueden ser «observa

das»? ¿No podemos ver bacterias utilizando microscopios, virus utili

zando microscopios electrónicos y núcleos utilizando aceleradores de

partículas? ¿Cómo puede entonces Poincaré estar seguro de que

nunca podremos simplemente observar que nuestro espacio es plano

o curvo?

No obstante, la presuposición de Poincaré de que no podemos,

de que la estructura geométrica forma parte de un reino del ser per

manentemente inmune a la observación directa, parece tener poder

persuasivo. ¿Qué sería observar, no rayos de luz o partículas, reglas o

relojes, sino «la estructura del espacio mismo»? Obviamente esto en

traña una gran cantidad de enigmas. Por ejemplo, ¿no «observamos

directamente» intervalos temporales entre nuestras experiencias?

¿Deben ser descartados como nada más que «intervalos temporales

mentales» que han de distinguirse del tiempo físico, real, en el mun

do material?

Una línea de argumentación a favor de Poincaré es que la mayo

ría de la física contemporánea que se ocupa del espacio y del tiempo

parece descansar en el mismo tipo de aserción de inmunidad de al

gunos hechos acerca del mundo a la observación directa que Poinca

ré está presuponiendo. Los argumentos de Einstein en la teoría espe

cial de la relatividad en su crítica, por ejemplo, a la noción de

simultaneidad de sucesos distantes, presuponen que dicha simulta

neidad debe ser determinada por medio de la luz, por señales causa

les de algún tipo, o transportando relojes. No puede tomarse como

algo abierto a la inspección directa. De nuevo, los argumentos para la

«geometrización» de la gravedad en los fundamentos de la relativi

dad general descansan en la suposición de que el campo gravitacio-

nal puede ser conocido sólo por sus efectos. Lo que observamos es el

comportamiento de los rayos de luz y de las partículas, de las reglas y

de los relojes, y no el campo gravitacional propiamente dicho. En

particular, parece haber dos suposiciones infiltradas en los funda

mentos de las teorías relativistas: 1) Lo que observamos es el compor

tamiento de las cosas materiales — rayos de luz, partículas, relojes y

varas de medir— , no la estructura del espacio-tiempo mismo; 2) Sólo

podemos determinar observacionalmente el comportamiento de las

cosas materiales en un momento dado, es decir, cosas tales como que

los extremos de dos reglas rígidas coinciden uno con otro. No pode

mos considerar como un hecho observacional el que dos reglas rígi


das separadas una cierta distancia entre sí tengan, o no, la misma lon

gitud, así como no podemos considerar la simultaneidad a distancia

como una característica observable del mundo en el sentido de ob-

servabilidad directa.

Podría suceder que semejantes suposiciones sobre tipos de carac

terísticas del mundo inmunes por siempre a la determinación obser-

vacional directa estén equivocadas. Pero se presuponen en el análisis

que fundamenta nuestra aceptación de las teorías del espacio-tiempo

contemporáneas. Supongamos, pues, por el momento, que Poincaré

está en lo cierto respecto a que estas estructuras inobservables for

man parte de nuestras teorías.

Poincaré está afirmando que nuestras estructuras postuladas

deben trascender los hechos observables. Este hecho es el que in

troduce en las teorías la «dualidad» que permite a numerosas ver

siones alternativas tener las mismas consecuencias observacionales.

¿Cómo sobrepasan las teorías de Einstein lo observable? En la teo

ría especial, mientras la coincidencia de sucesos es observable, la

simultaneidad de sucesos distantes se obtiene postulando la unifor

midad de la velocidad de la luz en todos los sistemas inerciales y

en todas las direcciones, un «hecho» que no puede comprobarse

observacionalmente. De nuevo, para obtener la estructura espacio-

temporal completa de la relatividad especial hay que añadir el pos

tulado de linealidad, lo cual equivale a postular que el espacio-

tiempo es plano. Una vez más, éste es un postulado teórico que

sobrepasa la comprobación directa. Sólo formulando estos postula

dos obtenemos la teoría estándar y no, por ejemplo, la vieja teoría

de un éter absoluto con reglas y relojes compensatorios «reales»,

que se contraen y atrasan respectivamente cuando están en movi

miento. En la teoría general se postula que los rayos de luz curva

dos y las partículas «libres» describen, bajo los efectos de la grave

dad, las geodésicas nulas y las de tipo temporal del espacio-tiempo

respectivamente. Y las reglas y relojes locales son tomados como

indicadores correctos de los intervalos métricos de espacio y tiem

po donde se encuentran ubicados. Sólo haciendo estas suposicio

nes conseguimos que las observaciones de los efectos de la grave

dad nos digan que el espacio-tiempo tiene curvatura. Con otros

postulados podríamos preservar la estructura espacio-temporal pla

na de la relatividad general, considerando que la gravedad es,

como en la teoría de Newton, un campo de fuerzas superpuesto

Espacio, tiempo, movim iento 95

que tiene efectos métricos, así como efectos dinámicos, sobre las

partículas en movimiento y sobre la luz.

El modelo de Poincaré parece, pues, describir muy bien el con

texto en el que las teorías relativistas se construyeron. Se obtienen

nuevos hechos observacionales. Éstos están restringidos a los hechos

locales y materiales sobre nuestros instrumentos de medida. Para jus

tificar y explicar estos hechos se postula una estructura espacio-tem-

poral. Sin embargo, las estructuras postuladas sobrepasan con su ri

queza a la totalidad de posibles hechos observacionales que las

soportan. Y, al igual que en la parábola de Poincaré de las criaturas

bidimensionales sobre el disco, también ahora una variedad de posi

bles estructuras espacio-temporales hará justicia a lo que considera

mos como la totalidad de hechos observacionales que podríamos en

contrar. Esto será así, al menos, si estamos preparados para hacer los

cambios necesarios en otras partes de nuestra teoría física.

Opciones realistasSi nos tomamos entonces seriamente el problema de Poincaré y nos

negamos a descartarlo por descansar en nociones ilegítimas sobre lo

que es, y lo que no es, observable o en nociones ilegítimas acerca de

que el reino de lo teórico sobrepasa, en principio, al reino de lo ob

servable, ¿cómo deberíamos continuar? Una clase de respuestas

acepta abiertamente el postulado de la estructura espacio-temporal

teórica, suponiendo que las teorías del espacio y el tiempo proponen

verdaderamente estructuras reales, pero inobservables, del mundo.

¿Estamos, pues, como Poincaré afirmó, circunscritos a la convencio-

nalidad para elegir la teoría correcta?

Una respuesta sería adoptar simplemente una actitud de escepti

cismo. Asumir que una de las múltiples teorías posibles del espacio-

tiempo compatibles con los datos observacionales es la correcta. Ar

güir que únicamente los hechos observacionales pueden conducirnos

legítimamente a elegir una teoría como preferible frente a las demás.

Argüir, entonces, que debemos simplemente negarnos, si somos razo

nables, a emitir un juicio sobre cuál de las teorías espacio-temporales

alternativas describe realmente el mundo. ¿No deberíamos, pues, ha

cer frente a estas limitaciones honestamente y rechazar un supuesto

conocimiento de lo que sencillamente no podemos conocer?


Para eludir esta exhortación al abandono, muchos han sugerido

que deberíamos buscar apoyo en esas características de las teorías

que usamos y, en su opinión, deberíamos usar, a fin de seleccionar la

teoría mejor y más convincente de un conjunto de alternativas entre

las que no puede hacerse una elección sobre la base de una diferen

cia de compatibilidad con los datos observables. Se arguye que en la

elección de una teoría aplicamos muchas consideraciones que sobre

pasan la mera comparación de las consecuencias observacionales de

la teoría con los hechos observados. Éstas son consideraciones que

pueden ayudarnos a decidir legítimamente cuál es la teoría más con

vincente. A menudo se arguye que unas teorías tienen una mayor

plausibilidad intrínseca que otras. En otros casos, la relación que una

teoría presenta con la ciencia de fondo sobre la que se proyecta se

supone que puede servir para discernir entre teorías más fiables y

aquellas en las que no merece la pena confiar.

Como ejemplo del segundo tipo de enfoque podríamos conside

rar la alegación de que el conservadurismo metodológico puede ju

gar un papel guía para dar preferencia a una teoría sobre otras indis

tinguibles observacionalmente de ella. Aquí se sostiene que existe

una regla del método científico en el sentido de que al elegir una

nueva teoría seleccionamos, y deberíamos seleccionar, la que se des

vía menos de las viejas teorías que venían siendo aceptadas, pero que

ahora rechazamos debido a su incompatibilidad con la evidencia.

¿Cómo se aplicaría esta regla en el caso, por ejemplo, de la relati

vidad general? Aquí estamos buscando una nueva teoría de la grave

dad. La teoría de Newton es incompatible con la relatividad y debe

ser rechazada, pero la teoría que pongamos en su lugar debe ser una

que sea compatible con los nuevos datos observacionales y que se

acerque lo más posible en sus afirmaciones a lo que la vieja teoría

afirmaba. ¿Podría dicha regla metodológica llevarnos a elegir la teoría

de Einstein frente a las teorías alternativas de «dilatación y contrac

ción más campos de fuerza»? Es sin duda cierto que en la vieja teoría

utilizábamos reglas y relojes para indicar correctamente los intervalos

espaciales y temporales. Esto sigue siendo cierto en la relatividad ge

neral, pero no en su alternativa espacio-temporal plana. Así, ¿no nos

lleva el conservadurismo metodológico a seleccionar la relatividad

general como la alternativa preferida?

Sin embargo, el espacio-tiempo era plano en la vieja teoría. Esto

sigue siendo así en la alternativa del campo, pero en la relatividad ge


neral se hace la propuesta radical de un espacio-tiempo curvo. Desde

este punto de vista parece que la alternativa de «espacio-tiempo pla

no más un campo gravitacional» es la elección más conservadora y,

por consiguiente, la que ha de preferirse. El problema es, claro está,

que el precepto de ser conservador respecto a la vieja teoría es ambi

guo. Hay muchos aspectos de la vieja y las nuevas teorías. El ser con

servador respecto a algunos de estos aspectos podría conducirnos a

elegir una de las alternativas, y el ser conservador respecto a otros as

pectos podría llevarnos a una elección muy diferente.

Pero es peor que eso. Aun cuando el conservadurismo nos lleva

se a una elección en lugar de a otra, ¿no podría suceder que la vieja

teoría mismamente pudiera ser reemplazada retrospectivamente por

una alternativa a ella? Tomemos la teoría gravitacional de Newton,

por ejemplo. Supongamos que consideramos que la alternativa de

«espacio-tiempo plano más fuerzas» es la teoría relativista más con

servadora respecto a la de Newton y, por tanto, la que ha de preferir

se. Pero, según hemos observado, es posible sustituir la teoría de

Newton por una teoría de la gravedad como espacio-tiempo curvo

que tendría las mismas predicciones observacionales que la teoría de

Newton. ¿No sería entonces la teoría del espacio-tiempo curvo, la re

latividad general, el cambio más conservador de esa versión revisada

de la física de Newton? ¿No es entonces la regla del conservaduris

mo sobre cómo se desarrollan realmente las teorías completamente

arbitraria? ¿No nos dice simplemente que proyectemos viejas deci

siones arbitrarias, accidentes de la historia, en el futuro? ¿Cómo pue

de ser eso una guía a la verdad?Como ejemplo de la otra sugerencia, que nos apoyemos en carac

terísticas intrínsecas de las teorías para hacer una elección entre las

alternativas, podríamos considerar la noción de simplicidad teórica.

Algo que se afirma habitualmente es que los científicos, dadas dos al

ternativas teóricas entre las que los datos observacionales no son de

cisivos, elegirán la más simple de las dos, revelando su intuición de

que la hipótesis más simple es más probable que sea la hipótesis más

verdadera.

La noción de simplicidad está, no obstante, plagada de enigmas.

En algunas versiones depende de la manera en que se formula la teo

ría. En un lenguaje o representación, una teoría podría parecer más

simple que otra, pero el orden de simplicidad podría verse trastroca

do si las teorías se expresasen de otra manera. Otras nociones de


simplicidad, que dependen de las características estructurales de la

teoría, la forma lógica de sus premisas básicas, podrían evitar en par

te esta aparente relatividad de la simplicidad respecto a la forma de

expresión. Hay, de hecho, significados intuitivos de simplicidad en

función de los cuales la teoría de la relatividad especial es más sim

ple que las teorías alternativas del éter o las teorías alternativas que

no suponen plano el espacio-tiempo. Intuiciones similares sobre la

simplicidad hacen que la relatividad general parezca más simple que

las teorías de «espacio-tiempo plano más campos impuestos» alterna

tivas a ella. En ambos casos, la idea es que la teoría einsteiniana no

posee la estructura problemática e innecesaria que contamina a sus

alternativas.

Para ver esto, comparemos primero el espacio-tiempo relativista

de la teoría especial de Einstein con una de las teorías del éter. Eins

tein considera que la velocidad de la luz es la misma en todas las di

recciones en cualquier sistema de referencia inercial. Las teorías del

éter lo niegan. Estas defienden que la luz tendrá una velocidad uni

forme en todas las direcciones solamente en el sistema que esté en

reposo en el éter. En los otros sistemas de referencia, la luz parece te

ner la misma velocidad en cada dirección sólo debido al efecto del

movimiento del laboratorio con respecto al éter sobre instrumentos

de medida tales como reglas y relojes. Así, mientras Einstein atribuye

los resultados nulos de los experimentos de ida y vuelta a la unifor

midad de la velocidad de la luz en todas las direcciones a lo largo de

las trayectorias, la teoría del éter los explica introduciendo, primero,

un cambio de la velocidad de la luz en direcciones diferentes y, lue

go, un cambio compensatorio en los instrumentos del laboratorio, de

pendiendo cada variación de la velocidad del laboratorio a través del

éter. Los efectos de estos cambios se cancelan exactamente. Sin duda,

la explicación según la teoría del éter de los resultados observados es

innecesariamente complicada. Para obtener los resultados observa

cionales necesitamos especificar un parámetro de la teoría, esto es, la

velocidad del laboratorio con respecto al éter. Sin embargo, sea cual

sea el valor que especifiquemos para esta cantidad, obtenemos exac

tamente las mismas predicciones experimentales, porque los efectos

de la velocidad se cancelan mutuamente. Por esta razón, ningún ex

perimento que podamos realizar podrá determinar la velocidad del

laboratorio con respecto al éter. Sin duda, la teoría de Einstein, la

cual niega simplemente la existencia de semejante sistema del éter o


de semejante velocidad indetectable, es más simple como hipótesis

explicativa y, por tanto, debe ser preferida.

Una situación similar se da en el caso de la relatividad general.

Einstein explica las trayectorias curvas de la luz y de las partículas

afirmando que éstas siguen las geodésicas de un espacio-tiempo cur

vo. La postulación de un «espacio-tiempo plano más fuerzas» alterna

tivo interpretaría esta curvatura como el resultado de fuerzas que

desvían a las partículas de las verdaderas geodésicas rectilíneas del

espacio-tiempo plano real. Un examen detenido de las teorías mues

tra que a cada mundo descrito por la teoría del espacio-tiempo curvo

corresponden un número infinito de mundos con «espacio-tiempos

planos más campos», así como un número infinito de mundos con

«sistemas de éter más compensación» corresponden a un único mun

do con un «espacio-tiempo minkowskiano relativista especial». Y así

como cada mundo con un sistema de éter es indistinguible de los

otros por observación, así cada uno de los nuevos mundos «espacio-

tiempo planos más campos» es indistinguible de todos los otros mun

dos semejantes. Esto es una generalización de algo que J. Maxwell y

otros ya observaron en relación a la teoría prerrelativista de la gravi

tación. Supongamos que existiese en el universo un campo gravita-

cional que fuese constante en todo lugar (es decir, la fuerza gravita-

cional tendría en cada punto la misma intensidad y apuntaría en la

misma dirección). Todo el universo material estaría, entonces, cayen

do con aceleración constante en este mundo. Aunque todo objeto

estaría siendo acelerado, esta aceleración no podría, al contrario que

la aceleración normal, ser detectada. Esto es debido a que todos los

aparatos de medida sufrirían la misma aceleración que el mundo mis

mo. La existencia de un campo gravitacional constante, pues, en caso

de existir, es un hecho indetectable sobre el mundo.

Pero en la relatividad general no hay ningún campo gravitacional,

y todos los mundos observacionalmente indistinguibles de la teoría

anterior pasan a ser asimilados a un único mundo con un espacio-

tiempo curvo. Esto se corresponde exactamente con la forma en que

la relatividad especial reemplaza a un número infinito de posibles sis

temas de éter por un único espacio-tiempo minkowskiano. Entonces,

en un sentido importante, las teorías estándar, einsteinianas, son más

simples que sus alternativas observacionalmente indistinguibles. Al

gunas teorías de confirmación teórica han utilizado hechos como éste

para generar nuevas nociones de datos que confirmen una teoría. Las


viejas nociones de confirmación denden a confirmar de igual manera

tíos teorías cualesquiera que sean observacionalmente indistinguibles,

a no ser que se les haya dotado previamente de alguna plausibilidad

intrínseca que las distinga. Las nuevas nociones de confirmación ha

cen posible que teorías como la relatividad especial o general sean

confirmadas por los datos, pero dan una confirmación cero a teorías

como las teorías del éter o las teorías del espacio-tiempo gravitacio

nal plano que contienen parámetros no determinables mediante la

observación.

Pero, por supuesto, hay quienes se oponen a esta solución al

enigma de Poincaré. ¿Porqué deberíamos creer que la teoría más

simple, aun cuando la noción de simplicidad pueda resultar coheren

te, es la que deberíamos aceptar como verdadera para el mundo?

¿Qué nos asegura que la simplicidad, no importa cómo se interprete,

debe ser tomada como una señal de la verdad de una teoría? Por su

puesto, podríamos preferir la teoría más simple por su atractivo esté

tico, pero ¿porqué debería tomarse la complejidad como una señal

de falsedad, equiparable a la incapacidad de la teoría para ajustarse a

los datos observacionales? ¿Deberían tales consideraciones como la

simplicidad de una teoría contribuir a su credibilidad para alguien

que adopta la postura realista de que hay un mundo independiente

de nuestras teorías sobre él y de que las teorías describen o no genui-

namente este mundo?

Opciones reduccionistasOpuestos a todos estos enfoques del problema de Poincaré se en

cuentran los enfoques que intentan socavar el desafío escéptico ne

gando que realmente haya teorías alternativas entre las que debamos

elegir. Si consideramos que la propia identidad de una teoría debe

ser determinada por sus consecuencias observacionales, entonces ¿no

llegamos a la conclusión de que todas las supuestas teorías alternati

vas son realmente una y la misma teoría y que parecen diferir entre sí

solamente porque han elegido expresar las mismas vindicaciones so

bre el mundo en un lenguaje diferente?

La idea subyacente es clara. Seguramente, se dice, podemos en

tender casos en los que dos expresiones de la teoría entran aparente

mente en conflicto entre sí, de forma que parece que las dos no pue


den ser correctas, pero donde el conflicto es sólo aparente: es el re

sultado de utilizar los mismos términos con significados diferentes en

las dos expresiones de la teoría. Si, por ejemplo, alguien propusiera

una teoría de la electricidad que fuese exactamente igual a nuestra

teoría ordinaria, pero donde se intercambiasen las palabras «positiva»

y «negativa» concernientes a las cargas, nos daríamos inmediatamente

cuenta de que no se había propuesto ninguna teoría nueva. En lugar

de ello, se había repetido la misma vieja teoría con los significados de

dos palabras clave intercambiados. Supongamos, entonces, que pos

tulamos que todo el contenido real de una teoría está implícito en

sus consecuencias observacionales y que dos teorías cualesquiera con

las mismas consecuencias observacionales equivalen a una sola teo

ría. Las diferencias aparentes entre las dos expresiones de la teoría se

deberían realmente a meras diferencias en los significados de algunos

de los términos involucrados.

Se ha propuesto una enorme variedad de explicaciones «positi

vistas» semejantes de la teoría y del significado teórico. Algunas veces

se ha sugerido que los términos de una teoría, para tener un significa

do auténtico, deben recibir una definición individual acuñada entera

mente en el vocabulario que hace referencia a los observables. Si te

nemos dos teorías aparentemente incompatibles con las mismas

consecuencias observacionales, podríamos determinar qué términos

en las dos formulaciones de la teoría difieren en el significado. Por

ejemplo, podría argüirse que el hecho de que los rayos de luz reco

rran geodésicas nulas en la relatividad general equivale a definir la

«geodésica nula» en esta teoría como la trayectoria de un rayo de luz.

En la teoría del «espacio-tiempo plano más fuerzas» los rayos de luz

no recorren geodésicas nulas. Así pues, se arguye, «las geodésicas nu

las» deben significar algo diferente en esta nueva formulación de la

teoría. Algunas otras versiones del caso requieren que cualquier pro

posición de la teoría pueda ser traducida a una expresada solamente

en términos observacionales. Hay todavía otros que encuentran estas

demandas de estricta definibilidad de los términos o de traducibili-

dad frase por frase demasiado severas. Para estos teóricos es la teoría

como un todo lo que tiene significado y este significado se agota en

la totalidad de sus consecuencias observacionales. Así, en el caso de

las teorías gravitacionales con espacio-tiempos curvo versus plano, ar

güirían que carece de sentido preguntar por los términos que han

cambiado de significado de una teoría a otra. Alternativamente, argu


yen, podrías decir que todos lo han hecho, salvo aquellos que se re

fieren a los fenómenos observables. Lo que uno puede decir, empero,

es que, como las dos teorías tienen las mismas consecuencias obser

vacionales, consideradas como un todo «dicen la misma cosa».

Los enfoques reduccionistas de este tipo menoscaban claramente

el problema escéptico de la teoría sobrepasando los datos. Desde

este punto de vista, el rebasamiento de lo observable es sólo ilusorio.

Algunas veces se dice que el dar a una teoría preferencia frente a

otra que es observacionalmente equivalente a ella es, en realidad, ele

gir solamente una manera de expresar una teoría. Algunas veces se

alega que es como elegir un sistema de coordenadas para describir la

localización de los sucesos, en lugar de otro. Al realista, para quien

las teorías pueden diferir en simplicidad y, por lo tanto, en lo que di

cen y, quizá, en su grado de credibilidad intrínseca, esta gente le res

pondería que una tal diferencia en simplicidad es solamente una di

ferencia en la simplicidad de la forma de expresión. No es una

diferencia real de simplicidad como, por ejemplo, la que se da entre

una función lineal y una cuadrática relacionando lo observable a lo

observable. El elegir una de las alternativas observacionalmente equi

valentes sobre las demás es entonces una mera elección de cómo ex

presar las propias creencias teóricas. Según esta concepción, las

creencias teóricas no son en realidad más que compendios lingüísti

camente pertinentes de la totalidad de sus consecuencias observacio

nales. Aunque no está del todo claro lo que Poincaré pretendía decir

al afirmar que la elección de la geometría es convencional, quizá fue

ra esto lo que tenía en mente.

La objeción más seria a este enfoque de las teorías es adonde nos

conduce cuando se lleva a su —casi inevitable— extremo. Cuando

dos teorías que aparentemente dicen cosas bastante incompatibles

acerca de la estructura de lo inobservable se considera que son, de

hecho, completamente equivalentes entre sí, es evidente que uno no

debería tomar lo que dicen sobre los inobservables de un modo cla

ramente referencial. Si una teoría que afirma que el espacio-tiempo

es curvo se considera que es completamente equivalente a una que

afirma que el espacio-tiempo es plano, entonces claramente ambas

teorías están utilizando solamente la referencia al espacio-tiempo

como medio instrumental para generar su contenido real, el orden le

gal entre los observables que predicen. Uno no debería entonces

tomar dicha conversación sobre el espacio-tiempo como referida real


mente a un objeto al que se atribuye alguna característica. Para ver

esto, uno sólo tiene que considerar el hecho de que si dos expresio

nes cualesquiera de teorías con un mismo contenido observacional

son enteramente equivalentes, entonces el simple compendio de las

consecuencias observacionales comunes a las dos teorías es equiva

lente a las dos. Y esta tercera «teoría» no se refiere en absoluto a las

entidades y estructuras teóricas (como el espacio-tiempo y su curva

tura). El hecho de que dicho compendio de consecuencias observa

cionales pudiera ser una colección infinita de afirmaciones no parece

ser, desde esta perspectiva positivista radical, relevante para la de

manda irrealista.

Pero, entonces, el considerar suficiente la equivalencia observa

cional para la equivalencia total parece entrañar un irrealismo radical

sobre lo inobservable. Toda referencia, excepto a lo que es directa

mente accesible a la inspección observacional, es pseudorreferencia,

y toda descripción de la estructura de lo inobservable se convierte en

una mera forma de hablar y no en una descripción cabal de una su

puesta parte real del universo. Si dicha referencia al espacio-tiempo y

a su estructura es completamente ficticia, ¿es igualmente ficticia la re

ferencia a los electrones? Y, si seguimos la familiar vía filosófica de

considerar como directamente observable sólo lo que consiste en

datos sensoriales de la percepción directa y no de características físi

cas de las cosas físicas, ¿no nos vemos conducidos a la concepción de

que todo el mundo físico es una ficción? Sin duda, un irrealismo tan

radical sobre lo físico es un precio demasiado alto para evitar el desa

fío escéptico a nuestro conocimiento de la estructura geométrica ac

tual del mundo.

Otras respuestas realistasMuchos realistas, en respuesta a estas consecuencias del enfoque po

sitivista que acabo de esbozar, han argüido que el error fundamental

del positivismo es su idea de que la equivalencia observacional de las

teorías es suficiente para su equivalencia total. A estos realistas les

gustaría admitir que, en ocasiones, teorías aparentemente incompati

bles «dicen la misma cosa» en realidad. Pero negarán que el tener

consecuencias observacionales comunes sea suficiente para la equiva

lencia total. Si, dicen, las teorías tienen la misma estructura a nivel


tcorico, de forma que una teoría puede ser obtenida a partir de la

otra por un intercambio término a término (como el intercambio en

tre «positivo» y «negativo» en la teoría de la electricidad mencionado

más arriba), entonces es correcto decir que las teorías son equivalen

tes. Sin embargo, cuando tienen las mismas consecuencias observa

cionales pero difieren en su estructura a nivel teórico, no deberían

ser consideradas como equivalentes. Esto es lo que sucede, se alega,

en nuestros familiares casos espacio-temporales. La relatividad espe

cial no es igual estructuralmente a las teorías compensatorias del éter,

según revela el hecho de que un número infinito de teorías del éter

diferentes corresponden al único espacio-tiempo de Minkowski. Y la

relatividad general no es igual estructuralmente a las alternativas de

«espacio-tiempo plano más fuerzas» porque, de nuevo, el único espa

cio-tiempo relativista general se corresponde con un número infinito

de posibles alternativas al mismo. Esto solamente reitera la afirma

ción de que las teorías relativistas son preferibles a sus alternativas en

razón de una simplicidad de tipo estructural. No necesitamos, pues,

suponer que las teorías relativistas son simplemente equivalentes a

sus alternativas, porque no necesitamos aceptar la demanda de los

positivistas de que la equivalencia observacional implica equivalencia

total.

El regreso a esta perspectiva realista nos lleva claramente de

vuelta a las cuestiones planteadas anteriormente sobre cómo pode

mos elegir de manera razonable entre las teorías ahora equivalentes,

pero indistinguibles observacionalmente. También nos conduce a la

cuestión de cómo, para el realista, obtienen su significado los térmi

nos teóricos de una teoría. La mayoría de los realistas suscriben la

idea de que primero adquieren significado los términos de nuestro

discurso asociados con los elementos de la experiencia observacio

nal, y que los otros términos de la teoría reciben su significado por

alguna relación que presentan con los términos observacionales (aun

que otros negarían incluso tan limitado «precedente semántico» al

vocabulario observacional). Un enfoque realista familiar consiste en

argüir que los términos teóricos obtienen cualquier significado que

presenten simplemente por el papel que desempeñan en el entrama

do de leyes en la teoría que finalmente conduce a consecuencias ob

servacionales. La idea ahora es que mientras los términos observacio

nales adquieren su significado con independencia del papel que

estén desempeñando en la teoría, los términos teóricos ganan cual


quier significado que tengan de su papel como ocupantes de una po

sición en la estructura teórica. Así, el significado de «geodésica nula»

está determinado enteramente por el lugar que ese término ocupa en

las leyes de, pongamos, la relatividad general.

A menudo se defiende que dicha teoría sobre el significado de

los términos teóricos no es incompatible con el realismo acerca de

las entidades y propiedades teóricas. El significado de «geodésica nu

la», por ejemplo, está determinado por el papel desempeñado por

este término en la teoría del espacio-tiempo. Pero eso no significa

que no existan geodésicas nulas. Si la teoría es correcta, existirán. Se

rán cualquier cosa a la que haga referencia el término «geodésica nu

la». El problema es que es muy fácil inventar referencias sustitutas de

los térmihos para que las teorías sigan siendo correctas, aun cuando

los términos ya no hagan referencia a lo que considerábamos que

eran las entidades y características teóricas reales. Uno podría, por

ejemplo, interpretar todos los términos teóricos de la teoría del espa-

cio-tiempo, no ya referidos a lo que visualizaríamos intuitivamente

como figuras espacio-temporales, sino referidos más bien a objetos

abstractos tales como números. La teoría sería entonces reinterpreta-

da en el sentido de afirmar que es posible asignar números a las enti

dades y características observables de manera tal que, siguiendo las

reglas de las matemáticas, se podría inferir la validez de ciertas regu

laridades legales entre los observables, pero sólo de esas regularida

des que se siguen de la teoría del espacio-tiempo original como com

prendidas de una manera realista. El discurso sobre entidades y

características teóricas se convierte entonces en un discurso sobre có

mo podemos integrar un comportamiento observable en una estruc

tura abstracta que tiene consecuencias para el orden y la regularidad

entre los observables. Siempre que uno adopte una concepción de

los términos teóricos del tipo «su significado es dado solamente por

su papel en la teoría», dichas reconstrucciones «representacionistas»

de la teoría incomodarán al realista.

Por esta razón, algunos realistas quisieran argüir que los términos

teóricos, incluyendo los que hacen referencia a estructuras espacio-

temporales, adquieren significado de algún otro modo. En este punto

se recurre con frecuencia a las analogías de significado con términos

observables. Las moléculas, se dice, son descritas como partículas, y

sabemos lo que significa «partícula» por las partículas observables.

Así pues, sabemos algo acerca del significado de «molécula» que nos


asegura que, sea lo que sean las moléculas, no son objetos abstractos

como los números. Quizá la analogía de una trayectoria como estruc

tura espacio-temporal con una trayectoria constituida por algún tipo

de sustancia material nos permita acceder al significado de términos

espacio-temporales más allá de su papel en la predicción del compor

tamiento local de los objetos materiales.

Concepciones pragmáticasLas opciones que hemos explorado no agotan todas las posibles reac

ciones que uno podría tener ante enigmas del tipo que Poincaré nos

ha planteado. Algunos filósofos han intentado argumentar que los de

bates entre realistas y antirrealistas descansan todos en confusiones.

Algunos de estos argumentos regresan al escepticismo que comenta

mos anteriormente acerca de la posibilidad de hacer de las conse

cuencias observables una clase distinguida de las consecuencias de

una teoría. Otros se apoyan en una afirmación en el sentido de que

preocupándose por cuál de las posibles teorías alternativas es la ver

dadera uno anda desorientado. Quizá existan varias descripciones al

ternativas que merezcan todas, en función de algún conjunto de posi

bles datos observacionales, ser denominadas «razonables de creer».

Supongamos que consideramos estas descripciones verdaderamente

incompatibles, no sólo reduciéndolas a simples variantes lingüísticas,

como los positivistas nos harían hacer. Si elegimos una de estas teo

rías, declararemos verdaderas sus consecuencias y falsas las conse

cuencias de las teorías rivales incompatibles con ella. Si hubiésemos

elegido alguna de las otras alternativas, habríamos, claro está, cambia

do nuestra valoración de cuáles aserciones eran verdaderas y cuáles

falsas, pero habríamos sido igual de razonables. Pero, ¿qué es de

todos modos la verdad? ¿No es simplemente una forma de caracteri

zar, al nivel de conversación sobre proposiciones, eso mismo que ex

presaríamos utilizando las propias proposiciones, en el sentido de

que declararemos verdaderas todas y sólo aquellas proposiciones que

estamos dispuestos a afirmar? Quizá Poincaré estuviera en lo cierto

al afirmar que la geometría del mundo era una cuestión de conven

ción en el sentido de que nos corresponde a nosotros elegir una de

las opciones razonables a nuestra disposición y, una vez hecho esto,

declarar «verdaderas» sus consecuencias.


Pero ¿qué sucederá si la opción que elegimos no se conforma

realmente con la manera de ser del mundo? En este punto, algunos

se vuelven escépticos ante la sola idea de un mundo independiente

de la teoría al que las teorías corresponden, o no. El que dicha con

cepción, unas veces asociada con el pragmatismo, otras denominada

«realismo interno», constituya realmente una opción firme, una que

no se reduzca al escepticismo o a alguna clase de reduccionismo po

sitivista, sigue siendo una cuestión abierta.

ResumenEn cualquier caso podemos ahora ver cómo los desarrollos en las

matemáticas puras y en la física teórica han cambiado radicalmente

nuestras posturas, tanto ante la geometría, como ante el lugar que

ésta ocupa en nuestro cuerpo de conocimientos. Durante siglos la

geometría fue vista como el prototipo de una teoría que parecía

aportarnos hechos significativos sobre el mundo en el que vivíamos;

podíamos conocer las verdades geométricas, y conocerlas con certe

za, pues eran derivables por medio de una cierta inferencia lógica de

primeros principios cuya verdad era autoevidente. La geometría era

el paradigma del conocimiento en general. Sólo con ser lo suficiente

mente inteligentes, podríamos conocer todas las verdades acerca del

mundo, así como conocíamos las geométricas. Más tarde, como he

mos visto, cuando la corriente empirista llevó a la mayoría de los filó

sofos a afirmar que sólo podíamos conocer el mundo por medio de

la generalización e inferencia de los datos fundamentales de la obser

vación y el experimento, la geometría pareció seguir siendo la excep

ción a esta regla general, una excepción cuya naturaleza especial re

quería una explicación tal como la que Kant apuntó.

Con el descubrimiento de una multiplicidad de geometrías axio

máticas lógicamente consistentes, y la posterior generalización allen

de éstas a las geometrías curvas multidimensionales de Riemann, y

allende éstas a las geometrías imaginadas en el estudio de la topolo

gía y de la estructura diferencial de los espacios (en las que no hemos

entrado), el estatus de la geometría como cognoscible sin el apoyo de

la observación o del experimento fue seriamente cuestionado. Este

cuestionamiento se hizo mucho más significativo con el descubri

miento en el siglo xx de, primero, los nuevos espacio-tiempos esen


ciales para el tratamiento relativista del comportamiento de la mate

ria y de la luz y, después, de la capacidad de invocar el espacio-tiem

po curvo como una teoría de la gravedad en la teoría general de la

relatividad. ¿No parecía, pues, que el conocimiento de la geometría,

como el de todas las otras teorías del mundo, descansaba en la obser

vación y el experimento?

Pero, según hemos visto, esto es demasiado simple. Ciertamente

parece que, bajo la perspectiva moderna, la geometría deviene muy

similar a las otras teorías físicas fundamentales, generales, pero funda

das observacionalmente, del mundo. Según hemos visto, sin embargo,

justamente la reflexión acerca del modo en que los resultados obser

vacionales pueden o no determinar por nosotros qué geometría del

mundo deberíamos razonablemente creer, nos revela el grado al que

la geometría, como toda teoría física fundamental, sobrepasa la sim

ple generalización de los datos que un crudo empirismo tomaría

como modelo de inferencia a teorías.

Cómo responder a la posibilidad de reconciliar una diversidad

de geometrías con cualesquiera datos observacionales posibles es,

como hemos visto, una cuestión muy problemática. Podríamos adop

tar una postura realista y mostrarnos simplemente escépticos sobre

qué geometría describe realmente el mundo. O podríamos intentar

encontrar reglas metodológicas para una creencia razonable, reglas

que nos llevasen a elegir una de las muchas geometrías alternativas

como la única razonablemente más creíble. O podríamos intentar

evitar el desafío escéptico e invocar un argumento reduccionista en

el sentido de que todas las geometrías alternativas, cuando se las

complementa con las teorías físicas necesarias para hacerlas —cada

una a su manera— compatibles con los datos observacionales, son

realmente equivalentes entre sí. Finalmente, podríamos intentar me

noscabar la pulla del problema de la «infradeterminación de la geo

metría por cualesquiera datos posibles» negando algunas de sus pre

misas sobre la distinción entre lo «en principio observable» y lo «en

principio inobservable», o desafiando la suposición implícita de una

única teoría verdadera que se corresponde con un mundo real inde

pendiente de la teoría.

La geometría ha planteado una vez más problemas a nuestra teo

ría del conocimiento en general. Estos problemas de infradetermina

ción teórica son problemas generales que deben ser afrontados por

todo el que quiera entender cómo se puede fundar racionalmente


una teoría del mundo en toda su generalidad, incluyendo su referen

cia a entidades y estructuras consideradas inmunes a la observación

directa, sobre los limitados datos obtenibles a partir de la experiencia

observacional.

¿Qué clase de entidad tiene el espacio-tiempo?

Como hemos visto, es imposible explorar problemas acerca de nues

tro conocimiento del espacio y el tiempo sin entrar en cuestiones del

ser, asuntos denominados metafísicos. Un enfoque positivista1 del sig

nificado de las teorías, diseñado para combatir el problema de infra-

determinación identificando el contenido de una teoría con el conte

nido de sus consecuencias observacionales, demandará una actitud

irrealista hacia las entidades y características postuladas aparente

mente por la teoría al nivel no-observable. Pero hay muchas otras

cuestiones de índole metafísica que, si bien en algún momento pue

den plantear problemas epistemológicos, no están fundadas inicial

mente en cuestiones sobre el conocimiento. Muchas de estas cuestio

nes son muy específicas del estudio del espacio y el tiempo, aunque,

como veremos, su consideración sacará a menudo a la luz cuestiones

más amplias de la metafísica.

Tiempo y serConsideremos, por ejemplo, las doctrinas tradicionales que conectan

el tiempo y el ser. Para algunas, parecía intuitivamente obvio que

sólo lo que existía ahora, existía realmente. El futuro todavía no ha

bía llegado a existir y el pasado había cesado de existir. Solamente de

las entidades que existían en el presente se podía decir, propiamente

hablando, que existían realmente. Para otras, era el pasado y el pre

sente los que eran reales, y el futuro irreal. Aquí la idea intuitiva era

que el pasado y el presente, habiendo ya llegado a ser o sucedido, te

nían una realidad determinada. Lo que eran, era un hecho incuestio

nable. De acuerdo a esa idea, el futuro era el reino de lo que todavía

no había llegado a ser. No tenía ninguna realidad determinada. Des

pués de todo, siguiendo el curso del pensamiento, si era un hecho

determinado ahora que algún suceso futuro tuviera una realidad, en


tonces ¿cómo podría haber un espacio para decidir cuáles serían

nuestras acciones futuras, por ejemplo, si ya era el caso ahora, y ha

bía sido siempre el caso, que lo que haremos mañana es ya un hecho

determinado hoy? Lo que aquí se discute no es la cuestión del deter

minismo, de si los sucesos pasados y presentes fijan o no, mediante

sus conexiones legales con otros sucesos, qué sucesos futuros de he

cho ocurrirán. La cuestión es, más bien, la afirmación de que si los

acontecimientos futuros tienen una realidad pasada y presente (si fue

ra un hecho ahora que yo compraré un helado mañana), entonces el

futuro no podría estar abierto en ningún sentido a la posibilidad.

A tales intuiciones se oponían las concepciones en el sentido de

que cualesquiera de dichas supuestas conexiones del tiempo al ser

eran meras ilusiones del lenguaje. Pasado, presente y futuro, se ar

güía, eran igualmente reales.

No consideramos que sea motivo para negar realidad a las cosas

el que no estén aquí, donde nos encontramos nosotros, así que ¿por

qué deberíamos considerar como motivo para negar su realidad el

que no estén existiendo en el momento en que hablamos o pensa

mos sobre ellas? Pensaríamos, por ejemplo, que es absurdo defender

que las cosas situadas detrás de nosotros o en el lugar que ocupamos

son reales, mientras las cosas situadas frente a nosotros carecen de

una verdadera realidad, así que ¿porqué no habríamos de considerar

igualmente absurdo postular realidad al pasado y al presente, pero

negársela a las realidades futuras?

Vinculadas a estas cuestiones se encuentran varias otras sobre las

que sólo podremos hacer observaciones muy breves. A veces se alega

que el tiempo es radicalmente diferente del espacio: mientras el espa

cio puede ser concebido correctamente desde un punto de vista

«aperspectivo», un entendimiento adecuado de la temporalidad de

las cosas requiere un punto de vista perspectivo. Podríamos, se argu

ye, describir todos los fenómenos espaciales de dos maneras igual

mente apropiadas. Podríamos asignar a cada una de las localizaciones

espaciales un nombre coordenado y decir dónde ocurrieron las cosas

especificando su localización mediante esta nominación perspectiva.

O podríamos especificar el lugar en el que algo ocurrió en relación a

«aquí», el lugar en el que nos encontramos ubicados.

Si intentamos el mismo truco con el tiempo, nos vemos descon

certados. La información aportada al decir cuándo ocurrieron las

cosas, incluso en relación unas a otras, ¿suministra completamente


todos los aspectos temporales de lo que ocurrió? Algunos dicen que

no. Supongamos que damos la fecha en la que Julio César murió y la

fecha del día de hoy. Supongamos que añadimos el hecho de que la

fecha de la muerte de César es anterior a la actual, entendiendo «es

anterior a» como una relación primitiva entre tiempos. Cuando haya

mos dicho todo eso, ¿hemos dicho todo lo que hay que decir, tempo

ralmente, sobre la muerte de César? La afirmación de que no lo he

mos dicho descansa en la idea de que cuando decimos que «César

murió», o cuando especificamos en alguna otra forma que la muerte

de César pertenece al pasado, estamos haciendo más que especificar

que ocurrió, pongamos, antes de 1989. Ese último hecho es «atem-

poralmente verdadero», pero-el hecho de que César murió no fue

verdad hasta que lo hizo, aun cuando el hecho de que la muerte de

César es (atemporalmente) anterior a 1989 sea, en cierto sentido,

siempre verdad.

¿No podríamos, sin embargo, captar la «preteridad» de la muer

te de César diciendo que ocurrió antes que ahora? Por supuesto, se

responde; pero «ahora» es el nombre del presente y, al plantear las

cosas de esta forma, hemos reintroducido una tensión esencial en

nuestra descripción temporal de las cosas. Aquellos que niegan que

haya algo esencialmente diferente entre el tiempo y el espacio en

este sentido responden que «ahora» es una palabra igual que

«aquí». La referencia de dichas palabras, algunas veces llamadas

símbolos reflexivos o coordinativos, varía con su uso. Cada uso de

«aquí» se refiere al lugar en el que se ubica el locutor. De manera

similar, cada uso de «ahora» se refiere al momento en el que se ha

ce la alocución. ¿Hay algo más misterioso en torno a «César murió»,

aparte del hecho de que la muerte de César es (atemporalmente)

anterior a 1989 y que ahora es 1989, que en torno al hecho de que

una supernova tuvo lugar a alguna distancia de la tierra y aquí es en

la tierra?

Sí, responde el proponente de la concepción de que hay algo ra

dicalmente diferente sobre el tiempo que lo distingue del espacio.

Mientras las cosas que existen en el espacio en otros lugares que

aquí existen, las cosas que no existen ahora no existen en absoluto.

«Ahora» no es un mero indicativo, insisten; es el término que selec

ciona (en cualquier momento) ese instante de tiempo que es el ins

tante en el que las cosas existen, el cual es, claro está, ¡el momento

presente! Así, este debate en torno a la tensión esencial del tiempo


revierte, una vez más, en la idea agustiniana de que solamente lo que

existe ahora existe realmente, hablando con propiedad.

Consideraciones relativistasEs obvio que la reestructuración radical del espacio y el tiempo en el

espacio-tiempo postulado por la teoría especial de la relatividad ha

de tener un fuerte impacto en este debate. ¿Qué sucede con la afir

mación de que «sólo lo que existe ahora existe verdaderamente», si

los sucesos que son simultáneos para un observador ocurren en tiem

pos diferentes para un observador en movimiento con respecto al

primero, aun cuando los dos observadores coincidan momentánea

mente? El propio significado de «ahora» se ha vuelto problemático.

Al menos ha pasado a ser una cuestión relativa a exactamente qué

sucesos están ocurriendo «ahora».

Supongamos que dos observadores coinciden en el suceso e, pero se encuentran en movimiento uno respecto al otro. Habrá suce

sos como el suceso a que son posteriores a e para el primer observa

dor pero simultáneos con e para el segundo. Pero entonces, ¿cómo

podríamos decir que a es irreal para el primer observador si a es real

para el segundo observador en el instante considerado (siendo simul

táneo con e para este segundo observador) y si el segundo observa

dor es sin duda real en el suceso e para el primero? La situación es

todavía peor que esto. Un suceso en relatividad puede ser posterior

al suceso e o «absolutamente posterior» al suceso e. Hablamos de

«absolutamente posterior» cuando el suceso, b, es posterior a e y pue

de conectarse causalmente a él por alguna señal viajando a igual, o a

menor, velocidad que la de la luz. Para sucesos como a, que no son

conectables causalmente con e, a será posterior a e, simultáneo con e, o anterior a e para diferentes observadores. Pero todos los observa

dores coincidirán en que b, que es absolutamente posterior a e, es

posterior a e. Sin embargo, todavía puede darse el caso de que haya

un observador para quien el suceso e' de su propia vida sea simultá

neo con b, pero tal que e sea simultáneo con e para el primer obser

vador. Así, el primer observador declarará la vida del segundo obser

vador en e real en e, y el segundo observador declarará b real en e . ¿Cómo podría, pues, el primer observador pensar que b, en su futuro

absoluto, es irreal en e?


Los argumentos aquí están diseñados para convencer al lector de

que la aceptación del espacio-tiempo de la relatividad hace irrisoria

la concepción tradicional de que «solamente lo que está presente

ahora es real». Se arguye que la relatividad es claramente compatible

sólo con la concepción alternativa que considera todos los sucesos,

pasados, presentes y futuros, como igualmente reales, al igual que tra

dicionalmente consideramos todo lo que sucede en el espacio, don

dequiera que suceda, como igualmente merecedor de ser llamado

real. Si pasado, presente y futuro son tan relativos a los estados de

movimiento como la teoría especial de la relatividad considera que

son, ¿cómo podríamos pensar que la realidad varía con el lugjr tem

poral de un suceso en relación con un suceso actual en la vida del

agente en cuestión?

Pero, por supuesto, esto no es tan sencillo. La tentativa de ex

traer una conclusión metafísica de una teoría científica requiere mu

cho más cuidado del que nosotros hemos puesto hasta ahora. Uno

podría, formalmente, defender las viejas doctrinas de la irrealidad de

todo menos el presente, pese a aceptar la relatividad, negando sim

plemente que «es real» es una noción enteramente transitiva. Si «es

simultáneo» tiene la característica en relatividad de que e puede ser

simultáneo con e para el observador uno, b simultáneo con e para el

observador dos, pero b no simultáneo con e para ninguno de los ob

servadores (característica que ciertamente posee), entonces ¿porqué

no deberíamos relativizar «es real a» en la misma forma, de manera

que aunque e es real a e para el observador uno y b real a e para el

observador dos, b no es real a e para ninguno? De manera que nin

gún observador en el suceso e declarará nunca que b es un suceso

real con independencia de cuál sea su estado de movimiento cuando

se encuentre coincidiendo con e.Una respuesta más interesante procede en principio buscando las

fuentes de la intuición de que el pasado y el futuro son irreales. Uno

de los motivos de esa concepción, aunque ni mucho menos el único,

es el alejamiento epistémico del pasado y del futuro respecto al pre

sente. Es una idea común que el presente se nos «presenta» directa

mente en la experiencia, pero que lo que sucedió en el pasado y en

el futuro sólo puede ser conocido por inferencia a partir de la expe

riencia presente (incluyendo tales experiencias como «tener el recuer

do de que tal y tal suceso ocurrió»). Tal como vimos en «¿Cómo co

nocemos la verdadera geometría del mundo?» el estatus ontológico


de lo inferido se pone frecuentemente en duda. Hay argumentos di

señados para arrojar una duda escéptica sobre la adecuación de cual

quier pretensión de conocer la verdad de una proposición cuya ver

dad sólo puede conocerse indirectamente y por medio de un proceso

inferencial. Si uno basa la afirmación de irrealidad del pasado y del

futuro en su alejamiento del tipo de cognoscibilidad que el presente

tiene para nosotros, entonces una forma de preservar la intuición de

que el pasado y el futuro son irreales en el contexto relativista se ha

ce evidente.

Cuando examinamos los fundamentos de la teoría de la relativi

dad, vimos que está fundada en un examen crítico de nuestro conoci

miento sobre sucesos distantes de nosotros en el espacio. En ese argu

mento crítico descansaba la original crítica de Einstein a la noción

intuitiva de simultaneidad para sucesos distantes. El desarrollo de lo

que se ha sugerido en las observaciones anteriores sugiere una lectura

metafísica apropiada a la relatividad a alguien que quiera defender la

concepción de que el pasado y el futuro son irreales. Es negar la reali

dad del otro lugar tanto como la del otro tiempo, considerando que

sólo tiene realidad auténtica lo que coincide con el lugar-tiempo de

uno como observador. Ahora bien, dicha reducción de lo real a un

punto del espacio-tiempo es incluso peor que retener la realidad sólo

para el momento ínfimo de tiempo que es el ahora. Huelga decir que

no estoy defendiendo semejante disminución radical de lo que vemos

como real. Lo que se está afirmando, no obstante, es que el ímpetu y

las intuiciones que subyacen a la anterior actitud irrealista hacia el pa

sado y el futuro no pueden ser descartados simplemente señalando la

relatividad de las nociones de pasado y futuro respecto al estado de

movimiento del observador en un espacio-tiempo relativista. El lector

interesado en las cuestiones de porqué alguien defendería semejante

dramático irrealismo sobre el pasado y el futuro en primer lugar, y

porqué, en el contexto relativista, personas aparentemente sanas po

drían verse tentadas al irrealismo aun más radical sobre el otro lugar

deberá dirigirse a las obras más detalladas acerca de estas cuestiones.

Sustantivismo versus relacionismo

Un tópico con posibilidades bastante más sustanciales es el impacto

de las teorías relativistas en el debate entre los sustantivistas y los re-


lacionistas que ya introduje anteriormente. Como veremos, las cues

tiones aquí son diversas, sutiles y complejas. Pero como también ve

remos, resulta, una vez más, que uno debe tener cuidado con la ten

dencia a inferir prematuramente una concepción metafísica de los

resultados de la ciencia. El tratar de llegar a alguna conclusión filosó

fica acerca de la existencia y naturaleza del espacio y del tiempo exa

minando lo que nos dicen las mejores teorías científicas disponibles

sobre el espacio y el tiempo es una tarea digna de consideración.

Pero es algo que requiere una dosis notable de cautela y prudencia

filosófica.

Los relacionistas negaban que uno debiera postular el espacio y

el tiempo como entidades por derecho propio, arguyendo que lo más

que podía postularse eran las relaciones espaciales que los objetos

materiales presentan entre sí y las relaciones temporales que los suce

sos materiales presentan entre sí. Tras el desarrollo de la teoría espe

cial de la relatividad, se aseguraba normalmente que Einstein había

completado finalmente el programa relacionista leibniziano. Pero

estas vindicaciones llamaban a engaño. Aunque la teoría especial nos

dice que algunas de las características del mundo que una vez

tomamos por absolutas son realmente relativas, esto no es en absolu

to lo mismo que decir que el relacionismo es correcto. En la descrip

ción del espacio y el tiempo por Newton, hay una separación defini

da, no relativa, espacial y temporal entre dos sucesos cualesquiera.

En la teoría de la relatividad, dichas separaciones son solamente rela

tivas a una elección de sistema de referencia inercial y difieren en

función del sistema elegido. Pero dicha relatividad no tiene nada que

ver con que, a fin de dar cuenta de los fenómenos observables, deba

mos postular el espacio y el tiempo o, ahora, el espacio-tiempo, como

estructuras sobre y por encima de las cosas y características materia

les del mundo. También debería indicarse de paso aquí que aunque

la relatividad especial convierte en relativas algunas nociones previa

mente no relativas, introduce nuevas características, no relativas, de

su propia cosecha. El intervalo espacio-temporal de separación entre

los sucesos es, en la teoría especial, una relación absoluta entre los

sucesos y es independiente de cualquier observador, como lo es el

tiempo propio transcurrido a lo largo de una trayectoria específica en

el espacio-tiempo de un suceso a otro.

Si el argumento de Newton a favor de una concepción sustanti-

vista del espacio-tiempo, que él utilizó con gran acierto contra Leib-


niz, luese correcto, entonces la relatividad especial parecería ser una

teoría que postula asimismo un espacio-tiempo sustantivista. Como

hemos señalado, la distinción, tan importante en el argumento new-

toniano, entre sistemas inerciales con movimiento verdaderamente

uniforme y sistemas absolutamente acelerados se conserva en la teo

ría especial de la relatividad. En la nueva teoría, los sistemas inercia

les son, como lo eran en la teoría newtoniana, aquellos en los que no

se experimentan fuerzas inerciales. Pero ahora también se distinguen

por ser los estados de movimiento en los que los experimentos ópti

cos de ida y vuelta dan sus famosos resultados nulos. La distinción

entre estar realmente en movimiento acelerado o no, central al argu

mento de Newton contra el relacionismo, se conserva en la teoría es

pecial de la relatividad.

¿Significa esto que si aceptamos la teoría especial, debemos

aceptar la postura metafísica del antirrelacionista newtoniano (con,

claro está, el espacio-tiempo minkowskiano, en lugar del espacio ab

soluto de Newton, como la estructura del espacio-tiempo sustanti

vista)? ¿Necesitamos todavía un «espacio-tiempo mismo» en rela

ción al cual la aceleración absoluta es aceleración y cuya existencia

se presupone como parte de la explicación de la existencia de fuer

zas inerciales y de los efectos ópticos que ponen de manifiesto la

aceleración absoluta? Quizá, pero de nuevo sería precipitado pasar

sin una reflexión ulterior de una teoría científica a una conclusión

metafísica. ¿No podríamos encontrar alguna forma de reconciliar la

relatividad especial con una descripción relacionista del espacio-

tiempo?

Quizá. Pero las cuestiones filosóficas involucradas son complejas,

sutiles y problemáticas. Hay argumentos diseñados para mostrar que

el programa sustantivista de postular el espacio-tiempo como una en

tidad necesaria para explicar la distinción entre movimientos absolu

tamente acelerados y los no acelerados en absoluto falla y que las ex

plicaciones ofrecidas son espurias. Las fuerzas inerciales y los efectos

ópticos de la aceleración se explican por referencia a la aceleración

del laboratorio respecto a «sistemas de referencia inerciales» del es

pacio-tiempo mismo, los cuales ocupan en la relatividad especial el

lugar del «espacio mismo» de Newton. Pero las mismas estructuras

del espacio-tiempo permanecen, en algún sentido, inmunes a la ob-

servabilidad directa, manifestándose sólo indirectamente en términos

ile los efectos causales del movimiento con respecto a ellas. ¿No po


demos explicar todo lo que hay que explicar sin presuponer el espa

cio-tiempo mismo?

Ahora podemos explicar las diferencias entre los efectos inercia-

les percibidos en dos laboratorios por referencia a sus aceleraciones

relativas entre sí. «Pero», dice el sustantivista, «no puedes explicar

porqué en un conjunto de estos sistemas no se siente ningún efecto

inercial en absoluto, siendo estos efectos sentidos solamente en los

laboratorios en aceleración con respecto a estos laboratorios preferi

dos. Yo», dice él, «puedo explicar porqué estos sistemas son preferi

dos. Son los que no están acelerados con respecto al espacio-tiempo

mismo». El relacionista puede contraargurrientar afirmando que, si

bien no puegle explicar porqué un conjunto de estos sistemas es pre-

ferencialmente inercial, puede simplemente tomar esto como un «he

cho incuestionable básico de la naturaleza» que sencillamente nunca

podrá explicarse. Después de todo, puede decir, debe haber algunos

hechos incuestionables fundamentales, así que ¿porqué no éstos?; y

pasa a argüir que el sustantivista requiere hechos incuestionables en

cualquier caso. Para el sustantivista es un hecho incuestionable de la

naturaleza que la aceleración con respecto a las geodésicas inerciales

del espacio-tiempo induce los efectos inerciales. Así pues, defiende el

relacionista, el sustantivista no está mejor provisto de términos ex

plicativos que el relacionista, pero el primero debe postular la miste

riosa entidad del «espacio-tiempo mismo», que no ejerce ninguna

función explicativa real. Y una vez más, siguiendo a Leibniz, el rela

cionista producirá una serie de argumentos en el sentido de que la

concepción sustantivista postula otros hechos, como el que hace refe

rencia a la posición del espacio-tiempo en la que ocurre un suceso

particular, que no tienen ninguna consecuencia observable. Así pues,

continúa el relacionista, la postulación del espacio-tiempo mismo in

troduce «diferencias en la teoría sin una diferencia observacional».

Tales diferencias en la teoría fueron una de las características proble

máticas del espacio mismo de Newton.

Hay muchas otras características problemáticas a ambos lados

del argumento. De hecho, como en cualquier debate metafísico en fi

losofía, los mismos términos en los que el debate se plantea son su

mamente problemáticos. ¿Comprendemos realmente lo que el sustan

tivista está afirmando que debemos postular a fin de explicar los

fenómenos observables? ¿Entendemos realmente lo que el relacionis

ta está negando y lo que está poniendo en su lugar? En particular,


¿podemos realmente comprender completamente en qué difieren los

dos enfoques? Comentaré sólo brevemente estas cuestiones más ade

lante.

La propuesta de Mach y la relatividad generalPor el momento, sin embargo, volvamos a la propuesta de Mach por

la que una explicación alternativa de los famosos efectos inerciales,

aceptable desde un punto de vista relacionista, podría ser posible

después de todo. ¿No podríamos suponer que las fuerzas inerciales, y

ahora también los efectos ópticos inerciales, no eran el resultado de

la aceleración de los aparatos prueba respecto al espacio mismo o, en

el caso relativista, respecto a la estructura geodésica inercial del espa

cio-tiempo de Minkowski, sino, más bien, respecto a la materia cós

mica del universo? Después de todo, en la teoría del electromagnetis

mo estamos familiarizados con fuerzas magnéticas que dependen de

las velocidades que las partículas cargadas tienen unas respecto a

otras. ¿No podría haber igualmente fuerzas dependientes de la acele

ración entre trozos de materia ordinaria? Si estas fuerzas dependieran

muy poco de la separación de las cosas entre sí, pero fueran suma

mente dependientes de las cantidades de materia involucradas, ¿no

sería posible explicar los efectos inerciales como el resultado de la

aceleración del objeto prueba respecto a lo que Mach llamó las «es

trellas fijas», y lo que nosotros ahora denominaríamos la materia dis

tante de los supercúmulos de galaxias que constituyen la materia cós

mica del universo?

Aunque la relatividad especial no proporciona un contexto apro

piado para las ideas machianas, quizá la relatividad general sea más

prometedora en esta dirección. Después de todo, ésta se ocupa de la

gravedad, una fuerza de largo alcance. La gravedad newtoniana evi

dentemente no podría proporcionar el tipo de interacción de largo

alcance, dependiente de la aceleración, que Mach postuló como res

ponsable de los efectos inerciales, pero quizá, si la gravedad se recon

ciliase con la relatividad al modo de la nueva teoría del espacio-tiem

po curvo de la gravedad, se obtendría una teoría de índole machiana.

De hecho, Einstein se vio sin duda motivado por semejantes expecta

tivas cuando comenzó la investigación que condujo a la teoría gene

ral de la relatividad.


Si Mach tuviera razón al postular que los efectos inerciales son el

resultado de la interacción del sistema prueba con la materia restante

del universo, ¿cuáles serían algunas de las consecuencias de ello? Pri

mero, consideremos las primeras observaciones de Newton sobre lo

que sucedería en un universo vacío. Desde el punto de vista newto

niano, debería existir una distinción entre un objeto que está girando

y uno que no está girando, aun cuando el objeto prueba fuese el úni

co objeto en el universo. El giro se pondría de manifiesto por los

efectos inerciales sobre el objeto prueba generados por el movimien

to absoluto. Mach duda de que debiéramos pensar siquiera en uni

versos vacíos. El universo, dice, nos es dado solamente una vez,

«completo con las estrellas fijas-intactas». Esto podría significar que

no tenemos forma de inferir a partir de lo que observamos lo que su

cedería en el caso de un universo radicalmente diferente, o podría

implicar la afirmación más fuerte de que, dado que las leyes de la na

turaleza son meramente compendios de lo que de hecho ocurre en el

mundo tal como es, no tiene ningún sentido hablar sobre lo que su

cedería en un universo radicalmente diferente al actual. Sea como

fuere, podríamos sin duda preguntar a una teoría como la relatividad

general, capaz de describir la gravedad en muchas clases diferentes

de mundos posibles, si sus predicciones para un universo vacío se

guirían marcando, como las de Newton, una distinción entre objetos

absolutamente giratorios y objetos no giratorios, o si esa distinción

desaparecería en este mundo — sin la materia cósmica de Mach

como sistema de referencia para el movimiento absoluto.

Esperaríamos que, en un mundo machiano, los efectos inerciales

generados sobre un objeto prueba variarían cuando la materia del

universo en torno al objeto se modificase radicalmente, ya que los

efectos inerciales son el resultado de la interacción entre los sistemas

prueba y la materia circundante. ¿Predice esto la teoría general de la

relatividad? No debería existir diferencia alguna entre hablar de un

objeto en un mundo machiano en rotación junto a una materia cir

cundante no rotatoria, y hablar, en su lugar, de la materia rotatoria al

rededor del laboratorio prueba, pues, según Mach, es sólo la acelera

ción relativa entre el sistema prueba y la materia lo que determina las

fuerzas inerciales detectadas. ¿Es esto lo que predice la teoría de la

relatividad? Por último, si Mach tiene razón, sería absurdo hablar de

la materia del universo como, de por sí, en rotación absoluta. Si los

efectos de la rotación en el sistema prueba son debidos a su movi


miento respecto a la materia cósmica, entonces sería imposible que

hubiera efectos debido a que la materia cósmica estuviese, de por sí,

en rotación absoluta, pues eso significaría una rotación de esta mate

ria respecto a sí misma, lo cual es absurdo. ¿Qué tiene la teoría de la

relatividad que decir sobre esto?

Algunos de los primeros trabajos con la relatividad general mos

traron aspectos machianos de la teoría. Es sin duda cierto que lo que

un objeto prueba en movimiento acelerado experimenta dependerá

de la distribución general de materia en el universo, pues, en la relati

vidad general, la aceleración absoluta es la desviación del movimiento

de las geodésicas curvas, de tipo temporal, locales del espacio-tiempo.

Y como la curvatura global del espacio-tiempo está correlacionada

con la distribución de materia en el espacio-tiempo, un cambio radi

cal de la cantidad o distribución de la materia cósmica tendrá un

efecto en las fuerzas inerciales generadas por el movimiento local. De

nuevo, en la relatividad general puede mostrarse que un objeto que

está de suyo en reposo, pero se encuentra circundado por materia en

alta rotación, experimentará fuerzas similares a aquellas que habría

experimentado el objeto prueba si hubiera sido puesto en rotación y

la materia circundante hubiera permanecido en reposo.

Pero si uno mira más allá, la teoría parece distanciarse cada vez

más de lo que Mach hubiera deseado. Aunque los efectos inerciales

se ven modificados por la distribución cambiante de la materia exte

rior en el mundo, es como si hubiera un efecto inercial básico debi

do a la rotación absoluta al que los nuevos efectos modificadores se

fueran añadiendo. En otras palabras, incluso en un universo exento

de materia exterior, la relatividad general predice una distinción en

tre estar en rotación absoluta y no estarlo. Determinar a qué se ase

meja el espacio-tiempo en un mundo relativista general requiere la

especificación de condiciones de contorno para el espacio-tiempo,

del mismo modo que encontrar a qué se asemeja un campo eléctrico

requiere más que conocer las cargas que están presentes. La suposi

ción habitual que se hace en relatividad general, al menos en univer

sos abiertos, es que el espacio-tiempo distante de la materia es plano,

el espacio-tiempo de Minkowski. Un espacio-tiempo razonable para

un universo vacío, pues, sería justamente este espacio-tiempo plano

de Minkowski de la relatividad especial. Pero, entonces, en un tal

mundo, la vieja distinción newtoniana entre rotación absoluta y au

sencia de rotación seguiría conservando su valor. De hecho, la relati


vidad general permite espacio-tiempos vacíos todavía más extraños.

La curvatura del espacio-tiempo tiene su propia auto-energía gravita

cional. Es posible, pues, tener una curvatura distinta de cero en un

universo vacío, o que haya regiones de espacio-tiempo curvo cuya

desviación de la planaridad no esté sustentada por ninguna materia,

sino simplemente por la auto-energía de la región de espacio-tiempo

curvo. Por lo tanto, la idea de Mach de que en un mundo vacío no

habría efectos inerciales no es válida en la relatividad general.

De nuevo, si bien la materia en rotación en torno a un objeto ge

nera efectos inerciales, puede verse que la situación se desvía de lo

que Mach esperaría. Si un objeto prueba está circundado por dos ci

lindros girando uno respecto al otro y respecto al objeto prueba, lo

que uno experimenta en el laboratorio dependerá, no solamente de

las rotaciones relativas implicadas, sino también de aquello en torno

a lo que el cilindro está «realmente girando», contrariamente a las ex

pectativas machianas. Lo más dramático de todo fue el descubrimien

to por K. Gódel de que hay mundos posibles consistentes con la rela

tividad general en los que toda la materia del universo está en

rotación. No es como si esa materia fuese alguna gigantesca esfera

cósmica, rígida, en rotación. Eso sería relativistamente imposible.

Pero en este mundo, un observador en cualquier lugar, cuyo labora

torio estuviese en reposo con respecto a la materia cósmica, podría

realizar un experimento para probarse a sí mismo que estaba rotando

junto con toda la materia. Para cada observador hay un plano espe

cial. Si el observador lanza partículas libres o rayos de luz a lo largo

de ese plano, éstas siguen trayectorias espirales en el sistema de refe

rencia fijo en la materia cósmica. Esto indica que esta materia está en

rotación, así como la trayectoria de una partícula que se mueve en lí

nea recta a partir del centro sobre un disco de fonógrafo que gira so

bre un tocadiscos trazará una raya espiral sobre el disco. Así que es

como si cada observador pudiera considerarse a sí mismo fundamen

tal para la rotación de la materia cósmica. Para un machiano esto pa

rece absurdo, pero es una posibilidad consistente con la relatividad

general, revelando una vez más los aspectos no machianos de esa teo

ría. (Véase la figura 2.10.)

Existen tentativas de hacer la relatividad general más machiana.

Algunas de las objeciones a una interpretación machiana de la relati

vidad general descansan en el hecho de que la distribución de mate

ria no siempre es suficiente para determinar completamente la es-


F i g u r a 2.10. La rotación absoluta de la materia en el universo de Gódel. En una solución

a las ecuaciones de la relatividad general hallada por K. Gódel es plausible decir de

la materia informe del universo que está en «rotación absoluta». ¿Qué significa esto? En cualquier punto hay un plano con la siguiente característica: Fijemos las coordenadas x e y en el plano de manera que esté en reposo en relación a la materia informe del universo. Ahora emitamos desde el punto o una partícula o rayo de luz libre, a. En las coordenadas en reposo en la materia, la partícula o rayo de luz describirá

una trayectoria espiral a medida que la partícula o rayo de luz se aleje de o. Si consideramos a las partículas y rayos de luz libres en movimiento rectilíneo en relación a algún marco de referencia «absoluto», es «como si» la materia informe estuviera rotando en relación a ese marco.

tructura del espacio-tiempo, y por lo tanto, no es adecuada para de

terminar completamente qué efectos inerciales del movimiento existi

rán. En universos que son siempre espacialmente cerrados, sin em

bargo, hay un nexo más estrecho entre la distribución de materia y la

estructura espacio-temporal, de manera que sólo una estructura espa

cio-temporal es compatible con la distribución completa de materia.

Así, se ha propuesto, la versión machiana de la relatividad general es

una donde el espacio-tiempo tiene el cierre apropiado. Pero esto está

muy lejos del relacionismo duro de Mach.


Más sobre la relatividad general y el debate entre sustantivistas y relacionistasDe hecho hay aspectos de la teoría del espacio-tiempo en la relativi

dad general que hacen que comencemos a preguntarnos si la distin

ción entre el relativismo y el sustantivismo, tal como se entendían

tradicionalmente, es coherente. Hemos observado que, en la relativi

dad general, el espacio-tiempo mismo tiene energía-masa. Pero la

energía-masa es el aspecto característico fundamental de la materia

tal como se entiende normalmente. ¿Podemos entonces hablar acerca

de «relaciones entre la materia» versus «el espacio-tiempo mismo», si

la distinción entre materia y espacio-tiempo es en sí misma problemá

tica?

Antes incluso de que la teoría general de la relatividad plantease

las cuestiones que acabamos de discutir, era evidente que la distin

ción entre sustantivismo y relacionismo según la interpretación tradi

cional estaba sometida a una cierta tensión. A finales del siglo XIX, el

concepto de «campo» pasó a ser esencial en la física. A fin de poder

tratar los hechos de la electricidad y el magnetismo, por ejemplo, se

hizo necesario añadir a los elementos de la naturaleza productos bas

tante diferentes de las partículas materiales familiares de la física an

terior. Entidades como el campo eléctrico se conciben como extendi

das por todo el espacio, con intensidades diferentes en diferentes

puntos espaciales. Éstas tienen una evolución dinámica en el tiempo.

«Objetos» físicos tales como los campos son esenciales para la teoría

física estándar. Pero, claramente, son algo muy diferente de los obje

tos materiales localizados presupuestos por el relacionista. En mu

chos sentidos se parecen más al «espacio mismo» del sustantivista

que a las partículas materiales ordinarias. Cuando uno considera lo

mucho que debe modificarse la propia concepción que uno tiene so

bre lo que existe cuando se admiten los campos en la imagen física

del mundo, parece claro que el fracaso en los términos del debate

sustantivista-relacionista había ya comenzado con la introducción de

las cantidades tipo campo en la física.

Si dirigimos la atención a un aspecto diferente de la relatividad

general, vemos otra forma en que la existencia de nuestra teoría fun

damental del espacio-tiempo afecta al debate tradicional entre sustan

tivistas y relacionistas. El problema del determinismo en la física es

enormemente complejo. El científico del siglo xvm P. S. de Laplace


es famoso, por haber afirmado que, dada la verdad de la imagen me

cánica newtoniána del mundo, la especificación del estado del mun

do en un tiempo dado determinaba su estado en todos los tiempos

futuros, porque las leyes de la naturaleza generaban a partir de ese

estado todos los estados que se seguían necesariamente en tiempos

posteriores. Pero todo lo que tiene que ver con la cuestión de si

estaba en lo cierto, de si el mundo es realmente determinista, se vuel

ve complejo y problemático.

Para empezar, hay algunos problemas filosóficos. Como B. Rus-

sell señaló, si dejamos que la noción de «estado del mundo» sea lo

bastante amplia y la noción de «ley de la naturaleza» lo bastante fle

xible, el determinismo se convierte en una doctrina trivial, pues, no

importa cómo fuese el mundo, podríamos simplemente tomar como

leyes las proposiciones que dicen cuáles estados siguen de hecho a

cuáles otros. Supongamos que contamos con alguna forma de evitar

estas trivializaciones exigiendo que las leyes verdaderas satisfagan

condiciones más estrictas. Muchos problemas científicos se siguen de

ello. Incluso en la mecánica newtoniana, hay problemas con el deter

minismo. Si nos ocupamos de partículas puntuales con una intensi

dad de interacción que se hace infinita cuando las partículas se apro

ximan a una distancia cero, resulta imposible seguir los estados

deterministamente a través de las colisiones de las partículas. De

nuevo, si especificamos el mundo en un tiempo dado, puede que el

futuro esté influido por una partícula que «llega del infinito» después

de ese instante, obstaculizando la determinación del futuro por el

estado total en el tiempo en cuestión.

Cuando pasamos primero a la relatividad especial y luego a la ge

neral con sus nuevos espacio-tiempos, surgen muchas cuestiones aún

más complejas. Los estados del mundo «en un instante» son una

cuestión relativa en la relatividad especial. En la relatividad general,

puede que ni siquiera sea posible seccionar el espacio-tiempo del

mundo en «espacios en un instante», por lo que la misma noción de

estado del mundo en todo lugar en un tiempo dado podría dejar de

tener sentido. El modelo de una posible influencia causal en estas

teorías es, por supuesto, más complejo de lo que lo era en las teorías

newtonianas, y la complejidad de la estructura causal conduce a im

portantes e interesantes problemas matemáticos sobre cómo caracte

rizar qué mundos son deterministas en los sentidos que uno puede

dar al término. En la relatividad general surge otro problema debido


a la posibilidad (y, a menudo, la inevit íjj^des en

el espacio-tiempo. El big bang en el que COT;^feé-»««Strjdîrêrso es-

pacio-temporal (si es que existe) es una ae~ôw gff̂ mfejlaridades,

como lo serían las que se encuentran en el centro de los~«enomina-

dos agujeros negros. Estas singularidades son puntos de espacio-tiem

po donde la curvatura se hace infinita. Su presencia en el espacio-

tiempo bloquea la capacidad de predecir a su través los estados

posteriores del mundo a partir de los anteriores. Introducen, pues,

una forma de indeterminismo en la imagen.

La misma conexión entre determinismo y predictibilidad que, se

gún Laplace suponía, significaba más o menos lo mismo, es también

problemática. ¿Implica el decir que el mundo es determinista <}ue es

predecible, al menos en principio? Muchos han argüido que semejan

te implicación no es válida. Después de todo, el determinismo dice

que el estado del mundo en un tiempo dado fija, por las leyes de la

naturaleza, los estados en otros tiempos. Pero si no podemos conocer

el estado completo del mundo en un tiempo dado, como una cues

tión de principio fundamental, el mundo podría ser determinista,

pero no predecible. El espacio-tiempo de Minkowski tiene esta natu

raleza. El estado completo del mundo en un espacio (respecto a un

sistema inercial) puede muy bien fijar el estado del mundo en espa

cios posteriores. Pero para cualquier observador dado, puede darse

el caso de que nunca pueda acumular la información sobre el estado

del mundo en todo un «espacio en un tiempo», porque la informa

ción que recibe es la que puede alcanzarle causalmente desde el pa

sado, y ésta está restringida a la que se encuentra dentro de su cono

pretérito de luz. Esto es, sólo puede obtener información sobre suce

sos en el pasado que puedan ser conectados con él en el presente

por señales causales desde el pasado. Por esta razón y, como vere

mos, por otras también, la identificación demasiado precipitada del

determinismo con la predictibilidad es ingenua. No obstante, si el de

terminismo y la predictibilidad están enteramente desligados, resulta

muy difícil resolver el problema planteado por Russell de encontrar

una forma de restringir lo que puede considerarse como estado y

como ley de manera que la cuestión del determinismo no se reduzca

a una trivialidad.

En el capítulo 3 volveremos al tema del determinismo. En él exa

minaremos cómo la sensibilidad del desarrollo de un sistema a sus

condiciones iniciales exactas ha llevado a algunos a negar el determi-


nismo en el mundo. ¿Qué tipo de mundo determinista puede darse

si incluso un cambio infinitesimal en el estado inicial de un sistema

puede conducir a cambios enormes en su desarrollo futuro? En el

capítulo 4 exploraremos algunas de las cuestiones del determinismo

y el indeterminismo que surgen en el contexto aun más radical de la

mecánica cuántica. Ahí veremos porqué algunos han alegado que si

la mecánica cuántica describe verdaderamente el mundo, el determi

nismo debe ser radicalmente falso.

Pero por el momento quiero centrarme en un argumento concer

niente al determinismo en la teoría general de la relatividad, un argu

mento diseñado para defender una clase de relacionismo leibniziano

defendiendo que si interpretamos la relatividad general en una forma

enteramente sustantivista, debemos considerarla como una teoría in

determinista — cuyo indeterminismo es sorprendentemente peculiar.

Algunos de los argumentos más eficaces de Leibniz contra el sustan

tivismo descansaban en la suposición de que cada punto del espacio

era exactamente igual a cualquier otro y cada dirección en el espacio

igual a cualquier otra. Así pues, el mundo material desplazado del lu

gar en el espacio en el que realmente estaba sería cualitativamente

idéntico al mundo tal como es. No habría una razón suficiente para

que estuviera en un lugar del espacio y no en otro. Y el mundo apa

recería exactamente igual a cualquier observador, sin importar dónde

se encontrase el mundo material en el espacio.

Esto deja de ser cierto en la relatividad general, pues el espacio-

tiempo puede ahora tener una estructura que varía de un lugar y

tiempo a otro lugar y tiempo. El desplazamiento de la materia ordi

naria a través del espacio-tiempo sería muy diferente en un mundo

en el que la curvatura (el campo gravitacional) varía de una posición

espacio-temporal a otra. Pero puede reconstruirse algo parecido al ar

gumento leibniziano donde el desplazamiento de la materia a través

del espacio se acompaña de un desplazamiento compensatorio en la

propia estructura espacio-temporal.

Una consecuencia de esto es un problema indicado por Einstein

y llamado el problema del «agujero». Tomemos una pequeña región

del espacio-tiempo desprovista de materia. Supongamos que la distri

bución de materia y la estructura del espacio-tiempo fuera de la re

gión es cualquier cosa que queramos. Entonces, estructuras espacio-

temporales que parecen diferentes unas de otras en ?1 agujero son

igualmente compatibles, según las leyes de la relatividad general, con


la inexistencia de materia en el agujero y la distribución de materia y

espacio-tiempo fuera del mismo. Hay una forma de leer este resulta

do que intenta rebatirlo afirmando que sólo dice que la estructura en

el agujero puede ser descrita por medio de sistemas coordenados al

ternativos. Pero si tomamos seriamente las posiciones puntuales del

espacio-tiempo, seguramente parte de la lectura sustantivista de la

teoría, hay una manera de entender este resultado que dice que, no

importa cuán pequeño sea el agujero, hay estructuras de espacio-

tiempo genuinamente diferentes en él compatibles con la estructura

de espacio-tiempo y materia circundante. Este es el nuevo tipo de in

determinismo que, se alega, se impone a uno cuando uno se aferra a

la lectura sustantivista de la nueva teoría del espacio-tiempo.

Evidentemente, la discusión se termina aquí. Queda un largo ca

mino por recorrer antes de haber seleccionado cuáles son las innu

merables cuestiones diversas entre relacionistas y sustantivistas de va

rios tipos. Y hay muchos aspectos de las teorías físicas ordinarias del

espacio-tiempo que también deben ser mejor entendidas. Hasta que

los dos aspectos, el filosófico y el físico, de las cuestiones no se hagan

más claros y más precisos, será imposible decir qué lectura metafísica

se adapta mejor a lo que la física ordinaria nos dice sobre el espacio

y el tiempo del mundo. Las cuestiones aquí son importantes, pues los

argumentos teóricos que subyacen a la crítica del sustantivismo y a la

defensa del relacionismo, y la oposición a estos argumentos por parte

de los sustantivistas, son utilizados de manera similar en otros deba

tes filosóficos.

Relaciones espacio-temporales y relaciones causalesHemos venido explorando el debate entre aquellos que consideran

el espacio-tiempo como la entidad fundamental del mundo y aque

llos que toman solamente las relaciones espacio-temporales entre las

cosas y los sucesos materiales como constitutivos de la realidad espa-

cio-temporal del mundo. Otro grupo de cuestiones importantes con

cernientes a la naturaleza de la realidad espacio-temporal gira en tor

no a la relación entre las características espacio-temporales y causales

del mundo. Existe una estructura causal entre los sucesos del mun

do. Algunos sucesos causan a otros o, al menos, son causa parcial de

otros, necesitando a otros sucesos que junto con ellos sean suficiente

12H Filosofía de la física

para causar el suceso efecto. Hay profundas e importantes relaciones

entre lo que tomamos como estructura espacio-temporal del mundo

y lo que tomamos como estructura causal entre los sucesos. Estas re

laciones fueron percibidas mucho antes del descubrimiento de las

teorías relativistas, pero adquirieron una gran importancia cuando la

atención de los filósofos se dirigió hacia las cuestiones concernientes

a lo que las teorías relativistas nos dicen sobre la naturaleza de nues

tro mundo. Particularmente importantes son un grupo de afirmacio

nes en el sentido de que la estructura causal entre los sucesos es la

estructura real entre ellos, la estructura física más fundamental cons

titutiva de la realidad. Desde la perspectiva de estas afirmaciones,

las relaciones espacio-temporales son reales solamente en la medida

en que pueden ser reducidas a, o definidas en términos de, relacio

nes causales. Pero dichas afirmaciones resultan ser complejas y su

tiles.

Quizá la primera conexión entre nociones causales y espacio-tem-

porales de este tipo fue hecha por Leibniz. Supongamos que unos su

cesos son causa de otros sucesos por medio de señales enviadas a lo

largo de una trayectoria espacio-temporal continua desde un suceso

anterior a otro posterior. Supongamos, como hacíamos antes de la re

latividad, que estas señales pueden viajar a cualquier velocidad que

queramos, siempre y cuando la velocidad sea finita. Entonces, cual

quier suceso podrá conectarse a cualquier otro suceso por alguna se

ñal causal, a no ser que los dos sucesos ocurran exactamente al mis

mo tiempo. ¿No podríamos «definir» entonces la noción «x es

simultáneo con y» por la noción «x no es causalmente conectable a

y»? De hecho, ¿no podríamos decir que lo que significa para un suce

so ser simultáneo con otro significa para los sucesos no ser causal

mente conectables entre sí?

Ahora examinemos lo que sucede en la teoría de la relatividad.

Dado que hay una velocidad máxima de propagación de una señal

causal, la velocidad de la luz en el vacío, habrá muchos sucesos que

son causalmente conectables entre sí (y, por consiguiente, claramente

no simultáneos entre sí), todos los cuales se encuentran en el domi

nio de no ser causalmente conectable a un suceso dado. Parece,

pues, que en este caso no podríamos definir «x es simultáneo con y» como «x no es causalmente conectable a y» y deberíamos usar algún

otro método como, por ejemplo, el elegido por Einstein, usando se

ñales de luz reflejadas y relojes. De aquí hay solamente un paso a


afirmar que como la simultaneidad no puede definirse causalmente

como «no siendo causalmente conectable», la simultaneidad no es

una relación real en la relatividad, sino una cuestión de mera conven

ción o estipulación.

Para ver cuán problemática podría ser dicha afirmación, debe

mos examinar algunos descubrimientos hechos por el matemático

A. Robb poco después del descubrimiento de la relatividad por Eins

tein. Robb fue capaz de mostrar que hay una relación, definible usan

do solamente la noción de conectabilidad causal, que es válida entre

sucesos en el espacio-tiempo de la relatividad especial si, y solo si,

esos sucesos son simultáneos de acuerdo a la definición de simulta

neidad dada por Einstein. Así, «al mismo tiempo» es causalmente de

finible, auncfue la relación causal que define la simultaneidad sea una

relación más compleja, no la simple noción intuitiva de no ser causal

mente conectable utilizada por Leibniz. En realidad, Robb fue capaz

de ir mucho más lejos y mostrar que nociones tales como separación

espacial y separación temporal (relativas a un observador) pueden

también ser definidas en términos de la sola noción de conectabili

dad causal. (A decir verdad, Robb utilizó la noción de «después» en

su definición, donde esto significaba «absolutamente después» en el

sentido relativista, pero su trabajo puede ser reconstruido utilizando

la noción temporal-simétrica de conectabilidad causal.)

¿Significa esto que la simultaneidad y las otras nociones métricas

de la relatividad son reales y aconvencionales porque son reducibles

a nociones causales? Una vez más, las cosas no son tan simples. Su

pongamos que pasamos al contexto de la relatividad general, donde

son posibles una variedad de diferentes espacio-tiempos — no sólo el

espacio-tiempo de la relatividad especial. En algunos de estos mun

dos, varios de los postulados acerca de la estructura de las relaciones

causales entre los sucesos que Robb utilizó, dejan de ser válidos. En

tales mundos, es evidente que las definiciones dadas por Robb de las

relaciones espacio-temporales métricas en términos de las relaciones

causales no se pueden satisfacer. Incluso si los postulados de Robb

se satisfacen, es posible que sus definiciones fallen. Hay espacio-tiem

pos permitidos por la relatividad general en los que todos los postu

lados de Robb sobre la conectabilidad causal se satisfacen, pero son

tales que si uno utilizase las definiciones de Robb para las cantidades

métricas (como la simultaneidad y la separación espacial y temporal),

se asignarían valores a estas cantidades que diferirían de los que se


les asignan por la teoría de la relatividad general. Los valores asigna

dos utilizando las definiciones de Robb diferirían de los valores que

uno obtendría utilizando, pongamos, cintas de medir, relojes, y seña

les de luz reflejadas, al modo relativista habitual.

Parece que lo que en realidad está sucediendo aquí es lo siguien

te: es verdad que, en el espacio-tiempo de la teoría de la relatividad

especial, varias nociones métricas coinciden con nociones que pue

den ser definidas utilizando solamente la conectabilidad causal. Pero

parece mucho más dudoso afirmar que este hecho demuestra que las

nociones métricas espacio-temporales en ningún sentido, forma o ma

nera se reducen a, o son definibles mediante, las nociones causales.

Un símil puede aclarar esto aun más. Imaginemos un mundo en el

que encontramos que (quizá por accidente, quizá como resultado de

una ley de la naturaleza) todas las cosas azules son cuadradas y todas

las cosas cuadradas son azules. Esto, por sí mismo, no implica que lo

azul se reduce a lo cuadrado, o que es definible en sus términos, o a

la inversa.

Sin embargo, parece que hay algo de cierto en la afirmación se

gún la cual mientras el que los sucesos sean, o no, causalmente co-

nectables es un hecho fuerte de la naturaleza, la elección de qué

sucesos serán simultáneos unos con otros en la teoría de la relativi

dad parece entrañar un elemento de arbitrariedad o convencionali-

dad. ¿Podemos lograr una mayor comprensión de las ideas subya

centes?

Lo que tenemos hasta el momento es esto: en la física prerrelati-

vista, hay una asociación natural entre una noción causal (conectabili

dad acausal mutua) y la noción espacio-temporal de simultaneidad.

Algunos se ven inducidos a defender que la relación real en el mun

do es la relación causal, y que la simultaneidad es reducible a, o defi

nible en términos de, la relación causal. Cuando pasamos a la teoría

especial de la relatividad, esta asociación natural de relaciones causa

les y espacio-temporales se quiebra, llevando a algunos a afirmar que

la relatividad muestra cómo la simultaneidad es meramente conven

cional o estipulativa. Los resultados de Robb muestran que no sola

mente la simultaneidad, sino también todas las nociones espacio-tem

porales métricas de la relatividad especial, pueden ser definidas en

términos causales. Esto induce a algunos a afirmar que son aconven-

cionales. Pero una reflexión ulterior muestra que las definiciones

causales de Robb no dejan de ser peculiares. Las asociaciones que


utilizan no son tan naturales como las del tipo leibniziano y, en el

contexto relativista general, estas asociaciones generalmente pierden

validez. Los axiomas de Robb dejan normalmente de satisfacerse, y

aun cuando se satisfagan, las relaciones métricas, en la forma en que

Robb las define, difieren a menudo de las relaciones métricas están

dar. ¿Qué podemos inferir de todo esto?

Topología y estructura causal

Antes de responder a esta cuestión, exploremos cómo en el contexto

de la relatividad general encontramos una serie muy similar de argu

mentos; la serie, una vez más, trata de en qué medida puede darse

una definición causal a una relación espacio-temporal y de las su

puestas consecuencias filosóficas de la existencia o inexistencia de ta

les definiciones causales. Cuando se comenzó a estudiar la relativi

dad general se observó que dos espacio-tiempos relativistas generales,

métricamente diferentes, podían tener la misma estructura causal.

Esto es, aunque las relaciones espacio-temporales métricas entre los

sucesos en los mundos tuviesen una estructura bastante diferente, la

estructura de las relaciones causales entre los sucesos podía ser la

misma. Así, toda esperanza de una definición causal de la métrica se

vio frustrada. Para determinar completamente la estructura métrica

de un espacio-tiempo, uno debe añadir algo a la estructura causal.

Esto podría ser una estructura métrica espacial determinada por cin

tas de medir o una estructura métrica temporal determinada por re

lojes ideales. Más tarde, se vio que la especificación conjunta de la

estructura causal y de las trayectorias recorridas por las partículas

materiales, ideales, libres (esto es, partículas sobre las que sólo actúa

la gravedad) determinaba completamente la estructura métrica. Pero

las relaciones causales por sí solas no lo hacían.

Ahora bien, la topología de un espacio-tiempo constituye una es

tructura mucho más débil que su métrica. Dos espacio-tiempos pue

den ser topológicamente semejantes, es decir, semejantes en lo que

concierne a todas las cuestiones de continuidad en el espacio-tiempo

y, pese a ello, ser métricamente muy diferentes. Podemos imaginar

nos intuitivamente las características topológicas de un espacio como

esas características preservadas bajo cualquier deformación del espa

cio que conserve intactas las propiedades de continuidad. El espacio


F ig u r a 2.11. Espacio-tiempos causalmente patológicos. En eí espacio-tiempo con bucles causales cerrados — ilustrado en (a)— una señal causal puede dejar un suceso o y avanzar hacia el futuro. Siguiendo la señal, siempre hacia el «futuro local», trazamos una trayectoria que regresa al suceso causante o. Aun cuando no posea un tal bucle

cerrado, un espacio-tiempo puede ser bastante «patológico» desde un punto de vista

causal. Esto se ilustra en (b). Aunque ninguna señal desde o puede «regresar» a o mismamente, todavía puede suceder, para cada región espacio-temporal en torno a o con independencia de lo pequeña que sea, que una señal que parte de o y abandona una

región, e, pueda en algún momento regresar a ésta y así retornar «arbitrariamente cerca» del suceso causante o.

puede ser deformado de cualquier manera y su topología seguirá

siendo la misma siempre que ningún «corte» separe puntos situados

originalmente «uno al lado del otro» y ningún «pegado» una puntos

previamente separados. ¿Podrían las primitivas estructuras de conti

nuidad del espacio-tiempo, aquéllas descritas por la topología, ser

quizá causalmente definibles, aun cuando la estructura métrica total

no lo fuera? La respuesta es fascinante, si bien algo compleja. Si

tomamos como nuestra noción causal fundamental «el suceso x es

causalmente conectable al suceso y», resulta que la topología puede a

veces definirse mediante la conectabilidad causal, pero sólo en espa-

cio-tiempos «con un buen comportamiento causal». En espacio-tiem

pos «causalmente patológicos» no es así. ¿Qué es un espacio-tiempo

causalmente patológico? Básicamente, es cualquier espacio-tiempo

donde hay una curva causal cerrada, o donde un cambio infinitesi

mal en el espacio-tiempo podría generar una curva semejante. Dichas

trayectorias constituyen secuencias de sucesos causalmente conecta-


t0 = t0+At = t0 + 2At...

F ig u r a 2.12. Un universo «cerrado en el tiempo». Toma el espacio-tiempo ordinario de

Minkowski 3e la relatividad especial y «secciónalo» por dos lineas de simultaneidad

en relación a algún observador, una de dichas líneas en el tiempo t0 y la otra en el tiempo t0+At. En el diagrama t representa la dirección del tiempo y x la del espacio. Entonces «identifica» los dos bordes del trozo seccionado del espacio-tiempo de Minkowski y forma así un cilindro con esa pieza. E l resultado es un espacio-tjempo

«cerrado en el tiempo» pero extendiéndose al infinito espacial. Naturalmente, dicho

espacio-tiempo es sumamente artificial. Nadie considera que sea un modelo posible del espacio-tiempo real del mundo. Pero la consistencia que presenta con las ecuaciones definidoras de la teoría del espacio-tiempo sugiere que modelos más realistas del universo podrían muy bien contener bucles causales cerrados, como sucede en este

espacio-tiempo patológico.

dos que «se rizan en el tiempo» para regresar, o casi, al suceso inicial,

del que se había partido. Solamente en mundos con un grado especí

fico de buen comportamiento causal puede ser suficiente la conecta-

bilidad causal para especificar la topología. Esto se pone de manifies

to de forma muy drástica en ciertos espacio-tiempos topológicos con

una topología no trivial (algunos sucesos están «cerca» de otros suce

sos y algunos no lo están), pero donde todo suceso es causalmente

conectable con todo otro suceso. (Véase las figuras 2.11 y 2.12.)

Así pues, la situación no es muy diferente de la que examinamos

anteriormente. Solamente en ciertos casos, la noción causal indicada

será adecuada para definir las relaciones espacio-temporales desea

das. En otros casos, la definición no puede ser encontrada. Pero la si

tuación es todavía más complicada. Hemos venido tomando como

nuestra noción causal — a la que las nociones espacio-temporales han

de reducirse— la relación que un suceso tiene con otro cuando son

causalmente conectables. Una noción causal más rica es la de una

134 Filosofía de la tísica

trayectoria en el espacio-tiempo que es una trayectoria causal conti

nua. Si imaginamos una partícula puntual (o partícula de luz) viajan

do desde un punto del espacio-tiempo a otro, la trayectoria seguida

es una de dichas trayectorias causales continuas. El resultado es im

portante y puede ser establecido como sigue: Si dos espacio-tiempos

son exactamente iguales en sus estructuras de trayectorias causales

continuas, son exactamente iguales en su topología, al menos cuando

sólo se consideran los tipos estándar de topologías (las denominadas

topologías de variedades). La noción de conectabilidad causal dice

solamente que dos sucesos son conectables por una u otra trayecto

ria causal continua. Esta nueva noción causal requiere especificar cla

ramente qué fragmentos de trayectoria en el espacio-tiempo son ver

daderamente las trayectorias continuas causales. Lo que el resultado

dice es que todos los hechos topológicos sobre el espacio-tiempo es

tán completamente determinados una vez que se ha determinado

qué colecciones de sucesos en el espacio-tiempo constituyen trayec

torias continuas de propagación causal o, mejor dicho, que esto es

cierto cuando sólo se consideran las topologías estándar. Aquí tene

mos, pues, un resultado positivo en la relatividad general sobre la de-

finibilidad de al menos la topología por hechos causales solamente.

¿Son las características espacio-temporales reducibles a características causales?Pero, ¿cuál es la relevancia de todos estos resultados para nuestra

idea inicial de que los hechos causales que relacionan unos sucesos

con otros son los hechos reales o incuestionables sobre la estructura

del mundo? Recordemos que lo que el teórico causal quería defen

der era que en la medida en que los hechos del espacio-tiempo fue

ran hechos incuestionables, serían reducibles a hechos causales, y en

la medida ?n que los hechos del espacio-tiempo no fueran reducibles

en esta forma, no serían de ningún modo hechos reales, sino mera

mente el resultado de una elección o estipulación convencional por

nuestra parte.

Las cuestiones aquí son controvertidas, pero permitidme esbozar

una respuesta a estas afirmaciones. Una forma de abordar cuál es la

motivación intuitiva tras las teorías causales de las características del

espacio-tiempo se centra en la cuestión epistemológica de cómo lie-


gamos a conocer el espacio-tiempo del mundo. Aquí, como discuti

mos anteriormente, se arguye algunas veces que son aquellas caracte

rísticas que nos son accesibles por algún proceso directo de inspec

ción las que debemos tomar como hechos verdaderos sobre el mun

do espacio-temporal. Otras características, atribuibles al espacio-tiem-

po sólo eligiendo algunas hipótesis no testables directamente sobre la

estructura del espacio-tiempo, son consideradas bajo esta concepción

como una cuestión de convención, ya que ningún hecho observacio

nal, directamente inspeccionable, selecciona la correcta hipótesis por

nosotros. Tanto en la anterior versión leibniziana, como en las versio

nes relativistas modernas de las teorías causales del espacio-tiempo,

se supone que la influencia causal se propaga a lo largo de trayecto

rias continuas en el espacio-tiempo, que pueden ser recorridas por al

guna cosa material como una partícula. En Leibniz, por supuesto,

cualquier trayectoria espacio-temporal dirigida al futuro puede ser re

corrida en esta forma; en las versiones relativistas, sin embargo, sólo

aquellas trayectorias que representan una velocidad menor o igual a

la de la luz pueden ser recorridas así. Pero si una partícula puede re

correr dicha trayectoria, también puede hacerlo, en principio, un ob

servador.

Alguien podría, pues, argumentar como sigue: Las características

del espacio-tiempo determinables en un solo punto del espacio-tiem

po, como la simultaneidad de sucesos en un mismo lugar, son deter

minables por observación directa por nosotros. Por consiguiente,

éstas constituyen hechos incuestionables sobre el espacio-tiempo.

También nos son accesibles observacionalmente, en principio, he

chos sobre la continuidad de las trayectorias que son causales, esto

es, que son tales que un observador puede moverse a lo largo de la

trayectoria y comprobar directamente sus propiedades de continui

dad. Es por esto por lo que en la relatividad especial deberíamos

considerar la simultaneidad en un punto como un hecho incuestiona

ble, pero la simultaneidad de sucesos separados y otras características

métricas de tipo no puntual como cuestiones de convención. De nue

vo, la continuidad a lo largo de trayectorias causales debería ser con

siderada como una cuestión de hechos incuestionables. Cualquier

otro hecho topológico debe, bien reducirse a estos hechos, bien ser

considerado como convencional. Es por ello que es importante mos

trar que la continuidad de las trayectorias causales determina com

pletamente la topología en la relatividad general. Sólo entonces pode


mos estar seguros de que los hechos topológicos son todos (al estar

determinados enteramente por hechos topológicos directamente ac

cesibles) hechos incuestionables.

Si las teorías causales de las características espacio-temporales se

interpretan en esta forma, vemos que el llamar teorías causales a

estas teorías puede inducir a error. Para Robb, la conectabilidad cau

sal (en la forma de la relación «después») era la única relación legíti

ma sobre la que cimentar las características métricas de un espacio-

tiempo relativista especial. Para los teóricos causales de la topología

del espacio-tiempo, la continuidad a lo largo de trayectorias causales

es la única característica legítima del espacio-tiempo sobre la que ci

mentar todos los hechos topológicos. Pero estas características causa

les fundamentales son privilegiadas en esta forma no por ser hechos

sobre relaciones causales, es decir, sobre cómo los sucesos en el

mundo determinan, producen o provocan otros sucesos en el mun

do. Antes bien, son privilegiadas porque son las características del es

pacio-tiempo que podemos determinar como tales sin apoyarnos en

hipótesis que, al no poder ser comprobadas por ningún procedimien

to de inspección directa, están afectadas de una arbitrariedad que

sólo puede resolverse tomando una decisión arbitraria o conven

cional.

Desde esta perspectiva, no son los hechos causales los que son

fundamentales, sino un subconjunto limitado de los hechos espacio-

temporales. El orden espacio-temporal no puede ser reducido al or

den causal o definido por medio del orden causal. En lugar de ello,

toda la estructura espacio-temporal ha de reducirse a, o definirse por

medio de, el subconjunto limitado de hechos espacio-temporales que

están verdaderamente abiertos a nuestro acceso epistémico. De he

cho, en este punto, es probable que uno piense en las tentativas de

analizar la noción de causalidad que nos son familiares de la filosofía.

Habitualmente, se piensa en la causalidad como dotada de un aspec

to espacio-temporal. Hume, por ejemplo, al intentar decir a qué equi

valía la causalidad, insistió en que la continuidad espacio-temporal

era un elemento necesario para definir el proceso causal. Causa y

efecto tienen que ser, decía, «contiguos en el espacio y en el tiempo».

Naturalmente, debe haber algo más que la relación causal. Debe ha

ber lo que sea que constituye la determinación del efecto por la cau

sa. Pero, desde esta perspectiva, las características espacio-tempora

les, al menos algunas de ellas, son primitivas e irreducibles a la


causalidad propiamente dicha. En su lugar, la causalidad tiene como

parte de su análisis una relación espacio-temporal fundamental entre

sucesos.

El problema de las interconexiones entre causalidad y caracterís

ticas espacio-temporales del mundo difícilmente puede resolverse

mediante las breves observaciones realizadas más arriba. Nuestra

concepción del mundo como existiendo en el espacio y el tiempo y

nuestra concepción del mundo como gobernado por un proceso de

sucesos determinando otros sucesos, es decir, por causalidad, son dos

de las conceptualizaciones más profundas y amplias del mundo que

poseemos. Cómo se relacionan estos dos aspectos fundamentales del

mundo, y cuál es la dependencia entre uno y otro para su significado

e inteligibilidad, son temas actuales para una exploración filosófica

profunda.

En el capítulo 3 tocaremos una cuestión relacionada con las que

acabamos de discutir. Veremos cómo una característica especial del

tiempo, su asimetría, en el sentido de que el pasado y el futuro pare

cen radicalmente diferentes uno del otro de muchas maneras, es rela

cionada por muchos científicos y filósofos con otra asimetría funda

mental del mundo, la tendencia de los sistemas físicos a pasar de

estados ordenados a estados desordenados. La concepción de que el

desorden creciente del mundo es esencial a nuestras ideas sobre la

asimetría del tiempo y de los sistemas en el tiempo se coloca también

algunas veces, equivocadamente, en la categoría general de «teorías

causales de la estructura espacio-temporal». En realidad, la teoría en

cuestión no es en absoluto una teoría causal; es una afirmación adi

cional en el sentido de que una estructura espacio-temporal puede

ser reducida a una clase diferente de estructura, afirmación que exa

minaremos detenidamente en el capítulo 3.

ResumenHemos visto ahora que el problema del tipo de «ser» que se ha de

atribuir al espacio y al tiempo tiene una rica historia y un futuro pro

metedor. Las cuestiones metafísicas fundamentales mismamente tie

nen una estructura compleja y de largo desarrollo. El que hayamos

de concebir el espacio, por ejemplo, como una sustancia que existe

separada de los contenidos materiales del mundo, como un conjunto


de relaciones entre los objetos materiales del mundo, o como algo

completamente distinto, sigue siendo una cuestión abierta. También

hemos visto que la cuestión de si la espacialidad o la temporalidad

son reducibles de algún modo a algún otro aspecto del mundo, pon

gamos, a un aspecto causal, está asimismo por responder. Más impor

tóte aún, hemos visto que cada avance científico revolucionario en

nuestra comprensión del espacio y el tiempo lleva aparejado un nue

vo contexto en el que los debates filosóficos tienen lugar. Aunque los

l°§ros científicos por sí mismos no pueden resolver enteramente las

cuestiones metafísicas, cualquier tratamiento filosófico adecuado de

la naturaleza del espacio y el tiempo debe hacer plena justicia a estas

realizaciones científicas. *

Lecturas adicionales

Algunos libros que cubren los tópicos tratados en este capítulo con

mayor detalle y profundidad son Reichenbach (1956), el cual es muy

'Aportante históricamente, y Grünbaum (1973), el cual presenta una

cobertura enciclopédica. Van Fraassen (1970) es muy útil al presentar

el trasfondo histórico de muchas de las cuestiones importantes. Sklar

(1574) es una introducción sistemática a las cuestiones principales, y

Sklar (1985) se ocupa más ampliamente de algunos de los problemas.

Ffiedman (1983) introduce al lector al vocabulario técnico de la física

matemática moderna del espacio y el tiempo y ahonda en profundi

dad, asimismo, en la controversia filosófica.

Smart (1964) contiene importantes y breves extractos de los prin

cipales textos históricos. Jammer (1954) es un breve estudio histórico

de concepciones filosóficas sobre el espacio. Alexander (1956) contie

ne el debate original entre Leibniz y el newtoniano Clarke sobre la

naturaleza del espacio y el tiempo. Barbour (1989) es un estudio con

ciso de la historia de las ideas sobre el espacio, el tiempo y el movi

miento desde los griegos antiguos, pasando por Galileo, Huyghens,

Descartes, Leibniz y Newton. La teoría del espacio por Kant puede

hallarse en la primera parte de Kant (1950) y en la Estética Trascendental de Kant (1929).

Las introducciones a la teoría especial de la relatividad y su espa-

cio-tiempo abundan. Taylor y Wheeler (1963) es excelente, al igual

que Bohm (1989). Moller (1952), Synge (1956), y Rindler (1977) son


todos de utilidad. Toretti (1983) y Lucas y Hodgson (1990) tienen

una orientación filosófica e histórica, al igual que Anderson (1967).

También hay numerosas introducciones a la teoría general de la

relatividad. Geroch (1978) aporta lo fundamental. Meller (1952),

Rindler (1977), Anderson (1967), y Wald (1984) son todos clásicos en

la materia. Misner, Thorne y Wheeler (1973) es enciclopédico. Toretti

(1983) es histórico y filosófico. Einstein et al. (1923) contiene la tra

ducción al inglés de los artículos originales en la materia.

Para la historia de la epistemología de la geometría, véase Toretti

(1978). Los artículos originales de Poincaré se encuentran en Poinca

ré (1952). Eddington (1920) presenta una temprana y estimulante dis

cusión. Reichenbach (1956) es un clásico del convencionalismo. Dis

cusiones generales recientes pueden encontrarse en Sklar (1974) y

Friedman (1983).

Un útil estudio de cuestiones filosóficas sobre el tiempo se en

cuentra en Newton-Smith (1980). Una buena introducción a las cues

tiones del tiempo y sus estadios es Mellor (1981). Para una discusión

de los estadios del tiempo en el contexto de la relatividad especial

véase Rietdijk (1966), Putnam (1967), el capítulo 11 de Sklar (1985), y

Stein (1991).

La cuestión del sustantivismo versus relacionismo en las teorías

del espacio-tiempo se examina exhaustivamente en Earman (1989).

La historia de este tema es tratada con gran detalle en Barbour

(1989). Friedman (1983) y Nerlich (1976) ofrecen argumentos a favor

del sustantivismo. Una discusión general de las cuestiones se presen

ta en el capítulo 3 de Sklar (1974). La «geometrodinámica» se discute

ampliamente desde una perspectiva filosófica en Graves (1971).

Una discusión completa del determinismo se encuentra en Ear

man (1986). El papel del determinismo en el argumento del «aguje

ro» en la relatividad general se trata en Earman (1989). La estructura

de la causalidad en la relatividad general es estudiada (desde un pun

to de vista muy avanzado) en Hawking y Ellis (1973). Algunas refle

xiones filosóficas sobre teorías causales del espacio-tiempo se en

cuentran en van Fraassen (1970) y en los capítulos 9 y 10 de Sklar

(1985). Respecto a la teoría causal del espacio-tiempo de Robb, véase

Winnie (1977) para una exposición y el capítulo 3 de Sklar (1985)

para una crítica.

LA INTRODUCCIÓN DE LA PROBABILIDAD EN LA FÍSICA

Capítulo 3

Los filósofos acerca de la probabilidad y la explicación estadística

Probabilidad: la teoría formalEs muy ventajoso para nosotros ser capaces de predecir con confian

za lo que sucederá en el futuro. En ciertos casos, muy excepcionales,

podemos predecir que el futuro tendrá un, y solo un, resultado, pon

gamos, cuando predecimos la posición futura de uno de los planetas

a partir de su estado actual y de las leyes dinámicas del movimiento.

En muchos otros casos, sólo contamos con una idea muy vaga de lo

que el futuro deparará. Hay un conjunto especial de casos, sin em

bargo, donde no podemos decir con seguridad cuál entre un número

de sucesos posibles ocurrirá, pero donde podemos tener un conoci

miento fiable de la proporción en la que ocurrirán los sucesos en la

repetición de un gran número de pruebas de tipo similar. El tirador

de dados no sabe lo que obtendrá en la siguiente tirada del dado,

pero sabe que en una larga serie de tiradas aparecerá un siete sobre

el dado aproximadamente un sexto del total de las veces. La explora

ción de dichas situaciones, comenzando con la típica situación de

azar, condujo al desarrollo de la teoría de la probabilidad. La proba

bilidad de un suceso fue considerada como algo estrechamente rela

cionado con la frecuencia con que se esperaría que dicho suceso ocu

141

N 2 Filosofía de la física

rriera en la repetición de un gran número de pruebas idénticas de un

tipo determinado.

Se ha construido una teoría matemática formal de la probabili

dad de una simplicidad y elegancia sin par. Sorprendentemente, no

se formalizó hasta los años treinta del siglo XX, a pesar del hecho de

que las ideas básicas se conocían desde hacía cientos de años. Sea da

da una colección de sucesos básicos como el número que aparece en

la cara de un dado. Números del cero al uno son asignados a las sub-

colecciones de la colección de sucesos básicos. Así, asignamos a la

colección formada simplemente por «aparece el número uno» el nú

mero — esto es, la probabilidad de— un sexto. A la colección carac

terizada por «aparece un número par» le asignamos el número un

medio. Al resultado vacío (ninguno de los posibles sucesos ocurre) se

le da la probabilidad cero, y al resultado trivial (alguno de los posi

bles sucesos ocurre) la probabilidad uno. El postulado más importan

te es el de aditividad. Supongamos que si un suceso está en la co

lección A, no puede estar en la colección B, y viceversa. La

probabilidad asignada al resultado «A o B» se considera entonces

que es la suma de las probabilidades asignadas a A y a B. Así, si uno

no puede ser ciudadano de Nueva York y de California al mismo

tiempo, la probabilidad de que uno sea ciudadano de uno de los dos

estados es la suma de las probabilidades de que sea neoyorquino y

de que sea californiano.

En circunstancias ordinarias, nos es bien conocida la situación

donde el número de posibles sucesos básicos es finito: el dado con

seis caras, la ruleta con treinta y siete ranuras, etcétera. Sin embargo,

el matemático y, como veremos, el físico deben tratar con casos don

de el número de sucesos básicos es infinito. Por ejemplo, un suceso

básico podría ser una partícula puntual ocupando una cualquiera del

número infinito de posiciones posibles en una caja. Habitualmente,

se adopta una generalización del postulado de aditividad. Ésta es de

nominada aditividad contable. Se trata de una suposición natural, si

bien tiene algunas consecuencias peculiares. Una de ellas es que la

probabilidad cero ya no se asigna solamente al conjunto vacío obte

nido cuando no se da ningún resultado básico, sino que también se

asigna a conjuntos no vacíos. Por ejemplo, si uno anda ocupado en la

tarea de elegir un número entre todos los números reales entre cero

y uno, la aditividad contable implica que la probabilidad de obtener

un número que sea racional, esto es, que pueda ser representado por

La introducción de la probabilidad en la física 141

una fracción de dos enteros, es cero. Pero, claro está, hay un número

infinito de tales números racionales en la colección. La idea es que

hay «muchos más» números reales no fraccionarios que fraccionarios.

En estos contextos, pues, el suceso imposible tiene probabilidad

cero, pero no todos los sucesos con probabilidad cero son imposi

bles. Y el tener probabilidad uno no significa que un suceso deba ne

cesariamente ocurrir.

Una noción importante en la teoría de la probabilidad es la de

probabilidad condicionada. Supongamos que sabemos que se ha ob

tenido un siete en el lanzamiento de dos dados. ¿Cuál es la probabili

dad, dado dicho suceso, de que uno de los dados muestre un uno en

su cara? Veamos, el siete puede aparecer en seis formas, y en sólo

dos de los casos se tendrá un uno en uno de los dados. Así pues, la

probabilidad es un tercio. En suma, la frecuencia esperada de un tipo

de suceso, B, una vez que ha ocurrido un tipo de suceso, A, es la

probabilidad de B condicionada a A o la probabilidad de B bajo la

condición A. Si la probabilidad de B bajo la condición A es simple

mente la probabilidad no condicionada de B (y la probabilidad de A bajo la condición B simplemente la probabilidad de A), se dice que

A y B son sucesos probabilísticamente independientes entre sí. Dos

lanzamientos sucesivos de una moneda se toman habitualmente

como independientes en este sentido. La probabilidad de obtener

una cara en el segundo lanzamiento sigue siendo un medio, siendo el

resultado del primer lanzamiento irrelevante para esta probabilidad.

Sin embargo, ser californiano y ser del oeste no son evidentemente

independientes. La probabilidad de que alguien provenga de Califor

nia suponiendo que proviene del oeste es obviamente mayor que la

probabilidad de que sea californiano suponiendo sólo que vive en al

gún lugar de Estados Unidos.

A partir de los postulados básicos de la teoría de la probabilidad

se puede probar un grupo de importantes teoremas denominados Le

yes de los Grandes Números. ¿Esperamos que aparezcan caras la mi

tad de las veces en un número pequeño de lanzamientos de una mo

neda? Si el número de lanzamientos es impar, no podrá ser. Aun

cuando el número de lanzamientos sea par, esperamos que el suceso

real se desvíe de la proporción exacta de un medio en cualquier serie

dada de lanzamientos. A medida que aumente el número de lanza

mientos, sin embargo, esperamos que haya algún tipo de convergen

cia de la frecuencia de caras observadas a la probabilidad postulada


ili- im medio. Lo que las Leyes de los Grandes Números nos dicen es

que la probabilidad de dicha convergencia (entendida en varios senti

dos, pues puede ser de diferentes intensidades) tiende a uno («certe

za probabilística») cuando el número de pruebas tiende a infinito.

Esto es válido si las pruebas son probabilísticamente independientes

entre sí. Así pues, si bien no podríamos ciertamente probar que en

cualquier serie de pruebas tendiendo al infinito, la frecuencia conver

gería a la probabilidad, podemos probar, dada la independencia de

las pruebas, que un resultado semejante es cierto probabilística

mente.

Interpretaciones objetivistas de la probabilidadUna cosa es tener un conjunto de axiomas formales de probabilidad.

Hay algunas variaciones en éstos, pero se comprenden bien. Otra

muy diferente es lograr un acuerdo sobre lo que la probabilidad es sencillamente. ¿De qué estamos hablando cuando hablamos de pro

babilidades? Dada la estrecha relación entre frecuencias de sucesos

en el mundo y atribuciones de probabilidad, ¿no sería más sencillo

identificar las probabilidades con las frecuencias relativas reales de

los sucesos? Con el fin de abarcar los casos en los que el número de

sucesos básicos es infinito en lugar de finito, podríamos querer gene

ralizar y hablar de proporciones reales en lugar de frecuencias reales,

pero la idea básica sería la misma. Esta sencilla concepción, sin em

bargo, tropieza con la objeción familiar de que en cualquier clase real

de experimentos no esperamos que las frecuencias o proporciones

reales sean las probabilidades exactas. Esperamos un tipo de «con

centración» de los sucesos reales en torno a los valores de la probabi

lidad, pero no su identidad.

Para evitar esto, se sugiere a menudo que deberíamos identificar

las probabilidades con las frecuencias o proporciones relevantes «a la

larga», esto es, cuando el número de pruebas tiende a infinito. Un

problema al respecto es, por supuesto, que el número real de prue

bas es siempre finito. ¿Qué es esta peculiar «serie de pruebas ten

diendo a infinito» idealizada en la que han de determinarse las fre

cuencias? ¿Se supone que es algo real o, más bien, algún tipo de

idealización? Y si es esto último, ¿qué ha sucedido con la concepción

original de las probabilidades como frecuencias o proporciones rea


les? Otro problema con esta concepción es que, incluso ¡i la larga, el

nexo entre probabilidades y frecuencias es solamente un nexo proba-

bilístico. Las Leyes de los Grandes Números son válidas sólo cuando

las pruebas son independientes entre sí, y esto es una noción proba

bilística. Peor aún, la identidad entre frecuencia y probabilidad, in

cluso a la larga, sólo se asegura con «probabilidad uno» y, como he

mos indicado, esto no significa que, en cualquier serie infinita de

ensayos, el límite de la frecuencia relativa y la probabilidad deban

coincidir.

A menudo se sugiere una conexión más laxa entre probabilida

des y frecuencias o proporciones reales. Tomad la «probabilidad»

como un término no definido y las probabilidades como una caracte

rística primitiva atribuida a los sistemas físicos. De qué característica

se trata viene determinado por el papel que la probabilidad juega en

nuestro esquematismo para predecir, controlar y explicar los sucesos.

Contamos, por ejemplo, con reglas «ascendentes» que nos dicen có

mo inferir de las frecuencias y proporciones observadas las probabili

dades asignadas, y de reglas «descendentes» que nos dicen, una vez

asignada una probabilidad a un fenómeno, qué tipos de frecuencias y

proporciones esperar en pruebas finitas. Así pues, en lugar de identi

ficar la probabilidad con alguna proporción o frecuencia real, quizá

deberíamos considerar que dichas frecuencias y proporciones reales

especifican lo que la probabilidad es por medio solamente de su co

nexión con las probabilidades a través de estas reglas ascendentes y

descendentes de inferencia, reglas que conectan las frecuencias y pro

porciones reales a las probabilidades asignadas.

Otras sugerencias contemplan el examinar todo el esquema de

atribuciones estadísticas y legales que hacemos al mundo. Contamos

con una amplia y profunda estructura jerárquica de generalizaciones,

algunas legales y sin excepción, otras estadísticas y basadas en atribu

ciones de probabilidad. Todas estas generalizaciones se refieren al

orden de las conexiones entre los fenómenos en el mundo. Quizá

deberíamos figurarnos las probabilidades como esas atribuciones

idealizadas de frecuencia y proporción que aparecen en los postula

dos que juegan un papel fundamental en esta estructura de generali

zaciones. Sería entonces un error concebir la probabilidad como una

frecuencia en un sentido ingenuo: la probabilidad es un tipo de pro

porción simple idealizada que se considera representativa de la es

tructura general del mundo al nivel de las generalizaciones funda


mentales. Pueden proponerse varios esquemas diferentes para inten

tar que esta noción de «proporción idealizada» sea menos vaga.

El objetivo de todas estas interpretaciones es asignar una proba

bilidad a un suceso en una serie de pruebas, ya sea la frecuencia o

proporción de ese suceso, o alguna proyección o idealización de la

misma. Otra interpretación objetivista de la probabilidad examina,

antes bien, el proceso por el que se generarían las frecuencias requeri

das. La probabilidad, según esta concepción, es una característica del

objeto, o bien del proceso que involucra un objeto, por la que un su

ceso puede o no producirse. Así como una ventana puede ser frágil

aunque no se haya roto, así, una moneda lanzada tiene, bajo esta con

cepción, una disposición o tendencia a producir caras o cruces, aun

cuando esta tendencia no se actualice en ciertos casos. El describir la

probabilidad de obtener caras en el'lanzamiento de una m on jía

como un medio es atribuir al sistema o situación de lanzamiento una

«propensión» a producir caras la mitad de las veces que se lleva a ca

bo un gran número de pruebas. Así pues, la probabilidad es, bajo

esta concepción, el atributo de un solo lanzamiento, la magnitud de

su disposición a producir un suceso de un tipo específico.

Como veremos más tarde en este capítulo y en el capítulo 4, de

terminar en qué medida la probabilidad es inherente a un solo suce

so, en lugar de ser una medición meramente de una clase de resulta

dos sobre una clase de sucesos, requerirá algo más que cuestiones

puramente filosóficas. Por tales entiendo cuestiones del tipo de si la

concepción disposicional presupone un soporte frecuentista y si esa

concepción puede resolver las dificultades encontradas en las con

cepciones anteriores. También surgirán cuestiones de física. Pues la

cuestión de si las proporciones que observamos en el mundo son in

herentes en un sentido irreducible a sucesos simples, está íntimamen

te relacionada a la cuestión de si hay condiciones suficientes en cada

suceso para determinar completamente que sólo uno de los posibles

sucesos efectivamente ocurrirá. ¿Pueden darse casos en los que que

de una multiplicidad de resultados, aun cuando se hayan especifica

do todas las condiciones (conocidas, desconocidas, o incluso incog

noscibles) que gobiernan el suceso? Ésta es una cuestión importante

en mecánica cuántica, como veremos, donde la cuestión de los pará

metros deterministas «ocultos» es importante.

Hay otra área de problemas que debe ser explorada por todo

aquel que pretenda entender la probabilidad como una característica

La introducción de la probabilidad en la física N 7

objetiva del mundo. Se trata del problema de la aleatoriedad. Supon

gamos una serie de lanzamientos de moneda como la siguiente:

C,X,C,X,C,X,..., etc. ¿Deberíamos decir que en dicha serie la probabi

lidad de obtener cara en un lanzamiento dado es un medio? Ésta es,

en definitiva, la frecuencia límite con que ocurren las caras. Sin em

bargo, la ordenación de la serie, una ordenación que nos permite de

cir, dado el resultado de nuestro último lanzamiento, si ocurrirá cara

o cruz en el lanzamiento siguiente, lleva a muchos a afirmar que el

considerar la probabilidad de obtener cara en un lanzamiento dado

como un medio induciría a error. Si se ha de asignar alguna probabi

lidad, ¿no deberíamos asignar al suceso obtener cara la probabilidad

uno en los lanzamientos impares y la probabilidad cero en los lanza

mientos pares? Sólo en una serie aleatoria, dicen, la probabilidad

¡guala a la frecuencia relativa límite. Pero, ¿qué es exactamente una

serie aleatoria?

El estudio de la aleatoriedad desde el punto de vista objetivista

ha conducido a resultados interesantes, cuando no absolutamente

concluyentes. Investigadores como L. von Mises y A. Church han in

tentado definir la aleatoriedad como una propiedad que se satisface

cuando las frecuencias de los sucesos en la serie son las mismas en

cualquier subserie derivada de la original por cualquier proceso «me

cánico». Así pues, la serie de más arriba no es aleatoria, pues la sub

serie de lanzamientos impares puede ser seleccionada mecánicamen

te por un ordenador automático convenientemente programado. Y la

frecuencia de caras en esa serie es uno, no un medio. El concepto de

una subserie seleccionable mecánicamente puede hacerse matemáti

camente preciso. Sin embargo, hay series que son aleatorias en este

sentido pero que son, intuitivamente, no aleatorias en el sentido de

que pueden adoptarse algunas estrategias de juego contra ellas que

son «sucias».

Una propuesta diferente para dar una explicación de la aleatorie

dad objetiva descansa en la intuición de que «casi todas» las series

deberían ser aleatorias. Las series ordenadas deberían ser escasas en

la colección de todas las series, una noción que podríamos formalizar

exigiendo que una serie sea aleatoria «con probabilidad uno». Así

pues, uno busca definiciones de no aleatoriedad que seleccionarán

de entre todas las series una colección con una probabilidad de ta

maño cero. El principal problema que surge con las definiciones

cuando se desarrolla esta idea es que se pierde su estrecho vínculo


( mi la noción intuitiva de aleatoriedad de la que uno partió. Hay

todavía otra definición de aleatoriedad que imagina un efectivo pro

cedimiento «universal» para probar la no aleatoriedad y declara a

una serie aleatoria si supera esta prueba.

Una cuarta alternativa adopta una estrategia sumamente intuitiva.

Consideremos una computadora programada para producir como sa

lida la serie de resultados experimentales que ocurren efectivamente.

¿Cómo de largo será el programa más corto que haga este trabajo?

Obviamente un programa siempre funcionará, la instrucción que di

ce sencillamente «Imprime ...», donde la «...» es la serie en cuestión.

Pero las series «no aleatorias» poseen, intuitivamente, programas más

cortos. Por ejemplo, la serie C,X,C,X, ... puede venir dada sencilla

mente por «Imprime C y X alternativamente». Así, una serie es tanto

menos aleatoria cuanto más corto pueda ser su programa generador.

Todo esto puede hacerse formalmente decente. Pero apenas se consi

gue lo que el objetivista quería, pues resulta que una definición satis

factoria parece dar por sentado nuevamente que la serie se ha presu

puesto como generada por un proceso probabilístico. Esto hace

difícil usar una noción de aleatoriedad objetiva definida en una for

ma que, junto a la noción de frecuencia relativa límite, sirva para de

cir lo que la probabilidad es ante todo.

Interpretaciones subjetivistas de la probabilidadUn entendimiento de la naturaleza de la probabilidad radicalmente

diferente al de las explicaciones objetivistas que hemos venido exa

minando hasta el momento no se centra en lo que hay en el mundo

sino, en su lugar, en lo que hay en nosotros. Nosotros utilizamos la

probabilidad como guía para actuar frente al riesgo, apostando por

un resultado dado sólo si consideramos que la probabilidad de acer

tar es lo bastante alta como para superar nuestras dudas de que el re

sultado se dé efectivamente. Quizá deberíamos concebir entonces la

probabilidad como una medida de nuestro grado de confianza en la

ocurrencia de un suceso, una medida de la «creencia parcial» por

nuestra parte, si se quiere.

Supongamos que las probabilidades son medidas de la creencia

parcial, en el sentido de que son indicadoras de las mínimas diferen

cias en razón de las que apostaremos por un resultado. ¿Por qué en


tonces habrían nuestras probabilidades de obedecer las leyes están

dar de la teoría de la probabilidad? Qué deberían obedecer estas le

yes es un resultado bastante trivial desde el punto de vista frecuentis-

ta, pero el subjetivista necesita un argumento por el que deberían.

Algunos argumentos están diseñados para mostrar que sólo en el

caso de que nuestras probabilidades obedezcan las reglas estándar

nos veremos libres de caer en una situación donde un corredor de

apuestas nos ofrece apuestas que aceptamos, pese a garantizar una

pérdida por nuestra parte con independencia de cómo resulten las

cosas. Otro enfoque intenta mostrar que si las preferencias de alguien

por «billetes de lotería» (obtienes A si x ocurre y B si x no ocurre),

como revela la elección de un billete antes que otro, son racionales

en el sentido de que si el billete 1 se prefiere al billete 2 y el 2 al 3,

entonces el uno se prefiere al 3, siempre habrá una forma de repre

sentar nuestras creencias parciales en los resultados que obedecerá

entonces los axiomas estándar de probabilidad.

Por consiguiente, para el objetivista, las probabilidades son carac

terísticas del mundo esperando a ser descubiertas. Para el «subjetivis

ta», son grados de la creencia parcial de un agente que guían sus ac

ciones y creencias en un mundo incierto. Pero, ¿qué probabilidades

debería el agente racional atribuir a los sucesos? Los argumentos que

acabamos de esbozar están diseñados para demostrar que con inde

pendencia de las probabilidades que se elijan, éstas deben satisfacer

conjuntamente los axiomas estándar de la probabilidad. Pero ¿hay al

guna otra restricción sobre la racionalidad probabilística?

Un conjunto de argumentos está diseñado para describir y justifi

car un procedimiento capaz de modificar las propias probabilidades

subjetivas a la luz de nueva evidencia. Un teorema fundamental de la

teoría de la probabilidad, el Teorema de Bayes, relaciona la probabi

lidad de una hipótesis sobre la base de evidencia (una probabilidad

condicionada) con la probabilidad condicionada de la evidencia, su

puesta la verdad de la hipótesis y la probabilidad inicial de que la hi

pótesis sea verdadera. Supongamos que consideramos que, después

de presentada la evidencia, deberíamos adoptar como nuestra nueva

probabilidad para la verdad de la hipótesis su vieja probabilidad con

dicionada a la evidencia. Tenemos entonces una forma de cambiar

nuestras probabilidades a la luz de nueva evidencia que es «conser

vadora». Comporta los mínimos cambios concebibles en nuestras

probabilidades anteriores. Y las nuevas probabilidades se ajustarán,


como las viejas, a los axiomas de la teoría de la probabilidad. Este

proceso de modificación de la probabilidad a la luz de la evidencia

se conoce como condicionamiento. Puede ser generalizado para en

globar casos en los que la nueva evidencia no se conoce como cierta,

sino que lleva asignada solamente una probabilidad. Alguien que si

guiera este procedimiento podría, por ejemplo, partir de la suposi

ción de que una moneda, que podría estar sesgada, tiene probabili

dad un medio de dar cara. A medida que se sumen nuevos

lanzamientos de moneda, el agente modificará la probabilidad a la

luz de los resultados observados. Una partida dominada por las

caras, por ejemplo, inducirá al agente a aumentar su estimación de la

probabilidad que tiene la moneda de dar caras. De nuevo, pueden

darse argumentos a favor de que lo razonable es la modificación de

las probabilidades de uno por condicionamiento. Algunos de estqf

argumentos son del tipo de los que se utilizaban para intentar con

vencernos de que era razonable que nuestras probabilidades se con

formasen a los axiomas usuales.

Más arriba indiqué que al obtener nuevas probabilidades para las

hipótesis a la luz de la evidencia, uno se apoyaba en las probabilida

des iniciales de la verdad para las hipótesis en cuestión. Así pues, ¿no

se debería comenzar con alguna plausibilidad «intrínseca» para las

hipótesis, sus así denominadas probabilidades a priori? ¿De dónde

podrían éstas proceder? Algunos han defendido que deberíamos dar

cabida a hipótesis probabilísticas en nuestro cuerpo de creencias

aceptadas sólo sobre la base de frecuencias observadas como eviden

cia. Más frecuentemente se alega que las hipótesis pueden tener pro

babilidades intrínsecas generadas con independencia de las frecuen

cias observadas. De hecho, dichas probabilidades a priori fueron el

objeto de estudio de los primeros trabajos en teoría de la probabili

dad en los siglos xv ii y xvm. En el lanzamiento de una moneda hay

dos sucesos posibles «simétricos», cara y cruz. ¿No parece entonces

razonable suponer inicialmente que la probabilidad de cada uno de

ellos es un medio? En el lanzamiento de un dado hay seis caras simé

tricas. ¿No deberíamos entonces, si no hay evidencia de sesgos, atri

buir la probabilidad de un sexto a cada suceso consistente en apare

cer una cara específica en la parte superior del dado? Podemos, pues,

intentar obtener las probabilidades a priori dividiendo los sucesos en

casos simétricos y atribuyendo la misma probabilidad a cada uno.

Éste es el famoso Principio de Indiferencia.


Los filósofos posteriores formalizaron estas nociones y las genera

lizaron. Si elegimos un lenguaje en el que describir el mundo, pode

mos encontrar varias formas de clasificar las posibilidades del mun

do, según su descripción en este lenguaje, en posibilidades simétricas.

La probabilidad inicial se distribuye entonces sobre las posibilidades

de un modo intuitivo y simétrico. Así, una vez obtenidas en esta for

ma las propias probabilidades a priori «racionales», uno podría modi

ficarlas a la vista de la evidencia experimental (especialmente de la

evidencia sobre las frecuencias efectivamente observadas de los suce

sos) usando el proceso de condicionamiento descrito más arriba. Los

métodos inventados fueron vistos por algunos como una generaliza

ción de la teoría formal de \x deducción, porque tenían en cuenta la

definición de un tipo de «nexo lógico parcial» entre las proposicio

nes, esto es, la idea de que una proposición puede sustentar lógica

mente a otra hasta cierto grado. Así, los sistemas formales recibieron

el nombre de lógicas inductivas.

Hace tiempo que se advirtió que estas técnicas se ven afectadas

por dificultades cuando el Principio de Indiferencia es sometido a

análisis y crítica. Todas ellas descansan en una división de los sucesos

posibles en casos simétricos. Pero la idea tras dicha división no siem

pre está clara. Podemos decir, claro está, que el dado puede dar un

uno, un dos, etc., sumando un total de seis casos. Pero también pode

mos decir que el dado puede dar un uno o ningún uno en su cara

superior, lo cual hace dos casos. Entonces, ¿por qué no asignar a

«aparecer un uno» una probabilidad de un medio? En otros casos, la

necesidad de alguna forma basada en principios para elegir cómo ser

«indiferente» se hace más clara. Imaginemos un vaso construido de

forma tal que el volumen ocupado no sea proporcional al área de la

superficie humedecida del interior del vaso (fácil de hacer si se

toman curvos los lados del vaso). Sin tener idea de cuán lleno está el

vaso ¿supondríamos, usando el Principio de Indiferencia, que está

medio lleno? O ¿supondríamos, con igual justificación, que la mitad

de su interior está húmeda? Las dos suposiciones son incompatibles

entre sí, pero ambas parecen igualmente justificadas, a priori, por

puras consideraciones de simetría.

Más adelante en este capítulo exploraremos cómo se utiliza la

probabilidad en mecánica estadística, el primer dominio de la física

en el que jugó un papel fundamental. Veremos que las controversias

entre los filósofos acerca de la naturaleza de la probabilidad y las


controversias sobre el origen y la justificación de las asignaciones de

probabilidad inicial son cruciales cuando uno está intentando enten

der sencillamente cómo debería introducirse la probabilidad en la fí

sica. Como veremos, varios descubrimientos físicos no sólo arrojan

luz sobre las cuestiones filosóficas, sino también revelan cuestiones

adicionales que complican aun más la situación del problema filosó

fico.

Explicación estadística: explicación, ley y causaDeseamos no sólo describir el mundo tal como lo encontramos, sino

explicar también lo que acontece en el mundo. Explicar, creemos, es

responder a la cuestión de por qué ocurre lo que ocurre, y no sólo

describir qué es lo que de hecho ocurre. Pero ¿qué significa respon

der a un por qué? Y ¿qué significa dar una explicación de un fenó

meno?

La noción intuitiva de una causa ha jugado un papel en las tenta

tivas de analizar el concepto de explicaciones en la ciencia desde el

momento mismo en que la idea de aportar un tal análisis se le ocu

rrió por vez primera a un filósofo. Explicar un suceso es indicar su

causa y explicar una clase de sucesos es suministrar la clase o tipo de

causa que los produce.

En un temprano análisis de la causalidad, Aristóteles distinguió

entre la materia en la que ocurría un cambio, la naturaleza del cam

bio, la finalidad o propósito del cambio, y el generador directo del

cambio, como cuatro clases diferentes de causas. Las designó con los

calificativos de causas materiales, formales, finales y eficientes. El ma

terial y las propiedades implicadas no se consideran aquí como cau

sas de un proceso, sino como constituyentes del cambio que se pre

tende explicar. La cuestión de las causas finales — metas, o

propósitos— sigue todavía suscitando mucha discusión. En la activi

dad intencional de un agente, quizá en biología (en la forma de expli

caciones funcionales de un órgano, por ejemplo), y en las ciencias so

ciales, algo como la idea aristotélica de que indicar un objetivo, o

propósito, es explicativo, sigue pareciendo atractivo. Ni siquiera en la

física está claro que no haya espacio en absoluto para las «causas

finales». Explicaciones de la trayectoria de la luz como aquella que

toma el menor tiempo se alega algunas veces que son finales por na


turaleza. Y en la termodinámica (que expondremos más adelante en

este capítulo), el explicar un proceso en términos de un sistema que

tiende a un estado de equilibrio como un «objetivo» se ha alegado

que es una explicación que utiliza la noción de «causa final».

Pero cuando un científico contemporáneo piensa en causas, él o

ella piensa normalmente en causas eficientes, los sucesos que «oca

sionan» la ocurrencia del suceso a explicar. Pero ¿qué significa expli

car un suceso demostrando su causa eficiente? La idea intuitiva pare

ce ser que un suceso es explicado cuando se descubre un suceso

anterior que «hace necesaria» la ocurrencia del suceso en cuestión.

Cerrar el interruptor hace que la luz se encienda, empujar el objeto

hace que se acelere, etcétera. Pero ¿cuál es la naturaleza de esta de

terminación o «hacer», por la que es apropiado describir la causa

como lo que hace suceder el efecto o suceso explicado?

En un merecidamente famoso examen crítico de la noción de

causalidad, David Hume argüyó que sería un error concebir las rela

ciones causales como fundadas en algún «nexo causal» especial o

«conexión necesaria» entre los sucesos en el mundo. Antes bien, ar

güyó, lo que encontramos en el mundo cuando examinamos sucesos

relacionados como causa y efecto es, ante todo, una relación espacio-

temporal entre los sucesos, en la que los sucesos están en contacto

espacio-temporal, pero de forma que el suceso causa precede al suce

so efecto en el tiempo. También encontramos a los sucesos conteni

dos en una clase de pares de sucesos del mismo tipo que siempre es

tán acompañados uno por el otro. Esto es, el suceso 1 causa el

suceso 2 si, y sólo si, tienen la correcta relación espacio-temporal y si,

y sólo si, los sucesos de tipo 1 son siempre seguidos por los de tipo 2

y los de tipo 2 están siempre precedidos por los de tipo 1. Mientras

creemos poder explicar esta «conjunción constante» de los tipos de

sucesos diciendo que los sucesos de tipo 1 «causan» los sucesos de

tipo 2, en realidad, cuando hablamos de causalidad, estamos sólo re-

describiendo esa conjunción constante según Hume.

La cuestión no es tan simple para Hume, puesto que pregunta de

dónde sacamos la idea de que el suceso causa «hace necesario» el su

ceso efecto. Su comprensión de esto es que la necesidad no es reflejo

de una relación real entre los sucesos en el mundo sino, antes bien,

una proyección sobre el mundo de un fenómeno psicológico. Al ver

sucesos de tipo 1 acompañados siempre por sucesos de tipo 2, nos

acostumbramos a que los sucesos del primer tipo sean siempre segui


dos por sucesos del segundo tipo. Así, cuando experimentamos un

suceso del primer tipo, nuestra mente inmediatamente salta a la ex

pectativa de que un suceso del segundo tipo ocurrirá. Esta expecta

ción, fundada en «la costumbre o el hábito», constituye el origen de

nuestra idea de que el primer tipo de sucesos hace necesario el se

gundo tipo de sucesos. Pero, afirma Hume, esto es cuestión de nues

tra psicología. Todo lo que hay en el mundo de los sucesos mismos

son las relaciones espacio-temporales de «contigüidad y precedencia»

y la conjunción constante de los sucesos de los tipos en cuestión.

Intimamente asociado a este análisis humeano de la causalidad

se encuentra un modelo de explicación científica denominado el

modelo deductivo-nomológico (aunque uno podría adoptar este

modelo sin ser un humeano). En él se arguye que explicar un suce

so es demostrar que el enunciado de la ocurrencia del suceso en

cuestión podría deducirse lógicamente de los enunciados de la ocu

rrencia de otros sucesos normalmente anteriores, si, además de la

descripción de esos sucesos explicativos, uno utilizase proposicio

nes de las «leyes de la naturaleza» conectando los distintos tipos de

sucesos. Para un humeano, estas leyes son solamente los enunciados

generales de las conjunciones constantes de los tipos relevantes de

sucesos.

Los proponentes de este modelo de explicación científica diri

gen nuestra atención a la íntima relación que existe entre la explica

ción que ellos han elaborado y los objetivos de predicción y control

compartidos por la mayoría de los agentes humanos. Si somos

capaces de explicar un cierto tipo de sucesos, entonces tenemos a

nuestra disposición las generalizaciones legales que conectan sucesos

de un tipo con otros tipos de sucesos utilizados en la explicación. Si

en otras circunstancias, pues, sabemos qué tipos de sucesos «causa»

han ocurrido, podemos, utilizando las generalizaciones descubiertas

en nuestra búsqueda de explicaciones deductivo-nomológicas, pre

decir qué sucesos ocurrirán. O podríamos, manipulando la ocurren

cia del tipo correcto de sucesos «causantes», controlar el mundo de

terminando qué tipos de sucesos manipulables ocasionarán (o

impedirán) sucesos del tipo que queremos que ocurran. Una vez

más, las conexiones entre los tipos apropiados de sucesos se revelan

en los enunciados de las leyes generales descubiertas en la búsqueda

de explicaciones.

Como veremos, algunas personas objetan que el modelo consis


tente en deducir una descripción de un suceso a partir de las des

cripciones de otros sucesos y de enunciados generales de leyes, exige

demasiado de una explicación. Otrqs dicen que exige demasiado

poco. Un problema importante está conectado de nuevo a la noción

de causalidad. Si los sucesos explicativos y explicados no tienen la re

lación causal correcta, se arguye, las conexiones entre sus descripcio

nes no constituyen explicaciones, aun cuando se satisfagan las condi

ciones del modelo deductivo de explicación. Podríamos deducir la

posición de un planeta ayer a partir de las leyes de la dinámica y de

su posición y velocidad hoy, pero eso no explica por qué tenía la posi

ción que tenía ayer, se dice, ya que el pasado explica el futuro pero

no al contrario. Y esto es así,, se dice, porque la causalidad va en la

dirección del pasado al futuro. Explicar, se afirma, es desvelar las

causas. De nuevo, dos sucesos podrían estar correlacionados median

te una ley porque son el efecto común de un tercer suceso que es su

causa común. Los dos sucesos no se explican, pues, uno al otro, aun

que ambos son explicados por la causa común. Si una infección bac

terial provoca a la vez un sarpullido y una hinchazón, se dice, ni el

sarpullido explica la hinchazón, ni la hinchazón el sarpullido. Antes

bien, ambos son explicados por su causa, la infección bacteriana. Pero,

¿qué otro elemento adicional se necesita para la explicación además

de la conjunción constante?

Explicaciones que invocan la probabilidadMuchos de los que piensan que el modelo deductivo de explicación

exige demasiado aluden a explicaciones históricas. Aquí parecemos

aceptar descripciones explicativas que no hacen uso alguno de gene

ralizaciones legales. Después de todo, ¿cuáles son las leyes que go

biernan los sucesos históricos? Más interesantes para nosotros son

esas explicaciones en las que los sucesos están conectados por gene

ralizaciones, pero donde las generalizaciones no son leyes de la natu

raleza de pleno derecho, sino conexiones probabilísticas o estadísti

cas entre los sucesos. El fumar no siempre causa cáncer de pulmón,

pero ciertamente aumenta su probabilidad. ¿No damos, entonces,

una explicación al menos del cáncer de pulmón de alguien, si señala

mos su vicio de fumar, aun cuando el fumar no comporte la necesi

dad de contraer la enfermedad? ¿Qué clase de relación probabilística


entre suceso explicativo y explicado es suficiente para poder decir

que el primero explica el segundo?

Un primer pensamiento natural es que un suceso es explicado si

podemos encontrar otros sucesos tales que la ocurrencia del suceso

en cuestión se siga con alta probabilidad de la ocurrencia de los su

cesos explicativos. El «seguirse de» es mediado por la existencia de

generalizaciones estadísticas legales que ocupan el lugar de las leyes

sin excepción utilizadas en las explicaciones deductivo-nomológicas.

Nos percatamos de inmediato de que tal «explicación estadística»

de un suceso será muy diferente de la explicación que se obtiene

cuando se utilizan leyes puras. Por ejemplo, en el caso deductivo, si

podemos explicar el suceso 1 y podemos explicar el suceso 2, pode

mos generar automáticamente una explicación del «suceso 1 ocurrió

y el suceso 2 ocurrió» juntando simplemente los recursos explicati

vos utilizados para explicar cada suceso individual. Pero si el suceso

1 se sigue de alguna base explicativa con «alta probabilidad», es de

cir, con una probabilidad mayor que alguna cantidad especificada, y

el suceso 2 se sigue de su base explicativa con parecida probabili

dad, eso no garantiza que «el suceso 1 y el suceso 2» se sigan de las

bases explicativas conjuntas con una probabilidad superior al valor

mínimo.

Es más, un suceso que tenga una probabilidad alta respecto a su

base explicativa, podría tener una probabilidad baja respecto a esa

base complementada con información adicional. Aunque podamos

decir que es altamente probable que alguien criado en un entorno

horrible tenga tendencias criminales, cuando nos digan, además, que

es el hijo de una familia rica, etcétera, reduciremos la probabilidad

estimada. Esto no puede suceder con sucesos explicados deductiva-

nomológicamente.

Pronto pensamos en casos donde presentimos que un suceso

puede ser explicado probabilísticamente aun cuando no tenga una

alta probabilidad en relación a lo que se propone como explicación.

La combustión de algo que arde espontáneamente se explica dicien

do que algunas veces, aunque muy raramente, dicho fenómeno tiene

lugar en la situación pertinente. ¿Cómo podemos explicar un suceso

haciendo referencia a hechos respecto a los que presenta una proba

bilidad baja? Se señala que sin los hechos explicativos, el suceso en

cuestión tendría una probabilidad aún más baja. Así podemos expli

car porqué algo sucede aludiendo a hechos que lo hacen más proba


ble de lo que sería de otra forma, aun cuando después de añadir los

hechos explicativos, su probabilidad siga siendo baja.

Después se observa que hay muchos casos en los que explicamos

un suceso haciendo referencia a otro suceso, aun cuando aportando

la nueva información disminuyamos la probabilidad del suceso en re

lación a nuestro conocimiento de fondo. Un médico explica la muer

te de un paciente del que se sabe que padece una terrible enferme

dad señalando que, en este caso particular, fue el efecto secundario,

muy improbable, de un medicamento lo que mató al paciente, no la

enfermedad. La causa de la muerte puede ser el medicamento, aun

que la muerte por enfermedad, tratada o no tratada, sea mucho más

probable que la muerte producida por el efecto secundario del1 medi

camento.

Podemos combinar estas observaciones con otras similares a las

aducidas cuando quienes discuten una explicación deductivo-nomo-

lógica arguyen que, en la teoría de la explicación que entiende como

tal la inclusión bajo una generalidad, falta el elemento causal. Obte

nemos así una teoría que dice que explicar, tanto probabilísticamente

como por medio de leyes sin excepción, es indicar el origen causal

de un suceso. Pero ahora la causalidad se entiende como una rela

ción que admite una conexión probabilística. Aquí la idea es que un

suceso podría causar un número de sucesos diferentes, cada uno con

una probabilidad determinada de ser causado. Aunque una causa

pueda generar una multiplicidad de efectos, es todavía una relación

causal lo que produce el suceso efecto como consecuencia del suce

so causa. Mirando las cosas de esta manera, puede que se haga justi

cia a los casos arriba mencionados. También servirá para distinguir

las correlaciones que no son explicativas, siendo no causales, de

aquellas que son explicativas, siendo verdaderamente causales aun

que probabilísticas.

Pero aquí surgen otras cuestiones interesantes. Si damos una ex

plicación probabilística que es causal, ¿estamos obligados entonces a

mantener que hay relaciones causales irreduciblemente probabilísti

cas en el mundo? ¿Debemos afirmar que el mundo tiene, en su base,

una naturaleza genuinamente «tiquista», o azarosa, no sostenida por

relaciones causales completamente deterministas? No necesariamen

te. Algunos han argüido que puede haber explicaciones probabilísti-

co-causales que expliquen un suceso como el resultado «por puro

azar» (aunque un resultado causal) de algunos sucesos anteriores que


presentan una disposición causal a generar sucesos del tipo que ha

de explicarse. En otros casos, la explicación probabilística, relevando

una vez más una estructura causal, puede ser explicativa al estar la

relación causal probabilística fundada en algunas relaciones causales

subyacentes enteramente deterministas. Veremos una defensa de este

punto de vista más adelante en este capítulo. En esta segunda clase

de explicación, el estado posterior de un sistema está completamente

determinado por su estado dinámico anterior. Pero, se arguye, mu

chos estados dinámicos iniciales son posibles candidatos consistentes

con la descripción inicial del sistema. Cada uno de dichos estados

iniciales conduce a un resultado futuro diferente. Cada evolución es

totalmente determinista. En este caso, la probabilidad se introduce

en la imagen explicativa cuando comenzamos a hablar sobre la «pro

babilidad de un estado dinámico inicial dado» consistente con la

descripción inicial del sistema. Así pues, tendremos elementos proba-

bilísticos en nuestra estructura explicativa. La estructura explicativa

descansará en el desvelamiento de los procesos causales subyacentes

que generan los sucesos que han de explicarse. Pero la probabilidad

se introducirá, no porque la relación causal sea «intrínsecamente

aleatoria», sino porque se están explorando simultáneamente muchas

posibles evoluciones causales diferentes. Más tarde, cuando discuta

mos la mecánica cuántica en el capítulo 4, veremos porqué tiene al

guna plausibilidad la afirmación de que en ese contexto se debe pos

tular una causalidad verdaderamente «incierta».

Desde esta perspectiva, pues, las demandas de una probabilidad

alta o aumentada parecen descaminadas. Lo que estamos intentando

hacer cuando explicamos probabilísticamente un suceso es ubicar di

cho suceso en una estructura de relaciones causales, donde la estruc

tura revelada es probabilística, bien porque las relaciones causales

son intrínsecamente indeterministas, bien porque se están conside

rando simultáneamente un número de evoluciones causales alternati

vas. Aun cuando el suceso considerado tenga una probabilidad baja,

o una probabilidad reducida, en la cadena de causalidad que condu

ce hasta él, podemos todavía dar una explicación del mismo. Por su

puesto,'esto no significa negar valor a la aliviadora sorpresa de mos

trar que un suceso es altamente probable, o de mostrar que es más

probable de lo que habríamos esperado de otro modo. Hacemos

estas cosas y las consideramos, en algún sentido, como suministrando

explicaciones.


¿Significa toda la importancia concedida a la revelación de una

relación causal en la explicación que estamos dando la espalda a una

teoría humeana de lo que es para una cosa ser la causa de otra? No

necesariamente. Algunos afirmarían que como las explicaciones exi

gen que se haga referencia a relaciones causales entre los sucesos,

debemos presuponer la noción de una relación causal como un ele

mento primitivo en nuestro entendimiento de la naturaleza del mun

do. Otros buscan un entendimiento de lo que es la relación causal en

términos de otras relaciones que los sucesos presentan entre sí. Un

enfoque, ya presente en Hume en algunos lugares, es intentar enten

der la causalidad en términos de «lo que ocurriría» en el mundo si

las cosas fuesen diferentes a como son. Así, podría concebirse como

causa un suceso tal que, de no haber ocurrido, no habría ocurrido el

suceso efecto. En realidad, no es tan simple. Fenómenos tales como

la sobredeterminación (un efecto es múltiplemente causado) y la ante

posición (una cosa es causada por un suceso que, de no haber ocurri

do, habría dado pie a que un segundo suceso hubiera provocado el

efecto; siendo el primer suceso tal que obstaculizó la ocurrencia del

segundo suceso) requieren un análisis más sofisticado de la relación

entre «lo que hubiese ocurrido si» y lo que significa que un suceso

cause otro. Otros problemas adicionales surgen debido a conexiones

no causales que también están asociadas con dicho «lo que habría su

cedido». Por si fuera poco buscamos además un entendimiento de lo

que significa justamente ese discurso sobre lo que habría sucedido si

las cosas hubieran sido de otro modo, un entendimiento que de suyo

no descansa en la presuposición de una relación causal implícita.

Otros enfoques que analizan la causalidad recurren a la combina

ción de la conjunción constante de Hume con otros elementos reales

en el mundo. A menudo se recalca, por ejemplo, que la estructura

del mundo es tal que identificamos una conjunción constante como

una relación causal sólo cuando los sucesos bajo consideración están

unidos uno a otro por caminos adecuadamente continuos de sucesos

en conjunción constante. Debe haber, entonces, caminos de «influen

cia causal» o «propagación causal».

Finalmente, es muy importante reflexionar sobre el hecho de que

las regularidades totalmente legales o sólo probabilísticas que utiliza

mos en nuestras explicaciones científicas forman una jerarquía unifi

cada de proposiciones en una estructura teórica. Algunas generaliza

ciones son mucho más amplias, más profundas, y más fundamentales


que otras. Puede argüirse que la diferencia entre meras correlaciones

y correlaciones causales aptas como explicación es que las últimas in

sertan la correlación de los sucesos en cuestión en los niveles más

profundos de correlación de las teorías más fundamentales. Así, se

arguye, la referencia al hecho de que tenemos causalidad, y por con

siguiente explicación, sólo cuando se pone al descubierto el mecanismo de la correlación de los sucesos, puede tomarse como indicativo,

no ya de que pueda producirse alguna relación causal misteriosa ade

más de la correlación, sino de que una correlación es explicativa sólo

cuando inserta la relación entre los sucesos bajo consideración en las

correlaciones fundamentales de nuestra teoría básica apropiada. ¿No

podría algo como esto hacer comprensible el debate entre quienes

piensan que las correlaciones conocidas entre el fumar y el contraer

cáncer son suficientes para afirmar que el fumar causa cáncer, y quie

nes lo niegan? ¿No están los últimos exigiendo causalidad como ex

plicación en el sentido de insertar la correlación entre el fumar y la

enfermedad en un contexto mucho más amplio y profundo? Tanto la

biología, como la química y la física son utilizadas para complemen

tar la manifiesta correlación con correlaciones mucho más finas fun

dadas en las leyes, mucho más profundas, de la ciencia. Detalles tales

como las correlaciones entre la inhalación de productos químicos,

estando la presencia de estos productos correlacionada a los cambios

genéticos, y siendo estos cambios seguidos en sus pormenores por

medio de las correlaciones más profundas de toda la física —que

muestran lo que sucede en el nivel molecular— son dados por estas

ciencias. Desde esta perspectiva, pues, la demanda de causalidad en

la explicación está garantizada, pero por razones básicamente hu-

meanas.

Este último aspecto del papel de la causalidad en la explicación

es particularmente relevante para nuestros propósitos presentes. Con

forme nos adentremos en los pormenores del papel de la probabili

dad en la teoría de la mecánica estadística, veremos que lo. que ahí

sucede es que una teoría «a nivel de superficie» del comportamiento

macroscópico, la termodinámica, se relaciona en un modo explicati

vo con una teoría dinámica «a nivel profundo». Esta teoría a nivel

profundo es la teoría del comportamiento de los sistemas fundada en

las leyes fundamentales de la dinámica de los componentes microscó

picos de los sistemas macroscópicos (tales como las moléculas de un

gas). Las consideraciones probabilísticas surgen cuando intentamos


acoplar uno al otro estos dos niveles de descripción, utilizando la

teoría de nivel profundo para explicar la teoría de superficie. Se pre

supone, pues, que podemos dar una descripción causal de la evolu

ción del sistema en términos de la dinámica de sus constituyentes mi

croscópicos. Este es el nivel amplio, profundo y fundamental de la

descripción científica indicado más arriba. La probabilidad juega un

papel al insertar la descripción del sistema forjada en los términos

del nivel superior en esta imagen causal global. Como veremos, la re

lación entre correlación y causalidad introduce aquí sus propios enig

mas particulares.

Explicación y reducciónNuestra discusión ha procedido como si los acontecimientos indivi

duales fueran los objetos primarios del entendimiento científico, esto

es, como si lo que quisiéramos explicar fuesen sucesos particulares.

En ciencia es más habitual, sin embargo, el entendimiento de las ge

neralizaciones, leyes o correlaciones probabilísticas, que estamos bus

cando. ¿Cómo podemos ampliar nuestro entendimiento de las gene

ralizaciones legales? ¿Cómo podemos explicarlas?

La idea principal es que las generalizaciones, ya sean legales o es

tadísticas, se explican en función de generalizaciones más amplias,

más profundas o más fundamentales. Nuestras leyes forman una je

rarquía que abarca desde generalizaciones parcas, de superficie

(como la Ley de Snell de la refracción en óptica o la Ley de Ohm en

la electricidad), hasta las leyes extremadamente generales y profundas

de nuestras teorías físicas fundamentales. Explicamos leyes de un or

den inferior mostrando que se siguen de las leyes de un orden supe

rior. Las leyes de niveles inferiores puede que sólo sean válidas en

ciertas circunstancias especiales bien definibles (esto es, cuando la si

tuación posee las condiciones especiales apropiadas). Explicamos la

óptica geométrica mostrando que se sigue de la óptica física (ondula

toria), explicamos la óptica física como una consecuencia de la teoría

electromagnética, explicamos el electromagnetismo como un compo

nente del campo electrodébil descrito por la teoría cuántica de cam

pos, etcétera.

Generalmente, la idea es que las leyes más superficiales son expli

cadas mediante su derivación de leyes del tipo más general y funda


mental. Pero las cosas son, en realidad, mucho más complicadas que

eso. Una afirmación habitual es que a menudo se encuentra que las

leyes más de superficie, una vez explicadas, no son realmente verda

deras. Con frecuencia son sólo buenas aproximaciones a la verdad y

eso sólo en ciertas circunstancias. Así, una vez comprendida la teoría

ondulatoria de la luz, nos percatamos de que la óptica geométrica

sólo es válida cuando la longitud de onda de la luz es pequeña com

parada con las dimensiones de los objetos físicos situados en la tra

yectoria de la luz. El hacer aquí rigurosa la noción de aproximación

no es una tarea fácil.

Más problemáticas son las cuestiones que surgen cuando las le

yes y las generalizaciones estadísticas menos profundas que se pre

tende explicar se han forjado en conceptos diferentes a los utilizados

en la gestación de los principios más profundos. Esto ocurre cuando

una teoría menos profunda es reducida a una teoría más profunda,

siendo necesario establecer una conexión entre los conceptos, a ve

ces bastante diferentes, de las dos teorías. Mientras la biología habla

de organismos y células, por ejemplo, la química molecular habla de

moléculas, gradientes de concentración, etcétera. ¿Cómo se relacio

nan las células, por ejemplo, con sus constituyentes microscópicos?

Aquí la respuesta parece clara, a saber, que las células están formadas

por moléculas, pero esto necesita ser completamente aclarado.

En el caso del que nos ocuparemos en este capítulo, esta cone

xión interteórica es aun más problemática. La teoría reducida que

describiré, la termodinámica, trata de características del mundo

como la temperatura, la cantidad de calor y la entropía. Pero la teoría

explicativa — reductora— se ocupa de los sistemas desde el punto de

vista de su construcción a partir de constituyentes microscópicos ta

les como moléculas. Aunque los objetos macroscópicos estén cons

truidos a partir de componentes microscópicos, el relacionar las pro

piedades de los sistemas que han sido utilizadas para caracterizarlos

en el nivel explicativo (temperatura y entropía, por ejemplo) con las

propiedades de los sistemas (el número de sus constituyentes micros

cópicos y el espacio en el que se encuentran confinados, por ejem

plo) y las propiedades de los propios constituyentes microscópicos

(su momento, energía, masa y tamaño, por ejemplo) es una cuestión

sutil y compleja.

Esto resulta doblemente difícil por la curiosa interacción entre

las leyes globales y las generalizaciones estadísticas en el esquema ex


plicativo. Las leyes a explicar parecen tener inicialmente el estatus de

leyes sin excepción. Pero el hecho mismo de explicarlas arroja ciertas

dudas sobre esta suposición. En el nivel explicativo más profundo se

encuentran las leyes fundamentales de la dinámica de los constitu

yentes microscópicos. Estas son, de nuevo, leyes de pleno derecho,

aunque en la versión de la mecánica estadística que adopta la diná

mica cuántica como su teoría dinámica fundamental, estas leyes po

seen en germen, como veremos en el capítulo 4, un elemento funda

mentalmente estadístico. Lo que es importante por el momento es

observar que entre las leyes dinámicas fundamentales de los micro-

constituyentes, y las leyes explicadas de la teoría que se quiere redu

cir, encontramos generalizaciones que introducen elementos probabi-

lísticos o estadísticos en la imagen explicativa. Así, como veremos, a

menudo se alega que la dinámica fundamental explica el comporta

miento térmico en el nivel macroscópico presentándolo tan sólo

como el comportamiento ostensiblemente más probable o, en otros

casos, como el comportamiento medio que ha de esperarse.

Cuando uno intenta entender la mecánica estadística, las cuestio

nes más importantes e interesantes aparecen precisamente en este

punto. ¿Cómo están las generalizaciones estadísticas que forman los

postulados centrales de la teoría relacionadas, de un lado, con las le

yes dinámicas fundamentales que gobiernan a los constituyentes mi

croscópicos del sistema bajo consideración y, del otro lado, con las

leyes que gobiernan el comportamiento macroscópico de los sistemas

según su caracterización por los conceptos de la física térmica tradi

cional? La explicación del comportamiento en el nivel macroscópico

debe realizarse sobre la base de su entendimiento como una conse

cuencia de la constitución del sistema macroscópico a partir de sus

partes microscópicas y de las leyes fundamentales que gobiernan la

dinámica de esas partes. ¿Qué tipo de explicación será ésta? Como

veremos, se trata de un esquema explicativo que incorpora, en un ni

vel intermedio, nociones fundamentalmente probabilísticas y estadís

ticas.

Pero ¿en qué se fundamenta la introducción de estos postulados y

suposiciones probabilísticas adicionales? ¿Pueden ser derivados a

partir de la dinámica fundamental por sí misma? ¿O se necesitan

otros postulados fundamentales para introducirlos en la física? Esta

cuestión es muy difícil y compleja. Y es muy importante. Pues de la

respuesta que se dé a esta cuestión se seguirá justamente el tipo de


explicación de los fenómenos macroscópicos que está proporcionan

do la física. Aunque hay casos en los que puede decirse que la gene

ralización en el nivel inferior es explicada por la teoría más funda

mental mediante la derivación de la primera a partir de la segunda,

con, presumiblemente, algunas nociones de aproximación intercala

das, en el caso de la mecánica estadística hay elementos importantes

que juegan un papel en la derivación; éstos son muy diferentes de los

elementos habituales de los modelos filosóficos estándar de la expli

cación estadística de las generalizaciones.

De la termodinámica a la mecánica estadística

TermodinámicaEl fenómeno del calor nos es familiar por nuestra experiencia diaria,

por lo que no es sorprendente que la física intentase entenderlo. Las

primeras tentativas incluyeron el desarrollo de dispositivos tales

como el termómetro diseñados para reemplazar por medidas numéri

cas precisas las impresiones subjetivas de calor y frío que experimen

tamos. Con no poco esfuerzo intelectual se hizo la distinción entre

grado de temperatura y cantidad de calor, siendo lo primero una

cantidad «intensiva» y lo segundo «extensiva». Esto es análogo a la

distinción entre densidad y cantidad de materia respectivamente. Así,

cuando a una cantidad de agua fría se añade una menor cantidad de

agua a una temperatura mayor se obtendrá la misma temperatura

final de la mezcla que cuando se añade una mayor cantidad de agua

a una menor temperatura, de manera que uno podría afirmar que en

los dos casos se añadió la misma cantidad de calor aunque las tempe

raturas fuesen diferentes.

Las primeras tentativas de entender estos resultados considera

ron el calor como un tipo de sustancia o materia, llamada calórico, y

la temperatura como un tipo de medida de la densidad del calórico

en la materia. Cuanto más calórico hubiese en una porción dada de

materia ordinaria, mayor sería la temperatura. Semejante concepción

substantivista hace justicia a muchos resultados experimentales cuan

do se introduce un principio de «conservación del calórico». Pero

hay otros resultados, en particular, la generación de nuevo calor por

acción mecánica o la conversión de calor en acción mecánica (como


en una máquina de vapor alimentada por calor), que no encajan bien

en la concepción del calórico. Ya en un estadio muy temprano, algu

nos pensadores imaginaron que el calor era una suerte de movimien

to de minúsculos componentes del sistema, demasiado pequeños

para ser detectados por los procedimientos ordinarios.

Antes aún de que la teoría del calor como movimiento interno

triunfase, se avanzó notablemente en la formalización de una teoría

del calor. La reflexión acerca de la experiencia de quienes trabajaban

con máquinas de calor condujo a S. Carnot a la importante observa

ción de que la cantidad de calor que podía ser convertida en trabajo

mecánico, incluso en el caso de una máquina perfectamente eficiente,

estaba limitada por la diferencia de temperatura entre el calor intro

ducido en el motor y el calor disipado en su tubo de escape. Esto

condujo inmediatamente a la idea de un cero absoluto de temperatu

ra, la temperatura del calor extraído de un motor que podía transfor

mar todo el calor introducido en trabajo mecánico útil. R. Clausius y

otros desarrollaron una teoría formal del calor a partir de las ideas de

Carnot.

Primero se observó que, si bien el trabajo mecánico y el calor

pueden ser transformados uno en el otro, su cantidad total es inva

riante. Ésta es la llamada Primera Ley de la Termodinámica. Des

pués, el hecho de que la obtención de trabajo útil a partir de calor

requiriese que el calor introducido en el motor estuviese a una ma

yor temperatura que el calor extraído, condujo, tras una brillante re

flexión, al principio general de irreversibilidad, la llamada Segunda

Ley de la Termodinámica. Hay muchas formulaciones sutiles de esta

ley. Una de ellas dice básicamente lo siguiente: Sea un sistema ener

géticamente aislado. Supongamos que algún calor en él se transforma

en trabajo mecánico. Supongamos que el sistema parte de un estado

dado. Entonces, al final del proceso no puede encontrarse en su

estado inicial. Podría suceder que al final del proceso hubiésemos

transformado el trabajo obtenido de nuevo en calor, pero el resulta

do neto del proceso entero será que, si bien el calor total es el mismo

que cuando comenzamos, estará ahora a una temperatura menor y,

por lo tanto, menos «dispuesto» a ser convertido en calor.

La noción de estado de equilibrio de un sistema deviene crucial.

Supongamos que un sistema está aislado energéticamente del resto

del mundo. Más tarde o más temprano alcanzará un estado macros

cópicamente invariable, su estado de equilibrio. Así, una barra de


hierro caliente en un extremo y fría en el otro alcanza un estado uni

forme de temperatura intermedia. Un gas inicialmente en una parte

de una caja alcanza una condición de densidad uniforme en toda la

caja. Una ley «Cero» de la termodinámica nos pide considerar tres

sistemas A, B, C, cada uno en su estado de equilibrio, y donde A y B son tales que cuando se les pone en contacto energético, permanecen

en el mismo estado de equilibrio. Supongamos que lo mismo puede

decirse de B y C cuando se ponen en contacto. Entonces, A y C per

manecerán en sus estados de equilibrio originales cuando se ponen

en contacto. Podemos etiquetar la «comunalidad» de equilibrio en

los sistemas mediante su temperatura común. Finalmente, es necesa

rio introducir el novel concepto de entropía. La entropía sigue de

cerca la «utilidad» del calor para ser convertido en trabajo mecánico.

Mientras la cantidad de calor a una temperatura alta y a una baja pue

de ser la misma, la primera tiene una mayor utilidad como fuente de

trabajo mecánico. Se dice entonces que tiene una entropía menor. Si

llevamos un sistema de un estado de equilibrio a otro, la cantidad de

calor transferida y la cantidad de trabajo mecánico realizado podrán

diferir de un proceso a otro con los mismos estados finales. Pero el

cambio de entropía de un estado a otro será el mismo. Así, los

estados de equilibrio de un sistema tienen una temperatura absoluta

definida y tienen una entropía definida (salvo una constante arbitra

ria). Estas, junto a otras propiedades (como la presión y el volumen

de una parte del gas en equilibrio) mecánicas (o eléctricas, etc.), ca

racterizan completamente la naturaleza de los estados de equilibrio.

El resultado final es, pues, una elegante teoría formal del calor.

Los sistemas tienen estados de equilibrio. En la conversión de uno

de estos estados a otro puede generarse o absorberse trabajo mecáni

co. También puede transferirse energía sin realizarse ningún trabajo.

Esto se llama flujo de calor. Los estados de equilibrio se caracterizan

por su temperatura, de forma que el calor fluye sólo entre sistemas

con temperaturas que difieren unas de otras. La cantidad de trabajo

que se puede obtener en una transición de un estado de equilibrio a

otro depende de la temperatura de los estados. Sólo si el estado final

tiene un cero absoluto de temperatura, se habrá transformado todo

el calor disponible en trabajo mecánico. La transformación de calor

en trabajo es, en máquinas no ideales, irreversible: Esto es, tú no pue

des transformar calor en trabajo en un sistema aislado y hacer a con

tinuación algo más de forma que termines donde habías empezado


con todo el calor tan disponible como al principio para hacer todavía

más trabajo. Puedes obtener trabajo a partir de calor y transformar

entonces el trabajo de nuevo en calor. Terminarás con la misma can

tidad de energía en forma de calor con la que empezaste, pero ya no

estará disponible en la misma forma para ser convertida en trabajo

mecánico. Los estados de equilibrio no tienen solamente propieda

des mecánicas como la presión y el volumen; también tienen una

temperatura determinada y una entropía determinada (o al menos

una entropía determinada en relación al valor asignado arbitraria

mente a un estado). La entropía de un estado indica la disponibilidad

de su energía de calor interno a ser convertida en trabajo, siendo una

baja entropía indicativa dg una alta disponibilidad. Las leyes básicas

de la teoría son la transitividad del equilibrio (la ley Cero), la Conser

vación de la Energía (la Primera Ley), y la Ley de Irreversibilidad (La

Segunda Ley). Algunas veces se añade una Tercera Ley, la imposibili

dad de alcanzar el cero absoluto.

La teoría cinética del calorPara algunos físicos, la teoría de los fenómenos térmicos que acaba

mos de esbozar era plenamente satisfactoria como una teoría autóno

ma fundamental de la física. No veían ninguna razón para reducirla en

alguna forma a una teoría más profunda, ni ninguna necesidad de dar

explicaciones en cuanto a porqué sus proposiciones básicas eran ver

daderas. Pero para otros, la teoría clamaba por una explicación más

profunda. ¿Qué era, en último término, el calor, esa cosa convertible

en, y a partir de energía mecánica? ¿Cuál era la característica de los

sistemas por la que éstos poseían una temperatura específica? ¿Porqué

existían los estados de equilibrio de los sistemas y porqué, admitiendo

que existiesen, tenían la estructura particular que mostraban tener? Y,

lo más importante de todo, ¿cuál era el origen de la extraña asimetría

en el tiempo del mundo, la asimetría revelada en el hecho de que los

sistemas fuera del equilibrio, dejados a su suerte, se movían uniforme

mente hacia la condición de equilibrio, siempre en la dirección futura

del tiempo, y una vez obtenido el equilibrio, permanecían en él?

Aunque la idea de que el calor era un tipo de energía en movi

miento de pequeños componentes del sistema macroscópico, compo

nentes tan pequeños que sus movimientos individuales no eran de-

I6K Filosofía de la física

tcctables directamente a gran escala, fue objeto de especulación por

F. Bacon, J. Bernoulli y otros, fue sólo en el siglo XIX cuando esta idea

logró imponerse. Pero, aun cuando el calor fuese movimiento, ¿qué

tipo de movimiento era? Los sistemas podían, después de todo, tener

una estructura microscópica muy compleja y sutil. Dos pensadores

británicos, J. Herepath y J. Waterston, sugirieron ambos que la situa

ción era muy simple para los gases. Estos estaban formados, dijeron

estos pensadores, por partículas minúsculas que pasaban la mayor

parte de su tiempo en movimiento libre, interaccionando sólo por

colisión unas con otras y con las paredes del recipiente. El contenido

de calor de un sistema era meramente la energía de este movimiento

de sus partes microscópicas. Pero sus sugerencias fueron ignoradas.

Finalmente, cuando estas ideas fueron expuestas por los físicos ale

manes A. Krónig y Clausius, obtuvieron la atención que merecían.

Supongamos un gas en una caja compuesto por partículas peque

ñas en su mayoría en movimiento libre. Si suponemos simplemente

que el calor es la energía total de este movimiento y que está distri

buido uniformemente entre las moléculas, entonces resultados tales

como la Ley de los Gases Ideales, que establece una relación entre la

presión, el volumen y la temperatura del gas en equilibrio, pueden

derivarse fácilmente. La presión. es-al-reoultnckr t lcl -choque de las

partículas con las pare'descfeí recipiente, y la temperatura una medi-

~“da~de sus energías individuales de movimiento. Suponiendo qtre las

moléculas colisionan unas con otras, podemos resolver enigmas tales

como porqué, si las partículas (es decir, las moléculas) están en tan

rápido, casi libre, movimiento, la difusión de un gas de un lado a

otro de una habitación es tan lenta como indica su medición.

El siguíente avarice importante fue la observación hecha por J. C.

Maxwell en el sentido de que la suposición según la cual en el equili

brio cada molécula tenía la misma velocidad era inverosímil. Hacien

do uso de un argumento ingenioso, aunque no del todo convincente,

derivó una curva que establecía una distribución de velocidades para

las moléculas del gas en equilibrio. Algunas se movían muy despacio

y otras muy rápido, mostrando una concentración en torno a un va

lor medio. ¿Podía darse a este resultado una justificación mejor, más

convincente? Aquí L. Boltzmann nos dejó su mayor contribución.

Boltzmann preguntó cómo esperaríamos que evolucionase un gas

que no estuviera en equilibrio. La evolución tendría lugar debido al

movimiento de las moléculas y, en particular, al intercambio de ener


gía entre unas y otras por colisión. ¿Podía demostrarse que si el gas

partía de una distribución de velocidades distinta a la de Maxwell, se

aproximaría por este proceso de intercambio de energía a la distribu

ción de Maxwell para permanecer en ella?

Mediante suposiciones plausibles, una de las cuales la examinare

mos en sus pormenores brevemente, Boltzmann fue capaz de derivar

una ecuación para la evolución de la función distribución de velocida

des. Mostró que la distribución maxwelliana era una solución estacio

naria de la ecuación, de manera que, una vez alcanzada, no cambiaría.

Fue capaz de definir una función distribución de velocidades y de

mostrar que, hasta que esta función no alcanzase su valor mínimo (ob

tenido para la distribución de Maxwell), la distribución de velocidades

no sería éstacionaria. Así pues, la distribución de Maxwell era la única solución estacionaria de la ecuación. En conjunto, esto parecía expli

car porqué un gas fuera del equilibrio evolucionaría hacia el equilibrio

y porqué, una vez alcanzado el equilibrio, permanecería en él.

Pero ahora comenzaron los problemas. Primero, los críticos ad

virtieron que los sistemas estaban supuestamente compuestos por

moléculas que obedecían las leyes de la dinámica clásica. Pero en

tanto que un tal sistema cualquiera esté aislado y la energía se con

serve, lo cual es cierto en este caso, debería evidenciar el resultado

de H. Poincaré: El sistema con punto de partida en un estado diná

mico dado retornaría un número infinito de veces a estados muy pró

ximos al estado original. Pero, entonces, ¿cómo podía tener razón

Boltzmann al afirmar que un sistema inicialmente en un estado de no

equilibrio evolucionaría al estado de equilibrio y permanecería en él?

Otro resultado de la dinámica clásica nos dice que si un sistema evo

luciona desde el estado 51 al estado 52, evolucionará desde un

estado similar al 52, salvo con todas las direcciones de movimiento

invertidas, al «inverso temporal» del estado 51. Llamemos a los

estados invertidos temporalmente 51' y 52'. La evolución de 52' a

51' ', si 52', al igual que 52, describe un estado de equilibrio, y 51', al

igual que 51, un estado de no equilibrio, violaría la ecuación de

Boltzmann, que siempre describe la evolución hacia el equilibrio.

¿Cómo puede entonces la ecuación de Boltzmann ser consistente

con la dinámica clásica? (Véase las figuras 3.1 y 3.2.)

Es en este punto donde las ideas probabilísticas comienzan a ju

gar un papel en las diferentes versiones de la teoría. ¿Podría suceder

que la ecuación de Boltzmann no describa cómo debe comportarse


F ig u r a 3.1. La recurrencia de Poincaré. Trabajamos en el espacio de fases donde un

solo punto representa el estado microscópico exacto de un sistema en un momento

dado, esto es, la posición y velocidad de cada molécula en un gas. Poincaré demuestra

que para ciertos sistemas (un gas encerrado en una caja y aislado energéticamente del mundo exterior es uno de tales sistemas), si un tal sistema parte de un estado microscópico dado, o, entonces, excepto para un número «infinitamente pequeño» de dichos estados iniciales, cuando se sigue la evolución del sistema a lo largo de la curva p, se

encontrará que el sistema, para cualquier región pequeña de microestados en torno al microestado original, o, «regresará» a un microestado en esa pequeña región, E. Así pues, «casi todos» los sistemas de esta índole que parten de un estado dado regresarán en algún momento a un estado microscópico «muy próximo» al estado inicial.

cada sistema, sino sólo cómo se comportarán probablemente los siste

mas? Si bien, entonces esperaríamos una evolución hacia el equili

brio con una probabilidad abrumadora, también esperaríamos casos

raros donde un sistema en no equilibrio evoluciona apartándose aun

más del equilibrio o donde un sistema en equilibrio evoluciona a un

estado de no equilibrio. Pero aquí uno tiene que andar todavía con

mucho cuidado. El teorema de recurrencia de Poincaré nos dice que

podemos estar seguros probabilísticamente de que los sistemas que

parten de una condición dada de no equilibrio regresarán en algún

momento a una condición de no equilibrio tan próxima como uno

quiera a aquélla de la que partieron. Así, ¿cómo puede ser probable

una aproximación monótona al equilibrio? Además, para toda evolu

ción del no equilibrio al equilibrio, hay una posible evolución inver

sa. Entonces, ¿no deberían ser las evoluciones en ambas direcciones

igualmente probables?

La respuesta de Boltzmann, aclarada por P. y T. Ehrenfest, pre

senta varias componentes importantes. Primero está el descubrimien

to de Boltzmann de una nueva forma de derivar la distribución de

velocidades en el equilibrio. Imaginemos todas las formas posibles en

que las moléculas se pueden colocar en «cajas» pequeñas en un espa-


b S(b) > S(a)

• a'

S(b') > S(a')F ig u r a 3.2. E l argumento de Loschmidt sobre la «reversibilidad». Sea un sistema que parte de un microestado a y evoluciona a un microestado b. Supongamos, como es de esperar, que la entropía del estado b, S(b), es mayor que la del estado a, S(a). Entonces, dada la invariancia bajo inversión temporal de las leyes dinámicas subyacentes que rigen la evolución del sistema, debe haber un microestado, b', que evoluciona a un microestado, a \ y tal que la entropía de b’ es igual a la de b y la entropía de a' es igual a la de a (según la definición por Boltzmann de entropía estadística). Así pues, a cada evolución «termodinámica» en la que la entropía aumenta debe corresponder una po

sible evolución «antitermodinámica» en la que la entropía disminuye.

ció abstracto, correspondiendo a pequeñas regiones de posición y mo

mento. El momento es crucial aquí: si utilizamos la velocidad o la

energía obtendremos resultados erróneos. Al mover una molécula de

una caja a otra, obtenemos un nuevo ordenamiento. No obstante, mu

chas permutaciones de las moléculas pueden corresponder a un mis

mo estado de «combinación», es decir, un estado caracterizado por

números de moléculas en cada caja, irrespectivamente de qué molécu

la particular se encuentre en cada caja. La distribución de equilibrio

es el estado de combinación correspondiente a la combinación domi

nante obtenida por un número ostensiblemente grande de permuta

ciones de las moléculas en las cajas. En general, las combinaciones

cerca del equilibrio son obtenibles por un amplio número de permu

taciones. Las combinaciones correspondientes a los estados macroscó

picos lejos del equilibrio son obtenibles sólo por un número muchísi

mo menor de permutaciones. Si consideramos que cada permutación


Vv---- 'r - \ i—y - y

sistema

F ig u r a 3 .3 . La imagen «simétrica en el tiempo» de Boltzmann. En esta imagen del mundo, se propone que un sistema aislado cuya entropía es Ssl¡lrm «a lo largo de un tiempo infinito» pasa casi todo el tiempo en estados con entropía próxima al valor máximo, Smáxlmi¡, esto es, en el estado de equilibrio. Hay fluctuaciones aleatorias del sistema fuera del equilibrio. Cuanto mayor sea la fluctuación de un sistema a partir del equilibrio, con menor frecuencia se dará. La imagen es simétrica en el tiempo. Si encontramos un sistema lejos del equilibrio, deberíamos esperar que en el futuro se encontrase más cerca del equilibrio. Pero también deberíamos inferir que en el pasa

do estuvo asimismo más cerca del equilibrio.

es igualmente probable, en virtud de algún principio de indiferencia o

simetría, ¿no podríamos concebir el equilibrio como el estado «osten

siblemente más probable» del sistema?

Deberíamos entonces pensar en la situación como sigue: Un siste

ma dado, observado durante todo el tiempo y perpetuamente aislado,

pasará casi todo el tiempo en o cerca del equilibrio. Se darán desvia

ciones del equilibrio, pero cuanto mayor sea la desviación, menor será

su ocurrencia. La situación será simétrica en el tiempo, con transicio

nes desde el no equilibrio al equilibrio, y viceversa, con igual frecuen

cia. Todavía se cumplirá, sin embargo, que casi todo estado lejos del

equilibrio estará seguido por estados mucho más próximos al equili

brio, como establece la ecuación de Boltzmann. (Véase la figura 3.3.)

No es posible, empero, considerar que la ecuación de Boltzmann

da la evolución más probable de un sistema en un tiempo infinito,

porque esto entraría en conflicto con la recurrencia. Antes bien, la si

tuación debería verse de la siguiente forma: Tomemos una gran colec

ción de sistemas que parten todos de un estado de no equilibrio en

un momento dado determinado. Examinémoslos en intervalos discre

tos de tiempo, observando en cada intervalo de tiempo el estado del

sistema que puede ser obtenido por la mayoría dominante de siste

mas. Dibujemos una curva a través de esos estados evolventes «más

probables». Esa curva, la «curva de concentración» de la evolución de

la colección, obedecerá la ecuación de Boltzmann. Prácticamente

todos los sistemas se apartarán en algún momento del equilibrio, pero

estos excursos serán incoherentes, produciéndose en momentos dife


Smax

Si

F ig u r a 3.4. La «curva de concentración» de una colección de sistemas. Sé considera

una colección de sistemas cuyos miembros tienen cada uno una entropía S¡ en el tiempo 1. Los sistemas evolucionan de acuerdo con sus microestados particulares departida en el tiempo inicial. En tiempos posteriores, 2, 3, 4, 5, 6....... la colección seexamina de nuevo. En cada tiempo una considerable mayoría de los sistemas tienen entropías en o cerca de los valores Sp -Vj, S„ 5̂ , ... , que están señalados sobre la «curva de concentración». Esta curva puede aproximarse monótonamente al valor de

equilibrio Smx, aun cuando casi todos los sistemas, individualmente, se aproximen y

se aparten de la condición de equilibrio en la manera ilustrada en la figura 3.3.

rentes para los diferentes sistemas. Después de un largo tiempo, casi

todos los sistemas se encontrarán en cualquier instante dado cerca del

equilibrio, tal como exige la ecuación de Boltzmann bajo esta nueva

interpretación. Así pues, esta interpretación probabilística de la ecua

ción de Boltzmann es consistente con los resultados de la recurrencia.

(Véase la figura 3.4.)

Pero necesitamos ir más lejos en nuestra reflexión. Si, como sugie

re esta nueva interpretación, el equilibrio es la condición «ostensible

mente más probable» de un sistema, ¿porqué se encuentra el mundo

en el que vivimos tan inmensamente lejos del equilibrio? Boltzmann

ofrece una serie de argumentos para soslayar esto. Primero, dice, el

universo es muy extenso en el espacio y en el tiempo. Podemos pos

tular, pues, que la región accesible a nuestra observación es muy pe

queña. Recordemos que este trabajo se estaba llevando a cabo en los

años ochenta del siglo XIX y que la existencia de galaxias fuera de la

Vía Láctea no se estableció hasta algún tiempo después. Ahora bien,

esperamos que partes pequeñas de sistemas grandes estén, durante

pequeños lapsos de tiempo, en estados lejos del equilibrio. Así, pode

mos entender el no equilibrio prevalente que experimentamos como

una «fluctuación local» en torno a una situación de equilibrio preva

lente.

17-4 Filosofía de la física

A continuación podríamos preguntar cómo es que nosotros nos

encontramos en una parte tan singular del universo en lugar de en la

región dominante de equilibrio espacio-temporal. Aquí la respuesta

hace referencia a un tipo especial de sesgo observacional. Para que

pueda haber organismos sostenidos, complejos (como nosotros mis

mos), capaces de realizar observaciones, debe haber flujos de energía.

Solamente éstos pueden contrarrestar el proceso normal de equilibrio

y mantener operando a un organismo activo sumamente estructurado

como es una forma de vida. Pero tal flujo de energía presupone una

situación de no equilibrio. Así pues, si ha de haber observadores,

éstos deben de encontrarse en las partes pequeñas, desviadas, en no

equilibrio del universo.

Ahora bien, es ostensiblemente probable que dicha parte del uni

verso que se encuentra fuera del equilibrio sea una que esté todavía

más lejos del equilibrio en una dirección temporal y más cerca en la

otra. Estas son mucho más corrientes que los raros casos extremos de

partes del universo que son puntos de retorno donde la región está

más cerca del equilibrio en ambas direcciones temporales, y aun más

probables relativamente que los casos extraordinariamente raros de

un estado lejos del equilibrio flanqueado en ambas direcciones tem

porales por estados todavía más lejos del equilibrio.

Pero, ¿porqué, en nuestra parte del universo, habríamos de hallar

a los estados más próximos al equilibrio en la dirección futura del

tiempo y no en la dirección pasada del tiempo? ¿No son las dos op

ciones igualmente probables? En este punto, Boltzmann sostiene que

lo que entendemos por dirección futura del tiempo es la dirección del

tiempo en la que aumenta la entropía local, es decir, la dirección del

tiempo en la que nuestro trozo local de universo se está aproximando

al equilibrio. Sostiene que la dirección del tiempo que se toma como

futuro será, probablemente, opuesta en regiones separadas del univer

so en las que el proceso hacia el equilibrio se da en direcciones tem

porales opuestas. Esto es como el «abajo» para alguien situado en

nuestras antípodas sobre la tierra, que se encuentra en la dirección es

pacial opuesta a nuestro «abajo». Y, dice, en la parte en equilibrio

prevalente del universo, no habrá distinción entre pasado y futuro,

aunque todavía habrá, por supuesto, dos direcciones opuestas del

tiempo. La analogía ahora se establece con el espacio vacío, donde

todavía existen todas las direcciones espaciales, pero donde ninguna

de ellas es «abajo» al no existir una dirección local de la fuerza gravi-


tacional. Examinaremos críticamente estas brillantes ideas boltzman-

nianas brevemente.

La concepción ergódica de la mecánica estadística

Maxwell y Boltzmann aportan ocasionalmente un tratamiento algo di

ferente de la situación de equilibrio. La idea ahora es considerar una

colección infinita de sistemas similares al sistema en cuyos aspectos

macroscópicos específicos uno está interesado. Uno podría, por ejem

plo, considerar un gas con una energía interna determinada de sus

moléculas y encerrado en tin contenedor de tamaño estipulado. Uno

imagina entonces una colección en la que sus miembros tienen todos

la misma energía interna que el gas dado y están encerrados en conte

nedores del mismo tamaño, pero en la que cada uno de sus miembros

posee una condición microscópica de sus microcomponentes diferen

te. Esto es, uno considera muestras del gas con características macros

cópicas constantes, pero donde se actualizan todas y cada una de las

posibles posiciones y momentos individuales de sus moléculas.

A continuación se asigna una cierta distribución natural de proba

bilidades a estas condiciones microscópicas, de forma tal que el

estado microscópico de un caso situado en una serie específica de di

chos estados tenga una probabilidad definida. La distribución elegida

es casi inevitable. Se deduce, una vez más, aplicando un principio de

indiferencia o simetría. Pero, como indicamos en la sección sobre pro

babilidad, la aplicación de dicho principio significa ya la elección de

una caracterización preferida del sistema, que debe ser de suyo justifi

cada. Uno puede probar que la distribución de probabilidades especi

ficada no cambiará en el tiempo. Esto es, mientras cada gas en la co

lección sufrirá un cambio de estado microscópico, el número total de

sistemas con sus estados en una región dada permanecerá constante,

aun cuando los estados de algunos sistemas habrán abandonado esta

región y los estados de otros sistemas habrán entrado en la región.

Así, esta probabilidad parece natural para describir el equilibrio, un

estado macroscópico invariable.

A continuación identificamos los observables macroscópicos

(como la presión) con promedios de una función de los microestados

del sistema, donde los promedios se calculan utilizando la distribu

ción de probabilidades en cuestión. Es fácil demostrar que cuando


esto se hace, las cantidades calculadas estarán relacionadas entre sí

como encontramos que lo están en los sistemas en equilibrio en el

mundo.

Este método para calcular los valores de equilibrio, identificándo

los con «promedios de fases» sobre una colección (o «conjunto») de

sistemas sujetos todos ellos a las mismas ligaduras macroscópicas, fue

formalizado y generalizado por J. Gibbs. Gibbs desarrolla conjuntos

(esto es, distribuciones de probabilidad sobre microestados del siste

ma) no solamente apropiados para sistemas energéticamente aislados,

sino también para los casos importantes de sistemas mantenidos en

contacto energético con una fuente de calor a temperatura constante

y de sistemas que pueden intercambiar moléculas con un manantial

exterior.

Observemos que hay algunas diferencias sutiles entre este método

y el enfoque alternativo de Boltzmann. Antes concebimos el estado de

equilibrio como el estado microscópico «ostensiblemente más proba

ble» del sistema. Ahora las cantidades de equilibrio se conciben, no

ya como cantidades válidas en los microestados ostensiblemente pro

bables, sino como promedios de cantidades sobre todos los estados

microscópicos posibles, incluyendo aquellos que son menos proba

bles. Sólo si la distribución de probabilidades sobre los estados mi

croscópicos tiene la propiedad de ser simétrica y estar sumamente

concentrada en torno el estado más probable, serán iguales (en gene

ral) las dos cantidades. Puede demostrarse, en el caso de las distribu

ciones de probabilidad utilizadas en la mecánica estadística y de las

cantidades calculadas con ellas, que las dos formas de calcular los va

lores de equilibrio coincidirán entre sí.

Si bien la imagen presentada por Boltzmann, y por quienes han

explicado su trabajo, posee alguna plausibilidad, y si bien esta nueva

explicación evita las contradicciones obvias con la dinámica subya

cente presentes en nuestro anterior entendimiento de la teoría,

todavía quedan muchos problemas por resolver. Una cosa es postular

una imagen semejante del comportamiento de los sistemas; otra muy

diferente es justificar la afirmación de que los sistemas se comporta

rán según esta nueva descripción; y otra aún es explicar porqué los sis

temas se comportan en esa forma boltzmanniana si es que, efectiva

mente, lo hacen.

Una de las primeras tentativas de justificar parte de los procedi

mientos estándar de lo que ahora puede denominarse mecánica esta-


F i g u r a 3 .5 . La Hipótesis Ergódica. Sea un sistema que parte de cualquier microestado, representado por un punto a en el espacio de fases. Supongamos que c representa

cualquier otro microestado posible para el sistema. La Hipótesis Ergódica postula

que en un tiempo futuro u otro el sistema que partió en el estado a pasará eventualmente por el estado c. Pero el postulado es, de hecho, probablemente falso.

dística fue una sugerencia temprana de Boltzmann que, si se la pudie

ra hacer funcionar, justificaría la elección de la distribución de proba

bilidades estándar utilizada en el conjunto de equilibrio para un siste

ma energéticamente aislado, al tiempo que aportaría una justificación

parcial de su concepción de que un sistema a lo largo de un tiempo

infinito pasaría casi todo su tiempo cerca del equilibrio. Supongamos,

dice Boltzmann, que el estado dinámico microscópico de cualquier

sistema individual pasa en algún momento por todos y cada uno de

los estados dinámicos microscópicos compatibles con las ligaduras del

sistema. Estas ligaduras podrían venir dadas, por ejemplo, por la ener

gía total invariable del sistema y por el volumen de la caja en la que

se encuentra confinado. Llamemos a esta suposición la Hipótesis Er

gódica. (Véase la figura 3.5.)


Muchas cosas se seguirían de la Hipótesis Ergódica si fuera cierta.

A partir de ella, uno podría demostrar que la distribución de probabi

lidades estándar no es sólo una distribución estacionaria bajo evolu

ción dinámica, sino que es la única distribución de dicha índole. Uno

podría no sólo demostrar que un sistema, a lo largo de un tiempo infi

nito, pasará casi todo su tiempo en o cerca del equilibrio, sino demos

trar incluso que el tiempo que el sistema pasa con su microestado en

una región particular de microestados será justamente esa proporción

de tiempo que la región tiene como una proporción del conjunto de

todos los microestados accesibles de acuerdo con la medida de proba

bilidad estándar. Esto permitiría identificar la «probabilidad» de un

microestado (determinada según la distribución de probabilidades es

tándar) con un tipo más físico de probabilidad, a saber, la proporción

de tiempo que el sistema pasa con su microestado dotado de una ca

racterística determinada. Todo esto será válido, sin embargo, sólo en

el límite de tiempo infinito. Si uno utilizase entonces el gran número

de grados de libertad de un sistema (su vasto número de moléculas) y

la naturaleza especial de las funciones utilizadas para calcular caracte

rísticas macroscópicas observables, contaríamos con una justificación

bastante completa de la identificación de los valores medios calcula

dos por medio de la medida de probabilidad estándar con los «valo

res ostensiblemente probables». Entonces, si consideramos el equili

brio como el estado ostensiblemente probable, contaríamos con una

justificación para considerar los valores medios de los conjuntos

como representativos del equilibrio.

Vaya, Boltzmann no pudo demostrar que la Hipótesis Ergódica

era cierta. De hecho, es falsa y puede demostrarse que lo es por me

dio de razonamientos topológicos (o de medida-teóricos) muy genera

les. Pero, como veremos, una modificación de la idea boltzmanniana

ha resultado ser inmensamente fructífera. '

La justificación de las afirmaciones de la teoría del no equilibrio

que describe la aproximación al equilibrio de sistemas que partieron

de ese estado es todavía más problemática. La nueva imagen boltz

manniana sugiere esto: Si partimos de la colección de todos los siste

mas posibles en un estado dado de no equilibrio, seguimos su evolu

ción en el tiempo, y tomamos nota del estado dominante de los

sistemas en cada instante, la curva a través de esos estados dominan

tes será la curva generada como solución de la ecuación de Boltz

mann. Pero, ¿lo será? Y si lo es, ¿por qué lo es? La forma en que los

La introducción de la probabilidad en ia física 179

sistemas se comportarán en realidad dependerá de dos cosas: el

estado dinámico microscópico del que partieron y las leyes de la di

námica que determinan cómo evolucionarán sus estados dinámicos

microscópicos a partir de ese estado inicial.

Así, una teoría estadística perfecta del no equilibrio nos debería

decir qué probabilidad atribuir a una clase de estados microscópicos

iniciales de sistemas preparados en una condición inicial dada de no

equilibrio. Nos debería explicar también por qué tenemos derecho a

esperar que esta distribución de microestados iniciales represente

verdaderamente, de algún modo apropiado, la distribución de los

estados iniciales de los sistemas reales en el mundo. Además, la teo

ría nos debería explicar cómo" es que cuando la colección de sistemas

evoluciona en el tiempo, sufriendo cada sistema individual un cam

bio de microestado de acuerdo con las leyes dinámicas dadas, la dis

tribución de probabilidades de las colecciones de sistemas, esto es, la

proporción de sistemas que se encuentran en dominios determinados

de microestados posibles, evolucionará de forma tal que las últimas

colecciones se parecerán cada vez más a la distribución de probabili

dades correspondiente al equilibrio.

Muy pronto se advirtió que Boltzmann, en la derivación de su fa

mosa ecuación de evolución, se había valido de una suposición cru

cial. Al describir la evolución de las moléculas de un gas simple, su

puso que la frecuencia de las colisiones en las moléculas con una

velocidad dada sería proporcional a la fracción de moléculas en el

gas con esa velocidad. Esta es su famosa Hipótesis Relativa a los N ú

meros de Colisión. Se supone que no hay una correlación especial

entre las moléculas antes de la colisión. La evolución de la colección

de gases hacia la colección de equilibrio en la versión estadística de

la teoría depende de una suposición similar, el Postulado del Caos

Molecular. Se supone que, no sólo al comienzo de la evolución, sino

también en cada instante posterior, puede aplicarse un postulado de

«aleatoriedad» de las colisiones de las moléculas. Pero la evolución

del conjunto está fijada por el conjunto inicial y por la evolución di

námica determinista de cada gas en la colección. ¿Es, entonces, consistente con la colección inicial apropiada y estas leyes el postular la

validez del Caos Molecular? Evidentemente, si la evolución está to

talmente determinada por el estado inicial y las leyes, uno debe justi

ficar la legitimidad de hacer tal suposición de realeatoriedad. Explo

raremos esto brevemente.


Es importante observar que es justamente dicha suposición de

realeatoriedad, aplicada a las moléculas antes, pero no después, de

que colisionen, lo que aporta el origen de la asimetría temporal de la

ecuación de Boltzmann y de su solución, describiendo la aproxima

ción temporal-asimétrica al equilibrio en el futuro, pero no en el pa

sado. Pero las leyes de la dinámica no muestran dicha asimetría tem

poral. ¿Dónde se introduce físicamente? ¿Hay asimetrías ocultas en

las leyes de la dinámica? ¿Es nuestra idealización del sistema como

aislado del resto del mundo una idealización errónea? O ¿es el ori

gen de la asimetría algo sobre la naturaleza física del mundo que ha

ce de un conjunto inicial apropiado — uno que genera la asimetría en

el tiempo de la descripción probabilística conjuntista del mundo y, a

continuación, captura en nuestra teoría la asimetría observada del

mundo como se expresa en la Segunda Ley de la Termodinámica—

el correcto para ser elegido? Semejantes cuestiones, como veremos,

siguen siendo frecuentes en los fundamentos de esta disciplina.

El problema de la irreversibilidad y las tentativas de resolverlo

Los años que siguieron a este trabajo pionero en mecánica estadística

presenciaron un enorme progreso. La ampliación de los primeros tra

bajos con el objeto de aplicarlos a sistemas más generales que los ga

ses rarificados de los primeros estudios significó un gran avance. La

teoría de los sistemas en equilibrio ha sido generalizada para abarcar

sistemas tales como los gases densos, y sistemas de índole radical

mente diferente como la radiación en interacción con la materia. Sin

embargo, no se ha logrado un éxito comparable con la generalización

de la teoría del no equilibrio a los gases no densos, pues los métodos

de solución aproximada, que funcionan bien en el problema del

equilibrio, dejan de hacerlo normalmente cuando lo que se intenta

generalizar son las ecuaciones de no equilibrio. Pero incluso aquí se

ha realizado un progreso significativo.

Lina revisión fundamental de la teoría se dio cuando la dinámica

clásica, empleada para describir el comportamiento de los constitu

yentes microscópicos en la teoría original, fue reemplazada por una

nueva teoría dinámica fundamental, la mecánica cuántica. Tal y como

veremos en el capítulo 4, la mecánica cuántica comporta su propia

descripción probabilística de la evolución de los sistemas en el tiem


po. Pero la concepción estándar es que sigue siendo imposible elimi

nar los elementos probabilísticos de la mecánica estadística, pues

describen un aspecto probabilístico del mundo más allá de cualquie

ra de los aspectos probabilísticos descritos al nivel mecánico-cuánti

co. El problema de reconciliar la teoría estadística, o probabilística,

que aporta un fundamento a la termodinámica, con la teoría dinámi

ca subyacente, pues, continúa siendo un problema abierto, aun cuan

do la teoría dinámica subyacente sea la mecánica cuántica. De hecho,

por ciertas razones técnicas, algunos de los argumentos justificativos

y explicativos que discutiremos en esta sección, argumentos que pre

suponen la dinámica clásica como teoría dinámica subyacente, dejan

de ser válidos en el nuevo contexto dinámico. Los fundamentos de

los postulados probabilísticos de la mecánica estadística resultan de

algún modo más difíciles de explicar, en lugar de más fáciles, en el

nuevo marco dinámico.

Aparte de en la generalización de la teoría y en su reconstrucción

sobre la nueva base dinámica, se ha realizado un enorme trabajo para

suministrar la justificación fundacional de la teoría, cuya necesidad

ya discutimos anteriormente. El programa general consiste en ver

qué parte de la postulación probabilística incluida en la teoría de la

mecánica estadística puede demostrarse que es no autónoma. Esto

es, deseamos averiguar hasta qué punto puede dotarse a las suposi

ciones probabilísticas (y a su uso en el cálculo de cantidades observa

bles) de un fundamento explicativo en fuentes no probabilísticas. En

particular, con lo que tenemos que trabajar es con los hechos sobre

la estructura de los sistemas en cuestión (que el gas está formado por

moléculas y está encerrado en una caja, por ejemplo) y los hechos so

bre la teoría dinámica subyacente (que las moléculas se mueven en

una forma especificada por la dinámica clásica, que su intercambio

de energía por colisión viene también descrito por esa teoría, etcéte

ra). ¿En qué medida podemos derivar los postulados requeridos por

la mecánica estadística de las características dinámicas fundamentales

del sistema? Entre los elementos de la mecánica estadística que que

rríamos deducir se encuentran la distribución de probabilidades es

tándar utilizada en la teoría del equilibrio, la identificación de canti

dades observables en el equilibrio con promedios derivados de su

distribución de probabilidades, el Postulado de Caos Molecular utili

zado en la teoría del no equilibrio, etcétera. Y si algunas de las supo

siciones probabilísticas básicas de la mecánica estadística no fuesen


derivables de la estructura del sistema y de su dinámica subyacente,

¿qué cabida puede darse a las mismas en el mundo descrito por la fí

sica? Y si son postulados autónomos ¿cuál es la razón física que los

hace verdaderos?

Dado que el resto de esta sección sobre el problema de la irre-

versibilidad es bastante denso, permitidme esbozar la estructura que

tendrá. Primero examinaremos algunas tentativas de entender el

estado de equilibrio. Después discutiremos el problema general de la

aproximación al equilibrio. Acto seguido, distinguiremos algunos de

los enfoques «no ortodoxos» sobre el problema del equilibrio más

estándar. Luego examinaremos algunas variaciones del enfoque es

tándar de estas cuestiones. A continuación, examinaremos el proble

ma de caracterizar la distribución de probabilidades inicial que ha de

suponerse. Finalmente, examinaremos algunas tentativas de dar cuen

ta del problema fundamental de la irreversibilidad de los sistemas

que introducen resultados sobre la estructura global del cosmos en la

argumentación.

Caracterizando el equilibrioExaminemos primero el caso de la teoría del equilibrio. Como indi

camos anteriormente, el procedimiento estándar para calcular los va

lores de equilibrio de cantidades observables consistía en identificar

esas cantidades con los valores medios de ciertas funciones del

estado microscópico del sistema. El valor medio se calcula utilizando

la distribución de probabilidades estándar. La «imagen» de Boltz

mann de la justificación de este procedimiento era que el sistema ais

lado se encontraría en casi todo momento en o cerca del equilibrio.

Dado que la medida de probabilidad estándar podía interpretarse en

el sentido de indicar la proporción de tiempo que un sistema pasa

con su. microestado en una región determinada de condiciones, y da

do que, además, los estados ostensiblemente más probables prevale

cían absolutamente sobre los otros, de manera que los valores me

dios podían ser identificados con los valores más probables, el valor

medio de una cantidad, calculado según la medida de probabilidad

estándar, sería igual a su valor ostensiblemente más probable. Éste

sería entonces su valor de equilibrio. Según indicamos, se logró dar

una justificación de estas afirmaciones utilizando la Hipótesis Ergódi-


ca —que el microestado de cualquier sistema pasaría por todos y ca

da uno de los microestados posibles en algún momento de su evolu

ción— . Pero la Hipótesis Ergódica era presumiblemente falsa. ¿Po

dría encontrarse algo que poner en su lugar?

Se probó un teorema en el sentido de que si un sistema satisfacía

una cierta ligadura determinada (esencialmente, la ausencia de cual

quier constante de movimiento «global» que no fuesen las utilizadas

para especificar el sistema), los promedios de fase para cantidades,

calculados utilizando la medida estándar, serían iguales a los prome

dios temporales de esas cantidades, al menos para la mayoría de los

sistemas. Esto es, excepto para un conjunto de sistemas con una pro

babilidad de tamaño cero en la medida estándar, el promedio sobre

un tiempo infinito de una cantidad para un sistema dado a medida

que los sistemas evolucionaban sería igual al promedio de esa canti

dad tomado sobre todos los sistemas en un mismo instante, utilizan

do la medida de probabilidad estándar para especificar el número de

sistemas con sus microestados en un dominio dado de dichos mi

croestados. Si esta condición se cumpliese, uno podría probar que,

para «casi todos» los sistemas, el tiempo pasado por el sistema en un

dominio de microestados determinado (en el límite de tiempo ten

diendo a infinito) sería igual a la probabilidad de ese dominio de mi

croestados en la medida de probabilidad estándar. Así pues, podría

derivarse una cierta «ley de los grandes números», a saber, que en el

límite de tiempo infinito, las proporciones temporales eran iguales a

probabilidades, aun cuando, en este caso, no estuviésemos tratando

con series probabilísticamente independientes sino, antes bien, con

una evolución determinista. Y uno podría probar, si la condición se

cumpliese, que la única medida de probabilidad que (1) era invarian

te en el tiempo y (2) asignaba una probabilidad cero a las clases de

microestados que tenían probabilidad cero en la medida estándar,

era la propia medida estándar. Estos resultados se aproximan a los

obtenidos utilizando la falsa Hipótesis Ergódica. (Véase figura 3.6.)

Pero ¿satisfacen los sistemas interesantes alguna vez la condición

en cuestión? Primero se encuentra una condición dinámica para que

un sistema sea ergódico (es decir, para que satisfaga la condición del

teorema esbozado). Se trata de una condición sobre la inestabilidad

de los caminos de evolución de los sistemas en sus descripciones mi

croscópicas y, esencialmente, exige que para cada microestado haya

microestados próximos tales que la evolución de los sistemas a partir


F ig u r a 3.6. E l teorema ergódico. Sea un sistema que parte de un microestado, a. Sea

R una región cualquiera de microestados posibles del sistema dadas sus ligaduras. D ichas ligaduras podrían ser una especificación, por ejemplo, de la energía total del gas. Supongamos que R tiene un tamaño definido, distinto de cero, en el espacio de fases. Entonces, cuando un sistema es ergódico, sucederá que, excepto posiblemente para

un conjunto de microestados iniciales de tamaño cero, la trayectoria desde el microestado inicial a pasará en algún momento por la región R.

de ellos diverja de la evolución del sistema dado muy rápidamente.

Después se demuestra cómo ciertos modelos de sistemas satisfacen

esta condición dinámica y, por lo tanto, son sistemas ergódicos. En

particular, el sistema formado por «esferas rígidas en una caja» es

uno de tales sistemas ergódicos. Las partículas deben interaccionar

sólo instantáneamente por colisiones entre sí y con las paredes de la

caja, y las colisiones deben ser perfectamente elásticas. Perfectamente

elásticas significa que no se absorbe o se emite energía alguna en las

colisiones. Como este modelo es uno de los modelos estándar adop

tado para los gases ideales, parece que hemos encontrado un tipo de

justificación de la teoría del equilibrio utilizando solamente la estruc


tura del sistema y las leyes de la dinámica que gobiernan los micro-

componentes.

Estos resultados son impresionantes. Pero debemos ser cautelo

sos. Para empezar, está el problema del «conjunto de medida cero».

Con la ayuda de los resultados ergódicos podemos demostrar que,

excepto para un conjunto inicial de condiciones iniciales de probabi

lidad cero en la medida de probabilidad estándar, todo sistema pre

sentará promedios temporales de sus cantidades iguales a los valores

medios calculados utilizando la probabilidad estándar. Pero, ¿por

qué suponer que, sólo porque un conjunto tenga probabilidad cero

en la medida estándar, es muy poco probable que un sistemé en el

mundo tenga una condición inicial semejante? Nuevamente, pode

mos demostrar que de todas las distribuciones de probabilidad que

asignan probabilidad cero a aquellos conjuntos con probabilidad

cero en la distribución de probabilidades estándar, sólo la distribu

ción de probabilidades estándar es constante en el tiempo. Pero, ¿por

qué restringir nuestra atención justamente a esas distribuciones de

probabilidad que «ignoran» (es decir, dan probabilidad cero a) los

conjuntos que tienen probabilidad cero en la medida estándar? Es

como si hubiésemos reemplazado nuestro postulado probabilístico

original, según el cual la medida de probabilidad estándar da la pro

babilidad correcta, por una suposición de probabilidad autónoma,

más débil, pero aún no trivial, a saber, que los miembros del conjun

to de condiciones iniciales que tiene probabilidad cero en la medida

estándar pueden ser ignorados. Estamos suponiendo que podemos

esperar con «certeza probabilística» que éstos no ocurrirán.

Otro importante problema se deriva del hecho de que, si bien las

condiciones necesarias para que el Teorema Ergódico sea válido son

probablemente ciertas para tales sistemas idealizados como el de las

esferas rígidas en una caja, probablemente no lo sean para sistemas

más realistas. Las moléculas en un gas no son esferas rígidas perfectas

que permanecen sin interaccionar unas con las otras o con las pare

des del contenedor hasta que se produce la colisión. En lugar de ello,

se da una interacción suave y gradual de las moléculas entre sí y de

las moléculas con las paredes, una interacción que varía con la sepa

ración de los componentes interactivos. En mecánica hay otro teore

ma, el Teorema de Kolmogorov-Arnold-Moser (o KAM), el cual nos

dice que en ciertos casos determinados habrá regiones en el espacio

de fases cuya medida es distinta de cero y tales que el estado de todo


F ig u r a .3.7. E l teorema KAM. La curva cerrada, S, representa un sistema que parte

de un estado inicial dado, pasa a través de una serie de estados intermedios y regresa

después a su estado inicial exacto, repitiendo el proceso ad infinitum. Un ejemplo podría ser un planeta que, imperturbado, repite una órbita cerrada indefinidamente. E l teorema KAM dice que para sistemas que satisfacen sus requisitos, una perturbación

suficientemente pequeña del sistema (digamos, del planeta por el tirón gravitacional de otro planeta) producirá una órbita que, aunque ya no será cerrada, estará confinada a una región finita (indicada por el tubo Tí circunscribiendo (en el espacio de fases) la curva inicial S. Un sistema semejante no puede entonces ser ergódico y «vagar» por todo el espacio de fases disponible.

sistema cuyas condiciones iniciales estén en dicha región permanece

rá en la misma durante todo el tiempo. Estos sistemas poseen una es

tabilidad que les impide transitar por todos los lugares de la región

de microestados permitida, tal como requiere la ergodicidad. Aunque

no podemos (en general) probar que los sistemas realistas tengan la

condición necesaria para que se cumpla el Teorema KAM, es muy

plausible que lo hagan. Así pues, las idealizaciones más realistas de

un sistema no satisfarían las condiciones para la ergodicidad. (Véase

la figura 3.7.)

Lo que uno desearía demostrar en estos casos sería algo más mo

desto que la ergodicidad. Uno utilizaría el hecho de que los sistemas

reales de los que nos ocupamos están constituidos por un vasto nú

mero de microcomponentes tales como moléculas. Esto no se toma

en cuenta en absoluto en los resultados ergódicos. Después uno in


tentaría demostrar que, para tales sistemas, la región de las trayecto

rias estables, requerida por el Teorema KAM, se hace muy pequeña

en la medida de probabilidad natural a medida que crece el número

de componentes en el sistema. Efectivamente, los modelos de orde

nador parecen demostrar que esto es cierto. La región restante de

inestabilidad no tendría por qué ser tan caótica como la región ines

table del sistema ergódico. Pero, aun cuando no se pudiera probar la

validez de la ergodicidad en la región de fases como un todo, ni si

quiera en la región de inestabilidad dominante, quizá uno pudiera

demostrar que en esta región se daba un tipo de inestabilidad. Esta

región constaría de la inmensa mayoría de los estados iniciales si se

medía en la forma natural. Esto sería suficiente para obtener algo pa

recido a los resultados de Boltzmann. Es decir, sería suficiente para

garantizar que el comportamiento a largo plazo de las trayectorias

que hubieran arrancado de esta región podía ser modelado por las

probabilidades estándar. La exploración de posibilidades como ésta

es un proyecto de investigación en curso en los fundamentos de la

mecánica estadística. Sin embargo, aun cuando se obtuvieran dichos

resultados, su aplicación requeriría la suposición de que las regiones

pequeñas de estabilidad en la medida de probabilidad natural fueran

realmente «pequeñas» en el mundo. Necesitaríamos demostrar que

es poco probable físicamente encontrar un sistema con su microesta-

do en una tal región de estabilidad. Esto no sería derivable de la di

námica subyacente.

Finalmente, deberíamos de reparar en la estructura de las expli

caciones estadísticas ofrecida por esta teoría del equilibrio. ¿Cómo

son explicadas probabilísticamente las características de equilibrio de

los sistemas por esta teoría? No se demuestra que éstas son las carac

terísticas de los sistemas que encontramos con gran probabilidad en

el mundo. De hecho, si esto se llegase a demostrar, nos encontraría

mos con un problema, pues, como sabemos, existe una alta probabi

lidad de que encontremos sistemas en el mundo que no están en

equilibrio. La teoría tampoco muestra en forma alguna que las ca

racterísticas del equilibrio sean más probables de lo que hubiése

mos esperado por la evidencia de fondo. Y tampoco aporta un tipo

de explicación estadístico-causal del equilibrio. No deriva el equili

brio de algunas propensiones causales tiquistas, ni deriva su probabi

lidad de una distribución probabilística sobre condiciones iniciales

causales. Dicha explicación probabilístico-causal, si es que puede


darse en modo alguno, estará en el origen de la teoría mecánico-esta-

dística del no equilibrio y de la aproximación al equilibrio. Volvere

mos sobre esto en un momento.

En lugar de ello, la teoría nos permite comprender las caracterís

ticas de equilibrio de los sistemas en virtud de su demostración de

que bajo las condiciones adecuadas las características que se dan en

los sistemas cuando se observa que están en equilibrio son justamen

te esas características que dominan el comportamiento de un sistema

a lo largo de un tiempo infinito idealizado. Una vez más, como he

mos indicado, sólo el lograr establecer esto requiere una gran dosis

de idealización. La legitimidad de la idealización es una cuestión con

trovertida. Pero el modelo de explicación es ciertamente interesante.

Una característica macroscópica es identificada con el promedio de

la cantidad microscópica correspondiente utilizando una distribución

de probabilidades natural. La distribución de probabilidades está jus

tificada, demostrándose que es la única distribución estacionaria que

asigna probabilidad cero a las regiones que tienen probabilidad cero

en esa misma medida natural. El tiempo pasado en regiones de

estados microscópicos en el límite infinito se demuestra que es equi

valente al tamaño de la región según dicha medida natural. Y, con el

enorme número de componentes microscópicos introducido, puede

demostrarse que los promedios de las cantidades son equivalentes a

los valores ostensiblemente más probables, y éstos equivalentes a los

valores estándar en el equilibrio. Finalmente, y de gran importancia,

es la medida en que se puede dotar de un fundamento firme a la na

turalidad de la medida de probabilidad. Puede demostrarse, por lo

que se refiere a todos los requisitos que hemos indicado, que es la

medida de probabilidad «correcta». La demostración utiliza solamen

te la estructura del sistema y las leyes de la dinámica. En alguna me

dida, al menos, se ha reducido la necesidad de postular la medida de

probabilidad natural como una parte autónoma y fundamental de la

teoría. Como veremos, sin embargo, las cosas no son tan simples

cuando lo que está en juego es el no equilibrio.

La aproximación al equilibrio

¿Qué tipo de teoría deberíamos buscar para contar con una descrip

ción estadística general de la aproximación al equilibrio y con una


explicación de los fenómenos de no equilibrio? Esperamos que nues

tra descripción incluya elementos probabilísticos, pues sabemos por

la estructura de la dinámica fundamental que los sistemas individua

les pueden, de hecho, comportarse en el modo «contradinámico».

Pueden dejar de moverse suavemente desde un estado de no equili

brio inicial a un estado de equilibrio. Será en el comportamiento de

una colección de sistemas, en la que cada sistema ha partido de la

misma condición de no equilibrio, donde encontraremos nuestra des

cripción de la aproximación al equilibrio. Y será algo referente a la

evolución del conjunto de sistemas o, más precisamente, algo referen

te a la evolución de una distribución de probabilidades inicial sobre

los posibles microestados de sistemas compatibles con la condición

de no equilibrio original del sistema, lo que representará para noso

tros la aproximación al equilibrio.

Hay una buena forma de caracterizar el tipo de comportamiento

que estamos buscando que haría justicia a las ideas de Boltzmann y

de los Ehrenfest discutidas más arriba. Esto fue aclarado por Gibbs.

Consideremos una distribución de probabilidades inicial del no equi

librio. Sigamos su evolución de acuerdo con las leyes dinámicas que

nos dicen cómo cada sistema en la colección, caracterizado por su

microcondición inicial específica, evolucionará. ¿Podría esta distribu

ción de probabilidades mismamente aproximarse en el tiempo a la

distribución de probabilidades del equilibrio para las ligaduras espe

cificadas? Por ejemplo, supongamos que en una caja tenemos gas que

comenzó en la parte izquierda y al que se permitió expandirse hasta

llenar la caja. Inicialmente la probabilidad está concentrada por com

pleto en los estados correspondientes al gas confinado en la parte iz

quierda de la caja. ¿Se aproximará esta distribución de probabilida

des inicial a la correspondiente distribución de equilibrio para un gas

expandido suavemente por toda la caja?

La respuesta es, probablemente, no. Un teorema fundamental nos

dice que la distribución de probabilidades original no puede difumi-

narse en esta forma. Pero puede «difuminarse». La distribución de

probabilidades, en un principio compacta y regularmente acotada,

puede convertirse en una distribución caóticamente deshilachada

que ocupa la región entera de microestados posibles en un sentido

«de grano grueso». A medida que el tiempo avanza, cada microestado

será uno de los ocupados por uno de los sistemas originales o uno de

los no ocupados en esta forma. La fracción de microestados ocupa-


F ig u r a 3.8. Difuminación «de grano grueso» de un conjunto inicial. La región A representa la colección de puntos en el espacio de fases correspondiente a la colección de

sistemas preparados todos en una condición de no equilibrio que es macroscópicamente idéntica pero que permite una variedad de estados microscópicos iniciales. Conforme los sistemas evolucionan siguiendo la dinámica que rige el cambio de

estado microscópico, A se desarrolla en T(A). E l tamaño de T(A) debe ser igual al de

A por una ley de la dinámica, pero mientras A es una región simple confinada a una

pequeña parte del espacio de fases disponible, T(A) es una región deshilachada, compleja, que se extiende por todo el espacio de fases disponible «en un sentido de grano grueso». Una distribución uniforme sobre el espacio de fases disponible es lo que

corresponde al equilibrio en la teoría. T(A) no está en realidad difuminada de manera

uniforme en el espacio de fases pero puede, no obstante, considerarse que representa

una difuminación del conjunto inicial representativa de una aproximación al equili

brio.

dos se mantendrá constante. Pero la situación pasará de ser una en la

que todos los puntos ocupados están en una región compacta de los

estados accesibles, a una en la que, para cada pequeña región de mi

croestados posibles, una parte proporcional a esa región consistirá en

estados ocupados. Gibbs utiliza como analogía la mezcla de tinta in-

soluble y agua. Si bien cada parte del fluido, si se examina con el su

ficiente detenimiento, es siempre tinta o agua; la tinta, que comenzó

flotando en la superficie del agua, se deslíe en algún momento uni

formemente por todo el volumen permitido. Dicha aproximación de

grano grueso al equilibrio de la distribución de probabilidades inicial

de no equilibrio se corresponderá muy bien, como noción formal,


con las ideas sobre la aproximación al equilibrio resumidas por los

Ehrenfest en su solución a la ecuación de Boltzmann, representando

la «curva de concentración» de la distribución de probabilidades

evolvente para la colección. (Véase la figura 3.8.)

Pero, ¿podemos demostrar que una probabilidad inicial corres

pondiente a una situación de no equilibrio evolucionará, efectiva

mente, en el sentido de grano grueso, hacia la distribución de proba

bilidades asociada con el equilibrio? Podemos obtener dicho

resultado si imponemos un enunciado general de un Postulado de

Caos Molecular a la teoría. Éste puede tomar formas diferentes, de

pendiendo de cómo queramos modelar matemáticamente la evolu

ción de la distribución de probabilidades. Pero, en cada caso, el pos

tulado, el descendiente de la Hipótesis Relativa al Número de

Colisiones de Boltzmann, debe ser añadido a los enunciados subya

centes sobre la estructura del sistema y a las leyes dinámicas subya

centes. ¿Cómo podemos estar de algún modo seguros de que la evo

lución así determinada tendrá, de hecho, el tipo de naturaleza

permanentemente «realeatoriadora» que se utiliza para derivar la

aproximación al equilibrio cuando se supone Caos Molecular? Aquí

hay problemas profundos de consistencia entre el postulado y las d i

námicas subyacentes.

Algunos enfoques no estándar del problemaAntes de abordar este problema, exploremos algunas de las concep

ciones acerca del origen físico de la aproximación al equilibrio de los

sistemas. La teoría ortodoxa supone que los sistemas en cuya evolu

ción estamos interesados pueden ser concebidos como verdadera

mente aislados del mundo exterior. Pero ¿es legítima esta suposi

ción? La teoría estándar supone leyes dinámicas de la naturaleza

subyacentes que son «invariantes bajo inversión temporal», y busca

la razón de la asimetría temporal de la termodinámica y de la mecá

nica estadística en algo diferente a una asimetría subyacente de las le

yes dinámicas básicas. ¿Es esta suposición correcta? El enfoque orto

doxo supone que la asimetría en el tiempo está fundada en alguna

cuestión de hecho sobre el mundo que requiere una explicación si

milar a las explicaciones físicas ofrecidas a otros fenómenos descu

biertos. Pero ¿es esto correcto, o podemos encontrar la justificación a


las suposiciones probabilísticas de la teoría en algunas características

generales de la inferencia inductiva y probabilística, antes que buscar

su fundamento en algunos hechos sobre el mundo físico?

Los métodos estándar de la mecánica estadística tratan a los sis

temas como si verdaderamente pudieran aislarse energéticamente del

mundo exterior. Pero un aislamiento tan perfecto es, por supuesto,

imposible. Como mínimo se tiene la interacción gravitacional entre el

sistema y el entorno exterior, una interacción que no puede ser eli

minada. Las fuerzas debidas a la interacción pueden, empero, ser de

hecho muy pequeñas. Considerad un gas confinado en la parte iz

quierda de una caja. Dejad que se expanda por toda la caja. La con

cepción del aislamiento puro sostiene que en las posiciones y en los

momentos de las moléculas en un tiempo posterior se encuentra im

plícita la información sobre el estado original del gas. Pero, arguye el

intervencionista, incluso los cambios infinitesimales en el microesta

do inducidos por las débiles interacciones con el mundo exterior

modificarán el microestado del gas de tal forma que el microestado

real en un tiempo posterior perderá cualquier correlación que indi

que el estado macroscópico inicial del gas. La inversión temporal de

este microestado real, por oposición a ideal, no será un microestado

que evolucionará de nuevo a la situación del gas confinado en la par

te izquierda de la caja sino, antes bien, uno de los innumerables mi

croestados correspondientes al gas expandido en toda la caja. ¿Pue

den ser eliminadas de esta forma las paradojas de la reversibilidad?

La mayoría piensa que no. Hay casos especiales en los que el ais

lamiento es suficiente para que pueda construirse un verdadero tipo

de inversión de un estado. Podemos construir un microestado que

lleve al sistema a mostrar un comportamiento antitermodinámico. El

experimento del eco-espín es uno de ellos. Los núcleos con momen

tos magnéticos evolucionan desde un estado de equilibrio macroscó

picamente ordenado a uno aparentemente desordenado. Un pulso de

radio puede «voltear» los núcleos, de manera que el sistema parece

retroceder espontáneamente a su condición original ordenada de no

equilibrio. Aquí el aislamiento es suficiente para que el microestado

ulterior del sistema en equilibrio retenga la información sobre el

estado original de no equilibrio. El experimento puede ser también

realizado cuando los núcleos interaccionan magnéticamente entre sí.

Pero el sistema parece mostrar, hasta el «volteo», la aproximación

macroscópica al equilibrio habitual, indicando que debemos explicar

La introducción de ia probabilidad en la física 193

dicho comportamiento incluso cuando el aislamiento es «perfecto».

La mayoría de los físicos están todavía convencidos de que hasta los

sistemas perfectamente aislados del entorno exterior mostrarían la

asimetría temporal caracterizada por la Segunda Ley. (Véase la figu

ra 3.9.)

Los enigmas estándar concernientes a la reversibilidad suponen

también que las leyes dinámicas subyacentes tienen la propiedad de

invariancia bajo inversión temporal. Esto implicaría que el microes-

tado invertido de un sistema que ha evolucionado a partir del no

equilibrio sería uno que evolucionaría en el inverso temporal del

microestado original de no equilibrio. Se tendría entonces una evo

lución con retorno a una situación de no equilibrio. ¿Podría estar

equivocada* esta suposición de simetría temporal para las leyes diná

micas subyacentes, de manera que la asimetría temporal a este nivel

de la dinámica fundamental fuese realmente la fuente de la asimetría

termodinámica? La mayoría piensa que no. Las leyes de la dinámica

clásica, y también, se afirma habitualmente, las leyes de la dinámica

cuántica, son simétricas en el tiempo en el sentido convencional. En

realidad, para la mecánica cuántica, ésta es una cuestión que podría

ser controvertida. Según veremos en el capítulo 4, en la concepción

mecánico-cuántica del mundo existe un proceso denominado medi

ción que entraña una clase especial de asimetría temporal. La natura

leza y origen de esa asimetría son de por sí controvertidos, siendo

atribuidos por algunos a la asimetría termodinámica considerada

como la asimetría fundamental. Pero la opinión general es que las fa

miliares asimetrías de la termodinámica no tienen su origen en ningu

na asimetría semejante de la medición mecánico-cuántica, y que el

origen de la asimetría de la mecánica estadística debe buscarse en

otro lugar.

Curiosamente, hay fenómenos en la naturaleza que parecen de

mandar leyes fundamentales asimétricas en el tiempo. Esto salta a la

vista en el estudio de ciertas interacciones en el dominio de la teoría

cuántica de campos. Aquí, parece, encontramos procesos que son po

sibles de acuerdo a las leyes fundamentales, pero cuyas inversiones

temporales naturales son imposibles. Más concretamente, las proba

bilidades del proceso no son invariantes bajo inversión temporal. Se

han llevado a cabo algunos trabajos con el propósito de demostrar

que no podría derivarse ninguna explicación de las familiares asime

trías que nos ocupan aquí a partir de estos fenómenos, aun cuando


- 0 O O O— O ' 0 o ot=A,0 " Q O 0

, = 2 a , 0 © o OF ig u r a 3.9. E l experimento del eco-espín. La fila de arriba de la figura representa una

colección de núcleos giratorios cuyos espines están alineados en la misma dirección

según un plano que es perpendicular a un campo magnético aplicado sobre el cristal a cuyos átomos pertenecen los núcleos en cuestión. En la segunda fila ha transcurrido un período de tiempo. Las direcciones de los espines han precesado, a diferentes velocidades, en torno al campo magnético aplicado, de manera que en este punto los espines, aunque todavia en el mismo plano, apuntan ahora en todas las direcciones «al azar». En la tercera fila, los espines han sido «volteados» por un pulso de frecuencia de radio. Los espines «más adelantados» en la «carrera de precesión» son ahora

los «más atrasados». E l resultado se muestra en la fila de abajo. E l tiempo es ahora el doble del transcurrido desde la fila de arriba a la segunda fila. Los espines se han «alcanzado» ahora unos a otros, de forma que todos ellos apuntan de nuevo en la misma dirección. Desde la tercera línea a la linea de abajo parece haber una condición

de equilibrio (espines aleatorios) que evoluciona espontáneamente a una condición de no equilibrio (todos los espines alineados).

éstos revelen una no invariancia bajo inversión temporal verdadera

mente legal en el mundo.

Finalmente, está la escuela que busca la justificación de las apli

caciones de la probabilidad en la mecánica estadística, no en el des

cubrimiento de proporciones reales en el mundo o en alguna caracte

rística especial de las leyes y estructuras de los sistemas como la

ergodicidad, sino en principios generales del razonamiento inductivo.


En caso de equilibrio, se arguye, la justificación de la medida ordina

ria de probabilidad es el Principio de Indiferencia. Éste nos dice que,

a falta de una evidencia ulterior, tratemos de la misma forma, en tér

minos de peso probabilístico, todos los casos simétricos permitidos

por la evidencia disponible. Pero, como hemos indicado, el Principio

de Indiferencia estará vacío hasta que se proporcione una forma defi

nitiva de caracterizar los sistemas. ¿Dónde, si no es en las propieda

des de la dinámica y de la estructura, encuentran los «inductivistas»

esto?

En el caso de no equilibrio, los inductivistas arguyen que, con tal

que una situación sea «reproducible experimentalmente» en el nivel

macroscópico, uno puede justificar la concepción de que la entropía

aumenta con el tiempo. La idea es la siguiente: Podemos esperar que

sistemas idénticamente preparados en lo que a sus características ma

croscópicas respecta evolucionen a sistemas semejantes en sus carac

terísticas macroscópicas sólo si hay muchos más microestados que

correspondan a la situación macroscópica fundamental de los que

correspondían a la situación macroscópica original. Pero semejante

incremento en los microestados correspondientes a un macroestado

evolucionado es justamente la noción mecánico-estadística del au

mento de entropía estadística. Bien, de acuerdo. Pero lo que noso

tros queríamos explicar era por qué se da algo como la repro-

ducibilidad experimental de los sistemas cuando se describen

macroscópicamente. ¿Cómo es que sistemas constituidos por un vas

to número de componentes pueden ser descritos de manera sencilla

mediante un pequeño número de parámetros que evolucionan según

ciertas leyes? Y ¿por qué los sistemas descritos macroscópicamente

en esta forma evolucionan siempre en la misma dirección temporal

cuando se considera el movimiento hacia el equilibrio? ¿Cómo se ex

plica, si quieres, que los experimentos sean todos reproducibles ex

perimentalmente en la misma dirección temporal y algunos no lo

sean en la dirección opuesta? Y ¿cómo es que esta dirección tempo

ral es la que consideramos como el futuro?

Si observamos un sistema en un estado de no equilibrio, somos

capaces de inferir sus estados en tiempos diferentes solamente en

una dirección temporal. Sabemos que un sistema calentado por un

extremo y frío en el otro estará más tarde todo él caliente, mientras

dada una barra caliente no somos capaces de inferir el estado de no

equilibrio del que partió, ya que son muchas las condiciones de no


equilibrio que evolucionan hacia el mismo estado de equilibrio. Pero

¿por qué existen tales caracterizaciones macroscópicas y su comporta

miento legal? ¿Por qué evolucionan los sistemas paralelamente unos

a otros en el tiempo? ¿Por qué es la dirección de aproximación al

equilibrio la dirección futura? Estos son los hechos que queríamos

explicar. La línea inductivista parece presuponer tan sólo que los fe

nómenos en cuestión existen y entonces señala las consecuencias de

su existencia y lo que esta existencia y naturaleza presuponen sobre

la evolución microscópica de los sistemas. Pero por qué se dan los fe

nómenos precisamente en esta forma es lo que queríamos explicar en

primer lugar.

Algunos enfoques estándar del problemaRegresemos a la escuela ortodoxa de pensamiento. Considerad un

sistema energéticamente aislado del resto del mundo y en una condi

ción de no equilibrio. ¿Cómo deberíamos representar su aproxima

ción al equilibrio en mecánica estadística? Pues bien, consideramos

toda condición posible de sus componentes microscópicos compati

ble con el estado de no equilibrio original del sistema. Nos imagina

mos una vasta (de hecho, infinita) colección de sistemas que tengan

todos los posibles microestados iniciales, e imponemos una distribu

ción de probabilidades sobre esos microestados. Cada sistema indivi

dual en la colección nos lo imaginamos ahora evolucionando de

acuerdo con su estructura y con las leyes dinámicas que gobiernan la

dinámica de los microcomponentes. Queremos mostrar que, dada la

distribución de probabilidades original y dadas esas leyes, se da una

evolución de las distribuciones de probabilidad que tiende, en un

sentido u otro, hacia la distribución de probabilidades en el equili

brio correspondiente a las ligaduras impuestas sobre el sistema.

Una primera cuestión a plantear es cómo serán las distribuciones

iniciales de probabilidad. Sólo se entiende bien un número limitado

de casos. Un caso es aquel en el que el sistema, si bien no está en

equilibrio, está cerca del equilibrio para empezar. Otro caso, más ge

neral, es aquel en el que el sistema, si bien no está en equilibrio, pue

de considerarse que posee regiones suficientemente pequeñas y sufi

cientemente próximas al equilibrio durante tiempos suficientemente

pequeños. Así, en este último caso, aunque no podamos atribuir una


densidad, presión, temperatura o entropía al sistema, podemos consi

derar que parte con una cierta distribución de densidad, presión, den

sidad de entropía y temperatura. El gas confinado inicialmente en el

lado izquierdo de la caja tiene una alta densidad uniforme en la mi

tad del espacio físico ocupado y una densidad cero en la otra mitad.

La barra de hierro inicialmente caliente en un extremo y fría en el

otro no tiene una temperatura; tiene una distribución de temperatura

a lo largo de la longitud de la barra. En estos casos, las reglas que ge

neralizan la forma en que el Principio de Indiferencia se aplicaba

para obtener la distribución de probabilidades en el equilibrio, pue

den probablemente aplicarse para obtener las distribuciones iniciales

de probabilidad en el no equilibrio. En los casos donde ni siquiera

puede suponerse un «equilibrio local transitorio», no está claro cómo

debería ser nuestra distribución de probabilidades inicial. Pero, en

dicho caso, una vez más, tampoco existe realmente una teoría ma

croscópica que describa la aproximación al equilibrio que ha de de

ducirse y explicarse.

¿Podemos mostrar, en base solamente a la estructura del sistema

y a la dinámica de los microconstituyentes, sin invocar un postulado

tipo caos molecular de perpetua realeatoriedad, que esta distribución

de probabilidades inicial se aproximará a la distribución de equili

brio, al menos en la forma de grano grueso sugerida por Gibbs? En

algunos casos sí podemos —en cierto modo. En los casos en los que

podía probarse la ergodicidad en la teoría del equilibrio, como los de

esferas rígidas en una caja, pueden también probarse algunas veces

resultados más fuertes.

La ergodicidad no es suficiente para nuestros propósitos. Ima

ginemos una vasta colección de sistemas, preparados todos en una

condición dada de no equilibrio. Todos podrían ser ergódicos, evo

lucionando de forma tal que en un tiempo infinito estuviesen

normalmente en o cerca del equilibrio. Aún así, podría resultar que

la colección no se aproximase, como un todo, al equilibrio. Podría

darse una aproximación regular y uniforme de los sistemas a, y des

de, el equilibrio de una forma sincronizada, de manera que la distri

bución de probabilidades sobre todos los sistemas no pudiera mos

trar una aproximación uniforme al equilibrio ni siquiera en el sentido

de grano grueso. Es decir, podría haber momentos en el futuro en los

que la distribución de probabilidades estuviese alejándose de la dis

tribución de equilibrio, aun cuando cada uno de los sistemas indivi


duales pasase la mayoría de su tiempo en o cerca del equilibrio del

sistema individual.

Sin embargo, un resultado más fuerte que la ergodicidad, «la

mezcla», puede probarse para sistemas idealizados del tipo de las es

feras rígidas en una caja. Lo que la mezcla dice, concisamente, es que

si comenzamos con cualquier distribución de probabilidades inicial

«no patológica», ésta, al menos en el paso al límite cuando el tiempo

tiende a infinito, se aproximará en el sentido de grano grueso a la

distribución de probabilidades en el equilibrio. «No patológica» sig

nifica esencialmente que la distribución de probabilidades inicial

asignará una probabilidad cero a toda región de microcondiciones

que tenga probabilidad cero en la medida estándar familiar.

Uno puede, efectivamente, probar resultados más fuertes que el

de la mezcla para tales sistemas. Se puede probar que son sistemas K. Ser un sistema K es tener un tipo de «indeterminación probabilísti

ca» de grano grueso. Supongamos que concebimos a los microesta

dos del sistema agrupados en pequeñas colecciones de microestados.

Si un sistema es un sistema K, no podremos determinar con probabi

lidad uno o cero en qué subcolección se encontrará el microestado

de un sistema en un instante de tiempo dado, aun cuando sepamos

en qué subcolección se encontraba el microestado del sistema en

todos los instantes anteriores de tiempo, discretamente separados,

hasta el pasado infinito. La única excepción se daría en el caso de ser

trivialmente verdadero que el sistema tiene una probabilidad uno o

cero de tener su microestado en la subcolección designada.

Y, todavía más fuerte, uno puede probar que los sistemas son sis

temas Bernoulli. Esto significa que uno puede construir conjuntos de

subcolecciones de microestados tales que la descripción en un tiem

po infinito de en qué subcolección se encuentra el microestado de

un sistema en cada momento de observación determina completa

mente la evolución estadística de la distribución de probabilidades.

Pero la información sobre las subcolecciones en las que el sistema ha

estado durante el pasado no aporta ninguna información probabilísti

ca sobre la subcolección en la que se encontrará en el instante de

tiempo subsiguiente. Cuando se trata de en qué subcolección se en

contrará el microestado, el sistema, si bien evolucionando determinis

tamente, se comporta justamente igual que los resultados de series de

lanzamientos de monedas probabilísticamente independientes. Así

pues, el determinismo al nivel de microestado exacto es compatible


F ig u r a 3.10. Un conjunto mixto. T es una región del espacio de fases para el sistema

en la que el punto fásico para el sistema se encuentra localizado. A y B son dos regiones de puntos en el espacio de fases de tamaño distinto de cero. B se mantiene constante. Seguimos la evolución de los sistemas cuyos microestados iniciales se encuentran en la región A E l resultado es una serie de regiones T(A) a medida que pasa el tiempo. Un sistema «mixto» es uno en el que la región A evolucionará en una región T(A) en el límite «a medida que el tiempo tiende a infinito». Esta región T(A) está distribuida uniformemente sobre el espacio de fases en el sentido de grano grueso. Para

que esto suceda, la proporción de cualquier región B ocupada por puntos que evolucionan desde la región A ha-de ser igual en el límite de tiempo infinito a la proporción del espacio de fases ocupada originalmente por puntos» en la región A.

con el comportamiento más aleatorio imaginable al nivel de grano

grueso. (Véase la figura 3.10.)

¿Resuelven dichos resultados, de una vez por todas, todos los

enigmas sobre la aproximación al equilibrio? Ciertamente no. Prime

ro está el hecho de que cuando aplicamos la mezcla para elaborar un

modelo de aproximación al equilibrio, debemos ignorar los «conjun

tos de medida cero». Al suponer que podemos ignorar distribuciones

iniciales de probabilidad patológicas en las que la probabilidad dis

tinta de cero se concentra en colecciones de microestados que tienen

probabilidad cero en la medida estándar, estamos suponiendo que

dichas colecciones de microestados pueden ser ignoradas. Esto es

una vez más una suposición probabilística no derivable de la estruc

tura de los sistemas o de sus dinámicas.

Además está el problema de que la mayoría de los sistemas rea

listas no cumplirán las condiciones necesarias para que se dé la


mezcla. Esto es debido a que se encuentran (probablemente) en el

dominio del teorema KAM. Esto requiere nuevamente la existencia

de regiones distintas de cero de microestados que generar trayectorias

estables, trayectorias que no se desplazan por toda la región disponi

ble de microestados. Así como esto hizo imposible la ergodicidad

para casos más realistas en la teoría del equilibrio, así también hace

imposible el resultado más fuerte de la mezcla. Al igual que antes, se

tendrá en alguna forma que recurrir en este punto al gran número de

constituyentes del sistema y a algún argumento en el sentido de que

las regiones de estabilidad serán muy pequeñas y de que fuera de

estas regiones el movimiento será lo bastante caótico para generar, si

no una mezcla en sentido puro, algún sustituto razonable de ésta.

Pero existe una dificultad mucho mayor que ésta para quien pre

tenda fundamentar la aproximación al equilibrio solamente en resul

tados de mezclas. Si un sistema está mezclado, entonces cualquier

distribución de probabilidades inicial no patológica sobre sus mi

croestados presentará una aproximación de grano grueso a la distri

bución de probabilidades en el equilibrio en el límite de tiempo infi

nito. Pero ¿qué sucederá «a corto plazo», esto es, en intervalos de

tiempo correspondientes a ésos en que nos hallamos interesados, los

tiempos típicos que tarda un sistema en no equilibrio en acercarse al

equilibrio?

La mezcla es compatible con cualquier comportamiento a corto

plazo que uno pueda imaginar. La distribución de probabilidades en

el no equilibrio puede aproximarse en el sentido de grano grueso a la

distribución en el equilibrio, alejarse de ella, permanecer como distri

bución de no equilibrio, o seguir cualquier modelo de aproximacio

nes, retrocesos, o quedar igual que uno quiera, y ser todavía la distri

bución de probabilidades de un sistema mezclado. Pero lo que

queremos modelar es la aproximación uniforme, a corto plazo, al

equilibrio de sistemas reales en no equilibrio. ¿Qué es lo que se ne

cesita añadir al hecho de que un sistema esté mezclado para asegu

rarnos de que nuestro modelo tendrá estas características?

Uno también puede ver que la mezcla por sí misma no basta

para responder a todas nuestras cuestiones, observando que es una

noción simétrica en el tiempo. Cualquier distribución de probabilida

des inicial no patológica para un sistema mezclado evolucionará tam

bién, conforme el tiempo tiende al pasado infinito, hacia una distri

bución de probabilidades que se asemeja en el sentido de grano


grueso a la distribución de equilibrio. Apenas sorprende que cual

quier sistema que esté mezclándose hacia el futuro, esté mezclándose

hacia el pasado. Después de todo, la «mezclabilidad» de un sistema

se sigue de su estructura y de las leyes dinámicas subyacentes simétri

cas en el tiempo. Naturalmente, la asimetría temporal de la termodi

námica, y de la mecánica estadística que queremos para sustentar la

teoría macroscópica no puede derivarse de los elementos de la es

tructura y la microdinámica únicamente. De nuevo, debe añadirse

algo más.

Discutiremos en un momento el elemento adicional requerido,

pero reparemos antes en que el enfoque del no equilibrio por la me

cánica estadística que acabamos de discutir no es la única forma de

intentar justificar la teoría del no equilibrio. Hay un enfoque impor

tante y bastante diferente; su contraste con el enfoque que acabamos

de discutir es muy iluminador. Ciertos resultados nos dicen que si

idealizamos un sistema en la forma apropiada, en particular, dejando

que el número de moléculas en el gas tienda a infinito, que la densi

dad del gas tienda a cero, y que el tamaño de las moléculas del gas

comparado con el tamaño de la caja (el denominado Límite de Gra

do de Boltzmann) tienda a cero, entonces podemos demostrar que,

para períodos de tiempo suficientemente pequeños, «casi todos» los

sistemas (es decir, todos los sistemas excepto un conjunto de proba

bilidad cero) evolucionarán de acuerdo con la manera descrita por la

ecuación de Boltzmann. Esta es la «derivación rigurosa de la ecua

ción de Boltzmann».

Ahora bien, puede demostrarse que estos resultados son válidos

solamente para tiempos que son fracciones del tiempo esperado en

tre la colisión de una molécula con otra molécula y después con otra

molécula. Pero hay razones para pensar que se trata de resultados

verdaderos, aunque no se pueda probar, para tiempos más largos.

Este resultado, a diferencia del de la mezcla, proporciona una justifi

cación del hecho de tomar como válida la descripción estadística ha

bitual incluso para períodos breves y de considerar que la evolución

tiene la naturaleza unidireccional que esperábamos.

Pero los resultados aquí mencionados son de hecho enigmáticos.

Supongamos que consideramos que el resultado es válido en todo

momento, incluso cuando el tiempo tiende a infinito. Entraremos en

tonces en contradicción con el Teorema de Recurrencia. Este nuevo

resultado dice que casi todos los sistemas evolucionarán hacia el


equilibrio y permanecerán en el mismo, pero el Teorema de Recu

rrencia nos dice que casi todos los sistemas retornarán a su condi

ción original de no equilibrio un número infinito de veces. Y el resul

tado es asimismo incompatible con la mezcla. No hay ninguna

contradicción matemática, por supuesto, pues aquí sólo se ha proba

do que los resultados son válidos en tiempos finitos, breves. Más im

portante aún es que sólo son válidos en el límite indicado. En ese lí

mite no se puede seguir representando el comportamiento del

sistema como un flujo de trayectorias a partir de microestados inicia

les, de manera que las condiciones necesarias para la recurrencia y la

mezcla que había que demostrar dejan de ser válidas.

Pero no es la ausencia de una contradicción matemática lo que

es más interesante. La cuestión principal es que este modelo de apro

ximación al equilibrio, un modelo que intenta demostrar que en una

idealización apropiada es altamente probable que un sistema evolu

cione desde el no equilibrio al equilibrio y permanezca entonces en

el equilibrio, está conceptualmente muy en desacuerdo con la ideali

zación familiar desde la clarificación por los Ehrenfest del programa

de Boltzmann. En esta idealización más familiar, la recurrencia es

aceptada y la mezcla es la idealización buscada del comportamiento

del no equilibrio. Lo que se espera de la solución a la ecuación de

Boltzmann no es que represente lo que casi todo sistema hará, sino,

en lugar de ello, la «curva de concentración» de la evolución de la

distribución de probabilidades. No es «la evolución más probable»,

sino «la evolución de las condiciones más probables» lo que ha de

representar la aproximación al equilibrio.

Lo que muestra la existencia de estos dos enfoques es que

todavía no hay un acuerdo tácito sobre cuál es la idealización correc

ta que ha de utilizarse para intentar representar el comportamiento

termodinámico en términos de las probabilidades y del comporta

miento dinámico microscópico. Un auténtico conflicto sobre cómo

debería.ser construida la teoría mecánico-estadística final y cómo ese

constructo debería ser utilizado para representar el mundo divide

todavía a la comunidad de teóricos. Deberíamos observar que los

problemas derivados de la introducción de la asimetría temporal en

el enfoque de la mezcla, a los que pronto regresaremos, aparecen asi

mismo en esta «derivación rigurosa del enfoque de Boltzmann» alter

nativa. Y deberíamos observar lo diferente que son los papeles que

juega el gran tamaño del sistema en los dos enfoques. Para el enfo


que de la mezcla, el vasto número de microcomponentes aparece

sólo al final del argumento cuando queremos pasar de los valores

medios a los valores más probables de las cantidades. Para el otro en

foque, sin embargo, el hecho de que el sistema sea un sistema muy

suavizado con un número ilimitado de pequeños componentes es

crucial para la idealización desde un principio. Incluso un sistema de

dos esferas rígidas en una caja es una mezcla, pero el Límite del Gra

do de Boltzmann es crucial para la derivación rigurosa de la ecua

ción de Boltzmann.

El problema de las distribuciones iniciales de probabilidadTrabajaremos por el momento en el ámbito de la idealización que se

vale de la mezcla del conjunto inicial para representar la aproxima

ción al equilibrio. Como ya observamos, incluso si el sistema es un

sistema mezclado, se pueden encontrar conjuntos iniciales, esto es,

distribuciones iniciales de probabilidad sobre los microestados com

patibles con la condición macroscópica original de no equilibrio, que

mostrarán la apropiada aproximación de grano grueso, uniforme, a

corto plazo, a una distribución de probabilidades en el equilibrio.

Pero también se pueden encontrar conjuntos iniciales que mostrarán

cualquier otra clase de comportamiento a corto plazo. Consideremos,

por ejemplo, la distribución de probabilidades sobre microestados

que aparece cuando una distribución aun más alejada del equilibrio

evoluciona en la forma esperada a una compatible con la condición

dada de no equilibrio del gas. La inversión temporal de la última dis

tribución de probabilidades será una distribución de probabilidades

sobre microestados compatible con la condición de no equilibrio de

nuestro sistema que evolucionará a una condición de un «equilibrio

aún menor». (Véase la figura 3.11.)

Así pues, para obtener la correcta aproximación de grano grueso,

uniforme, a corto plazo, al equilibrio necesitamos partir de. una distri

bución de probabilidades inicial «apropiada». Esencialmente, quere

mos que la probabilidad se distribuya uniformemente (en relación a

la medida estándar) sobre una región de microestados que no sea de

masiado pequeña y que tenga una forma regular. La demanda de un

tamaño suficiente es para asegurar que la distribución inicial se pro

pague en forma de grano grueso con la suficiente rapidez como para


F i g u r a 3.11. Reversibilidad al nivel del conjunto. Supongamos, como en (a), que A es una región del espacio de fases que evoluciona con el tiempo a la región fibrada, T(A). Se puede entonces mostrar, como en (b), que debe haber una región fibrada de

puntos fásicos, T l(A'), que según avanza el tiempo al futuro evoluciona a una región

simple compacta, como A'. Además, A ’ y la región de la que proviene tendrán ambas el mismo tamaño que A y su sucesor fibrado.

representar el «tiempo de relajación» efectivo que tardan los sistemas

reales en alcanzar el equilibrio. La demanda de una forma regular es

para excluir las regiones que pueden ser construidas para representar

un comportamiento anti-termodinámico.

Pero ¿por qué deberían elegirse dichas distribuciones iniciales de

probabilidad? ¿Qué hay en la naturaleza del mundo que las convier

te en los conjuntos iniciales correctos a elegir para obtener los resulta

dos que representan el mundo tal como es? Una explicación fue

ofrecida por el físico N. Krylov. Este parte de una crítica a quienes


por toda explicación de la naturaleza especial de estas distribuciones

iniciales de probabilidad alegarían tan sólo la observación de que es

así como parece estar distribuida la probabilidad sobre los estados

iniciales en el mundo. Estos teóricos negarían la posibilidad de algu

na otra explicación más profunda. (Los filósofos hablan alguna vez de

la naturaleza «meramente de /acto» de la Segunda Ley, queriendo

decir que «sucede simplemente que los estados iniciales están distri

buidos así».) Krylov insiste en que este enfoque no hará justicia a la

naturaleza legal, incluso si es sólo estadísticamente legal, de la Segun

da Ley. También arguye que no puede hacer justicia al hecho de que

para los sistemas que son intermediarios en el proceso de eyolución

desde una condición de no equilibrio inicial hasta una de equilibrio,

dicha distribución de probabilidades uniforme en relación a su des

cripción macroscópica intermediaria no puede ser cierta, puesto que

sabemos que provenían de un estado inicial determinado aún más le

jos del equilibrio. Pero dichos sistemas obedecerán todavía a la Se

gunda Ley.

Krylov, cuya teoría positiva nunca recibió una exposición adecua

da debido a su muerte prematura, explica la naturaleza especial de la

distribución de probabilidades inicial apoyándose en un argumento

procedente de las primeras tentativas de entender la mecánica cuánti

ca. En el capítulo 4 discutiremos el denominado Principio de Incerti-

dumbre de la mecánica cuántica. Este principio nos dice que es impo

sible especificar simultáneamente la posición y la velocidad de una

partícula a un grado arbitrario de precisión. Una temprana interpreta

ción de este principio, hoy en día no aceptada ya por la mayoría de

quienes se ocupan de estas cuestiones, fue que el intento de nuestra

parte de medir una de las dos cantidades interfería físicamente con el

sistema de forma tal que «perturbaba» el valor existente de la otra

cantidad. Esta interacción física del observador con el sistema obser

vado era lo que generaba la «incertidumbre». Krylov arguye que la

sensibilidad de un sistema a una pequeña perturbación en su estado

inicial, de manera que una ligera variación en la posición o velocidad

de una sola molécula cambie sustancialmente la microevolución futura

del sistema, nos da un Principio de Incertidumbre de un «nivel supe

rior» al tratar con los sistemas de la termodinámica. A esta interferen

cia con el sistema, cuando el sistema está preparado en esta condición

de no equilibrio, se debe que la distribución de probabilidades sobre

los microestados tenga el tamaño y la regularidad apropiados.

2D6 Filosofía de la física

No está claro cómo podría hacerse que esto funcionase en sus

pormenores. Pero hay, además, un problema más profundo. ¿Qué

constituye la «preparación» de un sistema? Supongamos que exami

namos un sistema que está en no equilibrio en el momento de ser

creado (es decir, separado energéticamente del resto del universo).

También lo examinamos en el momento de ser destruido (es decir,

reintegrado al mundo exterior). Conviene suponer que a partir de la

condición inicial de no equilibrio tenderá a aproximarse al equili

brio. Así, la distribución de probabilidades apropiada sobre los mi

croestados en el instante inicial es la estándar. Pero si hiciésemos la

misma suposición respecto al estado final del sistema, nos veríamos

llevados a inferir, erróneamente, que este estado era una fluctuación

espontanea de estados más próximos al equilibrio. ¿A qué se debe

que sea apropiado atribuir la distribución estándar de probabilidades

sobre los microestados al comienzo de la evolución de los sistemas,

pero no al final?

Bien, el estado inicial es la forma en que el sistema ha sido «pre

parado». El estado final es el resultado, no de la preparación, sino de

la evolución. Pero, ¿qué constituye la preparación y por qué ella, y

solo ella, habría de tener la característica de requerir la correcta dis

tribución de probabilidades termodinámica sobre los microestados

asociados con los macroestados obtenidos por ella? Esencialmente, la

asimetría temporal de la mecánica estadística está siendo introducida

a través de la suposición de que siempre son los primeros estados de

los sistemas aislados los que están «preparados» y nunca sus estados

íinales. Intuitivamente pensamos que es cierto, pero dar un significa

do coherente a lo que la intuición capta, que no sea reiterar la asime

tría que queríamos explicar en primer lugar, es una cuestión intrin

cada.

Lna solución diferente, y más radical, al problema ha sido ofreci

da por I. Prigogine. Su solución presenta vanos elementos. Primero,

adopta el punto de vista extremadamente radical de que los sistemas

individuales no tienen microestados exactos. Mantiene, en lugar de

ello. que la inestabilidad radical de la dinámica significa que el mi

croestado exacto de un sistema, según se postula en la dinámica sub

yacente habitual, es una falsa idealización. Considera que la distribu

ción de probabilidades sobre microestados utilizada en mecánica

estadística debería ser considerada como caracterizadora del sistema

individual. Esta distribución de probabilidades, sostiene, no caracte


riza a un supuesto colectivo compuesto por muchos sistemas cada

uno de los cuales tiene un microestado exacto. Una vez más, la mecá

nica cuántica y su interpretación son relevantes aquí. Como veremos,

existen «pruebas de variables no ocultas» en la teoría cuántica. Estas,

se alega algunas veces, nos demuestran que la característica de «in

certidumbre» de los sistemas en mecánica cuántica debería ser consi

derada como irreducible. No hay, se afirma, parámetros subyacentes,

ni siquiera incognoscibles, que determinen exactamente el curso fu

turo del sistema.

Ahora bien, en el caso de la mecánica estadística no encontramos

desde luego semejantes demostraciones de la no existencia de un mi

croestado enteramente determinista. De hecho, la posibilidad de in

versiones exactas del comportamiento, tal como ilustran los resulta

dos del eco-espín mencionados anteriormente, hacen de la negación

de un microestado exacto una pretensión bastante dudosa. Pero las

restantes partes de la concepción de Prigogine no dependen, en reali

dad, para su defensa de esta concepción ontológica radicalmente

nueva.

Prigogine esboza métodos por los que la distribución de proba

bilidades original, cuya evolución siguió las leyes invariantes bajo in

versión temporal derivadas de las leyes simétricas en el tiempo de

la dinámica subyacente, puede ser transformada en una nueva «re

presentación» con una evidente asimetría temporal en su evolución.

Esto funciona en casos en los que se da una condición de «caos» su

ficientemente fuerte, como es que el sistema sea un sistema K. Lo

que sucede aquí no es nada misterioso. Si un sistema tiene las carac

terísticas de mezcla adecuadas, mostrará una aproximación temporal

de grano grueso al equilibrio, aun cuando su evolución sea reversible

temporalmente en el micronivel. Las técnicas utilizadas aquí para

pasar a la nueva representación muestran esencialmente cómo este

comportamiento de grano grueso de la distribución de probabilida

des original puede ser reflejado en una nueva forma de representar

las estadísticas del conjunto de manera que la asimetría temporal, re

presentada solamente en el sentido de grano grueso en la representa

ción original, es ahora incorporada en la nueva forma de caracterizar

la distribución de probabilidades. Esta nueva distribución de proba

bilidades está determinada unívocamente dada la original y determi

na a ésta de manera unívoca. Genera los mismos valores medios de

todas las cantidades generados por la distribución de probabilidades


original y es, por lo tanto, «estadísticamente equivalente» a la repre

sentación original.

¿Resuelve la existencia de dicha nueva representación de la pro

babilidad el problema de la asimetría temporal? No. Una razón para

esta respuesta negativa es que también hay una nueva representación

de la distribución de probabilidades original que es manifiestamente

antitermodinámica. Así como la distribución inicial se aproximaba en

la forma de grano grueso al equilibrio conforme el tiempo tendía a

menos infinito, así como a más infinito, así también hay dos transfor

maciones de la misma a una nueva representación — una que ma

nifiesta un comportamiento termodinámico y la otra antitermodiná-

mico.

Así pues, ¿de dónde procede la asimetría temporal? Prigogine

piensa que uno no puede captar esto utilizando una distribución de

probabilidades inicial no patológica, pues cualquiera de dichas distri

buciones tenderá en la forma de grano grueso al equilibrio en el lími

te de tiempo infinito, tanto en el futuro como en el pasado. En lugar

de ello, sugiere, deberíamos prestar atención a ciertas distribuciones

iniciales «singulares», unas que concentren toda la probabilidad en

una región de probabilidad cero en la medida estándar. Ahora bien,

en la representación original, semejante distribución inicial singular

no podría aproximarse a la distribución de equilibrio ni siquiera en

el sentido de grano grueso, pues siempre evolucionaría hacia una

nueva distribución cuyo tamaño es cero en la medida estándar. Pero,

señala Prigogine, puede suceder que, si bien la nueva representación

de la distribución original es también singular y de tamaño cero, las

nuevas representaciones de las distribuciones hacia las que evolucio

na puede que no sean singulares. Puede que, de hecho, evolucionen

hacia la distribución de equilibrio. Y si se elige adecuadamente la

distribución inicial singular, esto es justamente lo que ocurre. Quizá,

pues, la solución a la asimetría temporal se encuentre en la regla se

gún la cual, en la mecánica estadística, los sistemas físicos que co

menzaron en no equilibrio están siempre representados adecuada

mente por estos tipos de distribuciones de probabilidad inicial

singular.

¿Es ésta la respuesta? Yo creo que no. Primero, es importante

observar que también habrá distribuciones iniciales singulares de

probabilidad que son intrínsecamente antitermodinámicas. Éstas, cla

ro está, no pueden representar sistemas reales. Pero ¿no estábamos


buscando la razón física de por qué es posible un tipo de comporta

miento y no el otro? Nosotros no pretendíamos solamente encontrar

una forma más de «enchufar» una característica asimétrica a nuestra

representación del mundo. Peor aún, el uso de dichas distribuciones

iniciales singulares de probabilidad parece inapropiado para algunos

casos físicos reales. Una situación que se adecúa al modelo de Prigo

gine sería, por ejemplo, un haz de partículas perfectamente paralelo.

Éste es un estado inicial de «probabilidad cero». Dicho haz perdería,

claro está, su asombrosa coherencia y orden originales, siendo esta

pérdida representada por la difuminación de la representación trans

formada de la distribución de probabilidades originalmente singular

elegida para representar el sistema. Pero ahora consideremos un gas

confinado én el lado izquierdo de una caja. Removamos la partición

que la divide por la mitad. La distribución de probabilidades inicial

apropiada en este caso no será una cuya probabilidad esté confinada

a una región de tamaño cero, ni siquiera una aproximación de una

distribución singular semejante. En su lugar, la forma correcta de re

presentar la física aquí sería la de una evolución de grano grueso al

equilibrio de una distribución inicial que no está, originalmente, difu-

minada en forma de grano grueso sobre la totalidad de microestados

disponibles, pero que tampoco está, originalmente, confinada a una

región de tamaño cero.

La cuestión es que los conjuntos iniciales correctos mostrarán

una evolución hacia el equilibrio incluso a corto plazo. Éstos pueden

representar correctamente la física incluso si en el límite de tiempo

infinito tienden hacia el equilibrio (en sentido estricto) en ambas di

recciones temporales. Los conjuntos iniciales singulares de Prigogine

parecen ser innecesarios y algunas veces no representan adecuada

mente las situaciones físicas reales de interés.

Cosmología e irreversibilidad¿Cuál, pues, es la razón física de la asimetría temporal? Prestemos

atención a un enfoque popular. Éste se funda en los resultados de la

cosmología. Como señalamos anteriormente, ya Boltzmann se había

valido de presuposiciones especulativas acerca de la estructura global

del universo a fin de reconciliar sus concepciones finales sobre el

equilibrio con los hechos observables sobre el predominio del no


equilibrio en el mundo tal como lo encontramos. Revisemos un ins

tante la estructura de las afirmaciones boltzmannianas: Primero, el

universo es extenso en el espacio y en el tiempo. Se encuentra en la

mayoría de las regiones del espacio y en la mayoría de los períodos

de tiempo cerca del equilibrio. Pero hay pequeñas regiones que se

desvían del equilibrio durante breves instantes de tiempo. Segundo,

podemos esperar encontrarnos a nosotros mismos en una de dichas

regiones fluctuantes, puesto que solamente en una región semejante

podrían evolucionar y sobrevivir observadores. Tercero, la entropía

aumenta en la dirección futura del tiempo en nuestra región porque

por dirección futura del tiempo entendemos la dirección del tiempo

en la que aumenta la entropía de los sistemas, es decir, en la que lo

calmente éstos se mueven en paralelo unos con otros hacia el equili

brio.

Ahora bien, nosotros nos encontramos en un universo lejos del

equilibrio. Y hallamos que el aumento de entropía de sistemas aisla

dos temporalmente se produce en la misma dirección, la dirección

que llamamos el futuro. ¿Puede lo que ahora se sabe sobre la estruc

tura cosmológica, global, del universo darnos una explicación de

esto?

La imagen del cosmos que nos presenta la cosmología contempo

ránea es muy diferente a la del universo inactivo en su conjunto de

Boltzmann. El universo, o al menos esa parte accesible a nuestra ins

pección observacional, parece haber estado concentrado en un punto

singular de energía material hace diez billones de años. Desde enton

ces, el universo ha estado expansionándose. No se sabe si dicha ex

pansión continuará eternamente o si, por el contrario, volverá a con

traerse en algún momento para convertirse de nuevo en una

singularidad. Eso depende de la densidad de masa (energía material)

en el universo. El universo como un todo parece obedecer a la Se

gunda Ley, con un aumento de su entropía en la dirección futura del

tiempo.

Este aumento de entropía necesita una explicación. Aquí el

estado termodinámico de la condición singular que se dio en el ori

gen es crucial. Habitualmente se presupone que la materia estaba ori

ginalmente en una condición uniforme de equilibrio, siendo el

estado ordinario de las estrellas calientes, brillando en el espacio frío,

una clara situación de no equilibrio, una evolución ulterior. Pero

¿significa esto que la entropía disminuyó con el tiempo? No necesa


riamente. La disminución entrópica en la materia fue, de acuerdo

con la mayoría de los teóricos, «pagada» con un vasto aumento en la

entropía del campo gravitacional o, si queréis, del espacio-tiempo

mismo. El espacio-tiempo, originalmente uniforme, desarrolló «gránu-

los» a medida que la materia pasó de su condición uniforme original

a su condición actual alejada de la uniformidad. Por razones especia

les relacionadas con la naturaleza puramente atractiva de la grave

dad, esta transformación de un espacio-tiempo suave en uno granula

do corresponde a un aumento de su entropía. Uno podría, pues,

achacar el aumento de entropía del cosmos a su condición espacio-

temporal original altamente organizada y de muy baja entropía.

¿Por qué habría de ser la.condición original una de baja entropía?

De todas las condiciones originales posibles, ésta es una «altamente

improbable». Aquí se ponen a prueba los límites mismos de la expli

cación científica. Nos vemos obligados a aceptar sencillamente como

un hecho que así fueron las cosas, pese a haber sido sugeridas una

diversidad de «explicaciones» de este hecho. Es importante observar

que la expansión del universo no es responsable por sí sola del au

mento de entropía. En un universo en contracción, según el punto

de vista prevalente, la entropía continuaría aumentando, conducien

do a una singularidad final, de naturaleza intrínsecamente compacta.

La inversión temporal de dicha recontracción sería compatible con

todas las leyes y representaría un universo en expansión con entropía

decreciente. La naturaleza especial del big bang y el big cruncb, siendo

el primero de baja entropía y el segundo de alta entropía, es lo que

distingue a un universo en el que la expansión seguida de una con

tracción es acompañada por un aumento, en lugar de por una dismi

nución, de la entropía.

¿Se funda entonces la Segunda Ley de la Termodinámica en su

aplicación a los sistemas individuales pequeños en el estado original,

singular, de baja entropía, del universo? Cuando se intenta que esta

concepción funcione,.surgen problemas. La propuesta habitual es tra

bajar con la noción de sistema derivado. Un sistema derivado es un

sistema individual aislado que originalmente estuvo en contacto

energético con el mundo exterior, fue posteriormente aislado del

mismo durante un tiempo y, finalmente, fue unido de nuevo al mis

mo al final de su tiempo de vida finito.

Supongamos que tenemos un sistema derivado aislado en una

condición lejos del equilibrio. Como el universo a nuestro alrededor


está claramente en un estado de no equilibrio, es mucho más razona

ble suponer que el no equilibrio del sistema derivado es el resultado

de haber sido «separado» del sistema global en no equilibrio, a supo

ner que la condición de no equilibrio del sistema derivado es el re

sultado de una de las extrañísimas fluctuaciones del equilibrio espe

radas incluso en sistemas totalmente aislados.

Imaginemos ahora un gran número de sistemas derivados, cada

uno al comienzo de su vida y todos en una condición común de no

equilibrio. No podemos inferir un comportamiento para los sistemas,

puesto que no tienen una vida pasada, habiendo comenzado a existir

sólo recientemente como sistemas derivados. Si ahora hacemos la su

posición de que la distribución de probabilidades sobre los microes

tados de los sistemas es del tipo estándar, podemos inferir que en un

tiempo breve en el futuro el punto de concentración de los estados

del sistema estará más cerca del equilibrio. Este es el conocido mo

delo de Boltzmann. Descansa en una suposición probabilística acerca

de la distribución de microestados compatible con una condición

macroscópica dada. Pero, se alega, esta suposición no es de por sí asi

métrica en el tiempo. Así pues, el paralelismo de la evolución de los

sistemas derivados, el hecho de que el aumento de entropía de uno

tendrá lugar probablemente en la misma dirección temporal que el

aumento de entropía en cualquiera de los otros, ha sido derivado

simplemente de los resultados cosmológicos, del hecho de que los

sistemas son sistemas derivados y de una suposición probabilística

acerca de las microcondiciones iniciales que no es intrínsecamente

asimétrica en el tiempo.

H. Reichenbach dio una versión formal de este argumento. Rei-

chenbach coloca los estados de una colección de sistemas derivados

en una tabla, con los estados posteriores a la derecha de los anterio

res y los sistemas colocados en una lista vertical. Suponiendo que la

evolución de cada sistema es estadísticamente independiente de la

de todos los demás y suponiendo que los cambios en las distribucio

nes de los microestados en las columnas verticales (es decir, distribu

ciones de microestados sobre la pluralidad de sistemas de un tiempo

a otro) duplican los cambios esperados en un solo sistema a lo largo

del tiempo, es capaz de mostrar que, si la columna de la izquierda en

dicha tabla corresponde al no equilibrio, en el límite del tiempo ten

diendo a más infinito, la columna de la derecha representará el equi

librio. A dicha tabla la llama una «red de mezcla».


¿Introduce realmente esta técnica la explicación del comporta

miento paralelo en el tiempo del cambio de entropía de los sistemas

en la imagen sin simplemente presuponerla? Pienso que no. Habi

tualmente se supone que la dirección del tiempo en la que se produ

ce un aumento paralelo de la entropía en los sistemas derivados es la

misma dirección temporal en la que aumenta la entropía del univer

so como un todo. Pero, curiosamente, la dirección del cambio de en

tropía del universo nunca se utiliza en el argumento. Lo único que se

utiliza es el hecho de que el universo está lejos del equilibrio, no la

dirección de su cambio entrópico. Esto sugiere que el paralelismo

entre unos sistemas derivados y otros también puede haber sido «in

troducido subrepticiamente» en el argumento.

De hecho, yo creo que lo ha sido. Suponed que consideramos

una colección de sistemas derivados, partiendo la mitad de ellos de

un estado de no equilibrio y terminando la otra mitad en el mismo

estado de no equilibrio. Ahora distribuidlos en una red al estilo Rei

chenbach con su estado de no equilibrio a la izquierda. La misma

clase de suposiciones que hicimos anteriormente nos llevará a espe

rar que los estados de los sistemas en o cerca del equilibrio estén a la

derecha. Pero eso correspondería a sistemas que habían partido del

no equilibrio y se aproximaron al equilibrio en el futuro y conduciría

a la inferencia de que los sistemas que terminaron en el no equilibrio

habían estado cerca del equilibrio ¡en el pasado distante! Esto, por

supuesto, es la inferencia errónea. Deberíamos inferir que los siste

mas que terminaron en el no equilibrio procedían de sistemas aisla

dos aún más alejados del equilibrio en el pasado.

Lo que ha sucedido aquí es algo con lo que estamos familiariza

dos a estas alturas. Es razonable imponer la distribución de probabi

lidades estándar a los microestados de un sistema en no equilibrio, si el estado de no equilibrio es un estado verdaderamente inicial en re

lación al proceso que uno está infiriendo. Es ilegítimo —da los resul

tados incorrectos— utilizar dicha distribución de probabilidades

para retrodecir el comportamiento de un sistema a partir de su con

dición de no equilibrio, si esa condición es una condición final y no

inicial en relación al proceso que pretendemos inferir. Esto es justa

mente reiterar el hecho de que los sistemas muestran efectivamente

un comportamiento termodinámico (es decir, aproximación al equili

brio) en una dirección temporal paralela y, de hecho, en la dirección

del tiempo que llamamos el futuro. Pero los argumentos que acaba


mos de examinar no proporcionan una explicación física del hecho.

Antes bien, lo incluyen una vez más como un postulado en su des

cripción del mundo. La cosmología por sí misma, incluyendo el big bang su baja entropía, la expansión del universo y el aumento de en

tropía de ese universo en la dirección temporal en la que se está ex

pandiendo, no parece proporcionar la explicación del paralelismo en

el tiempo del aumento de entropía de los sistemas derivados. De he

cho, el comportamiento del cosmos según la Segunda Ley parece, des

de esta perspectiva, sólo un ejemplo más del comportamiento legal es

tadístico general de los sistemas, ya sean cosmológicos o derivados.

Así pues, el origen del comportamiento paralelo en el tiempo de

los sistemas sigue siendo en lo que a su incremento entrópico respec

ta algo misterioso. Sabemos cómo representar la asimetría en mecáni

ca estadística imponiendo una distribución de probabilidades sobre

los microestados de sistemas en no equilibrio solamente en una for

ma temporal asimétrica. Debemos suponer que la hipótesis estadísti

ca usual sobre cuán probable es un microestado es válida sólo si

tomamos el macroestado que estamos considerando como inicial, y

sólo si vamos entonces a utilizar la hipótesis estadística para inferir el

comportamiento futuro y no el pasado del sistema. Pero el por qué se

da el paralelismo temporal del aumento de entropía sigue siendo un

enigma.

Pero supongamos que el paralelismo se da efectivamente.

Todavía podríamos preguntarnos cómo es que la entropía crece en la

dirección futura del tiempo y no en la pasada. Aquí debemos una vez

más considerar la brillante sugerencia de Boltzmann de que el signifi

cado mismo de la distinción pasado-futuro de las direcciones del

tiempo se funda de por sí en el aumento paralelo de entropía. De

acuerdo con Boltzmann, y aquellos que le siguieron, lo que quere

mos decir con dirección «futura» del tiempo es justamente la direc

ción del tiempo en la que la entropía aumentará con una probabili

dad abrumadora. ¿Es esto plausible? Volveremos a esta cuestión en

«El problema de la dirección del tiempo».

ResumenLa estructura de las explicaciones probabilísticas en mecánica esta

dística es, como hemos visto, muy compleja. Sería muy agradable po

der informar que disponemos de una solución simple a todas las difi

La introducción de la probabilidad en la tísica 215

cultades que acabamos de revisar, pero no es el caso. Las cuestiones

aquí siguen siendo muy controvertidas, a pesar del hecho de que

estos problemas han sido explorados durante más de un siglo.

Hemos visto que uno puede dar una explicación interesante de

las características del equilibrio identificándolas con ciertos aspectos

de un sistema que se manifiestan en el límite de tiempo infinito. Pero

el tipo de «explicación» sobre los fenómenos observados que obtene

mos así dista mucho de la clase de explicación involucrando proba

bilidades que cabría esperar a tenor de las descripciones que los filó

sofos dan de la explicación estadística.

Cuando pasamos al caso de no equilibrio, la estructura explicati

va se parece más a la esbo&da por los filósofos. Pero subsisten mu

chos enigmas. Algunas descripciones de la aproximación al equilibrio

invocan el no aislamiento del sistema o la posibilidad de leyes de la

naturaleza no simétricas en el tiempo. Otras explicaciones descansan

sobre supuestas reglas generales de inferencia probabilística. Los en

foques más estándar descansan en la inestabilidad de las dinámicas

microscópicas del sistema y en el vasto número de microcomponen-

tes que forman el sistema. Pero incluso en el seno de estos enfoques

estándar, como hemos visto, hay ideas enfrentadas sobre el modelo

apropiado que ha de utilizarse y sobre la noción apropiada de expli

cación estadística a la que apelar.

También hemos visto cómo en el seno de los enfoques estándar

el problema del conjunto inicial o de la distribución de probabilida

des inicial correctos es crucial. Cómo elegir la correcta de dichas dis

tribuciones iniciales de probabilidad y, una vez elegida ésta, cómo

explicar por qué puede suponerse legítimamente válida en el mundo,

siguen siendo cuestiones abiertas. El problema fundamental de la asi

metría de los sistemas en el tiempo forma parte de este problema del

conjunto inicial.

Finalmente, hemos visto cómo, aunque uno invoque la asimetría

global en el tiempo del universo como un todo, el problema de la

asimetría en el tiempo de los sistemas individuales permanece abier

to. El problema general de adecuar el comportamiento termodinámi-

co de los sistemas a la descripción general de la dinámica de sus par

tes microscópicas sigue requiriendo un mayor conocimiento, no sólo

de la física de los sistemas, sino también de la estructura misma de lo

que consideramos como explicaciones probabilísticas legítimas en

nuestra descripción teórica del mundo.


Hemos visto que la inestabilidad de las trayectorias dinámicas

del sistema contribuye al comportamiento predecible, estable, del sis

tema al nivel macroscópico. Sin embargo, la inestabilidad puede ser

también una característica del comportamiento macroscópico del sis

tema. A partir del trabajo de Poincaré, los físicos han descubierto

que el comportamiento de los sistemas es con frecuencia fundamen

talmente irregular e impredecible incluso al nivel de las descripcio

nes macroscópicas. Muchos sistemas pueden ser descritos por un pa

rámetro que caracteriza alguna propiedad del sistema. Para algunos

valores de este parámetro, el sistema mostrará un comportamiento

regular, pero para otros valores, el comportamiento del sistema varia

rá tan sensiblemente con su estado inicial que cualquier esperanza de

predecir el comportamiento futuro del sistema será vana. Tales siste

mas deterministas, pero irregulares, son llamados caóticos.

La descripción de los sistemas caóticos ha introducido un nuevo

ámbito de comportamiento en la física, un ámbito en el que los mo

dos de pensamiento probabilísticos pasan a ser herramientas impor

tantes. Y con estos nuevos modos de descripción surgen nuevas cues

tiones filosóficas. En el momento actual, los filósofos están ocupados

con algunas de estas cuestiones, tales como la definición de un siste

ma caótico, los modos de explicación utilizados en la caracterización

del comportamiento de dichos sistemas, y las cuestiones generadas

por el hecho de que los sistemas pueden ser completamente determi

nistas, pero presentar un comportamiento macroscópico fundamen

talmente impredecible. Aunque no será posible echar un vistazo a

estas cuestiones aquí, en las lecturas sugeridas al final de este capítu

lo hemos indicado algunas lecturas introductorias a este nuevo y ex

citante campo.

El problema de «la dirección del tiempo»

Las discusiones de las tesis de Boltzmann a menudo van acompaña

das por debates sobre si la asimetría entrópica representa una asime

tría del «tiempo mismo» o simplemente una asimetría del comporta

miento de los sistemas físicos en el tiempo. Los defensores de la

primera tesis señalan habitualmente la naturaleza profunda y preva-

lente de la asimetría. Los defensores de la segunda afirmación hacen

referencia con frecuencia a otros hechos sobre el mundo que son asi

l l -introducción de la probabilidad en la física 217

métricos temporalmente, pero en los que la asimetría no está genera

da por leyes de la naturaleza subyacentes asimétricas en el tiempo.

Éstos arguyen que únicamente las asimetrías legales podrían llevar

nos a inferir una asimetría del tiempo mismo.

Aquellos que mantendrían que la asimetría entrópica no refleja

una asimetría en la naturaleza subyacente del tiempo normalmente

tienen en mente que deberíamos postular asimetrías del espacio-

tiempo sólo cuando se necesitan para explicar asimetrías de las leyes

de la naturaleza. Un ejemplo, indicado en el capítulo 2, sería la pos

tulación de una diferencia espacio-temporal subyacente para explicar

la distinción legal en la naturaleza entre movimiento inercial y no

inercial. Sin dicha asimetría legal, arguyen, no se necesita postular

ninguna asimetría del espacio-tiempo mismo subyacente. Aquellos

que piensan que la asimetría entrópica nos exige que concibamos al

tiempo mismo como asimétrico negarán que la asimetría entrópica,

con su alcance fundamental y universal, pueda ser reducida a cual

quier «mera» asimetría de los sistemas. Se requiere, arguyen, una ex

plicación más profunda en la asimetría del tiempo mismo.

Como vimos en el capítulo 2, la noción misma de una estructura

espacio-temporal que explique alguna característica estructural entre

las cosas del mundo es de por sí muy problemática. Desde el punto

de vista de muchos relacionistas, dista de estar claro que tenga algún

sentido plantear la cuestión de si la asimetría del aumento de entro

pía es meramente una asimetría estadística universal de los sistemas

físicos en el tiempo o, por el contrario, representa una asimetría sub

yacente del tiempo mismo.

En cualquier caso, las cuestiones cruciales para Boltzmann no

dependerían de la respuesta a estas cuestiones. Boltzmann quiere

vindicar que nuestra distinción intuitiva entre pasado y futuro puede

«fundarse» en la asimetría entrópica. Se esfuerza en vindicar que si

hay partes locales del universo donde la entropía «corre hacia atrás»,

esto es, en la dirección temporal opuesta a aquella en la que crece en

nuestra región del universo, los recuerdos de la gente lo serían tam

bién de sucesos acontecidos en lo que denominamos la dirección fu

tura del tiempo, como lo serían sus registros. Y ellos pensarían que la

causalidad discurre desde esa dirección del tiempo que considera

mos el futuro a esa dirección del tiempo que consideramos el pasa

do. Pensarían en los sucesos en la dirección temporal que llamamos

futuro como fijos y determinados, y en los sucesos en la dirección


temporal que llamamos pasado como abiertos. Pero, por supuesto,

según las tesis de Boltzmann, ellos, como nosotros, afirmarían recor

dar el pasado y tener registros del mismo y pensarían en la causali

dad como discurriendo del pasado al futuro. Ellos llamarían a la di

rección del tiempo que nosotros llamamos futuro la dirección

temporal pasada, y llamarían a lo que nosotros llamamos la dirección

temporal pasada el futuro del tiempo.

Algunas veces, la gente defiende las tesis de Boltzmann señalan

do que solamente a partir de hechos entrópicos es como podemos

determinar si una película está siendo proyectada en la dirección co

rrecta o, por el contrario, está siendo pasada hacia atrás por un pro

yector. Otros critican las tesis de Boltzmann señalando que para los

sucesos reales apenas necesitamos averiguar las características entró-

picas de los sistemas para determinar qué sucesos son posteriores a

qué otros. Estos dos argumentos, sin embargo, fallan por no entender

bien cuál es la tesis de Boltzmann.

Algunas veces los filósofos afirman que un dominio conceptual

se reduce a otro porque el significado mismo de las proposiciones en

uno de los dominios viene dada por afirmaciones en el otro. El argu

mento aquí es habitualmente que todos nuestros medios de deter

minar la verdad o falsedad de las proposiciones de la primera clase

dependen de proposiciones de la segunda clase. Así pues, el fe-

nomenalista arguye que hablar sobre objetos materiales se reduce a

hablar sobre datos sensoriales en la mente, y el relacionista espacio-

temporal arguye que toda conversación sobre el espacio y el tiempo

se reduce a una conversación sobre relaciones espaciales y tempora

les entre cosas y sucesos materiales. Pero yo no creo que sea razona

ble pensar que Boltzmann está afirmando que todo nuestro conoci

miento de la dirección en el tiempo que los sucesos tienen unos

respecto a otros lo derivamos de nuestro conocimiento acerca de las

relaciones entrópicas de los estados de unas cosas respecto a otras en

el tiempo. No es ese tipo de reducción filosófica de la asimetría tem

porada una asimetría entrópica lo que él tiene en mente.

Su noción de reducción, antes bien, está más cerca de lo que el

científico tiene presente al afirmar que la teoría de la luz se reduce a

la teoría del electromagnetismo, o cuando afirma que el hablar sobre

mesas se reduce a hablar sobre ordenaciones de átomos. Las ondas

luminosas son ondas electromagnéticas, según hemos descubierto, y

las mesas son ordenaciones de átomos. Es algo de este estilo lo que


Boltzmann quiere decir cuando afirma que la asimetría futuro-pasado

del tiempo es justamente la dirección temporal fijada por los resulta

dos del aumento de entropía. Pero ¿qué tipo de afirmación es ésta?

Boltzmann nos habría hecho reflexionar sobre nuestra noción de

la dirección abajo en el espacio. Para Aristóteles, la dirección abajo

es una noción primitiva. El probablemente creía que en todos los

puntos del espacio existía una dirección abajo y que todos estos

«abajo» estaban en la misma dirección espacial. Pero ahora sabemos

que «abajo» es sólo la dirección en la que está apuntando la fuerza

gravitacional local. Ahora comprendemos que hay regiones del uni

verso en las que no hay una dirección abajo ni tampoco una arriba, y

aceptamos sin dificultad que 4a dirección abajo para alguien que se

encuentre en Australia no sea paralela a la de alguien que se encuen

tre en Nueva York. Esto es lo que sucede con la distinción pasado-

futuro, afirma Boltzmann. Donde no hay una asimetría entrópica

local, no hay una distinción futuro-pasado, aunque, por supuesto, hay

todavía dos direcciones opuestas del tiempo. Y donde los aumentos

de entropía tienen direcciones opuestas en el tiempo, sucede igual

con la distinción pasado-futuro.

¿Qué se necesitaría para justificar esa afirmación? Ni siquiera

una asociación legal del aumento de entropía con una dirección tem

poral intuitiva sería suficiente por sí sola para justificar la afirmación

de Boltzmann. Para ver que esto es así, necesitamos solamente obser

var que ahora parece claro que ciertos procesos entre micropartícu-

las de materia no son simétricos entre sistemas dextro- y levógiros.

Existe una asimetría legal entre derecha e izquierda en la naturaleza

que se revela, por ejemplo, en el hecho de que ciertos procesos de

desintegración que involucran partículas giratorias son posibles,

mientras las imágenes especulares de estos procesos no lo son. Pero

¿se sentiría alguien inclinado a argüir que nuestra misma distinción

entre lo que es un guante de la mano izquierda y lo que es uno de la

mano derecha, por ejemplo, depende en algún sentido de esa asime

tría legal en la naturaleza que estamos considerando? No por mucho

tiempo, pienso. No sólo no distinguimos la izquierda de la derecha

utilizando estos procesos espacialmente asimétricos, sino que nada

de la existencia o inexistencia de dichos procesos parece tener algo

que ver con la explicación de porqué se da la familiar distinción iz

quierda-derecha en nuestro esquema conceptual intuitivo. Pero es

muy diferente con la gravedad y el «abajo». Nos sentimos inclinados


a decir que, incluso si no existiesen los procesos asimétricos descu

biertos recientemente por la física, la distinción izquierda-derecha

todavía existiría. Pero si no hubiera ninguna fuerza gravitacional, no

existiría simplemente una distinción arriba-abajo, ni en la naturaleza,

ni en nuestro esquema conceptual para tratar con la naturaleza.

La diferencia entre los dos casos es, pienso, la siguiente: En el

caso de la gravedad y el «hacia abajo», creemos que todos los hechos

relevantes sobre la dirección hacia abajo — que las rocas caen y los

globos de helio se elevan, por ejemplo— son explicados por los he

chos sobre la gravedad. Incluso el hecho de que podamos decir, sin

inferencia, qué dirección es la dirección hacia abajo es explicado por

los efectos de la gravedad sobre el fluido en nuestros canales semicir

culares. Pero nada sobre nuestras distinciones intuitivas entre objetos

dextrógiros y levógiros queda explicado en términos de los procesos

de la física que violan la denominada conservación de paridad. La

cuestión crucial es, pues, la siguiente: ¿se parece la conexión entre la

distinción futuro-pasado y la asimetría del aumento de entropía más

a la establecida entre la distinción arriba-abajo y la gravedad, como

Boltzmann pensaba, o se parece más a la conexión entre la distinción

izquierda-derecha y los procesos subatómicos que violan la simetría

de orientación?

Para responder a esta cuestión, tendríamos que caracterizar

todos esos aspectos fundamentales de la experiencia que tomamos

como básicos para la determinación de la distinción intuitiva futuro-

pasado. Después tendríamos que explorar la cuestión de si podría

mos explicar todos estos fenómenos asimétricos utilizando la asime

tría entrópica como el único factor asimétrico explicativo. Se han

llevado a cabo tentativas justamente en este sentido, pero por el mo

mento dejan mucho que desear.

Sin duda, una de las distinciones intuitivas más importantes entre

pasado y futuro es que hay trazos o registros del pasado, pero no del

futuro. Incluso la memoria, quizás, pueda considerarse como un sis

tema de registros del pasado. Pero ¿porqué tenemos registros y re

cuerdos del pasado y no del futuro?

Una respuesta a esta cuestión, dada por Reichenbach, se centra

en lo que él llamaba macroentropía. Aquí no es el orden y desorden

de los microconstituyentes de la materia lo que se cuestiona, sino di

chas clases más aparentes de orden y desorden que distinguirían,

pongamos, una disposición ordenada de objetos de tamaño medio de

La introducción de la probabilidad en la tísica 221

una colección caótica y desordenada de dichos objetos. ReiihiMibach

arguye que cuando encontramos un sistema con una macroentropiu

menor de la que habríamos esperado normalmente, debemos dar

cuenta de este macroestado improbable. Arguye que no es probable

que un microsistema de baja entropía sea una fluctuación espontanea

de un sistema aislado desde un microestado de alta entropía, sino

que es más fácil que se trate de un sistema que interaccionó con el

entorno exterior en el pasado. Después arguye que un sistema que

posea una macroentropía baja precisa también haber interaccionado

con el exterior para haber generado esa macroentropía baja. Una ma

croentropía baja, entonces, nos permite también inferir una interac

ción en el pasado. Y, afirma, esta inferencia de una interacción pasa

da es lo que aporta lo que entendemos por registro o traza.

Su ejemplo favorito es la huella sobre la arena de la playa. Espe

ramos encontrar una playa de macroentropía alta, esto es, una playa

suave con los granos de arena distribuidos aleatoriamente. Al encon

trar la huella, podemos inferir una interacción pasada de la playa con

algo diferente, el pie que produjo la huella. Así la huella es un regis

tro o traza de un suceso pasado.

Pero esta explicación presenta muchos problemas. Algunas veces,

los registros o las trazas son estados de macroentropía alta. Cuando

esperamos orden y encontramos desorden, también lo consideramos

indicativo de una interacción pasada. Los trozos dispersos de una ex

plosión son un registro de macroentropía alta. Algunas veces pode

mos inferir de estados de macroentropía baja a estados futuros. Algu

nos estados de macroentropía baja, por lo demás no esperados, son

pronosticadores de sucesos futuros. Estas situaciones son tales que, da

do que esos sucesos futuros ocurrirán, el suceso presente deviene

más probable. La señal en el radar de la pantalla puede muy bien ser

un buen indicador de una interacción futura, pongamos, del misil

dando en el objetivo, pero no es un registro de ese suceso futuro.

Una justificación real de la afirmación de Reichenbach sería una

razón para creer que hay un modelo general de inferencia de sucesos

pasados que es caracterizable en términos macroentrópicos y que no

rivaliza con un modelo similar de inferencia del futuro. Quizás po

dría llevarse a cabo algo de esta índole. Después de todo, mi periódi

co diario con sus caracteres ordenados es un indicador de lo que su

cedió anteriormente, y no hay nada parecido a un periódico para el

futuro. Pero la razón por la que esto es así sigue siendo muy confusa.


Lo que es especialmente confuso es cómo va a ser utilizado el au

mento hacia el futuro de la microentropía, la irreversibilidad termo

dinámica del mundo, para dar cuenta de la clara asimetría real que

hay en la Forma en que podemos obtener conocimiento del pasado y

del futuro. La ruta a través de la macroentropía es especialmente des

concertante debido al problema de que lo que la macroentropía de

un sistema es, depende de cómo clasificamos los sucesos en clases o

tipos de macrosucesos. Nosotros veríamos algunas formas de hacer

esto como «naturales», y otras como «innaturales» o perversas en al

gún modo. Cualquier teoría que intente explicar cómo es que algu

nos estados ordinarios deberían ser tomados como registros del pasa

do, pero ningún estado ordinario debería ser visto como un registro

del futuro a pesar de la habilidad para inferir algunas veces el futuro

a partir de ellos, y que intente hacer esto invocando la noción de ma

croentropía, debe hacer plena justicia a estas cuestiones de clases de

sucesos naturales versus innaturales. Ni qué decir tiene que la ruta

desde el aumento de entropía termodinámica a una explicación de

porqué tenemos recuerdos del pasado y no del futuro es si cabe más

misteriosa, dado lo poco que sabemos siquiera sobre cuál es realmen

te la base física de la memoria.

Algunos enfoques que secundan las tesis de Boltzmann conside

ran la asimetría del conocimiento, el hecho de que existan registros

del pasado pero no del tuturo, como fundamental. Estos puede que

busquen derivar otras asimetrías, pongamos, nuestra creencia en que

la causalidad va del pasado al futuro, de la asimetría del conocimien

to. Otros enfoques puede que busquen primero una derivación de la

asimetría causal a partir de la entrópica, considerando los registros

como efectos de los sucesos de los que son registros, siendo los suce

sos que son registrados, por definición, la causa del registro de los

mismos.

Un ataque particularmente ingenioso a la asimetría causal que

busca una explicación de la misma en fenómenos que podrían estar

conectados a la asimetría entrópica ha sido propuesta por D. Lewis.

Lewis asocia la causalidad con los denominados condicionales con

tractuales. La idea es vieja: La causa de un suceso es el suceso tal

que, si rio se hubiera producido, el suceso considerado el efecto no

hubiera ocurrido. (La explicación completa es más complicada que

esto, pero la versión simple bastará para nuestros propósitos.) Pero

¿cómo determinamos qué condicionales contrafactuales son verdade


ros? Lewis arguye que nuestras intuiciones son tales que cuando pre

guntamos qué habría sucedido si un suceso real no hubiera ocurrido,

o si hubiera ocurrido en una forma distinta a cómo en realidad lo hi

zo, tendemos a pensar en las clases de cambios que nos veríamos for

zados a hacer en el mundo si el suceso hubiera sido diferente a como

fue. Elegimos como lo que hubiera sucedido lo que sucede en un

mundo que es, en algún sentido, lo más próximo al nuestro posible,

dado que el cambio postulado se necesitó por ser el suceso diferente

a como en realidad fue. Nuestros criterios para hacer tales juicios de

«proximidades de mundos» tolerarán pequeñas violaciones de las le

yes de la naturaleza, pero no violaciones importantes o muchas de

ellas. Buscarán grandes regiQnes del espacio y el tiempo donde las

cosas permanezcan justo como son en este mundo, pero tolerarán

grandes cambios en realidades particulares, incluso si estas realidades

son importantes para nosotros. Los criterios de proximidad están

concebidos para que nuestros juicios intuitivos sobre «lo que sería el

caso» resulten correctos tan a menudo como sea posible.

Un resultado de este análisis es hacer que los «contrafactuales re

troactivos» resulten falsos. Éstos son contrafactuales que nos dicen

que si algún suceso se hubiese dado de otra forma, su pasado habría

sido diferente. Al menos resultan falsos en algunos casos. Los casos

son de los del tipo de la piedra lanzada al agua que genera una onda

expandiéndose en el estanque en el futuro del impacto de la piedra

con el agua. La idea es que mientras el no haber lanzado la piedra

habría requerido solamente un milagro menor en su pasado (mi neu

rona no disparando y no provocando en mí la volición de lanzar la

piedra), el impacto de la piedra en el agua se asocia a una vasta serie

de hechos dispersos espacio-temporalmente en el futuro del impacto.

Éstos son todas esas partes onduladas que aparecen, todas las ondas

luminosas que son emitidas desde ellas, etcétera. Según el análisis de

Lewis, entonces, resulta que si un suceso hubiera sido diferente a

como fue, el futuro de ese suceso habría sido diferente, pero el pasa

do habría sido el mismo, porque un suceso dado está «sobredetermi-

nado» por sucesos de su futuro. Hay muchos sucesos en el futuro de

un suceso dado que requieren la existencia de ese suceso, pero

pocos en su pasado que lo hagan. Y la causalidad siempre va, pues,

desde el pasado al futuro asimismo.

De nuevo hay muchos enigmas. En primer lugar, pensamos en la

causalidad como yendo del pasado al futuro, y no en la otra direc


ción,'incluso en casos que no involucran dicha «propagación de or

den en el futuro». Aquí uno podría intentar una línea de argumenta

ción debida a Reichenbach según la cual nuestra idea básica de cau

salidad asimétrica se forma a partir de casos donde hay una

propagación macroentrópica. El concepto es entonces «proyectado»

por una suerte de analogía a los casos en los que no hay tal propaga

ción. (Pero ¿parece esto realmente plausible?) De nuevo existe el

problema de que todos estos hechos sobre la propagación de un ma-

croorden en el futuro dependen fuertemente de cómo son caracteri

zados los sucesos. Como antes, queda la posibilidad de caracterizar

los macrosucesos de una forma tan perversa que uno observa una

propagación de orden en la dirección temporal equivocada. Final

mente, como Lewis mismo establece, no está nada claro cómo rela

cionar la explicación de la asimetría de la causalidad aquí bosqueja

da con el aumento de la microentropía de la termodinámica. Podrían

hacerse sugerencias acerca de la manera en que esto podría funcio

nar, de la misma forma que existen explicaciones que intentan carac

terizar fenómenos como la propagación de la correlación en los fenó

menos ondulatorios por medio de las características termodinámicas

de los emisores y receptores de las ondas. Einstein intentó explicar la

asimetría de la propagación de ondas electromagnéticas en esta for

ma. Pero todavía hay mucho aquí que no se entiende bien.

Probablemente la única estimación justa de la situación en el mo

mento actual es que la tesis de Boltzmann no es manifiestamente ab

surda o incoherente. Es también una que reposa sobre un argumento

de fuerte plausibilidad. Después de todo, si la asimetría termodinámi

ca de los sistemas en el tiempo es la forma en que la asimetría tem

poral radical se manifiesta en el comportamiento de los sistemas físi

cos, ¿no es evidente que esta asimetría física global es responsable en

alguna forma de todas nuestras asimetrías intuitivas en el tiempo?

Una cosa es cierta: Las tentativas de tomar el tiempo como funda

mentalmente asimétrico en alguna otra forma, pongamos, basada en

algún análisis metafísico profundo de la naturaleza del «tiempo mis

mo» parecen fracasar inevitablemente en explicar la asimetría entró-

pica. Ni tampoco está claro cómo explican realmente las asimetrías

de conocimiento y causalidad. Sin embargo, debe admitirse que na

die ha demostrado nunca realmente que la tesis final de Boltzmann

pueda ser completada en la manera circunstanciada necesaria para

hacerla convincente.

La introducción de la probabilidad en la física

Supongamos que somos capaces de propon?*0i5&wjn«frftóU*b^

vincentes en el sentido de que todas nuestras asimetrías i!!Lflft\fc*en

el tiempo tienen un fundamento explicativo en la asimetría entropífca.

¿Cuál deberíamos entonces decir que es la conexión entre estas dos

relaciones: 1) la relación que un suceso presenta con otro cuando el

primero es posterior al segundo en el tiempo, y 2) la relación que un

suceso presenta respecto a otro cuando el primer suceso está separa

do en el tiempo del segundo suceso y donde también la dirección

temporal del primer suceso al segundo es esa dirección temporal en

la que la entropía de los sistemas aislados casi siempre aumenta? Una

sugerencia que con frecuencia se hace es que una extensión satisfac

toria del argumento explicativo nos llevaría a afirmar que las dos re

laciones son idénticas entre sí.

Aquí la analogía se establece con frecuencia con otras «identida

des descubiertas» en el dominio de la ciencia. Descubrimos que los

cristales de sal son —es decir, son idénticos a— ordenamientos de

iones de sodio y cloro. Descubrimos también que las ondas de luz

son —es decir, no son sino— un tipo de ondas electromagnéticas.

¿No es también justo decir que hemos descubierto que la dirección

«abajo» en el espacio en cualquier lugar es justamente —es justamen

te idéntica a— esa dirección del espacio en la que está dirigida la

fuerza gravitacional en dicho lugar? ¿No sería también plausible en

tonces que si el programa explicativo de Boltzmann pudiera ser desa

rrollado por completo, deberíamos simplemente vindicar una identi

dad entre la asimetría futuro-pasado en el tiempo y esa asimetría

generada por el aumento de entropía?

No obstante, se han dejado escuchar algunas dudas de que

podamos llegar tan lejos, aun cuando el éxito del programa explicati

vo esté garantizado. Estas dudas están relacionadas con las expresa

das en el contexto del problema filosófico mente-cuerpo acerca de la

tesis que identificaría ciertos procesos mentales, como sentir un

dolor o tener una cierta sensación visual, con el desarrollo de un

cierto proceso en el cerebro. Quienes expresan estas dudas no ponen

en tela de juicio, en el contexto de este argumento, que podría darse

el caso de que para todas esas cualidades sentidas o percibidas de la

vida mental, ciertos procesos cerebrales fueran condiciones necesa

rias y suficientes. Podrían incluso estar de acuerdo en que los proce

sos mentales fueron «sobrevinientes» en lo físico, lo cual significa

que dos personas cualesquiera con idénticos procesos cerebrales

22(i Filosofía de la física

deberían tener procesos mentales idénticos. Lo que se niega es que

los procesos mentales y físicos puedan, en alguna forma razonable,

considerarse como uno y el mismo proceso.

Algunas veces estas dudas se expresan en un formato modal que

se retrotrae a R. Descartes. Podemos imaginar un proceso mental del

tipo apropiado sin el proceso cerebral asociado, se dice, o el último

sin el primero. Así pues, los procesos no son necesariamente idénti

cos uno al otro. Pero todas las identidades auténticas son identidades

necesarias, lo cual no significa decir que su descubrimiento podría

no ser una cuestión empírica. De forma que la contingencia de la co

nexión cualidades/procesos cerebrales pone de manifiesto que es

una no identidad. El argumento debe llevarse más lejos, sin embargo,

porque pensamos que también podemos imaginar agua que no es

H-O, aunque el agua sea ciertamente idéntica a H 20 . Llegados a este

punto se da un argumento para explicarnos porqué no podemos real

mente imaginar agua que no es H 2Ot sino sólo sustancia que tiene

muchas de las características propias del agua sin ser agua. Se arguye,

sin embargo, que la «inmediatez» de nuestro acceso a las cualidades

mentales hace que las dos situaciones sean radicalmente diferentes.

A. Eddington propuso un argumento parecido, en el sentido de

que cualquiera que fuera la relación entre que un suceso se diera

después que otro y que un suceso se diera en la dirección temporal

J.e! -.nimentó de entropía con respecto al otro, no podría ser la identi

dad Sabemos, afirmó, cómo es la «posterioridad». Y sabemos cómo

es la noción entrópica de estar un estado más desordenado que otro.

Y sabemos, afirmó, que las dos relaciones simplemente no son la mis

ma relación. Así es justamente como sabemos que cualquiera que sea

la relación de la percepción mental a los procesos cerebrales, no es

una relación de identidad entre lo que está sucediendo.

Aquí, como Eddington recalcó, el papel especial del tiempo en el

mundo es importante. Con frecuencia logramos que las identificacio

nes funcionen eliminando del mundo físico algunas de las caracterís

ticas del objeto identificado y trasladándolas al mundo mental. Así

pues, cuando decimos que una onda luminosa azul es idéntica a una

onda electromagnética, no tenemos que preocuparnos por el hecho

de que las ondas electromagnéticas no pueden pensarse como azules.

Pues ya hemos presupuesto que el azul percibido de la onda lumino

sa no es una característica de la onda de luz física, sino solamente

una «cualidad secundaria» en la mente, generada causalmente por


luz de un cierto tipo que alcanza nuestras retinas. Pero las relaciones

temporales entre los sucesos en el mundo, argüiría Eddington, son

características genuinas de esos sucesos. Y esa clase de temporalidad,

afirma, debe ser exactamente la misma clase de temporalidad que re

laciona los sucesos de la experiencia inmediata entre sí. Por estas ra

zones, razones que son muy difíciles de aclarar filosóficamente, pero

que no obstante son muy sugerentes, él piensa que la demanda de

identidad entre relaciones temporales, según se dan en el mundo y

según las experimentamos de forma inmediata, y relaciones tales

como las que se dan entre diferentes grados de orden, como es la di

ferencia de entropía, es implausible. La teoría entrópica de la asime

tría del tiempo tiene aspectos importantes y filosóficamente descon

certantes aun cuando el programa de Boltzmann como programa

explicativo pueda hacerse completamente plausible.

Lecturas adicionales

Reichenbach (1956) es una discusión seminal de las cuestiones de

este capítulo. Una discusión contemporánea es Horwich (1987). Da-

vies (1974) es una introducción excelente a diversos aspectos de la fí

sica. Sklar (próxima publicación) es una discusión sistemática de la fí

sica estadística desde una perspectiva filosófica.

Una buena introducción a la teoría de la probabilidad es Cramer

(1955). Feller (1950) da más detalles y es más avanzado. Un vivido re

sumen de la base axiomática por su inventor es Kolmogorov (1950).

Un estudio de las teorías filosóficas de la probabilidad puede encon

trarse en Kyburg (1970) o, más concisamente, en el capítulo 3 de

Sklar (próxima publicación). Para una introducción a la aleatoriedad

objetiva véase Earman (1986), capítulo 8.

Una visión de conjunto de lo que los filósofos dicen sobre las

explicaciones estadísticas puede encontrarse en Salmón (1984) y

Humphreys (1989). De nuevo, un breve resumen es el capítulo 4 de

Sklar (próxima publicación).

Los artículos más importantes de la historia de la mecánica esta

dística están traducidos en Brush (1965). Brush (1976) contiene una

buena cantidad de información sobre la historia de la disciplina. Eh-

renfest y Ehrenfest (1959) es una temprana exposición crítica de la

disciplina, también muy útil para formarse una idea histórica.


Buchdahl (1966) y Pippard (1961) son buenas introducciones a

los conceptos de la termodinámica. El trabajo original de Gibbs

(1960) es una buena introducción a los fundamentos de la mecánica

estadística. Tolman (1938) es un tratamiento discursivo y sutil donde

se recalcan los aspectos fundacionales. Jancel (1963) cubre muchos

de los detalles de los enfoques fundacionales de la teoría.

El enfoque temprano de la teoría ergódica puede encontrarse en

Farquhar (1964). El enfoque más moderno es expuesto brillantemen

te (a un nivel matemático bastante sofisticado) en Arnold y Avez

(1968). Sinai (1976) es también conciso y profundo (pero difícil). Para

una discusión filosófica de los enfoques alternativos a la teoría del no

equilibrio, véase Sklar (próxima publicación), capítulo 7.

El enfoque «subjetivista» (mejor dicho, inductivista) de la mecá

nica estadística puede encontrarse en Jaynes (1983), Katz (1967), y

Hobson (1971). Las ideas fundamentales de Krylov se encuentran en

Krylov (1979). Véase también Batterman (1990) y Sklar (próxima pu

blicación), capítulo 7. Sobre el enfoque de Prigogine, véase Prigogine

(1980 y 1984). Véase también Sklar (próxima publicación), capítulo 7,

y Batterman (1991).

Una introducción no técnica al estudio de los sistemas caóticos

es Gleick (1987). Devaney (1986) es una introducción a los aspectos

matemáticos de la teoría. Schroeder (1991) explica la estructura de

muchos aspectos de la teoría del caos y discute, asimismo, otras áreas

donde el razonamiento probabilístico ha pasado a ser central en la

explicación científica.

Un trabajo clásico sobre la relación de la cosmología a la entro

pía es Tolman (1934). Davies (1974) es accesible y cubre muchos tó

picos importantes. R. Penrose (1979) es un tratamiento sutil acerca

del aumento de entropía y de los resultados cosmológicos. Sklar (pró

xima publicación), capítulo 8, es un breve estudio desde una perspec

tiva filosófica.

Sobre sistemas derivados, el origen de la discusión se encuentra

en Reichenbach (1956), especialmente en la sección 3. Davies (1974),

capítulo 3, esboza los sistemas derivados. El escepticismo sobre la co

nexión del aumento de entropía cósmica al aumento paralelo de en

tropía en los sistemas derivados se discute en Sklar (próxima publica

ción), capítulo 8.

Sobre el tema de la dirección del tiempo, Reichenbach (1956),

sección 4, es seminal. Las concepciones a lo Reichenbach se defien

L* introducción de la probabilidad en la física 229

den en Grünbaum (1973), capítulo 8. Mehlberg (1980), especialmente

los capítulos 5 y 8, ofrece una crítica. Una discusión penetrante de

las afirmaciones reichenbachianas se encuentra en Earman (1974).

Horwich (1987) ofrece, tanto una explicación de los orígenes cósmi

cos de la asimetría en sistemas derivados, como una tentativa de fun

damentar la asimetría temporal intuitiva en la asimetría de los siste

mas derivados. Sklar (próxima publicación), capítulo 10, y Sklar

(1985), capítulo 12, exploran cómo deberá ser la estructura de una

descripción reduccionista del orden temporal.

Capítulo 4

LA IMAGEN CUÁNTICA DEL MUNDO

La base experimental de la teoría cuántica

La teoría cuántica ha confrontado a científicos y filósofos de la cien

cia con una serie de cuestiones sorprendentes. Muchos piensan que

cualquier tentativa de comprender un mundo descrito por la teoría

cuántica requerirá una revisión en nuestro entendimiento de la natu

raleza de las cosas mucho más radical que la revisión en nuestro en

tendimiento de la naturaleza del espacio y el tiempo demandada por

las teorías de la relatividad. Se ha afirmado que para comprender la

teoría cuántica debemos revisar nuestro entendimiento mismo de

cuestiones tales como la naturaleza objetiva de la realidad y su inde

pendencia de nuestra percepción de ella, la naturaleza de un sistema

complejo y su relación con sus componentes, y la naturaleza de la de

terminación causal y de otros tipos en el mundo. ¿Qué es lo que en

esta teoría parece imponernos una revisión tan radical en nuestras

categorías básicas de la naturaleza?

Nos será de ayuda explorar muy brevemente algunos de los mo

mentos culminantes en el desarrollo histórico de la teoría. Primero,

hemos de remontarnos a la historia de las teorías sobre la naturaleza

de la luz. En el siglo xvn se propusieron dos modelos sobre la natu

raleza de la luz. Uno, adoptado tentativamente por Newton, decía

que la luz era una corriente de partículas emitidas desde una fuente

231


y reflejadas por los objetos iluminados. El otro, propuesto por C.

Huyghens, entre otros, decía que la luz era una forma de movimiento

ondulatorio en un medio de transmisión, de forma parecida a como

el sonido es una onda generada por una fuente y transmitida como

un movimiento periódico a través del aire.

La teoría ondulatoria tuvo que superar algunas dificultades. ¿Có

mo podía una onda ser transmitida desde el sol a la tierra si existía

un vacío desprovisto de materia entre ellos? Haría falta postular un

medio de transmisión, el éter, que sirviese de soporte a las ondas ori

ginadas en el sol y recibidas en la tierra. Resultados ulteriores sobre

la polarización de la luz indicaron que si la luz fuese una onda, ten

dría que ser tal que su movimiento ondulatorio fuese perpendicular

a la dirección de propagación de la onda. Esto hizo la constitución

de este medio etéreo muy problemática, pues se pensaba que tales

ondas sólo podían transmitirse en un cuerpo rígido. En el caso del

movimiento ondulatorio, uno también espera fenómenos de difrac

ción. Podemos escuchar el sonido producido detrás de una pared en

la que sólo hay una pequeña abertura pues, una vez que el sonido

entra en la abertura, se propaga también detrás de la barrera. Pero

¿no proyecta la luz sombras nítidas, sin mostrar ninguno de dichos

efectos de dispersión, cuando es interceptada por una barrera? Eso

es lo que uno esperaría según la teoría corpuscular.

Pero en los siglos xvm y xix la teoría ondulatoria logró lo que a

todas luces parecía ser una clara victoria. Las mediciones indicaron

que, de acuerdo con lo esperado en la teoría ondulatoria y en con

flicto con las predicciones de la teoría corpuscular, la luz viajaba más

despacio en medios con índices de refracción mayores que en me

dios con índices menores. Una observación detenida reveló, además,

que los efectos esperados de difracción en una onda podían obser

varse en la luz. Anteriormente no habían sido detectados debido a

que la longitud de onda de la luz, a diferencia de la del sonido, es

muy pequeña comparada con el tamaño de los objetos macroscópi

cos. Esto hace que los efectos de dispersión asociados a la difracción

sean muy difíciles de discernir.

Lo más convincente de todo a favor de la teoría ondulatoria fue

el descubrimiento de los efectos de interferencia. Una onda es un fe

nómeno periódico, tanto en el espacio, como en el tiempo. Tiene una

amplitud que aumenta y disminuye periódicamente en cualquier lu

gar determinado, y aumenta y disminuye de un lugar a otro en un

La imagen cuántica del mundo 233

tiempo determinado. Las ondas pueden superponerse unas a otras. Si

la cresta de una onda se superpone a la cresta de otra onda, la ampli

tud de la onda resultante aumenta. Si la cresta se superpone a un

vientre, la onda compuesta resultante tiene una amplitud menor en

ese lugar y momento. Si una onda simple se divide en partes que se

superponen unas a otras a continuación, pongamos, haciendo pasar

la onda a través de dos rendijas separadas en una placa y haciendo

que los haces resultantes se superpongan e impresionen una pantalla,

entonces aparecerá una «figura de interferencia» como resultado de

la alternancia sistemática de superposiciones «constructivas» y «des

tructivas». Dicha figura, obtenible con luz, se considera claramente

indicativa de un fenómeno ondulatorio. Si la luz consistiese de partí

culas en fugar de ondas, esperaríamos encontrar la figura mucho más

simple de dos series de amplitud superpuestas, una por cada rendija,

en vez del sistema periódico de amplitudes grandes y pequeñas co

rrespondiente a una onda.

Hacia el final del siglo XIX, Maxwell convenció a la comunidad

científica de que la luz era una forma de onda electromagnética. Más

tarde, se fue abandonando gradualmente la idea del éter como un

medio de transmisión de la onda. El campo electromagnético mismo

fue visto como un tipo de entidad substantiva que podía ser transmi

tida a través de un vacío genuino, quedando así explicada la transmi

sión de la luz desde, por ejemplo, el sol a la tierra.

Los primeros signos de dificultades en la teoría ondulatoria es

tándar provinieron de las tentativas de entender la interacción entre

la materia y la luz. Un cuerpo material emitirá y absorberá luz. Man

tenido a una temperatura fija, ese cuerpo emitirá luz y la absorberá.

El cuerpo estará en equilibrio con la luz, cuya energía está distribui

da de acuerdo con una ley de distribución fija entre las diversas fre

cuencias posibles asociadas con cada onda. La ley puede ser determi

nada experimentalmente. La distribución de frecuencias variable con

la temperatura es conocida: uno puede ver cómo una barra de metal

calentada va cambiando de color a medida que va aumentando su

temperatura.

Varias tentativas de entender esta importante función de distri

bución espectral fueron llevadas a cabo. Un enfoque, partiendo de la

ley de distribución de Maxwell-Boltzmann para las moléculas de un

cuerpo caliente, dio lugar a la ley de Wien. Esta ley daba una buena

aproximación de la distribución de frecuencias observadas a altas


temperaturas, pero fallaba a bajas temperaturas. Otro enfoque trabajó

también a partir de los postulados de la teoría de la mecánica estadís

tica discutidos en el capítulo 3, pero aplicó el razonamiento estadísti

co a la radiación misma. Esto dio como resultado la ley de Rayleigh-

Jeans. Dicha ley funcionaba bien a bajas frecuencias, pero daba

resultados imposibles —divergentes— a frecuencias altas.

M. Planck buscó una ley de compromiso que se adaptase mejor a

los hechos experimentales, y la encontró. Pero la reflexión sobre su

significado físico parecía conducir a una interpretación casi inevita

ble. La Ley de Planck podía ser considerada válida, sobre la base del

razonamiento teórico ordinario, únicamente si uno suponía que la

materia y la luz intercambiaban energía sólo en «paquetes» discretos,

siendo la energía de cada paquete igual a una constante fija multipli

cada por la frecuencia de la luz emitida o absorbida. Esto estaba en

fuerte contradicción con las suposiciones habituales de la teoría on

dulatoria, a saber, que la luz y la materia podían intercambiar energía

en cualquier cantidad y a cualquier frecuencia. ¿Cuál era el origen de

esta peculiar discontinuidad en el intercambio de energía?

Einstein llamó más tarde la atención sobre otro tipo de interac

ción entre la luz y la materia, a saber, la liberación de electrones por

un metal cuando éste era bombardeado con luz de alta energía, el lla

mado efecto fotoeléctrico, que también parecía sugerir que la energía

existía en la luz sólo en paquetes discretos. Los resultados experi

mentales indicaron una vez más que cada paquete tendría una ener

gía proporcional a la frecuencia de la luz que representaba. La ener

gía de los electrones liberados del metal dependía de la frecuencia

de la luz utilizada, pero no de su intensidad. Sólo el número de elec

trones liberados dependía de la intensidad de la luz. Era como si ca

da electrón fuese liberado por la interacción con un solo paquete de

energía luminosa («fotón») y como si la intensidad de la luz indicase

cuántos fotones había presentes a una frecuencia dada. La luz pare

cía, una vez más, poseer algo parecido a un aspecto corpuscular.

Inspirado por los aspectos corpusculares de la luz, un conocido

fenómeno ondulatorio, L. de Broglie sugirió que los familiares fenó

menos corpusculares podrían tener también un aspecto ondulatorio.

Las partículas componentes que forman el átomo, tales como el elec

trón, mostrarían entonces, bajo condiciones experimentales apropia

das, aspectos de un fenómeno ondulatorio como la difracción o la in

terferencia. Un ingenioso argumento procedente de la relatividad


permitió a De Broglie asociar a una partícula, no ya una frecuencia

considerada proporcional a la energía como era el caso con los pa

quetes de energía luminosa, sino también una longitud de onda. Esta

longitud de onda se tomó como inversamente proporcional al mo

mento de la partícula.

Curiosamente, la confirmación experimental de la audaz conjetu

ra de De Broglie ya se había obtenido, si bien la importancia de los

datos reunidos no fue reconocida hasta que la tesis de De Broglie se

dio a conocer. Uno puede obtener fenómenos de interferencia a par

tir de una onda utilizando no sólo un dispositivo de rendija múltiple,

sino también dispersando la onda mediante un arreglo regular de

fuentes difusoras, tales como líneas gravadas en una placa reflectora,

una así denominada red de difracción. La onda es dispersada por ca

da línea, y las ondas dispersadas se combinan unas con otras, interfi

riendo y produciendo uno de los familiares patrones periódicos de

interferencia tan típicos de la interacción de una multiplicidad de on

das coherentes. Para el electrón, con su pequeña longitud de onda,

los átomos de un cristal proporcionan una tal red de difracción.

Efectivamente, si un haz de electrones es dispersado por la superficie

de un cristal, los electrones reflejados se distribuyen mismamente en

una figura cuya distribución angular es justo la que uno esperaría de

la figura de interferencia generada por una onda de la longitud de

onda asociada de De Broglie tras ser dispersada por una red de di

fracción con el espaciado apropiado al de los átomos en una red cris

talina. Si la luz, una onda, tiene un aspecto corpuscular, los haces de

electrones, haces de partículas, muestran un aspecto ondulatorio.


A continuación, E. Schródinger encontró la ecuación apropiada

cuyas soluciones representarían no sólo la onda asociada a un elec

trón libre, sino también las ondas asociadas a electrones sujetos a va

rios campos de fuerza. La aplicación de la ecuación a un electrón en

órbita alrededor del núcleo de un átomo dio por resultado que sólo

un número discreto de energías del electrón correspondían a ondas

que podían existir en una tal situación de partícula ligada. Efectiva

mente, las energías correspondían a esas energías permitidas de los

electrones en un átomo ya postuladas por una teoría atómica exis

tente.

Esta vieja teoría de los electrones y de su comportamiento en el

átomo, el modelo atómico de Bohr, condujo, curiosamente, al descu-


F ig u r a 4.1. E l aspecto ondulatorio de los electrones revelado por la difracción en un cristal Se dispara un haz de electrones a la superficie de un cristal en una dirección que forma un cierto ángulo con la misma. E l haz reflejado es detectado por D en un ángulo

diferente. La curva C indica esquemáticamente ia variación en intensidad del haz reflejado conforme el ángulo de D al cristal y al haz incidente, e, va cambiando. Tiene una forma que sería la esperada si el haz de electrones fuese una onda que produjese

excitaciones que generasen nuevas ondas dispersándose desde cada átomo de la red cristalina, ondas que entonces «interferirían» entre sí.

brimiento de la teoría cuántica, la cual tomó un rumbo muy diferen

te al que se había seguido desde Planck a De Broglie y a Schródin-

ger. El movimiento de los electrones en un átomo da como resultado

la emisión de luz por el átomo. Pero el patrón de frecuencia de la luz

emitida, el denominado espectro del átomo, es muy diferente al que

se esperaría en las situaciones clásicas. Clásicamente, uno esperaría

que las frecuencias aparecieran en familias de una frecuencia básica y

de múltiplos enteros de la misma. Esto se sigue de unos teoremas clá

sicos muy fundamentales sobre la forma en que el movimiento de

una partícula cargada puede descomponerse en componentes sim

ples, básicos, y de la asociación clásica del tipo de movimiento de

una carga al tipo de luz emitida por esa carga. Lo que se descubrió

en su lugar fue que las frecuencias emitidas podían ser ordenadas en

familias caracterizadas por diferencias de enteros, antes que por sim

ples múltiplos de una frecuencia fundamental.


Bohr ofreció una imagen del átomo que generaba este resultado,

aunque el modelo se apartaba fundamentalmente de lo que debería

ser posible de acuerdo con la teoría entonces estándar. Según la des

cripción de Bohr, los electrones podían existir en estados de energía

definidos, discretos, contrariamente al punto de vista clásico que per

mitía cualquiera de un continuo de estados. En la nueva imagen, los

electrones «saltaban» de un estado de energía a otro. En cada salto

se emitía o absorbía energía en una cantidad igual a la diferencia de

energía entre los dos estados. El cambio de energía en el átomo lleva

ba asociado la emisión o absorción de luz de una frecuencia asociada

con dicha energía por la regla de Planck. Esto se contrapone clara

mente al punto de vista clásico —en el que los electrones emitirían o

absorberían energía de manera continua. El modelo de Bohr era

capaz de generar estos estados de energía para los átomos más senci

llos por medio de un grupo de reglas simples, si bien algo infunda

das. Pero resultó incapaz de aportar un método general para determi

nar los estados de energía en casos más complejos e incapaz

asimismo de indicar una forma sistemática de determinar la intensi

dad y la frecuencia de la luz asociada a la emisión y absorción ató

micas.

W. Heisenberg acometió la resolución de estos problemas bus

cando una forma sistemática de tratar el problema de la interacción

entre los átomos y la luz. Dada la incompatibilidad del modelo de

Bohr con la teoría existente sobre el movimiento de los electrones,

buscó un esquema que evitara por completo el dar una imagen diná

mica del electrón en el átomo. El esquema intentaría, en lugar de

ello, calcular directamente las cantidades observables deseadas. Cu

riosamente, la teoría terminó por aportar, más bien, un nuevo sopor

te a la dinámica en su totalidad. El procedimiento de Heisenberg re

curría al método clásico de reducir los movimientos complejos a

movimientos simples y de asociar la radiación emitida con la canti

dad de cada componente simple de movimiento presente. Pero ahora

hizo falta un tipo de descomposición doble que respondiese a la ca

racterización de las frecuencias observadas por dos números, corres

pondiendo a diferencias en los estados de energía, en lugar de por un

solo número, correspondiendo al múltiplo del movimiento funda

mental, como en la física clásica.

En su nuevo formalismo, Heisenberg duplicó por analogía la es

tructura formal de las viejas reglas para calcular energías, frecuencias


e intensidades. Así consiguió un procedimiento sistemático para de

terminar las energías permitidas del electrón en cualquier átomo, las

frecuencias correspondientes de la luz emitida y las intensidades de

la luz observada.

Así como Heisenberg, M. Born y P. Jordán trabajaron también en

la teoría, proponiendo una teoría dinámica enteramente nueva. Aun

que las matemáticas estaban claras, la interpretación física de la teo

ría era menos obvia. Las cantidades dinámicas básicas de posición y

momento habían sido hasta entonces representadas matemáticamen

te por funciones que asignaban números a la partícula como una fun

ción del tiempo. Estos eran la posición y el momento de una partícu

la en un instante dado. Ahora, sin embargo, las cantidades dinámicas

estaban representadas por objetos matemáticos llamados operadores.

Estos operadores aplicaban una entidad matemática abstracta, el

estado del sistema, de un estado a otro. Se construyeron reglas para

determinar, dado el estado de un sistema y dado el operador corres

pondiente a la cantidad en cuyos valores uno estaba interesado, los

posibles valores observados de la cantidad. Uno podía calcular, por

ejemplo, los posibles valores de la energía para un electrón en un

átomo de un tipo dado. Otras reglas permitían el cálculo de las «am

plitudes de transición» de un estado correspondiente a un valor de

una cantidad a otro en una situación física dada. Así, se podía calcu

lar la razón a la que los electrones saltarían de un estado de energía a

otro en un átomo, aun cuando el átomo estuviese sometido a alguna

interferencia exterior. Esto daba las intensidades de la luz emitida de

una frecuencia específica.

Pero ¿qué tipo de mundo físico correspondía a estas innovadoras

matematicas.' Algo muy nuevo había ocurrido en la física. Mientras

que anteriormente un modelo físico había conducido a una descrip

ción matemática, aquí teníamos una estructura matemática que fun

cionaba, cuya interpretación física parecía bastante problemática.

Pronto se propuso una forma de resolver estas cuestiones sobre

el significado tísico de la teoría de Heisenberg. Si uno calculaba los

posibles estados de energía de un electrón en un átomo según el mé

todo de Schródinger, considerando como tales los posibles valores

de la energía para ondas del electrón «estacionarias» en el potencial

del núcleo del átomo (algo parecido a las ondas de sonido estaciona

rias que pueden formarse en un tubo de órgano de una longitud da

da), uno obtenía valores predichos idénticos a los que se obtenían


mediante las enigmáticas reglas de Heisenberg, utilizando el opera

dor correspondiente a la energía del átomo en cuestión. Si uno calcu

laba las tasas de transición entre estados por el método de Schródin

ger, utilizando un razonamiento similar al que explica cómo un

diapasón vibrando puede poner a otro en oscilación por resonancia,

uno obtenía los mismos valores que los obtenidos por Heisenberg al

calcular las amplitudes de transición con su misterioso cálculo de

operadores. Finalmente, Schródinger fue capaz de demostrar la rela

ción matemática entre las dos teorías que garantizaba que siempre

predecirían los mismos resultados observables. Matemáticamente, los

dos métodos eran «isomorfos» entre sí, debiéndose algunas diferen

cias en su apariencia al hecho de que mientras Schródinger incluía la

evolución temporal del sistema en la evolución de su función de on

da, Heisenberg trabajaba con un estado del sistema independiente

del tiempo e incluía la dinámica de la evolución temporal en la varia

ción en el tiempo de los operadores asignados a un observable físico

dado.

Ahora, parecía, teníamos al menos los rudimentos de un modelo

físico del electrón como una onda en la teoría de Schródinger. ¿No

podría verse la teoría de Heisenberg simplemente como un medio

matemático de tratar a los electrones y a las otras partículas como

verdaderas ondas físicas?

Esto fue lo que propuso Schródinger. Pero esta sencilla solución

a las dificultades pronto resultó difícil de aceptar. La función de on

da «dispersa» que describía al electrón tomaba de hecho la forma de

una onda en el espacio y tiempo físicos sólo en el caso de una sola

partícula. Cuando se consideraba un complejo de partículas, la fun

ción de onda se asemejaba a una onda sólo en un espacio coordena

do abstracto de más dimensiones, en el que las posiciones de todas

las partículas eran representadas simultáneamente por un solo punto.

Mucho peor era la aparente incompatibilidad de la interpretación del

electrón como una onda «real» dispersa con sus obvios aspectos cor

pusculares puntuales. Cuando aplicamos los aparatos experimentales

utilizados para detectar la presencia de un electrón, descubrimos que

todas sus manifestaciones, como la masa y la carga, pueden encon

trarse concentradas en una región física muy pequeña. Si no partícu

las «puntuales», los electrones son, al menos, bastante pequeños en

extensión. Pero la onda que describe la presencia de un electrón es

tá, de hecho, esparcida en un gran volumen físico que llega con fre


cuencia hasta el «infinito», al menos en un grado pequeño. Así pues,

¿cómo puede una partícula localizada ser identificada con una onda

dispersa físicamente real?

Una cierta esperanza de reconciliar los aspectos corpusculares de

un electrón con su pretendida naturaleza física ondulatoria surgió del

hecho de que los fenómenos ondulatorios pueden mostrar con fre

cuencia una concentración estable de la energía de la onda en un vo

lumen pequeño. Se sabía por la teoría ondulatoria clásica de la exis

tencia de algunos casos de «paquetes de ondas» en los que el grueso

de la energía del campo está concentrada en un volumen muy peque

ño del espacio. En un caso excepcional, el oscilador armónico sim

ple, podía demostrarse que el paquete de ondas concentrado de un

electrón se mantenía estable en el tiempo. Pero, vaya, en el caso ge

neral podía demostrarse que el paquete de ondas concentrado co

rrespondiente a un electrón disipaba su concentración muy rápida

mente, dando lugar a una onda ampliamente dispersa en el espacio.

El problema de reconciliar la onda dispersa con la partícula localiza

da seguía abierto.

Nos vemos, pues, enfrentados a un dilema. La luz, de la que se

sabía hacía tiempo que mostraba claramente aspectos ondulatorios

de difracción, interferencia, longitud de onda y frecuencia, resultaba

ahora poseer asimismo un aspecto corpuscular. Cualquier detección

de luz por un aparato material, pongamos, un trozo de una película

fotográfica, revelaba que la luz interaccionaba con la materia en un

modo corpuscular. La energía en la luz parecía estar contenida en pa

quetes discretos que podían interaccionar con la materia sólo «uno

por uno». La materia en forma de partículas elementales, que se sa

bía de tipo corpuscular, con sus masas y cargas concentradas en un

pequeño volumen físico, se veía ahora que tenía también un aspecto

ondulatorio. Los haces de electrones eran difractados al pasar por pe

queños agujeros en paredes, como lo hacían los rayos de luz al pasar

por agujeros muy pequeños del tamaño de un alfiler. Los electrones

dispersados por una red cristalina mostraban una clara figura de in

terferencia exactamente análoga a la mostrada por la luz dispersada

por una red de difracción ordinaria.

Pero ¿cómo podía entenderse esto? ¿Cómo podían aplicarse tér

minos tales como longitud de onda o frecuencia a partículas localiza

das? ¿Cómo podían los constituyentes físicos descritos por una fun

ción de onda dispersa encontrarse, siempre que eran detectados,


localizados en un pequeño volumen en la forma propia de las par

tículas discretas no dispersas?

Primeras tentativas de interpretar la teoría:

el principio de incertidumbre

Interpretando el formalismo: probabilidad, interferencia y mediciónUn vislumbre crucial para la comprensión de la teoría fue la descrip

ción por M. Born de la intensidad de la función de onda como indi

cativa de una probabilidad. Toda onda tiene una amplitud, la «altu

ra» de la magnitud onda. La intensidad de una onda, más o menos

proporcional al cuadrado de esa amplitud, es lo que normalmente re

gistramos, en el caso de la luz, como la luminosidad de la luz; es una

medida de la energía de la onda. Las amplitudes de las ondas de la

mecánica cuántica ondulatoria fueron expresadas en números com

plejos, pero sus «cuadrados» eran números reales que representaban

una cantidad física directamente interpretable. Fue idea de Born el

considerar a estas intensidades como representativas de la probabili

dad con la que se obtendría uno de los posibles valores de un obser

vable físico si se hacía una medición apropiada. La función de onda

puede ser representada por una función de distintas variables, por

ejemplo, por una función de la posición, o bien del momento, de la

partícula a la que está asociada la onda. Dependiendo de la represen

tación elegida, las probabilidades, pongamos, de encontrar a la partí

cula en una región si se efectuase una medición de la posición, o en

un intervalo dado de momentos si se efectuase, por el contrario, una

medición del momento, podían ser calculadas a partir de la intensi

dad apropiada sobre una región de la «onda de probabilidad» cuánti

ca, como algunos comenzaron a llamarla. Las probabilidades de tran

sición de una partícula desde un estado a otro también podían ser

determinadas a partir de las funciones de onda y sus interrelaciones,

tales como las amplitudes de transición asociadas con las intensida

des de luz espectral emitida, calculadas originalmente por el método

de Heisenberg.

Claramente, la idea de Born proporciona la primera clave sobre

cómo reconciliar la «dispersión» de la función de onda con la natura

leza localizada de las cantidades medidas. La onda no representaba

24 2 Filosofía de la física

una partícula real dispersa, sino sólo una probabilidad de encontrar

el valor localizado de la partícula en algún lugar de una región defini

da de valores.

Pero la simple identificación de la intensidad de la función de

onda con probabilidades entendidas en los términos habituales está

plagada de dificultades. El mejor lugar para ver dónde residen las di

ficultades es en el fenómeno de interferencia. Supongamos que un

resultado puede ser obtenido con un cierto grado de probabilidad en

una de dos formas, siendo las dos formas causalmente independien

tes una de otra. Representemos las probabilidades de los resultados

por P (0/A ) y P(0/B), donde O es el resultado y A y B son los dos

modos en los que puede ser obtenido. Normalmente esperaríamos,

dada la independencia causal de A y B, que la probabilidad del resul

tado O condicionada a haber sido obtenido por la ruta A o por la B fuese la suma de las dos probabilidades indicadas. Pero, en general,

esto no es cierto en la situación cuántica. Por ejemplo, la probabili

dad de que un fotón se detecte en un cierto punto de una pantalla

iluminada por dos rendijas no es la suma de la probabilidad de que

el fotón alcance dicho punto cuando sólo la rendija 1 está abierta

más la probabilidad de que el fotón alcance dicho punto cuando sólo

la rendija 2 está abierta. De hecho, si ambas rendijas están abiertas, la

probabilidad de que el fotón alcance un punto dado puede ser menor de lo que sería si sólo una de las dos rendijas estuviese abierta. En

términos ondulatorios esto es debido a que la onda de la rendija 1 y

la de la rendija 2 «interfieren destructivamente» una con otra para

dar la probabilidad reducida en cuestión. Pero si la función de onda

representa sólo una probabilidad y no una onda física en el mundo,

¿cómo puede darse semejante interferencia? Las probabilidades nor

males sencillamente no «interfieren» unas con otras.

Unos cuantos sencillos experimentos idealizados muestran lo cu

rioso que es en realidad el mundo cuántico. Consideremos primero

el experimento de la doble rendija. Aquí se deja pasar a un rayo de

luz simple a través de una placa con dos rendijas que pueden cerrar

se o abrirse indistintamente, y se deja que el rayo vaya a dar a una

pantalla. Si sólo una de las dos rendijas está abierta, se obtiene en la

pantalla una distribución característica de luz centrada en torno al

lugar donde está localizada la rendija abierta. Si ambas rendijas están

abiertas, sin embargo, la figura de la pantalla no es la suma de las fi

guras de cada rendija como indicamos anteriormente, sino que en su


lugar se obtiene la famosa figura de interferencia. Es importante ad

vertir que esto mismo se obtiene cuando la intensidad del rayo es tan

débil que por término medio sólo un paquete de energía, un fotón,

está viajando en cada momento desde la fuente a la pantalla a través

de las rendijas. Esto indica que la figura obtenida no puede ser expli

cada como una interacción causal normal entre los fotones. Es como

si, antes bien, cada fotón pasase por las dos rendijas como una onda,

pero fuese absorbido en la pantalla como una partícula localizada.


Si uno modifica el experimento colocando detrás de cada rendija

un detector que indique si un fotón ha pasado o no por la rendija, la

figura de interferencia desaparece y la pantalla muestra, en su lugar,

el tipo de figura que se obtendría si se sumasen sencillamente las fi

guras de dos experimentos individuales de una sola rendija. La mis

ma figura se obtiene si cada rendija es iluminada con una fuente de

luz independiente, en lugar de tener una misma fuente iluminando

ambas rendijas. Éstas son la mayoría de las peculiaridades caracterís

ticas del mundo que el formalismo cuántico requiere a fin de que

puedan ser captadas.

Otro experimento idealizado, llamémoslo el experimento de la

doble trayectoria, toma un haz simple de partículas luminosas y lo di

vide en dos haces, recorriendo cada uno de estos haces una trayecto

ria diferente, y siendo los dos llevados en un momento dado a coin

cidir en un punto. La división del haz de luz puede efectuarse

utilizando un espejo con una sola mitad azogada que refleje la mitad

de la luz que incide en el mismo y deje pasar la otra mitad a su

través.

En el punto en el que los dos haces son llevados de nuevo a con

verger, podemos elegir el tipo de experimento de detección que que

remos realizar. En un experimento se colocan detectores de tal ma

nera que sólo se dispararán si la «partícula» que está siendo

detectada (el fotón) recorre uno de los caminos y no el otro. Si la in

tensidad del haz se divide uniformemente, este experimento registra

rá resultados compatibles con la hipótesis según la cual parece como

si el divisor del haz original escindiera un haz de partículas en dos

mitades, estando uno de los haces formado por las partículas que re

corrieron solamente el camino A y el otro por las partículas que re

corrieron solamente el camino B. Pero si, en su lugar, los dos haces

son recombinados en el nuevo punto de coincidencia, se puede obte-


(a)

F ig u ra 4.2. E l experimento de las dos rendijas. Si se dirige un haz de partículas, e, a una pared con dos rendijas y las partículas se detectan sobre una pantalla situada al otro lado de la pared, se esperará una distribución de las partículas en la pared de la forma indicada en (a). Dos densidades de partículas, centrada cada una alrededor de

una de las rendijas, sencillamente sumadas una a la otra. Pero si se dirige una onda a la rendija, se espera obtener el patrón de interferencia para la intensidad de la onda indicado en (b). Esto se debe a que las ondas emitidas desde las dos rendijas pueden

sumarse una a la otra o cancelarse entre sí, dependiendo de las distancias relativas a un punto de la pantalla desde las dos rendijas. Si se dirige un haz de electrones, e, a un dispositivo de dos rendijas, el patrón indicado en (b) se detecta en la pantalla, a pesar de la naturaleza corpuscular de los electrones puesta de manifiesto en otros experimentos.


F i g u r a 4 .3 . E l experimento de la doble trayectoria. Un haz de electrones, e, puede dividirse de manera que siga una de las dos trayectorias señaladas con a y b en la figura. En la esquina distante, donde las trayectorias se reencuentran, se podría colocar un

dispositivo R en el camino para recombinar los haces y detectar patrones de interferencia por medio del detector D¡ (mostrando de esta forma la naturaleza ondulatoria

de los electrones) o quitar el recombinador R y por medio de los detectores D2í y D2h detectar a los electrones como partículas que no recorrieron los dos caminos, sino

uno u otro solamente. Uno puede decidir realizar el experimento en un momento posterior al momento en el que el electrón se encuentra ya recorriendo su trayectoria

(bien las dos trayectorias como onda o bien una de las dos como partícula). Éste es el

experimento de «elección retrasada».

ner interferencia entre los dos haces. De hecho, un detector de inter

ferencia, o interferómetro, de este diseño es un dispositivo óptico clá

sico. Estos efectos de interferencia revelan datos en conformidad con

la hipótesis de que es como si el espejo medio azogado original u

otro dispositivo divisor hubiese separado de hecho una onda en dos

componentes, una de las cuales recorrió el camino A y la otra el ca

mino B, pero de forma que permanecieron en fase entre sí, permi

tiendo que las componentes mostrasen al recombinarse el típico fe

nómeno de coordinación conocido como interferencia de ondas. Es

como si cada partícula, si los haces se imaginan como haces de par

tículas, ¡viajase por ambos caminos simultáneamente! (Véase la figu

ra 4.3.)

Tal y como J. Wheeler ha señalado, es importante advertir que la

elección del tipo de experimento a realizar en el punto de coinciden

cia final puede hacerse mucho tiempo después de que el haz haya si


do dividido y enviado a seguir su curso. Esto demuestra que el ape

lar a la elección de los experimentos como algo que determina cuál

de los aspectos corpuscular u ondulatorio del experimento propor

ciona en la división del haz la descripción real del mundo, no contri

buirá a explicar estos efectos.

Es como si en el momento de la división uno tuviera que pensar

en algo que tenga al mismo tiempo los aspectos de un haz de partícu

las dividido en dos haces de partículas separados y los aspectos de

una onda descompuesta en dos ondas componentes correlacionadas.

Otro tipo de experimento, el experimento de Stern-Gerlach, pue

de ayudar a visualizar todo el espectro de fenómenos cuánticos. Una

partícula elemental puede poseer una cantidad, conocida como es

pín, y una cantidad relacionada, el momento magnético de espín.

Esto presenta una relación con la magnetización clásica de una par

tícula giratoria cargada, pero, como la mayoría de los fenómenos

cuánticos, la relación es solamente por analogía. Para un electrón, el

momento magnético de espín se manifiesta como una «doble valora

ción» interna de la partícula. Si se envía a través de un campo mag

nético uniforme en todas las direcciones menos en una que es per

pendicular a la dirección de movimiento del electrón, el electrón se

verá desviado de su trayectoria hacia arriba o hacia abajo en la direc

ción de la inhomogeneidad magnética. Si elegimos entonces una di

rección como la dirección arriba-abajo, y dejamos que el campo sea

no uniforme en esa dirección, el haz de partículas se dividirá en un

haz de partículas «arriba» y un haz de partículas «abajo».

Sea un haz de partículas procedente de una máquina arriba-abajo

que absorbe todas las partículas abajo. Hagamos pasar el haz «arriba

puro» obtenido por una máquina cuya no uniformidad magnética es

perpendicular a la de la máquina arriba-abajo. Llamemos a esta nue

va máquina una máquina derecha-izquierda. Uno descubre que en el

producto final de la máquina derecha-izquierda, la mitad de las partí

culas salen en el haz izquierdo y la mitad en el haz derecho.

Ahora vienen los efectos cuánticos de interferencia característi

cos. Si bloqueamos el haz derecho de la máquina derecha-izquierda y

hacemos pasar su haz izquierdo por una nueva máquina arriba-abajo,

la mitad de las partículas saldrán de la máquina arriba-abajo arriba y

la mitad abajo. Lo mismo sucederá si bloqueamos el haz izquierdo

de la máquina izquierda-derecha y dejamos pasar sólo el haz derecho

por la nueva máquina arriba-abajo. La mitad de los electrones sal


drán arriba y la mitad abajo. Pero si recombinamos los haces izquier

do y derecho procedentes de la máquina izquierda-derecha y envia

mos el haz recombinado a través de la segunda máquina arriba-abajo,

¡todos los electrones saldrán de esa máquina en el haz de arriba! Los

haces izquierdos y derechos procedentes de la máquina izquierda-de-

recha están correlacionados entre sí de forma tal que son capaces de

«recordar» la naturaleza original, puramente arriba, del haz introduci

do. Cuando los haces se recombinan, «interfieren» uno con el otro

para generar no una «mezcla» de partículas izquierdas y derechas, si

no un haz de partículas que están todas definidamente arriba. Sin

embargo, al igual que en el caso de las dos rendijas, si hubiésemos

colocado detectores en las trayectorias de los haces izquierdo y dere

cho a fin de anotar para cada electrón si salió de la máquina izquier-

da-derecha como una partícula izquierda o como una derecha, y lue

go hubiésemos recombinado los haces y los hubiésemos enviado a

través de la máquina arriba-abajo, la mitad de los electrones habrían

salido de esa máquina arriba y la mitad abajo. La medición de los es

pines producidos por la máquina izquierda-derecha hace que cada

uno de ellos sea definidamente izquierda o definidamente derecha y

destruye la coherencia de los dos haces, resultando imposible recons

truir el haz arriba puro por medio de su recombinación. Esto indica

que los efectos de interferencia no son sólo relevantes para la distri

bución espacial de las partículas, sino también para cualquier carac

terística observable que puedan tener. (Véase la figura -4.4.)

En los haces recombinados de productos izquierda y derecha

que generan un haz arriba puro se da una coherencia entre sus com

ponentes izquierda y derecha que no se encuentra en un haz en el

que una de sus mitades está compuesta por el producto de una má

quina izquierda y la otra por el producto de una máquina derecha in

dependiente de la anterior. El último haz se dice que es una «mez

cla» de partículas izquierdas y derechas. El primero se dice que es

una «superposición» de partículas izquierdas y derechas.. Dicho

estado de superposición contiene información no presente en un

estado mixto. En el caso que nos ocupa, la información es que el

producto de la máquina izquierda-derecha es el resultado de haberse

alimentado a la máquina con un haz arriba puro como entrada.

El fenómeno de interferencia hace problemática la interpretación

tradicional y simple de la función de onda como una medida de pro

babilidad. Podríamos probar a considerar la probabilidad como una

248

(a)

(b)

(c)

(d)

(e)

F i g u r a 4 .4 . E l experimento ele Slem-Gerlach. La mecánica cuántica permite a un electrón tener solamente uno de dos valores de espín a lo largo de cualquier eje elegido

E l aparato de Stern-Gerlach puede separar un haz de electrones en dos haces, teniendo todos los electrones de cada uno de los haces salientes el mismo valor de espín. En (a) un haz «aleatorio» de electrones (e) es enviado a una máquina de Stern-Ger- lach con el eje arriba y abajo. La mitad de los electrones salen en el haz arriba y la mitad en el haz abajo. En (b) el haz saliente puro-arriba de un aparato es enviado a otro aparato orientado según el mismo eje. Todos los electrones que entran en el segundo aparato salen del mismo en el haz arriba. En (c) un haz puro-arriba de un primer aparato es enviado a un segundo aparato cuyo eje de orientación forma un ángulo de 90° con el del primer aparato. Al enviar un haz puro-arriba a una máquina

izquierda-derecha se obtiene una mitad de electrones emergentes con espín derecha y una mitad con espín izquierda. En (d) la salida de (c) es registrada por detectores a la

derecha de la máquina izquierda-derecha. Los haces registrados son recombinados y enviados a una segunda máquina arriba-abajo. La mitad salen arriba y la mitad abajo. Esto es lo que uno esperaría si el haz introducido en la ultima máquina está com

puesto por una mitad de electrones con espín derecha y mitad de electrones con es pin izquierda. En (e) la interferencia para el espín del electrón se pone de manifiesto. Esta vez los haces resultantes de la máquina izquierda-derecha son recombinados sin

ser perturbados de ninguna forma (pongamos, por contadores). E l haz recombinado

es introducido en una máquina arriba-abajo. Ahora todos los electrones emergen de

la última máquina con espín arriba. A pesar del paso por la máquina izquierda-derecha, el hecho de que el haz que se introdujo en la máquina izquierda-derecha era un

haz «arriba puro» es «recordado» por la interferencia y se pone de manifiesto en la forma en que la salida final de (e) difiere de la de (d).

I t i e a gen cuántica del mundo 249

me<Hda de nuestro conocimiento de los valores de un sistema. Proba

ría m o s entonces a considerar la asignación de una probabilidad un

medio a las partículas de un haz que fuese izquierdo o derecho como

la afirmación de que cada partícula es definidamente izquierda o de

recha y de que una apuesta razonable sobre si es una cosa o la otra

tendrá las mismas posibilidades en el resultado. O podríamos probar

a considerar la función de onda como diciéndonos que la fracción de

partículas del haz que son izquierdas es un medio y que el resto son

derechas. Pero, como hemos visto, dicho acuerdo no es suficiente.

Pues también hemos de entender que cada partícula del haz recom-

binado está definidamente arriba, y esto distingue al haz de uno muy

diferente compuesto por una mitad de partículas definidamente iz

quierdas y ufia mitad definidamente derechas. La superposición en

tre izquierda y derecha no es la mezcla de izquierda y derecha, aun

cuando para ambos haces es correcto afirmar que una medición iz

quierda-derecha indicará que la mitad de las partículas eran izquier

da y la mitad derecha al ser medidas.

Reflexionando sobre la interrelación formal entre la teoría ondu

latoria de Schródinger y la dinámica formal de Heisenberg, J. von

Neumann y P. Dirac desarrollaron formalismos que se substraían de

los dos enfoques para captar la esencia de la teoría cuántica. En cada

descripción hay representantes matemáticos de los estados del mun

do y de los observables físicos. Supongamos que un sistema tiene un

estado definido. La evolución de su estado en el tiempo cuando está

sometido a una influencia causal exterior es el objeto de estudio de

la dinámica. Dado el estado en un instante determinado y una espe

cificación del observable que va a ser medido, los representantes ma

temáticos del observable especifican cuáles pueden ser los resultados

posibles de la medición, y este representante del observable combi

nado con el estado del sistema determina las probabilidades de que

sea uno de los resultados posibles el que de hecho se obtenga.

Si conocemos el estado de un sistema en un momento dado y las

influencias causales en momentos posteriores, podemos determinar

su estado según el sistema evoluciona. Pero ¿cómo determinamos el

estado inicial de un sistema? Lo hacemos preparando el sistema, un

proceso que constituye al mismo tiempo un tipo de medición de los

valores del sistema. Podemos, por ejemplo, determinar el estado de

espín inicial de una partícula como definidamente arriba en el instan

te = 0 sabiendo que la partícula fue emitida desde el canal superior


de una máquina arriba-abajo en t = 0. Podemos entonces conocer el

estado de espín de la partícula en tiempos posteriores conociendo las

influencias causales (campos eléctricos y magnéticos en este caso) a

las que estuvo sometida desde el momento en que fue emitida por el

canal superior de la máquina arriba-abajo. Si entonces decidimos

efectuar una nueva medición de espín en el sistema, podemos deter

minar —a partir del operador correspondiente a la dirección del es

pín que decidimos medir— qué valores podrán obtenerse (en el caso

del electrón sólo dos, arriba o abajo en la dirección elegida) y a partir

de ese operador y del estado de la partícula en el momento de la me

dición podemos determinar la probabilidad de que se obtenga un va

lor dado del espín en la medición.

La atribución del estado apropiado a la partícula justo después

de su preparación descansa en el famoso Postulado de la Proyección

de Neumann. Este establece que si se acaba de realizar una medición

que revela un valor dado de un observable, entonces el estado del

sistema inmediatamente después de la medición es el que correspon

de al sistema con ese valor exacto para la cantidad medida. (En reali

dad, esto necesita un remedo para dar cuenta del hecho de que algu

nas veces la medición destruye un sistema y del hecho de que una

medición no determina normalmente todas las cantidades compati

bles de un sistema, pero para nuestros propósitos lo hará.) Un argu

mento principal de von Neumann es que solamente dicha atribución

de estados nos garantizará que, si la medición se repitiese a continua

ción, estaríamos seguros de obtener el mismo valor que obtuvimos

en la primera medición. La teoría formalizada expuesta por von Neu

mann, considerada la versión ortodoxa de la teoría cuántica, es

notable, pues, por presentar dos reglas diferentes para determinar el

cambio del estado de un sistema en el tiempo. Una, la regla dinámi

ca, nos dice cómo el mismo paso del tiempo y las influencias exter

nas, como la interacción del sistema con algún otro sistema, conduci

rán a una evolución dinámica del estado del sistema. La otra regla

nos dice que cualquiera que sea el estado de un sistema antes de una

medición, el estado del sistema después de haberse efectuado la me

dición corresponderá al sistema con el valor del observable recién

medido. El estado del sistema es «proyectado» en la medición al de

nominado estado característico correspondiente al valor observado o

medido que se ha obtenido en la medición. Cuando la medición tie

ne lugar, las reglas dinámicas de la evolución del estado son desecha


das. Como veremos, la noción de medición como un proceso espe

cial ajeno a la dinámica ordinaria se convierte en uno de los grandes

apartados problemáticos de la teoría cuántica.

La interpretación de CopenhagueEl gran físico Niels Bohr intentó gestar una imagen global del mundo

que hiciera justicia a los extraños fenómenos cuánticos recién descu

biertos, y diseñar la estructura teórica apropiada. No es fácil resumir

limpiamente su denominada interpretación de Copenhague. Algunos

han visto en ella una nueva filosofía del ser y del conocimiento, cuya

importancia trasciende la mera clarificación de los aspectos cuánticos

del mundo. Otros se han mostrado más escépticos. Einstein en una

ocasión la llamó «la filosofía tranquilizadora de Heisenberg-Bohr

— ¿o religión?— », para decir a continuación que «proporciona una

mullida almohada al fiel creyente de la que no se le puede despertar

fácilmente», es decir, que «encubría» los aspectos problemáticos de

la imagen cuántica en lugar de ofrecer una descripción coherente e

inteligible de los fenómenos cuánticos.

Bohr considera que el objetivo de la ciencia ha de ser determinar

las interrelaciones entre cantidades observables del mundo. Para que

se entienda la teoría cuántica, se considera como observable, no «los

datos sensoriales directamente percibidos por la mente», como en la

filosofía positivista tradicional, sino, antes bien, los resultados de las

observaciones con aparatos de medida típicos. Pero la filosofía de

Bohr comparte algunos aspectos del positivismo tradicional, como el

hincapié en una clase de «los observables» dada de una vez por

todas y en la teoría como sólo un instrumento para obtener las co

rrectas correlaciones de unos observables con otros. Bohr afirmó que

en nuestra descripción de estos resultados observables de la medi

ción nos veremos siempre limitados a los típicos medios «clásicos»

para describir el mundo desarrollados por la física cuántica. Así, las

cantidades que leemos en nuestros aparatos de medida son cosas ta

les como la posición de una partícula, su momento, carga y momento

angular, etc. Un aparato de medida es algo caracterizable nuevamen

te en términos clásicos. Posee estados «salida» definidos, que están

correlacionados a las cantidades medidas de los microsistemas. La

marca depositada de plata metálica indicará, por ejemplo, que un


fotón ha sido absorbido en alguna región limitada de una pelíecula

fotográfica; un destello determinado de un tubo detector puede indi

car el paso por una región de una partícula cargada, etc. En nuestro

registro de los resultados de una medición no habrá lugar para

estados de «superposición» cuánticos, sólo para estados descritos clá

sicamente.

El objetivo de los estados cuánticos es permitirnos hacer predic

ciones de probabilidad sobre los resultados del proceso de medida.

Una lectura clásica nos dice que un sistema ha sido preparado en un

estado cuántico dado. Las reglas dinámicas clásicas nos permiten se

guir la evolución a través del tiempo del estado cuántico asignado al

sistema. En un momento posterior, nos podemos valer de ese estado

cuántico para hacer predicciones probabilísticas sobre los valores

descritos clásicamente que se obtendrán en cualquier medición que

decidamos realizar. Pero es erróneo, desde este punto de vista, consi

derar que los sistemas entre una medición y otra poseen estados clá

sicos. Si podemos inferir del estado cuántico que en una medición

particular se obtendrá con seguridad un resultado específico, enton

ces, quizá podamos atribuir ese valor clásico al sistema aun cuando

no esté siendo medido. Pero, en general, cuando sólo pueden darse

probabilidades menores que la certeza de una variedad de valores

posibles para el resultado de una medición, es erróneo, bajo este

punto de vista, considerar que el sistema no medido posee alguno de

los valores posibles del resultado. Esto es muy diferente a lo que su

cede con la probabilidad clásica, donde nos figuramos que el sistema

tiene un valor definido pero desconocido, siendo la probabilidad

sólo una medida de nuestra ignorancia del estado real.

Bohr combinó esta concepción sobre la naturaleza de la medi

ción y sobre la escasa legitimidad de atribuir estados físicos clásicos a

los sistemas con lo que él llamó la idea de «complementariedad» a

fin de resolver algunas de las paradojas de la teoría cuántica. La com

plementariedad es una noción muy difícil de precisar completamen

te. Bohr mismo a menudo extiende la noción en formas bastante dra

máticas, hablando, por ejemplo, de las descripciones mentales y

físicas de la mente y el cerebro como complementarias. Pero, incluso

en el contexto teórico-cuántico, se da al término un uso muy amplio.

Los aspectos ondulatorio y corpuscular de una partícula se dice que

son complementarios uno del otro. Algunas veces son dos aspectos

de la descripción dinámica de un sistema — como la posición y el

2?3

momento— los que se toman como complementarios. La idea #0 neral es que un sistema puede ser descrito clásicamente en más de

una forma. En la física clásica, un sistema es, bien una onda, bien

una partícula, y un sistema tiene a la vez una posición definida y

un momento definido. En la teoría cuántica, sin embargo, estos pa

res de características aparecen curiosamente entrelazados. Los dos

aspectos complementarios del sistema son necesarios para su com

pleta caracterización. Pero es imposible describir el sistema simul

táneamente en términos de las dos características complementarias.

Podemos caracterizar los aspectos ondulatorios de un sistema, o

podemos caracterizar sus aspectos corpusculares. Pero no podemos

pensar en un sistema como ondulatorio y corpuscular al mismo

tiempo. Podemos imaginarnos un sistema que posea una posición

definida o un momento definido, pero, según Bohr, es imposible

atribuir simultáneamente una posición y un momento definidos a

una partícula.

La «exhaustividad conjunta pero mutua exclusividad» de las ca

racterísticas complementarias se manifiesta físicamente cuando pen

samos en formas posibles de utilizar la medición para asignar una

característica a un sistema. Podemos montar un dispositivo de inter

ferencia para descubrir los aspectos ondulatorios de un sistema,

como su longitud de onda y frecuencia. O podemos usar detectores

de partículas para determinar sus aspectos corpusculares, observando

por qué rendija pasa realmente la partícula. Pero el montar uno de

estos dispositivos experimentales imposibilita la construcción del

otro. Es físicamente imposible construir un dispositivo de medida

que pueda determinar simultáneamente dos de las características

descriptivas complementarias atribuibles a un sistema. Es lícito, en

tonces, concebir un sistema como ondulatorio, significando esto que,

si se realizase un experimento de carácter ondulatorio, el sistema re

velaría sus aspectos ondulatorios. Y es lícito concebir el sistema

como corpuscular, por razones similares. Pero nos vemos liberados

de la responsabilidad de atribuir aspectos contradictorios al sistema

debido al hecho de que nada de lo que hagamos en el ámbito de la

medición podrá poner de manifiesto estos aspectos contradictorios

simultáneamente.

Bohr pasa a mantener que es ilícito incluso pensar en el sistema

cuántico entre mediciones como dotado de la característica que que

remos atribuirle en un sentido absoluto, no relativizado. Valiéndose


de una analogía con la demostración relativista de Einstein por la

que los intervalos de longitud y tiempo eran atribuibles a las cosas

sólo en relación a la elección de un particular sistema de referencia

de movimiento, Bohr argüyó que se podía atribuir estados a los sis

temas — en el sentido de atribuirles características tales como as

pectos ondulatorios o corpusculares— sólo en relación a una elec

ción de los aparatos de medida. En relación a un dispositivo

interferométrico experimental la luz era ondulatoria. En relación a

un dispositivo detector de partículas luminosas, o fotones, la luz

era corpuscular. Si no era en relación a una elección específica del

dispositivo experimental, no era nada en absoluto. (Naturalmente,

Einstein no aceptó de buen grado la analogía con la relatividad,

diciendo que ¡hasta un buen chiste podía contarse demasiadas

veces!).

Bohr argüyó entonces que en cualquier situación experimental

era esencial distinguir entre el sistema que estaba siendo medido, el

cual, hasta que la medición fuese realizada, debía describirse sólo en

estados cuánticos que expresaran potencialidades hacia valores ob

servables que se obtenían en la forma de probabilidades, y el aparato

de medida. El aparato de medida estaba, según Bohr, correctamente

caracterizado en términos clásicos, tanto en lo que se refería a su

construcción y finalidad prior a la medición, como a su estado final

que revelaba el valor medido correcto que había de atribuirse al sis

tema. Mientras que la teoría cuántica era universal en el sentido de

que cualquier sistema físico en el mundo obedecía las leyes básicas

de la teoría cuántica, en cualquier situación de medición uno tenía

que «separar» el mundo en dos componentes, el sistema medido y el

aparato de medida. El primero estaba correctamente caracterizado en

términos cuánticos; pero la descripción correcta para la parte restan

te de la medición del mundo estaba forjada en los conceptos físicos

clásicos tradicionales. Además, la medición no podía ser comparada

con la ipteracción física ordinaria, pues aunque esta última estaba re

gida por las leyes dinámicas de la mecánica cuántica, el proceso de

medida obedecía la regla independiente del Postulado de Proyec

ción.

Pero ¿en qué parte del mundo debía trazarse la línea divisoria

entre el sistema cuántico medido y el aparato de medida clásico? La

respuesta era que podía trazarse a cualquier nivel. Para algunos pro

pósitos era útil considerar únicamente a la partícula elemental como


sistema cuántico y al resto del mundo físico como aparato de medi

da. Pero también podíamos, consistentemente, tratar cualquier parte

del aparato de medida como un sistema físico en interacción con la

partícula elemental, caracterizando al sistema conjunto formado por

la partícula y por esa fracción del aparato como un sistema cuántico.

Si hacíamos esto, reduciríamos el aparato descrito clásicamente a lo

que quedaría después de que la parte que inicialmente había reaccio

nado a la partícula hubiese sido traspasada al dominio cuántico. No

había nada en la física que marcase una línea divisoria estricta entre

la naturaleza cuántica y el aparato de medida clásico. La división po

día ser trazada a cualquier nivel. Pero la misma inteligibilidad de la

imagen cuántica demandaba que ésta fuera trazada en algún lugar.

Sería incoherente pensar en el universo entero como un sistema pu

ramente cuántico, pues la misma inteligibilidad de la atribución de

un estado cuántico a un sistema requería considerar al sistema como

medido por un aparato de medida descrito clásicamente, ajeno al sis

tema cuántico propiamente dicho.

La interpretación de Copenhague es una tentativa extraordinaria

mente ingeniosa de hacer justicia a todos los aspectos peculiares de

la nueva teoría cuántica. Abarca todo, desde la necesidad de descrip

ciones aparentemente incompatibles de un mismo sistema como on

dulatorio y corpuscular, hasta el papel especial jugado por la medi

ción y el Postulado de Proyección en el formalismo de la teoría. Pero

no es evidentemente una concepción del mundo fácil de entender.

Lo más sospechoso de todo es el papel especial que se reserva a los

aparatos de medida descritos clásicamente como esenciales para la

interpretación de la teoría. ¿Cómo puede haber tales cosas si, como

la teoría afirma, todo es en realidad un sistema cuántico? Y ¿cuál es

el papel especial reservado a los procesos de medida? ¿No son éstos

sólo interacciones de un sistema con otro sistema físico? ¿No pueden

ser descritas dichas interacciones por las reglas ordinarias de la teoría

cuántica? ¿Por qué debería haber una regla especial para los proce

sos de medida, si las mediciones no son más que otra variedad de in

teracción física? Y ¿es el punto de vista de Copenhague, con su rela

tivismo radical de los estados físicos de los sistemas respecto a las

elecciones de los aparatos de medida, capaz de proporcionarnos una

caracterización «realista» de cómo es realmente el mundo en su «pro

pia naturaleza»? Volveremos sobre estas cuestiones dentro de un mo

mento.

256

E l principio de incertidumbrePronto se vio que la teoría cuántica en cada uno de sus modos for

males conducía a una variedad de relaciones entre las características

de un sistema, que fueron resumidas como las Relaciones de Incerti-

dumbre. Una sencilla ilustración de estos resultados puede encon

trarse en la imagen ondulatoria de la versión por Schródinger de la

mecánica cuántica. Podemos preguntar por la probabilidad de encon

trar a una partícula localizada en alguna región espacial específica,

calculando las probabilidades según el grado al que la función de on

da está confinada a esa región. Alternativamente, podemos reescribir

la función de onda como una función del momento de la partícula,

encontrando así una nueva función que puede ser utilizada para de

terminar la probabilidad de encontrar a la partícula con su momento

en un intervalo dado. A través de la física ondulatoria clásica se vio

que había una relación recíproca entre el grado al que una función

de onda poseía una extensión espacial y el grado al que se encontra

ría dispersa en el «espacio de frecuencias» si la onda se reformulaba

en términos de varias componentes de frecuencias puras. Traducida

a términos cuánticos, esta relación recíproca conduce a la observa

ción de que cuanto menos dispersa en posición sea la distribución de

probabilidades para una partícula calculada a partir de su estado

cuántico, más dispersa tendrá que ser la distribución de probabilida

des para calcular su momento. Ningún estado cuántico podría gene

rar simultáneamente probabilidades fuertemente concentradas en

torno a un único punto en el espacio y a un único valor del momen

to. (Véase la figura 4.5.)

Desde la perspectiva de Heisenberg, este tipo de relación inversa

se manifestaba en el hecho de que los representantes matemáticos de

las cantidades observables, los operadores en su formalismo matemá

tico, eran «no conmutativos». Esto significa que el producto de dos

de ellos en un orden dado no era, en general, igual al producto

tomado en el orden inverso. Esta relación se cumple entre otras can

tidades conjugadas asimismo, no sólo entre la posición y el momento.

Si se pasaba a la representación abstracta de la teoría cuántica de von

Neumann y Dirac, era posible encontrar algunas relaciones matemá

ticas muy generales que resumían el Principio de Incertidumbre.

El grado de incertidumbre se toma como el producto de una me

dida de la dispersión de la probabilidad de las dos cantidades, cuan-


« nPi

Aq2

F ig u r a 4 .5 . relaciones de incertidumbre. En cualquier estado cuántico de una partícula, hay una cierta probabilidad de que la partícula sea encontrada en una región

determinada del espacio y una cierta probabilidad de que su momento tenga un valor situado en una horquilla determinada de momentos. E n (a) se esboza un estado

en el que la posición de la partícula está fuertemente circunscrita por una estrecha

distribución de probabilidades (trazo q¡). La distribución de probabilidades correspondiente para el momento (trazo p¡) muestra una distribución de probabilidades muy «dispersa». En (b) se esboza un estado en el que la distribución de probabilidades para el momento (trazo p 2) tiene ahora un pico marcado. Ahora la distribución de

probabilidades para la posición (trazo q2) muestra una probabilidad ampliamente

«dispersa», de acuerdo con las relaciones de incertidumbre.

do estas distribuciones de probabilidad son calculadas a partir del

estado cuántico. Algunas veces la incertidumbre varia de un estado

físico a otro. En otros casos, por ejemplo, el de la posición y el mo

mento, había una incertidumbre mínima, fija, de validez universal.

Pero ¿qué significa físicamente esta «incertidumbre ineliminable»?

Al explorar este problema, Heisenberg ofreció una imaginativa

explicación de la incertidumbre, considerándola como indicadora de

una limitación fundamental de nuestra capacidad para fijar todas las

propiedades de un sistema a un grado arbitrario de precisión por

cualquier técnica experimental. La idea básica aquí era que cualquier

medición realizada sobre un sistema debe, inevitablemente, perturbar

físicamente al sistema medido. El fijar una cantidad a un grado deter

minado de precisión perturbaría, pues, el sistema de forma tal que

nuestro conocimiento del valor de alguna cantidad conjugada queda

ría reducido, pudiendo ésta tomar después de la medición cualquier

valor de un gran intervalo de valores.

25H Filosofía de la física

Un famoso experimento conceptual de Heisenberg para ilustrar

su interpretación del Principio de Incertidumbre es un tipo de mi

croscopio diseñado para determinar a un alto grado de precisión la

posición espacial de una partícula en un tiempo determinado. ¿Cómo

podría hacerse dicha determinación de posición? Solamente, arguye

Heisenberg, haciendo que una señal detectora interaccione con la

partícula en cuestión. Uno podría, por ejemplo, iluminar la partícula

con luz y buscar la luz dispersada por el choque con la partícula.

Viendo dónde ha sido dispersada la luz por la partícula obtendría

mos información sobre la localización de la partícula.

Pero el tratamiento clásico del uso de la luz en microscopía rela

ciona la capacidad de la luz para resolver pequeñas diferencias espa

ciales a la longitud de onda de la luz. La luz de corta longitud de on

da puede determinar diferencias espaciales a un grado más fino de lo

que puede hacerlo la luz de una longitud de onda mayor. Pero en la

teoría cuántica, la longitud de onda más corta está asociada a la fre

cuencia más alta y, por consiguiente, a una energía mayor para el pa

quete mínimo de energía de la luz, el fotón. Para poder observar la

partícula ai menos un fotón debe ser dispersado por ella. Cuanto ma

yor sea la energía de dicho fotón, mayor será la horquilla de valores

del «puntapié» que podría dar a la partícula, modificando su momen

to inicial a algún nuevo valor. Si se siguen todos los pormenores se

obtiene una imagen en la que un esfuerzo microscópico para situar la

posición de la partícula en una estrecha horquilla se ve acompañado

de una inevitable interferencia causal en la vida de la partícula, que

disminuye la precisión con que somos capaces de determinar el mo

mento de la partícula después de la medición de la posición.

Teóricamente, incluso en la física precuántica, cualquier medición

de un sistema debe interferir con el estado del sistema en un grado

mínimo. Pero, en la imagen clásica, dicha interferencia puede ser redu

cida a una cantidad tan pequeña como uno quiera. Para Heisenberg,

al menos en esta interpretación de la incertidumbre, el elemento esen

cial de la teoría cuántica era la ahora inevitable interferencia mínima

en el sistema, la perturbación irreducible de su estado, una perturba

ción que no podía ser reducida por ningún medio físico, y que debe

acompañar a cualquier tentativa de determinar el valor de una propie

dad dada del sistema dentro de un pequeño intervalo de valores.

Desde esta perspectiva, la incertidumbre se considera una limita

ción a nuestra capacidad de discernir los valores simultáneos exactos


de dos propiedades conjugadas de un sistema. Esto es, consideramos

que el sistema tiene, por ejemplo, valores simultáneos precisos de la

posición y del momento, pero que nosotros somos incapaces, debido

a la interferencia inevitable del proceso de medida con el sistema, de

determinar con exactitud esos valores precisos, existentes conjunta

mente.

Bohr nunca quedó satisfecho con semejante interpretación de la

incertidumbre. Insistió desde el principio en que la especificación del

estado cuántico de un sistema constituía una descripción completa

de cada sistema individual del que ese estado cuántico era correcta

mente predecible. Era erróneo, argüyó, considerar que el estado

cuántico era válido en una colección de partículas, en la que cada

partícula posee de hecho un estado preciso más completo, si no com

pletamente cognoscible, de tipo clásico. Antes bien, argüyó, el estado

cuántico, con su «dispersión» intrínseca de los valores de las cantida

des clásicas representada por la dispersión de las distribuciones de

probabilidad asociadas con esos valores, era una descripción total del

estado real de la partícula. Para cualquiera de dichos estados cuánti

cos, como hemos indicado, habría conexiones entre los grados de

dispersión de las distribuciones de probabilidad para cantidades con

jugadas. Cualquier determinación de un estado cuántico que reduje

se la dispersión en la posición generaría automáticamente un estado

cuántico con una amplia distribución de probabilidades para el mo

mento. Pero, argüyó Bohr, era demasiado conservador interpretar

esta relación inversa como si se tratase meramente de una limitación

a nuestra capacidad de fijar con precisión valores conjugados simul

táneamente. En lugar de ello, uno debía considerar que cada partícu

la individual poseía — en el mejor de los casos— valores dispersos de

una cantidad clásica, si se insistía en considerar que las partículas no

poseían ninguna propiedad clásica entre mediciones.

Heisenberg se vio inducido a aceptar la lectura bohriana «ontoló-

gica». más radical, de la incertidumbre. Esto es, aceptó la idea de que

la incertidumbre refleja la dispersión irreducible de características

del sistema, no meramente una limitación en nuestro conocimiento

de propiedades conjuntas a grados arbitrarios de precisión. Más tar

de veremos algunas de las razones que le movieron a adoptar esta

postura más radical. Einstein, sin embargo, se vio consternado por la

teoría radical de Bohr y durante algún tiempo intentó hallar buenas

razones físicas para refutarla.


Siguieron una serie de fascinantes debates entre Einstein y Bohr.

Einstein se propuso como cometido personal el encontrar una situa

ción experimental en la que se violasen las limitaciones a la especifi

cación exacta de cantidades conjugadas dictadas por las Relaciones

de Incertidumbre. Diseñó ingeniosos experimentos conceptuales

para intentar mostrar que uno podía determinar dos cantidades con

jugadas a un grado de precisión conjunta que el Principio de Incerti-

dumbre declaraba imposible. A cada una de las sugerencias de Eins

tein, sin embargo, Bohr argüía que el procedimiento experimental en

cuestión requería en último término la determinación de dos cantida

des básicas por uno de los procedimientos que, como podía demos

trarse utilizando argumentos heisenbergianos, limitaban nuestro co

nocimiento de las cantidades conjugadas necesarias de acuerdo con

las familiares limitaciones de la incertidumbre. Si uno acepta los con

traargumentos de Bohr, parecería imposible encontrar la manera de

soslayar las Relaciones de Incertidumbre por medio de algún experi

mento real que superase su limitación. Sin embargo, esto todavía deja

sin responder, incluso si el Principio de Incertidumbre es verdadero,

la cuestión de cómo exactamente han de entenderse las relaciones.

¿Deben de ser entendidas en el viejo, más modesto, sentido heisen-

bergiano como una limitación sobre lo que podemos determinar, o

en el- modo bohriano, más radical, que niega la existencia misma de

valores precisos de dos cantidades conjugadas?

¿Qué es la medición en la teoría cuántica?

El problema de la mediciónEl formalismo básico de la teoría cuántica es claro y su aplicación al

mundo de la observación y del experimento no es, en la práctica,

más polémico que el de cualquier otra teoría física formal. Pero la

teoría nos plantea un montón de problemas interpretativos sorpren

dentes. Miembros de la comunidad científica, que se muestran de

acuerdo plenamente con los resultados de la teoría cuántica aplicada

al mundo físico, se encuentran enfrentados entre sí cuando intentan

explicar justamente cómo «entienden» lo que la teoría nos dice sobre

la estructura fundamental del mundo.

La teoría asocia a los sistemas entre mediciones un estado cuánti


co. Presumiblemente, pues, este estado «representa» en una forma u

otra el estado de naturaleza del sistema. Pero ¿qué es ese estado físi

co del sistema? y ¿cómo lo representa el estado cuántico? ¿Debería

considerarse al estado cuántico como una descripción de sistemas in

dividuales, pongamos, el de un fotón en el experimento de la doble

rendija? Después de todo, el hecho de que los resultados de la inter

ferencia sean válidos incluso si las partículas son enviadas una por

una a través de las rendijas, sugiere que cada fotón debe ser conside

rado de una forma u otra como «capaz de percibir» ambas rendijas

en la forma descrita por el estado cuántico. Pero ¿cómo puede des

cribirse correctamente una parfícula tan localizada por medio(de una

función de onda dispersa?

El uso‘ probabilístico de la función de onda, sugerido en primer

lugar por Born, hace alusión a una interpretación por la que la fun

ción de onda describiría, más bien, una colección, o «conjunto», de

sistemas, a la manera reminiscente del papel de las distribuciones de

probabilidad sobre posibles microestados de sistemas en la mecánica

estadística descrita en el capítulo 3. Dicha interpretación es también

sugerida por la lectura más obvia del Postulado de Proyección. Si la

función de onda es una descripción probabilística de una colección

de sistemas o, en una interpretación paralela, una representación de

nuestro conocimiento parcial del estado completo de un sistema in

dividual, entonces parece claro por qué descartar una función de on

da en favor de la correspondiente a un sistema en el que el valor

exacto de un observable dado se conoce tan pronto como ese valor

del observable haya sido obtenido en una medición. Si la medición

aumenta nuestro conocimiento específico de un sistema particular y

si la función de onda es relativa a ese conocimiento, no es sorpren

dente que se produzca un tipo de «colapso» no dinámico de la fun

ción de onda en la medición.

Pero esta interpretación también se encuentra plagada de dificul

tades. ¿Cómo explicamos los famosos efectos de interferencia tan pa

radigmáticos de la situación cuántica? El conocimiento parcial de

que el fotón pasó por la rendija uno no debería «interferir» con el

conocimiento parcial de que pasó por la rendija dos. Los fenómenos

de interferencia son característicos, más bien, de ondas físicas reales

dispersas. Hay también otras dificultades con la sencilla interpreta

ción conjuntista o del conocimiento parcial de la función de onda

cuántica. El complemento normal a considerar una representación


como «parcial», a la manera de la descripción conjuntista estadística

de un sistema, es abrigar la esperanza de que una descripción ulte

rior es posible; la descripción ulterior localizará el sistema específico

como miembro de una colección más restrictiva de sistemas. De he

cho, lo que se espera normalmente es que exista una descripción de

un sistema por la que éste sea el único miembro de la «clase unidad»

de un, y solo un, sistema físico. Así, por ejemplo, si en mecánica esta

dística tenemos una descripción de un sistema como miembro de

una colección de sistemas caracterizados por su temperatura común,

pensamos que son posibles descripciones más completas de los siste

mas, siendo la más fundamental aquella que especificase exactamente

el microestado completo del sistema en cualquier instante de tiempo.

Pero Bohr insistió en que el estado cuántico de un sistema espe

cífico era una descripción completa del estado de ese sistema. Aunque

dicha descripción especificaba solamente probabilidades para los re

sultados de las diversas observaciones que podían ser realizadas so

bre el sistema, era la descripción «más fina» posible del sistema. Si

esto es así, entonces es erróneo pensar que la función de onda carac

teriza una colección o caracteriza un conocimiento parcial en el sen

tido de las interpretaciones tradicionales de la probabilidad. La cues

tión de si Bohr estaba en lo cierto sigue siendo controvertida. Sin

embargo, como veremos, muchos resultados han mostrado que si

Bohr estuviese equivocado, no seria una cuestión trivial explicar de

que manera exactamente podría una descripción cuántica ser com

plementada para dar una descripción más completa del estado de un

sistema individual. Algunas cuestiones que aparecen aquí implican la

posibilidad de seguir describiendo el estado de un sistema en los tér

minos clásicos tradicionales. ;Es posible, por ejemplo, pensar que

una partícula en un estado cuántico que es una superposición de dos

estados de espín posee, de hecho, una de las componentes del espín,

aunque no sepamos cuál de ellas es? Otros debates contemplan la

posibilidad cié complementar la descripción cuántica de un sistema

con una ¿aracterización más detallada del sistema que sea suficiente

para precisarlo en una manera no estadística, incluso en una forma

que evite los términos descriptivos clásicos. Por el momento basta

con decir que ni la simple interpretación del estado cuántico de un

sistema al modo de un estado tradicional físicamente disperso como

una onda clásica, ni la interpretación ingenua del mismo al modo de

una medida de probabilidad tradicional de una colección especifica


da sólo mediante un conocimiento parcial del estado del sistema, pa

recen hacer justicia al papel que juega el estado cuántico en la teoría.

La teoría cuántica hace uso no sólo de los recién introducidos

estados cuánticos, sino también de los viejos estados clásicos. Bohr

interpreta que la función de onda especifica las probabilidades de los

resultados en las mediciones de varias cantidades. Pero, tal como

Bohr señala, estos resultados se especifican en los viejos términos clá

sicos. Una partícula sale de un aparato Stern-Gerlach de medida de

la componente del espín «definidamente en el haz de arriba» o «defi

nidamente en el haz de abajo». Un fotón que es sometido al experi

mento de las dos rendijas es finalmente localizado como habiendo

impresionado en alguna región definida la pantalla fotográfica. Alter

nativamente, si se han colocado detectores en las rendijas, el fotón es

detectado en el estado y «pasa definidamente por la rendija uno y

dispara el detector uno» o «pasa definidamente por la rendija dos

y dispara el detector dos».

Pero si todos los sistemas físicos pueden ser descritos adecuada

mente de acuerdo con las leyes de la mecánica cuántica —y la teoría

afirma esta universalidad— ¿cómo puede haber lugar en el universo

para instrumentos de medida cuyos estados de detección están carac

terizados en términos clásicos anticuados? ¿Existen realmente dos ti

pos diferentes de sistemas en el mundo, sistemas cuánticos y sistemas

clásicos, debiendo escribirse los primeros en términos de funciones

de ondas y los segundos en términos clásicos? O ¿es la práctica de

caracterizar en términos clásicos los resultados de las mediciones

algo que se ha de «eliminar» del contexto de la teoría cuántica como,

quizás, un tipo de «descripción aproximada», legítima pero condu

cente a errores, del estado real del aparato de medida? Si uno adopta

el argumento de que las descripciones clásicas de los aparatos de me

dida no son una descripción falsa de los mismos sino, al contrario, la

caracterización real de su verdadero estado físico, entonces surge la

cuestión de si no sería legítimo considerar a los sistemas cuánticos

medidos como poseedores de dichos estados clásicos.

Finalmente está la cuestión de la naturaleza del proceso de medi

da. Como indicamos, la teoría formal traza una clara línea de demar

cación entre los dos procesos, evolución dinámica y medición. Su

pongamos que conocemos el estado cuántico de un sistema en un

momento dado. ¿Cómo vamos a determinar el estado cuántico que

hemos de atribuirle en un tiempo posterior? Si el sistema no es ob


servado en ningún momento entre los dos instantes de tiempo, en

tonces, de acuerdo con la teoría, tendremos que seguir la evolución

de la función de onda que describe el estado cuántico del sistema

utilizando la famosa ecuación de Schródinger. Esta ecuación es el

análogo en la teoría cuántica de las ecuaciones dinámicas de la diná

mica clásica que nos dicen cómo evolucionará en el tiempo el estado

dinámico clásico de un sistema, teniendo en cuenta que el sistema es

tuvo sometido a ciertas fuerzas y tenía una constitución interna espe

cífica. Al igual que en la física clásica, pues, existe un tipo de «deter

minismo» de la evolución de un estado cuántico. Un sistema

sometido a fuerzas determinadas y de una naturaleza dada que tiene

un estado cuántico definido en un momento dado, tendrá en un mo

mento posterior un estado cuántico definido relacionado al primero

por las leyes de la dinámica.

Pero, ¡esto no es así si se realiza una medición sobre el sistema en

dicho intervalo de tiempo! Pues, dice la teoría, cuando la medición

tiene lugar, la evolución dinámica ha de ser ignorada y, en su lugar,

debe aplicarse el Postulado de Proyección. La función de onda que

describe el sistema prior a la medición debe ser descartada y, en su

lugar, introducirse la función de onda correspondiente al valor de la

cantidad observable obtenido en la medición. (Si la medición no de

termina los valores de todas las cantidades observables del sistema

que podrían ser determinadas, entonces se utiliza en su lugar una

versión modificada del Postulado de Proyección, la Regla de Lüder.

Al igual que el Postulado de Proyección, empero, no se trata eviden

temente de un mero ejemplo de evolución dinámica ordinaria.)

Ahora bien, si pudiéramos librarnos de la interpretación de la

función de onda por la que ésta pasó a ser, como es el caso de algu

nas distribuciones de probabilidad clásicas, una representación de

nuestro conocimiento parcial del sistema, podríamos entender la me

dición y el Postulado de Proyección de una forma muy simple. Una

medición sería cualquier proceso que aumentase nuestro conoci

miento del estado del sistema. No es de extrañar, pues, que la fun

ción que describe nuestro conocimiento parcial del sistema «salte»

en la forma discontinua indicada por el Postulado de Proyección en

la medición. Pero, como hemos visto, dicha interpretación de la fun

ción de onda no llega a hacer plena justicia a sus otros aspectos — tí

picos de un estado físico— como es el de la interferencia. Si concebi

mos la función de onda como un tipo de estado físico del sistema.


resulta mucho más difícil entender el lugar que ocupa en el formalis

mo el peculiar proceso denominado medición y entender el cambio

no dinámico de la función de onda en los procesos de medida.

¿Qué es lo que distingue, desde esta última perspectiva, un pro

ceso de medida de cualquier otra interacción dinámica ordinaria?

¿Cómo está el sistema relacionado a un aparato de medida en alguna

forma diferente al sistema meramente interaccionando con algún

otro sistema físico? Esa interacción tiene una descripción perfecta

mente clara en el seno de la teoría. Se trata de un aspecto de la diná

mica de los sistemas, en este caso de la dinámica que describe dos

sistemas inicialmente independientes uno de otro y más tarde en in

teracción física entre sí. Pero la evolución del nuevo sistema conjun

to (el sistema original combinado con el sistema físico con el que ha

llegado a interaccionar) no se parece en nada, de acuerdo con el for

malismo de la teoría, a ese proceso descrito por el Postulado de Pro

yección. Más decisivo es que, en la interacción dinámica ordinaria,

los efectos de interferencia debidos a encontrarse el sistema original

mente en una superposición de estados se conservan cuando el siste

ma interacciona con algún nuevo sistema físico. Las correlaciones

que caracterizan el proceso de interferencia son simplemente transfe

ridas al nuevo sistema conjunto.

Pero en un proceso de medida, según la descripción del Postula

do de Proyección, la interferencia se destruye. En el «colapso del pa

quete de ondas» que describe el Postulado de Proyección, los térmi

nos de interferencia sencillamente desaparecen. Un electrón descrito

por una función de onda extendida por todo el espacio está, una vez

que el electrón ha sido medido y localizado en una región espacial li

mitada, descrito por una función de onda confinada enteramente a esa

región. Un fotón descrito como una superposición de estados corres

pondientes a pasar por la rendija uno y por la rendija dos, está, des

pués de haber accionado el detector frente a la rendija uno, descrito

por una función de onda «pura» asociada a la rendija uno. ¿Por qué

las mediciones son diferentes de las interacciones físicas ordinarias?

La solución de Bohr y sus críticosHemos señalado anteriormente la ingeniosa y sutil tentativa de Bohr

de hallar una justificación de la naturaleza paradójica del mundo


cuántico. En la Interpretación de Copenhague, la medición se toma

como una noción «primitiva». Un sistema interaccionando con el

mundo exterior puede ser medido y no sólo tomar parte en la inte

racción dinámica. Los resultados de los procesos de medida se consi

dera que constituyen los hechos verdaderamente incuestionables so

bre el mundo, y la teoría se considera un mecanismo cuyo único

papel es proporcionar correlaciones entre el valor basado en un pro

ceso de medida que prepara a un sistema en un estado cuántico da

do y el valor de alguna cantidad observable en una medición poste

rior. Entre una medición y otra no debe considerarse al sistema

poseyendo algún valor clásico dado pero desconocido. Antes bien,

posee meramente «potenciales» de revelar valores observables con

probabilidades especificables en relación a un aparato de medida ele

gido. Como la medición simultánea de algunas cantidades — las com

plementarias— no es posible, y carece de sentido preguntar por las

probabilidades de que el sistema posea dichos valores conjuntos, in

compatibles, de los observables complementarios.

Pero ¿es aceptable la Interpretación de Copenhague? Una obje

ción a la misma procede de Schródinger y Einstein. Al igual que

Einstein, Schródinger fue uno de los grandes inventores de la teoría

cuántica y al mismo tiempo uno de los más severos críticos de sus in

térpretes «ortodoxos».

Recordemos, en primer lugar, que para Bohr es incorrecto pensar

que un sistema que todavía no ha sido medido tenga un estado clási

co, salvo quizás en la situación poco corriente de tenerse la certeza

de que se obtendrá un valor particular al medir el sistema. Recorde

mos, además, que para Bohr cualquier medición consiste en la medi

ción de un sistema cuántico por un aparato que debe ser descrito en

términos clásicos. Y recordemos por último que, en la explicación

que Bohr da de la medición, la línea divisoria entre el sistema (des

crito por un estado cuántico) y el aparato (descrito por estados clási

cos) puede trazarse a cualquier nivel. Aunque debe haber una parti

ción en algún lugar entre el sistema cuántico medido y el aparato de

medida clásico, la línea divisoria entre uno y otro no es algo que esté

determinado por la física de la situación, sino que puede ser trazada

en cualquier lugar de la cadena que va desde el sistema microscópico

hasta el valor observado al final. De hecho, varios resultados de con

sistencia de la teoría cuántica muestran que se inferirán las mismas

probabilidades para los diversos resultados de una medición, tanto si


consideramos que un sistema A es medido por un aparato compues

to B + C, como si consideramos en su lugar que el aparato C está

midiendo el sistema compuesto A + B.Sea ahora una caja en cuyo interior se encuentran un espejo divi

sor de haces y una fuente débil de fotones. Pongamos detectores en

las trayectorias del dispositivo y conectémoslos de manera que si el

detector uno se enciende primero, se produce una explosión por me

dio de una señal amplificada que mata a un gato en la caja. Es más,

dispongamos las cosas de manera que si el detector dos se enciende

primero, el mecanismo explosivo se desconecta. Schródinger nos pro

pone considerar lo siguiente: hasta que el fotón sea medido y locali

zado en una de las dos trayectorias, tenemos que figurárnoslo como

una superposición de haber estado en ambas trayectorias, cada una

con un peso asociado de un medio. Ahora podríamos considerar que

la medición ha tenido lugar tan pronto como uno u otro de los dos

detectores se enciende primero. En ese momento en el tiempo, pues,

el fotón habrá estado efectivamente en la trayectoria uno o efectiva

mente en la trayectoria dos. La superposición de los estados asocia

dos a las trayectorias colapsará a un único estado puro asociado a

una única trayectoria. (Véase la figura 4.6.)

Pero también podemos figuramos que la medición ha tenido lu

gar sólo en el momento en que hemos mirado dentro de la caja ce

rrada para ver qué había sucedido. La línea divisoria entre el mundo

cuántico y el aparato clásico podría ser, pues, correctamente trazada

tomándonos a nosotros como aparato de medida y a todo el conteni

do de la caja, incluyendo la fuente de fotones, el divisor del haz, los

detectores, los amplificadores, los mecanismos explosivos, los disposi

tivos interruptores del circuito, y el gato, como componentes todos

ellos de un único sistema cuántico complejo. Si trazamos la línea di

visoria en esa forma, entonces la concepción de Bohr nos obliga a

creer que, hasta que nosotros miremos en la caja, el fotón permane

cerá en una superposición de estados asociados a la trayectoria uno y

a la trayectoria dos. Pero lo mismo ocurrirá con el resto del sistema

acoplado al fotón y sus detectores. En otras palabras, hasta que no

miremos en la caja, es incorrecto decir que el gato está vivo o muer

to. En lugar de ello debemos decir que está «en una superposición

de estados vivo y muerto». No obstante, como Schródinger hace ver,

semejante concepción de algo que es macroscópico y animado es un

absurdo. Puede que sea posible (aunque difícil) figurarse un fotón en


F i g u r a 4.6. El gato de Schródinger. En una caja cerrada herméticamente se monta un

aparato en el que un haz de partículas, e, es dividido en dos haces, siendo igual la probabilidad de que una partícula vaya por uno u otro camino. Si la primera partícula sigue la ruta que pasa por D¡, se activa un barril de explosivos, destruyendo a un

pobre gato colocado encima de él. Si la primera partícula pasa por D¡, el interruptor S se abre, salvando al gato de la posibilidad de ser dinamitado. ¿Cómo debería un observador que se encuentra fuera de la caja y es incapaz de saber lo que ha sucedido

en ella describir al gato tras un período de tiempo en el que no hay duda de que una partícula al menos ha pasado por Dt o ha pasado por D2? De acuerdo con la Interpretación de Copenhague, el observador no debería imaginarse al gato vivo o muerto, sino, antes bien, «en una superposición de estados vivo y muerto», de la misma manera que un electrón que sale de una máquina Stern-Gerlach izquierda-derecha sin

ser detectado debe imaginarse en una «superposición de estados de espín izquierda y espín derecha» hasta su detección. Pero ¿es aceptable semejante descripción del gato

(o de cualquier otro objeto macroscópico)? Si no lo es, ¿en qué momento antes de que el observador exterior haga una observación de lo que queda dentro de la caja

debería dicho observador considerar que el gato está «definidamente vivo» o «definidamente muerto»?

una superposición de estados de trayectorias o un electrón en una

superposición de estados de espín, pero ¿no es manifiestamente ab

surdo figurarse al gato ni muerto ni vivo, sino «en una combinación

de los dos estados con igual peso»? Recordad que el estar en una su

perposición no puede ser interpretado, de acuerdo con Bohr, como

estar en un estado definido u otro, sin saber en cuál de los dos se es

tá. Es una «combinación» efectiva de los dos estados.

Advirtamos, claro está, que Schródinger no demuestra en modo

alguno que la explicación de Bohr conduzca a observaciones des


mentidas por el mundo. En el momento en que miramos al gato, por

supuesto, el paquete de ondas colapsa y encontramos al gato vivo o

muerto. De hecho, Bohr estaría sin duda alguna contento creyéndose

las consecuencias de su teoría. Todos los objetos en el mundo obede

cen a la mecánica cuántica, desde el más pequeño al más grande. Y

todos son susceptibles, pues, del tipo de efectos de interferencia que

nos obliga a considerar a los sistemas como si estuviesen en estados

de superposición. De nuevo, para Bohr estos estados son sólo poten

cialidades hacia resultados con probabilidades dadas en la medición.

El gato existe, al igual que el fotón mientras no es medido, en un

estado potencial que requiere referencia a una superposición. Pues,

en principio, podrían llevarse a cabo experimentos que revelarían la

interferencia latente en el estado del gato, así como podríamos quitar

los detectores y sustituirlos por una pantalla que pusiera de manifies

to la interferencia latente en la superposición de los estados trayecto

ria que es la condición cuántica del fotón.

Soluciones idealistasPero a otros les resulta absurdo pensar que el gato está en una super

posición de estados vivo y muerto. Llevando la sugerencia de

Schródinger un paso más adelante, E. Wigner introduce «el amigo de

Wigner». Sustituyamos el gato en la caja por un científico. Según

Bohr, hasta que miremos en la caja, deberíamos pensar que el cientí

fico está en una superposición de estados vivo y muerto, aunque, cla

ro está, el científico puede —en un momento en el que nos lo

estamos imaginando en dicha superposición— verse a sí mismo efec

tivamente volado, o no. Pero, dice Wigner, esto es absurdo. Esto lle

va a Wigner a una concepción de la medición y del mundo que es

bastante sorprendente procediendo de un físico, pero casi inevitable

como un camino alternativo para pensar en las perplejidades cuán

ticas.

¿Qué tiene de especial la medición, pregunta Wigner, en tanto

que opuesta a la interacción física ordinaria de dos sistemas físicos?

En una medición real, algún medidor debe «apercibirse» del valor

determinado por el proceso de medida. La concepción de Wigner

nos recuerda a la de los dualistas filosóficos, quienes consideran a un

ser humano (y, quizás, a otros seres sensibles) como una criatura mix


ta compuesta al mismo tiempo de un cuerpo físico y de una mente

— un tipo de entidad no física «ligada» al cuerpo, quizás mediante

una causalidad mutua a través del cerebro. Así, Wigner piensa que

una medición ha tenido lugar cuando, y sólo cuando, una mente es

afectada por el sistema medido. El efecto sobre la mente puede ser

muy indirecto, produciéndose por mediación de muchos aparatos fí

sicos intermedios (incluyendo los órganos sensoriales, los nervios y el

cerebro del cuerpo).

Pero no podemos considerar la medición como una mera ganan

cia de información por parte de un sujeto y, por consiguiente, como

un cambio de su «función de conocimiento parcial». Como ya indica

mos, la concepción de una función de onda como un mero compen

dio de nuestro conocimiento de un sistema y la de su colapso en la

medición como tan sólo el familiar cambio discontinuo de una fun

ción de conocimiento cuando se adquiere nuevo conocimiento, no

hace justicia a las otras propiedades de la función de onda. Éstas son

las propiedades de interferencia, por las que la función de onda se

parece mucho más a una representación de un estado de un sistema

natural independiente del conocimiento. Para Wigner, antes bien, la

medición es una interacción de doble sentido entre la mente y el

mundo físico. El mundo afecta causalmente a la mente, diciéndole

qué valor determinado se ha medido en el sistema; el mundo hace

esto indicando a la mente en qué posible estado acabó el aparato de

medida físico. Pero la mente también actúa sobre el mundo. Pues el

solo hecho de estar el sistema físico en un estado clásico definido y

no más en una superposición, es un efecto de la interacción de la

mente con la materia.

Para Wigner, pues, la medición ha tenido claramente lugar una

vez que el científico en la caja sabe si está siendo volado, o no. Pro

bablemente, si los gatos tienen mentes, lo mismo es cierto para el ga

to de Schródinger. La concepción bohriana, que permite incluso a

los científicos y a los gatos formar parte de un sistema cuántico res

pecto a un medidor externo —como un científico fuera de la caja ce

rrada— se rechaza.

No es extraño que la descripción del mundo aportada por Wig

ner, con su metafísica dualista del mundo físico y las mentes observa

doras, no resulte atractiva para muchos. Además de tolerar lo que

muchos tacharían de metafísica absolutamente extravagante, la expli

cación de la medición ofrecida es de por sí problemática. El colapso


de la función de onda causado por la acción de la mente sobre el sis

tema físico es algo que no se explica y que no compete a los físicos

explicar. Junto a los procesos legales de la naturaleza gobernados por

las leyes ordinarias de la física, en particular, por la ley dinámica de

la evolución dada por la ecuación de Schródinger, uno tiene ahora

un proceso «extrafísico» en el que algo de «fuera», la mente del ob

servador, interfiere en los mecanismos legales de la naturaleza física.

¿No podríamos encontrar una forma de explicar la medición que evi

te llegar a los extremos tolerados por estas explicaciones idealistas,

pero que evite asimismo, tanto la introducción de nociones primiti

vas de medición a la manera de Bohr, como la curiosa separación

ineliminable del sistema cuántico respecto al aparato de medida clá

sico propuesta por Bohr?

La medición como interacción físicaUn grupo de enfoques busca la caracterización de un proceso de me

dida, como distinto a las interacciones físicas ordinarias, viendo en el

mismo no una clase distinguida de proceso a la manera metafísica

del enfoque de Bohr o del enfoque idealista, sino intentando caracte

rizar una interacción por medición como una subclase específica de

las interacciones físicas ordinarias. Dentro de esta escuela, un grupo

de enfoques se centra en el hecho de que en un proceso de medida

el sistema cuántico interacciona con un instrumento de medida «ma

croscópico», y en el proceso de medida una microcaracterística del

sistema que está siendo medido se correlaciona con una macrocarac-

terística del aparato medidor en una forma que revela el valor de la

microcantidad.

En una operación que detecte por cuál rendija pasa la partícula,

por ejemplo, la partícula puede ser detectada al salir de la rendija

por medio de algún dispositivo de descarga electrónico (como un

contador Geiger) que amplifique el paso de la partícula por el detec

tor. Esto podría funcionar mediante la inducción al paso de la partí

cula de una cascada de un gran número de partículas cargadas segui

da de una gran descarga macroscópica de voltaje que involucre

enormes cantidades de partículas actuando concertadamente, reve

lando la presencia de la partícula microscópica. En una máquina de

Stern-Gerlach, las partículas con distintas componentes de espín en


la dirección que se está midiendo son, primero, separadas espacial

mente unas de otras a distancias macroscópicas por el campo magné

tico inhomogéneo del aparato. Después son detectadas, bien en el

haz superior, bien en el haz inferior, por un aparato similar al descri

to más arriba. En el caso del gato de Schródinger, el aparato revela la

ruta tomada por la partícula amplificando la elección cuántica reali

zada a los estados macroscópicamente diferenciables de un gato ínte

gro con vida y un gato volado, muerto, disperso.

Hay, pues, dos importantes características de la medición que

debemos tener en cuenta. La primera es que el estado final del apara

to medidor involucra cantidades enormes de partículas y es identifi-

cable en una escala macroscópica. La otra es que los estados finales

del aparato son macroscópicamente diferenciables (son «puros» y no

una superposición de estados) y están perfectamente correlacionados

con los estados microscópicos del sistema cuántico que está siendo

medido.

Además, arguye esta escuela, debemos percatarnos de que en rea

lidad el aparato macroscópico es, al igual que el sistema cuántico ori

ginal, un sistema físico ordinario en el mundo. Desde este punto de

vista, el sistema macroscópico debe poder ser descrito por la teoría

cuántica, y su interacción con el sistema cuántico que está siendo

medido debe poder ser determinada por las leyes cuánticas ordina

rias de la interacción de dos sistemas físicos. Pero, en este punto, la

interpretación tropieza con una dificultad. La teoría cuántica nos di

ce que si un sistema interacciona con otro, estando el primer sistema

en un estado superposición antes de que se diera la interacción, el

sistema combinado formado por el primer y segundo sistemas des

pués de tener lugar la interacción debe estar en un estado super

posición. Esto es cierto incluso si el segundo sistema estaba ori

ginalmente en un estado puro o en uno de los estados mixtos

correspondientes a estar en uno u otro estado puro con diferentes

grados de probabilidad en el viejo sentido. Si una partícula con espín

a la izquierda interacciona con un aparato detector de espines en la

dirección arriba-abajo, la partícula entra en la interacción en una su

perposición de estados de espines arriba y abajo. El estado funda

mental del sistema partícula-más-aparato-medidor debe ser, entonces,

un estado superposición. Es la superposición de dos estados puros

—«la partícula con espín arriba y la máquina dice espín arriba» y «la

partícula con espín abajo y la máquina dice espín abajo»— . Pero si


esto es así, ¿cómo puede la interacción representar una medición en

la que el resultado se supone que es un estado «partícula arriba y

máquina diciendo arriba» definido, o bien un estado «partícula abajo

y máquina diciendo abajo» definido?

Aquí se propone con frecuencia una manera de resolver esto que

hace referencia al hecho de que en una interacción por medición

puede considerarse a efectos prácticos que la superposición final no

existe en absoluto, aun cuando, propiamente hablando, la interacción

por medición tiene como resultado un estado superposición. En su

lugar, el estado superposición final puede ser reemplazado por un

estado mezcla similar. La idea fundamental es que, si bien la interac

ción del sistema y el aparato de medida debe, de acuerdo con las le

yes de la mecánica cuántica, retener esas correlaciones tipo interfe

rencia que distinguen una superposición de estados de una mezcla

de los dos estados, puede que en la práctica esta interferencia y sus

efectos sean irrecuperables después de haber tenido lugar la interac

ción.

¿Qué es lo que nos dice que el estado de una partícula espín-iz

quierda, después de haber sido enviada a través de una máquina de

espín arriba-abajo y no detectada, debe ser descrito como una super

posición de estados arriba y abajo, y no como una mezcla de los mis

mos? Si uno examinase el producto de una máquina de espín arriba-

abajo en cuanto a estados de espín arriba-abajo, encontraría a la

mitad de las partículas con espín arriba y a la mitad con espín abajo.

Ésta es la predicción que uno obtiene al describir a la partícula bien

en una superposición, o bien en una mezcla de estados de espín arri

ba y abajo con igual peso. Pero si uno enviase este producto a través

de un detector de espín izquierda-derecha, las partículas saldrían

todas a la izquierda. Eso es lo que la descripción tipo superposición

predice, pero no lo que la descripción tipo mezcla predice. Eso reve

la la interferencia remanente.

Pero si la partícula que sale de la máquina arriba-abajo se detecta

a la salida, será imposible en la práctica poner de manifiesto alguna

diferencia entre la mezcla de los estados «partícula arriba, aparato di

ce arriba» y «partícula abajo, aparato dice abajo» y su superposición.

Hacer esto requeriría un proceso que siguiera el curso exacto de

todos los microestados de todas las partículas en la cadena causal ini

ciada por la interacción del sistema de partículas y el detector. Tal

capacidad para poner de manifiesto la correlación debida a la interfe-

27A Filosofía de la física

renda remanente está fuera del alcance de cualquier posibilidad real.

Así pues, a los efectos predictivos de las probabilidades de los resul

tados de ulteriores experimentos que involucren a la partícula o al

aparato, bastara con la descripción tipo mezcla como una aproxima

ción de la verdadera descripción tipo superposición. La correlación

debida a la interferencia se ha disipado en el enorme número de gra

dos de libertad de las innumerables partículas que conforman el apa

rato macroscópico. Esta disipación se produce en el proceso amplifi

cador que revela el microestado de la partícula que está siendo

medida. Así pues, la superposición, aunque realmente presente, pue

de ser tratada como si se anulase cuando la medición tiene lugar.

Esta forma de considerar el proceso de medida cuenta con mu

chas ventajas. No se necesita introducir mentes que interaccionen

con el mundo físico mientras uno permanece fuera del mismo y sin

posibilidad de lograr una física comprehensiva que describa el mun

do. Ni se necesita la curiosa y elástica escisión del mundo en sistema

y aparato de medida que la Interpretación de Copenhague demanda.

En lugar de ello, hay solamente un mundo físico con interacciones fí

sicas ordinarias. Algunas de estas interacciones presentan las caracte

rísticas necesarias para que la verdadera descripción cuántica pueda

ser reemplazada por una aproximación falsa, pero adecuada. Estas

características son la macroscopicidad y la complejidad de los apara

tos de medida y ia perfecta correlación entre sus estados indicadores

y los estados microscópicos del sistema que está siendo medido. La

medición es. bajo esta concepción, sólo un tipo especial de interac

ción física y, cuando se la describe exactamente, cae bajo las leyes de

la dinámica cuántica y no fuera de ellas como sucede en las concep

ciones interpretativas idealistas o de Copenhague.

Pero esta forma de considerar la medición presenta problemas

propios. Los argumentos están diseñados para demostrar que uno

puede reemplazar una función de onda superposición por una fun

ción de onda mezcla a efectos predictivps cuando el sistema cuántico

medido interacciona con un aparato de medida suficientemente gran

de v complejo. Pero la medición de un sistema cuántico individual

da como resultado un sistema que debe tener, no la función de onda

mezcla, sino la función de onda pura de uno de sus componentes. Si

medimos el espín arriba-abajo de una partícula originalmente en un

estado que es una superposición de estados arriba y abajo, encontra

remos a la partícula en la medición definidamente arriba o definida-


mente abajo. Esto es «el colapso del paquete de ondas». El argüir

que la superposición original de estados arriba y abajo, convertida

ahora en una superposición de sistema y estados del aparato combi

nados, puede ser reemplazada por un estado mezcla, parece estar de

acuerdo implícitamente con la idea de que la función de onda

debería ser considerada como una descripción, no de una sola partí

cula, sino de una colección de partículas. Pues es a una colección de

partículas medidas, algunas ahora definidamente arriba y otras defíni-

damente abajo, a la que se atribuye propiamente el estado mezcla.

Pero ¿cómo puede reconciliarse esta concepción implícitamente

conjuntista de la función de onda con los hechos que parecían indi

car que cada partícula individual tenía la cualidad de una función de

onda superposición? Por supuesto, puede responderse que esas cu

riosas correlaciones tipo interferencia de una partícula, las cosas que

nos mueven a decir que cada fotón individual «pasa por las dos ren

dijas», siguen siendo características del mundo cuántico. Lo que se

está defendiendo aquí, se dirá, es que podemos entender por qué en

un proceso de medida configuramos nuestra teoría para hablar como

si la interferencia desapareciese, cuando sabemos que realmente no

lo hace. El argumento es, de nuevo, que el tamaño y la complejidad

del aparato de medida nos asegura que los restantes potenciales de

interferencia realmente existentes nunca podrán ser detectados ob-

servacionalmente por ningún experimento practicable.

Hay, quizá, una objeción más profunda, pero una que al menos

tiene una respuesta potencial. Born, buscando desentrañar lo que sig

nificaba la función de onda, hizo la famosa sugerencia de que su in

tensidad debía ser tomada como la probabilidad de obtenerse un va

lor dado para el sistema. Confrontado con la cuestión de cómo era

posible que las probabilidades cuánticas difiriesen tan radicalmente

de las probabilidades clásicas, Bohr sugirió una sutil enmienda a la

idea de Born y habló de probabilidades en relación a la elección de

uno u otro de un conjunto de procesos de medida complementarios.

Pero estas interpretaciones, así como las idealistas, presuponen que

en algún momento los resultados de las mediciones son verdadera

mente caracterizables en términos clásicos. Pues, sólo podremos in

terpretar el estado cuántico como «potencial» de que el sistema reve

le aspectos clásicos, si conservamos los conceptos clásicos para

describir los resultados de las mediciones.

La interpretación de la que nos ocupamos ahora, sin embargo,


debe tratar el papel de los conceptos clásicos en la interpretación de

la teoría en una forma mucho más compleja. Esto se debe a que, de

acuerdo con esta interpretación, no existen en realidad estados del

mundo físico que puedan ser descritos correctamente en términos

clásicos. La forma más correcta de caracterizar el estado total del

mundo — sistema y aparato de medida— será siempre por medio de

una función de onda cuántica. Pero si la función de onda debe de

suyo entenderse en términos de las probabilidades de estados descri

tos clásicamente, ¿cómo puede resolverse este dilema?

Se puede contar una historia que quizá explique cómo es posible

que podamos llegar a entender el significado de la función de estado

cuántica por una vía que «de paso» implica conceptos clásicos, aun

cuando en nuestro entendimiento final estos conceptos clásicos no

desempeñan ningún papel legítimo en la caracterización de los

estados del mundo físico. La historia dirá que nuestro anterior enten

dimiento precuántico del mundo es falso, pero que su suficiencia a

efectos prácticos para caracterizar los estados del mundo puede ser

explicada en última instancia por la relación de esta imagen falsa a la

verdadera imagen cuántica. Esta relación ha de fundamentarse en la

teoría de los procesos de medida indicada más arriba, donde la ca

racterización clásica del aparato de medida se explica como una «for

ma falsa pero adecuada de hablar». La historia nos dirá que, sobre la

base de un aparato conceptual que forma parte de, y depende de,

una falsa concepción del mundo, construimos la teoría cuántica co

rrecta, entendiendo inicialmente sus conceptos por referencia al mar

co de trabajo clásico anterior. Entonces, una vez en dominio del apa

rato cuántico, reconstruimos el marco de trabajo clásico anterior

como la imagen falsa, pero útil, del mundo que es. Después de utili

zar el marco de trabajo clásico a modo de escalera, nos deshacemos

de él una vez que hemos alcanzado nuestro objetivo.

Quizá. Pero surgen muchas preguntas. ¿Creemos realmente que

los objetos están efectivamente en estados de superposición en todo

momento? ¿Creemos realmente que no hay nada semejante a un gato

que esté, verdaderamente, del todo vivo o del todo muerto, sino que

permanece siempre en una superposición de estados? ¿Cómo

debemos de entender realmente dicha afirmación? ¿Habrá un

retorno final a la idea de que los conceptos clásicos son todavía ade

cuados para caracterizar lo que experimentamos directamente como

un tipo de característica de nuestra percepción inmediata, cuando no


de todos los objetos físicos reales? Esto asemejaría los estados clási

cos a las «cualidades secundarias» de la tradicional metafísica lockea-

aa, esto es, características que son verdaderamente predecibles sólo

de los contenidos de la percepción inmediata y no de los objetos físi

cos «como son en sí mismos».

La interpretación de Kocben y las interpretaciones estocásticasDebería tenerse en cuenta que hay otras interpretaciones de los pro

cesos de medida que comparten con la que acabamos de discutir su

afirmación básica de que la medición debe ser considerada como

una especie de interacción física en general y no, como en la concep

ción de Bohr o en la concepción idealista, como un proceso diferen

ciado de la evolución dinámica ordinaria de los sistemas. Pero no

todas las concepciones semejantes del proceso de medida explicarán

la adecuación del Postulado de Proyección, esto es, la utilidad de ver

a la función de onda colapsando y perdiendo todos sus términos de

interferencia, como resultado del tamaño y de la complejidad del

aparato de medida y de la disipación consiguiente de interferencia en

irrecuperabilidad.

S. Kochen, por ejemplo, ha propuesto otra descripción del lugar

de la medición en la dinámica. Una vez más, es en la naturaleza de la

interacción del sistema medido con el aparato de medida, según la

descripción de la dinámica cuántica, donde es hallado el fundamento

para justificar el lugar ocupado por el Postulado de Proyección en la

teoría. No se reserva ningún papel a los aparatos de medida descritos

clásicamente, como en la teoría de Bohr, ni se invoca un reino espe

cial del ser fuera de la física y, por consiguiente, fuera de la mecánica

cuántica, como en las interpretaciones idealistas. Pero tampoco de

sempeñan un papel crucial el tamaño macroscópico y la complejidad

del aparato de medida. La naturaleza de la interacción que establece

correlaciones entre los estados puros del sistema medido y el aparato

de medida sigue, empero, siendo relevante.

La interpretación de Kochen descansa en un importante teorema

de la mecánica cuántica. Dejemos que dos sistemas interaccionen.

Existirán entonces propiedades de cada uno de los dos sistemas

componentes dotadas de una naturaleza especial. Si la función de on

da del sistema combinado se desarrolla en función de aquellos


estados puros de los sistemas individuales basados en estas propieda

des especiales, entonces los términos de interferencia de esa función

de onda desaparecerán. Por lo que se refiere a estas propiedades,

pues, la función de onda del sistema combinado será igual a la que

caracteriza una «mezcla». Las propiedades especiales vienen determi

nadas por la naturaleza de los sistemas componentes y por la natura

leza de su interacción. En muchos casos existirá solamente una tal fa

milia de propiedades especiales. Aunque la costumbre en la teoría

cuántica ha sido expresar la función de onda del sistema interactivo

en función solamente de los estados puros relevantes para el sistema

aislado y del aparato, la nueva expresión elige una «base» para repre

sentar el estado dependiente de la naturaleza de la interacción. (La

matemática aquí es reminiscente de la posibilidad en física clásica de

representar sistemas dinámicos acoplados en «coordenadas norma

les». Si dos péndulos están acoplados mediante un muelle débil, por

ejemplo, la energía va y viene de un péndulo al otro dando lugar a

estados variables en el tiempo para los sistemas individuales. Pero

existen nuevas coordenadas en las que el movimiento puede ser ex

presado. Éstas dependen de la interacción. El estado del sistema aco

plado entero es estacionario cuando se mira en esta nueva, más com

pleja, representación coordenada.)

La idea de esta nueva interpretación es que el sistema y el apara

to, cuando interaccionan, puede considerarse que tienen uno respec

to del otro uno de los valores definidos de las propiedades que for

man la base de esta forma especial de representar la función de onda.

Asi pues, puede decirse que una partícula con espín, interaccionando

con la maquina Stern-Gerlach de medición arriba-abajo, está defini

damente arriba o definidamente abajo en relación al aparato de me

dida con el que está interaccionando. De manera similar, puede de

cirse que la máquina está definidamente en un estado «señala arriba»

o definidamente en un estado «señala abajo» en relación a la partícu

la cuyo espín está midiendo. Es la dinámica de la interacción lo que

determina en cualquier interacción por medición cuáles característi

cas del sistema y del aparato puede afirmarse que son definidas.

Pero hasta esta definitud es solamente una definitud del sistema

relativa al aparato y del aparato relativa al sistema. La partícula está

definidamente arriba o abajo según el «testimonio» del aparato de

medida, y el aparato señala definidamente arriba o abajo según el tes

timonio del sistema medido. En esta nueva interpretación no hay un

La imagen cuántica de! mundo 279

«colapso del paquete de ondas» en el sentido estipulado por la inter

pretación bohriana o por la idealista. En este aspecto se parece a la

interpretación discutida anteriormente que recurre al tamaño y com

plejidad del aparato de medida. La mecánica cuántica tiene un alcan

ce universal, y los teoremas que nos dicen que la superposición nun

ca desaparece realmente en la interacción, siguen siendo válidos. Se

puede ver esto si se considera el estado del sistema medido y del

aparato de medida combinados en relación a todo el entorno exte

rior, esto es, en relación al universo entero salvo la partícula interacti

va y el aparato de medida bajo consideración. Según el testimonio

del mundo exterior, la partícula y el aparato combinados presentan

el estado cuántico total de un sistema interactivo con todas las carac

terísticas correlaciónales de interferencia que ello implica.

Kochen llama a la observancia del sistema-más-aparato combina

dos por el mundo exterior «observancia pasiva», ya que no hay nin

gún acoplamiento dinámico del sistema-más-aparato al mundo exte

rior. A la observancia del sistema por el aparato y del aparato por el

sistema las llama «observancia activa», ya que hay un acoplamiento

dinámico entre el sistema y el aparato. Puede ser cierto, pues, que

una partícula espín-izquierda, después de interaccionar con una má

quina de medición arriba-abajo, tenga un espín arriba definido en re

lación al aparato de medida o un espín abajo definido en relación a

dicho aparato. Y el aparato tendrá una lectura arriba o abajo defini

das en relación a la partícula. Sin embargo, la información según la

cual la partícula era originalmente espín izquierda se conserva y la in

terferencia de los estados básicos para el sistema combinado (arriba

para la partícula y señala arriba para la máquina, abajo para la partí

cula y señala abajo para la máquina), interferencia que contiene la in

formación de que la partícula era originalmente espín izquierda, se

conserva y puede, en principio, ser revelada por una observación lo

suficientemente sutil.

Esta interpretación, pues, intenta hacer justicia a nuestra intui

ción de que, tras la medición, la partícula y el aparato poseen estados

definidos. Los tienen si los estados son los apropiados a la dinámica

de la interacción y si se considera que la partícula y el aparato tienen

estos estados puros según el testimonio de cada uno por el otro. E

intenta hacer justicia, asimismo, a la vindicación mecánico-cuántica

de que la superposición nunca se destruye. Esto se debe a que la su

perposición sigue estando presente en el estado del sistema y del


aparato de medida combinados según el testimonio del mundo exte

rior. Por supuesto, queda aún mucho por decir en el sentido de in

tentar demostrar que esta interpretación hará justicia a todos los he

chos observacionales sin invocar la dicotomía radical entre medición

e interacción dinámica del punto de vista bohriano.

Algunas otras interpretaciones recientes proceden postulando un

reino de procesos físicos que discurren a un nivel inferior al del

estado cuántico. En este nivel más profundo se sugiere que tiene lu

gar un tipo de actividad aleatoria, o estocástica. Con una formulación

adecuadamente inteligente de dicha física adicional describiendo

nuevos procesos físicos, uno puede confiar en obtener una teoría en

la que, en ciertas circunstancias, el proceso físico subyacente de tipo

aleatorio pueda «conducir» un sistema originalmente en un estado

cuántico que es una superposición a un estado cuántico que es

«casi» un estado puro correspondiendo a un solo valor para la canti

dad medida. Naturalmente, estas circunstancias físicas se supone que

son las que corresponden a lo que tomamos por proceso de medida

en la versión ortodoxa. En todas estas teorías, sin embargo, el nuevo

estado no es en realidad el estado ondulatorio completamente colap-

sado que la mecánica cuántica predice después de que una medición

haya tenido lugar. Dicha teoría debe, pues, contener también elemen

tos que nos digan por qué es legítimo adoptar el Postulado de Pro

yección y suponer que el estado es un estado puro tras la medición,

cuando realmente no lo es. En este caso, los argumentos habituales

se construyen de manera tal que a todos los efectos prácticos las pre

dicciones realizadas utilizando el estado real y el estado puro aproxi

mado sean las mismas.

Las interpretaciones de «muchos mundos»Hay todavía otra interpretación, propuesta inicialmente por H.

Everett y J. Wheeler, que intenta hacer justicia a las desconcertan

tes características de la medición abogando por una nueva metafísi

ca del mundo. A diferencia del revisionismo metafísico radical de

Bohr, uno que niega en algún sentido una realidad objetiva al

mundo físico en su conjunto, conservando una realidad sólo en re

lación a la elección del aparato de medida, la nueva metafísica es

objetivista. Pero el mundo real que postula es tal que choca, de he

cho, con nuestras intuiciones.

La imagen cuántica del mundo 281En la explicación bohriana del proceso de medida se «desecha»

una parte de la función de onda siempre que se realiza una medi

ción. La partícula, con espín izquierda, entra en la máquina de medi

da arriba-abajo en una superposición de estados arriba y abajo. Pero

una vez que se ha realizado la medición, la partícula se encuentra de

finidamente arriba (y el aparato de medida señala definidamente arri

ba) o definidamente abajo (y el aparato de medida señala definida-

mente abajo). Pero de acuerdo con la dinámica cuántica, justo antes

del «colapso de la función de onda» el complejo partícula-y-aparato

estaba en una superposición de estados «arriba y señala arriba» y

«abajo y señala abajo» combinados. Supongamos que la medición da

el valor «arriba» para la partícula. ¿Qué pasó con la componente

«abajo y señala abajo» de la función de onda? Sencillamente desapa

reció del mundo. Y con ella desaparecieron también las posibilidades

generadas por interferencia latentes en su presencia conjunta con la

otra componente de la función de onda.

Pero Everett y Wheeler suponen que ambas componentes de la

función de onda continúan existiendo después de que la medición

haya tenido lugar. ¿Cómo puede ser éste el caso? Cuando una partí

cula se detecta a la salida de una máquina que mide el espín arriba-

abajo, ¿no está definidamente arriba o definidamente abajo? ¿Cómo

podría darse las dos cosas? La respuesta dada por esta interpretación

es que en cada medición el universo se desdobla en una multiplici

dad de mundos, uno por cada resultado posible del proceso de me

dida. Hay un mundo en el que la partícula sale de la máquina en el

estado espín-arriba. En ese mundo también se obtiene en la máquina

la lectura espín arriba, pues los estados de detección del aparato de

medida se supone, de nuevo, que están perfectamente correlaciona

dos con el valor de la cantidad medida en cuestión. Pero junto al

mundo que tiene una partícula espín-arriba y un aparato de medida

donde se lee arriba, hay también un mundo con una partícula espín-

abajo y una máquina que lee espín abajo. La función de onda de la

partícula con espín a la izquierda que entra en la máquina e interac-

ciona con ella podría escribirse como una superposición de estados

«espín arriba y señala arriba» y «espín abajo y señala abajo». En la in

terpretación «de los muchos mundos» que estamos considerando

ahora, cada componente de esta superposición representa lo que está

aconteciendo en alguno de los muchos mundos presentes que se «es

cinden» de un universo cada vez que se realiza una medición.


Naturalmente, la interpretación requiere una forma de tratar la

probabilidad de los resultados. También requiere varios resultados

de consistencia para intentar convencernos de que la imagen de la

medición que nos está ofreciendo dará resultados observacionales

consistentes con los conocidos resultados resumidos en el formalis

mo estándar de la mecánica cuántica. Naturalmente, tampoco esta in

terpretación está libre de críticas. En primer lugar, la imagen metafí

sica es considerada por muchos grotesca y extravagante, lo cual no

sorprende. Después de todo, nosotros experimentamos sólo uno de

los posibles estados resultantes como producto de una medición, no

una variedad de todos los productos posibles. Es por esto por lo que

hablábamos del «colapso del paquete de ondas» en primer lugar.

¿Qué razón, que no sea una predilección por la simetría frente a la

experiencia, tenemos realmente para suponer que todos los otros re

sultados también ocurrieron y permanecen ocultos para nosotros de

bido a que son experimentados por otras «derivaciones» nuestras

que existen en otras derivaciones del universo? La teoría también

presenta problemas internos en lo que se refiere a cuándo tiene lugar

la escisión. ¿Ocurre con cada interacción? ¿Sólo en las interacciones

por medición? En el caso de estas últimas, ¿qué las distingue de las

evoluciones dinámicas ordinarias en una forma que justifique la me

tafísica de la escisión del universo? Y ¿a lo largo de qué dimensiones

tiene lugar? Una función de onda puede ser descompuesta en com

ponentes diferentes. ¿Representan escisiones todas estas descomposi

ciones? ¿De qué manera? O, ¿hay una descomposición preferida que

rige la forma en que el universo se divide, pongamos, determinada en

la manera que la interpretación kocheniana de la interacción deter

mina la propiedad medida y la propiedad de medición especiales?

En los últimos años algunos han combinado la concepción «de

los muchos mundos» y la concepción idealista de la medición en una

interpretación de «muchas mentes» (D. Albert y B. Loewer). En ésta,

solamente hay un mundo físico descrito en todo momento por la

función de onda evolvente que sigue la evolución dictada por la

ecuación de Schródinger y que nunca colapsa. Pero cualquier mente

que registre el valor de una cantidad medida se disocia en una varie

dad de mentes, cada una de las cuales experimenta uno solo de los

resultados posibles del proceso de medida. De nuevo, se proponen

pruebas de consistencia para intentar convencernos de que en cues

tiones tales como la comunicación de los resultados de nuestras me


diciones a otros, o la recepción de comunicaciones de su parte (me

diadas por el mundo físico), o en la repetición de las mediciones, ob

tendremos los conocidos resultados probabilísticos predichos por la

teoría cuántica.

La lógica cuánticaHemos estado explorando enfoques diseñados para explicar las cu

riosas características del mundo implicado por la mecánica cuántica;

estos enfoques descansan en programas que explican los fenómenos

por referencia a características metafísicas del mundo. Ya sea que los

programas postulen una dualidad flexible entre sistema cuántico y

aparato de medida clásico, como hace la teoría de Bohr; un papel re

manente para los conceptos clásicos en el reino de la mente fuera de

la realidad física, como hacen los enfoques idealistas; una visión del

mundo como uno en el que la dinámica cuántica rige universalmen

te, como hacen los enfoques que se apoyan en el tamaño y la com

plejidad del aparato de medida o en la interpretación de la interac

ción por Kochen; o una ampliación radical de nuestra ontología para

explicar los fenómenos, como hacen los enfoques tipo muchos mun

dos; todos buscan la solución en alguna modificación de nuestras

concepciones tradicionales sobre la naturaleza de los sistemas físicos

del mundo.

Un enfoque algo diferente busca la resolución de los problemas

en una modificación de nuestras ideas tradicionales concernientes a

algunos de los modos más difundidos y generales que tenemos para

describir el mundo. Quizá sea necesaria una reinterpretación radical

de los esquemas más generales de que disponemos para asimilar los

fenómenos del mundo, se arguye, si se quiere comprender el sentido

de las misteriosas propiedades cuánticas que hemos indicado.

Uno de dichos enfoques recalca el importante papel que la pro

babilidad juega en la teoría. Algunas de las desconcertantes propieda

des cuánticas pueden ser resumidas haciendo notar cuán radicalmen

te difieren en su forma de operar las probabilidades cuánticas de las

probabilidades más familiares de la física clásica. Tomemos, por

ejemplo, el experimento de la doble rendija. Nos figuramos que la

luz está compuesta de fotones localizables porque los detectores co

locados en las rendijas indican que toda la energía luminosa pasa por

2H4 Filosofía de la física

una de las rendijas o por la otra, fotón por fotón, y nunca por ambas

al mismo tiempo. ¿No deberíamos, entonces, concebir la probabili

dad de que un fotón alcance la pantalla como el resultado de dos

procesos «independientes», el fotón llegando a x después de pasar

por la rendija uno y el fotón llegando a x después de pasar por la

rendija dos? Pero, entonces, las reglas clásicas de la probabilidad nos

llevan a esperar que la probabilidad de que un fotón llegue a x pa

sando, bien por la rendija uno, bien por la rendija dos, será la suma

de las dos probabilidades separadas. Por supuesto, esto no es así,

pues tenemos los ya familiares efectos de interferencia. Quizá, pues,

deberíamos rechazar nuestras conocidas reglas para combinar proba

bilidades condicionadas por causas independientes.

Otra característica anómala de la probabilidad en la teoría cuán

tica puede verse cuando consideramos las denominadas distribucio

nes compuestas. Supongamos que tenemos una población de seres

humanos cuyos pesos se distribuyen de acuerdo con alguna distribu

ción de probabilidades de pesos. Y supongamos también que hay

una distribución del color de los ojos, caracterizable de nuevo por

una distribución de probabilidades. Entonces tiene sentido preguntar

por la distribución compuesta del peso y del color de ojos a la vez. Si

hay una cierta probabilidad de que una persona mida por encima de

un metro ochenta centímetros, y una cierta probabilidad de que una

persona tenga ojos azules, hay entonces una probabilidad compuesta

de que tenga ojos azules y una altura superior a un metro ochenta

centímetros.

Pero, como sabemos, dichas distribuciones de probabilidad com

puesta no siempre son posibles en mecánica cuántica. Puede que ha

ya una probabilidad dé encontrar a una partícula en una región par

ticular del espacio y también una distribución de probabilidades que

determine cuándo el momento de la partícula se encuentra dentro

de una horquilla determinada de valores del momento. Pero no ha

brá una probabilidad compuesta de encontrar a la partícula a la vez

en un intervalo espacial definido y en un intervalo de momentos de

finido. Bohr trata esto haciendo notar la imposibilidad física de reali

zar mediciones simultáneas de la posición y el momento. Posición y

momento son, en sus términos, complementarios entre sí. Y para los

observables complementarios uno no puede esperar de la mecánica

cuántica funciones distribución de probabilidad compuesta bien defi

nidas. Una de las sugerencias actuales es que quizá esta ausencia de


funciones de probabilidad compuesta pueda ser fundamentada en al

guna nueva teoría, no estándar, de la probabilidad.

Un diagnóstico todavía más profundo de los problemas concep

tuales de la mecánica cuántica busca la raíz de los problemas en

cuestiones sobre la naturaleza misma de la lógica propiamente dicha.

La lógica dicta las reglas básicas que rigen las relaciones vinculantes

que presentan entre sí nuestras proposiciones sobre el mundo. La ló

gica clásica nos dice, por ejemplo, que una proposición y su negación

no pueden ser las dos verdaderas, que una o la otra debe ser verda

dera; que si dos proposiciones son verdaderas, su unión también es

verdadera; etcétera. ¿Podría una revisión de la lógica clásica ayudar

nos a comprender el sentido de los fenómenos cuánticos? Nosotros

hemos considerado a la lógica como si de algo inmutable e indepen

diente de nuestro conocimiento experimental del mundo se tratase.

Pero, después de todo, también pensábamos lo mismo de la geome

tría hasta hace dos siglos. Quizá la lógica sea una cuestión empírica

en la misma medida que ahora consideramos que la química y la geo

metría lo son.

Una sugerencia en esta dirección fue realizada por H. Reichen-

bach, quien pensó que dando cabida a proposiciones que no fueran

ni ciertas ni falsas, algunas de las características de los sistemas cuán

ticos podrían representarse adecuadamente. Una afirmación sobre la

posición de una partícula era verdadera o falsa después de que se

hubiese realizado una medición de la posición. Pero para una partí

cula en un estado cuántico entre mediciones, en el que la posición

tuviera un valor definido con probabilidad uno, ¿no podríamos decir

que las afirmaciones sobre la posición tenían un valor de verdad «in

determinado», no siendo ni verdaderas ni falsas?

Una sugerencia mucho más fructífera de una revisión lógica para

ayudarnos con la mecánica cuántica tiene sus orígenes en el trabajo

de G. Birkhoff y J. von Neumann. Este trabajo presenta a la vez un

aspecto polémico y otro no polémico. El no polémico procede del

proyecto general de intentar discernir en la teoría cuántica las carac

terísticas más básicas que condujeron a los desconcertantes fenóme

nos cuánticos. Ya hemos observado que la teoría fue desarrollada ini

cialmente en dos formalismos que al principio parecieron tener muy

poco que ver uno con otro, la mecánica matricial de Heisenberg y la

mecánica ondulatoria de Schródinger. Schródinger mostró la equiva

lencia formal de las dos teorías, y Dirac y von Neumann pasaron a

286 Filosofía de la tísica

exponer la teoría en un modo más abstracto, que tomó de los dos en

foques su núcleo común.

Pero incluso estas formulaciones estándar de la teoría cuántica

podrían contener, a la par que elementos esenciales, elementos que

son inesenciales, artificios meramente de un modo particular de ex

poner la teoría. ¿Podríamos hallar una forma de encontrar los ele

mentos más esenciales de la teoría, aquellos que tendrían que apare

cer en cualquier «representación» de los hechos físicos?

Birkhoff y von Neumann señalaron que una forma de hacer esto

es centrándonos en las relaciones entre estados de sistemas, relacio

nes que podrían ser consideradas como un tipo de «lógica» de pro

posiciones sobre el sistema. Supongamos que una partícula pasa efec

tivamente, es decir, con probabilidad igual a uno, a través de un

filtro que sólo permite el paso de partículas espín-arriba. Entonces

podemos decir que «espín arriba» es verdadero para la partícula. Si

la partícula pasa definidamente a través de un filtro que deja pasar

tanto partículas espín-arriba como partículas espín-abajo, diremos

que en este caso «espín arriba qo espín abajo» es verdadero. Si una

partícula pasa efectivamente a través del filtro p y a través del filtro j

diremos que en este caso «p qy s» es verdadero.

Consideremos ahora la «ley distributiva» de la lógica tradicional,

la ley que dice que sí p es verdadero para algo y r o s es verdadero

para algo, entonces, bien p y r son verdaderos para el sistema, o bien

p y s son verdaderos para el mismo. Si un hombre es alto y tiene los

ojos azules o bien marrones, entonces el hombre es alto con ojos azu

les, o bien alto con ojos marrones. ¿Es «qy» distributiva sobre «qo»

de la misma forma que «y» es distributiva sobre «o»? No lo es. Con

sideremos una partícula que es «espín izquierda qy (espín arriba qo

espín abajo)». Cuando todas las partículas relevantes hayan pasado a

través de la máquina (arriba qo abajo), «arriba qo abajo» será verda

dero para cada partícula. Las partículas que son «espín izquierda qy

(espín arriba qo espín abajo)» son. pues, sólo las partículas definida-

mente espín-izquierda. Pero ninguna partícula tendrá probabilidad

uno de pasar a través de una máquina espín-izquierda y probabilidad

uno de pasar a través de una máquina espín arriba. Pues, espín iz

quierda y espín arriba son propiedades complementarias, y ningún

sistema puede definidamente tener estas dos propiedades al mismo

tiempo. Lo mismo es cierto para el espín izquierda y para el espín

abajo. No hay, pues, nada que sea «espín izquierda qy espín arriba» y


nada que sea «espín izquierda qv espín abajo», y, en consecuencia,

nada que sea «(espín izquierda qy espín arriba) qo (espín izquierda

qy espín abajo)». Aunque muchas partículas son «espín izquierda qy

(espín arriba qo espín abajo)», es decir, todas las que son espín iz

quierda, ninguna partícula es «(espín izquierda qy espín arriba) qo

(espín izquierda qy espín abajo)». Por consiguiente, «qy» no es distri

butiva sobre «qo» en la forma que «y» es distributiva sobre «o».

Uno puede formular una lógica de proposiciones del tipo ordina

rio utilizando el «no» ordinario, el «y» ordinario y el «o» ordinario.

Dicha lógica tiene la propiedad distributiva indicada más arriba y se

denomina una álgebra booleana. Uno puede formular una estructura

formal del tipo apropiado a «qy» y «qo» (junto con una negación

cuántica apropiada). Se denomina una red modular ortocomplemen-

tada. (En realidad, la estructura requerida por la mecánica cuántica

es, por razones que no vienen al caso, un poco más débil, una red

modular «débil»). El uso no polémico de dicha nueva «lógica» es el

siguiente: Uno puede captar los elementos esenciales de la estructura

de superposición, tan característica de los sistemas cuánticos, repre

sentando la estructura de las proposiciones acerca de los sistemas

cuánticos como una red modular. Entonces uno puede explicar por

qué la formulación estándar de la mecánica cuántica funciona tan

bien como lo hace demostrando que «representa» la red de proposi

ciones. (De un modo similar, uno puede justificar la introducción de

un espacio de fases clásico en la mecánica clásica como una repre

sentación del álgebra booleana de proposiciones sobre los sistemas

clásicos).

El asunto se torna más controvertido, de hecho, muy controverti

do, cuando se hace la propuesta (en su día por H. Putnam, por ejem

plo) de que la «lógica» cuántica debería ser interpretada como lógica

en el pleno sentido del término. La idea ahora es que, así como la re

latividad nos mostró que la geometría euclídea, en su día considera

da como válida para el mundo, era en realidad falsa y debía ser reem

plazada por razones empíricas por la geometría no-euclídea del

espacio-tiempo, así la mecánica cuántica nos dice que la lógica boo

leana estándar a la que estábamos acostumbrados es incorrecta como

lógica del mundo. Los hechos empíricos nos llevan a ver que la ver

dadera lógica del mundo es una caracterizada por la lógica no distri

butiva de la mecánica cuántica y no por la lógica distributiva que,

creíamos, describía correctamente las relaciones entre proposiciones


sobre el mundo. Desde este punto de vista, «qy» es en realidad «y» y

«qo» es «o». Sucede únicamente que algunas cosas que considerába

mos verdaderas sobre «y» y «o» son falsas, ocupando otras verdades

su lugar.

Es fácil ver por qué una concepción de esta índole resultaría

atractiva. Consideremos un haz de partículas, todas las cuales fueron

preparadas en el estado de espín-izquierda. El haz se envió entonces

a través de una máquina de medida de espín arriba-abajo con ambos

canales arriba y abajo abiertos. Los rayos emergentes se recombina-

ron a continuación. Nos gustaría decir de este haz que es un haz es

pín-izquierda definido. También nos gustaría decir de sus partículas

constituyentes que son, bien espín arriba, bien espín abajo. Pero no

queremos decir de ninguna de las partículas en el haz que está en un

estado «espín izquierda y espín arriba» o «espín izquierda y espín

abajo», pues espín izquierda y espín arriba son propiedades comple

mentarias, como lo son espín izquierda y espín abajo. Ninguna partí

cula, pues, puede ser definidamente espín izquierda y definidamente

espín arriba, y ninguna partícula puede ser definidamente espín iz

quierda y definidamente espín abajo.

Pero en la lógica cuántica podemos afirmar que las partículas en

el haz son todas espín izquierda, y que cada partícula en el haz es

«espín arriba o espín abajo», siempre que leamos el «y» como «qy» y

el «o» como «qo». La paradoja se evita porque, dada la no distributi-

vidad de «qy» sobre «qo», el decir que cada partícula es «espín iz

quierda y (espín arriba o espín abajo)» con estas nuevas lecturas para

la conectivas, no implica que sea forzosamente verdad que cualquier

partícula en el haz haya de ser «espín izquierda y espín arriba» o «es

pín izquierda y espín abajo».

Pero ¿nos muestra realmente la mecánica cuántica que debería

mos sustituir nuestra lógica clásica por una nueva lógica? Y ¿elimina

mos con ello realmente los aspectos paradójicos del mundo cuánti

co? Una objeción es que aunque «qy» y «qo» jueguen un papel útil,

sería totalmente erróneo pensar en ellos como sustitutos de «y» y

«o». Un problema es que «y» y «o» todavía juegan, en su significado

tradicional, un papel en la descripción cuántica del mundo. Un haz

mixto de partículas procedente de una máquina arriba-abajo, partícu

las que han sido detectadas a la salida de los canales correspondien

tes de la máquina arriba-abajo, antes de haber sido recombinadas, es

uno en el que las partículas están correctamente descritas por «espín


arriba o espín abajo», dando a «o» su significado clásico. Solamente

el haz superposición de esas partículas que pasaron por los canales

sin ser detectadas y luego fueron reunidas en el haz recombinado, es

tá correctamente descrito por «espín arriba qo espín abajo». Es, pues,

erróneo pensar que en la imagen cuántica del mundo «qy» y «qo» reemplazan, antes que complementan, a «y» y «o». Otra objeción co

rriente a la tesis de la sustitución es que la argumentación utilizada

en la propia discusión supone las reglas de la lógica estándar.

También internamente, en su tentativa de reconstruir la descrip

ción cuántica del mundo, el enfoque revisionista lógico encuentra di

ficultades. Es cierto que en la lógica cuántica «p qy (r qo s)» no es

equivalente a «(p qy r) qo (p qy s)». Pero incluso en la lógica cuántica

el segundo contiene al primero, esto es, si el segundo es verdadero, el

primero debe ser también verdadero. Es sólo en la dirección del pri

mero al segundo en la que no se da la inclusión. Supongamos ahora

que aplicamos la teoría estándar de la probabilidad a nuestra nueva

lógica. Un resultado básico de la teoría de la probabilidad es que si t contiene a w, entonces la probabilidad de w es como mínimo tan

grande como la de t. Después de todo, si el ser t verdadero garantiza

que w sea verdadero, sin duda es al menos tan probable que w sea el

caso como que lo sea t.En el caso de las dos rendijas en la teoría cuántica, esta conexión

entre inclusión y probabilidad parece sugerir que, dadas la lógica

cuántica y la teoría estándar de la probabilidad, la probabilidad de

que una partícula aterrice en un punto x sobre la pantalla, suponien

do que las dos rendijas estuvieran abiertas, debería ser al menos tan

grande como la probabilidad de que aterrice en x, suponiendo que

una de las dos rendijas está abierta, pero no las dos. La primera pro

babilidad es la probabilidad asignada a la aserción «aterriza en x y pa

só por la rendija uno o pasó por la rendija dos». La segunda probabi

lidad es la de «aterriza en x y pasó por la rendija uno o aterriza en x y

pasó por la rendija dos». Y, una vez más, este segundo fenómeno con

tiene al primero. Pero el fenómeno de interferencia permite que la

probabilidad de aterrizar en x cuando las dos rendijas están abiertas

sea menor que la probabilidad de aterrizar en x suponiendo que una

de las rendijas está abierta, y mucho menor que la suma de las proba

bilidades derivadas de estar las dos rendijas abiertas individualmente.

Esto al menos parece indicar que la lógica cuántica, por sí sola, no re

solverá todos nuestros dilemas sobre las paradojas cuánticas.

Filosofía de la tísica

ResumenAcabamos de examinar, de una forma muy rápida y superficial, varias

de las tentativas de «dar sentido» a la peculiar naturaleza del mundo

revelada por la teoría cuántica. El lector debería percatarse de que

cada una de las interpretaciones aquí mencionadas es una sutil, y al

gunas veces muy compleja, tentativa de hacer justicia a la plétora de

hechos que la teoría cuántica pone de manifiesto. Cada interpreta

ción precisa de un examen detenido de sus virtudes y de sus debili

dades críticas antes de que pueda juzgársela adecuada o inadecuada

para la tarea asumida.

El mismo alcance de las cuestiones que permanecen sin respues

ta definitiva es intimidador. ¿Cuál exactamente es el papel de los

conceptos clásicos en la descripción cuántica del mundo? ¿Son ellos

los conceptos primitivos e ineliminables del mundo necesarios para

describir la parte del mundo en el lado de la medición de un «corte»

flexible entre el sistema cuántico y el aparato de medida clásico?

¿Son ellos los términos ineliminables mediante los que ha de descri

birse la experiencia de mentes fuera del reino físico? ¿O son esos

conceptos clásicos sólo las maneras falsas, pero provechosamente fic

ticias, que son legítimamente aplicadas para describir estados verda

deramente cuánticos en circunstancias especiales, donde los concep

tos sirven para caracterizar «aproximadamente» los estados de los

sistemas? Más aún, ¿en qué medida pueden ser aplicados a los siste

mas entre mediciones? ¿Son totalmente inaplicables a estos sistemas,

o hay alguna forma en la que podamos legítimamente considerar a

los sistemas evolventes como caracterizados por valores clásicos, aun

cuando éstos nos sean desconocidos?

Y ¿cuál es la naturaleza del estado cuántico representado por la

función de onda? ¿Es una caracterización de los sistemas individua

les o sólo de una colección de sistemas? ¿Es la caracterización de un

aspecto físico real del mundo, o deberíamos de considerarla, por el

contrarío, como un tipo de mecanismo de cálculo intermedio que no

representa ninguna realidad física? Dado el papel de esa función de

onda en el cálculo de probabilidades de los resultados de una medi

ción, ¿puede considerarse que es algo muy parecido a una probabili

dad precuántica, pongamos, una medida de proporción en una colec

ción o un grado de creencia racional? O ¿dejan claro los fenómenos

de interferencia, más bien, que se trata de algo más parecido a una


función de onda física? Más aún, ¿es el estado cuántico de un siste

ma relativo a un proceso de medida particular, como insiste Bohr?

¿Qué podemos decir del peculiar proceso de medida? ¿Debe ser

considerado como una componente ineliminable de la teoría, de nin

gún modo asemejable a las evoluciones dinámicas o interacciones de

los sistemas ordinarias? ¿Es el «colapso del paquete de ondas» una

descripción de un fenómeno físico real o algo similar al cambio sufri

do por una distribución de probabilidades clásica cuando cambia la

base de conocimiento del agente? ¿Qué es lo que caracteriza exacta

mente las situaciones que son mediciones frente a las que son inte

racciones físicas ordinarias? ¿Nos da una distinción bohriana entre el

sistema y el aparato de medida clásico la clave? ¿Es esencial la pre

sencia de una «mente» que actúe sobre el mundo? ¿O es el proceso

de medida sólo un caso especial de una interacción cuántica ordina

ria caracterizada, ya sea por el tamaño y la complejidad de uno de los

sistemas interactivos, o por la naturaleza especial de la interacción en

relación a alguna propiedad preferida del sistema y el aparato?

¿Debemos postular una ontología radicalmente nueva de universos

desdoblados para hacer justicia a los hechos sobre la medición?

Claramente, aquí hay un conjunto complejo de cuestiones inter-

conectadas. El desarrollo pormenorizado de las cuestiones ha arroja

do mucha luz sobre lo peculiar justamente que es en realidad la ima

gen cuántica del mundo. La comprensión de algunas de las

interpretaciones de la medición requiere ahondar profundamente,

tanto en los hechos observacionales del mundo cuántico, como en el

formalismo de la teoría que intenta hacer justicia a estos hechos. El

lector que vaya a explorar la literatura más detallada, y algunas veces

bastante sofisticada en su aspecto formal, sobre estos temas, debería

sin embargo tener presente ciertos hechos básicos. Siempre es bue

no repasar con asiduidad las peculiaridades fundamentales de los

experimentos básicos. La luz que pasa por una pantalla con dos

rendijas muestra una figura de interferencia fácilmente explicable si

la luz es una onda dispersa cuya energía pasa por las dos rendijas al

mismo tiempo. Las partes individuales de las ondas se recombinan

después en el lado opuesto de la pantalla que contiene las rendijas.

Pero todo experimento diseñado a fin de detectar la energía de la

luz, encuentra a esa energía en una forma localizada. Los detectores

colocados en las rendijas muestran que los fotones pasan por una

rendija o por la otra, nunca por las dos simultáneamente. La luz ab

29 2 Filosofía de la física

sorbida por la película fotográfica siempre se pone de manifiesto por

la interacción de un fotón con una molécula iónica de plata, nunca

tomo una onda dispersa de energía. Los electrones, al ser detectados,

se manifiestan asimismo como partículas localizadas. Pero cuando los

electrones son difractados por una red cristalina, aun cuando sean di

fractados uno a uno, el haz difractado recibido en los detectores

muestra la típica figura de interferencia de una onda interaccionando

con una red difractora. ¿Cómo puede cada electrón individual, si es

que es sólo una partícula «puntual», «saber», al encontrarse con el

cristal, que está interaccionando con un ordenamiento regular distri

buido espacialmente de átomos difractores en la red del cristal?

Hechos como éstos y sus análogos para otras características,

como los efectos de interferencia observados en los experimentos de

medición del espín, son los que demandan la revisión radical de

nuestro formalismo físico, desde el de la física clásica al de la mecáni

ca cuántica. No es de extrañar que dichos hechos peculiares requie

ran, no ya una revisión de detalle, pongamos, modificando algunas de

las leyes de fuerzas que gobiernan los sistemas, sino un replantea

miento radical de lo que significa ser un sistema en el mundo, de lo

que significa para semejante sistema tomar un valor, y de lo que sig

nifica que dicho valor sea revelado en un proceso de medida. Como

veremos en el resto del capítulo, éste no es el último de los enigmas

con los que nos confronta la teoría cuántica.

El problema de las variables ocultas y el determinismo

Deterninismo e indeterminismoEl influjo de la imagen dinámica mecanicista newtoniana del mundo

condujo a un nuevo énfasis en una vieja doctrina, el determinismo.

La idea del determinismo — que a partir del estado del mundo en un

momento dado, las leyes de la naturaleza fijan completamente el

estado del mundo en momentos posteriores— apenas es nueva. Ideas

de la misma índole habían formado parte de la especulación en la

Grecia antigua. Pero el modelo de un sistema de partículas interac

cionando unas con otras mediante fuerzas, de forma tal que una con

dición inicial dada del sistema genere su condición posterior en todo

momento del futuro siguiendo las famosas leyes del movimiento de

Newton, proporcionó un ímpetu renovador a esta visión determinis


ta del mundo. La famosa afirmación del físico Laplace en el sentido

de que si conociera el estado del mundo en un momento dado, po

dría inferir su estado en todos los instantes futuros, caracteriza esta

nueva concepción.

Naturalmente, dicha doctrina tiene también sus consecuencias

preocupantes. Si, como T. S. Eliot lo expresa, «el tiempo pasado y el

tiempo futuro están en el tiempo presente, y el tiempo presente en el

tiempo pasado», si todo lo que ha de ser, está ya determinado por lo

que ha sido, ¿dónde hay lugar en el universo para la «libre elección»?

¿Cómo puede nuestra capacidad de decisión, determinando como

hace — al menos a un cierto grado— lo que será nuestra vida futura,

ser considerada de suyo nada menos que el resultado del estado del

mundo anterior incluso a nuestro nacimiento, algo obviamente fuera

de nuestro control? No tendré más que decir sobre tales cuestiones

filosóficas ampliamente debatidas.

Examinemos más detenidamente el determinismo. Ni siquiera en

la física clásica está claro que pueda decirse con seguridad que en el

mundo impera un determinismo ingenuo. En el caso de la mecánica

corpuscular newtoniana, existe la posibilidad de colisiones multicor-

pusculares. Si las partículas se conciben como partículas puntuales

para las que son válidas las leyes de fuerza usuales, no podemos, en

general, derivar el estado del mundo posterior a la colisión a partir

del estado anterior a la colisión. También existe la posibilidad, en

cualquier momento, de partículas «procedentes del infinito» de for

ma tal que resulte imposible determinar el estado en un tiempo pos

terior a partir de un estado suficientemente anterior. En contextos

relativistas generales, cuestiones acerca de la complejidad de la topo

logía del espacio-tiempo pueden incluso poner en tela de juicio la

noción de «el estado del mundo entero» en un instante dado. El es

tudio de la posibilidad de «superficies de Cauchy», es decir, de

estados del mundo «en un instante» suficientes para determinar los

estados del mundo en todos los tiempos posteriores, es una cuestión

teórica intrincada. De nuevo, como vimos en el capítulo 3, está la

cuestión de la inestabilidad radical del movimiento, incluso en la

descripción newtoniana. Un sistema puede estar constituido de tal

forma que haya estados tan próximos como uno quiera a cualquiera

de sus condiciones iniciales; pero estos estados pueden conducir a

estados futuros del sistema que diverjan radicalmente de aquellos a

los que conduce la condición inicial dada. No importa cuán precisos


puedan ser nuestros aparatos de medida, puede que seamos incapa

ces de determinar el estado inicial de un sistema a un grado de preci

sión que nos permita en alguna forma predecir su estado futuro tras

un intervalo de tiempo siquiera mínimo. De hecho, hay quienes argu

yen que, ante dicha inestabilidad radical, es irrazonable pensar que el

sistema tiene alguna condición inicial exacta que determine comple

tamente su evolución futura, aunque esta concepción es, evidente

mente. minoritaria.

Pese a estas incertidumbres, hay claramente aspectos de la mecá

nica newtoniana, y de otras teorías físicas clásicas como la teoría del

electromagnetismo, que nos llevan a considerar el mundo descrito

por ellas como genuinamente determinista. Y estos resultados de la

física tienen un impacto en las concepciones filosóficas que intentan

describir el mundo como uno en el que todo lo que sucede está de

terminado a suceder por algún acontecimiento pasado y por las cone

xiones legales entre los estados del mundo en un instante y sus

estados en algún otro instante.

La idea de que todo suceso tiene su causa, de que para cada ocu

rrencia en el mundo puede encontrarse una «razón suficiente» para

dicha ocurrencia en los sucesos pasados, fue considerada como un

postulado metafísico fundamental por Leibniz. Kant argüyó que el

principio de «causalidad universal» era una regla del funcionamiento

del entendimiento humano. Con ello estaba respondiendo en parte al

escepticismo de Hume, según el cual no podía encontrarse en el

mundo nada que correspondiese a la noción del metafísico de la «co

nexión necesaria» de unos sucesos con otros (nada, esto es, aparte de

las actuales regularidades «de hecho» del acontecer y de las expecta

tivas psicológicas generadas por ellas). De acuerdo con Kant, podía

mos saber a priori que el mundo de nuestra experiencia estaba sujeto

a los principios de causa y efecto. (De hecho, no está nada claro que

las dudas sobre el determinismo generadas por la teoría cuántica que

vamos a explorar seguidamente hubieran desalentado realmente a

Kant. habida cuenta del papel que éste reserva al principio de «todo

suceso tiene una causa».)

Un grupo de filósofos hallaron el principio de que todo suceso

tiene una causa universalmente verdadera, pero no como una verdad

metafísica a la manera de Leibniz o como una verdad «trascenden

tal» a la manera de Kant. Para ellos, el principio de que cada suceso

era tal que podía hallarse un suceso pasado suficiente para garantizar


la ocurrencia del suceso dado era un «dictado metodológico». Era

una decisión nuestra el no abandonar la búsqueda de un suceso an

terior explicativo. Si se daba un suceso para el que no pudiésemos

encontrar un suceso anterior que lo explicase causalmente, ¿no po

dríamos entonces mantener que simplemente no habíamos mirado

bien o el tiempo suficiente? Después de todo, ¿cómo podíamos estar

seguros de que no existiese semejante suceso explicativo? Nuestra

mera incapacidad para haber encontrado ya uno podía siempre ser

tomada, alegaban estos filósofos, como una señal, no de la inexisten

cia de un suceso que aportase una explicación causalmente adecua

da, sino simplemente de nuestra incapacidad de determinarlo.

Quizá el impacto más înteresante de la teoría cuántica sobre

estas cuestiones sea la afirmación por muchos de que por primera

vez contamos con una teoría del mundo que nos permite negar, para

un suceso dado, que pueda siempre hallarse cualquier suceso pasado

que sea adecuado causalmente para explicar porqué el suceso dado,

en lugar de algunas alternativas especificables del mismo, ocurrió.

Aquí, se afirma, existen razones para negar la existencia de la causa

necesaria, no sólo razones para pensar que dicha causa ha escapado

simplemente a nuestra percepción. Pasaremos a explorar los tipos de

argumentos propuestos para rebatir dicho argumento. El lector

debería notar, sin embargo, que ocultas en el fondo se encuentran

toda suerte de desconcertantes cuestiones filosóficas que nosotros no

vamos a explorar. Por ejemplo, la misma noción de determinismo

presupone la noción de una ley científica, una generalización que co

necte sucesos en un instante a sucesos en algún otro instante. Pero

como B. Russell señaló, si admitimos cualquier tipo de descripción de

los sucesos como legítima y cualquier generalización que haga uso de

dichas descripciones, resulta una cuestión trivial que cada suceso

pueda ser conectado «legalmente» a algún suceso anterior. Así pues,

quedan por resolver muchas cuestiones importantes, puramente filo

sóficas, si queremos saber con certeza qué significa verdaderamente

la afirmación de que el mundo es determinista.

Argumentos contra las variables ocultasPero regresemos a nuestra preocupación central. ¿Qué nos movería a

decir que la mecánica cuántica muestra que el mundo es indetermi-


nisia.’J Supongamos que un sistema está preparado en un estado

cuántico dado en un momento determinado. Supongamos ahora que

durante un intervalo de tiempo ese sistema permanece aislado de

cualquier interacción con el mundo exterior a él. ¿Está el estado

cuántico de ese sistema al final de dicho intervalo de tiempo comple

tamente «determinado» por su estado cuántico al inicio del interva

lo? La respuesta es que lo está. La evolución dinámica del estado

cuántico está regida por la ecuación de Schródinger. Y esta ecuación

determina completamente el estado cuántico en el instante posterior

a partir de su forma al inicio del intervalo de tiempo. Nada, pues, en

la evolución de los propios estados cuánticos sugiere un nuevo inde

terminismo debido a la teoría cuántica.

Es, antes bien, en la determinación de los valores de los resulta

dos de una medición donde podría surgir el indeterminismo. Dada la

cantidad observable que queremos determinar mediante una medi

ción, queda fijada una clase de resultados posibles para ese proceso

de medida. Pero el estado cuántico atribuido al sistema sólo permite

inferir que se obtendrá uno en particular de dichos resultados con

una cierta probabilidad. Solamente en casos muy excepcionales, el

estado cuántico asignará una probabilidad de uno a un resultado po

sible y una probabilidad de cero a cada uno de los restantes resulta

dos posibles. Así pues, el saber que un sistema ha sido preparado de

una manera determinada en un instante dado, e incluso el saber que

el sistema no ha sufrido interferencias en un intervalo de tiempo da

do, no nos permitirá por lo general predecir que se obtendrá un, y

solo un, valor de un observable, si ese observable es medido al final

del intervalo de tiempo.

Pero, por supuesto, eso todavía es compatible con el determinis

mo que se da en el mundo. Pues aunque el estado cuántico no de

termina completamente cuál de los resultados se obtendrá, eso po

dría todavía quedar determinado en cualquier caso por algún factor

no tomado en cuenta en el estado cuántico. Hay argumentos diseña

dos para convencernos de que la cantidad obtenida en una medición

no debe ser considerada, en general, como una cantidad poseída por

el sistema antes de la medición. Consideremos una partícula de la

que se sabe que está en un estado espín izquierda, por ejemplo. Si se

realiza una medición izquierda-derecha sobre esa partícula, sabemos

que la partícula resultará ser definidamente espín izquierda. Si se re

aliza una medición arriba-abajo sobre la partícula, se tendrá que la


mitad de las partículas son espín arriba y la otra mitad espín abajo.

Pero ninguna partícula es «definidamente izquierda y definidamente

arriba» y ninguna es «definidamente izquierda y definidamente aba

jo». Sería erróneo, pues, considerar a la colección de partículas antes

de la medición como una colección en la que el cien por cien son es

pín izquierda, el cincuenta por cien espín arriba y el cincuenta por

cien espín abajo. Consideraciones de esta índole llevaron a muchos a

sugerir que el proceso de medida no «determina un valor preexisten

te para una cantidad» sino, antes bien, «crea la cantidad». Como ve

remos, incluso el considerar la medición de esta forma, al menos el

considerarla como un tipo de proceso causal que cuando actúa sobre

el sistema produce el estado medido del mismo, tiene sus propias di

ficultades.

Sin embargo, ¿no podríamos pensar que la partícula antes de ser

medida tiene alguna cantidad «variable oculta» que determina com

pletamente el valor obtenido como resultado de la medición? Pensad

en la partícula que es definidamente espín izquierda. ¿No podría ha

ber algún otro factor propio de la partícula que determine su natura

leza, bien de forma tal que en una medición arriba-abajo se encuen

tre que está en el estado arriba, o bien de forma tal que en una

medición arriba-abajo se encuentre que está en el estado abajo? Este

factor no es tenido en cuenta en el estado cuántico del sistema, en el

hecho de que el sistema es definidamente espín izquierda. El estado

cuántico de espín-izquierda genera las probabilidades correspondien

tes a ser espín arriba o espín abajo si se realiza una medición arriba-

abajo. Pero eso no significa de por sí que no exista un factor oculto,

uno ignorado por el formalismo cuántico. Bohr negó explícitamente

que dicho factor pudiera existir, insistiendo en que el estado cuánti

co era una descripción completa del sistema cuántico. Pero la mera

insistencia dogmática, aun cuando provenga de alguien tan versado

como Bohr, no es un argumento. Einstein, como es sabido, fue impla

cable a la hora de insistir en que el indeterminismo del formalismo

cuántico indicaba que la teoría era incompleta. No podía creer, ase

guraba, que Dios «jugase a los dados» con el universo. ¿Podrían los

estados cuánticos, al igual que los estados estadísticos clásicos, po

seer por debajo una descripción más detallada de los sistemas que

reintrodujese un determinismo total en la descripción del mundo?

Para entender porqué muchos han negado la posibilidad misma

de variables ocultas que reintroduzcan el determinismo, necesitamos


seguir hasta el final un largo argumento que ha sido desarrollado a lo

largo de muchos años. Primero necesitamos la noción del valor espe

rado de una cantidad en un estado cuántico dado. En un estado

cuántico determinado, un observable dado podría tener muchos va

lores posibles en la medición. Cada valor posible tendrá su probabili

dad de ocurrencia. Multipliquemos cada valor por su probabilidad y

sumemos los productos de cada uno de los posibles valores. El resul

tado es el promedio o valor medio de la cantidad medida para un

sistema en un estado cuántico dado. Se le denomina el valor espera

do de esa cantidad en ese estado cuántico.

Ahora bien, algunas cantidades pueden ser escritas como funcio

nes de otras cantidades. Un caso muy simple, por ejemplo, es el cua

drado del momento de una partícula, el cual es una sencilla función

de su momento. Algunas cantidades son funciones de un número da

do de cantidades diferentes. Por ejemplo, la energía total de una par

tícula es la suma de su energía potencial y de su energía cinética.

Ahora bien, si el observable C es, por ejemplo, una función de los

observables A y B ¿cómo se relacionará el valor esperado de C con

los valores esperados de A y B en un estado dado? Si A, B y C son

cantidades simultáneamente mensurables, sin duda el valor esperado

de C será la misma función de los valores esperados de A y B que el

observable C lo es de los observables A y B. Pues podríamos medir

simultáneamente los valores de A, B y C para un sistema y obtener el

valor de C de dos formas diferentes, una directamente y otra calcu

lándolo a partir de los valores obtenidos para A y B. Los resultados

deben ser consistentes para cantidades simultáneamente mensu

rables.

Pero supongamos ahora que A, B y C no son cantidades simultá

neamente mensurables. En el ejemplo dado anteriormente, por ejem

plo, la energía total, la energía cinética y la energía potencial no son

en general simultáneamente mensurables. La energía potencial es una

función ele la posición y la energía cinética una función del momen

to, y las energías potencial y cinética son ejemplos típicos de cantida

des bohrianas complementarias. Podemos preparar un sistema en un

estado cuántico dado, al que corresponderá entonces ciertos valores

esperados de la energía potencial, la energía cinética y la energía to

tal. Aún si estas cantidades no son simultáneamente mensurables,

¿será el valor esperado de la energía total para sistemas en ese estado

cuántico igual a la suma del valor esperado de la energía potencial en


ese estado cuántico y el valor esperado de la energía cinética en ese

estado cuántico, si la energía total puede definirse como la suma de

las energías potencial y cinética? La respuesta es sí, incluso si las can

tidades no son simultáneamente mensurables. Un teorema sencillo

de la teoría cuántica es justamente que los valores esperados se com

portarán de esta manera para todos los observables en cualquier

estado cuántico.

Pero nosotros no estamos ahora tan interesados en los estados

cuánticos como lo estamos en los pretendidos estados subyacentes

«más profundamente», donde todas las variables ocultas no tenidas

en cuenta por el estado cuántico tienen valores definidos. Para cada

uno de estos estados, el resultado de cualquier observación relativa a

la especificación del estado más profundo es que un valor de la can

tidad observada tiene probabilidad uno y todos los otros valores tie

nen probabilidad cero. ¿Podían existir dichos estados? Un argumen

to al respecto fue diseñado por von Neumann para demostrar que

no podían existir. Von Neumann supuso que para dichos estados va

riables ocultos se cumple la misma relación entre valores esperados

que la que se cumple en los estados cuánticos, es decir, que el valor

esperado de la cantidad C será la misma función de los valores espe

rados de las cantidades A y B que el observable C lo es de los obser

vables A y B. Esto se denomina la «suposición de linealidad». Par

tiendo de esta suposición, fue capaz de probar que la existencia de

dichos estados variables ocultos conllevaría una violación de las inte-

rrelaciones de las probabilidades de los resultados predichas por la

mecánica cuántica. La postulación de variables ocultas sería, enton

ces, incompatible con las predicciones hechas por la mecánica cuán

tica. He aquí un argumento en el sentido de que las variables ocultas

no existen. Éste sostiene que no se trata simplemente de que la teo

ría cuántica no haga predicciones deterministas sobre los sistemas. Su

tesis es que si existiese un tal nivel subyacente de valores de paráme

tros totalmente determinativos, aun cuando éstos nos fueran desco

nocidos, su misma existencia confirmaría que las predicciones esta

dísticas hechas por la mecánica cuántica deberían estar equivocadas.

Durante muchos años el argumento de von Neumann fue visto

por muchos como una refutación decisiva de la compatibilidad del

determinismo con la mecánica cuántica. Nos había demostrado, se

argumentaba, que si el determinismo era válido, la mecánica cuántica

debía estar equivocada. La mecánica cuántica no podía, pues, ser vis-


(a como una teoría estadística que se asentaba sobre una descripción

determinista subyacente del mundo, como se veía a la mecánica esta

dística clásica asentada sobre la dinámica determinista subyacente de

los microestados de los sistemas por ella descritos.

Más tarde, sin embargo, surgieron dudas acerca de la legitimidad

de la prueba de la «no existencia de variables ocultas» dada por von

Neumann — no acerca de su razonamiento matemático, claro está, si

no de la legitimidad de una de las suposiciones básicas sobre la que

descansa. Se trata de la suposición de linealidad cuando se extiende

más allá de los estados cuánticos a los estados variables ocultos y, en

particular, cuando se aplica a observables que no son simultáneamen

te mensurables. ¿Es en realidad tan obvio que, incluso para observa

bles que no puedan ser medidos simultáneamente, el valor esperado

de C en un estado variable oculto dado debe ser la suma de los valo

res esperados de A y B, siempre que el observable C sea la suma de

los observables A y B? ¿No podríamos imaginar lo siguiente?: Hay un

estado variable oculto. Todo sistema en el mismo estado variable

oculto dará el mismo valor determinado cuando se mide la energía

total. También se obtendrá el mismo valor determinado cuando se

mide la energía potencial. Y el mismo valor determinado cuando se

mide la energía cinética. Pero la energía total de los sistemas en ese

estado no será la suma de las energías potencial y cinética. Si pudié

semos determinar simultáneamente todos estos valores para un siste

ma único, esto parecería absurdo; pero, tal y como Bohr insistió una

y otra vez, en ningún sistema podemos realizar las tres mediciones al

mismo tiempo.

Que la suposición de von Neumann era demasiado fuerte, reci

bió confirmación adicional. Su fortísimo resultado mostraba que nun

ca podrían existir variables ocultas, ni siquiera para las cantidades

observables más sencillas. Pero, para los casos más sencillos, se pueden de hecho construir teorías de tipo variables ocultas. Considere

mos, una vez más, una partícula que presente sólo dos estados com

ponentes de espín respecto a una elección determinada de un eje de

dirección, como un electrón que presenta un valor arriba o abajo de

su componente de espín a lo largo de cualquier dirección arriba-aba

jo que uno decida medir. Supongamos un haz de electrones com

puesto por electrones que son todos definidamente espín izquierda.

Si los hacemos pasar a través de un aparato de medida arriba-abajo,

midiendo su componente de espín perpendicular a su conocida di


rección de espín izquierda, la mitad saldrán espín arriba y la otra mi

tad espín abajo. La dirección arriba-abajo es perpendicular a la direc

ción izquierda-derecha. Elijamos cualquier otra dirección distinta a la

dirección izquierda-derecha y a la dirección arriba-abajo. La teoría

cuántica asignará probabilidades definidas a la componente del espín

del electrón que sale en una de las dos direcciones posibles a lo largo

del nuevo eje elegido.

Resulta que en este caso puede proponerse una teoría de variables

ocultas muy simple para dar cuenta de las relaciones probabilísticas

entre esas componentes de espín en el caso de una sola partícula

cuya componente de espín en-una dirección dada puede tener sólo

uno de dos valores (arriba o abajo en esa dirección), como sucede

con el electrón. Supongamos que la partícula tiene espín izquierda

definidamente. Uno puede entonces imaginar un parámetro adicional

que describa la partícula; el valor del parámetro puede variar en un

cierto dominio. Elijamos cualquier dirección en la que medir la com

ponente del espín. Supongamos que si el parámetro oculto está en un

cierto subconjunto de su dominio, la partícula será encontrada con

espín arriba en esa dirección. Puede construirse un modelo con las

siguientes características: A cada dirección en la que se mida el espín

y a cada posible resultado de esa medición, arriba o abajo en esa d i

rección, se les asigna un conjunto de valores del parámetro oculto.

Cuando la partícula tiene un espín definido en una dirección dada,

queda entonces determinada una distribución de probabilidades so

bre los valores del parámetro oculto. La probabilidad de que una

partícula sea encontrada con espín arriba, pongamos, en una direc

ción elegida, será entonces la probabilidad, de acuerdo con esta dis

tribución, de que el valor del parámetro caiga en el subdominio de

valores del parámetro correspondiente a este resultado en esta direc

ción. Una única distribución de probabilidades para el parámetro

oculto dará la probabilidad correcta para cada resultado en cada d i

rección posible, como predice la mecánica cuántica. En otras pala

bras, en el caso especial de una sola partícula con sólo dos posibles

estados componentes de espín en cualquier dirección, la totalidad de

las predicciones probabilísticas de la mecánica cuántica puede, de

hecho, duplicarse mediante un sencillo modelo de variables ocultas

en el que cada uno de sus resultados está determinado por el valor

que tiene la variable oculta en un caso particular. Las probabilidades

de un resultado dado para un sistema en un estado cuántico dado


quedarán, pues, fijadas simplemente por las probabilidades de que

los valores de las variables ocultas subyacentes se encuentren en el

subdominio correspondiente de los posibles valores variables ocultos.

Ahora bien, en este argumento no hay nada diseñado para de

mostrar que los resultados de la mecánica cuántica en este caso espe

cial quedan, efectivamente, explicados por semejante variable física

oculta real. Antes bien, el argumento está diseñado para demostrar

que, en este caso especial, no hay nada inconsistente en la postulación

de dicho modelo determinista, de variables ocultas, de los fenómenos

y de las predicciones probabilísticas de la mecánica cuántica. Pero si

el argumento de von Neumann hubiera de tomarse como concluyen-

te, si tuviésemos que aceptar el fortísimo postulado de von Neu

mann, entonces las variables ocultas serían inconsistentes con los re

sultados mecánico-cuánticos incluso en este sencillo caso de una

única partícula con sólo dos valores posibles de la componente del

espín en cualquier dirección. El argumento parece demostrar, pues,

que la suposición de von Neumann es demasiado fuerte para ser legí

tima.

Pero esto no es desde luego el final de la historia. Si von Neu

mann supone demasiado en su prueba de la «imposibilidad de varia

bles ocultas», quizá un argumento que suponga menos, de hecho uno

que suponga solamente postulados que parezcan intuitivamente ne

cesarios para cualquier teoría auténtica de variables ocultas, servirá

para fundamentar de una manera más sólida la prueba de imposibili

dad. Tales argumentos han sido, de hecho, construidos. Supongamos

que las variables ocultas existen. Entonces, en cualquier estado en el

que se especifiquen completamente los valores de todas las variables

ocultas, deberían quedar completamente determinados todos los re

sultados de un conjunto de observaciones — todas las cuales pueden ser realizadas simultáneamente. Esto es, si hay un conjunto máximo

de posibles mediciones simultáneas (o una multiplicidad de conjun

tos), el tfalor de las variables ocultas debería determinar para cada

uno de dichos conjuntos de posibles mediciones un, y solo un, resul

tado efectivo en cada medición. Estos resultados deben ser compati

bles con las predicciones mecánico-cuánticas, si es que la teoría de

variables ocultas ha de respaldar a la mecánica cuántica en vez de

ocupar su lugar como una teoría falsa refutable. ¿Puede existir seme

jante teoría de variables ocultas? Observemos que aquí no se está ha

ciendo la suposición de von Neumann, según la cual, incluso en

La imagen cuántica del mundo 50)

estados de variables ocultas, se cumplirá la relación de linealidad

para los valores esperados de observables incluso incompatibles.

Todo lo que se supone es que entre los resultados de cualquier con

junto de mediciones, todas ellas realizables simultáneamente, se cum

plirán las correctas relaciones mecánico-cuánticas. Y esto se supone

para cada uno de dichos conjuntos de observaciones simultáneamen

te realizables.

Que ninguna teoría de variables ocultas puede siquiera satisfacer

este, más modesto, requisito, se sigue de un teorema de A. Gleason o,

más directamente, del trabajo de Kochen y E. Specker. Su trabajo

muestra que ninguna teoría de variables ocultas reproducirá los re

sultados de la mecánica cuántica para ningún sistema siquiera un pa

so más avanzado del sistema discutido más arriba: la partícula única

con dos posibles resultados en una observación. En este último caso,

el más simple, sabemos que un modelo de variables ocultas es consis

tente con la mecánica cuántica. Pero para el caso siguiente en orden

de complejidad no puede hallarse una teoría de variables ocultas que

satisfaga el requisito mencionado más arriba.

Una ilustración del teorema, ideada por Kochen y Specker, dará

al lector una idea básica de cómo funciona la prueba, aunque los

pormenores de la misma no serán indicados aquí. Sea un sistema con

las siguientes características: una medida del cuadrado de la compo

nente del espín en cualquier dirección dará el valor 1 o el valor 0. En

cualquier triplete de tres direcciones, donde cada una forma ángulos

rectos con las otras dos, el sistema tendrá un valor 1 del cuadrado

del espín en dos de las direcciones y un valor 0 del cuadrado del es

pín en la tercera de estas direcciones al ser medido. Y para uno cual

quiera de dichos tripletes de direcciones mutuamente perpendicula

res, las tres mediciones pueden realizarse simultáneamente de

acuerdo con la teoría cuántica. ¿Podrían existir variables ocultas que

caracterizasen más completamente al sistema, yendo más allá de la

caracterización cuántica que nos da las relaciones entre los valores

indicados más arriba, pero proporciona sólo predicciones probabilís

ticas sobre si una dirección dada tendrá el valor 1 o el valor 0? Para

una asignación dada de variables ocultas completamente especifica

da, el que una dirección dada tenga un valor 1 o 0 es algo que debe

estar completamente determinado, y las relaciones cuánticas entre

estos valores indicadas más arriba deben ser satisfechas por esta ca

racterización más completa del sistema.


Ninguna teoría de variables ocultas semejante es posible. El argu

mento por el que esto es así utiliza solamente resultados de la geo

metría elemental. Puede demostrarse que es sencillamente imposible

asignar los valores 1 y 0 (o cualquier otro par de valores diferentes) a

las direcciones a partir de un punto dado en forma tal que para cual

quier triplete de tres direcciones mutuamente perpendiculares, se

asigne a dos de las direcciones el valor 1 y a la otra el valor 0. Así

pues, ninguna teoría de variables ocultas podría determinar comple

tamente el valor correcto del cuadrado del espín para todo conjunto

de tres direcciones mutuamente perpendiculares. Y ninguna teoría

de variables ocultas podría ser tal que se cumpliesen las correctas re

laciones mecánico-cuánticas entre los resultados de cada conjunto de

posibles mediciones simultáneas que uno pudiera realizar sobre el

sistema.

Pero el proponente de la concepción según la cual la mecánica

cuántica es una teoría estadística incompleta que precisa de una teo

ría determinista completa subyacente, no se dará por vencido tan fá

cilmente. Si examinas cómo funciona la prueba anterior de la «no

existencia de variables ocultas», descubrirás que el paso fundamental

es observar que cada dirección a partir de un punto puede ser consi

derada como miembro de una infinidad de tripletes de direcciones

perpendiculares. Así pues, el valor de la cantidad medida en una di

rección debe ser consistente, de acuerdo con las predicciones de la

mecánica cuántica, con los valores en las otras dos direcciones per

pendiculares a ella para muchos tripletes de direcciones. A esto se

debe que la prueba pueda demostrar la inconsistencia de las varia

bles ocultas con la mecánica cuántica. Partiendo de una asignación

de 1, 1 y 0 a tres direcciones perpendiculares, uno puede encontrar

una diversidad de tripletes de direcciones que contienen una o más

de las direcciones del conjunto original. Uno prosigue entonces ese

proceso hasta que se ve obligado a asignar el valor 0 a una dirección

a la que se le asignó en un principio el valor 1. (Véase la figura 4.7.)

Pero ¿qué sucederá si declaramos que el valor de la cantidad me

dida en una dirección dada relativa a una elección de las otras dos

direcciones perpendiculares no es la misma cantidad física que ese

valor relativo a otra elección de las dos direcciones perpendiculares?

Pues tener el valor 1 para cada cantidad física «relativa» semejante y

0 para la otra no será una contradicción flagrante. Pero ¿cómo po

dríamos nosotros, desde un punto de vista físico, sostener que seme-

La imagen cuántica del mundo

z0

305

F ig u r a 4.7. Un sistema utilizado en un argumento contra las variables ocultas. Existe un sistema cuántico que es tal que para cualesquiera tres direcciones mutuamente perpendiculares una cierta cantidad debe tener el valor 0 en una de esas direcciones y el valor 1 en las otras dos direcciones. ¿Podría un único conjunto de variables ocultas determinar todos esos valores? E l argumento de que esto no podría ser se apoya en

el hecho de que cualquier dirección dada es parte integrante de innumerables tripletes de direcciones mutuamente perpendiculares. Por ejemplo, z en la figura es miembro del triplete (z, x, y), pero también lo es del triplete (z, x , y ) . Se puede demostrar que es imposible asignar valores O' y V a todas las direcciones que parten de un

punto de forma tal que para todo triplete de direcciones mutuamente perpendiculares, una dirección tenga el valor 0 y las otras dos el valor 1. Pero mientras los valores a lo largo de cualesquiera tres direcciones mutuamente perpendiculares son «simultáneamente mensurables» (pongamos, a lo largo de z, x e y), los valores no serán en general simultáneamente mensurables a lo largo de, pongamos, x y x". Esto conduce a una concepción de las variables ocultas en la que los valores determinados puede

que varíen con el conjunto de medidas simultáneamente posibles elegidas.

jante relativización de la cantidad en cuestión es razonable? La res

puesta reside en el hecho de que, si bien los valores de la cantidad

en las tres direcciones perpendiculares son todos simultáneamente

mensurables, los valores de esa misma cantidad en otras direcciones


no son por necesidad simultáneamente mensurables con las tres can

tidades en cuestión. Asi, aunque se podrían determinar tres valores

en tres direcciones perpendiculares en una medición, no se podrían

determinar todos los valores en todas las direcciones simultáneamen

te. Quizá, entonces, el cambio en el aparato de medida que medía el

valor en una dirección, A, al tiempo que determinaba el valor de esa

cantidad en otras dos direcciones, B y C, respecto al aparato diferen

te necesario para medir el valor en la dirección A y en dos direccio

nes diferentes perpendiculares a la misma, D y E, afecte causalmente

al sistema. Esto podría arrojar como resultado que el valor de la can

tidad en la dirección A relativo a la medición de B y C está determi

nado por las variables ocultas de manera diferente a como la canti

dad en la dirección A está determinada por esas variables ocultas

cuando los valores en las direcciones D y E están siendo medidos a

la vez. ¿No podríamos imaginar que el mismo acto de cambiar el

aparato de medida que actúa sobre el sistema interacciona causal

mente con las variables ocultas del sistema para producir la diferen

cia? Después de todo, el resultado de la medición del valor en la di

rección A es el resultado causal conjunto de las variables ocultas del

sistema y del aparato de medida a la vez. Así, la medición de A junto

con una medición de B y C podría muy bien dar un valor en la direc

ción A diferente al que se obtendría midiendo el valor en la direc

ción de ,4 junto con una medición en las direcciones D y E. Con

todo, en ambos casos, los valores de las variables ocultas subyacentes

son los que determinan completamente cuál será el resultado de

todos esos valores medidos.

Si adoptamos una concepción «contextual» semejante de la natu

raleza de una cantidad medida, entonces la prueba bosquejada más

arriba, la prueba de que las interrelaciones entre los valores medidos

predichos por la teoría cuántica son incompatibles con cualquier po

sibilidad de que estos valores estén completamente determinados

por valores subyacentes de parámetros ocultos, no será válida. ¿Pode

mos encontrar otro tipo de prueba de la «no existencia de variables

ocultas» que sea inmune al tipo de razonamiento utilizado más arriba

para hacer que el contextualismo no parezca demasiado implausible

desde un punto de vista causal, determinista? La respuesta es que sí

podemos, y a esos argumentos vamos a dirigir ahora nuestra aten

ción.


La inseparabilidad de los sistemas

El argumento de Einstein, Podolsky y RosenBohr y Einstein fueron, respectivamente, los dos exponentes más

eminentes de dos concepciones contrarias de la teoría cuántica. Para

Bohr, la teoría cuántica proporcionaba una descripción fundamental

del mundo. Por supuesto, cualquier explicación cuántica del mundo

requería ser complementada por esas teorías pormenorizadas que

nos informaban sobre el tipo de fuerzas que actuaban entre las partí

culas elementales, los constituyentes básicos del mundo; pero, hasta

donde alcanzaba la descripción subyacente de los estados básicos de

la naturaleza y su evolución dinámica, la descripción cuántica sumi

nistraba un suelo firme. Si un sistema era preparado en un estado

cuántico dado, mediante una de esa clase de mediciones que deter

minaban, para el sistema tras la medición, los valores de algunos

miembros de un conjunto de observables compatibles, simultánea

mente mensurables, ese estado cuántico era una descripción comple

ta del estado del sistema después del proceso de preparación. Cual

quier inferencia que pudiera derivarse concerniente a los posibles

resultados de una medición futura del sistema, o a la posibilidad de

que dichos resultados se dieran, tendría que ser derivada de nuestro

conocimiento del estado cuántico del sistema. Si estas inferencias de

resultados medidos en un futuro fueran como mucho probabilísticas,

como es el caso normalmente en mecánica cuántica, también lo sería

el sistema. La mecánica cuántica nos demostraba que, en su nivel

más profundo, el mundo era genuinamente indeterminista. Contraria

mente al ideal determinista, respaldado al menos en cierta medida,

como hemos indicado, por los resultados de la física clásica, el mun

do tenía una naturaleza irreduciblemente «tiquista», o de carácter

azaroso.

Einstein, al contrario, no cedió en su concepción de que la mecá

nica cuántica no podía ser una teoría completa del mundo. Como

teoría estadística, capaz a lo sumo de predicciones probabilísticas so

bre el mundo, debería verse necesitada de un sostén en la forma de

una teoría determinista de los sistemas que descansase en una des

cripción de los mismos a un nivel más profundo que el suministrado

por la descripción cuántica. Un sistema preparado en un estado

cuántico tenía que tener, pues, otros factores propios del mismo, in-

«08 Filosofía de la física

duso si no sabíamos cuáles eran éstos, y mucho menos cuáles eran

los valores particulares de estas características ocultas que poseía el

sistema particular. Estos factores subyacentes determinarían exacta

mente el resultado de cualquier medición que se realizase sobre el

sistema, y las predicciones meramente probabilísticas derivables del

estado cuántico del sistema habrían de ser vistas como un reflejo del

hecho de que el estado cuántico proporcionaba sólo una descripción

parcial, no una completa, del estado del sistema.

Para Bohr, un proceso de medida «creaba» el valor de la canti

dad medida. Antes de la medición, el sistema no tenía ese valor de la

cantidad medida, a no ser que estuviese en un estado cuántico muy

especial en el que dicho valor se obtuviera con certeza en la medi

ción para empezar. Y antes de la medición, el sistema no era caracte

rizable por ningún otro parámetro interno que determinase comple

tamente que el resultado de hecho obtenido era el que se hubiera

obtenido si el sistema hubiese interaccionado con el aparato de me

dida apropiado. Para Einstein, esto era inaceptable. Si el sistema re

sultaba poseer efectivamente un valor determinado cuando se realiza

ba la medición, algo en el mundo que caracterizaba el estado previo

del sistema (y, quizá, del aparato de medida) tendría que dar cuenta

de que se hubiese obtenido dicho valor, y no ninguno de los otros

resultados posibles.

En 1935 Einstein, en colaboración con B. Podolsky y N. Rosen,

publicó un artículo seminal en el que se cuestionaba la forma bohria-

na de ver las cosas. Este artículo dio pie a una larga discusión en tor

no al tipo de «experimento conceptual» que Einstein propuso. Final

mente, estos estudios condujeron a una serie de resultados que

parecían plantear las más serias dificultades a un entendimiento de la

mecánica cuántica desde el punto de vista einsteiniano.

La idea de Einstein parte de la consideración de un sistema que

está compuesto por dos partes componentes. Éstas podrían ser, por

ejemplo, dos partículas nucleares unidas en un núcleo de dos partí

culas. Los sistemas pueden ser construidos de forma tal que el valor

de una cantidad para una de las partículas en el sistema compuesto

esté exactamente correlacionado con el valor de esa misma cantidad

para la otra componente. De hecho, el sistema puede ser tal que,

para toda una familia de propiedades, si la partícula uno tiene un va

lor dado de una de las propiedades en la familia, la partícula dos

debe tener un, y solo un, valor correlacionado de esa propiedad.


Einstein utilizó originalmente propiedades de la posición y el mo

mento para su modelo, pero nosotros utilizaremos en su lugar el

modelo de dos partículas con espines correlacionados. Éste es el sis

tema que se utiliza normalmente para explicar el experimento con

ceptual y sus consecuencias. Las partículas podrían ser, por ejemplo,

electrones que posean las familiares propiedades de espín que hemos

indicado en las secciones anteriores. Para cualquier dirección dada,

la componente del espín de cada partícula tendrá uno de dos valo

res, «arriba» en esa dirección o «abajo» en esa dirección. Los siste

mas compuestos en los que estaremos interesados son los que están

en un estado «singlete». En un tal estado, las partículas están correla

cionadas de forma tal que si el espín está arriba en una dirección da

da, el espín de la otra debe estar abajo en esa misma dirección. (El

nombre singlete proviene de la espectroscopia, donde los estados sin-

gletes corresponden a líneas espectrales que no son divididas cuando

el sistema se coloca en un campo magnético externo. Otros sistemas

acoplados podrían ser, por ejemplo, un estado «triplete», donde la lí

nea espectral se divide en tres líneas cuando se sumerge al sistema en

un campo magnético.)A continuación, hemos de imaginar al sistema compuesto dividi

do en sus dos componentes. Cada una de éstas se alejará en el espa

cio hasta que las partículas componentes originalmente constituyan

ahora dos partículas bien separadas en el espacio. Al mismo tiempo,

se supone que la división ha sido realizada por algún método que no

perturba las correlaciones de espín que las partículas tienen entre sí.

Esto puede hacerse mediante una intervención física apropiada sobre

el sistema desde el exterior. Bajo estas circunstancias, ¿cuál es la des

cripción correcta de las partículas una vez que han sido separadas,

según la mecánica cuántica? La respuesta es que todavía se las debe

considerar conjuntamente como un sistema compuesto en un estado

singlete de espín. Propiamente hablando, no existe un estado cuánti

co de una partícula que ignore a la otra, aunque para algunos propó

sitos se puede construir un tipo de estado «reducido» para una sin la

otra. (Véase la figura 4.8.)¿Cuáles son las predicciones que podemos hacer sobre las medi

ciones del espín de las partículas, dado su estado cuántico conjunto?

Pues bien, para cualquier dirección podemos predecir la probabili

dad de que una de las partículas se encuentre, si su espín se mide en

esa dirección, en un estado espín arriba o espín abajo. En este caso,


(a) oo (P1 + P2)

F ig u r a 4.8. La inseparabilidad de ios sistemas cuánticos. En (a) se muestra un sistema

que está compuesto por dos partículas (Pt y P2). E l sistema es tal que los valores de

espín de las partículas en cualquier dirección serán encontrados, si se miden, en direcciones opuestas entre sí, independientemente del eje que se elija para hacer la medida. En (bl las partículas son separadas y enviadas lejos una de la otra en direcciones opuestas. La separación se efectúa de forma tal que se conserve la «anticorrelación»

de espín entre las dos partículas. Uno puede decidir medir el espín de la partícula P¡ en una dirección cualquiera utilizando el detector D¡, y medir el espín de la partícula

P2 en una dirección cualquiera utilizando el detector D2. Los valores obtenidos presentan en mecánica cuántica relaciones correlaciónales probabilísticas definidas entre

si. Se puede demostrar que ninguno de los conjuntos de variables ocultas postulados, capaces de determinar los resultados de las mediciones en D¡ y D¿ con independen

cia de ¡a medición elegida en cada caso, dará las predicciones correctas para las probabilidades de todas las correlaciones predichas por la mecánica cuántica. Además, ahora es difícil imaginar que la elección de una medición sobre una de las partículas atecte a la variable oculta que determina el resultado de la medición en la otra partícula, va que las dos mediciones se hacen a distancias y a proximidades en el tiempo

tan colosales que hacen la interacción causal entre ellas imposible.

cada una de esas probabilidades es de un medio. Estas probabilida

des se seguirían ambas del estado cuántico total del sistema com

puesto y de los estados reducidos que podemos atribuir a cada partí

cula por separado. Pero, de la naturaleza del estado conjunto se sigue

algo distinto, a saber, la perfecta correlación de las partículas. No im

porta lo distantes en el espacio que lleguen a estar las partículas, po

demos siempre inferir, suponiendo que nada interaccione con ellas

desde el exterior entre la división del sistema original y las medicio

nes realizadas, que si en una medición se encuentra que una partícu

la tiene espín arriba en una dirección dada, se encontrará sin duda

que la otra partícula tiene espín abajo si su espín se mide en la mis

La imagen cuántica de! mundo 311

ma dirección. Además, si se realiza una medición sobre una partícula

en una dirección dada y se anota el resultado, se encontrarán probabi

lidades definidas para el resultado de una medición del espín sobre la

otra partícula en cualquier otra dirección elegida. Estas probabilida

des condicionadas del resultado de una medición sobre la partícula

dos al resultado de una medición sobre la partícula uno se siguen del

estado cuántico total del sistema compuesto. Éstas son eliminadas en

las descripciones reducidas que pueden construirse para las partículas

en cada momento, razón por la que dichas descripciones reducidas

no sirven para especificar el estado cuántico total del mundo.

Ahora bien, dice Einstein, miremos desde el punto de vista boh-

riano al estado de la partícula dos antes y después de que el estado

de la partícula uno haya sido determinado mediante una medición.

De acuerdo con Bohr, antes de realizarse una medición, ninguna de

las partículas tiene un espín definido. Ni tienen, de acuerdo con

Bohr, una propiedad por la que tendrían necesariamente un valor

definido de espín en una dirección definida en caso de realizarse una

medición. Más bien, antes de una medición, las partículas poseen

únicamente una disposición a aparecer con un valor de espín dado

en una dirección dada con probabilidad un medio, junto a la disposi

ción a tener sus valores de espín, si se miden los dos, correlacionados

en la forma descrita por la función de onda del estado singlete. Pero

supongamos que se mide el espín de la partícula uno en una direc

ción dada, pongamos, A. Supongamos que se obtiene el valor «arri

ba». En ese mismo instante, de acuerdo con Bohr, la segunda partí

cula, aunque se encuentre a una distancia de años luz, «salta»

instantáneamente al estado cuántico apropiado para que su espín

tenga la dirección «abajo» en la dirección A. Esto es cierto porque

una vez que se ha determinado que el espín de la partícula en la po

sición «arriba» está en la dirección A, es seguro que el espín de la

partícula dos se encuentra «abajo» en esa dirección, y la única fun

ción de onda que otorga esa probabilidad a la partícula dos sería una

función de onda «abajo pura en la dirección A». Esta función de on

da para la partícula dos difiere mucho de la asignación a la partícula

dos, en unión con la partícula uno, de una función de onda previa

correspondiente a la partícula dos formando parte de un sistema

compuesto en un estado singlete.

Ahora bien, dice Einstein, si concebimos la función de onda

como una caracterización física completa de la partícula, este tipo de


cambio es absurdo. Bohr concibe la medición como la «creación» de

un valor para la observación del sistema, un valor que no existía an

tes de haberse realizado la medición, y no como la revelación de un

valor preexistente (o al menos predeterminado) para esa cantidad.

Esto puede ser plausible si nosotros interaccionamos físicamente con

el sistema cuando lo medimos, pero carece de sentido si el sistema

no se ve perturbado lo más mínimo por nuestra medición. Eso es lo

que sucede en el caso del sistema acoplado que estamos consideran

do. Medimos el valor del espín en la partícula dos haciendo interac-

cionar nuestro aparato de medida con la partícula uno. La medición

que realizamos determina el valor del espín en la dirección A para la

partícula uno. Eso nos dice inmediatamente cuál es el valor del espín

para la partícula dos, es decir, qué valor del espín en la dirección A mostraría ahora una medición de la partícula dos. Pero, como no

tocamos para nada en absoluto, en el sentido físico, a la partícula dos

durante el proceso de medida, sea lo que fuere lo que determina que

la partícula dos tenga un valor definido de espín en la dirección A si

se mide, deberá haber sido cierto para la partícula dos antes de nuestra medición de la partícula uno. Pero, antes de nuestra medición de la partícu

la uno, la función de onda que describía las partículas no asignó un

valor definido de espín en la dirección A a la partícula dos. Y, repito,

la partícula dos debe haber poseído semejante valor determinado del

espín en la dirección A aun antes de nuestra medición de la partícula

uno. Por lo tanto, concluyen Einstein y sus colaboradores, el estado

cuántico del sistema compuesto antes de la medición no contenía

una descripción total del estado actual del mundo. No asignó, por

ejemplo, una disposición definida de la partícula dos a mostrar un, y

solo un, valor de espín en la dirección A, una disposición que la par

tícula dos debe haber tenido «desde un principio», de acuerdo al ar

gumento que acabamos de exponer.

Concluyen, pues, que la mecánica cuántica es una teoría incom

pleta. La función de onda, arguyen, debe considerarse que represen

ta, no el estado físico total de un sistema, sino sólo nuestro conoci

miento parcial de ese estado. El cambio instantáneo de la función de

onda en la medición deja así de resultar misterioso. Supongamos que

sabemos que una peseta se encuentra, bien en una caja de cerillas en

la Tierra, bien en una caja de cerillas en un planeta de Alpha Centau-

ri. Podemos representar esto por una función de probabilidad que

asigna, pongamos, la probabilidad de un medio a cada posibilidad.


Miramos ahora en la caja de cerillas en la Tierra y vemos la peseta.

Por supuesto, la probabilidad de que la peseta esté en la otra caja de

cerillas se reduce instantáneamente a cero. Pero esto no implica un

cambio físico misterioso de la caja de cerillas en el planeta distante,

sólo un cambio en lo que nosotros sabemos sobre ella. Pues si la caja

de cerillas distante resulta estar vacía, debe haber estado vacía aun

antes de que mirásemos en la caja de cerillas en la tierra.

Bohr no se mostrará en absoluto de acuerdo con este argumento.

Es verdad, responde, que la función de onda asignada a un sistema

es relativa a la elección de alguna medición. Antes de que la medi

ción se haya realizado sobre la partícula uno, la función de onda ade

cuada para caracterizar a la partícula dos es la que la caracteriza

como una componente del sistema original compuesto en estado sin

glete. En relación a la medición inicial de preparación, ésta es la fun

ción de onda correcta para describir el mundo. Después de que la

partícula uno ha sido medida y se ha hallado que tiene un valor defi

nido de espín en la dirección A, la función de onda correcta para

describir el mundo es la que asigna a cada partícula un espín defini

do en la dirección A Asigna a la partícula uno el valor de espín de

terminado por la medición, y asigna a la partícula dos el valor de es

pín que debe tener debido a la perfecta correlación de los espines de

las dos partículas. La medición de la partícula uno, pues, cambia

efectivamente la función de onda atribuida a la partícula dos. Pero

esto no implica, ni que la función de onda sea meramente un com

pendio de nuestro conocimiento y no una especificación total del

estado físico, ni que la medición de la partícula uno tenga un efecto

«causal» sobre la partícula dos. Antes bien, es una característica de la

relatividad de la función de onda respecto al proceso de medida. Es

este aspecto relacional de la mecánica cuántica, a saber, que los

estados existen sólo en relación a las mediciones, lo que Bohr preten

de en su explicación de la situación, argumentando que la relatividad

de la función de onda respecto a la medición realizada es algo análo

go a la relatividad de la longitud de una vara de medir respecto al

movimiento de un observador en la relatividad. El cambio del estado

de movimiento de uno mismo respecto a la vara de medir cambia la

longitud de la vara de medir respecto a uno mismo como observa

dor. Pero esto no significa un cambio causal en la vara de medir, tal y

como la teoría del éter lo habría explicado. Ni significa que la longi

tud es una característica subjetiva de la vara de medir. La longitud es


relativa al sistema de referencia. De manera similar, afirma Bohr, la

(unción de onda es física, pero relativa.

1:1 Teorema de Bell¿Podría cualquier argumento servir para ayudar a determinar cuál de

estas posturas respecto a la función de onda es la correcta? Al menos

podríamos confiar en hacer lo siguiente: podríamos ser capaces de

determinar si la postulación de variables ocultas que fijan los estados

de los dos sistemas separados individualmente, así como el estado de

la partícula distante independientemente de la medición que decida

mos realizar en la partícula más cercana, es consistente con todas las

predicciones probabilísticas hechas por la mecánica cuántica. Noso

tros vamos a considerar ahora la afirmación de que una postulación

semejante, una que esté de acuerdo con la imagen de Einstein de la

función de onda como una descripción incompleta del mundo soste

nido por un nivel de descripción más completa, determinista, ya nos

sea o no conocida, no es de hecho consistente con la mecánica cuán

tica. Un teorema de J. Bell, y algunas extensiones del mismo, están

diseñados para demostrar que la imagen que Einstein sugiere cómo

la correcta interpretación de la función de onda asignada a sistemas

correlacionados no puede ser correcta.

¿Cómo funciona la demostración? Para empezar, supongamos

que Einstein está en lo cierto. En el caso de las dos partículas corre

lacionadas con posibles valores de espín que se ha descrito más arri

ba, supongamos que tan pronto como las partículas se separan una

de la otra, cada partícula arrastra consigo un valor de un parámetro

oculto. El valor del parámetro oculto asociado a una partícula deter

minará completamente, para esa partícula, si aparece arriba o abajo

en cualquier medición de espín realizada sobre la misma en cual

quier dirección que elijamos. Supongamos, también, que sucesos

muy distantes en el espacio y próximos entre sí en el tiempo, de for

ma tal que, por relatividad, ninguna señal causal pudiera ser enviada

desde el uno al otro, no pueden afectarse mutuamente. Una conse

cuencia de esto es lo siguiente: Supongamos que medimos la partícu

la dos en la dirección B. El resultado de esta medición no debe de

pender de ninguna elección por nuestra parte de la dirección en la

que decidamos medir el espín de la partícula uno. Después de todo,


podríamos disponer las dos mediciones, una vez que las partículas se

hubiesen separado una distancia entre sí, de forma tal que una medi

ción no pueda afectar causalmente a la otra. Así, la elección de la di

rección en la que mediremos el espín de la partícula uno no debería

tener efecto alguno sobre el resultado de una medición de espín en

la partícula dos en la dirección elegida para hacer esa medición.

Supongamos ahora que decidimos efectuar dichos pares de medi

ciones del espín en una clase amplia de pares de partículas, todas

preparadas de la misma forma, con las mismas correlaciones de espín

predichas por la mecánica cuántica. Suponemos que cada resultado

está completamente determinado por el valor del parámetro oculto

que cada partícula arrastra en cada uno de los experimentos. Tam

bién suponemos que las probabilidades de los resultados de las me

diciones en una de las partículas son independientes de qué medi

ción de espín elijamos hacer sobre la otra partícula. La probabilidad

de que se obtenga un valor dado en una medición sobre una partícu

la dada en una dirección dada debería, entonces, depender sólo de la

probabilidad con la que los diversos valores posibles de los paráme

tros ocultos para cada partícula están distribuidos.

Introduzcamos la siguiente notación: es un símbolo con

seis lugares disponibles. Los tres lugares anteriores al punto y coma

corresponden a la partícula uno y los tres después del mismo a la

partícula dos. Cada uno de los tres lugares a cada lado del punto y

coma corresponde a una dirección A, B y C. Consideraremos medi

ciones de la componente del espín de cada partícula en cada una de

estas tres direcciones. Un símbolo «i-» en un lugar significa que el

valor del espín para esa partícula en esa dirección está determinado

por los parámetros ocultos a aparecer en la dirección arriba. Un sím

bolo «—» significa que está determinado a aparecer abajo. (Cuál de las

dos direcciones se toma como arriba y cuál como abajo para cada A, B y C es indiferente). Un «0» en un lugar significa que el parámetro

oculto tiene un valor tal que el espín en esa dirección aparecerá arri

ba o abajo, es decir, cualquier valor consistente con los más y los me

nos asignados a los otros lugares. Recordad que las partículas tienen

una correlación perfecta, de manera que si aparece un más, ponga

mos, en el primer lugar a la izquierda del punto y coma, eso forzará

un valor menos en el primer lugar a la derecha del punto y coma.

Por ejemplo, el símbolo (+,0,0;0,0,+) indicará la probabilidad de que

en una medición de la primera partícula en la dirección A aparezca


necesariamente un espín arriba en esa dirección, y en una medición

de la segunda partícula en la dirección C aparezca necesariamente un

valor arriba en la dirección C del espín.

Consideremos la siguiente ecuación:

Ecn. A-C: (+,0,0;0,0,+) = (+,+,—~ ,—,+) + (+,—,—;—,+,+)

Aquí nos apoyamos en los dos argumentos siguientes: 1) si se ob

tiene el valor + para una partícula en una dirección, el valor de la

otra partícula en esa dirección es forzosamente menos; 2) dados los

valores determinados para los espines de las partículas uno y dos en

las direcciones A y C, quedan solamente dos posibilidades para el va

lor de estos espines en la dirección indeterminada B. Como todas

estas probabilidades están bien definidas y son independientes de la

medición que decidamos realizar sobre cada partícula, parece razona

ble sobre la base de los postulados elementales de la teoría de la pro

babilidad que la probabilidad total de que la partícula uno resulte

más en la dirección A y la partícula dos resulte más en la dirección C

es la probabilidad de ese suceso y también de que la partícula uno

resulte más en la dirección B (con la partícula dos resultando menos

en esa dirección) más la probabilidad de que se dé el resultado men

cionado y que la partícula uno resulte menos en la dirección B (con

la partícula dos resultando más en esa dirección). Esto se debe a que,

dado el resultado mencionado, estas dos otras posibilidades para el

resultado en la dirección B se excluyen mutuamente y agotan todas

las posibilidades que pueden darse.

Siguiendo exactamente el mismo razonamiento se obtiene una se

gunda ecuación:

Ecn. B-C: (0,+,0;0,0,+) = (+,+,— ,—,+) + (—,+,—;+,—,+)

y una tercera ecuación:

Ecn. A-B.: (+,0,0;0,+,0) = (+,-,+;-,+,-) +

Ahora viene la observación que pone en duda la postulación de

las denominadas variables locales ocultas subyacentes a las probabili

dades mecánico-cuánticas. Si miramos al lado derecho de la Ecn. A-C,

observamos que el primer término en el mismo aparece en el lado


derecho de la Ecn. B-C y el segundo término aparece en el lado dere

cho de la Ecn. A-B. Ahora bien, los otros términos en el lado derecho

de cada una de estas dos últimas ecuaciones deben ser mayores que,

o iguales a, cero porque representan probabilidades, y las probabili

dades nunca son números negativos. Así pues, si sumamos los lados

izquierdos de las Ecns. B-C y A-B, debemos obtener un número que

sea al menos tan grande como el lado izquierdo de la Ecn. A-C. Di

cho en palabras esto se reduce a lo siguiente: «La suma de las proba

bilidades de que la partícula uno aparezca arriba en la dirección B y

la partícula dos aparezca arriba en la dirección C con la probabilidad

de que la partícula uno aparezca arriba en la dirección A y la partícu

la dos aparezca arriba en la dirección B no puede ser menor que la

probabilidad de que la partícula uno aparezca arriba en la dirección

A y la partícula dos aparezca arriba en la dirección C. Esto debe ser

cierto para todas las direcciones A, B y C.»

Pero resulta que hay direcciones de A, B y C en las que ¡esta des

igualdad se ve violada por las probabilidades predichas por la mecá

nica cuántica! En mecánica cuántica, la correlación probabilística de

la dirección A con la dirección C puede ser mayor que la suma de la

correlación de la dirección A con alguna otra dirección, B, y la corre

lación de esta otra dirección, B, con la dirección C. Parece que el

postular que todas las probabilidades indicadas están bien definidas

es incompatible con las predicciones mecánico-cuánticas sobre pro

babilidades de resultados conjuntos. Y los postulados tras la existen

cia de estas probabilidades parecen ser, entonces, incompatibles con

las predicciones probabilísticas mecánico-cuánticas. Estos postulados

son, primero, que hay valores de parámetros ocultos que determinan

los resultados de todos los experimentos de espín que puedan reali

zarse sobre las partículas separadas y, segundo, que el resultado de

una medición sobre la segunda partícula es independiente de la me

dición de espín que hagamos para medir el espín de la primera partí

cula (y viceversa). Parece como si estuviésemos obligados a pensar

que el realizar una medición particular sobre la primera partícula tie

ne un efecto determinante sobre la distribución de probabilidades

para el resultado de mediciones sobre la segunda partícula. Este efec

to no puede ser comparado con el caso clásico donde hay una proba

bilidad ya determinada para cada resultado en la segunda partícula,

independientemente del experimento que realicemos sobre la prime

ra, sirviendo el experimento sobre la primera partícula sólo para per

318 Filosofía tle la física

mitirnos hacer inferencias más profundas acerca de la segunda por

un tipo de condicionamiento probabilístico.

Suponed que admitimos que los parámetros ocultos portados por

cada una de las partículas no determinan con certeza el resultado de

cada una de las mediciones que pueden realizarse sobre las partícu

las; fijan el resultado sólo indeterminista y probabilísticamente. Aquí,

pues, las variables ocultas no restaurarían el determinismo en la físi

ca. Pero ¿no podrían al menos restaurar la «localidad»? ¿No podría

mos pensar que cada partícula, después de la separación, porta su

propia probabilidad de dar un resultado específico en cualquier me

dición que se realice sobre ella, aun si la partícula no porta un resul

tado completamente determinado para cada posible medición? Vaya,

si se hace una suposición de «localidad» natural, adicional, esta ver

sión de las «variables ocultas locales estocásticas» es también incon

sistente con la mecánica cuántica. La suposición adicional es que la

probabilidad determinada para los resultados de todas las posibles

mediciones sobre la partícula dos por su variable estocástica oculta

es independiente del resultado de cualquier medición que realicemos

sobre la partícula uno. En el caso de variables ocultas deterministas,

supusimos que el resultado sobre la partícula dos era independiente

de la elección del experimento realizado sobre la partícula uno. Aho

ra suponemos, asimismo, que la probabilidad de un resultado en la

partícula dos es independiente del resultado que podríamos obtener

en una observación hecha en la partícula uno. Seguramente ésta es

una suposición razonable si lo que pretendemos es construir una teo

ría que esté de acuerdo con el desiderátum de Einstein de que el

estado de la partícula dos, una vez separada de la partícula uno de

cualquier modo causal ordinario, es independiente de lo que pueda

sucederle a la partícula uno.

Aun en el caso de una teoría de variables ocultas probabilística,

la suposición de localidad para la variable oculta, interpretada natu

ralmente, está en desacuerdo con las predicciones cuánticas. Se da

una suerte de «enmarañamiento» entre los sistemas, en su momento

unidos y ahora separados, que no puede ser reducido al mero hecho,

clásicamente inteligible, de que cada uno de ellos, independiente

mente del otro, porta un registro de su existencia pasada como com

ponentes de un sistema compuesto con propiedades determinadas.

Es cierto que juntos portan un registro de ese estado anterior, pero

parece que este registro no puede ser factorizado en características


independientes de las dos partículas tomadas como sistemas físicos

independientes y distintos.

La idea de que el realizar un experimento en un lugar parece, de

acuerdo con la mecánica cuántica, producir un efecto en las probabi

lidades de los resultados de otro experimento realizado en algún lu

gar distante evoca la posibilidad de una comunicación que sobrepasa

los límites impuestos a la transmisión de la energía por la famosa afir

mación relativista de que la luz es la señal más rápida posible para la

transmisión de una señal causal. Pero un examen detenido de la si

tuación muestra que no hay nada que un experimentador pueda ha

cer en el lugar de la partícula uno para modificar cualquier resultado

que un experimentador obtenga en el lugar de la partícula dos y que

pudiera ser utilizado para informar al segundo experimentador de

que, por ejemplo, el primer experimentador había de hecho decidido

medir el espín de la partícula uno en una dirección particular o de

que había obtenido resultados específicos al hacerlo. Las correlacio

nes entre los espines de las partículas que se obtendrían si se hicie

ran dos mediciones particulares sobre dos partículas correlacionadas

particulares separadas del mismo sistema compuesto original en

estado singlete, las correlaciones predichas por la mecánica cuántica,

no son reproducibles mediante variables ocultas locales, ya sean del

tipo determinista o del estocástico. Pero ninguno de estos hechos so

bre la correlación podría ser utilizado para violar los límites relativis

tas sobre la velocidad o transmisibilidad de una señal causal.

Parece falso, pues, que las probabilidades de las componentes se

paradas de un sistema, en su momento unificado, puedan ser fijadas,

deterministamente o simplemente probabilísticamente, por caracte

rísticas locales a este sistema aislado y en forma tal que las probabili

dades de resultados en mediciones de los sistemas individuales satis

fagan todos los resultados correlaciónales sobre los productos de las

mediciones dictados por las leyes de la mecánica cuántica. Y es falso

si uno hace las suposiciones fundamentales contenidas en estos argu

mentos sobre «variables ocultas no locales». Existen tentativas de

soslayar estos argumentos que se fundan, por ejemplo, en teorías pro

babilísticas no estándar. Pero la rareza del mundo implicado por

estas teorías es al menos tan extrema como la aparente no localidad

de los sistemas que normalmente se asume como consecuencia de

estos argumentos.

Pero ¿podría estar la mecánica cuántica equivocada en sus pre


dicciones sobre las correlaciones de estados de sistemas separados?

No parece probable. Se ha llevado a cabo un trabajo experimental

(no con la clase de partículas que utilizamos en nuestro ejemplo, sino

con fotones de luz polarizada para los que se puede probar un resul

tado relacionado de «variables no ocultas»). Este parece mostrar, sin

ser motivo de sorpresa, que las correlaciones entre los estados de las

partículas en su momento unidas son justo como predice la mecánica

cuántica.

Así, el seguimiento de la astuta idea de Einstein de apelar a siste

mas que en su momento habían interaccionado causalmente pero

que, en el momento en que se realizaron las mediciones sobre ellos,

constituían sistemas ampliamente separados que no podían ser consi

derados en contacto causal entre sí, ha tenido el efecto opuesto al

que Einstein pretendía. Einstein consideró absurdo que una medi

ción en un lugar y tiempo pudiera provocar un cambio real en otro

lugar y tiempo no conectado causalmente al primero, y que esto de

mostrase que el estado cuántico debía ser tomado como una repre

sentación de nuestro conocimiento parcial del estado del mundo y

no como una descripción completa de ese estado. Pero los resultados

del teorema de Bell parecen indicar, antes bien, que no es plausible

un entendimiento de la mecánica cuántica como una teoría estadísti

ca sobreimpuesta a una teoría de variables ocultas local subyacente.

Dichos resultados van más allá de los discutidos en «Argumentos

contra las variables ocultas» en que, en los casos que estamos consi

derando ahora, la solución dada por los teóricos de variables ocultas

al dilema —primero tomando los observables como contextúales y

relativos a otras cantidades observadas y después considerando las

otras mediciones realizadas simultáneamente como actuando causal

mente sobre las variables ocultas que determinan el resultado de la

medición en cuestión— no parece ser válida. Si admitimos que la

elección de qué medición realizar sobre una partícula en un momen

to dado, y el resultado obtenido en esa medición, no pueden afectar

causalmente a los valores de las variables ocultas de la otra partícula

a una gran distancia y cuya medición se realiza en un tiempo próxi

mo al de la primera medición, esta forma de soslayar los resultados

de «variables no ocultas» queda ahora invalidada.


ResumenLos resultados esbozados en E l argumento de Einstein, Podolsky y Rosen y en el Teorema de Bell no pueden, por sí mismos, determinar cuál

de las posibles interpretaciones metafísicas de la mecánica cuántica y

del proceso de medida es la correcta. Parecen, no obstante, inclinarse

a favor de las interpretaciones que proponen revisiones radicales en

nuestro entendimiento de la naturaleza del mundo y en contra de

quienes afirman que podríamos entender la nueva teoría con sólo re

visiones más o menos menores en nuestros conceptos sobre cómo es

el mundo. Estas eran, por ejemplo, esas interpretaciones del Princi

pio de Incertidumbre que veían en el mismo una limitación mera

mente en nuestro posible conocimiento del estado de un sistema.

Nosotros no podíamos conocer, argumentaban estas interpretaciones,

valores simultáneos exactos de la posición y del momento de una

partícula. Pero podíamos suponer, continuaba el argumento, que di

chos valores todavía existían. No obstante, el hecho de que ninguna

variable oculta no contextual de ningún tipo pudiera generar los re

sultados probabilísticos correctos para todas las mediciones posibles

sobre un sistema parecería militar contra esta concepción y a favor,

antes bien, de la argumentación más radical de Bohr, según la cual

las características atribuidas a un sistema, cuando éste era medido y

se encontraba que tenía ciertos valores de una cantidad observable,

eran «creadas» por la medición y no se encontraban previamente

presentes en el sistema.

Los aun más sorprendentes resultados del Teorema de Bell pare

cen permitirnos ir un poco más lejos. Una cosa es considerar la medi

ción como una «creación» del estado observado del sistema por me

dio de un tipo de proceso causal, el resultado de la interacción

causal entre el aparato de medida y el sistema medido. Después de

todo, somos conscientes del hecho de que, incluso en la física pre-

cuántica, el acto de medir una cantidad de un sistema puede cambiar

el estado del sistema. La introducción de un termómetro en un líqui

do para medir la temperatura de ese líquido cambiará la temperatura

del líquido en el proceso. ¿No podría considerarse de este modo el

«efecto de la medición sobre el sistema medido»? La diferencia entre

el caso clásico y el cuántico residiría entonces en el hecho de que en

el caso precuántico es posible, en principio, hacer que la perturba

ción del sistema por el aparato de medida sea tan pequeña como uno


quiera, mientras que en mecánica cuántica el límite irreducible sobre

la cantidad mínima de energía transferida en un proceso de medida

(debido a la naturaleza cuántica de la energía transferida desde un

sistema a otro) podría hacer imposible reducir dicha perturbación a

«casi cero». Semejante forma de entender la incertidumbre tuvo sus

partidarios, especialmente en la primera interpretación del Principio

de Incertidumbre.

Pero, tal y como hemos visto, la mecánica cuántica parece reque

rir que una medición pueda ejercer un efecto sobre un sistema aun

cuando el aparato de medida y el sistema no están en contacto causal

de ninguna forma. La medición del espín en la partícula uno cambia

el estado cuántico de la partícula dos. Como hemos visto, este cam

bio no puede ser reducido a la simple modificación en las probabili

dades que resulta de un aumento en nuestro conocimiento del mun

do para cuyo propósito servirá un modelo clásico. La inexistencia de

variables ocultas locales parece implicar esa conclusión. Así Bohr pa

rece estar en lo cierto cuando mantiene que los estados del mundo,

estados cuánticos de los sistemas, poseen una cierta clase de relativi

dad respecto a la elección y al resultado de la medición que no es

comparable, ni a una modificación causal del sistema por la medi

ción, ni a la consideración del estado cuántico como sólo una des

cripción parcial del sistema, un compendio de nuestro conocimiento

sobre el mismo cuya modificación en la medición es comprensible en

una forma clásica. Los resultados de los teoremas de «variables no

ocultas» refuerzan la vindicación de que la mecánica cuántica nos

exigirá un replanteamiento radical de la naturaleza del mundo, una

vez que hallamos logrado algo parecido a un entendimiento coheren

te de la misma.

No se sabe bien en qué consistirá dicho replanteamiento. Como

mínimo parecería que la mecánica cuántica sitúa bajo una luz muy

diferente la vieja cuestión de si Leibniz estaba en lo cierto al pensar

que todo suceso que ocurría tenía una «razón suficiente». Si la mayo

ría de los intérpretes de la mecánica cuántica están en lo cierto, no

hay sencillamente razón causal alguna en absoluto por la que un nú

cleo de un elemento radioactivo se desintegraría en un intervalo de

tiempo dado, mientras un núcleo idéntico de la misma clase no lo

haría. Peor aun, como hemos visto, las causas estocásticas o probabi-

lísticas parecen descartadas, si se supone que la causalidad — aun si

es indeterminista— es una relación puramente local en la que los


estados de las cosas están determinados solamente por lo que está

sucediendo en su vecindad espacio-temporal. Junto a la noción de

una cadena causal del acontecer en el mundo discurre nuestra no

ción de lo que significa explicar por qué ocurren los fenómenos. Po

demos explicar las correlaciones observadas en las mediciones de es

pín de las partículas distantes por referencia a su origen como

componentes de un sistema compuesto en estado singlete. Pero a di

ferencia de la habitual explicación clásica de dichas correlaciones, no

podemos explicar esta correlación mostrando cómo el origen históri

co de las partículas proporciona para cada una, independientemente

de la otra, una probabilidad definida de ocurrencia, siendo la correla

ción la consiguiente distribución de probabilidades compuestas para

un par de resultados, cada uno de los cuales es descrito probabilísti-

camente. En lugar de ello, la correlación es un hecho «irreducible», y

la explicación de ello es directa y no a través de semejantes probabi

lidades independientes, pues sabemos que cualquier asignación de

las mismas sería incompatible con las correlaciones que se dan efecti

vamente.

Finalmente, aunque más indirectamente, los resultados de «varia

bles no ocultas» refuerzan las afirmaciones de que un entendimiento

total del mundo descrito por la mecánica cuántica requerirá una re

valuación radical de nuestra imagen metafísica del mundo. Para algu

nos, esto significa pasar de la presuposición de la imagen mecanicista

clásica de un único mundo material a una en la que suposiciones

idealistas, bastante anticuadas, sobre la existencia de estados menta

les ontológicamente independientes de los soportes físicos desempe

ñan un papel. Para otros, significa la negación, mucho más radical, de

un mundo físico unitario, y su sustitución por una versión u otra de

una ontología de «muchos mundos» en la que, en cada momento, ca

da uno de una diversidad de resultados posibles de un proceso se

realiza en los diferentes «universos derivados». Para otros, el cambio,

todavía más radical, sería la negación absoluta de cualquier noción

de un mundo objetivo que exista con independencia de nuestras ten

tativas de llegar a conocerlo, sustituyendo esta tradicional concep

ción objetivista por algún tipo de versión de una imagen bohriana, en

la que el mundo está descrito por estados cuánticos, pero estos

estados son de suyo relativos a la elección de una medición a rea

lizar.

Una vez más, el lector debería reflexionar sobre los fenómenos fí

Í 24 Filosofía de la física

sicos que. condujeron a estas osadas especulaciones en primer lugar.

Es importante recordar que tales fenómenos como la naturaleza dual

de la luz como una onda mostrando fenómenos de interferencia y

como una partícula mostrando transferencia de energía en una forma

sumamente localizada; la presencia de fenómenos de interferencia

para las partículas materiales fundamentales del mundo tal y como se

revela, pongamos, en la dispersión de electrones por un cristal; la

aparición de interferencia en otros aspectos del mundo además del

espacial, como en los experimentos de espín que muestran la reten

ción de memoria del espín original de una partícula en una dirección

incluso después de que el haz de partículas haya sido dividido en ha

ces puros de partículas con espines arriba y abajo en alguna otra di

rección; los resultados correlacionados de posibles mediciones simul

táneas sobre un sistema no compatibles con el hecho de estar

determinados por cualquier variable oculta no contextual para el sis

tema, por razones geométricas muy elementales; y la existencia de co

rrelaciones distantes cuya explicación no descansa en una interacción

local pretérita de los sistemas separados, pero que no puede ser re

construida como explicable por parámetros locales portados por ca

da uno de los sistemas separados individualmente. Estas característi

cas del mundo, demostrables experimentalmente, no son parte de

ningún formalismo esotérico, sino características totalmente distinti

vas reproducibles en el laboratorio. Cuanto más se reflexiona sobre

ellas, más difícil es dar con una explicación unitaria plausible que no

recurra a una redefinición absolutamente radical de la naturaleza del

mundo.

Lecturas complementarias

Tres introducciones básicas a la filosofía de la mecánica cuántica que

son fácilmente accesibles son Pagels (1982), Squires (1986) y Rae

(1986). Gibbins (1987) estudia también, con alguna sofisticación filo

sófica, el material básico. Heisenberg (1930) sigue siendo un clásico

de una exposición elemental brillante. Hughes (1989) contiene una

exposición del formalismo de la teoría, con una explicación cuidado

sa de por qué desempeña el papel que desempeña. D ’Espagnat (1971)

es un tratamiento sofisticado de muchos problemas centrales que ha

ce uso de una mayor cantidad de aparato formal que las obras más

La imagen cuántica del mundo

sencillas. Jammer (1974) es de una envergadura enci?fót^édigtfijwgj|

trando la mayor parte de las líneas más importantes de interpretados

a través de la historia de la disciplina.

Jammer (1966) es una historia comprehensiva de los orígenes de

la teoría cuántica que hace hincapié en el desarrollo de los principa

les conceptos. Ludwig (1968) contiene traducciones de los artículos

originales en el campo de la teoría cuántica. Bohm (1951) contiene

también capítulos con una exposición clara sobre la base experimen

tal de la teoría y sobre su desarrollo temprano.

Hay numerosos textos introductorios sobre la teoría cuántica.

Bohm (1951), Dicke y Wittke,(1960), y Gottfried (1960) son todos ex

celentes. Presentaciones formales clásicas de la teoría son Dirac

(1930) y von Neumann (1955). Introducciones a las matemáticas ne

cesarias para formular la teoría pueden encontrarse en Hughes (1989)

y Jordán (1969). El material más avanzado es examinado en Jauch

(1968).

Sobre las interpretaciones tempranas de la teoría, Jammer (1974),

capítulos 2 al 6, es comprehensiva. Heisenberg (1930) es también una

lectura esencial. Una introducción al debate, junto con muchos de

los importantes artículos originales, se encuentra en Wheeler y Zurek

(1983).

Sobre la medición, la lectura de los capítulos 2 y 4-6 de Wheeler

y Zurek (1983) es vital. D ’Espagnat (1971), parte 4, es exhaustiva y cla

ra. Jammer (1974), capítulo 11, abarca las principales teorías.

La formulación del «estado relativo» en la teoría por Kochen

puede encontrarse en Kochen (1985). Una exposición y una discu

sión completas de este enfoque se encuentra en Healy (1989). Una

interpretación relacionada puede encontrarse en van Fraassen (1991).

Propuestas que vinculan la medición cuántica al tipo de irreversibili-

dad discutida en el capítulo 3 del presente libro pueden encontrarse

en el capítulo 5 de Wheeler y Zurek (1983). La concepción según la

cual la medición es el resultado de «puntapiés aleatorios» al sistema

desde un nivel físico «más profundo» pueden encontrarse en Ghirar-

di, Rimini y Weber (1986). Una crítica de esta concepción y de la

concepción de Kochen puede encontrarse en Albert y Loewer (1990).

La interpretación de «muchos mundos» de la teoría cuántica se dis

cute en la sección 11.6 de Jammer (1974) y 2.3 de Wheeler y Zurek

(1983), así como en el capítulo 20 de D ’Espagnat (1971).

La versión de Reichenbach de la «lógica cuántica» se encuentra


en Reichenbach (1944). Un estudio de los principales temas de la ló

gica cuántica se encuentra en el capítulo 8 de Jammer (1974). Los ca

pítulos 9 y 10 de Gibbins (1987) exponen ambos la naturaleza de la

pretendida lógica cuántica y ofrecen una crítica de esas posturas filo

sóficas que consideran a la «lógica» cuántica como una revisión de la

lógica propiamente dicha. Hughes (1989) es también una buena fuen

te sobre este tópico.

Para una variedad de teorías de variables ocultas véase Jammer

(1974), capítulo 7, y Belinfante (1973). Sobre la inseparabilidad de los

sistemas, Düspagnat (1971), parte 3, es excelente. Importantes artícu

los originales de Bell se encuentran en Bell (1987).

REFLEXIONES SOBRE LA INTERDEPENDENCIA DE LA FILOSOFÍA Y LA CIENCIA

Capítulo 5

Acabamos de explorar una abundante variedad de tópicos a los

que pueden aplicarse tanto los recursos de la física contemporánea

como los de la filosofía de la ciencia. La profusión de ejemplos y la

forma en que la física y la filosofía juegan un papel intrincadamente

entrelazado en su intento por llegar al fondo de las cuestiones plan

teadas deberían convencer al lector de que la física y la filosofía son

dos formas sumamente interdependientes de tratar de entender el

mundo y nuestro lugar como conocedores del mismo.

Tradicionalmente, la filosofía ha intentado describir la naturaleza

del mundo en términos de máxima generalidad. Eludiendo la des

cripción pormenorizada y la clasificación del gran número de fenó

menos de la naturaleza, dejando esto como cometido a las ciencias

especiales, la filosofía se ha preocupado por la naturaleza del ser a

los niveles de máxima abstracción. ¿Existen particulares solamente, o

debemos postular universales, propiedades, como dotados de una

existencia propia? ¿Se agota la sustancia del universo en el ser mate

rial, o debemos también tolerar un reino de existencia no material a

fin de dar cuenta de los fenómenos de la mente? Éstas son las clases

de preguntas que esperamos que planteen los filósofos.

La filosofía también ha considerado de su incumbencia el exa

men crítico de las ciencias específicas. Aunque la ciencia infiere la

naturaleza del futuro y de lo inobservado a partir de los datos limita

327


dos de que disponemos por las observaciones realizadas hasta el mo

mento, la filosofía se interesa por la justificación del razonamiento in

ductivo que permite la proyección de un supuesto conocimiento más

allá del reino de lo observado. La ciencia reúne los resultados de ob

servaciones, resultados gestados en los términos derivados en último

término del lenguaje de la experiencia cotidiana. Después explica

estos resultados haciendo referencia a un dominio de entidades teóri

cas inobservadas y de propiedades de las mismas. La filosofía, por

contraste, inquiere sobre la legitimidad de dicha extrapolación allen

de el reino de lo observable al reino de lo inobservable. ¿Cómo pue

den racionalizarse o justificarse dichas inferencias? Profundizando

aún más, ¿cómo pueden los conceptos que pretenden hacer referen

cia a lo inobservable tener siquiera un significado para nosotros, da

do el papel que supuestamente juega la asociación de un concepto

con la experiencia en la fundamentación del significado?

La filosofía de la ciencia es a menudo caracterizada por reservar

para sí cuestiones en el reino de la metodología. Mientras la acumu

lación real de resultados observacionales y su asimilación en teorías

explicativas generales ha de ser la tarea del científico en su disciplina

especial, es el filósofo de la ciencia quien ha de explorar los métodos

con los que la ciencia acomete su tarea. ¿Cómo se formulan, com

prueban, aceptan y recusan las teorías en la ciencia? ¿Qué papel jue

ga la confrontación con los datos? ¿Qué papel juegan elementos tales

como la simplicidad ontológica o la elegancia formal en el proceso

continuo de construcción y selección de teorías? ¿Cuáles son los me

dios con los que el científico ofrece un entendimiento del mundo so

bre la base de observaciones y teorización? ¿Cómo son las explicacio

nes formuladas por el científico? ¿Cuáles son los recursos tras los

esquemas explicativos, y de qué manera la existencia de una explica

ción científica nos aporta un mayor entendimiento de la naturaleza

del mundo? Pero, como hemos visto, la necesidad de teorías revolu

cionarias en la física que traten de los fenómenos de la naturaleza a

los niveles de mayor generalidad y de mayor profundidad ha obliga

do a los propios científicos a confrontar cuestiones del tipo justamen

te que han sido tradicionalmente reservadas a los filósofos.

Cuando estamos tratando con las cuestiones más fundamentales

concernientes al espacio y el tiempo y al lugar que ocupan en la na

turaleza, las cuestiones concernientes al tipo de ser que puede existir

y que puede ser invocado en nuestras descripciones explicativas pa

Reflexiones sobre la interdependencia de la filosofía y la ciencia 329

san a un primer plano. Esto era ya obvio en el siglo xvn cuando,

como hemos visto, pensadores de la talla de Newton y Leibniz force

jearon con las cuestiones metafísicas que parecían inextricables des

de sus concepciones sobre la naturaleza del espacio y el tiempo. Aho

ra, con las revoluciones en nuestras concepciones del espacio y el

tiempo a las que nos hemos visto forzados por la teoría especial de la

relatividad y la teoría general de la relatividad, estas viejas cuestiones

sobre la substantividad del espacio y el tiempo han resurgido. Pro

fundizando aún más, como hemos visto, pensadores tales como Bohr,

confrontados con los extraños fenómenos a los que la mecánica

cuántica debe hacer justicia, han encontrado necesario ocuparse de

cuestiones concernientes a la objetividad misma del mundo como

una entidad supuestamente independiente de las acciones acometi

das por quienes intentan llegar a conocer su naturaleza. Las viejas

cuestiones filosóficas de la autonomía del mundo respecto a nuestra

comprensión sensible e intelectual del mismo, cuestiones con las que

se debatió, por ejemplo, Kant, pasan a formar parte de una tentativa

de entender el formalismo de la teoría diseñado para tratar los insóli

tos hechos sobre la interacción de la materia con la radiación de los

que la mecánica cuántica debe ocuparse.

Hemos visto asimismo que el enfoque epistemológico crítico de

la filosofía ha jugado un papel en los fundamentos de algunas de

estas teorías físicas contemporáneas. Aunque los espacio-tiempos re

volucionarios de las teorías especial y general de la relatividad surgen

en parte de la necesidad de nuevas descripciones del espacio y el

tiempo que hagan justicia a los hechos experimentales recientemente

descubiertos acerca del comportamiento de la luz, el movimiento de

las partículas, y los resultados de mediciones con relojes y varas de

medir, un papel igualmente importante en la formulación de estas

teorías es jugado por el examen crítico de los conceptos desde el

punto de vista epistémico. Este programa crítico alcanza su culmina

ción en el trabajo de Einstein. Einstein nos incita una y otra vez a la

discusión teórica pidiéndonos que reflexionemos sobre el significado

de nuestros términos básicos referentes al espacio y al tiempo. Nos

pide que consideremos el funcionamiento de estos términos en nues

tras teorías, haciendo especial hincapié en el grado en que nuestras

teorías aceptadas están fundamentadas en hechos del mundo que

nos son verdaderamente accesibles epistémicamente. Haciendo uso

de un examen crítico de los términos e hipótesis que depende de


una exploración de los límites de nuestra conciencia epistémica del

mundo, Einstein revigoriza las teorías físicas a nuestra disposición

para tratar de la estructura espacial y temporal del mundo. En la ten

tativa de resolver las características aparentemente paradójicas del

mundo que nos describe la mecánica cuántica, encontramos de nue

vo pensadores como Bohr y Heisenberg intentando convencernos de

que un entendimiento correcto de la teoría, y del mundo que ésta

describe, nos exige dar marcha atrás y reflexionar sobre nuestra capa

cidad de llegar a conocer el mundo. Esta reflexión se hace desde una

perspectiva crítico-epistemológica.

A modo de ejemplo de cómo los resultados de la física requieren

un replanteamiendo de algunas cuestiones metodológicas, podríamos

considerar la forma en que la mecánica estadística muestra que hay

modos de explicación de los fenómenos que parecen requerir mode

los de explicación estadística de sorprendente originalidad. El papel

de las probabilidades en la mecánica estadística, la razón de su atri

bución a los microestados de ciases particulares de sistemas, su papel

en dar cuenta de los fenómenos macroscópicos de los que se ocupa

la termodinámica, y la relación de estas probabilidades con las conse

cuencias de tipo estadístico derivadas de las leyes de la dinámica

subyacentes, todo esto muestra la pertinencia de un replanteamiento.

Debemos pensar enérgicamente sobre la relación de las condiciones

iniciales con las leyes, y sobre el papel que ambas juegan en la expli

cación de por qué sucede lo que sucede en el mundo. Hemos visto

también cómo las consecuencias de la mecánica cuántica, como las

pruebas de imposibilidad de variables ocultas locales, sugieren que la

ciencia nos ha impuesto una nueva actidud hacia lo que constituye

una explicación completa de las correlaciones descubiertas entre

unos fenómenos y otros cuando estos fenómenos no están en interac

ción causal en el momento en que ocurren. De hecho, la naturaleza

mismj de la causalidad y cómo ésta ha de ser buscada e invocada en

la ciencia adquieren una apariencia diferente en el contexto cuántico.

No podemos esperar, pues, hacer filosofía sin referencia a los re

sultados de la física. Que esto es cierto para la metafísica, la investiga

ción en la naturaleza del mundo a los niveles de la mayor generali

dad, parece de lo más obvio. Es evidente que nuestro entendimiento

de las clases fundamentales de cosas y propiedades que debemos

postular para abarcar la naturaleza del mundo debe tomar en cuenta

lo que la ciencia nos dice sobre el mundo. Repetidas veces la filoso


fía que intenta razonar a priori, con independencia de los datos de la

observación y el experimento, y llegar a conclusiones sobre cómo

debe ser el mundo, se ha visto turbada por las revelaciones de la

ciencia. Esto nos ha hecho ver lo limitada que ha sido la imaginación

de los filósofos aprioristas al pretender delimitar el reino de las posi

bilidades para la naturaleza del mundo. Sin los resultados de la física,

¿qué filósofo habría considerado la amplia variedad de posibilidades

para la naturaleza del espacio y el tiempo, de la causalidad, y de las

clases de objetividad y su carencia que las recientes teorías radicales

de la física han postulado como posibilidades para nuestra considera

ción?

Pero no es la metafísica la única que debe prestar atención a los

resultados de la ciencia. Muchos filósofos de la teoría del conoci

miento han argumentado en los últimos años que la esperanza en

una teoría racionalizada y apriorísticamente formulada de la inferen

cia a la verdad es también una proposición dudosa. Al decidir cuáles

son las reglas razonables para ser utilizadas en desentrañar la verdad,

han argumentado, debes valerte de tus mejores intuiciones sobre la

naturaleza del mundo cuyas verdades estás intentado desvelar. Pero,

si esto es así, sin duda debemos tomar en consideración esas teorías

de las ciencias, sea la física fundacional o la neuropsicología y las

ciencias cognitivas de la percepción y el pensamiento, que nos dicen

lo que sabemos sobre la naturaleza del mundo que estamos intentan

do descubrir y sobre nuestra relación con el mismo como percepto

res y teorizadores. Como hemos visto, nuestra misma noción de lo

que significa comprender ese mundo, entender sus mecanismos y

aportar descripciones explicativas de lo que sucede en él dependerá

mismamente de la propia naturaleza de ese mundo. Así, en sus come

tidos epistemológicos y metodológicos, la filosofía necesitará referirse

continuamente a lo que las ciencias avanzadas, incluyendo la física

fundacional, nos dicen sobre el mundo.

Es importante observar que esta dependencia respecto a las cien

cias no es una mera dependencia de las mismas como fuentes de

datos básicos solamente. Por supuesto, los resultados observacionales

que empujan a la ciencia de la física a la invención de las radicales y

noveles teorías que hemos estado examinando son cruciales en lo

que a su impacto sobre la filosofía respecta. Pero también la capaci

dad de los practicantes de estas ciencias de imaginar nuevos esque

mas conceptuales que toman en cuenta los nuevos datos proporciona


a la filosofía un espectro de incomparable riqueza de nuevas formas

conceptuales de tratar con el mundo. Las imaginaciones de científi

cos como Boltzmann, Einstein y Bohr son la fuente de formas de

pensamiento completamente nuevas acerca de la naturaleza de la rea

lidad, nuestro conocimiento de ella y nuestra capacidad para dar una

descripción explicativa de la misma. Ellas proporcionan una fuente in

comparablemente fértil de enriquecimiento al filósofo que busca

nuevas formas de tratar los problemas tanto viejos como nuevos, pre

sentados por el mundo de la experiencia.

Pero si la filosofía debe prestar una atención detenida a los resul

tados de la física fundacional, está claro que la física fundacional pre

senta a su vez una dependencia de la filosofía. Al explorar las raíces

de las teorías fundacionales en el corazón de la física moderna, he

mos visto una y otra vez que la formulación de estas teorías no se re

duce a una extrapolación trivial por un razonamiento obvio de los

datos observacionales. Antes bien, la formulación de una teoría apro

piada y la justificación suministrada por esa elección, cuando se

adopta una postura teórica particular y se defiende contra las críticas,

depende de los tipos de razonamiento que los filósofos han explora

do y debatido. Esto puede verse claramente, por ejemplo, en las justi

ficaciones tras las teorías especial y general de la relatividad ofrecidas

por Einstein y en las tentativas de Bohr por proporcionar un enten

dimiento coherente del formalismo de la mecánica cuántica. Aquí

cuestiones filosóficas tales como la indistinción entre las consecuen

cias de una teoría comprobables por la observación y aquellas inmu

nes a la confrontación; el papel del examen crítico de los significados

de los conceptos no observacionales de las teorías; la justificación de

principios para la elección de teorías que descansan en consideracio

nes como la de simplicidad ontológica; la conveniencia de generaliza

ciones para proporcionar explicaciones auténticas de los fenómenos;

y la cuestión de cuándo una explicación puede ser considerada defi

nitiva, juegan todas ellas un papel crucial en el seno de la dialéctica

científica que lleva a la formulación y aceptación de teorías. Es como

si cuestiones tradicionalmente filosóficas tuviesen que pasar a formar

parte del pensamiento científico mismo cuando las teorías científicas

bajo consideración son de una generalidad y fundamentalidad tan

notables como las que hemos discutido en los capítulos precedentes.

En cierta época, los físicos teóricos recibían normalmente una

formación en filosofía y su historia. En aquellos tiempos, podía en


contrarse referencia explícita al tipo de razonamiento filosófico que

respaldaba el razonamiento físico en los trabajos de algunos de los

grandes científicos. Einstein y Bohr proporcionan dos ejemplos no

tables. Aunque la especialización de la formación académica en las

décadas recientes ha hecho que dicha familiaridad con la filosofía

tradicional sea menos habitual entre los científicos, incluidos los

científicos más teóricos, la necesidad del tipo de pensamiento filosó

fico que hemos venido discutiendo como parte del pensamiento

científico se ha hecho ahora clara. Esto es así independientemente de

que el científico quiera o no afrontar el hecho. Evidencia de ello

puede verse en el tipo de pensamiento cuasi-filosófico que ha pasado

a formar parte de la especulación cosmológica y la teorización sobre

el big bang en la cosmología científica.

El hecho de que las teorías científicas mismamente estén basadas

en un pensamiento de tipo filosófico, ya se haga esto explícito en la

historia científica o sólo implícito y esperando a ser desenterrado por

el historiador y el filósofo, significa también que uno debe estar aler

ta ante la tentativa demasiado ingenua de resolver cuestiones filosófi

cas tradicionales haciendo referencia a los resultados de la ciencia.

Los argumentos en el sentido de que un resultado dado de la ciencia

resuelve conclusivamente una cuestión filosófica tradicional en una

dirección u otra pierden de vista con demasiada frecuencia la forma

en que ciertas presuposiciones filosóficas implícitas se han insertado

en la teoría que está siendo utilizada para resolver el debate. Si se hu

bieran hecho otras elecciones filosóficas en la ciencia misma, las im

plicaciones de la ciencia para la filosofía podrían parecer de hecho

muy diferentes.

En cualquier caso, está bastante claro que en sus niveles de máxi

ma generalidad y en sus tentativas de tratar a la naturaleza en su ni

vel más fundamental, la ciencia es una disciplina que en su naturale

za no puede ser diferenciada radicalmente de la filosofía. Y la mejor

forma de hacer filosofía es utilizar un método que, como la ciencia,

siempre remita en su teorización a la naturaleza de las cosas según

nos es revelada por esa refinada experiencia que llamamos observa

ción científica y experimento.

BIBLIOGRAFÍA

Albert, D., y B. Loewer (1990), «Wanted Dead or Alive: Two Attempts to

Solve Schródinger’s Paradox», en Fine, M. Forbes y L. Wessels eds.,

PSA-1990, vol. 1. East Lansing, MI, Philosophy of Science Association.

Alexander, H., ed. (1956), The Lebtiiz-Clarke Correspondence, Manchester,

Manchester University Press.

Anderson, J. (1967), Principies of Relativity Pbysics, Nueva York, Academic

Press (*).

Arnold, V., y A. Avez (1968), Ergodic Problems of Classical Mechanics, Nueva

York, Benjamín (**).

Barbour, J. (1989), Absolule or Relative Motion?, vol. 1, The Discovery of Dynamics, Cambridge, Cambridge University Press.

Batterman, R. (1990), «Irreversibility and Statistical Mechanics: A New Ap-

proach?», Philosophy of Science, 57, 395-419.

— (1991), «Randomness and Probability in Dynamical Theories: On the

Proposals of the Prigogine School», Philogophy of Science, 57, 241-263.

Belinfante, F. (1973), A Survey of Hidden Variable Theories, Nueva York, Per-

gamon (*).

Bell, J. (1987), Speakable and Wnspeakable in Quantum Mechanics, Cambridge,

Cambridge University Press.

Bohm, D. (1951), Quantum Theory, Englewood Cliffs NJ, Prentice-Hall (*)•

— (1989), The Epecml Theory of Relativity, Reading, MA, Addison-Wesley.

Las obras que requieren algún conocimiento previo de matemáticas y física teórica (por ejemplo, en un nivel de estudiante universitario) van señaladas con un asterisco (*). Los textos que precisan de una mayor familiaridad con conceptos técnicos ymétodos se señalan con dos asteriscos (**).

335

336 Bibliografía

Brush, S. (1965), Kinetic Theory, Oxford, Pergamon Press.

— (1976), TheKindofMotion Tbat WeCallHeat, Amsterdam, North-Holland.

Buchdahl, H. (1966), The Concepts of Classical Thermodynamics, Cambridge,

Cambridge University Press (*).

Cramér, H. (1955), The Elements of Probabihty Theory and Some of Its Applications, Nueva York, John Wiley.

Davies, P. (1974), The Physics of Time Asymmetry, Berkeley, University of Cali

fornia Press.

D ’Espagnat, B. (1971), Conceptual Foundations of Quantum Mechanics, Menlo

Park, CA, Benjamín (**).

Devaney, r. (1986), An Introduction to Chaotic Dynamical Systems, Menlo Park,

CA, Benjamin-Cummings (**).

Dicke, R., y J. Wittke (1960), Introduction to Quantum Mechanics, Reading,

MA, Addison-Wesley (*).

Dirac, P. (1930), The Principies of Quantum Mechanics, Oxford, Oxford Uni

versity Press (*).

Earman, J. (1974), «An Attempt to Add a Little Direction to 'The Problem of

the Direction of Time’», Phylosophy of Science, 41, 15-47.

— (1986), A Primer ofDeterminism, Dordrecht, D. Reidel.

— (1989), World-Enough andSpace-Time, Cambridge, MA, MIT Press.

Eddington, A. (1920), Space, Time and Gravitation, Cambridge, Cambridge

University Press.

Ehrenfest, P., y T. Ehrenfest (1959), The Conceptual Foundations of the Statisti- calApproach in Mechanics, Ithaca, NY, Cornell University Press (*).

Einstein, A., et al. (1923), The Principie of Relativity, Nueva York, Dover.

Farquhar, I. (1964), Ergodic Theory in Statistical Mechanics, Nueva York, John

Wiley (*).

Feller, W. (1950), An Introduction to Probability Theory and Its Applications, Nueva York, John Wiley (*).

Friedman, M. (1983), Foundations of Space-Time Theories, Princeton, Princeton

University Press (*).

Geroch, R. (1978), General Relativity from A to B, Chicago, University of Chi

cago Press.

Ghirardi, G., A. Rmini y M. Weber (1986), «Unified Dynamics for Microsco

pio and Macroscopic Systems», Physical Review, D 34, 470-479 (*).

Gibbins, P. (1987), Particles and Paradoxes, Cambridge, Cambridge University

Press.

Gibbs, J. (1960), Elementary Principies in Statistical Mechanics, Nueva York,

Dover (*).

Gleick, J. (1987), Chaos: Mabinga New Science, Nueva York, Penguin Books.

Gottfried, K. (1960), Quantum Mechanics, Nueva York, Benjamín (*).

Graves, J. (1971), The Conceptual Foundations of General Relativity Theory, Cambridge, MA, MIT Press.

Bibliografía 337

Grünbaum, A. (1973), Philosophical Problems of Space and Time, 2d ed., Dor-

drecht, Reidel.

Hawking, S., y G. Ellis (1973), The Large Scale Structure of Space-Time, Cam

bridge, Cambridge University Press (**).

Healy, R. (1989), The Philosopby of Quantum Mecbanics, Cambridge, Cambrid

ge University Press.

Heisenberg, W. (1930), The Physical Principies of the Quantum Theory, Nueva

York, Dover.

Hobson, A. (1971), Concepts in Statistical Mecbanics, Nueva York, Godon and

Breach.

Horwich, P. (1983), Asymmetries in Time, Cambridge, Massachusetts, M IT

Press. , ,

Hughes, R. (1989), The Structure and Interpretation of Quantum Mecbanics, Cam

bridge, Massachusetts, Harvard University Press.

Humphreys, P. (1989), The Chances of Explanation, Princeton, Princeton Uni

versity Press.

Jammer, M. (1954), Concepts of Space, Cambridge, Cambridge University Press.

— (1966), The Conceptual Development of Quantum Mecbanics, Nueva York,

McGraw-Hill.

— (1974), The Philosopby of Quantum Mechanics, Nueva York, John Wiley.

Jancel, R. (1963), Funda tío ns of Classical and Quantum Statistical Mechanics, O x

ford, Pergamon Press (*).

Jauch, J. (1968), Foundations of Quantum Mechanics, Reading, Massachusetts,

Addison-Wesley (**).

Jaynes, E. (1983), Papers on Probability, Statistics and Statistical Pbysic, Dor-

drecht, Reidel.

Jordán, R. (1969), Linear Operators for Quantum Mechanics, Nueva York, John

Wiley (*).

Kant, I. (1929), The Critique of Puré Reason, trad. de M. Kemp Smith, Nueva

York, Macmillan.

— (1950), Prolegomenon to Any Future Metaphysic, Nueva York, Liberal Arts

Press.

Katz, A. (1967), Principies of Statistical Mechanics, San Francisco, Freeman (*).

Kochen, S. (1985), «A New Interpretation of Quantum Mechanics». En P.

Lahti y P. Mittelstaedt, eds. Symposium on the Foundations of Modem Physics, Teaneck, NJ, World Scientific Publishing (*).

Kolmogorov, A. (1950), Foundations of the Theory of Probability, Nueva York,

Chelsea (*).

Krylov, N. (1979), Works on the Foundations of Statistical Physics, Princeton,

Princeton University Press.

Kyburg, H. (1970), Probability and Inductive Logic, Londres, Macmillan.

Lucas, J., y P. Hodgson (1990), Spacetime and Electromagnetism, Oxford, O x

ford University Press.

338 Bibliografía

Luwig, G. (1968), W'ave Mechanics, Oxford, Pergamon Press.

Mehlberg, H. (1980), Time, Causality and the Quantum Theory, Dordrecht, D.

Reidel.

Mellor, D. (1981), Real Time, Cambridge, Cambridge University Press.

Misner, C., K. Thorne y J. Wheeler (1973), Gravitation, San Francisco, Free-

man (**).

Moller, C. (1952), The Theory of Relativity, Oxford, Oxford University

Press (*)•

Nerlich, G. (1976), The Shape of Space, Cambridge, Cambridge University

Press.

Newton-Smith, W. (1980), The Structure ofTime, Londres, Routledge and Ke-

gan-Paul.

Pagels, J. (1982), TheCosmicCode, Nueva York, Bantam Books,

Pensorse, R. (1979), «Singularities and Time Asymmetry». En S. Hawking y

W. Israel, eds., General Relativity: An Einstein Centenary Survey, Cambridge,


Pippard, A. (1961), The Elements of Classical Thermodynamics, Cambridge,


Poincaré, J. (1952), Science and Hypothesis, Nueva York, Dover.

Prigogine, I. (1980), Frotn Being to Becoming, San Francisco, Freeman.

— (1984), Oder Out of Chaos, Nueva York, Bantam Books.

Putnam, H. (1967), «Time and Physical Geometry», Journal of Philosophy, 64,

240-247.

Rae, A. (1986), Quantum Physics: IIlusión or Reality?, Cambridge, Cambridge

University Press.

Reichenbach, H. (1944), Philosophic Foundations of Quantum Mechanics, Berke-

ley, University of California Press.

— (1956), TheDirection ofTime, Berkeley, University of California Press.

— (1958), The Philosophy of Space and Time, Nueva York, Dover.

Rietdijk, C. (1966), «A Rigorous Proof of Determinism from the Special

Theory of Relativity», Philosophy of Science, 33, 341-344.

Ridnler, W. (1977), EssentialRelativity, Nueva York, Springer-Verlag (*).

Salmón, W. (1984), Scientific Explanation and the Causal Structure of the World, Pripceton, Princeton University Press._

Schoroeder, M. (1991), Fractals, Chaos, Power Laws, Nueva York, Freeman (*).

Sinai, Y. (1976), Introduction to Ergodic Theory, Princeton, Princepton Univer

sity Press (**).

Sklar, L. (1974), Space, Time, and Spacetime, Berkeley, University of California

Press.

— (1985), Philosophy and Spacetime Physic, Berkeley, University California Press.

— De próxima publicación, The Physics of Chance, Cambridge, Cambridge

University Press.

Smart, J., ed. (1964), ProblemsofSpace and Time, Nueva York, Macmillan.

Bibliografía 339

Squires, E. (1986), The Mystery of the Quantum World, Bristol, Adam Hilger.

Stein, J. (1991), «On Relativity Theory and Openness of the Future», Philo-

sophy of Science, 57, 147-167.

Synge, J. (1956), Relativity: the Special Theory, Amsterdam, North-Holland (*).

Taylor, E., y J. Wheeler (1963), Spacetime Physics, San Francisco, Freeman.

Tolman, R. (1934), Relativity, Thermodynamics and Cosmology, Oxford, Oxford

University Press.

— (1938), The Principies of Statistical Mechanics, Oxford, Oxford University

Press (*).

Toretti, R. (1978), The Philosopby of Geometry from Riemann to Poincaré, Dor-

drecht, Reidel.

— (193), Relativity and Geometry, Oxford, Pergamon Press (*).

Van Fraasen, B. (1970), An Introduction to the Philosopby of Time and Space, Nueva York, Random House.

— (1991), Quantum Mechanics: An Empiricist View, Oxford, Oxford Univer

sity Press (*).

Von Neumann, J. (1955), Mathematical Foundations of Quantum Mechanics, Princeton, Princeton University Press (**).

Wald, R. (1984), General Relativity, Chicago, University of Chicago Press (*).

Wheeler, J., y W . Zurek, eds. (1983), Quantum Theory and Measurement, Prin

ceton, Princeton University Press (*).

Winnie, J. (1977), «The Causal Theory of Space-Time», en J. Earman, C.

Glymour y J. Stachel, eds., Foundations of Space-Time Theories, Minnesota Studies in the Philosopby of Science, vol. 8, Minneapolis, University of M in

nesota Press.

ÍNDICE ANALÍTICO

Aceleracióny espacio-tiempo de Minkowski, 60,

62 (figura), 64, 115-116

y espacio-tiempo neo-newtoniano, 66

y gravedad, 67, 68, 69, 70, 71, 99-1003 teoría de Newton, 42, 67, 115-116

y teorías de la relatividad, 44-45. 47, 60, 61 (figura), 64-65

Véase también movimiento y velocidad de la luz, 47-50, 52, 94, 98

Véase también luz, naturaleza de la

Aditividad contable, 142

Agujeros negros, 82, 83

Albert, D., 282 Antirrelacionismo, 42-47

Aristóteles, 13, 14, 39, 152,219 Aritmética, 29, 30, 31, 32

Asimetría temporaly aproximación al equilibrio, 196-197,

201,202,203 y asimetría entrópica, 217-219, 224-

227y cosmología, 209-214, 215

y macróentropía, 221-222

y mezcla, 202-203 y preparación, 206-207

y modelo de Prigogine, 206, 208

y teoría cuántica de campos, 193, 194,

195y teoría de Krylov, 207 en termodinámica, 167-168, 174-176,

180-181, 191, 192, 193, 224 Astronomía, 28, 50, 67-68. Véase también

movimiento planetario Átomos, 233-240. Véase también mecánica

cuántica, teoría cuántica

Agustín, san, 36

Bacon, F., 168Banda de Mobius, 81 (& figura)

Bell, J., 314Bernoulli, J., 168Birkhoff, G„ 285, 286Bohr, Niels, 29, 259, 260, 329, 330

acerca de la descripción cuántica, 262,

263, 298, 299, 307 y naturaleza del átomo, 236, 237, 238 Véase también Interpretación de Co

penhagueBoltzmann, L . Véase ecuación de Boltz

mann

Bo lya iJ., 72, 73Born, M., 238, 241-242, 261, 275-276

341

342 Indice analítico

Calor. VVa.it- termodinámica

Carnot, S., 165

Causalidad

asimetría de, 222-225 y asimetría entrópica, 217-218, 221-

222y condicionales contrafactuales, 222-

224y curvatura del espacio-tiempo, 79-

82y determinismo, 293-296, 322-323

y espacio-tiempo, 134-137

y explicación, 152-155, 157-161

y espacio-tiempo de Minkowslci, 64-

65, 133(figura) y mecánica cuántica, 24, 293-296, 322,

329-330 y metafísica, 31-32

y teoría cuántica, 19, 250

teorías del espacio-tiempo de Robb, 127-131

y topología del espacio-tiempo, 131- 134, 132 (figura), 133 (figura), 135

Church, A., 147

Cinemática, 45-46 Clausius, R., 165, 168

Clifford, W„ 76

Complementariedad, 252-254 Conjuntos, 175-177

Conocimiento, 14-15, 331en la filosofía griega clásica, 27-29

asimetría de, 222e Interpretación de Copenhague, 251-

255equivalencia estructural, 102-107

geometría como paradigma de, 28-30, 31, 32, 33, 85-87, 106-109

y metodología, 31, 95-97

pragmatismo, 105-107

y teoría cuántica, 261-263, 270

teorías positivistas, 99-103 y escepticismo, 30, 31, 32, 95, 99, 101,

105-106simplicidad teórica, 61-63, 64-65 Véase también explicación; medida; tó

picos específicos Conos de luz, 57-58

Contracción de longitudes, 50-52, 59

Corrimiento al rojo gravitacional, 71 (fi

gura)Críticas epistemológicas, 19-20, 134-136,

329. Véase también metodología

Curva de concentración, 172-174, 173

(figura), 191 Cosmología, 16-17, 79-83, 209-214, 333

Véase también teoría del big bang Condicionantes contrafactuales, 222-

224Curvatura del espacio-tiempo, 55

y conservadurismo metodológico, 96-

97y cosmología, 79-83

y universos vacíos, 120

y gravedad, 70-71, 75-81, 78 (figura), 83-85

y geometrías no-euclídeas, 72-81

y hechos observables, 94-95 y simplicidad teórica, 98-99

Véase también relatividad, teoría gene

ral de la

De Broglie, L ., 234 De Laplace, P. S., 123-124, 125, 293

Descartes, René, 226

Determinismoargumento de inseparabilidad de

Einstein-Podolsky-Rosen, 307-314,

310 (figura) y causalidad, 293-295, 222-223

y física clásica, 292, 293, 294 e Interpretación de Copenhague, 297-

300, 307-309, 321

Teorema de Bell, 314-323

y teoría general de la relatividad, 123- 127

y mecánica cuántica, 126, 295-306, 305 (figura), 307-309, 321-324

teoría de von Neumann, 299-301, 302-303

Dinámica, 21, 46, 169, 249-253, 263, 264

Dios, 41,42Dirac, P., 249-250, 256, 285-286

Distribución de materia, 121-122

Distribuciones compuestas, 284

Indice analítico 3-43

Ecuación de Boltzmann, 168-173, 173 (figura), 182

y cosmología, 209, 210, 212

y curva de concentración, 173-174, 173 (figura), 191

y dirección del tiempo, 172, 173, 214, 216-227

clarificación por los Ehrenfest, 170, 189, 191, 202

y concepción ergódica, 175-180

derivación rigurosa de la, 201, 202- 203

e Hipótesis Relativa a los Números de

Colisión, 179-180, 191-192

y naturaleza de la luz, 233-234

y Ley de Wien, 233-234

Eddington, A., 226-227 Efecto Doppler, 70

Efecto fotoeléctrico, 234 Ehrenfest, P , 170, 189, 191, 202

Ehrenfest, T„ 170, 189, 191, 202

Einstein, Aibert, 20, 21, 46, 47, 70, 224, 234, 259, 260

acerca de la Interpretación de Copen

hague, 251, 254 acerca del determinismo, 297, 307,

308, 309argumento de inseparabilidad, 307-

314, 310 (figura)Véase también entradas a relatividad; es

pacio-tiempo

Electromagnetismo, 21, 118, 123-124, 218-219, 225,233

Elliot, T. S., 293Energía de conservación, Véase Primera

Ley de la Termodinámica

Entropía, 195,210, 220, 221asimetría de la, 210, 211, 213, 216-

220, 222, 226-228 véase también asimetría temporal

Equivalencia estructural, 102-105 Equivalencia masa-energía, 61, 123

Escepticismo, 30, 31, 32, 33, 95-96, 99- 101, 105-106

Espacio, 22-23, 32-34como continente de la materia, 34-35,

39-41, 43-44, 45-47

y estados de equilibrio, 174-176

y teoría general de la relatividad, 24, 328, 329

y gravedad, 68-69

teoría de Leibniz, 38-42

y metafísica, 110-112

teoría de Newton, 42, 44, 45, 46, 54,

58, 61, 64, 115, 116 no orientabilidad, 81-82

teoría de Poincaré, 88-89, 91-92 y posibilidad, 40, 41, 42, 43

y teoría especial de la relatividad, 19,

47-55, 328-329 Véase también entradas a geometría; mo

vimiento; entradas a relatividad; es

pacio-tiempo

Espacio-tiempo, 55-65, 56 (figura)y asimetría entrópica, 210-211, 216-

219y causalidad, 64-65, 80-81, 127-137,

132 (figura), 133 (figura)y cuestiones epistemológicas, 329,

330,331

y metafísica, 111-138 neo-newtoniano, 65-67, 82-83

y debate sustantivista-relacionista, 123-127

y teoría machiana, 118-122

topología de, 130-134, 132 (figura),

133 (figura), 134-135Véase también curvatura del espacio-

tiempo; entradas a relatividad

Espacio-tiempo de Minkowski, 55-64, 56

(figura)y aceleración, 61, 62 (figura), 64, 115-

117y causalidad, 63-64, 133 (figura) y determinismo, 125

y espacio-tiempo neo-newtoniano, 65, 82-83

y geometría, 57-58, 66, 78

y teoría general de la relatividad, 121

Espacio-tiempo galileano. Véase espacio- tiempo neo-newtoniano

Espacio-tiempo neo-newtoniano, 64-67,

83Espectroscopia, 309-310

Estados de equilibrio, 165-167

y cosmología, 209-214

344 índice analítico

concepciones ergódicas, 175-181, 177

(figura), 181-185, 186 (figura), 187, 188

explicación de, 146-147

Teorema KAM , 186 (figura), 186-189, 200

y teoría cinética del calor, 168-176, 170 (figura), 171 (figura), 172 (figura)

Véase también estados de equilibrio, aproximación a los

Estados de equilibrio, aproximación a los, 189-191, 190 (figura)

y aislamiento de sistemas, 191-193 experimento del eco-espín, 192-193,

194 (figura) y cosmología, 209-214

problema de la distribución inicial de

probabilidad, 202-210, 204 (figura) mezcla, 198-203, 199 (figura), 206-207 teorías no estándar, 191-196

Postulado de Caos Molecular, 179,181, 191, 197

modelo de Prigogine, 206, 207, 208

teorías estándar, 195-203

Véase también estados de equilibrio Euclides, 72, 73 Véase también geometría

Everett, H., 280, 281

Experimento de la doble trayectoria, 242-244, 245 (figura)

Experimento de las dos rendijas, 242- 243, 244 (figura), 247, 260-261, 265-266, 290-291

y lógica, 284-285, 289-290

Experimento de Michelson-Morley, 49, (figura)

Experimento del eco-espín, 193, 194 (figura)

Experimento de Stern-Gerlach, 246, 248 (figura), 263, 271,278

Explicación, 155-163, 187, 214-215. Véase también conocimiento

Filosofía

historia de, 13-16, 21, 27-31

importancia de la física para, 21-24, 331-334

y física moderna, 16-22 y ciencia, 13-16, 327-333

Véase también tópicos específicos Filosofía griega clásica, 13, 14, 27-29, 292.

Véase también filósofos específicos Fuerzas inerciales, 43, 45-47, 115-117,

118-120. Véase también aceleración; movimiento

Galilei, Galileo, 42, 47, 53, 61, 67, 68, 87

Gato de Schródinger, 268 (figura), 268- 270, 271

Gauss, K .F., 72, 73, 74, 82

Generalización, 160-162, 180, 295. Véase también conocimiento; metodología, reducción

Geodésicas, 77, 78 (figura), 79-80, 82-84, 94, 101-102

Geometría. Véase geometría euclídea; geometría no-euclídea; conocimiento

Geometría euclídea

como paradigma del conocimiento, 29-30,31-33,85-87, 107-108

y espacio-tiempo de Minkowski, 56, 57, 58, 64, 65, 66

y naturaleza del espacio, 34-35, 41-42, 45-46

teoría de Poincaré, 88-91

Geometría no-euclídea, 70-83

y conocimiento, 85-87, 107-109

teoría de Poincaré, 88-96, 100 y teoría especial de la relatividaár'7’8-

79, 107-108

G ibb sJ ., 176, 189, 190, 197 Gleason, A., 303

Gódel, K., 121, 122 (figura)Gravedad

y aceleración, 67, 68, 69, 98-100

V curvatura del espacio-tiempo, 70, 75-80, 78 (figura), 82-84

y entropía, 210, 211, 217-219

y hechos observables, 92-93, 95-97

y mecánica estadística, 191-192

y dilatación del tiempo, 72-73, 79-80

Véase también relatividad, teoría general de

Grecia. Véase filosofía griega clásica

Indice analítico 345

Hechos observables, 22-23, 47, 108-109,254, 331

y conocimiento, 27, 29-30, 31, 87, 88, 89-92

y estados de equilibrio, 172-174

y gravedad, 92, 95-97

y lenguaje, 99-102 teoría de Poincaré, 88-91, 93-96, 98

y Principio de incertidumbre, 21-22, 205

Véase también conocimiento; medida; tópicos específicos

Heisenberg, W„ 237, 238, 239, 249, 256, 257, 258, 285, 330. Véase también P rin c ip ió le Incertidumbre

Herepath, J., 168Hipótesis ergódica, 176-178, 177 (figura),

183-184Hipótesis Relativa a los Números de Co

lisión, 179, 191-192

Hume, David, 30, 31, 153, 159, 294 Huyghens, C., 232

Inferencia, reglas de. Véase generalización; conocimiento; metodología; hechos observables; reducción

Interacción mente-cuerpo, 270, 274, 275, 282

Interferencia, 241-249, 262, 269, 273, 275, 276, 290-291,324

Interpretación de Copenhague, 21, 251 -

255, 283, 291y argumento de inseparabilidad de


311,312-315 y determinismo, 297-299, 307-309,

320-321y distribuciones compuestas, 284-285

e interpretación por interacción de

Kochen, 277, 279

e interpretaciones de «muchos mundos», 280, 281

y la medición como interacción física, 271-272, 274-275, 276

Respuesta de Schródinger, 266-269

Interpretación de las «muchas mentes», 282

Intervalo temporal coordenado, 60-61

Irreversibilidad, 215-217y enfoques ergódicos, 182-185 y teorema KAM , 185, 186, 187, 198

y teoría cuántica de campos, 192-194 Véase también estados de equilibrio,

aproximación a; asimetría temporal.

Jordán, P., 238

Kant, Immanuel, 14, 30, 31, 46, 329

acerca de la causalidad, 31, 294-295 y geometrías no-euclídeas, 85-87, 88,

89, 107-108

Kepler, Johannes, 67, 68, 80

Kochen, S„ 277, 279, 283, 303 Krónig, A., 168

Krylov, N , 204, 205

Lenguaje, 100-103, 104-106

Ley Cero, 167Ley de irreversibilidad. Véase Segunda

Ley de la Termodinámica Ley de Planck, 234, 236

Ley de un gas ideal, 168-169

Ley distributiva, 286-287 Ley de Rayleigh-Jeans, 234

Ley de Wien, 233, 234 Leyes de los Grandes Números, 143,

144, 145, 183 Leibniz, Gottfried Wilhelm von, 14, 46,

125, 294, 329 y causalidad, 128, 129, 130, 131, 135,

322y espacio-tiempo, 38-42, 115-117

Lewis, D , 222, 223Lím ite de Grado de Boltzmann, 201,

202, 203

Lobachevsky, N .I., 72, 90 Locke, John, 277

Loewer, B., 282

Lógica, 14, 283-289

Lógica booleana, 286-289

Lorentz, H., 20

Loschmidt, J., 171 (figura)


Luz

naturaleza de la, 231-241, 236 (figura), 323-324

velocidad de la, 46-53, 62-63, 94, 98-99

Mach, E , 45, 118

Macroentropía, 220-222

Matemáticas, 14, 29, 30, 31, 32, 46, 238, 239, 278, 279

Maxwell, J. C„ 47, 99, 168, 169, 175, 233, 234

Mecánica cuántica, 20-21, 180-181, 329-

330Teorema de Bell, 314-322 argumento de inseparabilidad de


310 (figura) y asimetría temporal, 193 y causalidad, 24, 294-295, 322, 323,

330y determinismo, 124-125, 294-306,

305 (figura), 307-309, 321-324

y distribuciones compuestas, 284

e interpretación de Kochen, 277-279 y lógica, 285-286

medida, 193, 262-264 Principio de Incertidumbre, 21,205,321

Véase también teoría cuántica

Mecánica estadística, 160-164, 187-188, 191-192, 215, 329. Véase también estados de equilibrio; estados de

equilibrio, aproximación a Medida, 248-255, 260-265


argumento de inseparabilidad de

Einstein-Podolsky-Rosen, 307-314, 3,10 (figura)

y asimetría temporal, 192-193 como interacción física, 255-256, 271-

277, 282como interacción mente-mundo, 270-

271,274-275 y determinismo, 293, 296-299

e interferencia, 262, 268, 273-276, 277-278, 323-324

interpretación de las «muchas men

tes», 282-283

interpretación de los «muchos mundos», 279-280, 323-324

interpretación por interacción de Ko chen, 277-279, 282

interpretaciones idealistas, 267-270, 282-283

y el gato de Schródinger, 267-269

y Principio de Incertidumbre, 256-258

Véase también Interpretación de Copenhague; mecánica cuántica; teoría cuántica

Metafísica, 38, 108-110, 328-329, 331

y espacio-tiempo, 84-85, 109-138

y debate sustantivista-realista, 114-119

rechazo por Hume de,' 30, 31, 32, 33

y teoría cuántica, 277, 280-283

Metodología, 14, 15, 31, 95-97, 328, 329 Véase también críticas epistemológicas;

conocimiento

Mili, J. S„ 32Modelo deductivo-nomológico, 153-155,

157Momento, 170-172

Mónadas, 38-39Movimiento, 42, 44-52, 49 (figura). Véase

también aceleración; entradas a relatividad

Movimiento planetario, 68, 80, 87. Véase también astronomía

Newton, Isaac, 21, 66, 67, 68, 231, 329

y determinismo, 123-124, 292, 293, 294

acerca de la gravedad, 67, 77-78, 82- 83, 87, 94, 95, 97, 98

acerca del espacio, 43, 44, 45, 46, 47.53-55, 57-59, 61, 64, 115-117

debate Leibniz-, 38, 42-47

No orientabilidad, 81 (& figura)

Orden temporal, 62-63, 63 (figura)

Paradoja de los gemelos, 61, 62 (figura) Planck, M„ 234, 236

Platón, 14, 34

índice analítico 347

Podolsky, B., 308Poincaré, Henri, 88-92, 90 (figura), 216

respuestas a, 91-109

y termodinámica, 169, 170 (figura) Posiciones de sucesos-puntuales, 55-56

Positivismo, 99-105, 108-109 Posibilidad, 40, 42, 43

Postulado de aditividad, 142*143

Postulado de Caos Molecular, 179, 181-182, 191, 197

Postulado de las paralelas, 70-73

Postulado de linealidad, 94-95

Postulado de proyección, 250-251, 254, 261,264, 265, 277, 280

Prigogine, I., 206-209

Primera Ley de la Termodinámica, 164- 165

Principia (Newton), 67

Principio de equivalencia, 70

Principio de Incertidumbre, 21, 205-206, 255-260, 257 (figura), 321, 322, 323

Principio de indiferencia, 150-151, 175,195

Principio G IG O , 24 Probabilidad


y argumento de inseparabilidad de Einstein-Podolsky-Rosen, 310, 311-

312y estados de equilibrio, 179-180, 195-

196y explicación, 155-161, 187-188

e Interpretación de Copenhague, 251-253, 266

e interpretación de los «muchos mundos», 281-282

interpretaciones objetivistas, 144-148

interpretaciones subjetivistas, 148-152

y lógica, 283-284, 285-286

y mecánica cuántica, 180, 181, 309- 310, 311, 313-322

y medida, 260, 261-262 y Principio de Incertidumbre, 256

y reducción, 163-164

y sistemas caóticos, 216

teoría formal de, 141-144

y teoría cuántica, 241-242, 255-256, 260-261,262

y termodinámica, 169-170 Véase también estados de equilibrio;

estados de equilibrio, aproximación

a; mecánica estadística

Problema mente-cuerpo, 224-225 Probabilidad condicionada, 143-144

Problema del «agujero», 126-127 Putnam, H ., 287

Quine, W. V., 15

Red de mezcla, 212-214

Redes modulares, 287

Reducción, 160-163, 217-219

Véase también generalización

Reichenbach, H ., 212, 220, 221, 224, 285

Relacionismo, 38-43, 45-46, 114-118,123-127

Relatividad, teoría general de, 19-20, 44*46, 96-98

y debate sustantivista-relacionista, 122-127

y determinismo, 124-128

y geometrías no-euclídeas, 77-78, 87* 88, 106-107

y naturaleza del espacio, 24-25, 328- 329

orígenes de, 69-84

y simplicidad teórica, 98-100

y teoría machiana, 118-122

teoría de Gódel, 121, 122 (figura) Relatividad, teoría especial de, 17-19, 20-

21,44-46, 328-329

y causalidad, 128-130, 135 espacio-tiempo neo-newtoniano, 65-69

y geometrías no-euclídeas, 107-108

y hechos observables, 93-95 e Interpretación de Copenhague, 254

orígenes de, 47-55

y simplicidad teórica, 97-99 y tiempo, 17-19, 47-55, 62, 63 (figura),

328-329

Véase también espacio-tiempo

Revoluciones conceptuales, 18-20, 85, 235-36

Riemann, B., 72, 74, 77, 82, 84


Robb, A., 129, 130, 131, 136 Rosen, N., 308Rotación de la materia, 118-120, 121,

122 (figura)

Russel, B„ 124, 125, 295

Saccheri, G., 72Schródinger, E„ 236, 238, 239, 249, 256,

264, 285, 296

e Interpretación de Copenhague, 266,267, 268 (figura), 271-272

Segunda Ley de la Termodinámica, 164- 166, 179-181, 192, 205, 211-212, 214

Ser. Véase metafísica

Simplicidad teórica, 97-100, 101-103

Simultaneidad, 51-54, 53 (figura), 57-59, 66

y causalidad, 127, 128, 129 y hechos observables, 93. 94, 95

y metafísica, 111, 112, 113, 114

Singularidades, 125-126 Sistemas de Bernoulli, 198

Sistemas caóticos, 215-216

Sistemas K , 198, 199, 207 Specker, E ., 303

Sueños, 37Superficies de Cauchy, 293 £Sustantivismo, 24, 46-47, 114-118, 123-

127

Taquiones, 64-65

Temporalidad. Véase tiempo Tensor de energía-momento, 78-79 Teorema de Bell, 314-322 Teorema ergódico, 183-187, 184 (figura)

Teorema de Kolmogorov-Arnold-Mo- ser (KAM), 186 (figura), 185-189, 198

Teorema de Recurrencia, 201-203

Teorema KAM . Véase Teorema de Kol- mogorov-Arnold-Moser (KAM)

Teoría cinética del calor, 168-175, 170 (figura), 171 (figura), 172 (figura)

Teoría cuántica, 18-19, 289-292Interpretación de Copenhague, 251-

255,266-271

base experimental de, 231-241, 236

(figura)y conocimiento, 261-262, 270

y determinismo, 294-295

e interferencia, 242-249, 244 (figura), 245 (figura), 324

y lógica, 283-289

medida, 249-255, 260-283

y metafísica, 277, 279-282

Principio de Incertidumbre, 255-260, 257 (figura)

y probabilidad, 240-242, 247

Véase también teoría de campos cuántica; mecánica cuántica

Teoría cuántica de campos, 193-194 Teoría de partículas. Véase teoría cuán

ticaTeoría del big bang, 16, 17, 82, 125, 143,

214, 333 Teoría del big crunch, 211

Teoría de campos, 21, 122-124

Teoría del éter, 59, 97-98, 232-233

Teoría especial de la relatividad. Véase relatividad, teoría especial de

Teoría general de la relatividad. Véase relatividad, teoría general de

Teoría ondulatoria. Véase teoría cuántica

Términos. Véase lenguaje

Termodinámica, 160, 162-163, 164-167, 180-181

y asimetría causal, 223-225

incertidumbre en, 205-206

teoría cinética del calor, 167-175, 170 (figura), 171 (figura), 172 (figura)

Véase también estados de equilibrio, aproximación a; asimetría temporal

Tercera Ley de la Termodinámica, 167- 168

Tiempo, 23-24, 34, 35, 36, 44, 45, 46,183, 185

dilatación de, 50, 51, 59, 60, 61, 62 (figura), 70, 80-81

dirección de, 174-175, 213-214, 216- 227

espacio-tiempo neo-newtoniano, 65-67

y gravedad, 68-70, 71 (figura) y mecánica cuántica, 180-181

y metafísica, 110-112

Indice analítico 349

no orientabilidad, 81-82

teoría de Aristóteles, 36, 37, 38 teoría de Leibniz, 39-42

y teoría especial de la relatividad, 17- 18, 44-55, 62-64, 63 (figura), 328

Véase también irreversibilidad; espacio-

tiempo; asimetría temporal Timeo (Platón), 34

Transformaciones de Lorentz, 55

Universos de Robertson-Walker, 82

Universos vacíos, 118-122

y Teorema de Bell, 314, 318, 320, 321,

322teoría de von Neumann, 299, 300,

302Velocidad de la luz. Véase luz

Von Mises, L ., 147Von Neumann, J., 249, 250, 256, 285,

299, 300, 302

Waterston, J., 168

Wheeler, ]., 245, 280, 281

Wigner, E , 269, 270

Variables ocultas, 295-305, 305 (figura) Zenón de Elea, 36