D ESDE los viejos tiempos
«Ir A m ate les , lisua y filosofía son dos maneras de acercarse a la
« iiiiipirnsióM ilrl mundo que se han desarrollado en conexión mutua. Más
«|iir i'u.ili|iner olra disciplina científica, la física ha presionado sobre los
limites «le nuestro conocimiento más general acerca de las estructuras
pmlunilas del entendimiento y de la realidad, por lo que posee muchos
puntos comunes con el pensamiento ontológico y epistemológico,
tradicionalmente objeto de la filosofía. LAWRENCE SKLAR traza un
mapa de las áreas principales en la que se plantean cuestiones
fundamentales de filosofía del conocimiento del mundo físico. FILOSOFÍA
DE LA FISICA estudia la estructura del espacio, el tiempo y el
movimiento, la geometría del mundo y el tipo de entidades fundamentales
que lo constituyen. Aborda también el problema de la probabilidad y el
carácter aleatorio de los procesos básicos de la naturaleza, y termina con un
examen de las implicaciones ontológicas y epistemológicas de la mecánica
cuántica, la teoría más precisa y fecunda de cuantas han existido nunca, así
como la más extraña y difícil de conjugar con la imagen del mundo del
sentido común. También en Alianza Editorial, «Sobre la realidad de los
cuantos», de J. M. Jauch (AU 428), y «El debate de la teoría cuántica», de
Franco Selleri (AU 453).
Alianza Editorial
Filosofía de la física
Lawrence Sklar
Filosofía de la física
Versión española
de Rosa Álvarez Ulloa
Alianza Editorial
Título original: P hilosophy o f Physics
Reservados todos los derechos. De conformidad con lo dispuesto en el art. 534-bis del Código Penal vigente, podrán ser castigados con penas de multa y privación de libertad quienes reprodujeren o plagiaren, en todo o en parte, una obra literaria, artística o científica fijada en cualquier tipo de soporte sin la preceptiva autorización.
© Westview Press, Inc., 1992 © Ed. cast.: Alianza Editorial, S. A., Madrid, 1994
Calle Juan Ignacio Luca de Tena, 15; 28027 Madrid; teléf. 741 66 00 ISBN: 84-206-2797-6 Depósito legal: M. 38.916-1994Impreso en Lavel. Los Llanos, C/ Gran Canaria, 12. Humanes (Madrid) Printed in Spain
PatyRubby
ÍNDICE
Agradecimientos ............................................................................. 11
1. In t r o d u c c ió n : L a f i lo s o f ía y la s c ienc ias f ís ic a s ..................... 13
La relación de la ciencia a la filosofía .................................. 13
Física moderna y filosofía ..................................................... 16
Filosofía de la física y filosofía general ................................. 22
Finalidad y estructura de este lib ro ...................................... 24
2. E spa c io , t ie m po , m o v im ie n t o ................................................... 27
Problemas filosóficos tradicionales del espacio y el tiempo.. 27
El debate entre Newton y Leibniz ....................................... 38
Del espacio y el tiempo al espacio-tiempo .......................... 47
La gravedad y la curvatura del espacio-tiempo ................... 67
¿Cómo conocemos la verdadera geometría del mundo? .... 85
¿Qué clase de entidad tiene el espacio-tiempo? .................. 109
Lecturas adicionales .............. ................................................ 138
3. L a INTRODUCCIÓN DE LA PROBABILIDAD EN LA FÍSICA .................. 141
Los filósofos acerca de la probabilidad y la explicación es
tadística ................................................................................... 141
9
De la termodinámica a la mecánica estadística ................... 164
El problema de la irreversibilidad y las tentativas de resol
verlo ........................................................................................ 180
El problema de «la dirección del tiempo» ............................ 216
Lecturas adicionales .............................................................. 227
4. L a IMAGEN CUÁNTICA DEL MUNDO ................................................... 231
La base experimental de la teoría cuántica .......................... 231
Primeras tentativas de interpretar la teoría: el principio de
incertidumbre ........................................................................ 241
¿Qué es la medición en la teoría cuántica? .......................... 260
El problema de las variables ocultas y el determinismo..... 292
La inseparabilidad de los sistemas ....................................... 307
Lecturas complementarias .................................................... 324
5. R efle x io n e s sobre la in t e r d e p e n d e n c ia de la f ilo so fía y
la c ie n c ia ................................................................................. 327
B ib l io g r a f ía ...................................................................................................... 335
Índice a n a lít ico ............................................................................. 341
10 Indice
AGRADECIMIENTOS
En un trabajo de esta clase, concebido como un examen del
estado actual del campo, las fuentes de influencia intelectual son de
masiado numerosas para mencionarlas en una sección de agradeci
mientos. Las lecturas sugeridas al final de los tres capítulos principa
les indicarán al lector dónde he encontrado las fuentes de muchas
ideas importantes en la filosofía de la física.
Las discusiones mantenidas con muchas personas a lo largo de
los años me han ayudado a poner en orden mis ideas sobre los tópi
cos que presento aquí. Jim Joyce y Bob Batterman han sido de gran
ayuda, y de John Earman, Clark Glymour, David Malament, Paul
Horwich, y Michael Friedman he aprendido mucho.
Michele Vaidic fue de inestimable ayuda a la hora de confeccio
nar el manuscrito. Spencer Carr y los dos referees de Westview Press
me ayudaron mucho a mejorar el primer borrador del manuscrito,
especialmente en lo que a estilo y organización se refiere. A Marian
Safran, redactora jefe, le agradezco mucho la ayuda proporcionada
en llevar el manuscrito a su forma final.
Parte de la investigación que contribuyó a reunir el material del
capítulo 3 fue subvencionada por la National Science Foundation,
cuya ayuda agradezco sinceramente. También debo dar gracias a la
Universidad de Michigan por una beca que contribuyó a sufragar al
gunos de los costes de la preparación del manuscrito*
Lawrence Sklar11
Capítulo 1
INTRODUCCIÓN: LA FILOSOFÍA Y LAS CIENCIAS FÍSICAS
La relación de la ciencia a la filosofía
La demarcación entre las ciencias naturales y la filosofía ha sido un
proceso largo y gradual dentro del pensamiento occidental. En un
principio la indagación en la naturaleza de las cosas consistía en una
amalgama de lo que hoy concebiríamos como filosofía: consideracio
nes generales del tipo más amplio sobre la naturaleza del ser y la na
turaleza de nuestro acceso cognitivo al mismo, y lo que hoy se consi
deraría característico de las ciencias específicas: la acumulación de
hechos observacionales y la formulación de hipótesis generales y teó
ricas que los expliquen. Si atendemos a los restos fragmentarios de
las obras de los filósofos presocráticos, encontramos no sólo impor
tantes e ingeniosas tentativas de aplicar la razón a amplias cuestiones '
metafísicas y epistemológicas, sino también los primeros conatos de
teorías físicas, si bien extraordinariamente imaginativas, sobre la na
turaleza de la materia y sus aspectos cambiantes.
En la época de la filosofía griega clásica podemos ya apreciar una
cierta disociación de las dos disciplinas. En sus obras metafísicas,
Aristóteles está haciendo exactamente lo mismo que harían los filóso
fos hoy día. Pero en la mayoría de sus obras biológicas, astronómicas
y físicas, encontramos métodos de investigación que nos son hoy día
familiares en la práctica de los científicos.
13
14 Filosofía de la física
A medida que las ciencias especiales, como la física, la química y
la biología, han ido multiplicándose, dominando cada vez más recur
sos y desarrollando metodologías sumamente individualizadas, han
demostrado poseer capacidad para describir y explicar las caracterís
ticas fundamentales del mundo en el que vivimos. Debido al éxito de
los practicantes de las ciencias especiales, muchos se preguntan si
aun queda algo que los filósofos puedan hacer. Algunos filósofos
creen que hay dominios de investigación radicalmente diferentes a
los de las ciencias particulares, por ejemplo, la indagación en la natu
raleza de Dios, de «ser ello mismo» o de alguna otra cosa. Otros filó
sofos han buscado de diversas maneras un dominio distinto de inves
tigación para la filosofía más estrechamente vinculado a los recientes
y sofisticados desarrollos de las ciencias naturales.
Una concepción todavía más antigua, cuya popularidad fue dis
minuyendo con el paso de los siglos, aunque sin llegar a desaparecer
totalmente, sostiene que hay una forma de conocer el mundo cuyo
fundamento no necesita descansar en la investigación observacional
o experimental, el método de las ciencias específicas. Esta vieja con
cepción se vio influida en parte por la existencia de la lógica pura y
las matemáticas, cuyas verdades firmemente establecidas no parecen
descansar para su justificación en un fundamento observacional o ex
perimental. Desde Platón y Aristóteles a Leibniz y otros racionalistas,
pasando por Kant y los idealistas, y llegando hasta nuestros tiempos,
ha perdurado la esperanza de que, siendo lo suficientemente inteli
gentes y reflexivos, podríamos establecer un cuerpo de proposiciones
descriptivas del mundo, si bien conocidas con la certeza con la que
afirmamos conocer las verdades de la lógica y las matemáticas. Esto
sería creíble con independencia de cualquier soporte inductivo de
los hechps particulares de la observación. Si este cuerpo de conoci
miento estuviese a nuestra disposición, ¿no sería el objetivo anhelado
durante siglos por la disciplina tradicionalmente llamada filosofía?
Una concepción más contemporánea sostiene que el papel de la
filosofía es servir, no ya de. fundamento para las ciencias o como ex
tensión de ellas, sino antes bien de observador crítico de las mismas.
La idea aquí es que las disciplinas científicas particulares usan con
ceptos y métodos. Las relaciones entre unos conceptos y otros, aun
que implícitas en el uso que la ciencia hace de ellos, podrían no estar
claras de manera explícita para nosotros. En este caso sería tarea de
la filosofía el esclarecimiento de estas relaciones conceptuales. De
Introducción: la filosofía y las ciencias físicas 15
nuevo, las ciencias particulares emplean métodos específicos para ge
neralizar de los datos observacionales a las hipótesis y a la teoría. El
cometido de la filosofía es, desde esta perspectiva, describir ios méto
dos que las ciencias utilizan y explorar el terreno para justificar estos
métodos. Es decir, compete a la filosofía mostrar que se trata de los
métodos adecuados para hallar la verdad en la disciplina científica en
cuestión.
Pero, ¿está claro desde alguna de estas dos perspectivas que la fi
losofía y la ciencia puedan ser diferenciadas una de la otra en una
forma más rotunda? Muchos insinúan que no. En las ciencias especí
ficas, las teorías se adoptan a veces no sólo por ser consistentes con
los datos observacionales, sino también por otros motivos como el
grado de simplicidad, el poder explicativo u otras consideraciones
que se cree que contribuyen a su plausibilidad intrínseca. Cuando
advertimos esto, comenzamos a perder confianza en la idea de que
hay dos reinos muy diferentes de proposiciones, aquéllas respaldadas
sólo por los datos y aquéllas respaldadas sólo por la razón. Muchos
metodólogos contemporáneos, como W. V. Quine, mantendrían que
las ciencias naturales, las matemáticas y hasta la lógica pura forman
un continuo unificado de creencias sobre el mundo. Todas ellas, afir
man estos metodólogos, están indirectamente respaldadas por los
datos observacionales, pero todas ellas contienen asimismo elemen
tos de apoyo «racionales». Si esto es cierto, ¿no formaría incluso la fi
losofía, entendida como las verdades de la razón, parte integrante asi
mismo del todo unificado? Esto es, ¿no sería también la filosofía
simplemente un componente del cuerpo de las ciencias especiali
zadas?
Cuando preguntamos por la adecuada descripción y justificación
de los métodos de la ciencia, parece que esperamos que los resulta
dos específicos de las ciencias particulares entren de nuevo en juego.
¿Cómo podríamos entender la aptitud de los métodos de la ciencia
para conducirnos a la verdad sin ser capaces de demostrar que estos
métodos poseen efectivamente la fiabilidad que se les ha atribuido?
Y ¿cómo podríamos hacer esto sin emplear el conocimiento sobre
cómo es el mundo que nuestra mejor ciencia disponible nos ha reve
lado? ¿Cómo podríamos, por ejemplo, justificar nuestra confianza en
la observación sensorial en la ciencia si nuestro entendimiento de los
procesos perceptivos, un entendimiento que descansa en la física, la
neurología y la psicología, no nos garantizase que la percepción, en la
16 Filosofía de la física
forma que se utiliza para probar las teorías científicas, era efecti
vamente una buena guía hacia la verdad sobre la naturaleza del
mundo?
Es en la discusión de las teorías más fundamentales y generales
de la física donde la indistinción de la frontera entre las ciencias na
turales y la filosofía se hace más evidente. Dada la clara ambición de
estas teorías por describir el mundo natural en sus aspectos más fun
damentales y generales, no resulta sorprendente que los tipos de ra
zonamiento aplicados en el desarrollo de estas teorías sumamente
abstractas parezcan a veces más próximos al razonamiento filosófico
que a los métodos empleados en llevar a cabo una investigación cien
tífica más limitada y particular. Más adelante, cuando exploremos los
conceptos y métodos utilizados por la fi'sica en el estudio de sus
cuestiones más fundamentales, veremos una y otra vez cómo puede
no estar claro en absoluto si estamos explorando cuestiones de la
ciencia natural o cuestiones de la filosofía. De hecho, en este domi
nio de nuestra exploración de la naturaleza del mundo, la distinción
entre las dos disciplinas se torna muy confusa.
Física moderna y filosofía
Nos será de ayuda echar una mirada preliminar a algunas de las for
mas en que los resultados de la física moderna han afectado a las
cuestiones filosóficas. Esto puede suceder cuando un estudio teórico
en física ejerce presión contra lo que se ha considerado que son lími
tes de su dominio de indagación. Consideremos, por ejemplo, la cos
mología moderna. El modelo más ampliamente aceptado de la es
tructura a gran escala de nuestro universo es el big bang. En él se
traza la evolución del universo actual hacia atrás en el tiempo, con
un contraimiento de las dimensiones espaciales del universo en esa
dirección temporal de retroceso. Una gran parte de la estructura y di
námica actuales del universo puede ser aparentemente explicada si
suponemos que el universo se ha desarrollado de una manera explo
siva a partir de una singularidad en un tiempo finito en el pasado. Es
decir, parece que en algún momento del pasado (del orden de como
mucho unas cuantas decenas de billones de años atrás) toda la mate
ria del universo estaba concentrada «en un punto» del espacio (o,
mejor aún, el espacio mismo estaba concentrado en esa forma).
Introducción: la filosofía y las ciencias físicas 17
Pero semejante modelo del universo obviamente da lugar a cues
tiones asombrosas que parecen llevarnos más allá de los modos de
búsqueda de una respuesta que nos son familiares en la discusión de
cuestiones de causalidad a la escala astronómica. Si el estado actual
del universo puede retrotraerse en el tiempo a través de una serie de
causas y efectos a la singularidad inicial, ¿qué podemos hacer enton
ces para continuar el proceso de pregunta-y-respuesta de la ciencia y
buscar la explicación causal de la existencia y naturaleza de ese mis
mo estado inicial singular? Sencillamente, no tenemos claro qué tipo de respuesta explicativa podríamos dar a una pregunta como, «¿por
qué tuvo lugar el big bang y por qué se dio en la forma que lo hizo?
Hemos, por así decirlo, rebasado el ámbito de las respuestas explica
tivas del tipo familiar. La cadena de razonamiento causal regresivo de
un estado a un estado anterior postulado como causa suficiente pare
ce detenerse en la singularidad inicial del big bang.Esto no significa que no se pueda imaginar algo parecido a una
explicación de la ocurrencia y naturaleza del big bang, sólo que en
este punto parece que los modos de pensamiento científicos habitua
les han de ser complementados con otros modos familiares al filóso
fo. Lo que se cuestiona es la naturaleza misma de nuestra demanda
de una explicación, el tipo de contestación que podríamos esperar
como respuesta a dicha demanda. Aquí la física y la filosofía parecen
converger, pasando las cuestiones específicas sobre la naturaleza del
mundo a estar inextricablemente entrelazadas con cuestiones de un ti
po más metodológico acerca precisamente de qué tipo de descripción
y explicación del mundo puede esperarse propiamente de la ciencia.
Otra presión a «filosofar» en la física contemporánea proviene de
que los cambios en nuestra imagen física del mundo exigen una revi
sión radical de nuestra conceptualización del mismo. Cuando inten
tamos acomodar los desconcertantes datos observacionales que nos
abocaron a las nuevas revoluciones científicas, descubrimos pronto
que muchos de nuestros preciados conceptos para tratar con el mun
do dependen para su viabilidad de la presencia de ciertas caracterís
ticas estructurales en nuestra imagen del mundo. En algunos casos se
trata de características cuya existencia ni siquiera advertimos hasta
que son cuestionadas por las nuevas teorías físicas revolucionarias.
Pero, una vez que estas características de nuestra imagen teórica son
puestas en tela de juicio, los conceptos que dependen de ellas dejan
de funcionar para nosotros como lo han hecho hasta entonces y
18 Filosofía de la física
debemos revisar nuestros conceptos. Pero semejante revisión concep
tual es justamente la clase de cosa que nos impone una investigación
típicamente filosófica del significado mismo de los conceptos que he
mos estado utilizando todo el tiempo y de las revisiones de significa
do necesarias para acomodar el nuevo entendimiento conceptual del
mundo.
Consideremos, por ejemplo, la revisión de nuestro concepto del
tiempo implicada por la teoría especial de la relatividad. Por razones
que analizaremos más tarde, la adopción de esta teoría exige que di
gamos muchas cosas sobre el tiempo que parecen ser manifiestamen
te absurdas. Dos sucesos que ocurren al mismo tiempo para un «ob
servador» pueden, en esta teoría, no ser simultáneos para algún otro
observador en movimiento con respecto al primero. El mismo orden
temporal de algunos sucesos (sucesos que no son causalmente conec
tables entre sí) puede invertirse con respecto a observadores diferen
tes. Sin embargo, nuestro anterior concepto del tiempo suponía, casi
inconscientemente, que lo que es simultáneo para un observador es
simultáneo para todos, y que si el suceso a es anterior al suceso b, esto es un hecho «absoluto» para todos los observadores.
La naturaleza de la nueva teoría del espacio y el tiempo, trayen
do consigo sus conceptos revolucionarios, nos impone una profunda
reconsideración de todo lo que conformaba nuestras viejas presupo
siciones teóricas y nuestro viejo aparato conceptual. Dicha reconside
ración nos lleva a examinar con detenimiento justamente lo que en
nuestra concepción anterior estaba fundado en la experiencia y lo
que se presuponía sin razón o justificación. Y los cambios revolucio
narios nos imponen el deber de explorar detenidamente la forma en
que los conceptos dependen de la estructura teórica en la que se en
cuentran inmersos, y cómo los cambios en esa estructura pueden le
gítimamente exigir una renovación conceptual de nuestra parte.
Como veremos, al pasar de la teoría especial a la teoría general de la
relatividad, necesitaremos estructuras todavía más noveles del espa
cio y el tiempo. Será posible considerar al menos la posibilidad de
mundos en los que, por ejemplo, un suceso dado se encuentre, en un
sentido perfectamente coherente, en su propio pasado y futuro. Cla
ramente, esta clase de cambio cuenta como una revolución concep
tual. El entendimiento de justamente cómo pueden darse dichas re
voluciones conceptuales, y de lo que ocurre exactamente cuando una
tiene de hecho lugar, es el tipo de problema apropiado para la inves
Introducción: la filosofía y las ciencias físicas 19
tigación filosófica. La filosofía queda ahora integrada en la teoriza
ción física.
Otro ejemplo más de la clase de revolución científica conceptual
que exige que la reflexión filosófica pase a formar parte de la prácti
ca científica concierne al impacto de la teoría cuántica en nuestras
nociones tradicionales de causalidad. Una gran parte de nuestra cien
cia presuponía la idea de que cada suceso podía ser explicado aso
ciándolo de una forma legal con alguna condición anterior del mun
do. Dicha suposición era en muchos sentidos un principio guía en la
búsqueda de explicaciones científicas cada vez más globales de los
fenómenos de la experiencia. Si un suceso parecía no responder a
ninguna causa, sólo podía ser un reflejo de nuestra ignorancia, del
hecho de que aún no habíamos hallado la causa cuya existencia
estaba asegurada por el principio general de que «todo suceso tiene
una causa».
Pero, según veremos, muchos han afirmado que este principio no
puede seguir siendo considerado como verdadero en un mundo des
crito por la mecánica cuántica. ¿Qué tipo de teoría podría decirnos
que hay sucesos no causados en el mundo, sucesos para los que la
búsqueda de una causa determinante subyacente es una empresa
abocada al fracaso? La respuesta no es una cuestión sencilla. El fallo
de la causalidad universal implicado por la mecánica cuántica es par
te de una revuelta conceptual mucho más profunda a la que nos he
mos visto forzados por esta teoría. De hecho, pocos de los que han
explorado las cuestiones con detenimiento piensan que alguna de las
descripciones del mundo ya construidas llegará a hacer justicia a los
hechos que la mecánica cuántica nos dice que encontraremos en el
mundo. Ideas básicas sobre lo que constituye «la realidad objetiva»,
como opuesta a nuestra experiencia subjetiva de ella, devienen pro
blemáticas a la luz de esta asombrosa teoría. Una vez más (y éste es el
único comentario que haré aquí), la naturaleza revolucionaria de los
datos de la experiencia y de la teoría construida para dar cuenta de
ellos en la física moderna nos impone el tipo de examen crítico y de
tenido del papel desempeñado (algunas veces sólo implícita e incons
cientemente) por ciertos conceptos fundamentales en nuestras viejas
teorías. Además, esa misma naturaleza revolucionaria requiere un
examen filosófico detenido sobre la forma en que lat revisión de la
teoría nos impone una revisión de la estructura conceptual. Los tipos
de pensamiento y razonamiento familiares en contextos filosóficos
20 Filosofía de la física
pasan a ser parte integrante de la ciencia en el contexto de las revo
luciones conceptuales.
La filosofía ha sido también integrada en la práctica científica de
la física moderna mediante la irrupción en la teorización científica de
un tipo de crítica epistemológica que antes sólo se encontraba en la
filosofía. La física anterior descansaba en suposiciones sobre qué po
día constituir datos legítimos para fundamentar la inferencia a teorías
físicas y qué podía constituir reglas legítimas de inferencia por las
que uno pasaba de las compilaciones de datos observados a las hipó
tesis generalizadas y a las teorías postuladas. Con frecuencia se deja
ba a los filósofos la tarea de desentrañar las suposiciones implícitas
hechas por las ciencias, de esclarecer su naturaleza y examinar su le
gitimidad. Pero en la física moderna se ha hecho ineludible para los
teóricos, como parte de su práctica científica, el explorar estas cues
tiones básicas concernientes a nuestras razones para aceptar y recusar
hipótesis. Los trabajos de Einstein en la teoría de la relatividad y de
Bohr en la mecánica cuántica son particularmente reveladores de
esta nueva corriente epistemológica.
En su artículo seminal sobre la teoría especial de la relatividad,
por ejemplo, A. Einstein afronta una serie de dificultades teóricas y
observacionales sumamente complejas de la física existente. Su forma
de abordar estos problemas se funda en una discusión extraordina
riamente original y brillante de la pregunta, «¿cómo podemos deter
minar si dos sucesos separados espacialmente ocurren o no al mismo
tiempo?». Esta exploración en la base evidencial e inferencial de
nuestra legítima postulación teórica conduce a Einstein al núcleo
central de su nueva teoría, la relatividad de la simultaneidad respecto
al estado de movimiento del observador. Si bien Einstein deriva, de
hecho, de sus postulados básicos algunas consecuencias observacio
nales asombrosamente nuevas y de importancia fundamental, mu
chos de sus resultados predichos estaban contenidos en la teoría an
terior de H. Lorentz. Pero incluso para estas consecuencias, el
trabajo de Einstein constituye un avance de una importancia funda
mental. Vistas desde su nueva perspectiva, las fórmulas anteriores ad
quieren un significado completamente diferente. Es esencial observar
que esta nueva perspectiva se funda en un examen filosófico-crítico
de la base evidencial de nuestras inferencias teóricas. Sorprendente
mente, como veremos más adelante, un examen epistemológico críti
co muy similar de otras teorías más antiguas se encuentra en el pro-
Introducción: la filosofía y las ciencias físicas 21
pió núcleo de la otra teoría fundamental de Einstein sobre el espacio
y el tiempo: la teoría general de la relatividad.
La mecánica cuántica nos proporciona otro ejemplo principal de
cómo la crítica epistemológica juega un papel crucial en la física mo
derna. La cuestión sobre la naturaleza del proceso de medida, el pro
ceso mediante el que un observador exterior explora un sistema físi
co con la intención de determinar su estado, resulta fundamental
para un entendimiento del significado de las fórmulas centrales de la
mecánica cuántica. Desde los primeros comienzos de esta teoría, las
cuestiones sobre lo que es observable jugaron un importante papel
conceptual. Más tarde, las tentativas llevadas a cabo para entender
consecuencias tan curiosas de la teoría como el denominado Princi
pio de Incertidumbre exigieron, una vez más, un examen crítico de
aquello que podía ser determinado observacionalmente. Por último,
las tentativas de entender el marco de trabajo conceptual fundamen
tal de la teoría llevaron a Niels Bohr a afirmar que la nueva teoría fí
sica exigía una revisión extraordinariamente radical de nuestras ideas
tradicionales sobre la relación entre lo que sabemos del mundo y lo
que de hecho es el caso sobre él. La idea misma de una naturaleza
objetiva del mundo independiente de nuestro conocimiento sobre el
mismo fue atacada en el programa de Bohr. Una vez más, ideas pre
viamente familiares en el contexto de la filosofía pasaron a formar
parte de la física. En filosofía, la negación de la objetividad y las vin
dicaciones a favor de varias doctrinas de la relatividad o de la subje
tividad para el mundo son una vieja historia.
La interacción entre la filosofía y la física no comenzó con estas
teorías del siglo XX. Como veremos, hubo cuestiones filosóficas entre
lazadas con los primeros desarrollos de la dinámica (especialmente
en I. Newton). En el siglo XIX, los debates filosóficos desempeñaron
un papel crucial en el desarrollo de la nueva teoría atómico-molecu-
lar de la materia. Otras polémicas de cariz filosófico fueron importan
tes para establecer la base conceptual de la teoría del electromagne
tismo, con su invocación del «campo» como un componente
fundamental del mundo físico. Pero la física moderna ha llevado sus
exploraciones hasta los mismos límites del mundo. Al hacer esto, ha
forzado el aparato conceptual adecuado para tratar con cuestiones
más limitadas. La física, en su intento de hacer justicia a los comple
jos e inesperados fenómenos revelados por las técnicas experimenta
les modernas, exige la revisión radical de conceptos anteriormente
22 Filosofía de la física
no cuestionados. Las nuevas teorías demandan un examen de las ba
ses evidencíales e inferenciales tras sus postulados. En consecuencia,
la física teórica moderna se ha convertido en un foro en el que los
modos filosóficos de pensamiento son un componente esencial del
progreso físico. Es este entrelazamiento de la física y la filosofía lo
que vamos a explorar.
Filosofía de la física y filosofía general
Acabamos de ver algunas de las razones por las que la filosofía ha ad
quirido importancia para quienes se preocupan por la naturaleza de
la teoría física. Podría ser de ayuda explicar también porqué el estu
dio de los fundamentos de la teoría física y de sus aspectos filosófi
cos reviste valor para los filósofos que no se interesan específicamen
te por la naturaleza de la física. A mí me gustaría sugerir que los
problemas investigados por los filósofos de la física y los métodos
que emplean para explorar estos problemas pueden arrojar luz sobre
cuestiones filosóficas más generales asimismo.
Los filósofos de la ciencia están interesados en cuestiones tales
como la naturaleza de las teorías científicas, la manera en que éstas
explican los fenómenos del mundo, la base evidencial e inferencial
de estas teorías y la forma en que esa evidencia puede ser utilizada
para respaldar justificadamente o desalentar la creencia en una hipó
tesis. Podemos lograr un mayor discernimiento explorando estas
cuestiones más generales en el contexto de teorías específicas de la
física contemporánea. El vasto alcance de las teorías y su naturaleza
sumamente explícita proporcionan un contexto en el que muchas
cuestiones de la filosofía general de la ciencia, de lo contrario bastan
te vagas, se hacen más «fijas» cuando centramos nuestra atención en
estas teorías físicas especiales.
Al estar las teorías sumamente formalizadas, el lugar que en ellas
ocupan conceptos cruciales está sencilla y claramente delimitado. Las
cuestiones sobre el significado de los conceptos cruciales, su elimina-
bilidad o irreducibilidad, sus relaciones definitorias y otras más, pa
san a ser sometidas a un examen riguroso. Dicho examen es más difí
cil de realizar cuando se trata de los conceptos más «relajados» de
ciencias no tan bien formalizadas. Como también veremos, la rela
ción de la estructura postulada teóricamente a los hechos obser-
Introducción: la filosofía y las ciencias físicas 23
vacionales de los que es inferida está particularmente clara en mu
chos de los casos de la física formalizada. En las teorías del espacio y
el tiempo, por ejemplo, el propio contexto de teorización científica
presupone nociones bastante definidas de lo que ha de considerarse
como «hechos accesibles a la inspección observacional directa», los
cuales han de proporcionar la totalidad del soporte evidencial de la
teoría. Así, cuestiones sobre si la totalidad de dichos hechos podría
seleccionar un único competidor teórico viable, respaldándolo frente
a todos sus contendientes, son tratadas en una forma iluminadora,
una de la que carecemos en el contexto científico general. En este úl
timo contexto no hay una noción clara de los límites de la observa
ción, ni una clara delimitación de la clase de posibles alternativas
teóricas a considerar. Si exploramos cuestiones tales como la elimina-
bilidad o no eliminabilidad de los conceptos teóricos o el grado al
que las elecciones teóricas están condicionadas por los hechos obser
vacionales en el contexto de las teorías fundamentales de la física, te
nemos una forma de tratar con estas cuestiones metodológicas gene
rales: examinamos casos específicos que confieren una agudeza
especial a las cuestiones filosóficas. El discernimiento logrado en este
dominio, más formalizable y delimitado, puede resultar de provecho
a quienes están involucrados en cuestiones más amplias.
Estas consideraciones pueden de algún modo ser generalizadas.
Los filósofos que se ocupan de las cuestiones generales de la metafí
sica, la epistemología y la filosofía del lenguaje descubrirán que la ex
ploración de cuestiones en estos campos, al ser las cuestiones ejem
plificadas en los casos particulares concretos de la teoría física,
arrojará luz sobre las formas adecuadas de tratar con las cuestiones
generales. No se puede avanzar mucho en el entendimiento de las es
tructuras específicas de las teorías físicas parciales sin utilizar los re
cursos aportados por quienes exploran las cuestiones más generales y
fundamentales de la filosofía. Lo que es más, no se puede realizar
ningún claro progreso en estas áreas más generales sin ver cómo se
comportan los métodos y las soluciones generales cuando se aplican
a casos específicos. Y los casos específicos de los fundamentos filosó
ficos de la teoría física fundamental son, de nuevo, particularmente
adecuados como casos prueba de las vindicaciones filosóficas gene
rales. ,
Una última cuestión relacionada merece un momento de aten
ción. Uno encuentra con frecuencia en la literatura afirmaciones muy
Filosofía de la física
.11 revidas de que la física contemporánea ha resuelto decisivamente
viejos debates filosóficos de una vez por todas. «La mecánica cuánti
ca reiuta la afirmación de que todos los sucesos tienen una causa» es
un ejemplo frecuente. Algunas veces, asombrosamente, los dos ban
dos de un debate filosófico sostienen que una teoría resuelve un pro
blema en su favor. Así, se ha argüido que la teoría general de la rela
tividad resuelve decisivamente la cuestión de la naturaleza del
espacio. Pero algunos arguyen que refuta el sustantivismo, mientras
otros arguyen que resuelve el debate ¡en favor de esa doctrina! Vindi
caciones tan burdas e incompetentes son decepcionantes porque las
cuestiones son complejas y los razonamientos a menudo frustrante-
mente sutiles y opacos. Bajo dichas circunstancias, las vindicaciones
de una victoria decisiva de cualquier tipo deberían ser tratadas al
menos con cierto escepticismo.
Tendremos que tener un cuidado especial con las conclusiones
filosóficas derivadas de los resultados físicos. En analogía con el Prin
cipio G IG O de la ciencia de los computadores («garbage in, garbage
out») [«basura in, basura out»], podemos llamar a esto el Principio
MIMO: «metafísica in, metafísica out». No hay duda de que cual
quier vindicación filosófica debe ser reconciliada con los mejores re
sultados de la ciencia física a nuestra disposición. Ni hay duda algu
na de que el progreso de la ciencia ha proporcionado un útil
antídoto contra mucho dogmatismo en la filosofía. Pero al examinar
lo que la física nos dice sobre las cuestiones filosóficas, debemos te
ner siempre presente preguntar si se han insertado presuposiciones
filosóficas en la propia teoría. Si descubrimos que dichas presuposi
ciones han sido incluidas en la propia teoría, debemos de estar prepa
rados para examinar detenidamente la cuestión de si esa forma de
presentar la teoría es la única forma en la que sus resultados científi
cos podían haber sido acomodados o si pudiera haber otras presupo
siciones que nos llevarían a derivar conclusiones filosóficas bastante
diferentes en caso de formar parte de la teoría.
Finalidad y estructura de este libro
Por último, ofreceré unas pocas observaciones sobre la finalidad y la
estructura de este libro. La investigación sistemática y exhaustiva de
cualquiera de los principales problemas de la filosofía es una tarea
Introducción: la filosofía y las ciencias físicas
larga y ardua. Un dominio de los contenidos de''l»»J&tí¿i*sí\í funda
mentales de la física contemporánea requiere un estudio preSuJk del
difícil y extenso cuerpo de las matemáticas, ya que las teorías están a
menudo gestadas en el poderoso y abstracto lenguaje de la matemáti
ca contemporánea. El estudio de los elementos físicos especiales de
las teorías debe añadirse al trasfondo matemático. Por encima de
esto, la indagación filosófica requiere un conocimiento firme de mu
chos aspectos de la filosofía analítica contemporánea: la metafísica, la
epistemología, y la filosofía del lenguaje.
Un intento de hacer plena justicia a cualquiera de los problemas
centrales de la filosofía en una obra introductoria como la presente
está claramente fuera de toda cuestión. Nuestra finalidad aquí, antes
bien, es suministrar al lector un mapa de carreteras de las áreas don
de se encuentran los problemas centrales en el campo. El libro se
centra en lo que, a mi entender, parecen ser las cuestiones más im
portantes de la filosofía de la física. Muchos otros tópicos interesan
tes apenas serán tocados y algunos serán dejados completamente a
un lado, con la intención de dirigir toda la atención posible a las
cuestiones más cruciales y centrales.
En lo que a los tópicos considerados respecta, proporciono un
bosquejo o resumen de las principales características de las teorías fí
sicas que interaccionan más crucialmente con la filosofía. M i propósi
to es ofrecer un tratamiento suficientemente claro y conciso de estas
cuestiones a fin de conducir al lector interesado a través de los cami
nos, en ocasiones laberínticos, seguidos por los debates centrales. Los
capítulos 2, 3 y 4 están complementados con una guía comentada de
la literatura. El lector interesado en seguir con detalle las cuestiones
esbozadas en el texto encontrará en estas secciones de referencia una
guía a los materiales de fondo básicos en matemáticas, física y filoso
fía, así como una guía a las discusiones contemporáneas más impor
tantes del problema específico. Las secciones de referencia no están
concebidas como un examen exhaustivo de la literatura sobre cual
quiera de los temas tratados (una literatura en ocasiones muy exten
sa) sino, antes bien, como una guía selectiva de los materiales más
útiles para hacer avanzar al lector de una forma sistemática.
Pese a haber intentado incluir en las secciones de referencia ma
terial accesible a aquellos que no dispongan de unos conocimientos
básicos extensos de matemáticas y física teórica, no he excluido ma
terial que requiera conocimiento en estas áreas para su comprensión.
26 Filosofía de la física
El material que requiere un conocimiento bastante modesto de este
tipo (digamos al nivel medio de una licenciatura) está señalado con
(*). El material que requiere una mayor familiaridad con los concep
tos y métodos técnicos está señalado con (**)■
Las tres áreas principales que exploraremos en este libro son las
concernientes al espacio y tiempo, a las teorías probabilísticas y esta
dísticas de tipo «clásico», y a la mecánica cuántica. Esto nos permiti
rá examinar muchas de las áreas problemáticas actuales más asom
brosas y fundamentales en la filosofía de la física. Otra área principal
será tratada sólo incidentalmente, aunque introduce de suyo muchas
cuestiones sumamente interesantes que han sido sólo parcialmente
exploradas. Se trata de la teoría general de la materia y su constitu
ción tal y como es descrita por la física contemporánea. Las cuestio
nes que derivan de la postulación del campo como un elemento bási
co del mundo, de problemas en la teoría de la constitución de la
materia a partir de sus microconstituyentes en una jerarquía descen
dente que nos lleva a través de las moléculas y los átomos a las partí
culas elementales (y quizá más allá), y de la teoría fundamental de las
propias partículas elementales serán tocadas solamente de paso al
ocuparnos de las tres áreas de problemas centrales mencionadas más
arriba.
Capítulo 2
ESPACIO, TIEMPO, MOVIMIENTO
Problemas filosóficos tradicionales del espacio y el tiempo
Cuestiones acerca del conocimientoLos grandes filósofos de la Grecia Antigua confrontaron el problema
de entender qué significa tener conocimiento del mundo. ¿Cuáles
son los fundamentos, se preguntaron, y cuáles los límites de nuestra
capacidad de conocer cómo es realmente el mundo que nos rodea?
No es sorprendente que esta empresa, dirigida a intentar distinguir el
conocimiento verdadero de la mera opinión, comenzase examinando
las creencias ordinarias sobre aquello que, al entender de la persona
racional corriente, podía constituir un conocimiento bien fundado.
Había, claro está, muchas creencias particulares compartidas
acerca de la existencia y de la naturaleza de los objetos individuales
del mundo que hallamos en nuestra vida cotidiana. Pero, ¿había tam
bién verdades generales sobre el mundo que pudieran asimismo ser
conocidas, verdades sobre todos los objetos o características de un ti
po dado?
Algunas verdades generales parecía que podían ser establecidas
por generalización de nuestra experiencia cotidiana. Así, parecía po
der inferirse de la observación que las estaciones del año seguirían
perpetuamente su curso habitual. Que las rocas caían, que el fuego
27
28 Filosofía de la física
ascendía, que los seres vivos procreaban y después, tras un proceso
de maduración, perecían, y muchas otras verdades generales forma
ban parte de un haber común de creencias. Pero la reflexión crítica
demostró que en la observación, expuesta como estaba a la ilusión y
al error de percepción, no se podía con frecuencia confiar. Y con fre
cuencia se halló que las creencias generales derivadas de la experien
cia dejaban de ser válidas cuando se añadían nuevas experiencias.
Además, las verdades derivadas parecían carecer de exactitud y pre
cisión, salvo en esferas de la experiencia tan reducidas como la de la
astronomía, donde se observaba una regularidad más perfecta y per
manente que la hallada en la experiencia de las cosas terrenales ordi
narias.
No obstante, en su búsqueda en pos de las verdades generales
acerca de la estructura fundamental del mundo, los griegos también
contaron con las teorías de los primeros grandes filósofos especulati
vos. Entre las muchas teorías generales principales que se propusie
ron estaba que todas las cosas están formadas por un pequeño núme
ro de sustancias básicas; que el cambio debe explicarse por el
reordenamiento de los átomos invariables; que el mundo es funda
mentalmente inmutable o, por el contrario, que está en flujo constan
te. Pero, si bien estas teorías fundamentales del universo eran apasio
nantes y profundas, parecían carecer de la clase de soporte evidencial
que podría persuadir a un escéptico a aceptarlas como verdaderas.
Sus proponentes, por supuesto, las defendieron, unas veces invocan
do burdas verdades generales derivadas de la observación, otras afir
mando abiertamente que podían llevar al convencimiento por el pro
ceso del razonamiento puro. Pero ninguna doctrina gozó de
aceptación universal, es decir, ninguna doctrina probó ser verdadera
por una evidencia incuestionable.
¡Y entonces se hizo la geometría! Aquí uno parecía contar con un
cuerpo de aserciones de significado completamente claro, aserciones
sobre la naturaleza del mundo que eran exactas y precisas y de las
que se podía saber si eran verdaderas con certeza. Ejemplos de esta
clase de verdades son que al duplicar la longitud de un lado de un
cuadrado su área queda multiplicada por cuatro, y que el cuadrado
de la longitud de la hipotenusa de un triángulo rectángulo es la suma
de los cuadrados de las longitudes de los otros dos lados. Éstas y
otras afirmaciones de la geometría poseían una claridad y una certeza
no presente en ningún otro tipo de enunciados sobre el mundo.
Espacio, tiempo, movimiento 29
Esta certeza existía porque las proposiciones de la geometría po
dían ser demostradas, un hecho que había sido descubierto por los
griegos poco antes de la gran era de la filosofía griega clásica. Las
proposiciones podían ser derivadas por razonamiento puramenteTó-
gico a partir de primeros principios, axiomas o postulados, que pare
cían verdaderos en sí mismos a la mente razonable. El razonamiento
utilizado procedía seguro intuitivamente de no llevar de una verdad
a una falsedad. Uno partía de verdades tan obvias como que dos
puntos fijos determinaban una, y solo una, recta que contenía a los
dos y que iguales sumados a iguales daban iguales. Entonces, por una
cadena de razonamientos en la que cada paso era una transición de
una proposición a otra proposición que conducía a uno de‘ manera
autoevidefite de una verdad a otra, se podía finalmente alcanzar una
conclusión cuya verdad quedaba entonces garantizada con seguridad.
Éstas eran las verdades acerca d^ la compleja estructura geométrica
del mundo.
Tan asombrosa es esta característica de la geometría, su capaci
dad de aportarnos un conocimiento sobre la estructura del mundo
avalado por una inferencia incuestionable a partir de verdades bási
cas, simples e incuestionables, que todo otro tipo de conocimiento
putativo les pareció a los filósofos a lo más un tipo de conocimiento
de segunda clase. El conocimiento fundado en los sentidos estaba su
jeto a los familiares tipos de errores sensoriales —percepción errónea
e ilusión. Y el conocimiento que surgía por vía de generalización a
partir de los datos concretos de la sensación contaba con un doble
inconveniente, la posibilidad de error sensorial y la posibilidad de
que nuestras inferencias generalizadoras pudieran de suyo conducir
nos de la verdad a la falsedad. Mientras la preservación de la verdad
de las inferencias puramente lógicas que nos conducían de los postu
lados básicos a los teoremas geométricos parecía estar garantizada
por la intuición, las reglas para trascender la experiencia de los senti
dos y pasar a afirmaciones generales sobre la naturaleza parecían ca
recer de dicha garantía avalada por la intuición.
Para muchos, la creencia fundada en la observación sensorial y
en la inferencia a partir de ésta se convirtió simplemente en un preli
minar al establecimiento de un conocimiento auténtico por el méto
do «geométrico». Los filósofos insistieron durante mucho tiempo en
el ideal de que, sólo con ser lo suficientemente inteligentes, podría
mos algún día construir un edificio de conocimiento que compren-
30 Filosofía de la física
diese todos los campos de investigación, la física de la naturaleza, la
psicología de la mente, incluso los principios básicos de la moral que
rigen las verdades de lo bueno y lo malo, así como de lo correcto y
lo incorrecto, al descubrir en todos estos campos sus primeros princi
pios, verdaderos en sí mismos, análogos a los axiomas de la geome
tría. Podríamos entonces derivar a partir de estos primeros principios
el conjunto entero de verdades en cada área, de la misma forma que
los teoremas de la geometría se siguen por la lógica solamente de los
postulados geométricos básicos.
Con la creciente influencia de la observación y del experimento
en la fundamentación de la ciencia que surgió tras la revolución
científica, y dada la incapacidad para formular una «geometría» de la
naturaleza y la moral, la gente se volvió escéptica respecto a la conve
niencia del modelo geométrico para la estructura del conocimiento
científico. En su lugar, los modelos del conocimiento basados en la
observación y la generalización a partir de ésta se hicieron más atrac
tivos, al menos para la mayoría de los filósofos.
David Hume sugirió que, de hecho, no podía existir un conoci
miento auténtico del mundo fundado en la autoevidencia intuitiva y
la inferencia lógica. Dicho conocimiento infalible, sugirió, sólo podía
ser conocimiento de proposiciones «vacías», proposiciones verdade
ras sólo en virtud de la definición de sus términos (tal como la pro
posición de que ningún soltero está casado). Toda proposición verda
dera, llena de contenido, podía conocerse, si es que podía, sólo con
dependencia de los sentidos y por la generalización de los mismos
que nos condujo a las creencias en las relaciones causales en el mun
do. En particular, Hume negó toda posibilidad a la metafísica, la ra
ma de la filosofía que se ocupa de establecer verdades profundas y
generales acerca de la naturaleza del mundo sobre la base del razona
miento puro únicamente.
La respuesta de Immanuel Kant a Hume fue especialmente im
portante.. Pese a coincidir con Hume en el rechazo escéptico de la
mayor parte de la metafísica tradicional, Kant reservó una pequeña
parte de ésta como constituida por aserciones verdaderamente llenas
de contenido, establecidas sin referencia alguna a la observación o al
experimento. Que semejantes verdades llenas de contenido pudieran
ser conocidas por la razón pura, argumentaba, quedaba demostrado
por la existencia de las dos ramas de la verdad matemática pura, la
geometría y la aritmética. Estas dos disciplinas consistían en verdades
Espacio, tiempo, movimiento 31
de las que ninguna persona racional podía dudar y que habían sido
establecidas por medio de la razón pura únicamente. Pero las verda
des de estas disciplinas, pensó, no eran del tipo «vacío» evidentemen
te. No forma parte del significado de «triángulo» que los ángulos in
teriores de un triángulo sumen 180° en el mismo sentido que forma
parte del significado de «soltero» que un soltero no esté casado.
Kant sostenía que semejantes verdades llenas de contenido, que
podían ser establecidas por la razón, existían porque reflejaban la es
tructura del aparato perceptivo y cognitivo de nuestras mentes con el
que aprehendíamos la naturaleza del mundo. Decía que una porción
limitada de la metafísica tradicional, la cual incluía aserciones tales
como «todo suceso tiene una. causa», compartía con la geometría y
con la aritmética la cualidad de poseer un contenido verdadero y, pe
se a ello, ser cognoscible con independencia de la observación y del
experimento. Lo importante acerca de estas afirmaciones generales
para nuestros propósitos es el papel que en ellas juega la geometría.
Aun cuando la esperanza en una física, una psicología o una ética
fundada en la razón pura sea vana, ¿no persiste la teoría del espacio
— la geometría— , junto a la aritmética, como un cuerpo de conoci
miento que no se funda en una generalización de los hechos concre
tos observados que nos proporcionan los sentidos?
Muchos intentaron en los años posteriores a Kant justificar el pa
recer de Hume de que sólo podía demostrarse que las aserciones
que contenían enunciados verdaderamente informativos sobre el
mundo fuesen correctas mediante su confrontación con los datos de
la experiencia observacional. El estatus problemático de la geometría
y la aritmética recibió una gran dosis de atención, pues, si Hume te
nía razón, las disciplinas matemáticas podrían versar sobre el mundo
o podrían ser conocidas por la razón pura, pero nunca ambas cosas a
la vez. Algunos intentaron mostrar que esas disciplinas podían rete
ner su estatus de cognoscibilidad con independencia de la experien
cia observacional, pero sólo porque estaban libres de un contenido
verdaderamente informativo. Varias tentativas de mostrar que la ver
dad matemática era el resultado de la lógica pura, combinada con la
definición de los términos matemáticos en el vocabulario puramente
lógico, se vieron suscitadas de esta forma.
Otros buscaron, por el contrario, preservar el contenido verdade
ramente informativo de las ciencias matemáticas, pero rechazar la
pretensión kantiana de que pudieran ser establecidas por cualquier
Filosofía de la física
proceso <Je razonamiento puro que las hiciera, a diferencia de las
ciencias ordinarias, inmunes a la confrontación con la observación
como prueba definitiva de su credibilidad. J. S. Mili, por ejemplo, ar
guyo que incluso las proposiciones de la aritmética eran establecidas
por un proceso de generalización a partir de los resultados de obser
vaciones particulares. Podía parecer que las leyes básicas de la arit
mética poseían un tipo de certeza autogarantizada. Pero esto era una
ilusión. Nosotros derivamos las leyes de la aritmética de nuestra ex
periencia sensorial. Esta experiencia, sin embargo, nos es tan familiar
y está tan extendida que nos lleva a pensar erróneamente que las le
yes de la aritmética no precisan de ninguna confirmación empírica.
De hecho, Mili pensó que, al igual que las leyes de la física y la quí
mica, las leyes de la aritmética sólo podían ser establecidas por gene
ralización a partir de la experiencia empírica.
Algunos teóricos del conocimiento reflexionaron sobre el modo
en que nuestras creencias forman una red compleja de aserciones, al
gunas de las cuales son invocadas siempre que la sensatez de creer
en algunas de las otras es cuestionada. También observaron el grado
al que nuestras creencias deben estar fundadas en principios de infe
rencia, tales como aceptar como razonable la teoría más simple que
podamos imaginar en consonancia con los datos empíricamente rele
vantes. Los teóricos también argumentaron que estos principios pare
cían inteligibles y justificables sólo si se admitía un conjunto ya exis
tente de creencias que permanecían irrebatibles por el momento.
Veían con escepticismo la utilidad de cualquier distinción rígida en
tre proposiciones cognoscibles mediante la razón pura y aquellas cog
noscibles sólo con dependencia de los datos experimentales. De he
cho, muchos veían con escepticismo la posibilidad de dividir
nuestras creencias, como Hume quería hacer, en dos grupos: aquellas
que son verdaderas por convención (o por definición o por el mero
significado de los términos) y aquellas con un contenido informativo
genuino.
Desde esta perspectiva, todas nuestras creencias forman parte de
un tejido sin costuras de creencia teórica. Cada proposición contiene
elementos de convención y elementos de objetividad. En opinión de
estos filósofos, cada proposición confronta la experiencia sensorial
sólo cuando se une a un amplio cuerpo de creencias aceptadas. Sólo
como parte de una estructura teórica general puede ser una proposi
ción probada por la experiencia o confirmada por ella. Es este cuer
Espacio, tiempo, movimiento 33
po de creencias aceptadas, afirmaban, lo que fundamenta nuestros
principios de legítima inferencia científica.
No va a ser tarea nuestra en este libro examinar las diferentes op
ciones en alguna profundidad. En lugar de ello exploraremos más
adelante el impacto de los cambios en el lugar ocupado por la geo
metría en las matemáticas y en la física que influyeron en, y se vieron
influidos por, el problema más general de los fundamentos de la legí
tima creencia científica. Ya hemos indicado que la existencia tempra
na de la geometría como cuerpo ideal de un conocimiento verdade
ramente científico sobre el mundo condujo a muchos filósofos a
limitar el conocimiento auténtico a aquél que pudiera ser establecido
por una impecable derivación lógica a partir de primeros postulados
autoevidentes e incuestionables. El descubrimiento y la exploración
por los matemáticos de alternativas a la familiar geometría euclídea,
que había reinado como la única geometría matemática durante mu
chos siglos, y la posterior aplicación de las recién descubiertas geo
metrías alternativas a las teorías físicas que intentaban describir el
mundo real fueron influencias clave sobre los filósofos que buscaron
polemizar con las cuestiones planteadas por el conflicto entre Kant y
Hume y llevadas adelante por otros. Estas eran las cuestiones concer
nientes al fundamento último de nuestra creencia científica sobre el
mundo y a la medida en que esa creencia era responsable de los
datos evidencíales particulares de la observación y del experimento.
Cuestiones acerca de la naturaleza de la realidad
La geometría es la ciencia descriptiva del espacio. Pero, ¿qué clase de
cosa es el espacio? O mejor dicho, ¿cómo podemos integrar la espa-
cialidad del mundo en nuestra concepción global sobre la clase de
cosas y propiedades que existen? Es evidente que la espacialidad es
uno de los aspectos más generales y fundamentales del mundo según
lo experimentamos y según construimos su naturaleza por inferencia
a partir de dicha experiencia. En nuestro lenguaje y práctica corrien
tes nos sentimos plenamente contentos con el uso que hacemos de
nociones espaciales tales como distancia, contención espacial, y conti
nuidad y discontinuidad en el espacio, cuando tratamos con las im
portantes estructuras que rigen el mundo material que nos rodea.
Filosofía de la física
Pero cuando intentamos reflexionar sobre lo que el espacio es en y
por sí mismo nos vemos desconcertados.
Quizá lo primero que nos venga a la mente es que el espacio es
una suerte de «continente» de la materia del mundo. Pensamos en
las cosas como existentes en el espacio, de hecho, en un único espa
cio total que contiene todas las cosas materiales del mundo. Pero in
cluso esta idea de contención causa perplejidad, pues parece que el
espacio contiene objetos en virtud de la coincidencia virtual de los
objetos con los trozos del espacio mismo. Un objeto ocupa la parte
de espacio en la que se encuentra. Esto es claramente una clase de
contención diferente a la de, pongamos, un objeto contenido en una
caja.
Se nos ocurre de manera natural que podemos imaginar un mun
do vacío de todas las cosas materiales, pero conservando aún una cla
se de realidad. Se trataría de un espacio vacío esperando a ser llena
do, o parcialmente llenado, por trozos de materia. Esta idea de
espacio como una clase de entidad, el continente fijo e invariable de
las cosas materiales ordinarias que pueden llegar a ser y dejar de ser
y pueden sufrir cambios en su naturaleza, está probablemente pre
sente en el diálogo de Platón en el Timeo acerca del espacio como
«receptáculo» del ser material.
Pero, ¿qué clase de cosa o sustancia singular es esta fantasmal en
tidad. el espacio mismo? Nos sentimos ciertamente con derecho a
hablar de «el espacio vacío entre las estrellas» o, incluso, a imaginar
el espacio completamente vacío de un mundo en el que toda la ma
teria fue de alguna forma destruida como por arte de magia. Pero,
¿qué clase de cosa es esta sustancia que pretendemos llamar «espacio
vacío»? ¿Se trata de un único objeto particular del que forman parte
ciertos espacios, como el espacio de una habitación, al igual que un
trozo de pan forma parte de una barra entera? Esta cosa, el espacio,
tiene características, por ejemplo, las características descritas por las
verdades de la geometría. No obstante, nuestra intuición nos dice
que pl espacio mismo es demasiado diferente de la materia ordinaria,
demasiado insustancial, para poder ser considerado como una cosa
en el mundo, junto a las cosas ordinarias que se encuentran en el es
pacio. Pero, ¿de qué otra manera podemos ver la cuestión?
Aristóteles hablaba de «lugar». Es difícil descifrar lo que tenía en
mente exactamente, pero parece como si por lugar entendiese el con
torno o límite de un trozo de materia. El movimiento es cambio de
Espacio, tiempo, movimiento 35
lugar, ya que un objeto cambia la superficie que lo limita por otra.
Pero, ¿significa esto que el espacio es alguna cosa adicional sobre y
por encima de la materia contenida en él? Uno presiente que Aristó
teles está intentando escapar a esa conclusión, pero que no sabe qué
esquema conceptual poner en su lugar. Pronto examinaremos la prin
cipal tentativa llevada a cabo por los filósofos posteriores para encon
trar un esquema conceptual que haga justicia a las afirmaciones que
queremos hacer sobre objetos que existen en el espacio, que ocupan
un lugar, que son capaces de cambiar de lugar, etcétera, y que haga
también justicia a nociones intuitivas tales como la posibilidad de un
espacio desprovisto de materia. Esa propuesta posterior intentará
también evitar el escándalo de pensar en el espacio como un compo
nente adicional del ser que puede tener una realidad independiente
de la existencia misma de la materia en él.
Si el espacio nos causa perplejidad, el tiempo nos desconcierta
todavía más. Nuestra intuición nos dice de nuevo que todo lo que
ocurre en el mundo ocurre en el tiempo. Aun cuando pensemos al
gunas veces que nuestros estados mentales subjetivos podrían no
estar en el espacio (¿dónde, por ejemplo, se localizan los pensamien
tos?), pensamos que incluso nuestros pensamientos deben producirse
en algún momento en el tiempo. Tenemos la impresión de que hay
un único tiempo en el que ocurre todo lo que ocurre, abarcando
cualquier proceso extenso una parte del tiempo total del mundo.
Algo similar al aspecto de continente del espacio parece ser cierto
también para el tiempo. Los tiempos de procesos que ocupan tiempo
coinciden con momentos del «tiempo mismo». Y, pensamos, es posi
ble imaginar intervalos de tiempo en los que no se dan acontecimien
tos materiales. ¿No podemos imaginar un mundo en el que toda la
materia y sus manifestaciones hubieran desaparecido, pero en el que
el tiempo proseguiría como siempre lo había hecho?
Pero si concebir el espacio como una «cosa» es extraño, mucho
más extraño es concebir el tiempo como una «entidad» en el sentido
ordinario. Pero si puede haber un flujo del tiempo aun cuando la
materia cese de existir, ¿no debemos reconocer al tiempo un tipo de
ser independiente de la existencia de las cosas ordinarias del mundo
y de sus cambios ordinarios en el tiempo?
Otras conexiones entre temporalidad y ser nos dejan más perple
jos todavía. Parece que pensamos que la existencia misma de las
cosas ordinarias está vinculada al tiempo en una forma que no lo está
36 Filosofía de la física
al espacio. Si algo existió en el pasado, pero no existe ahora, pensa
mos que no existe en absoluto, propiamente hablando. Y lo mismo
puede decirse de los objetos futuros que todavía no existen. Pero,
como san Agustín indicó, el presente es un instante evanescente de
tiempo, que hace que nos preguntemos cómo podemos decir con
propiedad de las cosas, dada su naturaleza temporal, que tienen una
existencia. A diferencia del espacio, el tiempo parece tener un aspec
to asimétrico. El pasado y el futuro nos parecen muy diferentes, con
el pasado como una realidad fija, si bien desaparecida, y el futuro
como algo, quizá, sin una clase determinada de ser hasta que ocurre.
Otras características de la temporalidad de las cosas desconcerta
ron tanto a los antiguos filósofos que algunos se volvieron completa
mente escépticos respecto a la realidad del tiempo y a su cambio
concomitante. Zenón de Elea propuso argumentos tratando de mos
trar que las nociones ordinarias de tiempo estaban plagadas de con
tradicciones. ¿Cómo podía darse algo semejante al movimiento, por
ejemplo, si en cualquier instante particular un objeto estaba en repo
so en el espacio que ocupaba en ese momento? Sucede que algunos
de los argumentos con los que Zenón pretendió poner de manifiesto
ciertas contradicciones internas en las nociones mismas de tiempo y
movimiento serían ahora juzgadas falaces. No obstante, los dilemas
que Zenón planteó en otros argumentos proporcionan todavía un
punto de partida ventajoso a la discusión de cuestiones tales como
los esquemas conceptuales correctos para tratar la noción de espacio
y tiempo como continuos y del concepto de movimiento. Muchos lo
gros valiosos en filosofía, así como el desarrollo de las matemáticas
apropiadas para tratar el movimiento, se han visto inspirados por las
tentativas de resolver los enigmas planteados por Zenón.
Aristóteles sorprende de nuevo al lector moderno con su pene
tración, aun cuando, desde la perspectiva moderna, lo que tiene que
decir pueda ser interpretado de una multiplicidad de maneras. Aris
tóteles concibe el tiempo como algo distinto al movimiento, o cam
bio de las cosas materiales, así como el espacio no puede ser identifi
cado con los objetos que hay en él. Pero, señala, sin movimiento o
cambio no tendríamos conciencia alguna del paso del tiempo. Así, en
una forma paralela a su noción de lugar como espacialidad de los
cuerpos, distinto al cuerpo pero sin existir como entidad indepen
diente separada de los cuerpos en el mundo, habla del tiempo como
una medida del movimiento y del cambio. Pero queda sin aclarar jus-
Espacio, tiempo, movimiento 37
tamente qué se supone entonces que es el tiempo. Es algo que de
pende de las cosas y de sus movimientos y cambios, pero no es esos
movimientos y cambios. ¿Qué es entonces?
El desconcierto sobre la naturaleza del espacio y del tiempo se
debe en gran parte a su doble papel como proveedor de un foro, tan
to para la evolución de los fenómenos físicos, como para los conteni
dos de lo que intuitivamente consideramos como nuestra conciencia
subjetiva o privada. Los filósofos argumentaron con frecuencia que
mientras los objetos físicos y sus procesos tenían lugar en el espacio y
en el tiempo, los contenidos mentales de nuestras mentes existían
sólo en el tiempo. Sin embargo, sentimos que un modo espacial es
apropiado incluso para describir, pongamos, los contenidos visuales
de nuestros sueños. El gato soñado y el felpudo soñado pueden ser
irreales como objetos auténticos, pero el gato soñado puede parecer-
nos que está sobre el felpudo de una forma similar al menos a como
pensamos que un gato real puede estar sobre un felpudo real. Algún
tipo de espacialidad parece, pues, formar parte integrante incluso de
nuestros fantasmas mentales.
Seguramente, además, los sucesos de nuestros sueños ocurren en
un orden temporal, aun cuando estemos convencidos de que se trata
de un orden en el tiempo de acontecimientos irreales. No obstante,
parece haber de nuevo algunas diferencias entre el espacio de lo
mental y su temporalidad. El espacio en el que existen el gato y el
felpudo soñados parece no estar en «ningún lugar» en lo que con
cierne al espacio real. Parece tratarse de una clase de espacio separa
do del espacio de las cosas físicas. Pero los procesos soñados nos pa
recen ocurrir en el mismo tiempo que el tiempo que comprende los
sucesos físicos. El sueño del golpe con el coche ocurrió después de
que me fuera a dormir y antes de que despertara, en el mismo orden
temporal en que estuve echado en la cama. Pero el espacio del golpe
ilusorio con el coche no puede ser adaptado a ningún lugar real, ni
siquiera al espacio real de mi cabeza donde el mecanismo de mi sue
ño, mi cerebro, está localizado.
Como veremos, no existe una solución sencilla al problema de
poner en un esquema coherente un modelo sobre la naturaleza del
tiempo y del espacio que haga justicia a las intuiciones que acabamos
de examinar. Nuestro relato debería explicar en qué consiste la natu
raleza del espacio y el tiempo. ¿Qué tipo de ser poseen y cómo se re
laciona su ser con el de las cosas y procesos más ordinarios que ocu
38 Filosofía de la física
pan espacio y acaecen en el tiempo? ¿Cómo hace justicia esta natura
leza del espacio y el tiempo a nuestras intuiciones sobre la espaciali-
dad y la temporalidad, ya sea de los acontecimientos físicos del mun
do o de los contenidos de nuestra experiencia subjetiva? Y, por
último, ¿qué es lo que en la naturaleza del espacio y el tiempo nos da
acceso al conocimiento que decimos poseer sobre su naturaleza, una
clase de conocimiento que algunos consideraron el modelo mismo
de la certeza que podíamos obtener sobre el mundo generada por
nuestra razón pura únicamente?
El debate entre Newton y Leibniz
En el siglo xvil, la filosofía del espacio y el tiempo se convirtió en
una cuestión central de la metafísica y la epistemología. La discusión
alcanzó un punto culminante en el importante debate entre G. W.
von Leibniz, el gran filósofo y matemático alemán, y Newton, el gran
físico y matemático inglés. En su debate se perfilaron dos teorías con
trarías acerca del lugar del espacio y el tiempo en el mundo, y mu
chas de las cuestiones fundamentales que en los años posteriores
ocuparon a los filósofos interesados en el espacio y el tiempo reci
bieron su formulación más clara.
Leibniz ofreció una descripción del espacio y el tiempo que por
fin presentaba un claro entendimiento de cómo la teoría podía, al es
tilo aristotélico, negar al espacio y al tiempo un tipo de ser indepen
diente sobre y por encima del ser de las cosas materiales ordinarias y
de los acontecimientos materiales, pero podía conservar para el espa
cio y el tiempo un lugar crucial en la estructura del mundo. En la fi
losofía «profunda» de Leibniz, su verdadera metafísica, se niega la
existencia per se de la materia, así como la del espacio y el tiempo. En
este Leibniz esotérico, el mundo está constituido por entidades fun
damentales de tipo mental, las mónadas, que existen en un total ais
lamiento unas de otras, sin siquiera interaccionar por medio de la
causalidad. Cada mónada contiene dentro de su naturaleza una ima
gen completa del universo entero, lo cual explica cómo, sin interac
ción, pueden mostrar una evolución coherente en el tiempo.
Debemos dejar a un lado esta concepción leibniziana «profunda» del
mundo que, si bien es extraña, ha sido defendida de formas ingenio
sas e importantes. Su concepción menos profunda, exotérica, del es
Espacio, tiempo, movimiento 39
pació y el tiempo posee una suerte de estatus intermedio entre la
concepción que dota de existencia a la materia, al espacio y al tiem
po, y la última concepción monadológica.
En esta posición intermedia puede suponerse la existencia de ob
jetos materiales y de sucesos materiales. ¿Qué son entonces el espa
cio y el tiempo? Consideremos dos sucesos cualesquiera que imagi
namos como acontecimientos instantáneos entre las cosas materiales.
Los sucesos tienen una relación temporal entre sí, siendo el primer
suceso posterior a, simultáneo con, o anterior al segundo suceso en el
tiempo. Podemos avanzar aún más a una relación cuantitativa entre
los sucesos, estando el primer suceso separado del segundo en el
tiempo por algún intervalo-temporal definido, que podría ser positi
vo, cero o negativo. La idea sencilla de Leibniz es que el tiempo es
justamente la colección de todas las relaciones temporales de esa ín
dole entre los sucesos. Si no hubiera sucesos, no habría relaciones, de
manera que el tiempo en el sentido indicado carece de una existen
cia independiente de los sucesos en él. Pero las relaciones entre los
sucesos son una componente real del mundo (desde esta perspectiva
exotérica). Así, sería erróneo decir que no hay en absoluto una tal
cosa como el tiempo.
Si consideramos todas las cosas del mundo en un tiempo dado,
vemos relaciones espaciales entre ellas. Las cosas se encuentran a
ciertas distancias unas de otras y en ciertas direcciones unas respecto
de otras. La colección de todas estas relaciones espaciales entre los
objetos del mundo en un tiempo dado es lo que es el espacio. De
nuevo, no hay ningún continente, ningún espacio mismo, esperando
a ser ocupado por objetos. Tan sólo están los objetos y las innumera
bles relaciones espaciales que mantienen entre sí.
La analogía con las relaciones de parentesco nos puede ayudar a
ver esto con mayor claridad. Cualquier gran familia consiste en un
número de personas. Éstas se encuentran relacionadas entre sí en las
formas conocidas. A puede ser padre de B, C primo-hermano de D, etcétera. ¿De qué «materia» está hecha la realidad de una gran fami
lia? Respuesta: de las personas en la familia. Pero, claro está, las rela
ciones que unen a estas personas constituyen aspectos perfectamente
reales del mundo. ¿Podríamos, pues, pensar que las relaciones existen
con independencia de las personas? ¿Podría haber un tipo de «espa
cio relacional» que existe en y por sí mismo, esperando a ser ocupa
do por personas? Semejante conversación es manifiestamente absur-
■10 Filosofía de la física
tía. Mués bien, dice Leibniz, lo mismo que sucede con el «espacio re-
lacional», sucede con el espacio ordinario. Hay cosas y hay relaciones
espaciales entre las cosas. Pero no hay ningún continente que exista
independientemente, el espacio mismo, de la misma forma que no
hay nada que exista independientemente, el «espacio relacional».
Todo suceso que acontece en el mundo material o mental está
relacionado en el tiempo con todo otro suceso. Y todo objeto mate
rial está relacionado espacialmente con todo otro objeto material.
Estas dos familias de relaciones comprenden, pues, toda la realidad.
Pero existen como una colección de relaciones entre los sucesos y las
cosas sustanciales del mundo, no como sustancias independientes
ellas mismas.
Vaya, esto no es tan sencillo. ¿Qué es de los momentos de tiem
po cuando no ocurre nada? ¿Qué es de las regiones desocupadas del
espacio donde no hay nada? ¿Deberíamos negar sencillamente su
realidad? Leibniz sugiere un medio que nos permite mantener estas
nociones como legítimas sin dejar de ser relacionistas. Consideremos
el espacio vacío entre el lugar donde nos encontramos y una estrella.
No hay nada que mantenga con nosotros la relación espacial de estar
a medio camino entre nosotros y la estrella. Sin embargo, algo podría tener esa relación espacial con nosotros y con la estrella. Así pues,
podríamos imaginar los lugares desocupados como relaciones espa
ciales que algo podría poseer con los objetos del mundo pero que en
realidad no son poseídos por nada. El espacio es, dice Leibniz, «en
cuanto a posibilidad», el conjunto de relaciones espaciales entre las
cosas. De manera que la familia de relaciones contiene relaciones
tanto posibles como reales. Podríamos incluso pensar en restaurar la
noción de un espacio totalmente vacío en esta forma. Aun cuando no
hubiera objetos reales, podría haber objetos, y si los hubiera, presen
tarían relaciones espaciales entre sí. Así pues, el espacio totalmente
vacío, que para los antirrelacionistas es una noción inteligible, podría
convertirse para el relacionista en la colección de las relaciones posi
bles (pero no reales) que los objetos materiales posibles (pero no re
ales) podrían presentar entre sí, si tales objetos existiesen. Si el tole
rar tales «relaciones en posibilidad» significa dejar el juego en manos
de los antirrelacionistas, sigue siendo una cuestión de debate filo
sófico.
Leibniz no propone simplemente su descripción relacionista del
espacio y el tiempo de manera dogmática como una alternativa a la
Espacio, tiempo, movimiento 41
concepción según la cual el espacio y el tiempo son cosas con una
existencia independiente. La concepción del continente parece consi
derar el espacio como un tipo de sustancia. Las cosas existen en el
espacio, según esta concepción, por coincidir con un trozo limitado
de sustancia espacial. Pero, afirma Leibniz, dicha concepción está
plagada de dificultades.
Imaginemos que existe el espacio vacío y a Dios intentando deci
dir dónde colocar al universo material en el espacio. No hay razón al
guna para poner al universo en un lugar y no en otro. Como cada
punto o región del «espacio mismo» es igual a cualquier otto punto o
región, no podría haber un motivo por el que elegir un lugar para el
mundo material frente a otro. Pero Leibniz cree que todo hecho
debe tener una razón suficiente para darse. Como la ubicación del
universo material en el espacio mismo no puede tener tal razón sufi
ciente, no puede darse tal cosa. Pero la concepción del espacio como
continente, y no como mero conjunto de relaciones espaciales entre
las cosas, entraña la existencia de ubicación en el espacio mismo. Por
lo tanto, dicho espacio continente no puede existir.
Leibniz argumenta además que no habría ninguna diferencia ob
servacional por estar el mundo material ubicado en un lugar del es
pacio mismo y no en otro, pero sostiene que un hecho semejante (la
ubicación en el espacio mismo) sin consecuencias observacionales no
es realmente un hecho. De hecho, haciendo uso del principio según
el cual un mundo posible que es exactamente igual en todas sus ca
racterísticas a otro mundo posible debe ser el mismo mundo posible,
arguye que la propia noción de espacio mismo es incoherente. Si el
espacio mismo existiese, podría haber dos espacios posibles exacta
mente iguales, excepto en la diferente ubicación en el espacio mismo
del mundo material en cada uno de dichos mundos posibles. Pero tal
diferencia de ubicación en el espacio mismo no es una diferencia re
al. No puede haber, pues, dos mundos posibles semejantes y, por
consiguiente, la teoría del espacio mismo como continente, según la
cual podría haber dos mundos posibles semejantes, debe estar equi
vocada.
La postura relacionista leibniziana es, pues, que concebir el espa
cio como una cosa por derecho propio conduce a la incoherencia.
Además, el concebirlo como la colección de todas las relaciones es
paciales entre las cosas materiales nos permite decir todo lo que ne
cesitamos decir que es coherente sobre la espacialidad del mundo.
42 Filosofía de la física
La descripción relacionista es, pues, la que deberíamos adoptar. Y
una concepción similar del tiempo como la familia de las relaciones
temporales entre los sucesos materiales se supone que da al traste
con toda conversación sobre el «tiempo mismo» como una entidad
constituyente del mundo.
Pero hay objeciones abiertamente filosóficas al relacionismo, es
pecialmente al tipo de relacionismo que recurre a relaciones posibles.
Para el relacionista, la estructura del espacio, tal y como es revelada
por la geometría, es la estructura de la colección de todas las relacio
nes espaciales posibles entre los objetos. Pero ¿cuál es el «fundamen
to» de esta estructura de posibilidades? Con esto quiero decir lo si
guiente: Si pensamos en la mayoría de las posibilidades físicas, éstas
son comprensibles sólo debido a alguna estructura real subyacente.
Un trozo de sal, por ejemplo, aun cuando no se haya disuelto, contie
ne la «posibilidad» de pasar a la solución. Es, decimos, soluble. Pero
esta solubilidad estriba en la constitución real del trozo de sal no di
suelta por iones. En el caso de la estructura del espacio mismo, que
los relacionistas entienden como la estructura que describe la colec
ción de todas las relaciones espaciales posibles, ¿cuál es la realidad
subyacente que fundamenta este orden entre posibilidades, si no es
la estructura del «espacio mismo» como los antirrelacionistas ima
ginan?
El oponente de Leibniz, el gran físico Newton, fue un antirrela-
cionista. Newton considera al espacio y al tiempo como algo más que
meras relaciones espaciales y temporales entre los objetos y sucesos
materiales. Qué era exactamente este algo más, no podía decirlo con
seguridad. Considera que es algo similar a la sustancia, pero en oca
siones prefiere pensar que es un atributo o propiedad, de hecho una
propiedad de Dios. Aunque aporta algunos argumentos puramente fi
losóficos en contra del relacionismo leibniziano, Newton es famoso
principalmente por sostener que los resultados de la observación y
del experimento pueden refutar de manera concluyente la doctrina
relacionista.
En la física desarrollada por Newton a partir de los trabajos ante
riores de Galileo y otros, hay un claro contraste entre movimientos
inerciales y movimientos no inerciales. Los movimientos inerciales se
considera que son movimientos de un objeto con una velocidad
constante, esto es, con una velocidad invariable y en una dirección
fija. Ahora bien, para un relacionista, nociones tales como «velocidad
Espacio, tiempo, movimiento •43
invariable» y «dirección fija» pueden ser entendidas solamente en re
lación a un marco de referencia determinado por algunos objetos
materiales. Algo que está en reposo en relación a la superficie de la
tierra, por ejemplo, está en rápido movimiento en una dirección que
varía constantemente en relación a un sistema de referencia fijo, pon
gamos, en el sol. Pero, arguye Newton, la noción de movimiento no
inercial no es la de un movimiento «meramente relativo», sino la de
un movimiento que es «absoluto».
¿Por qué? Los movimientos no inerciales generan «fuerzas» que
se ponen de manifiesto en efectos demostrables. El agua en un cubo
giratorio desborda la pared del cubo. Los pasajeros se balancean ha
cia delante o hacia atrás cuando un tren acelera o frena para parar. Si
dos trenes se encuentran en aceleración relativa, podría suceder que
los pasajeros en uno de los trenes sintieran la aceleración mientras
que los del otro no sintieran nada en absoluto. Por ejemplo, un tren
puede estar parado en la estación, mientras el otro está frenando pre
cipitadamente. No obstante, ambos trenes están acelerando uno con
respecto al otro. La única explicación posible para la asimetría entre
los trenes es que existe una aceleración «absoluta», aceleración que
es cambio de velocidad no sólo en relación a algún sistema de refe
rencia material arbitrario.
Newton sostiene que dichos efectos inerciales serán los mismos
en todo lugar y en todo tiempo a lo largo del universo. Después de
todo, tales efectos inerciales son justamente los que evitan, por ejem
plo, que los planetas se precipiten sobre el sol. Así, la aceleración, la
aceleración absoluta, genera efectos observables. Pero la aceleración,
incluida la aceleración absoluta, es aceleración relativa a algo. Si no
puede ser entendida como una aceleración relativa a los objetos ma
teriales ordinarios del mundo, sólo puede ser entendida como una
aceleración relativa al «espacio mismo». Así, el espacio mismo no es
simplemente un «continente» de objetos, un modo algo torpe quizá
de referirse al hecho de que las cosas materiales están relacionadas
espacialmente unas con otras. Es un objeto que entra en una relación
causal con los objetos materiales. Así como el movimiento relativo de
un ladrillo y una ventana hace que el ladrillo rompa la ventana, así la
aceleración relativa de los pasajeros y el espacio mismo se manifiesta
mismamente en las fuerzas inerciales generadas como resultado de
dicho movimiento relativo.
Aunque concebir el tiempo como un tipo de «objeto» resulta me
II Filosofía de la física
nos convincente que en el caso del espacio mismo, el tiempo debe,
según Newton, ser también absoluto en un sentido importante. Para
el relacionista, la medida del paso del tiempo es algún cambio o mo
vimiento en una cosa material. En relación a un reloj, un proceso po
dría ser regular, con algún suceso recurrente en intervalos iguales de
tiempo. En relación a otro reloj diferente, sin embargo, el mismo pro
ceso podría parecer irregular. Éste será el caso a no ser que el segun
do reloj sea «regular» según los criterios del primer reloj. Para el rela
cionista no hay una medida «absoluta» del paso del tiempo, tan sólo
la elección de algunos relojes como preferidos debido a la simplici
dad de nuestra descripción del mundo en su medida del tiempo.
Ahora bien, el movimiento acelerado da lugar a efectos no presentes
en el movimiento no acelerado. Y esta aceleración es absoluta. Pero
el movimiento acelerado en una línea recta puede ser representado
como no acelerado si se elige una medida de tiempo suficientemente
singular, una que haga parecer uniforme a la velocidad, acelerando y
retardando la medida del tiempo en función del cambio de veloci
dad del objeto. Pero la aceleración real es absoluta, de manera que la
medida del tiempo debe ser asimismo absoluta. Hay un tiempo «en
sí mismo» que «fluye uniformemente con independencia de la medi
da de los relojes particulares». Los buenos relojes se ajustan a este
tiempo absoluto; los malos relojes no lo hacen.
Con Newton, pues, un nuevo elemento es introducido en el viejo
debate filosófico entre aquellos que considerarían el espacio y el tiem
po como constituyentes autónomos del mundo y aquellos que verían
en ellos un compendio meramente de relaciones entre las cosas fun
damentales del mundo, los objetos materiales y sus cambios. Para el
newtoniano, el espacio y el tiempo son elementos teóricos postulados,
cuya existencia debe presuponerse para poder explicar los fenómenos
a nuestro alcance en el nivel observacional-experimental.
Las reacciones a la transformación que sufrió con Newton el vie
jo debate filosófico fueron múltiples y variadas a lo largo de los dos
siglos que siguieron a sus argumentos. Las propuestas tempranas que
intentaron encontrar una explicación para los fenómenos newtonia-
nos y que postularon solamente las cosas materiales y las relaciones
entre éstas de los relacionistas, fracasaron. El mismo Leibniz admitió
que era esencial tener una idea de «cuál es el objeto que se mueve»
en los movimientos relativos. Él buscó una explicación de esta distin
ción en el objeto sobre el que actuaba la causa del movimiento.
Espacio, tiempo, movimiento 45
Muy pronto se hizo evidente que la doctrina de Newton tenía
consecuencias peculiares. Dado que el «espacio mismo» existía, la
posición de un objeto en el espacio mismo y el movimiento unifor
me de un objeto con respecto al espacio mismo eran características
reales del mundo, aun cuando, a diferencia de la aceleración del
objeto con respecto al espacio mismo, no dieran lugar a ningún fe
nómeno observacional. Algunos resultados de la física sugerían que
el movimiento uniforme absoluto podría entrañar fenómenos de ti
po óptico, en lugar de mecánicos, como detectables; como vere
mos, estas conclusiones resultaron ser erróneas. Propuestas poste
riores, planteadas tras las innovaciones en nuestras ideas .sobre el
espacio y el tiempo inspiradas en la teoría de la relatividad, postu
laron nociones del espacio y el tiempo que iban a permitir definir
la aceleración absoluta, pero no la posición espacial y la velocidad
absolutas.
En el siglo xix, el filósofo y físico E. Mach intentó, una vez más,
reconciliar los resultados de la física newtoniana con el enfoque rela
cionista del espacio y el tiempo. Señaló el importante hecho de que
la velocidad de rotación de la tierra, determinada mediante la obser
vación de las estrellas fijas, y la velocidad de rotación absoluta de la
tierra, determinada mediante experimentos puramente mecánicos,
dependientes de las fuerzas generadas por la rotación, eran la misma.
¿Podría esto sugerir un origen para las fuerzas inerciales, uno no ima
ginado por Newton? Supongamos que la aceleración de un objeto
material con respecto a otro genera fuerzas, al igual que la velocidad
relativa de dos partículas cargadas genera una interacción magnética.
Supongamos que esta fuerza es sumamente independiente de la sepa
ración de los objetos, pero dependiente de sus masas. ¿No debería
mos imputar las fuerzas generadas por las aceleraciones, que Newton
atribuyó a la interacción causal entre el objeto prueba y el espacio
mismo, a la aceleración relativa del objeto prueba respecto a las es
trellas fijas o, mejor dicho, respecto al promedio de materia «infor
me» del universo? Si esto fuera así, ¿no estaríamos en posición de re
conciliar los hechos observacionales que Newton utilizó para
defender la existencia de un tipo de espacio sustancial, con un rela-
cionismo leibniziano para el que todas las posiciones, velocidades y
aceleraciones eran características de una cosa material en relación a
otra cosa material?
Al final del siglo XIX, pues, la situación era más o menos la si-
4<) Filosofía de la física
guíente: todos coincidían en que había dos vastas dimensiones de la
realidad, todas las cosas materiales existentes en el espacio y todos
los acontecimientos, materiales o mentales, que se daban en el tiem
po. La estructura de estos foros del mundo se conocía. El tiempo po
día ser visto como un simple continuo unidimensional. El espacio era
una estructura tridimensional descrita por la familiar geometría euclí-
dea. Parecía que podíamos conocer esta estructura por inferencia a
partir de primeros principios cuya verdad era, de alguna manera, in
cuestionable, esto es, cuya verdad era dada a la persona racional por
algún tipo de razón pura. La naturaleza de estos continentes de todas
las cosas y acontecimientos no estaba clara desde una perspectiva fi
losófica. Los sustantivistas en la línea de Newton contendieron con
los relacionistas, que llevaron a sus últimas consecuencias las ideas
de Leibniz. Otros, como el filósofo Kant, para quien el espacio y el
tiempo eran estructuras organizadoras de la mente por las que dotá
bamos a la sensación de una horma comprensible, mantuvieron dife
rentes concepciones metafísicas.
El espacio y el tiempo podían ser descritos matemáticamente,
como podía serlo el movimiento de las cosas materiales en el espa
cio con el paso del tiempo. La caracterización mediante leyes de este
movimiento en los términos de la cinemática (la descripción del mo
vimiento) y la dinámica (su explicación en términos de fuerzas) cons
tituyó la disciplina central de la física. Un aspecto de esta teoría físi
ca era la necesidad en ella de distinguir las clases preferidas de
movimiento inercial de los movimientos acelerados que generaban
fuerzas inerciales. Esto proporcionó el núcleo del argumento cientí
fico newtoniano de la concepción sustantivista de la naturaleza del
espacio.
Mientras la aceleración con respecto al espacio mismo tenía con
secuencias observables, la posición en el espacio mismo y la veloci
dad uniforme con respecto al espacio mismo carecían de dichos con
comitantes observacionales. Pero existía la esperanza de que, por
medio de fenómenos ópticos, pudiera determinarse el estado de re
poso en el espacio mismo. La tentativa de determinar el estado de re
poso con respecto al espacio mismo por medio de experimentos con
luz es lo que condujo a las asombrosas revisiones de nuestras ideas
sobre el espacio y el tiempo en el trabajo del gran físico Albert Eins
tein. La posibilidad de otras ideas puramente filosóficas sobre la na
turaleza del espacio y el tiempo había existido anteriormente a su tra
Espacio, tiempo, movimiento 47
bajo, pero fue a la luz de sus logros y con las ideas suministradas por
ellos que se exploró la mayor parte de la filosofía contemporánea so
bre el espacio y el tiempo. En los apartados «Del espacio y el tiempo
al espacio-tiempo» y «La gravedad y la curvatura del espacio-tiempo»
esbozaré las noveles teorías del espacio y el tiempo propuestas por
Einstein y retomaré entonces la filosofía del espacio y el tiempo en el
contexto de estas nuevas teorías físicas.
Del espacio y el tiempo al espacio-tiempo
Los orígenes de la teoría especial de la relatividadHemos visto que mientras Newton postulaba «el espacio mismo»
como el objeto de referencia en relación al cual las aceleraciones ge
neraban fuerzas inerciales observables, se creía que el movimiento
uniforme con respecto al espacio mismo carecía de consecuencias
observables. Esto se seguía de la famosa observación de Galileo se
gún la cual, en un laboratorio cerrado, uno no podía decir cuál era el
estado de movimiento uniforme del laboratorio mediante la realiza
ción de un experimento mecánico. No obstante, seguía siendo conce
bible que otros fenómenos, no mecánicos, dependieran en alguna
forma del movimiento uniforme del aparato con respecto al espacio
mismo. Este movimiento se manifestaría entonces en alguna conse
cuencia observacional.
En el siglo XIX surgió una cierta esperanza al respecto al demos
trarse que la luz era radiación electromagnética. Según la teoría de la
electricidad y el magnetismo debida a J. C. Maxwell, las ondas elec
tromagnéticas, de las que las ondas luminosas son sólo una especie,
tienen una velocidad definida con respecto a un observador. Esta ve
locidad debería ser la misma en todas direcciones y ser independien
te de la velocidad de la fuente de luz con respecto al observador. Un
observador en reposo en un tanque de agua determinará una veloci
dad del sonido en el agua que es la misma en todas las direcciones.
Esta velocidad del sonido será completamente independiente del
movimiento de la fuente del sonido en el agua. Una vez que la onda
de agua se ha generado, su velocidad depende solamente de las pro
piedades del agua por la que viaja la onda. Lo mismo debería suce
der con la luz, recibiendo el medio de transmisión de la luz (la mate-
Filosofía de la física
fin i|iif es para la luz lo que el agua para el sonido) el nombre de
«ctcr».
Un observador que se mueva a través del agua en el tanque no
verá la misma velocidad del sonido en todas las direcciones, ya que
estará aproximándose al sonido en una dirección y alejándose del
mismo en la dirección opuesta. Así pues, un observador en movi
miento con respecto al éter debería ser capaz de detectar este movi
miento, incluso si es un movimiento uniforme, no acelerado, midien
do la velocidad de la luz en todas las direcciones. Si se supone que
un observador en reposo en el éter estará en reposo en uno de los
sistemas inerciales de la mecánica en el que no se generan fuerzas
mecánicas inerciales, resulta plausible identificar el éter con el espa
cio mismo de Newton. En el siglo XIX siempre se hizo esta suposición
y, reinterpretada, sigue siendo correcta en la teoría de la relatividad.
Podríamos, pues, utilizar experimentos con luz para determinar nues
tro movimiento uniforme con respecto al espacio mismo.
A fin de detectar cuál estado de movimiento uniforme era el
estado de reposo en el éter o en el espacio mismo se diseñó una serie
de ingeniosos experimentos. Éstos consistían en radiar luz desde un
punto a lo largo de diferentes trayectorias y en llevar a continuación
la luz a su punto de partida. La luz debería tardar diferentes cantida
des de tiempo en recorrer las diferentes trayectorias, dependiendo de
la longitud de las trayectorias y del estado de movimiento del apara
to en el éter. Cambiando la orientación del aparato, o dejando que el
movimiento de la tierra lo haga por nosotros según gira en torno a su
eje o viaja en su órbita alrededor del sol, se modificarían los tiempos
relativos que la luz tarda en recorrer las diferentes trayectorias. D i
chas variaciones en el tiempo podrían ser detectadas en la fuente de
luz por un observador, que observaría un corrimiento de la posición
de las líneas de interferencia, líneas alternantes de luz y oscuridad
que se generan cuando los dos rayos de luz retornantes se encuen
tran y sus regiones de intensidad variable se suman o se restan entre
sí. (Véase la figura 2.1.)
Cuando estos experimentos se llevaron a cabo, no se pudo apre
ciar, para consternación de quienes los realizaron, ninguna diferencia
observable en los tiempos de recorrido de la luz. Era como si la luz
viajase a una velocidad fija, la velocidad para la luz predicha por la
teoría en el sistema de referencia en reposo en el éter, en cualquier
laboratorio que estuviese en movimiento uniforme. (Estos «resulta-
Espacio, tiempo, movimiento 49
V
F ig u ra 2.1. E l experimento de Michelson-Morley. Un haz de luz es dividido en dos haces en el espejo semiplateado B. Un haz se dirige al espejo C donde es reflejado, el otro al espejo D. Si el aparato se está moviendo a través del éter, el medio de transmisión de la luz conjeturado por la vieja teoría ondulatoria, en la dirección mostrada
por la flecha v, la luz debería tardar más tiempo en recorrer el camino ABC de longitud l que lo que tarda en recorrer el camino BDB, también de longitud l. Si el aparato se gira entonces 90 grados, la diferencia en el tiempo a lo largo de los caminos se
invierte. Pero cuando el experimento se lleva a cabo no se detecta semejante cambio. Esto sigue siendo cierto incluso si la longitud del camino BC se toma diferente a la longitud BD. En general, ningún experimento de ida y vuelta pone de manifiesto el
movimiento del laboratorio a través del éter.
dos nulos» no son válidos, dicho sea de paso, cuando el aparato está
en movimiento no uniforme. La rotación puede ser detectada, por
ejemplo, mediante un giroscopio anular de láser, que detecta el cam
bio en la velocidad de la luz en direcciones opuestas alrededor de
una trayectoria circular a medida que el laboratorio gira.) Ahora bien,
podría parecer que este sorprendente resultado nulo se debiese a al
50 Filosofía de la física
guna peculiaridad de la luz o del electromagnedsmo. Sin embargo, si
se reflexiona sobre porqué la velocidad de la señal habría de variar
cuando el laboratorio está en movimiento con respecto al medio de
transmisión de la señal, uno se da pronto cuenta de que aquí se está
cuestionando una intuición muy fundamental sobre el movimiento.
La intuición es que si corremos, por ejemplo, tras una cosa en movi
miento, ésta se moverá más despacio respecto a nosotros que respec
to a alguien que no se hubiera unido a la carrera.
Uno podría intentar hallar una explicación a estos sorprendentes
resultados de muchas formas posibles. Una sugerencia fue que la tie
rra arrastraba consigo en su movimiento al éter local, de manera que
la porción de éter junto a la tierra se encontraba siempre en reposo
con respecto a la tierra y al aparato. Dicha propuesta, sin embargo,
terminaría entrando en conflicto con observaciones astronómicas
bien fundadas.
Una serie de teorías compensatorias fueron concebidas para ex
plicar los inesperados resultados nulos. Si suponemos que la longitud
del aparato se contrae en la dirección de su movimiento con respecto
al éter, y suponemos además que todos los procesos físicos medidos
por los relojes del aparato se ralentizan cuando estos relojes se ponen
en movimiento respecto al éter, uno podría entonces justificar como
una apariencia la manifiesta igualdad de la velocidad de la luz en
todas las direcciones. Aunque la luz estuviese efectivamente movién
dose a diferentes velocidades con respecto al aparato en diferentes
direcciones, las consecuencias observacionales esperadas de ello que
darían totalmente anuladas por los cambios inducidos (por el movi
miento del aparato a través del éter) en los componentes del aparato
que uno utilizó para determinar las velocidades — intervalos de lon
gitud y de tiempo medidos por medio de reglas y relojes— . El resul
tado neto sería por consiguiente ¡la imposibilidad una vez más de de
tectar por algún medio el movimiento uniforme con respecto al
espacio!'
Fue la brillante sugerencia de Einstein tomar la apariencia de
que la luz tiene la misma velocidad en todas las direcciones en cual
quier estado de movimiento uniforme como un indicativo de la reali
dad. ¿Porqué no postular, argüyó, que lo que parece ser el caso a te
nor de los experimentos de ida y vuelta es realmente el caso? Para
todo observador en movimiento uniforme, la luz en el vacío viaja a la
velocidad predicha por la teoría del electromagnetismo en todas las
Espacio, tiempo, movimiento 51
direcciones. Es importante observar lo radical que es esta propuesta.
Si un rayo de luz está alejándose de un observador en una dirección
dada con una velocidad c, y un segundo observador está viajando en
la dirección de la luz propagada con, pongamos, una velocidad v con
respecto al primer observador, consideraremos que la luz está viajan
do con una velocidad c, y no con una velocidad c~ v como nos dice
la intuición, también con respecto al segundo observador.
¿Cómo podía ser esto? El núcleo del argumento de Einstein es
una crítica penetrante de la noción de simultaneidad para sucesos a
una distancia uno de otro. ¿Qué significa que dos acontecimientos a
una distancia espacial uno de otro ocurran al mismo tiempo? En el
pensamiento preeinsteiniano suponemos sencillamente que si dos
sucesos ocurren al mismo tiempo para un observador, ocurrirán al
mismo tiempo para todos los observadores. Es el cuestionamiento
de esta última noción lo que constituye la diferencia principal entre
el espacio y el tiempo según la concepción anterior y el espacio-
tiempo según la así denominada teoría especial de la relatividad de
Einstein.
Einstein argumenta que, si vamos a determinar la velocidad de la
luz en una dirección dada, podríamos pensar en soslayar los resulta
dos nulos de los experimentos de ida y vuelta midiendo directamen
te la velocidad de la luz desde un punto A, a otro B. Pero solamente
podríamos hacer esto si pudiésemos determinar la distancia entre los
puntos y el tiempo que la luz necesita para ir de A a B, siendo la ve
locidad la distancia dividida por el tiempo. Pero para obtener el in
tervalo de tiempo entre la emisión y la recepción de una señal de luz
hemos de ser capaces de sincronizar relojes en los dos puntos de ma
nera que señalen «cero» en el mismo momento. ¿Cómo podría llevar
se a cabo esta sincronización?
Si pudiéramos transportar un reloj instantáneamente de A a B, podríamos establecer la sincronización simplemente sincronizando
dos relojes en A y moviendo uno de ellos instantáneamente a B. Pero, según Einstein, los objetos no pueden ser transportados de un
lugar a otro en un tiempo cero. Einstein supone, de hecho, que la ve
locidad de la luz en el vacío es una velocidad límite por encima de la
cual nada puede viajar. Pero entonces, ¿porqué no sincronizar dos
relojes en A, mover uno a una u otra velocidad hasta B, y suponer
que cuando un reloj en A lee el valor n y el reloj en B lee n, los dos
sucesos son simultáneos?
52 Filosofía de la física
En este punto debemos recordar el objeto de intentar establecer
la simultaneidad para sucesos distantes. Nuestro propósito con ello
era poder determinar la velocidad de la luz desde A hasta B. Y que
ríamos hacerlo de manera que pudiésemos soslayar el problema de
los resultados nulos obtenidos en los experimentos de ida y vuelta,
un fenómeno explicado combinando la idea de que la luz tiene dife
rentes velocidades en las diferentes direcciones con las afirmaciones
compensatorias sobre cómo las reglas se contraen y los relojes se
atrasan cuando se mueven con respecto al éter. Recordemos que el
objeto de los experimentos de ida y vuelta era determinar en primer
lugar cuál era el estado de movimiento en el que la velocidad de la
luz era realmente la misma en todas las direcciones, para poder de
terminar a continuación cuál era el estado de movimiento que estaba
realmente en reposo en el éter o en el espacio mismo.
Pero si la teoría compensatoria es correcta, los relojes transporta
dos desde A hasta B no estarán, en general, sincronizados en B. ni
aun cuando lo hubieran estado en A. Pues, en su movimiento desde
A hasta B, viajarán por lo general a diferentes velocidades con res
pecto al éter y sufrirán por consiguiente diferentes cantidades de «ra-
lentización». Claramente, el reloj más apropiado para determinar la
sincronización de relojes en A y B será uno que haya sido trasladado
muy lentamente en relación al éter y haya sufrido en consecuencia
una distorsión mínima en su movimiento. Pero para saber qué reloj
es éste, tendríamos que saber qué estado de movimiento era el
estado de reposo en el éter, ¡justo lo que estábamos intentando deter
minar en primer lugar!
Supongamos que conociéramos qué estado de movimiento es
taba en reposo en el éter. Como la luz viaja, en relación al éter, con
la misma velocidad en todas las direcciones, una sencilla manera de
sincronizar los relojes en A y en B sería enviando una señal de luz
desde A que fuese reflejada en B y regresara a A. Como la luz tardó
el mismo tiempo en ir desde A hasta B y desde B hasta A, el suceso
en A simultáneo con la reflexión en B podría ser tomado como el su
ceso en A a medio camino en el tiempo entre la emisión y la recep
ción de la señal de luz en A según la medida de un reloj en reposo
en A. Pero, dice Einstein, hasta donde los experimentos de ida y
vuelta llegan, es como si la luz tuviera esta misma velocidad en todas
las direcciones sin importar cuál sea el estado de movimiento unifor
me del observador. Supongamos que la luz viaja realmente a la mis-
Espacio, tiempo, movimiento 53
F i g u r a 2.2. La definición de simultaneidad por Einstein y la relatividad de la simultaneidad. OS representa los sucesos en la historia vital de un observador, un observador que permanece en una posición x constante según transcurre el tiempo /. O S representa la historia vital de otro observador que se mueve (respecto a OS) hacia la izquierda. Como e está a medio camino en el tiempo de O a r, los sucesos consistentes en emitir y recibir un haz de luz reflejado en el suceso e, S, considerando que la velocidad de la luz es igual hacia y desde e, considera que é es simultáneo con e. Por un
razonamiento similar, S' considera que e* es simultáneo con e porque está a medio camino en el tiempo desde O a /. Pero como una señal causal puede partir de e' y llegar a tanto S como S" coinciden en que e y e* no pueden ser simultáneos. En relatividad, los sucesos son o no simultáneos sólo en relación a un «sistema inercial de
movimiento» elegido como el de S o el de S .
ma velocidad en relación a cualquier observador en movimiento uni
forme. Cada uno de dichos observadores puede entonces utilizar el
método de la luz reflejada para determinar cuáles son los sucesos
que acontecen al mismo tiempo que otros sucesos.
54 Filosofía de la física
Es fácil ver que, si elegimos esto como nuestra definición de si
multaneidad para sucesos distantes, habrá observadores que discre
parán sobre qué pares de sucesos tienen lugar al mismo tiempo, se
gún puede verse en la figura 2.2 y en su explicación. Entonces, ¿qué
observador tiene razón en sus atribuciones de simultaneidad? De
acuerdo con la teoría del éter, solamente el observador en reposo en
el éter. Los demás se ven burlados al suponer que la luz viaja a la
misma velocidad en todas las direcciones en relación a sus laborato
rios, cuando esto no es así. De acuerdo con Einstein, todos los obser
vadores tienen razón en sus atribuciones de simultaneidad. Sucede
simplemente que no hay tal cosa como «ocurrir al mismo tiempo», si
no solamente «ocurrir al mismo tiempo en relación a un estado parti
cular de movimiento uniforme». Podemos reconciliar los resultados
nulos de los experimentos de ida y vuelta con la suposición galileana
de que todos los observadores en movimiento uniforme ven los mis
mos fenómenos físicos abandonando sencillamente la noción intuiti
va de que existe una noción absoluta, no relativa, de «ocurrir al mis
mo tiempo».
Podemos paliar algo la extrañeza de esta conclusión si examina
mos el concepto de «estar en el mismo lugar». Imaginemos dos ob
servadores en movimiento uno respecto al otro. El primer observa
dor recibe un golpe en la cabeza en dos momentos diferentes.
¿Ocurrieron los golpes «en el mismo lugar»? «Sí», dice el observador
que ha sido golpeado, «los dos ocurrieron donde se encontraba la
parte superior de mi cabeza». «No», dice el otro observador, «uno
ocurrió cerca de mí y el otro muy lejos». ¿Quién de los dos tiene ra
zón? A no ser que uno crea en «el espacio mismo» de Newton, en re
lación al cual uno, y solo uno. de los observadores puede estar real
mente en reposo, ¿porqué no decir que «en el mismo lugar» es sólo
una noción relativa? Dos sucesos pueden darse en el mismo lugar en
relación a un observador y en lugares diferentes en relación a otro en
movimiento respecto al primero. Y, si Einstein está en lo cierto, suce
de exactamente igual con «al mismo tiempo».
Para hacernos una idea completa de la imagen del espacio y el
tiempo propuesta por Einstein necesitamos una suposición más. Ésta
comprende la afirmación de que todos los lugares y direcciones en el
espacio y el tiempo son similares, pero va más allá al hacer una supo
sición que equivale a postular que la estructura espacio-temporal del
mundo es «plana». Nosotros examinaremos esta noción de «planari-
Espacio, tiempo, movimiento 55
dad» con más detalle en «La gravedad y la curvatura del espacio-
tiempo». Lo que se necesita suponer es la linearidad de las relaciones
de las separaciones espacial y temporal para un observador con res
pecto a las de otro observador. Con este postulado adicional se cons
truye una estructura del espacio y el tiempo en la que observadores
en movimiento relativo entre sí atribuirán separaciones espaciales de
unos sucesos a otros muy diferentes, y atribuirán también separacio
nes temporales entre sucesos muy diferentes. Las separaciones espa
ciales y temporales atribuidas a un par de sucesos por un observador
pueden, no obstante, ser calculadas a partir de las atribuidas a dicho
par por otro observador en movimiento respecto al primero, por me
dio de las denominadas transformaciones de Lorentz, fórmulas origi
nalmente derivadas en el contexto de las anteriores teorías compen
satorias.
Aunque las distancias espaciales y temporales entre dos sucesos
variarán de un observador a otro, es importante observar que una
consecuencia de los postulados básicos de la teoría es que otra canti
dad, el denominado cuadrado del intervalo entre los sucesos, tendrá
un valor invariante: será el mismo para todos los observadores en
movimiento uniforme. Esta cantidad puede ser calculada a partir de
la separación temporal entre los sucesos en el sistema referencial de
un observador, t, de la separación espacial en ese mismo sistema de
referencia, x, y de la velocidad de la luz, c, por medio de la fórmula:
P = x2 - x2t2. Mientras t y x variarán de un observador a otro, P permanecerá igual para todos ellos. Un paso crucial en esta prueba se
apoya en el hecho de que todos los observadores atribuyen a la luz la
misma velocidad invariante, c.
E l espacio-tiempo de MinkowskiTodas las consecuencias de la teoría de Einstein para una nueva con-
ceptualización del espacio y el tiempo pueden ser resumidas en la
noción del espacio-tiempo de Minkowski, el escenario de todos los
procesos físicos en la teoría de la relatividad especial. La idea básica
ahora es partir de las posiciones de sucesos-puntuales como los cons
tituyentes fundamentales de los que está construido el espacio-tiem
po. Uno puede imaginarlos como posiciones posibles de aconteci
mientos que son instantáneos y carecen de extensión espacial. Estos
56 Filosofía de la física
sucesos-puntuales ocupan el lugar de los puntos espaciales y de los
instantes temporales de la teoría prerrelativista. Las estructuras bási
cas impuestas sobre el conjunto de estos puntos espacio-temporales
es lo que constituye el marco de trabajo de la nueva imagen del espa
cio y el tiempo. (Véase la figura 2.3).
t
F ig u r a 2.3. Algunos elementos del espacio-tiempo de Minkouiski. La línea t representa
un observador inercial, siendo o un suceso en la vida de ese observador. La línea x representa los sucesos simultáneos a o para el observador. A y B representan señales de luz que llegan a o desde el pasado y que parten de o hacia el futuro. Los sucesos de las regiones I y II están tan lejos de o en el espacio y tan próximos al mismo en el tiempo que una señal tendría que viajar más rápido que la luz para conectar un suceso de dicha índole con el suceso o. Se supone generalmente que no existen semejantes señales. Los sucesos de las regiones I I I y IV son sucesos conectables al suceso o por señales causales que viajan a una velocidad menor que la de la luz.
57
Los pares de posiciones de sucesos tienen un intervalo definido,
invariante y absoluto en la estructura. Para un observador dado en
un estado particular de movimiento uniforme, puede derivarse una
separación espacial definida y un intervalo temporal definido entre
los sucesos, pero los valores obtenidos serán relativos al estado de
movimiento particular del observador.
Dos sucesos cuyo intervalo de separación tiene el valor cero son
tales que una señal de luz en el vacío emitida en un lugar-tiempo po
dría llegar al otro lugar-tiempo. Observad que «intervalo» difiere de
distancia espacial en que sucesos diferentes pueden tener intervalos
de separación cero. Dichos sucesos se dice que tienen una .separa
ción cero o de tipo luz. Los sucesos cuyo intervalo al cuadrado es ne
gativo se encuentran lo suficientemente próximos en el espacio y lo
suficientemente distantes en el tiempo para que las señales que se
propagan más despacio que la luz puedan llegar desde uno hasta el
otro. Se dice que tienen una separación de tipo temporal. Los pares
de sucesos cuyo intervalo al cuadrado es positivo están demasiado
separados en el espacio y demasiado próximos en el tiempo para que
una señal que viaje a la misma o a menor velocidad que la de la luz
pueda conectarlos. Si admitimos que la luz es la señal límite más rá
pida, los sucesos no pueden ser conectados por ningún proceso cau
sal y se dice entonces que tienen una separación de tipo espacial. Si
escogemos un suceso como origen, la clase de sucesos con una sepa
ración cero de dicho origen divide el espacio-tiempo en una región
interior y otra exterior de sucesos con una separación de tipo tempo
ral y sucesos con una separación de tipo espacial del suceso origen.
Esta clase divisoria de sucesos con una separación de tipo luz respec
to al suceso origen consta de una componente futura y una pasada.
Juntas forman los denominados «conos de luz» del suceso origen.
(En realidad son conos solamente en un espacio-tiempo de dos en
vez de tres dimensiones espaciales reales.)
En el espacio plano ordinario de la geometría euclídea existen
las líneas rectas. El espacio-tiempo de Minkowski también tiene tra
yectorias rectilíneas. Si los intervalos entre los puntos de la trayecto
ria geodésica son de tipo espacial, la trayectoria representa una línea
recta espacial. Esta última es una línea recta en el espacio en un
tiempo, el cual se obtiene a partir del espacio-tiempo eligiendo un
observador en movimiento uniforme y tomando como espacio en un
tiempo para este observador una colección de sucesos que sean
58 Filosofía de la física
todos simultáneos en su sistema de referencia. Las líneas rectas cuyos
sucesos tienen separación cero representan las trayectorias de los ra
yos de luz viajando en un vacío. Las líneas rectas de tipo temporal
representan las trayectorias a través del espacio en el tiempo de partí
culas con movimiento uniforme.
En un diagrama podríamos representar a un observador en re
poso en un sistema de referencia con movimiento uniforme median
te una línea recta vertical. Cualquier otro observador con movi
miento uniforme que coincida con nuestro primer observador en el
suceso origen estaría representado por una línea recta inclinada un
cierto ángulo respecto a la vertical. Es importante reconocer que la
elección de la recta vertical no comporta ningún significado físico.
Solamente si contásemos con una noción newtoniana acerca de
quién está realmente en reposo en el espacio mismo tendría un sig
nificado real el representar a un observador siempre en el mismo
lugar y a los otros observadores con movimiento uniforme de mane
ra que cambiasen de lugar con el tiempo. Pero el espacio-tiempo de
Minkowski carece de la noción de un observador en movimiento
uniforme con velocidad real cero, ya que todas las velocidades uni
formes se encuentran físicamente apareadas en esta imagen espacio-
temporal.
Una vez elegido un observador en movimiento uniforme, pode
mos también representar mediante una línea recta en el diagrama
todos aquellos sucesos simultáneos con el suceso origen en relación
al estado de movimiento de dicho observador. En el diagrama, esta
línea recta representa realmente «un espacio en un tiempo» para el
observador, el cual es, por supuesto, tridimensional. Pero debemos
suprimir dos dimensiones espaciales para poder dibujar el diagrama
en un plano; por lo tanto, todo «un espació en un tiempo» euclídeo
tridimensional, plano e infinito, es representado por una línea. Para
el observador en movimiento respecto a nuestro primer observador,
una línea,recta diferente representará todos los sucesos simultáneos
con el suceso origen en relación al estado de movimiento de este
nuevo observador. Se necesita una línea diferente porque los sucesos
simultáneos con el suceso origen serán diferentes para cada observa
dor y lo que se toma como espacio en el instante del suceso origen
depende del estado de movimiento de un observador. Puede mos
trarse fácilmente que la línea de simultaneidad (el espacio en un
tiempo) para el segundo observador representada en el diagrama ten
Espacio, tiempo, movimiento 59
dría que estar inclinada respecto a la línea de simultaneidad del pri
mer observador.
Ya observamos cómo, en las teorías compensatorias diseñadas
inicialmente para explicar los resultados nulos de los experimentos
de ida y vuelta, se postulaba que las longitudes de objetos en movi
miento con respecto al éter se contraían y que los relojes en movi
miento con respecto al éter se atrasaban. En el espacio-tiempo de
Minkowski no hay, por supuesto, ningün éter. Pero la contracción
de longitudes y la dilatación temporal se dan. Supongamos que una
barra de un metro de longitud se encuentra en reposo en un sistema
de referencia dotado de movimiento uniforme. En cualquier otro
sistema de referencia con movimiento uniforme se medirá una longi
tud de la barra menor que un metro. Supongamos que un reloj se
encuentra en reposo en un sistema de referencia dotado de movi
miento uniforme. Un observador en cualquier otro sistema de refe
rencia con movimiento uniforme dirá que dicho reloj «corre más
despacio», es decir, tarda más de un segundo en marcar un segundo
en su esfera.
Lo que es sorprendente es que la contracción de longitudes, así
como la dilatación temporal, sean perfectamente simétricas. Yo veo
más cortas las barras de un metro en reposo en tu sistema de refe
rencia (estando los dos en movimiento relativo), pero tú ves más cor
tas las barras de un metro en mi sistema de referencia. Y la ralentiza-
ción de los relojes es igualmente simétrica. Pese a la apariencia de
inconsistencia, no hay ninguna, pues los intervalos de longitud y de
tiempo son ahora relativos a un observador y las afirmaciones he
chas son perfectamente consistentes. Evidencia directa de la existen
cia real de estos fenómenos la encontramos, por ejemplo, en el tiem
po de vida medio — inexplicablemente dilatado en términos
prerrelativistas— de las partículas inestables que se crean en las
capas altas de la atmósfera y se observan en la superficie de la tierra.
Únicamente la ralentización relativa de sus procesos de desintegra
ción, debido a su alta velocidad respecto a nosotros, puede dar
cuenta del fenómeno.
Este resultado de la relatividad da lugar a una gran variedad de
paradojas, contradicciones aparentes que en realidad no son tales, al
gunas de las cuales pueden encontrarse en cualquier libro estándar
sobre relatividad. Por ejemplo, un hombre que porta una pértiga en
tra en un cobertizo por uno de sus lados y sale por el otro. Cuando
60 Filosofía de la física
la pértiga está en reposo respecto al cobertizo, tiene la misma longi
tud que el cobertizo. Como la pértiga en movimiento es más corta
que el cobertizo, alguien puede cerrar las dos puertas al corredor
mientras éste y la pértiga se encuentran dentro del cobertizo. Pero
para el corredor, el cobertizo es más corto que la pértiga, de mane
ra que esto es claramente imposible. La clave está en pensar en el
orden temporal en que ocurren los sucesos desde las diferentes
perspectivas del corredor y del observador en reposo en el coberti
zo. Para el hombre en reposo en el cobertizo ambas puertas están
cerradas mientras el corredor se encuentra con la pértiga en el co
bertizo. El corredor ve la puerta más distante abierta y su pértiga
sale del cobertizo antes de que la puerta más próxima se haya ce
rrado.
El espacio-tiempo de la relatividad especial, el espacio-tiempo de
Minkowski, requiere que hagamos otra distinción sobre el tiempo
que no se da en la teoría prerrelativista. Hemos observado cómo un
observador cualquiera atribuirá un cierto intervalo temporal entre
dos sucesos, y cómo este intervalo variará de un observador a otro.
Éste es denominado el intervalo temporal coordenado entre los suce
sos relativo al observador en cuestión. Otra noción de tiempo surge
cuando consideramos a alguien que se mueve desde un suceso (un
lugar en un instante) hacia algún otro suceso (un lugar diferente en
un tiempo diferente) a lo largo de alguna trayectoria espacio-tempo-
ral, a través de una sucesión de lugares-en-un-instante. Supongamos
que este agente transporta un reloj que se ajusta a cero en el primer
suceso. Este reloj marcará un valor definido en el suceso final. Segu
ramente todos los observadores coincidirán en cuál es dicho valor,
porque todos estarán de acuerdo en la coincidencia de la lectura de
dicho valor por el reloj con el suceso final, ya que se trata de sucesos
en el mismo lugar y no hay relatividad de la simultaneidad en este
caso. Este tiempo es denominado el tiempo propio entre los dos su
cesos.
Pero el tiempo propio transcurrido entre dos sucesos variará de
pendiendo de la trayectoria espacio-temporal por la que se transporta
el reloj de un suceso al otro. Este fenómeno no cuenta con ningún
precedente en la física prerrelativista. De hecho, puede demostrarse
fácilmente que el tiempo transcurrido en un reloj transportado de un
suceso a otro será máximo cuando la trayectoria seguida desde el pri
mer suceso al segundo sea una de movimiento uniforme, no acelera
61
do. Éste es el fundamento de la famosa paradoja de los gemelos, se
gún la cual si un gemelo permanece en un sistema de referencia con
movimiento uniforme mientras el otro realiza un viaje por el espacio
y el tiempo que entrañe movimiento acelerado, pero que lo lleve de
vuelta a coincidir con el gemelo que se ha quedado en casa, el geme
lo aventurero será más joven — mostrará, por ejemplo, un menor en
vejecimiento biológico— que su gemelo cuando los dos se encuen
tren de nuevo. Evidencia de que este efecto de la relatividad es real
la encontramos en las partículas inestables lanzadas por los canales
circulares de los aceleradores. El número de partículas desintegradas
es mucho menor entre ellas que entre sus partículas paisanas en un
grupo que permanece en reposo en el laboratorio entre el instante en
el que coinciden por primera vez y el instante en el que vuelven a
coincidir. Como de costumbre, no se trata de una contradicción en
la teoría, sólo de fenómenos que no habíamos esperado, un resulta
do de la sorprendente naturaleza del espacio-tiempo. (Véase la figu
ra 2.4.)
Ya observamos cómo la mecánica newtoniana se conformaba al
principio de Galileo de que todos los fenómenos físicos parecerían
iguales a cualquier observador en un estado de movimiento unifor
me, si bien el hecho de que el laboratorio de uno estuviese en movi
miento acelerado se revelaría en consecuencias observables. La vieja
teoría de la mecánica, una vez trasladada al nuevo espacio-tiempo re
lativista, deja de satisfacer este principio. De aquí que Einstein desa
rrollase una nueva mecánica que reconcilia la relatividad galileana de
los fenómenos mecánicos con la nueva imagen del espacio-tiempo. El
fundamento de esta teoría es simple. La vieja mecánica obedecía ta
les principios como la conservación de la energía, la conservación del
impulso y la conservación del momento angular. Éstos son considera
dos ahora el resultado de simetrías fundamentales de la estructura es
pacio-temporal (en particular, del hecho de que todos los puntos es
pacio-temporales son estructuralmente semejantes, como lo son todas
las direcciones espacio-temporales). Estas simetrías se dan también en
el nuevo espacio-tiempo, por lo que podemos mantener las viejas re
glas de conservación y derivar de ellas la nueva mecánica. En la nue
va mecánica, por ejemplo, se encuentra la famosa consecuencia de la
relatividad de la equivalencia entre masa y energía, a saber, que
cuanta más energía cinética posea un objeto, mayor será su resisten
cia a ser acelerado aún más por una fuerza.
Filosofía de la física
F ig u r a 2.4. La paradoja de los gemelos. S es un observador que permanece inercial y transporta un reloj desde el suceso o al suceso o'. E l tiempo transcurrido en el reloj se representa por las esferas de reloj situadas a la izquierda. S ‘, originalmente en reposo con respecto a S, se acelera a la derecha, viaja a la derecha con una velocidad
uniforme, invierte la dirección del movimiento relativo, regresa a la posición de 5 y acelera de nuevo para terminar en reposo en relación a S en la posición o'. E l tiempo
transcurrido en un reloj transportado por S ’ se representa por las esferas de reloj situadas a la derecha. La relatividad especial predice que habrá transcurrido menos tiempo en el reloj transportado por S ' a lo largo del camino acelerado de o a o' que en el reloj de S.
También indicamos que Einstein supuso que la velocidad de la
luz en el vacío era la velocidad máxima de propagación de una señal
cualquiera. Semejante postulado encaja muy bien en la nueva imagen
espacio-temporal.
Espacio, tiempo, movimiento 63
a S bF ig u r a 2.5. La relatividad del orden temporal de los sucesos en la relatividad especial. O es
un observador inercial. O ' es otro observador inercial que se mueve a la derecha en
relación a O. La linea S es la clase de sucesos que O considera simultáneos con el suceso a. La linea S ' es la clase de sucesos que O ' considera simultáneos con el suceso a. Para O el suceso c es posterior al suceso b y por consiguiente posterior al suceso
a. Pero para O ', el suceso c es anterior al suceso b ' y por consiguiente anterior al suceso a. Semejante inversión del orden temporal puede darse sólo para sucesos, como
el suceso a y el suceso c, que no son causalmente conectables uno al otro.
Podemos, por ejemplo, encontrar pares de sucesos, A y B, y de
observadores 01 y 02, tales que A es anterior a B en relación a 01 y
B es anterior a A en relación a 02. Pero éstos serán siempre sucesos
que tienen una separación de tipo espacial. Esto significa, suponien
do la velocidad límite de la luz, que los sucesos tendrán un orden en
el tiempo diferente en relación a dos observadores sólo si los sucesos
no pueden ser conectados por ninguna señal causal. Los sucesos que
64 Filosofía de la física
pueden ser conectados por una señal causal, viajando a la misma o a
menor velocidad que la de la luz, serán observados en el mismo or
den temporal por todos los observadores, si bien el tiempo transcu
rrido entre ellos variará de un observador a otro. (Véase la figura 2.5.)
Se ha señalado que no es necesario mantener el postulado de la
velocidad límite de la luz para contar con una teoría consistente en
la que el espacio-tiempo sea el espacio-tiempo de Minkowski, el es-
pacio-tiempo de la relatividad especial. Si uno simplemente insiste en
que las condiciones del mundo sean tales que se eviten paradojas
causales, uno puede tolerar «taquiones», señales causales a velocida
des mayores que la de la luz. La condición de consistencia es necesa
ria puesto que la postulación de taquiones en el espacio-tiempo de
Minkowski dejaría un margen para lazos causales cerrados, en los
que un suceso se causa a sí mismo. Si se pudieran elegir libremente
las condiciones iniciales, se podría generar una situación paradójica
(me doy un tiro antes de apretar el gatillo que dispara la bala). No
obstante, dichas velocidades superlumínicas nunca han sido detecta
das y las versiones estándar de la relatividad especial adoptan el pos
tulado de la luz como señal causal máxima junto a la estructura del
espacio-tiempo de Minkowski con su velocidad de la luz invariante
para todos los observadores inerciales.
Nada en el espacio-tiempo de la relatividad especial, según he
mos observado, juega el papel íntegro del espacio de Newton. Para
Newton, el espacio mismo aportaba un verdadero criterio de lo que
significa para un objeto estar realmente en reposo, pese a no deri
varse consecuencias empíricas del movimiento uniforme respecto al
espacio mismo. En el espacio-tiempo de Minkowski no hay nada
que proporcione un criterio sobre cuándo dos sucesos que no son
simultáneos entre sí están «en el mismo lugar». Carece por consi
guiente de sentido preguntar si un objeto permanece en un mismo
lugar a lo largo del tiempo, aun cuando tiene pleno sentido preguntar
si la posición relativa de un objeto, es decir, la posición respecto a
otros objetos materiales tomados como sistema de referencia, perma
nece invariable en el tiempo. Pero la distinción entre estar realmente
en movimiento uniforme, o no, se conserva en este espacio-tiempo.
El que la trayectoria de una partícula material a través del espacio-
tiempo, la trayectoria de tipo temporal que representa la sucesión de
lugares-tiempo que el objeto ocupa, sea o no una línea recta, esto es,
el que sea una de las trayectorias de tipo temporal que constituyen
65
una geodésica del espacio-tiempo, es una cuestión que tiene perfecto
sentido.
La distinción, pues, entre que un objeto esté en movimiento uni
forme o que esté en movimiento acelerado — representado por una
trayectoria curva de tipo temporal en el diagrama del espacio-tiem-
po— sigue siendo absoluta, en el sentido de que esta distinción no
tiene nada que ver con el movimiento del objeto en cuestión respec
to a otros objetos materiales. Al contrario, esta distinción está deter
minada por el movimiento de un objeto en relación a las estructuras
del espacio-tiempo mismo. En la física newtoniana, el movimiento
verdaderamente acelerado se ponía de manifiesto por la presencia
(en el laboratorio acelerado) de fuerzas inerciales que actuaban sobre
los objetos y estaban supuestamente generadas por la aceleración de
los objetos en relación al espacio mismo. En la relatividad especial, la
aceleración real se manifiesta en ésta y en otras formas también. Ya
observamos, por ejemplo, cómo los resultados nulos en los experi
mentos de ida y vuelta se obtenían sólo cuando uno de dichos expe
rimentos se realizaba con luz en un laboratorio en movimiento uni
forme. En un aparato acelerado, la luz invertirá tiempos en recorrer
las trayectorias que revelan la existencia de la aceleración absoluta
del dispositivo experimental. Aunque no hay tal cosa, entonces,
como «estar en el mismo lugar» si no es en relación a algún estándar
material, el «estar en movimiento uniforme» tiene, en la relatividad
especial, tanta significación real en un sentido absoluto como lo tiene
en la teoría newtoniana.
El espacio-tiempo neo-newtonianoUna vez que se hubo construido el espacio-tiempo de Minkowski de
la relatividad especial, se observó que uno podía volver atrás y cons
truir un espacio-tiempo apropiado para la teoría newtoniana anterior,
un espacio-tiempo que tuviera algunas ventajas sobre la noción de es
pacio mismo tradicionalmente postulada en la física newtoniana. Las
principales intuiciones proceden de darse cuenta de que la mejor ru
ta sistemática para construir un espacio-tiempo apropiado a lo que se
considera como cantidades observables postuladas por cualquier teo
ría dada es tomar las posiciones de sucesos como elementos primiti
vos y construir a continuación el espacio-tiempo dotando de una es
tructura al conjunto de las posiciones de sucesos.
66 Filosofía de la física
En la física newtoniana, la noción de simultaneidad para sucesos
separados se presupone como una noción absoluta. Así, para cons
truir nuestro nuevo espacio-tiempo de la física newtoniana dotamos a
la colección de posiciones de sucesos de un intervalo temporal defi
nido entre cualquier par de sucesos. Cuando este intervalo es cero,
los sucesos son simultáneos. En el espacio-tiempo de Minkowski de
la relatividad espacial, los espacios son colecciones de sucesos simul
táneos en relación a un observador dado. Se supone que estos espa
cios «relativos» tienen la estructura tridimensional ordinaria descrita
por la geometría de Euclides. En el espacio-tiempo newtoniano revi
sado, con su noción absoluta de simultaneidad, podemos, de nuevo,
considerar los espacios como colecciones de sucesos simultáneos.
Así, cada suceso estará en un único espacio y se supone, de nuevo,
que el espacio es un espacio euclídeo tridimensional.
En el contexto newtoniano, como en la relatividad especial, lo
que hace las veces de trayectoria del movimiento uniforme de un ob
jeto es una noción bien definida. Así, imponemos a este nuevo espa
cio-tiempo newtoniano una condición similar a la impuesta al espa
cio-tiempo de Minkowski: Debe haber una noción definida de
trayectorias rectilíneas que representen las posibles trayectorias del
movimiento a través del-espacio y en el tiempo de partículas que se
mueven libre y uniformemente. Ahora bien, Newton supuso que
existía una cosa tal como un suceso aconteciendo «en el mismo lu
gar» que otro suceso no simultáneo. Si imponemos esa estructura,
una noción definida del mismo lugar para sucesos no simultáneos, al
espacio-tiempo que estamos construyendo, formaremos la imagen del
espacio absoluto de Newton para el espacio y el tiempo. Pero esto
nos daría características del mundo sin consecuencias empíricas, tales
como la magnitud de la velocidad uniforme de un objeto con respec
to al «espacio mismo». Sin embargo, si dejamos a un lado esa estruc
tura del «mismo lugar en tiempos diferentes», obtenemos un nuevo
espacio-tiempo, denominado algunas veces el espacio-tiempo galilea-
no, y otras el espacio-tiempo neo-newtoniano. En este espacio-tiem
po, el movimiento uniforme absoluto está bien definido, pero la
igualdad absoluta de lugar a través del tiempo no lo está.
En esta nueva imagen del espacio-tiempo, las aceleraciones abso
lutas existen y tienen consecuencias observables, pero no existe nada
parecido a la velocidad absoluta de un objeto. Esto es justamente lo
que queremos. La necesidad sentida por los físicos de un nuevo en
Espacio, tiempo, movimiento 67
foque del espacio y el tiempo con el que hacer frente a los asombro
sos y desconcertantes resultados de los experimentos ópticos de ida
y vuelta condujo a profundas intuiciones sobre cuáles eran los com
ponentes de la imagen del espacio y el tiempo que poseíamos intuiti
vamente y que, en una forma refinada, sostenían el mundo de la
ciencia newtoniana. Confrontando los nuevos hechos experimentales
y construyendo el aparato conceptual que los justificase, los físicos
lograron nuevas maneras de examinar posibles teorías para dar cuen
ta de los viejos hechos observacionales postulados. Como veremos, la
existencia de estas nuevas estructuras para describir y explicar las ca
racterísticas espacio-temporales del mundo tuvo un importante efec
to en nuestro entendimiento filosófico de la naturaleza del espacio y
el tiempo y de nuestro acceso al conocimiento sobre su naturaleza.
Pero, antes de considerar estas cuestiones, examinaremos un segun
do cambio revolucionario en nuestras concepciones sobre la natura
leza del espacio y el tiempo provocado una vez más por la fértil ima
ginación científica de Einstein.
La gravedad y la curvatura del espacio-tiempo
Gravedad y relatividad
En su obra magna, los Principia, Newton propuso una teoría que ex
plicaba, entre otras cosas, el movimiento de los planetas alrededor
del sol y sus órbitas elípticas, que había sido tan cuidadosamente
descrito por J. Kepler. La teoría que da cuenta de este movimiento
tiene dos componentes. Una es la teoría de la dinámica de Newton,
la teoría general que relaciona los movimientos con las fuerzas que
actúan sobre los objetos en movimiento. Esta teoría, fundada en la
suposición subyacente de un espacio absoluto y de un curso absoluto
del tiempo, incorpora el principio de Galileo según el cual los obje
tos sobre los que no actúa ninguna fuerza permanecen en un estado
constante de movimiento uniforme. Postula, además, que el cambio
de movimiento (la aceleración) será proporcional a las fuerzas que ac
túan sobre un cuerpo e inversamente proporcional a la tendencia in
trínseca de un cuerpo a oponer resistencia a los cambios de movi
miento, su así denominada masa inercial.
68 Filosofía de la física
La otra componente de la teoría de Newton concierne a la fuerza
responsable de los movimientos observados de los cuerpos astronó
micos (y de otros muchos fenómenos, como la forma en que los cuer
pos caen hacia la superficie de la tierra, o las mareas). Apoyándose
una vez más en la importante observación de Galileo de que, dejan
do a un lado la resistencia del aire, todos los objetos sufren una ace
leración uniforme hacia la tierra cuando están en caída libre cerca de
su superficie, Newton postula una fuerza general de la gravedad ac
tuando entre todos los objetos materiales. La gravedad es siempre
una fuerza atractiva. La intensidad de la fuerza ejercida entre los
cuerpos se considera que es proporcional a la masa inercial de cada
cuerpo e inversamente proporcional al cuadrado de la distancia entre
ellos. La Tercera Ley del Movimiento de Newton afirma que la fuer
za ejercida por un cuerpo sobre un segundo cuerpo será compensada
por una fuerza de igual intensidad — pero dirigida en sentido contra
rio— ejercida por el segundo cuerpo sobre el primero.
El hecho de que la fuerza aumenta en proporción a la masa iner
cial, pero la resistencia del cuerpo a la aceleración es también pro
porcional a la masa inercial, produce directamente el resultado de
Galileo según el cual todos los cuerpos sufren una misma aceleración
cuando son sometidos a la fuerza gravitacional ejercida por algún
cuerpo fijo, siempre que los cuerpos prueba estén situados en el mis
mo lugar respecto al objeto que ejerce la fuerza gravitacional. New
ton demostró que las leyes de la dinámica junto a la ley de la fuerza
gravitacional por él postuladas conducen a las leyes de Kepler sobre
el movimiento planetario o, mejor dicho, a una versión ligeramente
modificada de las mismas.
No debería sorprender, pues, que Einstein, una vez que hubo de
mostrado la necesidad de un nuevo sistema dinámico y construido
uno consistente con el nuevo espacio-tiempo de la relatividad espe
cial, abordara el problema de la construcción de una nueva teoría de
la gravedad. Esta teoría, que se necesita claramente, debe ser consis
tente con las nuevas ideas sobre el espacio-tiempo. La teoría de New
ton, por ejemplo, considera que la interacción gravitacional entre
cuerpos es instantánea, mientras la relatividad considera que todas
las señales se propagan a una velocidad menor que, o igual a, la de la
luz. Se puede construir una gran variedad de alternativas a la teoría
newtoniana compatibles con el nuevo espacio-tiempo relativista. De
hecho, un programa en curso en la física experimental se ocupa de
Espacio, tiempo, movimiento 69
probar cada una de estas alternativas frente a las demás, buscando
posibles observaciones que permitan eliminar algunas de las posibili
dades. Pero la novel teoría gravitacional que mejor ha respondido a
los experimentos, y la que presenta una mayor elegancia teórica, es la
propia teoría de Einstein. Ésta se denomina la teoría general de la re
latividad. Es también la teoría que postula una naturaleza para el
mundo que reviste un gran interés para los filósofos. Dedicaré el res
to de esta sección a esbozar algunas de las ideas que condujeron a
Einstein a esta novel teoría de la gravedad, la cual, como veremos,
constituye una novel teoría de la estructura del espacio-tiempo mis
mo. Perfilaré algunos de los constituyentes básicos de la teoría y ex
ploraré algunas de las consecuencias de la misma que son de impor
tancia para el filósofo.
Einstein parte de la observación por Galileo de que la acelera
ción inducida por la gravedad en un objeto es independiente del ta
maño y de la constitución del objeto. La gravedad se distingue de
cualquier otra fuerza por poseer este efecto universal. Consideremos
el caso en el que un objeto es acelerado por un objeto gravitatorio si
tuado a una distancia lo suficientemente grande para que el campo
gravitacional sea efectivamente constante dentro del laboratorio.
Einstein hace notar que un pequeño objeto prueba en un laboratorio
se vería acelerado respecto a ese laboratorio en la misma forma exac
tamente en que lo haría si no hubiese ninguna fuerza actuando sobre
el objeto prueba y, en su lugar, el laboratorio mismo estuviese siendo
acelerado uniformemente en la dirección opuesta a la de la acelera
ción de la partícula. En este segundo caso, cualquier objeto prueba
de cualquier masa o composición parecería acelerar uniformemente
con respecto al laboratorio. Es la universalidad de la gravedad lo que
nos permite reemplazar la fuerza gravitacional por una aceleración
del sistema de referencia.
Quizá, sugiere Einstein, todos los efectos de la gravedad podrían
duplicarse mediante una aceleración semejante del laboratorio. Esto
conduce a la hipótesis de que la gravedad tendrá efectos sobre cosas
diferentes a la materia formada por partículas. Si dirigimos un rayo
de luz a través de un laboratorio en movimiento acelerado espera
mos que el rayo siga una trayectoria que no es recta en relación al la
boratorio. ¿No desviaría, entonces, la gravedad los rayos de luz que
pasan cerca de un cuerpo gravitacional?
Quizá más sorprendente es la conclusión de que deberíamos es
Filosofía de la física
perar que la gravedad afectase las mediciones de los intervalos espa
ciales y temporales, como revelan los relojes y las reglas de medir
idealizados. El argumento a favor del efecto temporal es el más senci
llo de construir y de seguir. Imaginaros un laboratorio acelerado con
un reloj en su extremo superior y un reloj idéntico en su extremo
inferior. Se envían señales desde el reloj inferior al superior y se
comparan las velocidades de emisión de las señales, según son de
terminadas por el reloj inferior, con las de recepción, según son
determinadas por el reloj superior. En el momento en el que una se
ñal emitida desde la parte inferior alcanza la parte superior, el reloj
superior estará moviéndose respecto al sistema de referencia en mo
vimiento uniforme en el que se encontraba en reposo el reloj inferior
cuando la señal fue emitida. Arguyendo, bien a partir del efecto de
dilatación temporal de la relatividad especial, bien a partir del deno
minado efecto Doppler, el cual muestra en un contexto prerrelativis-
ta cómo una señal emitida por una fuente a una frecuencia determi
nada parecerá tener una frecuencia menor cuando es observada por
alguien en relación al cual la fuente se encuentra en movimiento, es
plausible afirmar que el reloj inferior parecerá atrasar cuando es me
dido con el reloj superior. Esto es, la frecuencia con que la señal es
recibida por el reloj superior es menor que la frecuencia con que fue
emitida según la medición del reloj inferior. (Véase la figura 2.6.)
Pero, ahora, consideremos el laboratorio no acelerado con todos
sus aparatos en reposo situados en un campo gravitacional. Según el
argumento de Einstein (a menudo llamado el Principio de Equiva
lencia), deberíamos esperar que el reloj situado más abajo en el cam
po gravitacional pareciera atrasar al reloj localizado más arriba. O b
servemos que esto no tiene nada que ver con la fuerza gravitacional
sentida por cada uno de los relojes sino, antes bien, está determinado
por cuánto más abajo en la «colina» gravitacional se encuentra un re
loj respecto al otro. Así, deberíamos esperar que la gravedad tuviese
un efecto en nuestra medida de los intervalos temporales. Pueden
darse argumentos similares, aunque mucho más complicados, que
nos hacen esperar que la gravedad afecte también a las mediciones
espaciales.
Considerados conjuntamente, estos argumentos movieron a Eins
tein a hacer la sorprendente sugerencia de que la forma de tratar con
la gravedad en un contexto relativista era considerarla no como un
campo de fuerzas actuando en el espacio-tiempo sino, en vez de ello,
Espacio, tiempo, movimiento 71
como una modificación de la propia estructura geométrica del espa
cio-tiempo. En presencia de gravedad, argüyó, el espacio-tiempo no
es «plano», sino «curvo». Para saber lo que esto significa, empero,
debemos examinar brevemente la historia de la geometría según ha
sido desarrollada por los matemáticos.
(a) (b)
IF ig u r a 2.6. E l corrimiento al rojo gravitacional. (a) Representa un laboratorio acelerado con un reloj en el suelo y otro sujeto al techo. Debido a que una señal emitida
desde el reloj del suelo se recibe en el reloj del techo cuando el laboratorio está en
movimiento con una velocidad relativa al sistema de movimiento en el que se emitió
la señal (debido a la aceleración del laboratorio), el reloj del techo registrará que el reloj del suelo «atrasa» de manera muy parecida a como un observador escucha un
pitido que se aleja con una intensidad menor de la que se escucharía si el pitido estu
viese estacionario con respecto al observador. La relatividad general postula que un resultado similar se obtendrá en un laboratorio no acelerado, pero fijo, en un campo
gravitacional — como en (b)— . Un reloj situado más abajo en el campo gravitacional será registrado como «atrasando» por un reloj situado más arriba en el potencial gravitacional. Esto es el denominado corrimiento al rojo gravitacional. Señala una de las
maneras en que puede considerarse que la gravedad afecta a la estructura métrica del espacio-tiempo.
72 Filosofía de la física
La geometría no-euclídeaLa geometría ordinaria, en la forma en que Euclides la formalizó, de
riva todas las verdades geométricas de un pequeño conjunto de pos
tulados básicos, supuestamente autoevidentes. Aunque la axiomatiza-
ción por Euclides de la geometría no es, de hecho, completa (es
decir, suficiente en sí misma para permitir que se lleven a cabo todas
las derivaciones sin presuponer otras premisas subyacentes u ocul
tas), puede ser completada en esta forma. Durante mucho tiempo
existió un gran desconcierto en torno al denominado postulado de
las paralelas de Euclides. Éste equivale a la afirmación de que por un
punto no situado sobre una recta puede trazarse una, y solo una, rec
ta que se encuentre en el plano común a la recta y al punto dados y
que no intersecte a la recta dada en ninguna dirección con indepen
dencia de cuanto se extiendan las rectas. A los geómetras les pareció
que este postulado carecía de la autoevidencia de las otras hipótesis
más simples (tales como «iguales sumados a iguales dan iguales», y
«dos puntos determinan una recta que pasa por ellos»). ¿Podría este
postulado «sospechoso» derivarse de los otros postulados, resultando
superfluo como suposición independiente? Si uno pudiera demostrar
que la negación del postulado de las paralelas era inconsistente con
los otros postulados, podría demostrar que tal derivación era posible
por el método de reductio ad absurdum. Pero, ¿podía demostrarse
esto?
La negación del postulado de las paralelas puede tomar dos di
recciones. El postulado dice que existe una, y solo una, paralela por
un punto, y para negar esto podría afirmarse que no existe ninguna
paralela o que hay más de una. En 1733 G. Saccheri demostró que el
postulado de las no paralelas era, de hecho, inconsistente con el resto
de los axiomas, al menos si éstos se interpretaban en la forma habi
tual. Pero no fue capaz de demostrar que la negación de las muchas
paralelas también era inconsistente. Hacia el siglo XIX, J. Bolyai, N. I.
Lobachevsky y K. F. Gauss habían reconocido que se podían cons
truir geometrías consistentes que adoptaban los postulados de Eucli
des pero presentaban un postulado de muchas paralelas en lugar del
postulado de las paralelas de Euclides. B. Riemann demostró enton
ces que, si se modificaba ligeramente la interpretación de los otros
axiomas, podía también construirse una nueva geometría, con un
postulado de no paralelas en lugar del postulado de las paralelas de
Espacio, tiempo, movimiento 73
Euclides, que fuese lógicamente consistente. Las reinterpretaciones
necesarias son que: «Dos puntos determinan una recta» debe enten
derse de manera que en ocasiones haya más de una línea recta conte
niendo un par de puntos dados, y «Una línea puede extenderse arbi
trariamente en las dos direcciones» debe entenderse como afirmando
que una línea no encontrará ningún punto final si se prolonga, pero
no implicando que una línea completamente extendida tenga longi
tud infinita.
Posteriormente se vio que, si estas nuevas geometrías no-euclí-
deas eran consideradas como geometrías bidimensionales planas, po
dían ser interpretadas en una forma euclídea como la geometría de
las curvas de distancia más corta (geodésicas) sobre superficies bidi-
mensiondes curvas. En particular, la geometría axiomática riemannia-
na era justamente la geometría de las figuras construidas con arcos
de circunferencias máximas sobre la superficie de una esfera. Pero,
¿qué podía entenderse por geometrías no-euclídeas tridimensionales
lógicamente consistentes, o eran éstas, si bien lógicamente consisten
tes, absurdas por otras razones?
Gauss llevó la geometría un paso más allá con el desarrollo de
una teoría general de las superficies curvas bidimensionales. Estas se
caracterizan por un número — conocido como la curvatura gaussia-
na— en cada punto. La forma en que esta curvatura varía con la dis
tancia, medida a lo largo de las curvas dibujadas sobre la superficie,
determina la forma de la superficie curva. Gauss imaginó estas super
ficies curvas inmersas en el espacio euclídeo ordinario de tres dimen
siones. Un importante resultado de su trabajo, sin embargo, fue que
se podían caracterizar algunos de los aspectos de la curvatura (curva
tura «intrínseca») por medio de cantidades que podían ser determi
nadas por una hipotética criatura bidimensional confinada a la super
ficie curva y ajena por completo a la existencia de un espacio
tridimensional en derredor. Desde esta nueva perspectiva resultó que
las geometrías descritas por los viejos sistemas de axiomas podían ser
entendidas como casos especiales. La geometría euclídea bidimensio
nal, la geometría del plano, es la geometría de la superficie cuya cur
vatura gaussiana es cero en todo lugar. La geometría riemanniana, la
geometría de las superficies bidimensionales esféricas, es sencillamen
te la geometría de una superficie cuya curvatura gaussiana es cons
tante y positiva. La geometría de Bolyai-Lobachevsky es la geometría
de una superficie bidimensional cuya curvatura gaussiana es la mis-
74 Filosofía de la física
ma en cada punto y negativa. La curvatura negativa es característica
de un punto como el que hallamos en el centro de un paso de mon
taña, donde la superficie se curva «en direcciones opuestas» a lo lar
go de diferentes caminos que pasan por él.
Riemann siguió entonces adelante y generalizó la teoría de Gauss
de las superficies curvas a espacios de un número arbitrario de di
mensiones. Mientras Gauss daba por sentado que las superficies en
cuestión se hallaban inmersas en un espacio euclídeo plano, Riemann
no hizo tal suposición. Después de todo, un resultado del trabajo de
Gauss era que algunos aspectos de la curvatura serían accesibles a
una criatura bidimensional ajena al espacio circundante. La geome
tría riemanniana general se ocupa de estos aspectos de la curvatura,
los aspectos intrínsecos. (Esta geometría riemanniana general de los
espacios curvos «-dimensionales no debe ser confundida con la geo
metría axiomática riemanniana anterior.) La suposición básica de esta
geometría es que el espacio curvo «-dimensional puede ser aproxima
do en regiones suficientemente pequeñas por un espacio euclídeo,
plano, «-dimensional. En el caso de superficies curvas en el espacio
plano tridimensional, estas superficies aproximativas pueden ser re
presentadas por planos tangentes a la superficie curva en un punto
dado; los planos también Se encuentran contenidos en el espacio tri
dimensional circundante. En el caso de un espacio curvo riemannia-
no general «-dimensional, se postula la existencia de estos «planos
tangentes» solamente en el sentido de que, en lo que a las caracterís
ticas «-dimensionales intrínsecas respecta, el espacio curvo «-dimen
sional puede ser aproximado en un punto dado por un espacio euclí
deo, plano, «-dimensional.
¿Cuáles son algunas de las características de los espacios curvos?
¿Cómo podría, por ejemplo, una criatura tridimensional que habitase
en un espacio curvo tridimensional descubrir que su espacio era, en
efecto, curvo? La curvatura intrínseca se pone de manifiesto en la
medida de -las distancias. Una criatura «-dimensional puede realizar
un número suficiente de mediciones de distancias entre puntos para
asegurarse de que no había forma de que estos puntos pudieran estar
localizados en un espacio plano «-dimensional y tener las distancias
mínimas entre ellos a lo largo de curvas que tienen los puntos de las
criaturas. Por ejemplo, un examen de las distancias aéreas más cortas
entre ciudades de la Tierra nos podría decir que la superficie de la
Tierra no era plana, sino que se aproximaba a la de una esfera. En un
Espacio, tiempo, movimiento 75
espacio curvo «-dimensional, las curvas de distancia más corta, las
denominadas geodésicas del espacio, ya no son las líneas rectas que
serían si se tratase de un espacio plano. Estas líneas son también las
líneas de «menor curvatura» en el espacio. Intuitivamente, esto signi
fica que las líneas, pese a no ser rectas debido a la curvatura del es
pacio, no se desvían de la rectilineidad más de lo que les obliga la
curvatura del espacio mismo.
La curvatura puede manifestarse en otras formas también. Por
ejemplo, si tomamos un segmento dirigido (un vector) y lo movemos
a lo largo de una curva cerrada en un espacio plano, de manera que
permanezca en todo momento tan paralelo como sea posible a sí mis
mo según lo vamos moviendo, cuando retornemos al punto de parti
da, el vector apuntará en la misma dirección en ese punto que cuan
do comenzamos. Pero en un espacio curvo, semejante transporte
paralelo de un vector a lo largo de un lazo cerrado modificará, en ge
neral, la dirección del vector, de manera que al final del transporte
apuntará en una dirección diferente a la dirección con la que partió
al comienzo del viaje.
Un espacio plano tridimensional tiene una extensión infinita y
tiene un volumen infinito. Un plano euclídeo tiene extensión infinita
y área infinita. Pero la superficie intrínsecamente curva de una esfera,
aunque no tiene límites, tiene un área finita. Una criatura bidimen-
sional que habitase en una superficie esférica podría pintar la superfi
cie. Nunca encontraría un límite a la superficie. Pero después de un
tiempo finito habría concluido el trabajo, habiendo pintado toda la
superficie. De manera similar, una criatura tridimensional que habite
en el espacio curvo tridimensional que es análogo a la superficie esfé
rica, que habite en una así denominada tri-esfera, podría llenar la re
gión de plástico espumoso. Aunque nunca encontrase una pared que
limitase el espacio, terminaría el trabajo en un tiempo finito, habien
do llenado todo el volumen del espacio tridimensional con una canti
dad finita de espuma plástica.
Parece claro, pues, que la noción de un espacio curvo «-dimen
sional, incluyendo la de un espacio curvo tridimensional, no es sólo
lógicamente consistente, sino que no tiene evidentemente nada de
absurda. Siempre y cuando nos ciñamos a las características intrínse
cas de la curvatura, no estamos haciendo la suposición de que el es
pacio está inmerso en un espacio plano circundante de un mayor nú
mero de dimensiones. Y las características de la curvatura intrínsecas
76 Filosofía de la física
al espacio pueden claramente ser averiguadas mediante técnicas di
rectas por una criatura que viva en el espacio. ¿No podría darse el
caso, pues, de que el espacio tridimensional real de nuestro mundo
fuese curvo, y no el espacio plano caracterizado por los postulados
básicos de la geometría euclídea tridimensional? Tales especulacio
nes acompañaron naturalmente el descubrimiento de las nuevas geo
metrías.
E l uso de las geometrías no-euclídeas en la física9
En el siglo xix se especuló con la posible realidad del espacio curvo.
W. Clifford, por ejemplo, sugirió que era concebible que la materia
consistiera efectivamente de regiones pequeñas de espacio sumamen
te curvo en un espacio tridimensional que fuese plano a gran escala.
Era evidente que una curvatura del espacio a gran escala sólo podría
ser detectada a las escalas más grandes, astronómicas, pues la expe
riencia de generaciones nos había demostrado lo bien que funciona
ba la geometría euclídea tridimensional plana en nuestras descripcio
nes del mundo. Efectivamente, funcionaba bien para mediciones del
tipo ordinario e, incluso, en la descripción de cosas tales como la es
tructura del sistema solar.
No obstante, solamente con la nueva teoría relativista de la gra
vedad de Einstein, la teoría general de la relatividad, la geometría
curva pasó a formar parte esencial de una teoría física plausible. Ya
hemos visto que uno podía argüir con plausibilidad que la gravedad
afectaría dinámicamente a todos los objetos en la misma forma, con
independencia de su tamaño y constitución. Así, un objeto material
que, en ausencia de gravedad u otras fuerzas, seguiría una trayectoria
con dirección y velocidad uniformes, seguiría una trayectoria diferen
te c*n presencia de la gravedad. Pero el cambio de trayectoria depen
dería solamente del campo gravitacional y de la posición y velocidad
iniciales del objeto. No dependería de la masa del objeto o del mate
rial del que había sido hecho. Esta independencia del efecto de la
gravedad respecto al tamaño y estructura del objeto es lo que hace
posible la «geometrización» del campo gravitacional.
Cuando se la combina con los argumentos a favor de un efecto
gravitacional sobre las características métricas del mundo, según son
determinadas por reglas y relojes, la idea de tratar la gravedad como
77
una curvatura deviene plausible. Pero no es un espacio curvo lo que,
al menos de una manera fundamental, Einstein postula, sino, en su
lugar, un espacio-tiempo curvo. En el espacio-tiempo de Minkowski
de la relatividad especial, las partículas libres describían líneas rectas
de tipo temporal, las geodésicas de tipo temporal del espacio-tiempo.
Ahora, sugiere Einstein, hemos de pensar en las partículas sobre las
que sólo actúa la gravedad como partículas «libres» que se desplazan,
no ya según líneas rectas de tipo temporal, sino según las geodésicas
curvas de tipo temporal de un espacio-tiempo que es curvo. Un re
sultado fundamental de la geometría de Riemann es que por un pun
to en una dirección dada pasa una única trayectoria geodésica. En
los espacios riemannianos, las geodésicas son las trayectorias de cur
vatura mínima y las de distancia más corta (localmente) al mismo
tiempo. Dada la nueva métrica del espacio-tiempo, es más convenien
te tomar como fundamental la definición de «menor curvatura» de
las geodésicas. En el espacio-tiempo, si uno especifica una dirección
en un punto, especificará simultáneamente una dirección espacial y
una velocidad en cada dirección. Así, la geodésica de tipo temporal
que pasa por un punto en una dirección dada corresponderá a la es
pecificación de la posición inicial y de la velocidad inicial de una
partícula. La trayectoria determinada por la geodésica será entonces
única. Y esto es justamente lo que queremos para la gravedad ya que,
dadas una posición y una velocidad iniciales, la trayectoria de cual
quier partícula en un campo gravitacional es la misma. La luz, que en
la relatividad especial recorre las geodésicas nulas rectilíneas del es-
pacio-tiempo de Minkowski, recorre ahora las geodésicas nulas del
espacio-tiempo curvo, geodésicas que no serán, en general, líneas rec
tas. (Véase la figura 2.7.)
Uno podría determinar la curvatura de un espacio-tiempo si
guiendo las trayectorias de las partículas y de los rayos de luz «li
bres», es decir, partículas y rayos de luz que actúan bajo la sola in
fluencia de la gravitación, considerada ahora simplemente como la
curvatura del espacio-tiempo. Pero uno podría también, al menos en
principio, determinar la estructura de la curvatura realizando un nú
mero suficiente de mediciones de las separaciones espacial y tempo
ral de los sucesos y reuniendo estas mediciones en el intervalo de se
paración, que es la métrica del espacio-tiempo. La relatividad general
postula que el espacio-tiempo así determinado coincidirá con el obte
nido siguiendo los movimientos geodésicos de las partículas y de los
78 Filosofía de la física
(a) (b)F i g u r a 2 .7 . Movimiento en un campo gravitacional a lo largo de las geodésicas curvas. En (a) el espacio-tiempo es visto como «plano». La linea recta t representa la trayectoria que una partícula «libre» seguiría a través del espacio-tiempo y la línea recta l la trayectoria de un rayo de luz «libre». Bajo la influencia de una fuerza como la gravedad, la partícula y el rayo de luz recorrerán trayectorias curvas tales como t' y /'. Pero éstas son vistas como desviaciones de las trayectorias más rectas en el espacio- tiempo. En (b) las trayectorias rectas han desaparecido. En su lugar el espacio-tiempo es visto como «curvo» en la presencia de gravedad, siendo t ' y /' las trayectorias de
partículas y rayos de luz «libres» (es decir, partículas y rayos de luz sobre los que no
actúa ninguna fuerza no gravitacional), ahora consideradas geodésicas, o trayectorias más rectas posibles en el espacio-tiempo curvo.
rayos de luz, utilizando relojes y reglas para hacer que las mediciones
temporales y espaciales se vean también afectadas por el campo gra
vitacional, en el sentido de que ellos miden adecuadamente estas
cualidades métricas en el espacio-tiempo curvo.
La teoría gravitacional tradicional presentaba dos partes: una es
pecificaba la acción de la gravedad sobre objetos prueba; la otra es
pecificaba la clase de campo gravitacional que sería generado por
una fuente de gravedad. En la vieja teoría, la gravedad era una fuerza
que aceleraba de igual manera a todos los objetos materiales situados
en el mismo lugar de un campo gravitacional. En la nueva teoría, la
gravedad es la estructura del espacio-tiempo curvo. Afecta a las partí
culas y a los rayos de luz haciendo que ahora describan geodésicas
curvas nulas y de tipo temporal en el espacio-tiempo, y afecta a los
instrumentos de medida espacial y temporal idealizados.
Espacio, tiempo, movimiento 79
¿Qué sucede con el segundo aspecto de la teoría, el que especifi
caba qué tipo de campo gravitacional sería generado por una fuente
de gravedad? En la vieja teoría, cualquier objeto masivo genera un
campo gravitacional. En la nueva teoría relativista, la gravedad está
asociada con la energía de masa del mundo material. Las ecuaciones
de campo de la relatividad general poseen en el miembro de la iz
quierda una expresión matemática que caracteriza la curvatura del
espacio-tiempo. En el miembro de la derecha presentan una expre
sión que caracteriza la forma en que la energía de masa se distribuye
en el espacio-tiempo, el denominado tensor de energía-momento.
Esta ecuación es la que relaciona la gravedad, ahora el espacio-tiem
po curvo, con sus fuentes en ia energía de masa no gravitacional. (El
«no gravitacional» es importante porque el campo gravitacional pro
piamente dicho, el espacio-tiempo curvo, también posee energía de
masa.) Sería un error pensar en la materia como «causante» del cam
po gravitacional en un sentido simplista, porque para conocer el
miembro de la derecha de la ecuación, el cual describe cómo la ener
gía de masa se distribuye en el espacio-tiempo, es preciso postular
una estructura de espacio-tiempo. La ecuación nos dice si un espa
cio-tiempo dado es compatible con una distribución postulada de
energía de masa en ese espacio-tiempo. Solamente cuando la ecua
ción es satisfecha, tanto por la estructura espacio-temporal postulada,
como por la distribución de energía de masa postulada en esa estruc
tura, el mundo postulado es un mundo posible en la nueva teoría.
Es interesante que, dada la ecuación de campo, se siga la ley di
námica de la gravedad —que las partículas materiales puntuales «li
bres» recorren geodésicas de tipo temporal. A diferencia de la teoría
de Newton, la ley dinámica de la gravedad no necesita ser postulada
como una ley independiente, sino que puede ser derivada de la ecua
ción de campo básica.
Si aceptamos esta nueva teoría del espacio-tiempo curvo de la
gravedad, confrontamos entonces la tarea de intentar, como habitan
tes del mundo, determinar su estructura espacio-temporal actual. La
teoría nos dice que la geometría del espacio-tiempo debe estar corre
lacionada con la distribución de materia y energía en ese espacio-
tiempo. Y la estructura espacio-temporal en cuestión se hace mani
fiesta a través de las trayectorias geodésicas curvas de los rayos de luz
no obstaculizados y de las partículas «libres», así como por medio de
intervalos espaciales y temporales determinados por reglas de medir
Filosofía de la física
(o cimas en un mundo curvo) y relojes idealizados. Naturalmente,
si el espacio-tiempo muestra alguna curvatura, lo hará en las escalas
astronómicas, pues nosotros disponemos de una amplia experien
cia empírica para asegurar que en las mediciones locales, a peque
ña escala, la geometría plana minkowskiana funciona adecuada
mente.
Algunos efectos de esta «gravedad», entendida ahora «como cur
vatura espacio-temporal», se manifiestan en la escala del sistema
solar. Se considera que los planetas describen geodésicas en un espa
cio-tiempo curvado por la presencia de un sol masivo. Esto introduce
leves modificaciones en el movimiento kepleriano de los planetas ex
plicable por la teoría newtoniana. Sabemos que la curvatura espacio-
temporal, incluso del sistema solar, es pequeña. Las trayectorias de
los planetas en el espacio-tiempo se desvían ligeramente de las geo
désicas rectilíneas (que no deben confundirse con las elipses espacia
les, obviamente curvadas, que describen). Pero el efecto de la curva
tura es superponer a las familiares trayectorias elípticas de los
planetas pequeños efectos adicionales, tales como un desplazamiento
(respecto a un sistema inercial fijo en el sol) del punto de mayor
aproximación del planeta al sol en su órbita, un desplazamiento que
puede ser detectado en el caso del planeta Mercurio.
Otros efectos métricos de la gravedad pueden también observarse
en una escala relativamente pequeña, en particular, el atraso de un re
loj respecto a otro, si el primer reloj está situado por debajo del se
gundo en un potencial gravitacional. Pero es en las grandes escalas
cosmológicas donde se encuentran las nuevas y más interesantes pre
dicciones de la teoría y donde son posibles las más fascinantes mani
festaciones de las consecuencias observacionales de la curvatura del
espacio-tiempo. Aquí uno trata con universos modélicos sumamente
idealizados, de los que pueden derivarse conclusiones teóricas. Lo
que se espera, por supuesto, es que al menos algunas de estas imá
genes idealizadas del mundo a escala cosmológica se aproximen lo
bastante a la realidad para proporcionarnos una idea del mundo que
descubrimos en nuestras observaciones astronómicas del espacio pro
fundo. Por ejemplo, se supone habitualmente que la materia del uni
verso puede considerarse distribuida uniformemente y que la distri
bución es la misma en todas las direcciones del espacio en el mundo
cosmológico. Esta suposición está siendo actualmente sometida a un
intenso escrutinio observacional.
Espacio, tiempo, movimiento 81
Una gran variedad de posibles universos espacio-temporales ha
sido explorada por los teóricos. En muchos de ellos, la estructura de
continuidad del universo difiere de la de los universos de la física re
lativista especial o newtoniana. En algunos universos, por ejemplo,
pueden existir trayectorias de tipo temporal cerradas, colecciones de
sucesos tales que, cuando un observador los va siguiendo de suceso
en suceso, regresa en algún momento al suceso inicial. Otros espacio-
tiempos, aunque no tan patológicos causalmente, pueden hallarse
próximos a contener en su seno semejantes trayectorias curvas cerra
das. Otros espacio-tiempos peculiares llevan incorporada una no-
orientabilidad. Se encuentran dados la vuelta, como la conócida ban
da de Móbius, una superficie bidimensional girada inmersa en el
triespacio. (Véase la figura 2.8.)
F i g u r a 2.8, Un espacio no orientable. La banda de Mdbius es el ejemplo más sencillo
de espacio no orientable, en este caso de dimensión dos. B y B' representan figuras orientadas que no podrían ser transformadas la una en la otra si estuviesen dibujadas sobre una superficie plana normal. Pero si tomamos B y la movemos alrededor de la banda torcida de Móbius, podemos llevarla de vuelta en algún momento a Q de manera que coincida con B'. Esto pone de manifiesto la naturaleza no orientable de la superficie. En el espacio-tiempo, la no orientabilidad puede ser espacial, temporal o
espacio-temporal.
En un mundo espacio-temporal no-orientable semejante puede
resultar imposible hacer una distinción global entre objetos dextrógi-
ros y levógiros, pudiendo un objeto dextrógiro transformarse en uno
levógiro en el mismo lugar mediante un viaje por el espacio-tiempo.
O bien, puede que se carezca de orientabilidad temporal, lo cual ha
ce imposible determinar globalmente cuál es la dirección temporal
del «pasado» y cuál la del «futuro» en un suceso puntual.
82 Filosofía de la física
En algunos espacio-tiempos, los observadores pueden dividir el
espacio-tiempo en espacios-en-un-tiempo. Esto significa que en
estos mundos, para un observador en un estado determinado de
movimiento, el espacio-tiempo puede ser seccionado en espacios
tridimensionales de sucesos a los que se puede asignar un tiempo
específico en un orden temporal de validez universal. Para otros
espacio-tiempos, una segmentación semejante del espacio-tiempo
en «secciones simultáneas» de tri-espacios-en-un-tiempo es imposi
ble. Cuando dicha segmentación del espacio-tiempo en espacios-
en-un-tiempo es posible, los espacios pueden ser espacios curvos
tridimensionales del tipo estudiado por Riemann en su generaliza
ción de la geometría gaussiana de las superficies curvas. Un univer
so de esta índole, el modelo de Einstein, posee un tiempo que se
extiende indefinidamente en el pasado y en el futuro. Para un ob
servador en cada tiempo el mundo espacial existe como una esfera
cerrada tridimensional de tamaño finito y constante. Los universos
de Robertson-Walker están formados por espacios-en-un-tiempo de
curvatura constante, pero la curvatura puede ser positiva, cero o
negativa. El parámetro de tamaño en estos espacios puede variar
con el tiempo, convirtiéndolos en modelos plausibles de universos
big bang que presentan, .como parece ser el caso de nuestro univer
so según se desprende de los datos observacionales, un punto sin
gular en el que toda la materia del mundo está comprimida en un
punto espacial.
Es más, la curvatura espacio-temporal ayuda a explicar los datos
posibles de la experiencia en otra área: la descripción de las singulari
dades generadas por la materia colapsante de estrellas masivas. Éstos
son los famosos agujeros negros, regiones del espacio-tiempo tan cur
vadas por la presencia de materia sumamente densa que la luz no
puede escapar desde la región de espacio-tiempo interior al espacio-
tiempo exterior en las inmediaciones del punto singular de colapso
de la estrella. Los modelos de dichas regiones del espacio-tiempo,
fuertemente curvadas localmente, correspondientes a estrellas colap-
sadas con una carga eléctrica y/o con rotación, así como la clase ori
ginal estudiada, aportan casos de estudio fascinantes de los efectos
peculiares que puede tener la gravedad como curvatura espacio-tem
poral. Aunque la evidencia procedente de la observación todavía no
es concluyente, parece que algunos de los generadores de radiación
fuertemente energética en el cosmos, por ejemplo, los cuásares y los
Espacio, tiempo, movimiento 83
núcleos de las denominadas galaxias activas, podrían muy bien ser
agujeros negros semejantes.
E l espacio-tiempo curvo y la gravedad newtonianaCuando discutimos la transición del espacio y el tiempo al espacio-
tiempo al formularse los fundamentos de la teoría especial de la rela
tividad, observamos que, una vez construido el espacio-tiempo de
Minkowski como el espacio-tiempo apropiado a la relatividad espe
cial, los científicos se dieron cuenta de que se podía utilizar la noción
de espacio-tiempo para construir un espacio-tiempo que en algunos
aspectos se adaptase a la física de Newton mejor que su propio espa
cio y tiempo absolutos. Este fue el espacio-tiempo galileano o neo-
newtoniano. A la luz de la descripción de la gravedad como espacio-
tiempo curvo, la teoría general de la relatividad, se hizo evidente que
también en la imagen prerrelativista uno podía redescribir la grave
dad por medio de un espacio-tiempo curvo. En este marco prerrelati
vista, la gravedad no tiene los efectos sobre las mediciones de espa
cio y tiempo que tiene en la versión relativista, ni se tiene en modo
alguno en cuenta el efecto de la gravedad en la luz. En lugar de ello,
son los familiares efectos dinámicos de la gravedad los que se trans
forman en la curvatura del espacio-tiempo.
En esta imagen, el tiempo es lo mismo que fue para Newton.
Hay un intervalo de tiempo definido y absoluto entre dos sucesos
cualesquiera. Sucesos que son todos simultáneos forman espacios-en-
un-tiempo. Estos son, como lo eran para Newton, espacios euclídeos
tridimensionales planos. Al igual que en el espacio-tiempo neo-new-
toniano, no existe una noción no-relativa de dos sucesos no-simultá
neos en un mismo lugar, por lo que este espacio-tiempo carece de la
noción absoluta de igualdad de la posición en el tiempo y de veloci
dad absoluta de Newton. Pero, así como en la concepción neo-new-
toniana había geodésicas de tipo temporal que correspondían a las
posibles trayectorias de partículas moviéndose libremente, así tam
bién hay geodésicas de tipo temporal en esta nueva imagen espacio-
temporal. Sin embargo, mientras las geodésicas de tipo temporal de
la imagen neo-newtoniana eran trayectorias rectilíneas de partículas
moviéndose uniformemente (partículas sobre las que no actúan fuer
zas y se mueven, por la ley de inercia, con velocidad constante), aho
84 Filosofía-de la física
ra las geodésicas de tipo temporal son líneas curvas. Éstas resultan
ser las trayectorias de partículas «libres» en el nuevo sentido dimana
do de la teoría de la gravedad de Einstein, esto es, partículas sobre
las que no actúa ninguna otra fuerza más que la gravedad.
Una vez más, la fuerza gravitacional es eliminada de la teoría en
favor de la gravedad como curvatura de las geodésicas de tipo tem
poral, de manera que las partículas sienten el efecto de la gravedad,
no por verse desviadas de su movimiento geodésico por la fuerza del
objeto gravitatorio, sino, en su lugar, por seguir las trayectorias geo
désicas «libres» en el espacio-tiempo, trayectorias ahora curvas debi
do a la presencia del objeto gravitatorio que actúa como «fuente» de
curvatura del espacio-tiempo. Al igual que en la teoría de Einstein, es
únicamente el efecto uniforme de la gravedad sobre un objeto prue
ba, el hecho de que todos los objetos afectados por la gravedad su
fren el mismo cambio en su movimiento con independencia de su
masa o de su constitución, lo que permite esta «geometrización» de
la fuerza gravitacional. Este espacio-tiempo curvo de la gravedad
newtoniana no es, como el espacio-tiempo de Minkowski o el espa-
cio-tiempo curvo de la teoría general de la relatividad, un espacio-
tiempo riemanniano (o pseudo-riemanniano); pues, a diferencia de los
espacio-tiempos de la relatividad especial y general, carece de estruc
tura métrica espacio-temporal. Hay un intervalo temporal definido
entre dos sucesos cualesquiera. En el caso de sucesos simultáneos,
hay una separación espacial definida entre dos sucesos cualesquiera.
En este sentido, este espacio-tiempo posee una métrica del tiempo y
una métrica del espacio. Pero, por contraste con el caso relativista,
no existe ningún intervalo espacio-temporal entre un par de sucesos.
La curvatura se revela solamente en la no rectilineidad de las geodé
sicas de tipo temporal, y no en alguna característica métrica del espa-
cio-tiempo.
Resumen
El desarrollo de las elegantes teorías de Einstein, que intentan hacer
justicia a los sorprendentes hechos observacionales sobre el compor
tamiento de la luz, las partículas libres y las reglas y los relojes de
medida, nos proporciona, pues, dos revoluciones en nuestras concep
ciones del espacio y el tiempo. Primero, el espacio y el tiempo son
85
reemplazados por la noción unificada de espacio-tiempo, en relación
a la cual los aspectos espaciales y temporales del mundo pasan a ser
derivados. Segundo, la noción de curvatura es invocada con el fin de
hallar un lugar natural para los efectos de la gravedad en dicha ima
gen espacio-temporal del mundo.
Sin duda, tales revoluciones en nuestra perspectiva científica so
bre lo que son realmente el espacio y el tiempo deberían llevar a un
profundo replanteamiento de las cuestiones típicamente filosóficas
sobre el espacio y el tiempo. ¿Cómo deberíamos considerar el estatus
de nuestras pretensiones de conocimiento sobre la estructura del es
pacio y el tiempo en este nuevo contexto en el que, por primera vez,
un número de propuestas posibles y diferenciadas sobre la estructura
del espacio y"el tiempo están al alcance de nuestra inspección cientí
fica? Y ¿qué efecto deberían tener dichas estructuras noveles del es
pacio y el tiempo en nuestras concepciones sobre la naturaleza meta
física del espacio y el tiempo? En particular, ¿qué efecto deberían
tener estas revolucionarias concepciones científicas en el debate tra
dicional entre sustantivistas y relacionistas? Es a estas cuestiones filo
sóficas a las que vamos a prestar atención a continuación.
¿Cómo conocemos la verdadera geometría del mundo?
Concepciones cambiantes acerca de nuestro conocimiento de la geometría
Ya señalamos anteriormente la actitud cambiante de la comunidad
filosófica y científica ante la cuestión del fundamento ideal para
nuestro conocimiento del mundo que siguió a la revolución científi
ca del siglo x v ii. Primero se pensó que una proposición podía cono
cerse con un tipo de certeza que se seguía de la sola razón pura; des
pués se impuso gradualmente la idea de que nuestro conocimiento
del mundo — las verdades generales y teóricas acerca de la naturale
za de las cosas— podía sólo ser inferido a partir de verdades funda
mentales sobre el mundo. Esta inferencia era fiable, pero falible. La
creencia en estas verdades fundamentales descansaba en los datos
suministrados por los sentidos a través de la observación y del expe
rimento.
Pero la geometría siguió siendo una espina clavada en este enfo
86 Filosofía de la física
que empirista de la teoría del conocimiento. Supongamos que la geo
metría nos aporta verdades acerca de la naturaleza del mundo que
reconocemos como tales porque se siguen por cierta inferencia lógica
de verdades fundamentales cuya verdad es evidente en sí misma y
cognoscible para la razón pura. La geometría puede ser reconocida
entonces como verdadera con independencia de la observación y el
experimento. ¿No hay, pues, un campo de conocimiento acerca del
mundo por lo menos que no necesita de la garantía de los datos de
los sentidos, sino que podría afianzarse por el pensamiento puro sola
mente? Y si la geometría fuese una disciplina de esta índole, ¿no se
ría posible que en algún momento todo nuestro conocimiento físico
llegara a descansar en dicho fundamento epistémico superior?
El descubrimiento de las geometrías no-euclídeas contribuyó a
menoscabar las pretensiones de este tipo. Si la geometría euclídea no
era la única geometría posible, ¿cómo podía uno afirmar que las ver
dades de la geometría podían ser conocidas con independencia del
experimento? ¿No se revelaba la estructura del espacio en la geome
tría, así como cualquier otra estructura física que pudiera ser descrita
por una cualquiera de un número de teorías alternativas incompati
bles? En tal caso, ¿no deberíamos apoyarnos en la observación, como
hacemos en otras ciencias, para averiguar cuál de las posibles teorías
describe verdaderamente la estructura del mundo?
Los defensores de la concepción según la cual la geometría euclí
dea describía la naturaleza del mundo intentaron algunas veces cues
tionar la propia consistencia lógica de las geometrías no-euclídeas.
Esa táctica pronto fracasó, pues no tardaron en crearse pruebas de
consistencia relativa para las geometrías axiomáticas no-euclídeas.
Estas pruebas demostraron que podíamos estar seguros por pura ló
gica de que si las geometrías no-euclídeas eran inconsistentes, tam
bién lo era la geometría euclídea. En consecuencia, las geometrías
no-euclídeas eran al menos tan respetables desde un punto de vista
lógico como la euclídea. Los kantianos pudieron continuar defen
diendo por otras razones que la geometría euclídea era la verdadera
geometría del mundo, manteniendo, como lo hicieron, que la verdad
de la geometría euclídea tenía un tipo de necesidad que transcendía
la necesidad de las verdades cuya verdad se debía solamente a la ló
gica. Veremos en un momento una réplica a ellos. En general, sin em
bargo, quienes estaban familiarizados con la existencia de las nuevas
geometrías, estaban convencidos de que la geometría del mundo,
Espacio, tiempo, movimiento 87
como su química o su física, era algo sobre lo que sólo el experimen
to nos podía informar.
Como hemos visto, solamente en el contexto relativista comenza
ron las geometrías no-relativistas a jugar, de hecho, un papel impor
tante en la física teórica. La ruta partió del espacio y tiempo newto-
nianos, y continuó a través del espacio-tiempo de la relatividad
especial hasta el espacio-tiempo curvo de la teoría general de la rela
tividad. En cada fase de transición los hechos empíricos, los resulta
dos de la observación y del experimento, jugaron un papel decisivo.
La postulación del espacio-tiempo de Minkowski, el espacio-tiempo
de la relatividad especial, descansaba sobre el sorprendente descubri
miento de que, hasta donde llegaban los experimentos de ida y vuel
ta, la velocidad de la luz parecía ser la misma en todos los estados
inerciales de movimiento y en todas las direcciones. Por otro lado, el
hecho de que la velocidad de la luz fuese la velocidad máxima de
propagación de las señales causales desempeñó también un papel im
portante en la fundamentación de la teoría, y esto fue también un he
cho de experiencia observacional. Además, estaban todos los hechos
predichos en relación a la teoría especial, como los relativos a los
tiempos de vida aparentes de las partículas inestables en movimiento
respecto al observador, al aumento aparente de masa inercial con el
aumento de la velocidad, y otros, que una y otra vez se tomaban
como confirmación experimental de la nueva imagen espacio-tem
poral.
También en el paso a la relatividad general jugaron un papel cen
tral los hechos revelados por la observación, primero al sugerir la
nueva teoría, y después al confirmarla. Los hechos observacionales,
conocidos por Galileo, sobre cómo la gravedad actuaba sobre los ob
jetos con independencia de su tamaño y constitución, sugirieron ini
cialmente a Einstein la idea de tratar la gravedad como una caracte
rística geométrica del espacio-tiempo. Las predicciones sobre la
desviación de las trayectorias curvas de los rayos de luz cerca de ob
jetos gravitacionales y las velocidades relativas de los relojes ideales
en lugares diferentes de un potencial gravitacional se toman como
confirmación de la teoría. Otra confirmación basada en hechos pro
cede de los sutiles cambios predichos en las órbitas de los planetas
respecto a las trayectorias predichas por la teoría newtoniana. A la
larga se espera poder realizar observaciones a escala astronómica,
pongamos, de agujeros negros, o incluso a escala cosmológica, ponga
KH Filosofía de la física
mos, di- los clirios observacionales de la estructura globalmente cur
vada do la geometría del universo, para seguir probando las predic
ciones de la leona y, si se encuentra que concuerdan con la predic
ción, para confirmar su verdad.
¿No es evidente, pues, que los empiristas tienen razón? Uno pue
do imaginar un sinnúmero de teorías sobre la naturaleza del mundo.
Pero sólo la observación y el experimento nos podrán decir cuál teo
ría es la correcta. Esto es tan cierto para la geometría como lo es para
la física, la química, la biología o la psicología. Es la observación,
pues, la que ha de decidir cómo es realmente la geometría del mun
do. Cualquier esperanza de conocer la geometría del mundo con cer
teza e independientemente de la observación y el experimento es fa
laz. Pero, ¿están las cosas tan predeterminadas?
El convencionalismo de PoincaréQue no lo están fue lo que el gran matemático Henri Poincaré sugi
rió en un brillante análisis del estatus del conocimiento geométrico.
Su estudio precedió a las revoluciones de la relatividad, pero iba a
arrojar mucha luz sobre el estatus de la geometría en estas nuevas
teorías. Poincaré comienza presentando en una serie de ensayos una
prueba de consistencia relativa para una geometría no-euclídea, refu
tando cualquier afirmación de que dichas nuevas geometrías deban
ser desestimadas por ser lógicamente inconsistentes. Después consi
dera la afirmación kantiana de que la geometría euclídea es la geome
tría necesariamente correcta del mundo. De acuerdo a dicha vindica
ción, la necesidad de la geometría se basa en el hecho de que el
espacio es un componente de nuestra percepción del mundo y la
geometría euclídea describe la estructura de lo percibido que es
aportado a la percepción por la mente perceptora. Poincaré arguye
que el espacio de la física, el espacio en el que se dan los aconteci
mientos materiales, debe ser diferenciado de cualquier «espacio per-
ceptual», tal como el denominado campo visual de la percepción vi
sual. Arguye, de hecho, que no sabemos de la existencia o naturaleza
del espacio físico por ningún conocimiento perceptual directo, sino,
antes bien, por inferencia de lo que percibimos directamente. Son,
afirma, el orden y la regularidad de las partes de nuestra experiencia
perceptual de los fenómenos, lo que nos lleva a presuponer que esta
89
experiencia tiene un origen causal en los acontecimientos físicos, los
cuales no son de por sí componentes inmediatos de la conciencia
perceptual. Inferimos la existencia del mundo físico, incluido el espa
cio físico, y su naturaleza como una hipótesis explicatoria para dar
cuenta del orden y de la regularidad que experimentamos en nues
tras percepciones directas. Dicha inferencia es, pues, inferencia a par
tir de una hipótesis. Y ninguna de dichas hipótesis puede tener una
necesidad de ser generada a partir de unos supuestos «principios es
tructurales de lo percibido directamente», porque la hipótesis versa
sobre lo físico y lo inferido, y de ninguna manera sobre el contenido
de la percepción directa. •
En este punto, uno espera que Poincaré proponga que la geome
tría encuentra su soporte en la inferencia razonable a partir de los
datos de la observación y que uno podría, de hecho, descubrir que
las geometrías no-euclídeas se ajustaban mejor a los datos observacio
nales que la euclídea. Pero, en lugar de ello, nos sorprende con un
argumento en el sentido de que la geometría euclídea no puede ser
refutada por ningún tipo de experiencia. Arguye, de hecho, que siem
pre consideraremos a la geometría euclídea como la geometría del
mundo. Esta tiene, pues, un tipo de necesidad, pero la necesidad es
sólo cuestión de determinación convencional por nuestra parte, no
un reflejo de un hecho metafísico acerca del mundo.
El argumento de Poincaré descansa en una famosa parábola.
Imaginemos científicos bidimensionales confinados en un disco pla
no euclídeo finito. Ellos intentan determinar la geometría de su mun
do transportando reglas de medir de un lugar a otro. Pero los enga
ñamos. Les damos instrumentos de medir que se expanden y
contraen con los cambios de temperatura — todos en la misma ra
zón— y ajustamos la temperatura del disco de manera que las reglas
se contraigan a longitud cero en su periferia. Con un decaimiento
adecuado de la temperatura desde el centro al borde del disco, es fá
cil inducirles a engaño haciéndoles pensar que están viviendo en una
superficie bidimensional infinita lobachevskiana negativamente cur
vada. Si intentasen valerse de la luz para averiguar la geometría de su
mundo, pondríamos un medio con un índice de refracción variable
sobre la superficie, curvando las trayectorias de los rayos de luz de
tal forma que se verían de nuevo engañados. Así, son burlados al
pensar erróneamente que su geometría es no-euclídea, cuando no lo
es. (Véase la figura 2.9.)
90 Filosofía de la física
T = 0
F ig u r a 2.9. La parábola de Poincaré. Los habitantes bidimensionales están confinados en el interior de un disco ordinario en el plano euclídeo. Éstos están equipados con
varas de medir cuya longitud varía con la temperatura en una forma lineal. La temperatura en el centro del disco es T R 2, donde R es el radio del disco y T es una constante. En cualquier punto del disco la temperatura es T(R2 — r2) donde res la distancia del punto en cuestión al centro del disco. En el borde del disco, pues, la temperatura se hace cero y las varas de medir se contraen a longitud cero. E s fácil mostrar que si los habitantes consideran que la longitud de sus varas de medir es constante, llegarán a la conclusión de que viven en un plano lobachevskiano curvo que tiene una curvatura negativa constante y se extiende al infinito.
Pensemos ahora en nosotros mismos en nuestro mundo tridi-
mensioríal. Con independencia de las mediciones que hagamos utili
zando reglas y rayos de luz (o partículas libres o relojes, si es la geo
metría del espacio-tiempo lo que estamos determinando), ¿no podría
suceder que cualquier apariencia de no-euclidicidad en la geometría
se debiera a campos de dilatación y contracción y a campos que des
vían los rayos de luz y las partículas de sus trayectorias geodésicas, en
lugar de a una desviación genuina del espacio de su euclidicidad?
Espacio, tiempo, movimiento 91
Ahora bien, en el caso de las criaturas bidimensionales, supone
mos que nosotros tenemos la última palabra sobre lo que realmente está ocurriendo. Pero en caso de pretender determinar la geometría
de nuestro mundo, ¿qué es lo que debe marcar la diferencia entre
una geometría real no-euclídea y un mundo euclídeo con campos
distorsionantes que afectan incluso a los aparatos de medida idealiza
dos? La sugerencia de Poincaré es que no hay nada en los hechos
implicados que determine cuál de las hipótesis es la «correcta». Nos
corresponde a nosotros decidir qué descripción dar al mundo. La
«verdadera» geometría del mundo es una cuestión de decisión o con
vención por nuestra parte. Como veremos, dicha afirmación admite
interpretaciones muy diferentes.. Poincaré pasa a sugerir que, dado
que la geometría euclídea es más simple que la no-euclídea, siempre
elegiremos la primera como la «verdadera» geometría del mundo,
restaurando la euclidicidad como característica necesaria del mundo,
si bien una que es sólo «convencionalmente necesaria». Por supues
to, mucha gente ha advertido desde entonces que podría resultar
más sencillo describir el mundo en términos no-euclídeos, si con ello
se lograse simplificar el resto de la teoría, y que ésta es la elección he
cha (si es que es una elección) en, pongamos, la relatividad general
con su espacio-tiempo curvo.
Pero el argumento principal de Poincaré es claro. La evidencia
que podemos acumular mediante la observación y el experimento re
quiere una explicación teórica. Pero las hipótesis que ofrecemos para
explicar los hechos observacionales tienen una estructura que encie
rra un número de elementos. Podemos suscribir una propuesta acer
ca de la constitución de una parte de esta estructura a la vista de
datos cualesquiera, siempre que estemos dispuestos a postular un
número suficiente de cambios en otra parte de la estructura. Con in
dependencia de lo que nuestros experimentos muestren, podemos
elegir la geometría euclídea, por ejemplo, siempre que estemos dis
puestos a postular lo necesario para que un campo físico dilate y
contraiga las reglas, desvíe las ondas luminosas, etcétera. Por consi
guiente, afirma Poincaré, es una cuestión, no de hecho, sino de con
vención el que una geometría, y no otra, describa el espacio (o espa
cio-tiempo) del mundo.
92 Filosofía de la física
Respuestas a PoincaréHa habido una variedad muy amplia de respuestas a la vindicación
de Poincaré, una vindicación que cuestionaría no solamente la idea
de que podemos determinar la geometría del mundo por inferencia a
partir de la observación y el experimento, sino también la posibilidad
general de llegar a conclusiones definitivas sobre la estructura del
mundo apartadas de la observación directa. Una clase de respuestas
niega la premisa fundamental del argumento de Poincaré, esto es,
que uno puede aislar un conjunto de supuestos hechos sobre el
mundo como hechos de observación pura y situar luego estos hechos
en algún dominio de «percepciones en la mente», siendo todas las
aserciones físicas cognoscibles, si esto es posible, sólo sobre la base
de algún tipo de inferencia. Algunos negarían que un tal dominio de
lo percibido directamente sea inteligible, arguyendo que el conjunto
de nuestras percepciones no lo son de algunos «datos sensoriales en
la mente», sino del mundo físico. Negarían la existencia de cosas ta
les como objetos cognoscibles para la percepción con independencia
de una teoría postulada sobre el mundo. ¿Podemos creer seriamente
que el espacio en el que vemos mesas y sillas no es el espacio físico,
sino un «espacio visual» que no pertenece en modo alguno al domi
nio de la ciencia física?
Más importante aún, esas personas negarían normalmente la afir
mación de que hay hechos sobre el mundo inmunes en principio a
ser comprobados por «observación directa» o por «experimentación
directa». Para la tesis de Poincaré es crucial que hechos tales como
que el espacio del mundo sea realmente plano o curvo puedan sólo
conocerse por medio de una inferencia. No pueden ser determinados
por ningún tipo de inspección directa. Esta inmunidad de los hechos
geométricos a la observabilidad hace posible las teorías alternativas,
las cuales «salvan los fenómenos observables». Y esta inmunidad se
encuentra en la raíz del argumento de Poincaré de que nunca podre
mos afirmar legítimamente que conocemos la geometría del mundo
(excepto, claro está, estipulándolo convencionalmente).
Pero muchos han mostrado su escepticismo a que un tal reino
del ser inmune por siempre a la inspección directa pueda ser postula
do. Si ya negamos una vez un reino de lo directamente inspecciona
do «en la mente», considerando que cosas tales como mesas y árbo
les son visibles para nosotros, ¿no nos convence un resbaladizo
93
argumento de que en principio todas las cosas pueden ser «observa
das»? ¿No podemos ver bacterias utilizando microscopios, virus utili
zando microscopios electrónicos y núcleos utilizando aceleradores de
partículas? ¿Cómo puede entonces Poincaré estar seguro de que
nunca podremos simplemente observar que nuestro espacio es plano
o curvo?
No obstante, la presuposición de Poincaré de que no podemos,
de que la estructura geométrica forma parte de un reino del ser per
manentemente inmune a la observación directa, parece tener poder
persuasivo. ¿Qué sería observar, no rayos de luz o partículas, reglas o
relojes, sino «la estructura del espacio mismo»? Obviamente esto en
traña una gran cantidad de enigmas. Por ejemplo, ¿no «observamos
directamente» intervalos temporales entre nuestras experiencias?
¿Deben ser descartados como nada más que «intervalos temporales
mentales» que han de distinguirse del tiempo físico, real, en el mun
do material?
Una línea de argumentación a favor de Poincaré es que la mayo
ría de la física contemporánea que se ocupa del espacio y del tiempo
parece descansar en el mismo tipo de aserción de inmunidad de al
gunos hechos acerca del mundo a la observación directa que Poinca
ré está presuponiendo. Los argumentos de Einstein en la teoría espe
cial de la relatividad en su crítica, por ejemplo, a la noción de
simultaneidad de sucesos distantes, presuponen que dicha simulta
neidad debe ser determinada por medio de la luz, por señales causa
les de algún tipo, o transportando relojes. No puede tomarse como
algo abierto a la inspección directa. De nuevo, los argumentos para la
«geometrización» de la gravedad en los fundamentos de la relativi
dad general descansan en la suposición de que el campo gravitacio-
nal puede ser conocido sólo por sus efectos. Lo que observamos es el
comportamiento de los rayos de luz y de las partículas, de las reglas y
de los relojes, y no el campo gravitacional propiamente dicho. En
particular, parece haber dos suposiciones infiltradas en los funda
mentos de las teorías relativistas: 1) Lo que observamos es el compor
tamiento de las cosas materiales — rayos de luz, partículas, relojes y
varas de medir— , no la estructura del espacio-tiempo mismo; 2) Sólo
podemos determinar observacionalmente el comportamiento de las
cosas materiales en un momento dado, es decir, cosas tales como que
los extremos de dos reglas rígidas coinciden uno con otro. No pode
mos considerar como un hecho observacional el que dos reglas rígi
94 Filosofía de la física
das separadas una cierta distancia entre sí tengan, o no, la misma lon
gitud, así como no podemos considerar la simultaneidad a distancia
como una característica observable del mundo en el sentido de ob-
servabilidad directa.
Podría suceder que semejantes suposiciones sobre tipos de carac
terísticas del mundo inmunes por siempre a la determinación obser-
vacional directa estén equivocadas. Pero se presuponen en el análisis
que fundamenta nuestra aceptación de las teorías del espacio-tiempo
contemporáneas. Supongamos, pues, por el momento, que Poincaré
está en lo cierto respecto a que estas estructuras inobservables for
man parte de nuestras teorías.
Poincaré está afirmando que nuestras estructuras postuladas
deben trascender los hechos observables. Este hecho es el que in
troduce en las teorías la «dualidad» que permite a numerosas ver
siones alternativas tener las mismas consecuencias observacionales.
¿Cómo sobrepasan las teorías de Einstein lo observable? En la teo
ría especial, mientras la coincidencia de sucesos es observable, la
simultaneidad de sucesos distantes se obtiene postulando la unifor
midad de la velocidad de la luz en todos los sistemas inerciales y
en todas las direcciones, un «hecho» que no puede comprobarse
observacionalmente. De nuevo, para obtener la estructura espacio-
temporal completa de la relatividad especial hay que añadir el pos
tulado de linealidad, lo cual equivale a postular que el espacio-
tiempo es plano. Una vez más, éste es un postulado teórico que
sobrepasa la comprobación directa. Sólo formulando estos postula
dos obtenemos la teoría estándar y no, por ejemplo, la vieja teoría
de un éter absoluto con reglas y relojes compensatorios «reales»,
que se contraen y atrasan respectivamente cuando están en movi
miento. En la teoría general se postula que los rayos de luz curva
dos y las partículas «libres» describen, bajo los efectos de la grave
dad, las geodésicas nulas y las de tipo temporal del espacio-tiempo
respectivamente. Y las reglas y relojes locales son tomados como
indicadores correctos de los intervalos métricos de espacio y tiem
po donde se encuentran ubicados. Sólo haciendo estas suposicio
nes conseguimos que las observaciones de los efectos de la grave
dad nos digan que el espacio-tiempo tiene curvatura. Con otros
postulados podríamos preservar la estructura espacio-temporal pla
na de la relatividad general, considerando que la gravedad es,
como en la teoría de Newton, un campo de fuerzas superpuesto
Espacio, tiempo, movim iento 95
que tiene efectos métricos, así como efectos dinámicos, sobre las
partículas en movimiento y sobre la luz.
El modelo de Poincaré parece, pues, describir muy bien el con
texto en el que las teorías relativistas se construyeron. Se obtienen
nuevos hechos observacionales. Éstos están restringidos a los hechos
locales y materiales sobre nuestros instrumentos de medida. Para jus
tificar y explicar estos hechos se postula una estructura espacio-tem-
poral. Sin embargo, las estructuras postuladas sobrepasan con su ri
queza a la totalidad de posibles hechos observacionales que las
soportan. Y, al igual que en la parábola de Poincaré de las criaturas
bidimensionales sobre el disco, también ahora una variedad de posi
bles estructuras espacio-temporales hará justicia a lo que considera
mos como la totalidad de hechos observacionales que podríamos en
contrar. Esto será así, al menos, si estamos preparados para hacer los
cambios necesarios en otras partes de nuestra teoría física.
Opciones realistasSi nos tomamos entonces seriamente el problema de Poincaré y nos
negamos a descartarlo por descansar en nociones ilegítimas sobre lo
que es, y lo que no es, observable o en nociones ilegítimas acerca de
que el reino de lo teórico sobrepasa, en principio, al reino de lo ob
servable, ¿cómo deberíamos continuar? Una clase de respuestas
acepta abiertamente el postulado de la estructura espacio-temporal
teórica, suponiendo que las teorías del espacio y el tiempo proponen
verdaderamente estructuras reales, pero inobservables, del mundo.
¿Estamos, pues, como Poincaré afirmó, circunscritos a la convencio-
nalidad para elegir la teoría correcta?
Una respuesta sería adoptar simplemente una actitud de escepti
cismo. Asumir que una de las múltiples teorías posibles del espacio-
tiempo compatibles con los datos observacionales es la correcta. Ar
güir que únicamente los hechos observacionales pueden conducirnos
legítimamente a elegir una teoría como preferible frente a las demás.
Argüir, entonces, que debemos simplemente negarnos, si somos razo
nables, a emitir un juicio sobre cuál de las teorías espacio-temporales
alternativas describe realmente el mundo. ¿No deberíamos, pues, ha
cer frente a estas limitaciones honestamente y rechazar un supuesto
conocimiento de lo que sencillamente no podemos conocer?
Filosofía de la física
Para eludir esta exhortación al abandono, muchos han sugerido
que deberíamos buscar apoyo en esas características de las teorías
que usamos y, en su opinión, deberíamos usar, a fin de seleccionar la
teoría mejor y más convincente de un conjunto de alternativas entre
las que no puede hacerse una elección sobre la base de una diferen
cia de compatibilidad con los datos observables. Se arguye que en la
elección de una teoría aplicamos muchas consideraciones que sobre
pasan la mera comparación de las consecuencias observacionales de
la teoría con los hechos observados. Éstas son consideraciones que
pueden ayudarnos a decidir legítimamente cuál es la teoría más con
vincente. A menudo se arguye que unas teorías tienen una mayor
plausibilidad intrínseca que otras. En otros casos, la relación que una
teoría presenta con la ciencia de fondo sobre la que se proyecta se
supone que puede servir para discernir entre teorías más fiables y
aquellas en las que no merece la pena confiar.
Como ejemplo del segundo tipo de enfoque podríamos conside
rar la alegación de que el conservadurismo metodológico puede ju
gar un papel guía para dar preferencia a una teoría sobre otras indis
tinguibles observacionalmente de ella. Aquí se sostiene que existe
una regla del método científico en el sentido de que al elegir una
nueva teoría seleccionamos, y deberíamos seleccionar, la que se des
vía menos de las viejas teorías que venían siendo aceptadas, pero que
ahora rechazamos debido a su incompatibilidad con la evidencia.
¿Cómo se aplicaría esta regla en el caso, por ejemplo, de la relati
vidad general? Aquí estamos buscando una nueva teoría de la grave
dad. La teoría de Newton es incompatible con la relatividad y debe
ser rechazada, pero la teoría que pongamos en su lugar debe ser una
que sea compatible con los nuevos datos observacionales y que se
acerque lo más posible en sus afirmaciones a lo que la vieja teoría
afirmaba. ¿Podría dicha regla metodológica llevarnos a elegir la teoría
de Einstein frente a las teorías alternativas de «dilatación y contrac
ción más campos de fuerza»? Es sin duda cierto que en la vieja teoría
utilizábamos reglas y relojes para indicar correctamente los intervalos
espaciales y temporales. Esto sigue siendo cierto en la relatividad ge
neral, pero no en su alternativa espacio-temporal plana. Así, ¿no nos
lleva el conservadurismo metodológico a seleccionar la relatividad
general como la alternativa preferida?
Sin embargo, el espacio-tiempo era plano en la vieja teoría. Esto
sigue siendo así en la alternativa del campo, pero en la relatividad ge
Espacio, tiempo, movimiento 97
neral se hace la propuesta radical de un espacio-tiempo curvo. Desde
este punto de vista parece que la alternativa de «espacio-tiempo pla
no más un campo gravitacional» es la elección más conservadora y,
por consiguiente, la que ha de preferirse. El problema es, claro está,
que el precepto de ser conservador respecto a la vieja teoría es ambi
guo. Hay muchos aspectos de la vieja y las nuevas teorías. El ser con
servador respecto a algunos de estos aspectos podría conducirnos a
elegir una de las alternativas, y el ser conservador respecto a otros as
pectos podría llevarnos a una elección muy diferente.
Pero es peor que eso. Aun cuando el conservadurismo nos lleva
se a una elección en lugar de a otra, ¿no podría suceder que la vieja
teoría mismamente pudiera ser reemplazada retrospectivamente por
una alternativa a ella? Tomemos la teoría gravitacional de Newton,
por ejemplo. Supongamos que consideramos que la alternativa de
«espacio-tiempo plano más fuerzas» es la teoría relativista más con
servadora respecto a la de Newton y, por tanto, la que ha de preferir
se. Pero, según hemos observado, es posible sustituir la teoría de
Newton por una teoría de la gravedad como espacio-tiempo curvo
que tendría las mismas predicciones observacionales que la teoría de
Newton. ¿No sería entonces la teoría del espacio-tiempo curvo, la re
latividad general, el cambio más conservador de esa versión revisada
de la física de Newton? ¿No es entonces la regla del conservaduris
mo sobre cómo se desarrollan realmente las teorías completamente
arbitraria? ¿No nos dice simplemente que proyectemos viejas deci
siones arbitrarias, accidentes de la historia, en el futuro? ¿Cómo pue
de ser eso una guía a la verdad?Como ejemplo de la otra sugerencia, que nos apoyemos en carac
terísticas intrínsecas de las teorías para hacer una elección entre las
alternativas, podríamos considerar la noción de simplicidad teórica.
Algo que se afirma habitualmente es que los científicos, dadas dos al
ternativas teóricas entre las que los datos observacionales no son de
cisivos, elegirán la más simple de las dos, revelando su intuición de
que la hipótesis más simple es más probable que sea la hipótesis más
verdadera.
La noción de simplicidad está, no obstante, plagada de enigmas.
En algunas versiones depende de la manera en que se formula la teo
ría. En un lenguaje o representación, una teoría podría parecer más
simple que otra, pero el orden de simplicidad podría verse trastroca
do si las teorías se expresasen de otra manera. Otras nociones de
Filosofía de la física
simplicidad, que dependen de las características estructurales de la
teoría, la forma lógica de sus premisas básicas, podrían evitar en par
te esta aparente relatividad de la simplicidad respecto a la forma de
expresión. Hay, de hecho, significados intuitivos de simplicidad en
función de los cuales la teoría de la relatividad especial es más sim
ple que las teorías alternativas del éter o las teorías alternativas que
no suponen plano el espacio-tiempo. Intuiciones similares sobre la
simplicidad hacen que la relatividad general parezca más simple que
las teorías de «espacio-tiempo plano más campos impuestos» alterna
tivas a ella. En ambos casos, la idea es que la teoría einsteiniana no
posee la estructura problemática e innecesaria que contamina a sus
alternativas.
Para ver esto, comparemos primero el espacio-tiempo relativista
de la teoría especial de Einstein con una de las teorías del éter. Eins
tein considera que la velocidad de la luz es la misma en todas las di
recciones en cualquier sistema de referencia inercial. Las teorías del
éter lo niegan. Estas defienden que la luz tendrá una velocidad uni
forme en todas las direcciones solamente en el sistema que esté en
reposo en el éter. En los otros sistemas de referencia, la luz parece te
ner la misma velocidad en cada dirección sólo debido al efecto del
movimiento del laboratorio con respecto al éter sobre instrumentos
de medida tales como reglas y relojes. Así, mientras Einstein atribuye
los resultados nulos de los experimentos de ida y vuelta a la unifor
midad de la velocidad de la luz en todas las direcciones a lo largo de
las trayectorias, la teoría del éter los explica introduciendo, primero,
un cambio de la velocidad de la luz en direcciones diferentes y, lue
go, un cambio compensatorio en los instrumentos del laboratorio, de
pendiendo cada variación de la velocidad del laboratorio a través del
éter. Los efectos de estos cambios se cancelan exactamente. Sin duda,
la explicación según la teoría del éter de los resultados observados es
innecesariamente complicada. Para obtener los resultados observa
cionales necesitamos especificar un parámetro de la teoría, esto es, la
velocidad del laboratorio con respecto al éter. Sin embargo, sea cual
sea el valor que especifiquemos para esta cantidad, obtenemos exac
tamente las mismas predicciones experimentales, porque los efectos
de la velocidad se cancelan mutuamente. Por esta razón, ningún ex
perimento que podamos realizar podrá determinar la velocidad del
laboratorio con respecto al éter. Sin duda, la teoría de Einstein, la
cual niega simplemente la existencia de semejante sistema del éter o
Espacio, tiempo, movimiento 99
de semejante velocidad indetectable, es más simple como hipótesis
explicativa y, por tanto, debe ser preferida.
Una situación similar se da en el caso de la relatividad general.
Einstein explica las trayectorias curvas de la luz y de las partículas
afirmando que éstas siguen las geodésicas de un espacio-tiempo cur
vo. La postulación de un «espacio-tiempo plano más fuerzas» alterna
tivo interpretaría esta curvatura como el resultado de fuerzas que
desvían a las partículas de las verdaderas geodésicas rectilíneas del
espacio-tiempo plano real. Un examen detenido de las teorías mues
tra que a cada mundo descrito por la teoría del espacio-tiempo curvo
corresponden un número infinito de mundos con «espacio-tiempos
planos más campos», así como un número infinito de mundos con
«sistemas de éter más compensación» corresponden a un único mun
do con un «espacio-tiempo minkowskiano relativista especial». Y así
como cada mundo con un sistema de éter es indistinguible de los
otros por observación, así cada uno de los nuevos mundos «espacio-
tiempo planos más campos» es indistinguible de todos los otros mun
dos semejantes. Esto es una generalización de algo que J. Maxwell y
otros ya observaron en relación a la teoría prerrelativista de la gravi
tación. Supongamos que existiese en el universo un campo gravita-
cional que fuese constante en todo lugar (es decir, la fuerza gravita-
cional tendría en cada punto la misma intensidad y apuntaría en la
misma dirección). Todo el universo material estaría, entonces, cayen
do con aceleración constante en este mundo. Aunque todo objeto
estaría siendo acelerado, esta aceleración no podría, al contrario que
la aceleración normal, ser detectada. Esto es debido a que todos los
aparatos de medida sufrirían la misma aceleración que el mundo mis
mo. La existencia de un campo gravitacional constante, pues, en caso
de existir, es un hecho indetectable sobre el mundo.
Pero en la relatividad general no hay ningún campo gravitacional,
y todos los mundos observacionalmente indistinguibles de la teoría
anterior pasan a ser asimilados a un único mundo con un espacio-
tiempo curvo. Esto se corresponde exactamente con la forma en que
la relatividad especial reemplaza a un número infinito de posibles sis
temas de éter por un único espacio-tiempo minkowskiano. Entonces,
en un sentido importante, las teorías estándar, einsteinianas, son más
simples que sus alternativas observacionalmente indistinguibles. Al
gunas teorías de confirmación teórica han utilizado hechos como éste
para generar nuevas nociones de datos que confirmen una teoría. Las
100 Filosofía de la física
viejas nociones de confirmación denden a confirmar de igual manera
tíos teorías cualesquiera que sean observacionalmente indistinguibles,
a no ser que se les haya dotado previamente de alguna plausibilidad
intrínseca que las distinga. Las nuevas nociones de confirmación ha
cen posible que teorías como la relatividad especial o general sean
confirmadas por los datos, pero dan una confirmación cero a teorías
como las teorías del éter o las teorías del espacio-tiempo gravitacio
nal plano que contienen parámetros no determinables mediante la
observación.
Pero, por supuesto, hay quienes se oponen a esta solución al
enigma de Poincaré. ¿Porqué deberíamos creer que la teoría más
simple, aun cuando la noción de simplicidad pueda resultar coheren
te, es la que deberíamos aceptar como verdadera para el mundo?
¿Qué nos asegura que la simplicidad, no importa cómo se interprete,
debe ser tomada como una señal de la verdad de una teoría? Por su
puesto, podríamos preferir la teoría más simple por su atractivo esté
tico, pero ¿porqué debería tomarse la complejidad como una señal
de falsedad, equiparable a la incapacidad de la teoría para ajustarse a
los datos observacionales? ¿Deberían tales consideraciones como la
simplicidad de una teoría contribuir a su credibilidad para alguien
que adopta la postura realista de que hay un mundo independiente
de nuestras teorías sobre él y de que las teorías describen o no genui-
namente este mundo?
Opciones reduccionistasOpuestos a todos estos enfoques del problema de Poincaré se en
cuentran los enfoques que intentan socavar el desafío escéptico ne
gando que realmente haya teorías alternativas entre las que debamos
elegir. Si consideramos que la propia identidad de una teoría debe
ser determinada por sus consecuencias observacionales, entonces ¿no
llegamos a la conclusión de que todas las supuestas teorías alternati
vas son realmente una y la misma teoría y que parecen diferir entre sí
solamente porque han elegido expresar las mismas vindicaciones so
bre el mundo en un lenguaje diferente?
La idea subyacente es clara. Seguramente, se dice, podemos en
tender casos en los que dos expresiones de la teoría entran aparente
mente en conflicto entre sí, de forma que parece que las dos no pue
Espacio, tiempo, movimiento 101
den ser correctas, pero donde el conflicto es sólo aparente: es el re
sultado de utilizar los mismos términos con significados diferentes en
las dos expresiones de la teoría. Si, por ejemplo, alguien propusiera
una teoría de la electricidad que fuese exactamente igual a nuestra
teoría ordinaria, pero donde se intercambiasen las palabras «positiva»
y «negativa» concernientes a las cargas, nos daríamos inmediatamente
cuenta de que no se había propuesto ninguna teoría nueva. En lugar
de ello, se había repetido la misma vieja teoría con los significados de
dos palabras clave intercambiados. Supongamos, entonces, que pos
tulamos que todo el contenido real de una teoría está implícito en
sus consecuencias observacionales y que dos teorías cualesquiera con
las mismas consecuencias observacionales equivalen a una sola teo
ría. Las diferencias aparentes entre las dos expresiones de la teoría se
deberían realmente a meras diferencias en los significados de algunos
de los términos involucrados.
Se ha propuesto una enorme variedad de explicaciones «positi
vistas» semejantes de la teoría y del significado teórico. Algunas veces
se ha sugerido que los términos de una teoría, para tener un significa
do auténtico, deben recibir una definición individual acuñada entera
mente en el vocabulario que hace referencia a los observables. Si te
nemos dos teorías aparentemente incompatibles con las mismas
consecuencias observacionales, podríamos determinar qué términos
en las dos formulaciones de la teoría difieren en el significado. Por
ejemplo, podría argüirse que el hecho de que los rayos de luz reco
rran geodésicas nulas en la relatividad general equivale a definir la
«geodésica nula» en esta teoría como la trayectoria de un rayo de luz.
En la teoría del «espacio-tiempo plano más fuerzas» los rayos de luz
no recorren geodésicas nulas. Así pues, se arguye, «las geodésicas nu
las» deben significar algo diferente en esta nueva formulación de la
teoría. Algunas otras versiones del caso requieren que cualquier pro
posición de la teoría pueda ser traducida a una expresada solamente
en términos observacionales. Hay todavía otros que encuentran estas
demandas de estricta definibilidad de los términos o de traducibili-
dad frase por frase demasiado severas. Para estos teóricos es la teoría
como un todo lo que tiene significado y este significado se agota en
la totalidad de sus consecuencias observacionales. Así, en el caso de
las teorías gravitacionales con espacio-tiempos curvo versus plano, ar
güirían que carece de sentido preguntar por los términos que han
cambiado de significado de una teoría a otra. Alternativamente, argu
102 Filosofía de la física
yen, podrías decir que todos lo han hecho, salvo aquellos que se re
fieren a los fenómenos observables. Lo que uno puede decir, empero,
es que, como las dos teorías tienen las mismas consecuencias obser
vacionales, consideradas como un todo «dicen la misma cosa».
Los enfoques reduccionistas de este tipo menoscaban claramente
el problema escéptico de la teoría sobrepasando los datos. Desde
este punto de vista, el rebasamiento de lo observable es sólo ilusorio.
Algunas veces se dice que el dar a una teoría preferencia frente a
otra que es observacionalmente equivalente a ella es, en realidad, ele
gir solamente una manera de expresar una teoría. Algunas veces se
alega que es como elegir un sistema de coordenadas para describir la
localización de los sucesos, en lugar de otro. Al realista, para quien
las teorías pueden diferir en simplicidad y, por lo tanto, en lo que di
cen y, quizá, en su grado de credibilidad intrínseca, esta gente le res
pondería que una tal diferencia en simplicidad es solamente una di
ferencia en la simplicidad de la forma de expresión. No es una
diferencia real de simplicidad como, por ejemplo, la que se da entre
una función lineal y una cuadrática relacionando lo observable a lo
observable. El elegir una de las alternativas observacionalmente equi
valentes sobre las demás es entonces una mera elección de cómo ex
presar las propias creencias teóricas. Según esta concepción, las
creencias teóricas no son en realidad más que compendios lingüísti
camente pertinentes de la totalidad de sus consecuencias observacio
nales. Aunque no está del todo claro lo que Poincaré pretendía decir
al afirmar que la elección de la geometría es convencional, quizá fue
ra esto lo que tenía en mente.
La objeción más seria a este enfoque de las teorías es adonde nos
conduce cuando se lleva a su —casi inevitable— extremo. Cuando
dos teorías que aparentemente dicen cosas bastante incompatibles
acerca de la estructura de lo inobservable se considera que son, de
hecho, completamente equivalentes entre sí, es evidente que uno no
debería tomar lo que dicen sobre los inobservables de un modo cla
ramente referencial. Si una teoría que afirma que el espacio-tiempo
es curvo se considera que es completamente equivalente a una que
afirma que el espacio-tiempo es plano, entonces claramente ambas
teorías están utilizando solamente la referencia al espacio-tiempo
como medio instrumental para generar su contenido real, el orden le
gal entre los observables que predicen. Uno no debería entonces
tomar dicha conversación sobre el espacio-tiempo como referida real
Espacio, tiempo, movimiento 103
mente a un objeto al que se atribuye alguna característica. Para ver
esto, uno sólo tiene que considerar el hecho de que si dos expresio
nes cualesquiera de teorías con un mismo contenido observacional
son enteramente equivalentes, entonces el simple compendio de las
consecuencias observacionales comunes a las dos teorías es equiva
lente a las dos. Y esta tercera «teoría» no se refiere en absoluto a las
entidades y estructuras teóricas (como el espacio-tiempo y su curva
tura). El hecho de que dicho compendio de consecuencias observa
cionales pudiera ser una colección infinita de afirmaciones no parece
ser, desde esta perspectiva positivista radical, relevante para la de
manda irrealista.
Pero, entonces, el considerar suficiente la equivalencia observa
cional para la equivalencia total parece entrañar un irrealismo radical
sobre lo inobservable. Toda referencia, excepto a lo que es directa
mente accesible a la inspección observacional, es pseudorreferencia,
y toda descripción de la estructura de lo inobservable se convierte en
una mera forma de hablar y no en una descripción cabal de una su
puesta parte real del universo. Si dicha referencia al espacio-tiempo y
a su estructura es completamente ficticia, ¿es igualmente ficticia la re
ferencia a los electrones? Y, si seguimos la familiar vía filosófica de
considerar como directamente observable sólo lo que consiste en
datos sensoriales de la percepción directa y no de características físi
cas de las cosas físicas, ¿no nos vemos conducidos a la concepción de
que todo el mundo físico es una ficción? Sin duda, un irrealismo tan
radical sobre lo físico es un precio demasiado alto para evitar el desa
fío escéptico a nuestro conocimiento de la estructura geométrica ac
tual del mundo.
Otras respuestas realistasMuchos realistas, en respuesta a estas consecuencias del enfoque po
sitivista que acabo de esbozar, han argüido que el error fundamental
del positivismo es su idea de que la equivalencia observacional de las
teorías es suficiente para su equivalencia total. A estos realistas les
gustaría admitir que, en ocasiones, teorías aparentemente incompati
bles «dicen la misma cosa» en realidad. Pero negarán que el tener
consecuencias observacionales comunes sea suficiente para la equiva
lencia total. Si, dicen, las teorías tienen la misma estructura a nivel
Filosofía de la física
tcorico, de forma que una teoría puede ser obtenida a partir de la
otra por un intercambio término a término (como el intercambio en
tre «positivo» y «negativo» en la teoría de la electricidad mencionado
más arriba), entonces es correcto decir que las teorías son equivalen
tes. Sin embargo, cuando tienen las mismas consecuencias observa
cionales pero difieren en su estructura a nivel teórico, no deberían
ser consideradas como equivalentes. Esto es lo que sucede, se alega,
en nuestros familiares casos espacio-temporales. La relatividad espe
cial no es igual estructuralmente a las teorías compensatorias del éter,
según revela el hecho de que un número infinito de teorías del éter
diferentes corresponden al único espacio-tiempo de Minkowski. Y la
relatividad general no es igual estructuralmente a las alternativas de
«espacio-tiempo plano más fuerzas» porque, de nuevo, el único espa
cio-tiempo relativista general se corresponde con un número infinito
de posibles alternativas al mismo. Esto solamente reitera la afirma
ción de que las teorías relativistas son preferibles a sus alternativas en
razón de una simplicidad de tipo estructural. No necesitamos, pues,
suponer que las teorías relativistas son simplemente equivalentes a
sus alternativas, porque no necesitamos aceptar la demanda de los
positivistas de que la equivalencia observacional implica equivalencia
total.
El regreso a esta perspectiva realista nos lleva claramente de
vuelta a las cuestiones planteadas anteriormente sobre cómo pode
mos elegir de manera razonable entre las teorías ahora equivalentes,
pero indistinguibles observacionalmente. También nos conduce a la
cuestión de cómo, para el realista, obtienen su significado los térmi
nos teóricos de una teoría. La mayoría de los realistas suscriben la
idea de que primero adquieren significado los términos de nuestro
discurso asociados con los elementos de la experiencia observacio
nal, y que los otros términos de la teoría reciben su significado por
alguna relación que presentan con los términos observacionales (aun
que otros negarían incluso tan limitado «precedente semántico» al
vocabulario observacional). Un enfoque realista familiar consiste en
argüir que los términos teóricos obtienen cualquier significado que
presenten simplemente por el papel que desempeñan en el entrama
do de leyes en la teoría que finalmente conduce a consecuencias ob
servacionales. La idea ahora es que mientras los términos observacio
nales adquieren su significado con independencia del papel que
estén desempeñando en la teoría, los términos teóricos ganan cual
Espacio, tiempo, movimiento 105
quier significado que tengan de su papel como ocupantes de una po
sición en la estructura teórica. Así, el significado de «geodésica nula»
está determinado enteramente por el lugar que ese término ocupa en
las leyes de, pongamos, la relatividad general.
A menudo se defiende que dicha teoría sobre el significado de
los términos teóricos no es incompatible con el realismo acerca de
las entidades y propiedades teóricas. El significado de «geodésica nu
la», por ejemplo, está determinado por el papel desempeñado por
este término en la teoría del espacio-tiempo. Pero eso no significa
que no existan geodésicas nulas. Si la teoría es correcta, existirán. Se
rán cualquier cosa a la que haga referencia el término «geodésica nu
la». El problema es que es muy fácil inventar referencias sustitutas de
los térmihos para que las teorías sigan siendo correctas, aun cuando
los términos ya no hagan referencia a lo que considerábamos que
eran las entidades y características teóricas reales. Uno podría, por
ejemplo, interpretar todos los términos teóricos de la teoría del espa-
cio-tiempo, no ya referidos a lo que visualizaríamos intuitivamente
como figuras espacio-temporales, sino referidos más bien a objetos
abstractos tales como números. La teoría sería entonces reinterpreta-
da en el sentido de afirmar que es posible asignar números a las enti
dades y características observables de manera tal que, siguiendo las
reglas de las matemáticas, se podría inferir la validez de ciertas regu
laridades legales entre los observables, pero sólo de esas regularida
des que se siguen de la teoría del espacio-tiempo original como com
prendidas de una manera realista. El discurso sobre entidades y
características teóricas se convierte entonces en un discurso sobre có
mo podemos integrar un comportamiento observable en una estruc
tura abstracta que tiene consecuencias para el orden y la regularidad
entre los observables. Siempre que uno adopte una concepción de
los términos teóricos del tipo «su significado es dado solamente por
su papel en la teoría», dichas reconstrucciones «representacionistas»
de la teoría incomodarán al realista.
Por esta razón, algunos realistas quisieran argüir que los términos
teóricos, incluyendo los que hacen referencia a estructuras espacio-
temporales, adquieren significado de algún otro modo. En este punto
se recurre con frecuencia a las analogías de significado con términos
observables. Las moléculas, se dice, son descritas como partículas, y
sabemos lo que significa «partícula» por las partículas observables.
Así pues, sabemos algo acerca del significado de «molécula» que nos
106 Filosofía de la física
asegura que, sea lo que sean las moléculas, no son objetos abstractos
como los números. Quizá la analogía de una trayectoria como estruc
tura espacio-temporal con una trayectoria constituida por algún tipo
de sustancia material nos permita acceder al significado de términos
espacio-temporales más allá de su papel en la predicción del compor
tamiento local de los objetos materiales.
Concepciones pragmáticasLas opciones que hemos explorado no agotan todas las posibles reac
ciones que uno podría tener ante enigmas del tipo que Poincaré nos
ha planteado. Algunos filósofos han intentado argumentar que los de
bates entre realistas y antirrealistas descansan todos en confusiones.
Algunos de estos argumentos regresan al escepticismo que comenta
mos anteriormente acerca de la posibilidad de hacer de las conse
cuencias observables una clase distinguida de las consecuencias de
una teoría. Otros se apoyan en una afirmación en el sentido de que
preocupándose por cuál de las posibles teorías alternativas es la ver
dadera uno anda desorientado. Quizá existan varias descripciones al
ternativas que merezcan todas, en función de algún conjunto de posi
bles datos observacionales, ser denominadas «razonables de creer».
Supongamos que consideramos estas descripciones verdaderamente
incompatibles, no sólo reduciéndolas a simples variantes lingüísticas,
como los positivistas nos harían hacer. Si elegimos una de estas teo
rías, declararemos verdaderas sus consecuencias y falsas las conse
cuencias de las teorías rivales incompatibles con ella. Si hubiésemos
elegido alguna de las otras alternativas, habríamos, claro está, cambia
do nuestra valoración de cuáles aserciones eran verdaderas y cuáles
falsas, pero habríamos sido igual de razonables. Pero, ¿qué es de
todos modos la verdad? ¿No es simplemente una forma de caracteri
zar, al nivel de conversación sobre proposiciones, eso mismo que ex
presaríamos utilizando las propias proposiciones, en el sentido de
que declararemos verdaderas todas y sólo aquellas proposiciones que
estamos dispuestos a afirmar? Quizá Poincaré estuviera en lo cierto
al afirmar que la geometría del mundo era una cuestión de conven
ción en el sentido de que nos corresponde a nosotros elegir una de
las opciones razonables a nuestra disposición y, una vez hecho esto,
declarar «verdaderas» sus consecuencias.
Espacio, tiempo, movimiento 107
Pero ¿qué sucederá si la opción que elegimos no se conforma
realmente con la manera de ser del mundo? En este punto, algunos
se vuelven escépticos ante la sola idea de un mundo independiente
de la teoría al que las teorías corresponden, o no. El que dicha con
cepción, unas veces asociada con el pragmatismo, otras denominada
«realismo interno», constituya realmente una opción firme, una que
no se reduzca al escepticismo o a alguna clase de reduccionismo po
sitivista, sigue siendo una cuestión abierta.
ResumenEn cualquier caso podemos ahora ver cómo los desarrollos en las
matemáticas puras y en la física teórica han cambiado radicalmente
nuestras posturas, tanto ante la geometría, como ante el lugar que
ésta ocupa en nuestro cuerpo de conocimientos. Durante siglos la
geometría fue vista como el prototipo de una teoría que parecía
aportarnos hechos significativos sobre el mundo en el que vivíamos;
podíamos conocer las verdades geométricas, y conocerlas con certe
za, pues eran derivables por medio de una cierta inferencia lógica de
primeros principios cuya verdad era autoevidente. La geometría era
el paradigma del conocimiento en general. Sólo con ser lo suficiente
mente inteligentes, podríamos conocer todas las verdades acerca del
mundo, así como conocíamos las geométricas. Más tarde, como he
mos visto, cuando la corriente empirista llevó a la mayoría de los filó
sofos a afirmar que sólo podíamos conocer el mundo por medio de
la generalización e inferencia de los datos fundamentales de la obser
vación y el experimento, la geometría pareció seguir siendo la excep
ción a esta regla general, una excepción cuya naturaleza especial re
quería una explicación tal como la que Kant apuntó.
Con el descubrimiento de una multiplicidad de geometrías axio
máticas lógicamente consistentes, y la posterior generalización allen
de éstas a las geometrías curvas multidimensionales de Riemann, y
allende éstas a las geometrías imaginadas en el estudio de la topolo
gía y de la estructura diferencial de los espacios (en las que no hemos
entrado), el estatus de la geometría como cognoscible sin el apoyo de
la observación o del experimento fue seriamente cuestionado. Este
cuestionamiento se hizo mucho más significativo con el descubri
miento en el siglo xx de, primero, los nuevos espacio-tiempos esen
108 Filosofía de la física
ciales para el tratamiento relativista del comportamiento de la mate
ria y de la luz y, después, de la capacidad de invocar el espacio-tiem
po curvo como una teoría de la gravedad en la teoría general de la
relatividad. ¿No parecía, pues, que el conocimiento de la geometría,
como el de todas las otras teorías del mundo, descansaba en la obser
vación y el experimento?
Pero, según hemos visto, esto es demasiado simple. Ciertamente
parece que, bajo la perspectiva moderna, la geometría deviene muy
similar a las otras teorías físicas fundamentales, generales, pero funda
das observacionalmente, del mundo. Según hemos visto, sin embargo,
justamente la reflexión acerca del modo en que los resultados obser
vacionales pueden o no determinar por nosotros qué geometría del
mundo deberíamos razonablemente creer, nos revela el grado al que
la geometría, como toda teoría física fundamental, sobrepasa la sim
ple generalización de los datos que un crudo empirismo tomaría
como modelo de inferencia a teorías.
Cómo responder a la posibilidad de reconciliar una diversidad
de geometrías con cualesquiera datos observacionales posibles es,
como hemos visto, una cuestión muy problemática. Podríamos adop
tar una postura realista y mostrarnos simplemente escépticos sobre
qué geometría describe realmente el mundo. O podríamos intentar
encontrar reglas metodológicas para una creencia razonable, reglas
que nos llevasen a elegir una de las muchas geometrías alternativas
como la única razonablemente más creíble. O podríamos intentar
evitar el desafío escéptico e invocar un argumento reduccionista en
el sentido de que todas las geometrías alternativas, cuando se las
complementa con las teorías físicas necesarias para hacerlas —cada
una a su manera— compatibles con los datos observacionales, son
realmente equivalentes entre sí. Finalmente, podríamos intentar me
noscabar la pulla del problema de la «infradeterminación de la geo
metría por cualesquiera datos posibles» negando algunas de sus pre
misas sobre la distinción entre lo «en principio observable» y lo «en
principio inobservable», o desafiando la suposición implícita de una
única teoría verdadera que se corresponde con un mundo real inde
pendiente de la teoría.
La geometría ha planteado una vez más problemas a nuestra teo
ría del conocimiento en general. Estos problemas de infradetermina
ción teórica son problemas generales que deben ser afrontados por
todo el que quiera entender cómo se puede fundar racionalmente
Espacio, tiempo, movimiento 109
una teoría del mundo en toda su generalidad, incluyendo su referen
cia a entidades y estructuras consideradas inmunes a la observación
directa, sobre los limitados datos obtenibles a partir de la experiencia
observacional.
¿Qué clase de entidad tiene el espacio-tiempo?
Como hemos visto, es imposible explorar problemas acerca de nues
tro conocimiento del espacio y el tiempo sin entrar en cuestiones del
ser, asuntos denominados metafísicos. Un enfoque positivista1 del sig
nificado de las teorías, diseñado para combatir el problema de infra-
determinación identificando el contenido de una teoría con el conte
nido de sus consecuencias observacionales, demandará una actitud
irrealista hacia las entidades y características postuladas aparente
mente por la teoría al nivel no-observable. Pero hay muchas otras
cuestiones de índole metafísica que, si bien en algún momento pue
den plantear problemas epistemológicos, no están fundadas inicial
mente en cuestiones sobre el conocimiento. Muchas de estas cuestio
nes son muy específicas del estudio del espacio y el tiempo, aunque,
como veremos, su consideración sacará a menudo a la luz cuestiones
más amplias de la metafísica.
Tiempo y serConsideremos, por ejemplo, las doctrinas tradicionales que conectan
el tiempo y el ser. Para algunas, parecía intuitivamente obvio que
sólo lo que existía ahora, existía realmente. El futuro todavía no ha
bía llegado a existir y el pasado había cesado de existir. Solamente de
las entidades que existían en el presente se podía decir, propiamente
hablando, que existían realmente. Para otras, era el pasado y el pre
sente los que eran reales, y el futuro irreal. Aquí la idea intuitiva era
que el pasado y el presente, habiendo ya llegado a ser o sucedido, te
nían una realidad determinada. Lo que eran, era un hecho incuestio
nable. De acuerdo a esa idea, el futuro era el reino de lo que todavía
no había llegado a ser. No tenía ninguna realidad determinada. Des
pués de todo, siguiendo el curso del pensamiento, si era un hecho
determinado ahora que algún suceso futuro tuviera una realidad, en
110 Filosofía de la física
tonces ¿cómo podría haber un espacio para decidir cuáles serían
nuestras acciones futuras, por ejemplo, si ya era el caso ahora, y ha
bía sido siempre el caso, que lo que haremos mañana es ya un hecho
determinado hoy? Lo que aquí se discute no es la cuestión del deter
minismo, de si los sucesos pasados y presentes fijan o no, mediante
sus conexiones legales con otros sucesos, qué sucesos futuros de he
cho ocurrirán. La cuestión es, más bien, la afirmación de que si los
acontecimientos futuros tienen una realidad pasada y presente (si fue
ra un hecho ahora que yo compraré un helado mañana), entonces el
futuro no podría estar abierto en ningún sentido a la posibilidad.
A tales intuiciones se oponían las concepciones en el sentido de
que cualesquiera de dichas supuestas conexiones del tiempo al ser
eran meras ilusiones del lenguaje. Pasado, presente y futuro, se ar
güía, eran igualmente reales.
No consideramos que sea motivo para negar realidad a las cosas
el que no estén aquí, donde nos encontramos nosotros, así que ¿por
qué deberíamos considerar como motivo para negar su realidad el
que no estén existiendo en el momento en que hablamos o pensa
mos sobre ellas? Pensaríamos, por ejemplo, que es absurdo defender
que las cosas situadas detrás de nosotros o en el lugar que ocupamos
son reales, mientras las cosas situadas frente a nosotros carecen de
una verdadera realidad, así que ¿porqué no habríamos de considerar
igualmente absurdo postular realidad al pasado y al presente, pero
negársela a las realidades futuras?
Vinculadas a estas cuestiones se encuentran varias otras sobre las
que sólo podremos hacer observaciones muy breves. A veces se alega
que el tiempo es radicalmente diferente del espacio: mientras el espa
cio puede ser concebido correctamente desde un punto de vista
«aperspectivo», un entendimiento adecuado de la temporalidad de
las cosas requiere un punto de vista perspectivo. Podríamos, se argu
ye, describir todos los fenómenos espaciales de dos maneras igual
mente apropiadas. Podríamos asignar a cada una de las localizaciones
espaciales un nombre coordenado y decir dónde ocurrieron las cosas
especificando su localización mediante esta nominación perspectiva.
O podríamos especificar el lugar en el que algo ocurrió en relación a
«aquí», el lugar en el que nos encontramos ubicados.
Si intentamos el mismo truco con el tiempo, nos vemos descon
certados. La información aportada al decir cuándo ocurrieron las
cosas, incluso en relación unas a otras, ¿suministra completamente
Espacio, tiempo, movimiento 111
todos los aspectos temporales de lo que ocurrió? Algunos dicen que
no. Supongamos que damos la fecha en la que Julio César murió y la
fecha del día de hoy. Supongamos que añadimos el hecho de que la
fecha de la muerte de César es anterior a la actual, entendiendo «es
anterior a» como una relación primitiva entre tiempos. Cuando haya
mos dicho todo eso, ¿hemos dicho todo lo que hay que decir, tempo
ralmente, sobre la muerte de César? La afirmación de que no lo he
mos dicho descansa en la idea de que cuando decimos que «César
murió», o cuando especificamos en alguna otra forma que la muerte
de César pertenece al pasado, estamos haciendo más que especificar
que ocurrió, pongamos, antes de 1989. Ese último hecho es «atem-
poralmente verdadero», pero-el hecho de que César murió no fue
verdad hasta que lo hizo, aun cuando el hecho de que la muerte de
César es (atemporalmente) anterior a 1989 sea, en cierto sentido,
siempre verdad.
¿No podríamos, sin embargo, captar la «preteridad» de la muer
te de César diciendo que ocurrió antes que ahora? Por supuesto, se
responde; pero «ahora» es el nombre del presente y, al plantear las
cosas de esta forma, hemos reintroducido una tensión esencial en
nuestra descripción temporal de las cosas. Aquellos que niegan que
haya algo esencialmente diferente entre el tiempo y el espacio en
este sentido responden que «ahora» es una palabra igual que
«aquí». La referencia de dichas palabras, algunas veces llamadas
símbolos reflexivos o coordinativos, varía con su uso. Cada uso de
«aquí» se refiere al lugar en el que se ubica el locutor. De manera
similar, cada uso de «ahora» se refiere al momento en el que se ha
ce la alocución. ¿Hay algo más misterioso en torno a «César murió»,
aparte del hecho de que la muerte de César es (atemporalmente)
anterior a 1989 y que ahora es 1989, que en torno al hecho de que
una supernova tuvo lugar a alguna distancia de la tierra y aquí es en
la tierra?
Sí, responde el proponente de la concepción de que hay algo ra
dicalmente diferente sobre el tiempo que lo distingue del espacio.
Mientras las cosas que existen en el espacio en otros lugares que
aquí existen, las cosas que no existen ahora no existen en absoluto.
«Ahora» no es un mero indicativo, insisten; es el término que selec
ciona (en cualquier momento) ese instante de tiempo que es el ins
tante en el que las cosas existen, el cual es, claro está, ¡el momento
presente! Así, este debate en torno a la tensión esencial del tiempo
Filosofía de la física
revierte, una vez más, en la idea agustiniana de que solamente lo que
existe ahora existe realmente, hablando con propiedad.
Consideraciones relativistasEs obvio que la reestructuración radical del espacio y el tiempo en el
espacio-tiempo postulado por la teoría especial de la relatividad ha
de tener un fuerte impacto en este debate. ¿Qué sucede con la afir
mación de que «sólo lo que existe ahora existe verdaderamente», si
los sucesos que son simultáneos para un observador ocurren en tiem
pos diferentes para un observador en movimiento con respecto al
primero, aun cuando los dos observadores coincidan momentánea
mente? El propio significado de «ahora» se ha vuelto problemático.
Al menos ha pasado a ser una cuestión relativa a exactamente qué
sucesos están ocurriendo «ahora».
Supongamos que dos observadores coinciden en el suceso e, pero se encuentran en movimiento uno respecto al otro. Habrá suce
sos como el suceso a que son posteriores a e para el primer observa
dor pero simultáneos con e para el segundo. Pero entonces, ¿cómo
podríamos decir que a es irreal para el primer observador si a es real
para el segundo observador en el instante considerado (siendo simul
táneo con e para este segundo observador) y si el segundo observa
dor es sin duda real en el suceso e para el primero? La situación es
todavía peor que esto. Un suceso en relatividad puede ser posterior
al suceso e o «absolutamente posterior» al suceso e. Hablamos de
«absolutamente posterior» cuando el suceso, b, es posterior a e y pue
de conectarse causalmente a él por alguna señal viajando a igual, o a
menor, velocidad que la de la luz. Para sucesos como a, que no son
conectables causalmente con e, a será posterior a e, simultáneo con e, o anterior a e para diferentes observadores. Pero todos los observa
dores coincidirán en que b, que es absolutamente posterior a e, es
posterior a e. Sin embargo, todavía puede darse el caso de que haya
un observador para quien el suceso e' de su propia vida sea simultá
neo con b, pero tal que e sea simultáneo con e para el primer obser
vador. Así, el primer observador declarará la vida del segundo obser
vador en e real en e, y el segundo observador declarará b real en e . ¿Cómo podría, pues, el primer observador pensar que b, en su futuro
absoluto, es irreal en e?
Espacio, tiempo, movimiento 113
Los argumentos aquí están diseñados para convencer al lector de
que la aceptación del espacio-tiempo de la relatividad hace irrisoria
la concepción tradicional de que «solamente lo que está presente
ahora es real». Se arguye que la relatividad es claramente compatible
sólo con la concepción alternativa que considera todos los sucesos,
pasados, presentes y futuros, como igualmente reales, al igual que tra
dicionalmente consideramos todo lo que sucede en el espacio, don
dequiera que suceda, como igualmente merecedor de ser llamado
real. Si pasado, presente y futuro son tan relativos a los estados de
movimiento como la teoría especial de la relatividad considera que
son, ¿cómo podríamos pensar que la realidad varía con el lugjr tem
poral de un suceso en relación con un suceso actual en la vida del
agente en cuestión?
Pero, por supuesto, esto no es tan sencillo. La tentativa de ex
traer una conclusión metafísica de una teoría científica requiere mu
cho más cuidado del que nosotros hemos puesto hasta ahora. Uno
podría, formalmente, defender las viejas doctrinas de la irrealidad de
todo menos el presente, pese a aceptar la relatividad, negando sim
plemente que «es real» es una noción enteramente transitiva. Si «es
simultáneo» tiene la característica en relatividad de que e puede ser
simultáneo con e para el observador uno, b simultáneo con e para el
observador dos, pero b no simultáneo con e para ninguno de los ob
servadores (característica que ciertamente posee), entonces ¿porqué
no deberíamos relativizar «es real a» en la misma forma, de manera
que aunque e es real a e para el observador uno y b real a e para el
observador dos, b no es real a e para ninguno? De manera que nin
gún observador en el suceso e declarará nunca que b es un suceso
real con independencia de cuál sea su estado de movimiento cuando
se encuentre coincidiendo con e.Una respuesta más interesante procede en principio buscando las
fuentes de la intuición de que el pasado y el futuro son irreales. Uno
de los motivos de esa concepción, aunque ni mucho menos el único,
es el alejamiento epistémico del pasado y del futuro respecto al pre
sente. Es una idea común que el presente se nos «presenta» directa
mente en la experiencia, pero que lo que sucedió en el pasado y en
el futuro sólo puede ser conocido por inferencia a partir de la expe
riencia presente (incluyendo tales experiencias como «tener el recuer
do de que tal y tal suceso ocurrió»). Tal como vimos en «¿Cómo co
nocemos la verdadera geometría del mundo?» el estatus ontológico
114 Filosofía de la física
de lo inferido se pone frecuentemente en duda. Hay argumentos di
señados para arrojar una duda escéptica sobre la adecuación de cual
quier pretensión de conocer la verdad de una proposición cuya ver
dad sólo puede conocerse indirectamente y por medio de un proceso
inferencial. Si uno basa la afirmación de irrealidad del pasado y del
futuro en su alejamiento del tipo de cognoscibilidad que el presente
tiene para nosotros, entonces una forma de preservar la intuición de
que el pasado y el futuro son irreales en el contexto relativista se ha
ce evidente.
Cuando examinamos los fundamentos de la teoría de la relativi
dad, vimos que está fundada en un examen crítico de nuestro conoci
miento sobre sucesos distantes de nosotros en el espacio. En ese argu
mento crítico descansaba la original crítica de Einstein a la noción
intuitiva de simultaneidad para sucesos distantes. El desarrollo de lo
que se ha sugerido en las observaciones anteriores sugiere una lectura
metafísica apropiada a la relatividad a alguien que quiera defender la
concepción de que el pasado y el futuro son irreales. Es negar la reali
dad del otro lugar tanto como la del otro tiempo, considerando que
sólo tiene realidad auténtica lo que coincide con el lugar-tiempo de
uno como observador. Ahora bien, dicha reducción de lo real a un
punto del espacio-tiempo es incluso peor que retener la realidad sólo
para el momento ínfimo de tiempo que es el ahora. Huelga decir que
no estoy defendiendo semejante disminución radical de lo que vemos
como real. Lo que se está afirmando, no obstante, es que el ímpetu y
las intuiciones que subyacen a la anterior actitud irrealista hacia el pa
sado y el futuro no pueden ser descartados simplemente señalando la
relatividad de las nociones de pasado y futuro respecto al estado de
movimiento del observador en un espacio-tiempo relativista. El lector
interesado en las cuestiones de porqué alguien defendería semejante
dramático irrealismo sobre el pasado y el futuro en primer lugar, y
porqué, en el contexto relativista, personas aparentemente sanas po
drían verse tentadas al irrealismo aun más radical sobre el otro lugar
deberá dirigirse a las obras más detalladas acerca de estas cuestiones.
Sustantivismo versus relacionismo
Un tópico con posibilidades bastante más sustanciales es el impacto
de las teorías relativistas en el debate entre los sustantivistas y los re-
Espacio, tiempo, movimiento 115
lacionistas que ya introduje anteriormente. Como veremos, las cues
tiones aquí son diversas, sutiles y complejas. Pero como también ve
remos, resulta, una vez más, que uno debe tener cuidado con la ten
dencia a inferir prematuramente una concepción metafísica de los
resultados de la ciencia. El tratar de llegar a alguna conclusión filosó
fica acerca de la existencia y naturaleza del espacio y del tiempo exa
minando lo que nos dicen las mejores teorías científicas disponibles
sobre el espacio y el tiempo es una tarea digna de consideración.
Pero es algo que requiere una dosis notable de cautela y prudencia
filosófica.
Los relacionistas negaban que uno debiera postular el espacio y
el tiempo como entidades por derecho propio, arguyendo que lo más
que podía postularse eran las relaciones espaciales que los objetos
materiales presentan entre sí y las relaciones temporales que los suce
sos materiales presentan entre sí. Tras el desarrollo de la teoría espe
cial de la relatividad, se aseguraba normalmente que Einstein había
completado finalmente el programa relacionista leibniziano. Pero
estas vindicaciones llamaban a engaño. Aunque la teoría especial nos
dice que algunas de las características del mundo que una vez
tomamos por absolutas son realmente relativas, esto no es en absolu
to lo mismo que decir que el relacionismo es correcto. En la descrip
ción del espacio y el tiempo por Newton, hay una separación defini
da, no relativa, espacial y temporal entre dos sucesos cualesquiera.
En la teoría de la relatividad, dichas separaciones son solamente rela
tivas a una elección de sistema de referencia inercial y difieren en
función del sistema elegido. Pero dicha relatividad no tiene nada que
ver con que, a fin de dar cuenta de los fenómenos observables, deba
mos postular el espacio y el tiempo o, ahora, el espacio-tiempo, como
estructuras sobre y por encima de las cosas y características materia
les del mundo. También debería indicarse de paso aquí que aunque
la relatividad especial convierte en relativas algunas nociones previa
mente no relativas, introduce nuevas características, no relativas, de
su propia cosecha. El intervalo espacio-temporal de separación entre
los sucesos es, en la teoría especial, una relación absoluta entre los
sucesos y es independiente de cualquier observador, como lo es el
tiempo propio transcurrido a lo largo de una trayectoria específica en
el espacio-tiempo de un suceso a otro.
Si el argumento de Newton a favor de una concepción sustanti-
vista del espacio-tiempo, que él utilizó con gran acierto contra Leib-
Filosofía de la física
niz, luese correcto, entonces la relatividad especial parecería ser una
teoría que postula asimismo un espacio-tiempo sustantivista. Como
hemos señalado, la distinción, tan importante en el argumento new-
toniano, entre sistemas inerciales con movimiento verdaderamente
uniforme y sistemas absolutamente acelerados se conserva en la teo
ría especial de la relatividad. En la nueva teoría, los sistemas inercia
les son, como lo eran en la teoría newtoniana, aquellos en los que no
se experimentan fuerzas inerciales. Pero ahora también se distinguen
por ser los estados de movimiento en los que los experimentos ópti
cos de ida y vuelta dan sus famosos resultados nulos. La distinción
entre estar realmente en movimiento acelerado o no, central al argu
mento de Newton contra el relacionismo, se conserva en la teoría es
pecial de la relatividad.
¿Significa esto que si aceptamos la teoría especial, debemos
aceptar la postura metafísica del antirrelacionista newtoniano (con,
claro está, el espacio-tiempo minkowskiano, en lugar del espacio ab
soluto de Newton, como la estructura del espacio-tiempo sustanti
vista)? ¿Necesitamos todavía un «espacio-tiempo mismo» en rela
ción al cual la aceleración absoluta es aceleración y cuya existencia
se presupone como parte de la explicación de la existencia de fuer
zas inerciales y de los efectos ópticos que ponen de manifiesto la
aceleración absoluta? Quizá, pero de nuevo sería precipitado pasar
sin una reflexión ulterior de una teoría científica a una conclusión
metafísica. ¿No podríamos encontrar alguna forma de reconciliar la
relatividad especial con una descripción relacionista del espacio-
tiempo?
Quizá. Pero las cuestiones filosóficas involucradas son complejas,
sutiles y problemáticas. Hay argumentos diseñados para mostrar que
el programa sustantivista de postular el espacio-tiempo como una en
tidad necesaria para explicar la distinción entre movimientos absolu
tamente acelerados y los no acelerados en absoluto falla y que las ex
plicaciones ofrecidas son espurias. Las fuerzas inerciales y los efectos
ópticos de la aceleración se explican por referencia a la aceleración
del laboratorio respecto a «sistemas de referencia inerciales» del es
pacio-tiempo mismo, los cuales ocupan en la relatividad especial el
lugar del «espacio mismo» de Newton. Pero las mismas estructuras
del espacio-tiempo permanecen, en algún sentido, inmunes a la ob-
servabilidad directa, manifestándose sólo indirectamente en términos
ile los efectos causales del movimiento con respecto a ellas. ¿No po
Espacio, tiempo, movimiento 117
demos explicar todo lo que hay que explicar sin presuponer el espa
cio-tiempo mismo?
Ahora podemos explicar las diferencias entre los efectos inercia-
les percibidos en dos laboratorios por referencia a sus aceleraciones
relativas entre sí. «Pero», dice el sustantivista, «no puedes explicar
porqué en un conjunto de estos sistemas no se siente ningún efecto
inercial en absoluto, siendo estos efectos sentidos solamente en los
laboratorios en aceleración con respecto a estos laboratorios preferi
dos. Yo», dice él, «puedo explicar porqué estos sistemas son preferi
dos. Son los que no están acelerados con respecto al espacio-tiempo
mismo». El relacionista puede contraargurrientar afirmando que, si
bien no puegle explicar porqué un conjunto de estos sistemas es pre-
ferencialmente inercial, puede simplemente tomar esto como un «he
cho incuestionable básico de la naturaleza» que sencillamente nunca
podrá explicarse. Después de todo, puede decir, debe haber algunos
hechos incuestionables fundamentales, así que ¿porqué no éstos?; y
pasa a argüir que el sustantivista requiere hechos incuestionables en
cualquier caso. Para el sustantivista es un hecho incuestionable de la
naturaleza que la aceleración con respecto a las geodésicas inerciales
del espacio-tiempo induce los efectos inerciales. Así pues, defiende el
relacionista, el sustantivista no está mejor provisto de términos ex
plicativos que el relacionista, pero el primero debe postular la miste
riosa entidad del «espacio-tiempo mismo», que no ejerce ninguna
función explicativa real. Y una vez más, siguiendo a Leibniz, el rela
cionista producirá una serie de argumentos en el sentido de que la
concepción sustantivista postula otros hechos, como el que hace refe
rencia a la posición del espacio-tiempo en la que ocurre un suceso
particular, que no tienen ninguna consecuencia observable. Así pues,
continúa el relacionista, la postulación del espacio-tiempo mismo in
troduce «diferencias en la teoría sin una diferencia observacional».
Tales diferencias en la teoría fueron una de las características proble
máticas del espacio mismo de Newton.
Hay muchas otras características problemáticas a ambos lados
del argumento. De hecho, como en cualquier debate metafísico en fi
losofía, los mismos términos en los que el debate se plantea son su
mamente problemáticos. ¿Comprendemos realmente lo que el sustan
tivista está afirmando que debemos postular a fin de explicar los
fenómenos observables? ¿Entendemos realmente lo que el relacionis
ta está negando y lo que está poniendo en su lugar? En particular,
118 Filosofía de la física
¿podemos realmente comprender completamente en qué difieren los
dos enfoques? Comentaré sólo brevemente estas cuestiones más ade
lante.
La propuesta de Mach y la relatividad generalPor el momento, sin embargo, volvamos a la propuesta de Mach por
la que una explicación alternativa de los famosos efectos inerciales,
aceptable desde un punto de vista relacionista, podría ser posible
después de todo. ¿No podríamos suponer que las fuerzas inerciales, y
ahora también los efectos ópticos inerciales, no eran el resultado de
la aceleración de los aparatos prueba respecto al espacio mismo o, en
el caso relativista, respecto a la estructura geodésica inercial del espa
cio-tiempo de Minkowski, sino, más bien, respecto a la materia cós
mica del universo? Después de todo, en la teoría del electromagnetis
mo estamos familiarizados con fuerzas magnéticas que dependen de
las velocidades que las partículas cargadas tienen unas respecto a
otras. ¿No podría haber igualmente fuerzas dependientes de la acele
ración entre trozos de materia ordinaria? Si estas fuerzas dependieran
muy poco de la separación de las cosas entre sí, pero fueran suma
mente dependientes de las cantidades de materia involucradas, ¿no
sería posible explicar los efectos inerciales como el resultado de la
aceleración del objeto prueba respecto a lo que Mach llamó las «es
trellas fijas», y lo que nosotros ahora denominaríamos la materia dis
tante de los supercúmulos de galaxias que constituyen la materia cós
mica del universo?
Aunque la relatividad especial no proporciona un contexto apro
piado para las ideas machianas, quizá la relatividad general sea más
prometedora en esta dirección. Después de todo, ésta se ocupa de la
gravedad, una fuerza de largo alcance. La gravedad newtoniana evi
dentemente no podría proporcionar el tipo de interacción de largo
alcance, dependiente de la aceleración, que Mach postuló como res
ponsable de los efectos inerciales, pero quizá, si la gravedad se recon
ciliase con la relatividad al modo de la nueva teoría del espacio-tiem
po curvo de la gravedad, se obtendría una teoría de índole machiana.
De hecho, Einstein se vio sin duda motivado por semejantes expecta
tivas cuando comenzó la investigación que condujo a la teoría gene
ral de la relatividad.
Espacio, tiempo, movimiento 119
Si Mach tuviera razón al postular que los efectos inerciales son el
resultado de la interacción del sistema prueba con la materia restante
del universo, ¿cuáles serían algunas de las consecuencias de ello? Pri
mero, consideremos las primeras observaciones de Newton sobre lo
que sucedería en un universo vacío. Desde el punto de vista newto
niano, debería existir una distinción entre un objeto que está girando
y uno que no está girando, aun cuando el objeto prueba fuese el úni
co objeto en el universo. El giro se pondría de manifiesto por los
efectos inerciales sobre el objeto prueba generados por el movimien
to absoluto. Mach duda de que debiéramos pensar siquiera en uni
versos vacíos. El universo, dice, nos es dado solamente una vez,
«completo con las estrellas fijas-intactas». Esto podría significar que
no tenemos forma de inferir a partir de lo que observamos lo que su
cedería en el caso de un universo radicalmente diferente, o podría
implicar la afirmación más fuerte de que, dado que las leyes de la na
turaleza son meramente compendios de lo que de hecho ocurre en el
mundo tal como es, no tiene ningún sentido hablar sobre lo que su
cedería en un universo radicalmente diferente al actual. Sea como
fuere, podríamos sin duda preguntar a una teoría como la relatividad
general, capaz de describir la gravedad en muchas clases diferentes
de mundos posibles, si sus predicciones para un universo vacío se
guirían marcando, como las de Newton, una distinción entre objetos
absolutamente giratorios y objetos no giratorios, o si esa distinción
desaparecería en este mundo — sin la materia cósmica de Mach
como sistema de referencia para el movimiento absoluto.
Esperaríamos que, en un mundo machiano, los efectos inerciales
generados sobre un objeto prueba variarían cuando la materia del
universo en torno al objeto se modificase radicalmente, ya que los
efectos inerciales son el resultado de la interacción entre los sistemas
prueba y la materia circundante. ¿Predice esto la teoría general de la
relatividad? No debería existir diferencia alguna entre hablar de un
objeto en un mundo machiano en rotación junto a una materia cir
cundante no rotatoria, y hablar, en su lugar, de la materia rotatoria al
rededor del laboratorio prueba, pues, según Mach, es sólo la acelera
ción relativa entre el sistema prueba y la materia lo que determina las
fuerzas inerciales detectadas. ¿Es esto lo que predice la teoría de la
relatividad? Por último, si Mach tiene razón, sería absurdo hablar de
la materia del universo como, de por sí, en rotación absoluta. Si los
efectos de la rotación en el sistema prueba son debidos a su movi
120 Filosofía de la física
miento respecto a la materia cósmica, entonces sería imposible que
hubiera efectos debido a que la materia cósmica estuviese, de por sí,
en rotación absoluta, pues eso significaría una rotación de esta mate
ria respecto a sí misma, lo cual es absurdo. ¿Qué tiene la teoría de la
relatividad que decir sobre esto?
Algunos de los primeros trabajos con la relatividad general mos
traron aspectos machianos de la teoría. Es sin duda cierto que lo que
un objeto prueba en movimiento acelerado experimenta dependerá
de la distribución general de materia en el universo, pues, en la relati
vidad general, la aceleración absoluta es la desviación del movimiento
de las geodésicas curvas, de tipo temporal, locales del espacio-tiempo.
Y como la curvatura global del espacio-tiempo está correlacionada
con la distribución de materia en el espacio-tiempo, un cambio radi
cal de la cantidad o distribución de la materia cósmica tendrá un
efecto en las fuerzas inerciales generadas por el movimiento local. De
nuevo, en la relatividad general puede mostrarse que un objeto que
está de suyo en reposo, pero se encuentra circundado por materia en
alta rotación, experimentará fuerzas similares a aquellas que habría
experimentado el objeto prueba si hubiera sido puesto en rotación y
la materia circundante hubiera permanecido en reposo.
Pero si uno mira más allá, la teoría parece distanciarse cada vez
más de lo que Mach hubiera deseado. Aunque los efectos inerciales
se ven modificados por la distribución cambiante de la materia exte
rior en el mundo, es como si hubiera un efecto inercial básico debi
do a la rotación absoluta al que los nuevos efectos modificadores se
fueran añadiendo. En otras palabras, incluso en un universo exento
de materia exterior, la relatividad general predice una distinción en
tre estar en rotación absoluta y no estarlo. Determinar a qué se ase
meja el espacio-tiempo en un mundo relativista general requiere la
especificación de condiciones de contorno para el espacio-tiempo,
del mismo modo que encontrar a qué se asemeja un campo eléctrico
requiere más que conocer las cargas que están presentes. La suposi
ción habitual que se hace en relatividad general, al menos en univer
sos abiertos, es que el espacio-tiempo distante de la materia es plano,
el espacio-tiempo de Minkowski. Un espacio-tiempo razonable para
un universo vacío, pues, sería justamente este espacio-tiempo plano
de Minkowski de la relatividad especial. Pero, entonces, en un tal
mundo, la vieja distinción newtoniana entre rotación absoluta y au
sencia de rotación seguiría conservando su valor. De hecho, la relati
Espacio, tiempo, movimiento 121
vidad general permite espacio-tiempos vacíos todavía más extraños.
La curvatura del espacio-tiempo tiene su propia auto-energía gravita
cional. Es posible, pues, tener una curvatura distinta de cero en un
universo vacío, o que haya regiones de espacio-tiempo curvo cuya
desviación de la planaridad no esté sustentada por ninguna materia,
sino simplemente por la auto-energía de la región de espacio-tiempo
curvo. Por lo tanto, la idea de Mach de que en un mundo vacío no
habría efectos inerciales no es válida en la relatividad general.
De nuevo, si bien la materia en rotación en torno a un objeto ge
nera efectos inerciales, puede verse que la situación se desvía de lo
que Mach esperaría. Si un objeto prueba está circundado por dos ci
lindros girando uno respecto al otro y respecto al objeto prueba, lo
que uno experimenta en el laboratorio dependerá, no solamente de
las rotaciones relativas implicadas, sino también de aquello en torno
a lo que el cilindro está «realmente girando», contrariamente a las ex
pectativas machianas. Lo más dramático de todo fue el descubrimien
to por K. Gódel de que hay mundos posibles consistentes con la rela
tividad general en los que toda la materia del universo está en
rotación. No es como si esa materia fuese alguna gigantesca esfera
cósmica, rígida, en rotación. Eso sería relativistamente imposible.
Pero en este mundo, un observador en cualquier lugar, cuyo labora
torio estuviese en reposo con respecto a la materia cósmica, podría
realizar un experimento para probarse a sí mismo que estaba rotando
junto con toda la materia. Para cada observador hay un plano espe
cial. Si el observador lanza partículas libres o rayos de luz a lo largo
de ese plano, éstas siguen trayectorias espirales en el sistema de refe
rencia fijo en la materia cósmica. Esto indica que esta materia está en
rotación, así como la trayectoria de una partícula que se mueve en lí
nea recta a partir del centro sobre un disco de fonógrafo que gira so
bre un tocadiscos trazará una raya espiral sobre el disco. Así que es
como si cada observador pudiera considerarse a sí mismo fundamen
tal para la rotación de la materia cósmica. Para un machiano esto pa
rece absurdo, pero es una posibilidad consistente con la relatividad
general, revelando una vez más los aspectos no machianos de esa teo
ría. (Véase la figura 2.10.)
Existen tentativas de hacer la relatividad general más machiana.
Algunas de las objeciones a una interpretación machiana de la relati
vidad general descansan en el hecho de que la distribución de mate
ria no siempre es suficiente para determinar completamente la es-
122 Filosofía de la física
F i g u r a 2.10. La rotación absoluta de la materia en el universo de Gódel. En una solución
a las ecuaciones de la relatividad general hallada por K. Gódel es plausible decir de
la materia informe del universo que está en «rotación absoluta». ¿Qué significa esto? En cualquier punto hay un plano con la siguiente característica: Fijemos las coordenadas x e y en el plano de manera que esté en reposo en relación a la materia informe del universo. Ahora emitamos desde el punto o una partícula o rayo de luz libre, a. En las coordenadas en reposo en la materia, la partícula o rayo de luz describirá
una trayectoria espiral a medida que la partícula o rayo de luz se aleje de o. Si consideramos a las partículas y rayos de luz libres en movimiento rectilíneo en relación a algún marco de referencia «absoluto», es «como si» la materia informe estuviera rotando en relación a ese marco.
tructura del espacio-tiempo, y por lo tanto, no es adecuada para de
terminar completamente qué efectos inerciales del movimiento existi
rán. En universos que son siempre espacialmente cerrados, sin em
bargo, hay un nexo más estrecho entre la distribución de materia y la
estructura espacio-temporal, de manera que sólo una estructura espa
cio-temporal es compatible con la distribución completa de materia.
Así, se ha propuesto, la versión machiana de la relatividad general es
una donde el espacio-tiempo tiene el cierre apropiado. Pero esto está
muy lejos del relacionismo duro de Mach.
Espacio, tiempo, movimiento 123
Más sobre la relatividad general y el debate entre sustantivistas y relacionistasDe hecho hay aspectos de la teoría del espacio-tiempo en la relativi
dad general que hacen que comencemos a preguntarnos si la distin
ción entre el relativismo y el sustantivismo, tal como se entendían
tradicionalmente, es coherente. Hemos observado que, en la relativi
dad general, el espacio-tiempo mismo tiene energía-masa. Pero la
energía-masa es el aspecto característico fundamental de la materia
tal como se entiende normalmente. ¿Podemos entonces hablar acerca
de «relaciones entre la materia» versus «el espacio-tiempo mismo», si
la distinción entre materia y espacio-tiempo es en sí misma problemá
tica?
Antes incluso de que la teoría general de la relatividad plantease
las cuestiones que acabamos de discutir, era evidente que la distin
ción entre sustantivismo y relacionismo según la interpretación tradi
cional estaba sometida a una cierta tensión. A finales del siglo XIX, el
concepto de «campo» pasó a ser esencial en la física. A fin de poder
tratar los hechos de la electricidad y el magnetismo, por ejemplo, se
hizo necesario añadir a los elementos de la naturaleza productos bas
tante diferentes de las partículas materiales familiares de la física an
terior. Entidades como el campo eléctrico se conciben como extendi
das por todo el espacio, con intensidades diferentes en diferentes
puntos espaciales. Éstas tienen una evolución dinámica en el tiempo.
«Objetos» físicos tales como los campos son esenciales para la teoría
física estándar. Pero, claramente, son algo muy diferente de los obje
tos materiales localizados presupuestos por el relacionista. En mu
chos sentidos se parecen más al «espacio mismo» del sustantivista
que a las partículas materiales ordinarias. Cuando uno considera lo
mucho que debe modificarse la propia concepción que uno tiene so
bre lo que existe cuando se admiten los campos en la imagen física
del mundo, parece claro que el fracaso en los términos del debate
sustantivista-relacionista había ya comenzado con la introducción de
las cantidades tipo campo en la física.
Si dirigimos la atención a un aspecto diferente de la relatividad
general, vemos otra forma en que la existencia de nuestra teoría fun
damental del espacio-tiempo afecta al debate tradicional entre sustan
tivistas y relacionistas. El problema del determinismo en la física es
enormemente complejo. El científico del siglo xvm P. S. de Laplace
124 Filosofía de la física
es famoso, por haber afirmado que, dada la verdad de la imagen me
cánica newtoniána del mundo, la especificación del estado del mun
do en un tiempo dado determinaba su estado en todos los tiempos
futuros, porque las leyes de la naturaleza generaban a partir de ese
estado todos los estados que se seguían necesariamente en tiempos
posteriores. Pero todo lo que tiene que ver con la cuestión de si
estaba en lo cierto, de si el mundo es realmente determinista, se vuel
ve complejo y problemático.
Para empezar, hay algunos problemas filosóficos. Como B. Rus-
sell señaló, si dejamos que la noción de «estado del mundo» sea lo
bastante amplia y la noción de «ley de la naturaleza» lo bastante fle
xible, el determinismo se convierte en una doctrina trivial, pues, no
importa cómo fuese el mundo, podríamos simplemente tomar como
leyes las proposiciones que dicen cuáles estados siguen de hecho a
cuáles otros. Supongamos que contamos con alguna forma de evitar
estas trivializaciones exigiendo que las leyes verdaderas satisfagan
condiciones más estrictas. Muchos problemas científicos se siguen de
ello. Incluso en la mecánica newtoniana, hay problemas con el deter
minismo. Si nos ocupamos de partículas puntuales con una intensi
dad de interacción que se hace infinita cuando las partículas se apro
ximan a una distancia cero, resulta imposible seguir los estados
deterministamente a través de las colisiones de las partículas. De
nuevo, si especificamos el mundo en un tiempo dado, puede que el
futuro esté influido por una partícula que «llega del infinito» después
de ese instante, obstaculizando la determinación del futuro por el
estado total en el tiempo en cuestión.
Cuando pasamos primero a la relatividad especial y luego a la ge
neral con sus nuevos espacio-tiempos, surgen muchas cuestiones aún
más complejas. Los estados del mundo «en un instante» son una
cuestión relativa en la relatividad especial. En la relatividad general,
puede que ni siquiera sea posible seccionar el espacio-tiempo del
mundo en «espacios en un instante», por lo que la misma noción de
estado del mundo en todo lugar en un tiempo dado podría dejar de
tener sentido. El modelo de una posible influencia causal en estas
teorías es, por supuesto, más complejo de lo que lo era en las teorías
newtonianas, y la complejidad de la estructura causal conduce a im
portantes e interesantes problemas matemáticos sobre cómo caracte
rizar qué mundos son deterministas en los sentidos que uno puede
dar al término. En la relatividad general surge otro problema debido
Espacio, tiempo, movimiento 125
a la posibilidad (y, a menudo, la inevit íjj^des en
el espacio-tiempo. El big bang en el que COT;^feé-»««Strjd^ir^erso es-
pacio-temporal (si es que existe) es una ae~^ow gff̂ mfejlaridades,
como lo serían las que se encuentran en el centro de los~«enomina-
dos agujeros negros. Estas singularidades son puntos de espacio-tiem
po donde la curvatura se hace infinita. Su presencia en el espacio-
tiempo bloquea la capacidad de predecir a su través los estados
posteriores del mundo a partir de los anteriores. Introducen, pues,
una forma de indeterminismo en la imagen.
La misma conexión entre determinismo y predictibilidad que, se
gún Laplace suponía, significaba más o menos lo mismo, es también
problemática. ¿Implica el decir que el mundo es determinista <}ue es
predecible, al menos en principio? Muchos han argüido que semejan
te implicación no es válida. Después de todo, el determinismo dice
que el estado del mundo en un tiempo dado fija, por las leyes de la
naturaleza, los estados en otros tiempos. Pero si no podemos conocer
el estado completo del mundo en un tiempo dado, como una cues
tión de principio fundamental, el mundo podría ser determinista,
pero no predecible. El espacio-tiempo de Minkowski tiene esta natu
raleza. El estado completo del mundo en un espacio (respecto a un
sistema inercial) puede muy bien fijar el estado del mundo en espa
cios posteriores. Pero para cualquier observador dado, puede darse
el caso de que nunca pueda acumular la información sobre el estado
del mundo en todo un «espacio en un tiempo», porque la informa
ción que recibe es la que puede alcanzarle causalmente desde el pa
sado, y ésta está restringida a la que se encuentra dentro de su cono
pretérito de luz. Esto es, sólo puede obtener información sobre suce
sos en el pasado que puedan ser conectados con él en el presente
por señales causales desde el pasado. Por esta razón y, como vere
mos, por otras también, la identificación demasiado precipitada del
determinismo con la predictibilidad es ingenua. No obstante, si el de
terminismo y la predictibilidad están enteramente desligados, resulta
muy difícil resolver el problema planteado por Russell de encontrar
una forma de restringir lo que puede considerarse como estado y
como ley de manera que la cuestión del determinismo no se reduzca
a una trivialidad.
En el capítulo 3 volveremos al tema del determinismo. En él exa
minaremos cómo la sensibilidad del desarrollo de un sistema a sus
condiciones iniciales exactas ha llevado a algunos a negar el determi-
126 Filosofía de la física
nismo en el mundo. ¿Qué tipo de mundo determinista puede darse
si incluso un cambio infinitesimal en el estado inicial de un sistema
puede conducir a cambios enormes en su desarrollo futuro? En el
capítulo 4 exploraremos algunas de las cuestiones del determinismo
y el indeterminismo que surgen en el contexto aun más radical de la
mecánica cuántica. Ahí veremos porqué algunos han alegado que si
la mecánica cuántica describe verdaderamente el mundo, el determi
nismo debe ser radicalmente falso.
Pero por el momento quiero centrarme en un argumento concer
niente al determinismo en la teoría general de la relatividad, un argu
mento diseñado para defender una clase de relacionismo leibniziano
defendiendo que si interpretamos la relatividad general en una forma
enteramente sustantivista, debemos considerarla como una teoría in
determinista — cuyo indeterminismo es sorprendentemente peculiar.
Algunos de los argumentos más eficaces de Leibniz contra el sustan
tivismo descansaban en la suposición de que cada punto del espacio
era exactamente igual a cualquier otro y cada dirección en el espacio
igual a cualquier otra. Así pues, el mundo material desplazado del lu
gar en el espacio en el que realmente estaba sería cualitativamente
idéntico al mundo tal como es. No habría una razón suficiente para
que estuviera en un lugar del espacio y no en otro. Y el mundo apa
recería exactamente igual a cualquier observador, sin importar dónde
se encontrase el mundo material en el espacio.
Esto deja de ser cierto en la relatividad general, pues el espacio-
tiempo puede ahora tener una estructura que varía de un lugar y
tiempo a otro lugar y tiempo. El desplazamiento de la materia ordi
naria a través del espacio-tiempo sería muy diferente en un mundo
en el que la curvatura (el campo gravitacional) varía de una posición
espacio-temporal a otra. Pero puede reconstruirse algo parecido al ar
gumento leibniziano donde el desplazamiento de la materia a través
del espacio se acompaña de un desplazamiento compensatorio en la
propia estructura espacio-temporal.
Una consecuencia de esto es un problema indicado por Einstein
y llamado el problema del «agujero». Tomemos una pequeña región
del espacio-tiempo desprovista de materia. Supongamos que la distri
bución de materia y la estructura del espacio-tiempo fuera de la re
gión es cualquier cosa que queramos. Entonces, estructuras espacio-
temporales que parecen diferentes unas de otras en ?1 agujero son
igualmente compatibles, según las leyes de la relatividad general, con
Espacio, tiempo, movimiento 127
la inexistencia de materia en el agujero y la distribución de materia y
espacio-tiempo fuera del mismo. Hay una forma de leer este resulta
do que intenta rebatirlo afirmando que sólo dice que la estructura en
el agujero puede ser descrita por medio de sistemas coordenados al
ternativos. Pero si tomamos seriamente las posiciones puntuales del
espacio-tiempo, seguramente parte de la lectura sustantivista de la
teoría, hay una manera de entender este resultado que dice que, no
importa cuán pequeño sea el agujero, hay estructuras de espacio-
tiempo genuinamente diferentes en él compatibles con la estructura
de espacio-tiempo y materia circundante. Este es el nuevo tipo de in
determinismo que, se alega, se impone a uno cuando uno se aferra a
la lectura sustantivista de la nueva teoría del espacio-tiempo.
Evidentemente, la discusión se termina aquí. Queda un largo ca
mino por recorrer antes de haber seleccionado cuáles son las innu
merables cuestiones diversas entre relacionistas y sustantivistas de va
rios tipos. Y hay muchos aspectos de las teorías físicas ordinarias del
espacio-tiempo que también deben ser mejor entendidas. Hasta que
los dos aspectos, el filosófico y el físico, de las cuestiones no se hagan
más claros y más precisos, será imposible decir qué lectura metafísica
se adapta mejor a lo que la física ordinaria nos dice sobre el espacio
y el tiempo del mundo. Las cuestiones aquí son importantes, pues los
argumentos teóricos que subyacen a la crítica del sustantivismo y a la
defensa del relacionismo, y la oposición a estos argumentos por parte
de los sustantivistas, son utilizados de manera similar en otros deba
tes filosóficos.
Relaciones espacio-temporales y relaciones causalesHemos venido explorando el debate entre aquellos que consideran
el espacio-tiempo como la entidad fundamental del mundo y aque
llos que toman solamente las relaciones espacio-temporales entre las
cosas y los sucesos materiales como constitutivos de la realidad espa-
cio-temporal del mundo. Otro grupo de cuestiones importantes con
cernientes a la naturaleza de la realidad espacio-temporal gira en tor
no a la relación entre las características espacio-temporales y causales
del mundo. Existe una estructura causal entre los sucesos del mun
do. Algunos sucesos causan a otros o, al menos, son causa parcial de
otros, necesitando a otros sucesos que junto con ellos sean suficiente
12H Filosofía de la física
para causar el suceso efecto. Hay profundas e importantes relaciones
entre lo que tomamos como estructura espacio-temporal del mundo
y lo que tomamos como estructura causal entre los sucesos. Estas re
laciones fueron percibidas mucho antes del descubrimiento de las
teorías relativistas, pero adquirieron una gran importancia cuando la
atención de los filósofos se dirigió hacia las cuestiones concernientes
a lo que las teorías relativistas nos dicen sobre la naturaleza de nues
tro mundo. Particularmente importantes son un grupo de afirmacio
nes en el sentido de que la estructura causal entre los sucesos es la
estructura real entre ellos, la estructura física más fundamental cons
titutiva de la realidad. Desde la perspectiva de estas afirmaciones,
las relaciones espacio-temporales son reales solamente en la medida
en que pueden ser reducidas a, o definidas en términos de, relacio
nes causales. Pero dichas afirmaciones resultan ser complejas y su
tiles.
Quizá la primera conexión entre nociones causales y espacio-tem-
porales de este tipo fue hecha por Leibniz. Supongamos que unos su
cesos son causa de otros sucesos por medio de señales enviadas a lo
largo de una trayectoria espacio-temporal continua desde un suceso
anterior a otro posterior. Supongamos, como hacíamos antes de la re
latividad, que estas señales pueden viajar a cualquier velocidad que
queramos, siempre y cuando la velocidad sea finita. Entonces, cual
quier suceso podrá conectarse a cualquier otro suceso por alguna se
ñal causal, a no ser que los dos sucesos ocurran exactamente al mis
mo tiempo. ¿No podríamos «definir» entonces la noción «x es
simultáneo con y» por la noción «x no es causalmente conectable a
y»? De hecho, ¿no podríamos decir que lo que significa para un suce
so ser simultáneo con otro significa para los sucesos no ser causal
mente conectables entre sí?
Ahora examinemos lo que sucede en la teoría de la relatividad.
Dado que hay una velocidad máxima de propagación de una señal
causal, la velocidad de la luz en el vacío, habrá muchos sucesos que
son causalmente conectables entre sí (y, por consiguiente, claramente
no simultáneos entre sí), todos los cuales se encuentran en el domi
nio de no ser causalmente conectable a un suceso dado. Parece,
pues, que en este caso no podríamos definir «x es simultáneo con y» como «x no es causalmente conectable a y» y deberíamos usar algún
otro método como, por ejemplo, el elegido por Einstein, usando se
ñales de luz reflejadas y relojes. De aquí hay solamente un paso a
Espacio, tiempo, movimiento 129
afirmar que como la simultaneidad no puede definirse causalmente
como «no siendo causalmente conectable», la simultaneidad no es
una relación real en la relatividad, sino una cuestión de mera conven
ción o estipulación.
Para ver cuán problemática podría ser dicha afirmación, debe
mos examinar algunos descubrimientos hechos por el matemático
A. Robb poco después del descubrimiento de la relatividad por Eins
tein. Robb fue capaz de mostrar que hay una relación, definible usan
do solamente la noción de conectabilidad causal, que es válida entre
sucesos en el espacio-tiempo de la relatividad especial si, y solo si,
esos sucesos son simultáneos de acuerdo a la definición de simulta
neidad dada por Einstein. Así, «al mismo tiempo» es causalmente de
finible, auncfue la relación causal que define la simultaneidad sea una
relación más compleja, no la simple noción intuitiva de no ser causal
mente conectable utilizada por Leibniz. En realidad, Robb fue capaz
de ir mucho más lejos y mostrar que nociones tales como separación
espacial y separación temporal (relativas a un observador) pueden
también ser definidas en términos de la sola noción de conectabili
dad causal. (A decir verdad, Robb utilizó la noción de «después» en
su definición, donde esto significaba «absolutamente después» en el
sentido relativista, pero su trabajo puede ser reconstruido utilizando
la noción temporal-simétrica de conectabilidad causal.)
¿Significa esto que la simultaneidad y las otras nociones métricas
de la relatividad son reales y aconvencionales porque son reducibles
a nociones causales? Una vez más, las cosas no son tan simples. Su
pongamos que pasamos al contexto de la relatividad general, donde
son posibles una variedad de diferentes espacio-tiempos — no sólo el
espacio-tiempo de la relatividad especial. En algunos de estos mun
dos, varios de los postulados acerca de la estructura de las relaciones
causales entre los sucesos que Robb utilizó, dejan de ser válidos. En
tales mundos, es evidente que las definiciones dadas por Robb de las
relaciones espacio-temporales métricas en términos de las relaciones
causales no se pueden satisfacer. Incluso si los postulados de Robb
se satisfacen, es posible que sus definiciones fallen. Hay espacio-tiem
pos permitidos por la relatividad general en los que todos los postu
lados de Robb sobre la conectabilidad causal se satisfacen, pero son
tales que si uno utilizase las definiciones de Robb para las cantidades
métricas (como la simultaneidad y la separación espacial y temporal),
se asignarían valores a estas cantidades que diferirían de los que se
130 Filosofía de la física
les asignan por la teoría de la relatividad general. Los valores asigna
dos utilizando las definiciones de Robb diferirían de los valores que
uno obtendría utilizando, pongamos, cintas de medir, relojes, y seña
les de luz reflejadas, al modo relativista habitual.
Parece que lo que en realidad está sucediendo aquí es lo siguien
te: es verdad que, en el espacio-tiempo de la teoría de la relatividad
especial, varias nociones métricas coinciden con nociones que pue
den ser definidas utilizando solamente la conectabilidad causal. Pero
parece mucho más dudoso afirmar que este hecho demuestra que las
nociones métricas espacio-temporales en ningún sentido, forma o ma
nera se reducen a, o son definibles mediante, las nociones causales.
Un símil puede aclarar esto aun más. Imaginemos un mundo en el
que encontramos que (quizá por accidente, quizá como resultado de
una ley de la naturaleza) todas las cosas azules son cuadradas y todas
las cosas cuadradas son azules. Esto, por sí mismo, no implica que lo
azul se reduce a lo cuadrado, o que es definible en sus términos, o a
la inversa.
Sin embargo, parece que hay algo de cierto en la afirmación se
gún la cual mientras el que los sucesos sean, o no, causalmente co-
nectables es un hecho fuerte de la naturaleza, la elección de qué
sucesos serán simultáneos unos con otros en la teoría de la relativi
dad parece entrañar un elemento de arbitrariedad o convencionali-
dad. ¿Podemos lograr una mayor comprensión de las ideas subya
centes?
Lo que tenemos hasta el momento es esto: en la física prerrelati-
vista, hay una asociación natural entre una noción causal (conectabili
dad acausal mutua) y la noción espacio-temporal de simultaneidad.
Algunos se ven inducidos a defender que la relación real en el mun
do es la relación causal, y que la simultaneidad es reducible a, o defi
nible en términos de, la relación causal. Cuando pasamos a la teoría
especial de la relatividad, esta asociación natural de relaciones causa
les y espacio-temporales se quiebra, llevando a algunos a afirmar que
la relatividad muestra cómo la simultaneidad es meramente conven
cional o estipulativa. Los resultados de Robb muestran que no sola
mente la simultaneidad, sino también todas las nociones espacio-tem
porales métricas de la relatividad especial, pueden ser definidas en
términos causales. Esto induce a algunos a afirmar que son aconven-
cionales. Pero una reflexión ulterior muestra que las definiciones
causales de Robb no dejan de ser peculiares. Las asociaciones que
Espacio, tiempo, movimiento 131
utilizan no son tan naturales como las del tipo leibniziano y, en el
contexto relativista general, estas asociaciones generalmente pierden
validez. Los axiomas de Robb dejan normalmente de satisfacerse, y
aun cuando se satisfagan, las relaciones métricas, en la forma en que
Robb las define, difieren a menudo de las relaciones métricas están
dar. ¿Qué podemos inferir de todo esto?
Topología y estructura causal
Antes de responder a esta cuestión, exploremos cómo en el contexto
de la relatividad general encontramos una serie muy similar de argu
mentos; la serie, una vez más, trata de en qué medida puede darse
una definición causal a una relación espacio-temporal y de las su
puestas consecuencias filosóficas de la existencia o inexistencia de ta
les definiciones causales. Cuando se comenzó a estudiar la relativi
dad general se observó que dos espacio-tiempos relativistas generales,
métricamente diferentes, podían tener la misma estructura causal.
Esto es, aunque las relaciones espacio-temporales métricas entre los
sucesos en los mundos tuviesen una estructura bastante diferente, la
estructura de las relaciones causales entre los sucesos podía ser la
misma. Así, toda esperanza de una definición causal de la métrica se
vio frustrada. Para determinar completamente la estructura métrica
de un espacio-tiempo, uno debe añadir algo a la estructura causal.
Esto podría ser una estructura métrica espacial determinada por cin
tas de medir o una estructura métrica temporal determinada por re
lojes ideales. Más tarde, se vio que la especificación conjunta de la
estructura causal y de las trayectorias recorridas por las partículas
materiales, ideales, libres (esto es, partículas sobre las que sólo actúa
la gravedad) determinaba completamente la estructura métrica. Pero
las relaciones causales por sí solas no lo hacían.
Ahora bien, la topología de un espacio-tiempo constituye una es
tructura mucho más débil que su métrica. Dos espacio-tiempos pue
den ser topológicamente semejantes, es decir, semejantes en lo que
concierne a todas las cuestiones de continuidad en el espacio-tiempo
y, pese a ello, ser métricamente muy diferentes. Podemos imaginar
nos intuitivamente las características topológicas de un espacio como
esas características preservadas bajo cualquier deformación del espa
cio que conserve intactas las propiedades de continuidad. El espacio
132 Filosofía de la física
F ig u r a 2.11. Espacio-tiempos causalmente patológicos. En eí espacio-tiempo con bucles causales cerrados — ilustrado en (a)— una señal causal puede dejar un suceso o y avanzar hacia el futuro. Siguiendo la señal, siempre hacia el «futuro local», trazamos una trayectoria que regresa al suceso causante o. Aun cuando no posea un tal bucle
cerrado, un espacio-tiempo puede ser bastante «patológico» desde un punto de vista
causal. Esto se ilustra en (b). Aunque ninguna señal desde o puede «regresar» a o mismamente, todavía puede suceder, para cada región espacio-temporal en torno a o con independencia de lo pequeña que sea, que una señal que parte de o y abandona una
región, e, pueda en algún momento regresar a ésta y así retornar «arbitrariamente cerca» del suceso causante o.
puede ser deformado de cualquier manera y su topología seguirá
siendo la misma siempre que ningún «corte» separe puntos situados
originalmente «uno al lado del otro» y ningún «pegado» una puntos
previamente separados. ¿Podrían las primitivas estructuras de conti
nuidad del espacio-tiempo, aquéllas descritas por la topología, ser
quizá causalmente definibles, aun cuando la estructura métrica total
no lo fuera? La respuesta es fascinante, si bien algo compleja. Si
tomamos como nuestra noción causal fundamental «el suceso x es
causalmente conectable al suceso y», resulta que la topología puede a
veces definirse mediante la conectabilidad causal, pero sólo en espa-
cio-tiempos «con un buen comportamiento causal». En espacio-tiem
pos «causalmente patológicos» no es así. ¿Qué es un espacio-tiempo
causalmente patológico? Básicamente, es cualquier espacio-tiempo
donde hay una curva causal cerrada, o donde un cambio infinitesi
mal en el espacio-tiempo podría generar una curva semejante. Dichas
trayectorias constituyen secuencias de sucesos causalmente conecta-
Espacio, tiempo, movimiento 133
t0 = t0+At = t0 + 2At...
F ig u r a 2.12. Un universo «cerrado en el tiempo». Toma el espacio-tiempo ordinario de
Minkowski 3e la relatividad especial y «secciónalo» por dos lineas de simultaneidad
en relación a algún observador, una de dichas líneas en el tiempo t0 y la otra en el tiempo t0+At. En el diagrama t representa la dirección del tiempo y x la del espacio. Entonces «identifica» los dos bordes del trozo seccionado del espacio-tiempo de Minkowski y forma así un cilindro con esa pieza. E l resultado es un espacio-tjempo
«cerrado en el tiempo» pero extendiéndose al infinito espacial. Naturalmente, dicho
espacio-tiempo es sumamente artificial. Nadie considera que sea un modelo posible del espacio-tiempo real del mundo. Pero la consistencia que presenta con las ecuaciones definidoras de la teoría del espacio-tiempo sugiere que modelos más realistas del universo podrían muy bien contener bucles causales cerrados, como sucede en este
espacio-tiempo patológico.
dos que «se rizan en el tiempo» para regresar, o casi, al suceso inicial,
del que se había partido. Solamente en mundos con un grado especí
fico de buen comportamiento causal puede ser suficiente la conecta-
bilidad causal para especificar la topología. Esto se pone de manifies
to de forma muy drástica en ciertos espacio-tiempos topológicos con
una topología no trivial (algunos sucesos están «cerca» de otros suce
sos y algunos no lo están), pero donde todo suceso es causalmente
conectable con todo otro suceso. (Véase las figuras 2.11 y 2.12.)
Así pues, la situación no es muy diferente de la que examinamos
anteriormente. Solamente en ciertos casos, la noción causal indicada
será adecuada para definir las relaciones espacio-temporales desea
das. En otros casos, la definición no puede ser encontrada. Pero la si
tuación es todavía más complicada. Hemos venido tomando como
nuestra noción causal — a la que las nociones espacio-temporales han
de reducirse— la relación que un suceso tiene con otro cuando son
causalmente conectables. Una noción causal más rica es la de una
134 Filosofía de la tísica
trayectoria en el espacio-tiempo que es una trayectoria causal conti
nua. Si imaginamos una partícula puntual (o partícula de luz) viajan
do desde un punto del espacio-tiempo a otro, la trayectoria seguida
es una de dichas trayectorias causales continuas. El resultado es im
portante y puede ser establecido como sigue: Si dos espacio-tiempos
son exactamente iguales en sus estructuras de trayectorias causales
continuas, son exactamente iguales en su topología, al menos cuando
sólo se consideran los tipos estándar de topologías (las denominadas
topologías de variedades). La noción de conectabilidad causal dice
solamente que dos sucesos son conectables por una u otra trayecto
ria causal continua. Esta nueva noción causal requiere especificar cla
ramente qué fragmentos de trayectoria en el espacio-tiempo son ver
daderamente las trayectorias continuas causales. Lo que el resultado
dice es que todos los hechos topológicos sobre el espacio-tiempo es
tán completamente determinados una vez que se ha determinado
qué colecciones de sucesos en el espacio-tiempo constituyen trayec
torias continuas de propagación causal o, mejor dicho, que esto es
cierto cuando sólo se consideran las topologías estándar. Aquí tene
mos, pues, un resultado positivo en la relatividad general sobre la de-
finibilidad de al menos la topología por hechos causales solamente.
¿Son las características espacio-temporales reducibles a características causales?Pero, ¿cuál es la relevancia de todos estos resultados para nuestra
idea inicial de que los hechos causales que relacionan unos sucesos
con otros son los hechos reales o incuestionables sobre la estructura
del mundo? Recordemos que lo que el teórico causal quería defen
der era que en la medida en que los hechos del espacio-tiempo fue
ran hechos incuestionables, serían reducibles a hechos causales, y en
la medida ?n que los hechos del espacio-tiempo no fueran reducibles
en esta forma, no serían de ningún modo hechos reales, sino mera
mente el resultado de una elección o estipulación convencional por
nuestra parte.
Las cuestiones aquí son controvertidas, pero permitidme esbozar
una respuesta a estas afirmaciones. Una forma de abordar cuál es la
motivación intuitiva tras las teorías causales de las características del
espacio-tiempo se centra en la cuestión epistemológica de cómo lie-
Espacio, tiempo, movimiento 135
gamos a conocer el espacio-tiempo del mundo. Aquí, como discuti
mos anteriormente, se arguye algunas veces que son aquellas caracte
rísticas que nos son accesibles por algún proceso directo de inspec
ción las que debemos tomar como hechos verdaderos sobre el mun
do espacio-temporal. Otras características, atribuibles al espacio-tiem-
po sólo eligiendo algunas hipótesis no testables directamente sobre la
estructura del espacio-tiempo, son consideradas bajo esta concepción
como una cuestión de convención, ya que ningún hecho observacio
nal, directamente inspeccionable, selecciona la correcta hipótesis por
nosotros. Tanto en la anterior versión leibniziana, como en las versio
nes relativistas modernas de las teorías causales del espacio-tiempo,
se supone que la influencia causal se propaga a lo largo de trayecto
rias continuas en el espacio-tiempo, que pueden ser recorridas por al
guna cosa material como una partícula. En Leibniz, por supuesto,
cualquier trayectoria espacio-temporal dirigida al futuro puede ser re
corrida en esta forma; en las versiones relativistas, sin embargo, sólo
aquellas trayectorias que representan una velocidad menor o igual a
la de la luz pueden ser recorridas así. Pero si una partícula puede re
correr dicha trayectoria, también puede hacerlo, en principio, un ob
servador.
Alguien podría, pues, argumentar como sigue: Las características
del espacio-tiempo determinables en un solo punto del espacio-tiem
po, como la simultaneidad de sucesos en un mismo lugar, son deter
minables por observación directa por nosotros. Por consiguiente,
éstas constituyen hechos incuestionables sobre el espacio-tiempo.
También nos son accesibles observacionalmente, en principio, he
chos sobre la continuidad de las trayectorias que son causales, esto
es, que son tales que un observador puede moverse a lo largo de la
trayectoria y comprobar directamente sus propiedades de continui
dad. Es por esto por lo que en la relatividad especial deberíamos
considerar la simultaneidad en un punto como un hecho incuestiona
ble, pero la simultaneidad de sucesos separados y otras características
métricas de tipo no puntual como cuestiones de convención. De nue
vo, la continuidad a lo largo de trayectorias causales debería ser con
siderada como una cuestión de hechos incuestionables. Cualquier
otro hecho topológico debe, bien reducirse a estos hechos, bien ser
considerado como convencional. Es por ello que es importante mos
trar que la continuidad de las trayectorias causales determina com
pletamente la topología en la relatividad general. Sólo entonces pode
136 Filosofía de la física
mos estar seguros de que los hechos topológicos son todos (al estar
determinados enteramente por hechos topológicos directamente ac
cesibles) hechos incuestionables.
Si las teorías causales de las características espacio-temporales se
interpretan en esta forma, vemos que el llamar teorías causales a
estas teorías puede inducir a error. Para Robb, la conectabilidad cau
sal (en la forma de la relación «después») era la única relación legíti
ma sobre la que cimentar las características métricas de un espacio-
tiempo relativista especial. Para los teóricos causales de la topología
del espacio-tiempo, la continuidad a lo largo de trayectorias causales
es la única característica legítima del espacio-tiempo sobre la que ci
mentar todos los hechos topológicos. Pero estas características causa
les fundamentales son privilegiadas en esta forma no por ser hechos
sobre relaciones causales, es decir, sobre cómo los sucesos en el
mundo determinan, producen o provocan otros sucesos en el mun
do. Antes bien, son privilegiadas porque son las características del es
pacio-tiempo que podemos determinar como tales sin apoyarnos en
hipótesis que, al no poder ser comprobadas por ningún procedimien
to de inspección directa, están afectadas de una arbitrariedad que
sólo puede resolverse tomando una decisión arbitraria o conven
cional.
Desde esta perspectiva, no son los hechos causales los que son
fundamentales, sino un subconjunto limitado de los hechos espacio-
temporales. El orden espacio-temporal no puede ser reducido al or
den causal o definido por medio del orden causal. En lugar de ello,
toda la estructura espacio-temporal ha de reducirse a, o definirse por
medio de, el subconjunto limitado de hechos espacio-temporales que
están verdaderamente abiertos a nuestro acceso epistémico. De he
cho, en este punto, es probable que uno piense en las tentativas de
analizar la noción de causalidad que nos son familiares de la filosofía.
Habitualmente, se piensa en la causalidad como dotada de un aspec
to espacio-temporal. Hume, por ejemplo, al intentar decir a qué equi
valía la causalidad, insistió en que la continuidad espacio-temporal
era un elemento necesario para definir el proceso causal. Causa y
efecto tienen que ser, decía, «contiguos en el espacio y en el tiempo».
Naturalmente, debe haber algo más que la relación causal. Debe ha
ber lo que sea que constituye la determinación del efecto por la cau
sa. Pero, desde esta perspectiva, las características espacio-tempora
les, al menos algunas de ellas, son primitivas e irreducibles a la
Espacio, tiempo, movimiento 137
causalidad propiamente dicha. En su lugar, la causalidad tiene como
parte de su análisis una relación espacio-temporal fundamental entre
sucesos.
El problema de las interconexiones entre causalidad y caracterís
ticas espacio-temporales del mundo difícilmente puede resolverse
mediante las breves observaciones realizadas más arriba. Nuestra
concepción del mundo como existiendo en el espacio y el tiempo y
nuestra concepción del mundo como gobernado por un proceso de
sucesos determinando otros sucesos, es decir, por causalidad, son dos
de las conceptualizaciones más profundas y amplias del mundo que
poseemos. Cómo se relacionan estos dos aspectos fundamentales del
mundo, y cuál es la dependencia entre uno y otro para su significado
e inteligibilidad, son temas actuales para una exploración filosófica
profunda.
En el capítulo 3 tocaremos una cuestión relacionada con las que
acabamos de discutir. Veremos cómo una característica especial del
tiempo, su asimetría, en el sentido de que el pasado y el futuro pare
cen radicalmente diferentes uno del otro de muchas maneras, es rela
cionada por muchos científicos y filósofos con otra asimetría funda
mental del mundo, la tendencia de los sistemas físicos a pasar de
estados ordenados a estados desordenados. La concepción de que el
desorden creciente del mundo es esencial a nuestras ideas sobre la
asimetría del tiempo y de los sistemas en el tiempo se coloca también
algunas veces, equivocadamente, en la categoría general de «teorías
causales de la estructura espacio-temporal». En realidad, la teoría en
cuestión no es en absoluto una teoría causal; es una afirmación adi
cional en el sentido de que una estructura espacio-temporal puede
ser reducida a una clase diferente de estructura, afirmación que exa
minaremos detenidamente en el capítulo 3.
ResumenHemos visto ahora que el problema del tipo de «ser» que se ha de
atribuir al espacio y al tiempo tiene una rica historia y un futuro pro
metedor. Las cuestiones metafísicas fundamentales mismamente tie
nen una estructura compleja y de largo desarrollo. El que hayamos
de concebir el espacio, por ejemplo, como una sustancia que existe
separada de los contenidos materiales del mundo, como un conjunto
138 Filosofía de la física
de relaciones entre los objetos materiales del mundo, o como algo
completamente distinto, sigue siendo una cuestión abierta. También
hemos visto que la cuestión de si la espacialidad o la temporalidad
son reducibles de algún modo a algún otro aspecto del mundo, pon
gamos, a un aspecto causal, está asimismo por responder. Más impor
tóte aún, hemos visto que cada avance científico revolucionario en
nuestra comprensión del espacio y el tiempo lleva aparejado un nue
vo contexto en el que los debates filosóficos tienen lugar. Aunque los
l°§ros científicos por sí mismos no pueden resolver enteramente las
cuestiones metafísicas, cualquier tratamiento filosófico adecuado de
la naturaleza del espacio y el tiempo debe hacer plena justicia a estas
realizaciones científicas. *
Lecturas adicionales
Algunos libros que cubren los tópicos tratados en este capítulo con
mayor detalle y profundidad son Reichenbach (1956), el cual es muy
'Aportante históricamente, y Grünbaum (1973), el cual presenta una
cobertura enciclopédica. Van Fraassen (1970) es muy útil al presentar
el trasfondo histórico de muchas de las cuestiones importantes. Sklar
(1574) es una introducción sistemática a las cuestiones principales, y
Sklar (1985) se ocupa más ampliamente de algunos de los problemas.
Ffiedman (1983) introduce al lector al vocabulario técnico de la física
matemática moderna del espacio y el tiempo y ahonda en profundi
dad, asimismo, en la controversia filosófica.
Smart (1964) contiene importantes y breves extractos de los prin
cipales textos históricos. Jammer (1954) es un breve estudio histórico
de concepciones filosóficas sobre el espacio. Alexander (1956) contie
ne el debate original entre Leibniz y el newtoniano Clarke sobre la
naturaleza del espacio y el tiempo. Barbour (1989) es un estudio con
ciso de la historia de las ideas sobre el espacio, el tiempo y el movi
miento desde los griegos antiguos, pasando por Galileo, Huyghens,
Descartes, Leibniz y Newton. La teoría del espacio por Kant puede
hallarse en la primera parte de Kant (1950) y en la Estética Trascendental de Kant (1929).
Las introducciones a la teoría especial de la relatividad y su espa-
cio-tiempo abundan. Taylor y Wheeler (1963) es excelente, al igual
que Bohm (1989). Moller (1952), Synge (1956), y Rindler (1977) son
Espacio, tiempo, movimiento 159
todos de utilidad. Toretti (1983) y Lucas y Hodgson (1990) tienen
una orientación filosófica e histórica, al igual que Anderson (1967).
También hay numerosas introducciones a la teoría general de la
relatividad. Geroch (1978) aporta lo fundamental. Meller (1952),
Rindler (1977), Anderson (1967), y Wald (1984) son todos clásicos en
la materia. Misner, Thorne y Wheeler (1973) es enciclopédico. Toretti
(1983) es histórico y filosófico. Einstein et al. (1923) contiene la tra
ducción al inglés de los artículos originales en la materia.
Para la historia de la epistemología de la geometría, véase Toretti
(1978). Los artículos originales de Poincaré se encuentran en Poinca
ré (1952). Eddington (1920) presenta una temprana y estimulante dis
cusión. Reichenbach (1956) es un clásico del convencionalismo. Dis
cusiones generales recientes pueden encontrarse en Sklar (1974) y
Friedman (1983).
Un útil estudio de cuestiones filosóficas sobre el tiempo se en
cuentra en Newton-Smith (1980). Una buena introducción a las cues
tiones del tiempo y sus estadios es Mellor (1981). Para una discusión
de los estadios del tiempo en el contexto de la relatividad especial
véase Rietdijk (1966), Putnam (1967), el capítulo 11 de Sklar (1985), y
Stein (1991).
La cuestión del sustantivismo versus relacionismo en las teorías
del espacio-tiempo se examina exhaustivamente en Earman (1989).
La historia de este tema es tratada con gran detalle en Barbour
(1989). Friedman (1983) y Nerlich (1976) ofrecen argumentos a favor
del sustantivismo. Una discusión general de las cuestiones se presen
ta en el capítulo 3 de Sklar (1974). La «geometrodinámica» se discute
ampliamente desde una perspectiva filosófica en Graves (1971).
Una discusión completa del determinismo se encuentra en Ear
man (1986). El papel del determinismo en el argumento del «aguje
ro» en la relatividad general se trata en Earman (1989). La estructura
de la causalidad en la relatividad general es estudiada (desde un pun
to de vista muy avanzado) en Hawking y Ellis (1973). Algunas refle
xiones filosóficas sobre teorías causales del espacio-tiempo se en
cuentran en van Fraassen (1970) y en los capítulos 9 y 10 de Sklar
(1985). Respecto a la teoría causal del espacio-tiempo de Robb, véase
Winnie (1977) para una exposición y el capítulo 3 de Sklar (1985)
para una crítica.
LA INTRODUCCIÓN DE LA PROBABILIDAD EN LA FÍSICA
Capítulo 3
Los filósofos acerca de la probabilidad y la explicación estadística
Probabilidad: la teoría formalEs muy ventajoso para nosotros ser capaces de predecir con confian
za lo que sucederá en el futuro. En ciertos casos, muy excepcionales,
podemos predecir que el futuro tendrá un, y solo un, resultado, pon
gamos, cuando predecimos la posición futura de uno de los planetas
a partir de su estado actual y de las leyes dinámicas del movimiento.
En muchos otros casos, sólo contamos con una idea muy vaga de lo
que el futuro deparará. Hay un conjunto especial de casos, sin em
bargo, donde no podemos decir con seguridad cuál entre un número
de sucesos posibles ocurrirá, pero donde podemos tener un conoci
miento fiable de la proporción en la que ocurrirán los sucesos en la
repetición de un gran número de pruebas de tipo similar. El tirador
de dados no sabe lo que obtendrá en la siguiente tirada del dado,
pero sabe que en una larga serie de tiradas aparecerá un siete sobre
el dado aproximadamente un sexto del total de las veces. La explora
ción de dichas situaciones, comenzando con la típica situación de
azar, condujo al desarrollo de la teoría de la probabilidad. La proba
bilidad de un suceso fue considerada como algo estrechamente rela
cionado con la frecuencia con que se esperaría que dicho suceso ocu
141
N 2 Filosofía de la física
rriera en la repetición de un gran número de pruebas idénticas de un
tipo determinado.
Se ha construido una teoría matemática formal de la probabili
dad de una simplicidad y elegancia sin par. Sorprendentemente, no
se formalizó hasta los años treinta del siglo XX, a pesar del hecho de
que las ideas básicas se conocían desde hacía cientos de años. Sea da
da una colección de sucesos básicos como el número que aparece en
la cara de un dado. Números del cero al uno son asignados a las sub-
colecciones de la colección de sucesos básicos. Así, asignamos a la
colección formada simplemente por «aparece el número uno» el nú
mero — esto es, la probabilidad de— un sexto. A la colección carac
terizada por «aparece un número par» le asignamos el número un
medio. Al resultado vacío (ninguno de los posibles sucesos ocurre) se
le da la probabilidad cero, y al resultado trivial (alguno de los posi
bles sucesos ocurre) la probabilidad uno. El postulado más importan
te es el de aditividad. Supongamos que si un suceso está en la co
lección A, no puede estar en la colección B, y viceversa. La
probabilidad asignada al resultado «A o B» se considera entonces
que es la suma de las probabilidades asignadas a A y a B. Así, si uno
no puede ser ciudadano de Nueva York y de California al mismo
tiempo, la probabilidad de que uno sea ciudadano de uno de los dos
estados es la suma de las probabilidades de que sea neoyorquino y
de que sea californiano.
En circunstancias ordinarias, nos es bien conocida la situación
donde el número de posibles sucesos básicos es finito: el dado con
seis caras, la ruleta con treinta y siete ranuras, etcétera. Sin embargo,
el matemático y, como veremos, el físico deben tratar con casos don
de el número de sucesos básicos es infinito. Por ejemplo, un suceso
básico podría ser una partícula puntual ocupando una cualquiera del
número infinito de posiciones posibles en una caja. Habitualmente,
se adopta una generalización del postulado de aditividad. Ésta es de
nominada aditividad contable. Se trata de una suposición natural, si
bien tiene algunas consecuencias peculiares. Una de ellas es que la
probabilidad cero ya no se asigna solamente al conjunto vacío obte
nido cuando no se da ningún resultado básico, sino que también se
asigna a conjuntos no vacíos. Por ejemplo, si uno anda ocupado en la
tarea de elegir un número entre todos los números reales entre cero
y uno, la aditividad contable implica que la probabilidad de obtener
un número que sea racional, esto es, que pueda ser representado por
La introducción de la probabilidad en la física 141
una fracción de dos enteros, es cero. Pero, claro está, hay un número
infinito de tales números racionales en la colección. La idea es que
hay «muchos más» números reales no fraccionarios que fraccionarios.
En estos contextos, pues, el suceso imposible tiene probabilidad
cero, pero no todos los sucesos con probabilidad cero son imposi
bles. Y el tener probabilidad uno no significa que un suceso deba ne
cesariamente ocurrir.
Una noción importante en la teoría de la probabilidad es la de
probabilidad condicionada. Supongamos que sabemos que se ha ob
tenido un siete en el lanzamiento de dos dados. ¿Cuál es la probabili
dad, dado dicho suceso, de que uno de los dados muestre un uno en
su cara? Veamos, el siete puede aparecer en seis formas, y en sólo
dos de los casos se tendrá un uno en uno de los dados. Así pues, la
probabilidad es un tercio. En suma, la frecuencia esperada de un tipo
de suceso, B, una vez que ha ocurrido un tipo de suceso, A, es la
probabilidad de B condicionada a A o la probabilidad de B bajo la
condición A. Si la probabilidad de B bajo la condición A es simple
mente la probabilidad no condicionada de B (y la probabilidad de A bajo la condición B simplemente la probabilidad de A), se dice que
A y B son sucesos probabilísticamente independientes entre sí. Dos
lanzamientos sucesivos de una moneda se toman habitualmente
como independientes en este sentido. La probabilidad de obtener
una cara en el segundo lanzamiento sigue siendo un medio, siendo el
resultado del primer lanzamiento irrelevante para esta probabilidad.
Sin embargo, ser californiano y ser del oeste no son evidentemente
independientes. La probabilidad de que alguien provenga de Califor
nia suponiendo que proviene del oeste es obviamente mayor que la
probabilidad de que sea californiano suponiendo sólo que vive en al
gún lugar de Estados Unidos.
A partir de los postulados básicos de la teoría de la probabilidad
se puede probar un grupo de importantes teoremas denominados Le
yes de los Grandes Números. ¿Esperamos que aparezcan caras la mi
tad de las veces en un número pequeño de lanzamientos de una mo
neda? Si el número de lanzamientos es impar, no podrá ser. Aun
cuando el número de lanzamientos sea par, esperamos que el suceso
real se desvíe de la proporción exacta de un medio en cualquier serie
dada de lanzamientos. A medida que aumente el número de lanza
mientos, sin embargo, esperamos que haya algún tipo de convergen
cia de la frecuencia de caras observadas a la probabilidad postulada
Filosofía de la física
ili- im medio. Lo que las Leyes de los Grandes Números nos dicen es
que la probabilidad de dicha convergencia (entendida en varios senti
dos, pues puede ser de diferentes intensidades) tiende a uno («certe
za probabilística») cuando el número de pruebas tiende a infinito.
Esto es válido si las pruebas son probabilísticamente independientes
entre sí. Así pues, si bien no podríamos ciertamente probar que en
cualquier serie de pruebas tendiendo al infinito, la frecuencia conver
gería a la probabilidad, podemos probar, dada la independencia de
las pruebas, que un resultado semejante es cierto probabilística
mente.
Interpretaciones objetivistas de la probabilidadUna cosa es tener un conjunto de axiomas formales de probabilidad.
Hay algunas variaciones en éstos, pero se comprenden bien. Otra
muy diferente es lograr un acuerdo sobre lo que la probabilidad es sencillamente. ¿De qué estamos hablando cuando hablamos de pro
babilidades? Dada la estrecha relación entre frecuencias de sucesos
en el mundo y atribuciones de probabilidad, ¿no sería más sencillo
identificar las probabilidades con las frecuencias relativas reales de
los sucesos? Con el fin de abarcar los casos en los que el número de
sucesos básicos es infinito en lugar de finito, podríamos querer gene
ralizar y hablar de proporciones reales en lugar de frecuencias reales,
pero la idea básica sería la misma. Esta sencilla concepción, sin em
bargo, tropieza con la objeción familiar de que en cualquier clase real
de experimentos no esperamos que las frecuencias o proporciones
reales sean las probabilidades exactas. Esperamos un tipo de «con
centración» de los sucesos reales en torno a los valores de la probabi
lidad, pero no su identidad.
Para evitar esto, se sugiere a menudo que deberíamos identificar
las probabilidades con las frecuencias o proporciones relevantes «a la
larga», esto es, cuando el número de pruebas tiende a infinito. Un
problema al respecto es, por supuesto, que el número real de prue
bas es siempre finito. ¿Qué es esta peculiar «serie de pruebas ten
diendo a infinito» idealizada en la que han de determinarse las fre
cuencias? ¿Se supone que es algo real o, más bien, algún tipo de
idealización? Y si es esto último, ¿qué ha sucedido con la concepción
original de las probabilidades como frecuencias o proporciones rea
La introducción de la probabilidad en la física 145
les? Otro problema con esta concepción es que, incluso ¡i la larga, el
nexo entre probabilidades y frecuencias es solamente un nexo proba-
bilístico. Las Leyes de los Grandes Números son válidas sólo cuando
las pruebas son independientes entre sí, y esto es una noción proba
bilística. Peor aún, la identidad entre frecuencia y probabilidad, in
cluso a la larga, sólo se asegura con «probabilidad uno» y, como he
mos indicado, esto no significa que, en cualquier serie infinita de
ensayos, el límite de la frecuencia relativa y la probabilidad deban
coincidir.
A menudo se sugiere una conexión más laxa entre probabilida
des y frecuencias o proporciones reales. Tomad la «probabilidad»
como un término no definido y las probabilidades como una caracte
rística primitiva atribuida a los sistemas físicos. De qué característica
se trata viene determinado por el papel que la probabilidad juega en
nuestro esquematismo para predecir, controlar y explicar los sucesos.
Contamos, por ejemplo, con reglas «ascendentes» que nos dicen có
mo inferir de las frecuencias y proporciones observadas las probabili
dades asignadas, y de reglas «descendentes» que nos dicen, una vez
asignada una probabilidad a un fenómeno, qué tipos de frecuencias y
proporciones esperar en pruebas finitas. Así pues, en lugar de identi
ficar la probabilidad con alguna proporción o frecuencia real, quizá
deberíamos considerar que dichas frecuencias y proporciones reales
especifican lo que la probabilidad es por medio solamente de su co
nexión con las probabilidades a través de estas reglas ascendentes y
descendentes de inferencia, reglas que conectan las frecuencias y pro
porciones reales a las probabilidades asignadas.
Otras sugerencias contemplan el examinar todo el esquema de
atribuciones estadísticas y legales que hacemos al mundo. Contamos
con una amplia y profunda estructura jerárquica de generalizaciones,
algunas legales y sin excepción, otras estadísticas y basadas en atribu
ciones de probabilidad. Todas estas generalizaciones se refieren al
orden de las conexiones entre los fenómenos en el mundo. Quizá
deberíamos figurarnos las probabilidades como esas atribuciones
idealizadas de frecuencia y proporción que aparecen en los postula
dos que juegan un papel fundamental en esta estructura de generali
zaciones. Sería entonces un error concebir la probabilidad como una
frecuencia en un sentido ingenuo: la probabilidad es un tipo de pro
porción simple idealizada que se considera representativa de la es
tructura general del mundo al nivel de las generalizaciones funda
146 Filosofía de la física
mentales. Pueden proponerse varios esquemas diferentes para inten
tar que esta noción de «proporción idealizada» sea menos vaga.
El objetivo de todas estas interpretaciones es asignar una proba
bilidad a un suceso en una serie de pruebas, ya sea la frecuencia o
proporción de ese suceso, o alguna proyección o idealización de la
misma. Otra interpretación objetivista de la probabilidad examina,
antes bien, el proceso por el que se generarían las frecuencias requeri
das. La probabilidad, según esta concepción, es una característica del
objeto, o bien del proceso que involucra un objeto, por la que un su
ceso puede o no producirse. Así como una ventana puede ser frágil
aunque no se haya roto, así, una moneda lanzada tiene, bajo esta con
cepción, una disposición o tendencia a producir caras o cruces, aun
cuando esta tendencia no se actualice en ciertos casos. El describir la
probabilidad de obtener caras en el'lanzamiento de una m on jía
como un medio es atribuir al sistema o situación de lanzamiento una
«propensión» a producir caras la mitad de las veces que se lleva a ca
bo un gran número de pruebas. Así pues, la probabilidad es, bajo
esta concepción, el atributo de un solo lanzamiento, la magnitud de
su disposición a producir un suceso de un tipo específico.
Como veremos más tarde en este capítulo y en el capítulo 4, de
terminar en qué medida la probabilidad es inherente a un solo suce
so, en lugar de ser una medición meramente de una clase de resulta
dos sobre una clase de sucesos, requerirá algo más que cuestiones
puramente filosóficas. Por tales entiendo cuestiones del tipo de si la
concepción disposicional presupone un soporte frecuentista y si esa
concepción puede resolver las dificultades encontradas en las con
cepciones anteriores. También surgirán cuestiones de física. Pues la
cuestión de si las proporciones que observamos en el mundo son in
herentes en un sentido irreducible a sucesos simples, está íntimamen
te relacionada a la cuestión de si hay condiciones suficientes en cada
suceso para determinar completamente que sólo uno de los posibles
sucesos efectivamente ocurrirá. ¿Pueden darse casos en los que que
de una multiplicidad de resultados, aun cuando se hayan especifica
do todas las condiciones (conocidas, desconocidas, o incluso incog
noscibles) que gobiernan el suceso? Ésta es una cuestión importante
en mecánica cuántica, como veremos, donde la cuestión de los pará
metros deterministas «ocultos» es importante.
Hay otra área de problemas que debe ser explorada por todo
aquel que pretenda entender la probabilidad como una característica
La introducción de la probabilidad en la física N 7
objetiva del mundo. Se trata del problema de la aleatoriedad. Supon
gamos una serie de lanzamientos de moneda como la siguiente:
C,X,C,X,C,X,..., etc. ¿Deberíamos decir que en dicha serie la probabi
lidad de obtener cara en un lanzamiento dado es un medio? Ésta es,
en definitiva, la frecuencia límite con que ocurren las caras. Sin em
bargo, la ordenación de la serie, una ordenación que nos permite de
cir, dado el resultado de nuestro último lanzamiento, si ocurrirá cara
o cruz en el lanzamiento siguiente, lleva a muchos a afirmar que el
considerar la probabilidad de obtener cara en un lanzamiento dado
como un medio induciría a error. Si se ha de asignar alguna probabi
lidad, ¿no deberíamos asignar al suceso obtener cara la probabilidad
uno en los lanzamientos impares y la probabilidad cero en los lanza
mientos pares? Sólo en una serie aleatoria, dicen, la probabilidad
¡guala a la frecuencia relativa límite. Pero, ¿qué es exactamente una
serie aleatoria?
El estudio de la aleatoriedad desde el punto de vista objetivista
ha conducido a resultados interesantes, cuando no absolutamente
concluyentes. Investigadores como L. von Mises y A. Church han in
tentado definir la aleatoriedad como una propiedad que se satisface
cuando las frecuencias de los sucesos en la serie son las mismas en
cualquier subserie derivada de la original por cualquier proceso «me
cánico». Así pues, la serie de más arriba no es aleatoria, pues la sub
serie de lanzamientos impares puede ser seleccionada mecánicamen
te por un ordenador automático convenientemente programado. Y la
frecuencia de caras en esa serie es uno, no un medio. El concepto de
una subserie seleccionable mecánicamente puede hacerse matemáti
camente preciso. Sin embargo, hay series que son aleatorias en este
sentido pero que son, intuitivamente, no aleatorias en el sentido de
que pueden adoptarse algunas estrategias de juego contra ellas que
son «sucias».
Una propuesta diferente para dar una explicación de la aleatorie
dad objetiva descansa en la intuición de que «casi todas» las series
deberían ser aleatorias. Las series ordenadas deberían ser escasas en
la colección de todas las series, una noción que podríamos formalizar
exigiendo que una serie sea aleatoria «con probabilidad uno». Así
pues, uno busca definiciones de no aleatoriedad que seleccionarán
de entre todas las series una colección con una probabilidad de ta
maño cero. El principal problema que surge con las definiciones
cuando se desarrolla esta idea es que se pierde su estrecho vínculo
Filosofía de la física
( mi la noción intuitiva de aleatoriedad de la que uno partió. Hay
todavía otra definición de aleatoriedad que imagina un efectivo pro
cedimiento «universal» para probar la no aleatoriedad y declara a
una serie aleatoria si supera esta prueba.
Una cuarta alternativa adopta una estrategia sumamente intuitiva.
Consideremos una computadora programada para producir como sa
lida la serie de resultados experimentales que ocurren efectivamente.
¿Cómo de largo será el programa más corto que haga este trabajo?
Obviamente un programa siempre funcionará, la instrucción que di
ce sencillamente «Imprime ...», donde la «...» es la serie en cuestión.
Pero las series «no aleatorias» poseen, intuitivamente, programas más
cortos. Por ejemplo, la serie C,X,C,X, ... puede venir dada sencilla
mente por «Imprime C y X alternativamente». Así, una serie es tanto
menos aleatoria cuanto más corto pueda ser su programa generador.
Todo esto puede hacerse formalmente decente. Pero apenas se consi
gue lo que el objetivista quería, pues resulta que una definición satis
factoria parece dar por sentado nuevamente que la serie se ha presu
puesto como generada por un proceso probabilístico. Esto hace
difícil usar una noción de aleatoriedad objetiva definida en una for
ma que, junto a la noción de frecuencia relativa límite, sirva para de
cir lo que la probabilidad es ante todo.
Interpretaciones subjetivistas de la probabilidadUn entendimiento de la naturaleza de la probabilidad radicalmente
diferente al de las explicaciones objetivistas que hemos venido exa
minando hasta el momento no se centra en lo que hay en el mundo
sino, en su lugar, en lo que hay en nosotros. Nosotros utilizamos la
probabilidad como guía para actuar frente al riesgo, apostando por
un resultado dado sólo si consideramos que la probabilidad de acer
tar es lo bastante alta como para superar nuestras dudas de que el re
sultado se dé efectivamente. Quizá deberíamos concebir entonces la
probabilidad como una medida de nuestro grado de confianza en la
ocurrencia de un suceso, una medida de la «creencia parcial» por
nuestra parte, si se quiere.
Supongamos que las probabilidades son medidas de la creencia
parcial, en el sentido de que son indicadoras de las mínimas diferen
cias en razón de las que apostaremos por un resultado. ¿Por qué en
La introducción de la probabilidad en la física 149
tonces habrían nuestras probabilidades de obedecer las leyes están
dar de la teoría de la probabilidad? Qué deberían obedecer estas le
yes es un resultado bastante trivial desde el punto de vista frecuentis-
ta, pero el subjetivista necesita un argumento por el que deberían.
Algunos argumentos están diseñados para mostrar que sólo en el
caso de que nuestras probabilidades obedezcan las reglas estándar
nos veremos libres de caer en una situación donde un corredor de
apuestas nos ofrece apuestas que aceptamos, pese a garantizar una
pérdida por nuestra parte con independencia de cómo resulten las
cosas. Otro enfoque intenta mostrar que si las preferencias de alguien
por «billetes de lotería» (obtienes A si x ocurre y B si x no ocurre),
como revela la elección de un billete antes que otro, son racionales
en el sentido de que si el billete 1 se prefiere al billete 2 y el 2 al 3,
entonces el uno se prefiere al 3, siempre habrá una forma de repre
sentar nuestras creencias parciales en los resultados que obedecerá
entonces los axiomas estándar de probabilidad.
Por consiguiente, para el objetivista, las probabilidades son carac
terísticas del mundo esperando a ser descubiertas. Para el «subjetivis
ta», son grados de la creencia parcial de un agente que guían sus ac
ciones y creencias en un mundo incierto. Pero, ¿qué probabilidades
debería el agente racional atribuir a los sucesos? Los argumentos que
acabamos de esbozar están diseñados para demostrar que con inde
pendencia de las probabilidades que se elijan, éstas deben satisfacer
conjuntamente los axiomas estándar de la probabilidad. Pero ¿hay al
guna otra restricción sobre la racionalidad probabilística?
Un conjunto de argumentos está diseñado para describir y justifi
car un procedimiento capaz de modificar las propias probabilidades
subjetivas a la luz de nueva evidencia. Un teorema fundamental de la
teoría de la probabilidad, el Teorema de Bayes, relaciona la probabi
lidad de una hipótesis sobre la base de evidencia (una probabilidad
condicionada) con la probabilidad condicionada de la evidencia, su
puesta la verdad de la hipótesis y la probabilidad inicial de que la hi
pótesis sea verdadera. Supongamos que consideramos que, después
de presentada la evidencia, deberíamos adoptar como nuestra nueva
probabilidad para la verdad de la hipótesis su vieja probabilidad con
dicionada a la evidencia. Tenemos entonces una forma de cambiar
nuestras probabilidades a la luz de nueva evidencia que es «conser
vadora». Comporta los mínimos cambios concebibles en nuestras
probabilidades anteriores. Y las nuevas probabilidades se ajustarán,
150 Filosofía de la física
como las viejas, a los axiomas de la teoría de la probabilidad. Este
proceso de modificación de la probabilidad a la luz de la evidencia
se conoce como condicionamiento. Puede ser generalizado para en
globar casos en los que la nueva evidencia no se conoce como cierta,
sino que lleva asignada solamente una probabilidad. Alguien que si
guiera este procedimiento podría, por ejemplo, partir de la suposi
ción de que una moneda, que podría estar sesgada, tiene probabili
dad un medio de dar cara. A medida que se sumen nuevos
lanzamientos de moneda, el agente modificará la probabilidad a la
luz de los resultados observados. Una partida dominada por las
caras, por ejemplo, inducirá al agente a aumentar su estimación de la
probabilidad que tiene la moneda de dar caras. De nuevo, pueden
darse argumentos a favor de que lo razonable es la modificación de
las probabilidades de uno por condicionamiento. Algunos de estqf
argumentos son del tipo de los que se utilizaban para intentar con
vencernos de que era razonable que nuestras probabilidades se con
formasen a los axiomas usuales.
Más arriba indiqué que al obtener nuevas probabilidades para las
hipótesis a la luz de la evidencia, uno se apoyaba en las probabilida
des iniciales de la verdad para las hipótesis en cuestión. Así pues, ¿no
se debería comenzar con alguna plausibilidad «intrínseca» para las
hipótesis, sus así denominadas probabilidades a priori? ¿De dónde
podrían éstas proceder? Algunos han defendido que deberíamos dar
cabida a hipótesis probabilísticas en nuestro cuerpo de creencias
aceptadas sólo sobre la base de frecuencias observadas como eviden
cia. Más frecuentemente se alega que las hipótesis pueden tener pro
babilidades intrínsecas generadas con independencia de las frecuen
cias observadas. De hecho, dichas probabilidades a priori fueron el
objeto de estudio de los primeros trabajos en teoría de la probabili
dad en los siglos xv ii y xvm. En el lanzamiento de una moneda hay
dos sucesos posibles «simétricos», cara y cruz. ¿No parece entonces
razonable suponer inicialmente que la probabilidad de cada uno de
ellos es un medio? En el lanzamiento de un dado hay seis caras simé
tricas. ¿No deberíamos entonces, si no hay evidencia de sesgos, atri
buir la probabilidad de un sexto a cada suceso consistente en apare
cer una cara específica en la parte superior del dado? Podemos, pues,
intentar obtener las probabilidades a priori dividiendo los sucesos en
casos simétricos y atribuyendo la misma probabilidad a cada uno.
Éste es el famoso Principio de Indiferencia.
La introducción de la probabilidad en la física 151
Los filósofos posteriores formalizaron estas nociones y las genera
lizaron. Si elegimos un lenguaje en el que describir el mundo, pode
mos encontrar varias formas de clasificar las posibilidades del mun
do, según su descripción en este lenguaje, en posibilidades simétricas.
La probabilidad inicial se distribuye entonces sobre las posibilidades
de un modo intuitivo y simétrico. Así, una vez obtenidas en esta for
ma las propias probabilidades a priori «racionales», uno podría modi
ficarlas a la vista de la evidencia experimental (especialmente de la
evidencia sobre las frecuencias efectivamente observadas de los suce
sos) usando el proceso de condicionamiento descrito más arriba. Los
métodos inventados fueron vistos por algunos como una generaliza
ción de la teoría formal de \x deducción, porque tenían en cuenta la
definición de un tipo de «nexo lógico parcial» entre las proposicio
nes, esto es, la idea de que una proposición puede sustentar lógica
mente a otra hasta cierto grado. Así, los sistemas formales recibieron
el nombre de lógicas inductivas.
Hace tiempo que se advirtió que estas técnicas se ven afectadas
por dificultades cuando el Principio de Indiferencia es sometido a
análisis y crítica. Todas ellas descansan en una división de los sucesos
posibles en casos simétricos. Pero la idea tras dicha división no siem
pre está clara. Podemos decir, claro está, que el dado puede dar un
uno, un dos, etc., sumando un total de seis casos. Pero también pode
mos decir que el dado puede dar un uno o ningún uno en su cara
superior, lo cual hace dos casos. Entonces, ¿por qué no asignar a
«aparecer un uno» una probabilidad de un medio? En otros casos, la
necesidad de alguna forma basada en principios para elegir cómo ser
«indiferente» se hace más clara. Imaginemos un vaso construido de
forma tal que el volumen ocupado no sea proporcional al área de la
superficie humedecida del interior del vaso (fácil de hacer si se
toman curvos los lados del vaso). Sin tener idea de cuán lleno está el
vaso ¿supondríamos, usando el Principio de Indiferencia, que está
medio lleno? O ¿supondríamos, con igual justificación, que la mitad
de su interior está húmeda? Las dos suposiciones son incompatibles
entre sí, pero ambas parecen igualmente justificadas, a priori, por
puras consideraciones de simetría.
Más adelante en este capítulo exploraremos cómo se utiliza la
probabilidad en mecánica estadística, el primer dominio de la física
en el que jugó un papel fundamental. Veremos que las controversias
entre los filósofos acerca de la naturaleza de la probabilidad y las
112 Filosofía de la física
controversias sobre el origen y la justificación de las asignaciones de
probabilidad inicial son cruciales cuando uno está intentando enten
der sencillamente cómo debería introducirse la probabilidad en la fí
sica. Como veremos, varios descubrimientos físicos no sólo arrojan
luz sobre las cuestiones filosóficas, sino también revelan cuestiones
adicionales que complican aun más la situación del problema filosó
fico.
Explicación estadística: explicación, ley y causaDeseamos no sólo describir el mundo tal como lo encontramos, sino
explicar también lo que acontece en el mundo. Explicar, creemos, es
responder a la cuestión de por qué ocurre lo que ocurre, y no sólo
describir qué es lo que de hecho ocurre. Pero ¿qué significa respon
der a un por qué? Y ¿qué significa dar una explicación de un fenó
meno?
La noción intuitiva de una causa ha jugado un papel en las tenta
tivas de analizar el concepto de explicaciones en la ciencia desde el
momento mismo en que la idea de aportar un tal análisis se le ocu
rrió por vez primera a un filósofo. Explicar un suceso es indicar su
causa y explicar una clase de sucesos es suministrar la clase o tipo de
causa que los produce.
En un temprano análisis de la causalidad, Aristóteles distinguió
entre la materia en la que ocurría un cambio, la naturaleza del cam
bio, la finalidad o propósito del cambio, y el generador directo del
cambio, como cuatro clases diferentes de causas. Las designó con los
calificativos de causas materiales, formales, finales y eficientes. El ma
terial y las propiedades implicadas no se consideran aquí como cau
sas de un proceso, sino como constituyentes del cambio que se pre
tende explicar. La cuestión de las causas finales — metas, o
propósitos— sigue todavía suscitando mucha discusión. En la activi
dad intencional de un agente, quizá en biología (en la forma de expli
caciones funcionales de un órgano, por ejemplo), y en las ciencias so
ciales, algo como la idea aristotélica de que indicar un objetivo, o
propósito, es explicativo, sigue pareciendo atractivo. Ni siquiera en la
física está claro que no haya espacio en absoluto para las «causas
finales». Explicaciones de la trayectoria de la luz como aquella que
toma el menor tiempo se alega algunas veces que son finales por na
La introducción de la probabilidad en la física 153
turaleza. Y en la termodinámica (que expondremos más adelante en
este capítulo), el explicar un proceso en términos de un sistema que
tiende a un estado de equilibrio como un «objetivo» se ha alegado
que es una explicación que utiliza la noción de «causa final».
Pero cuando un científico contemporáneo piensa en causas, él o
ella piensa normalmente en causas eficientes, los sucesos que «oca
sionan» la ocurrencia del suceso a explicar. Pero ¿qué significa expli
car un suceso demostrando su causa eficiente? La idea intuitiva pare
ce ser que un suceso es explicado cuando se descubre un suceso
anterior que «hace necesaria» la ocurrencia del suceso en cuestión.
Cerrar el interruptor hace que la luz se encienda, empujar el objeto
hace que se acelere, etcétera. Pero ¿cuál es la naturaleza de esta de
terminación o «hacer», por la que es apropiado describir la causa
como lo que hace suceder el efecto o suceso explicado?
En un merecidamente famoso examen crítico de la noción de
causalidad, David Hume argüyó que sería un error concebir las rela
ciones causales como fundadas en algún «nexo causal» especial o
«conexión necesaria» entre los sucesos en el mundo. Antes bien, ar
güyó, lo que encontramos en el mundo cuando examinamos sucesos
relacionados como causa y efecto es, ante todo, una relación espacio-
temporal entre los sucesos, en la que los sucesos están en contacto
espacio-temporal, pero de forma que el suceso causa precede al suce
so efecto en el tiempo. También encontramos a los sucesos conteni
dos en una clase de pares de sucesos del mismo tipo que siempre es
tán acompañados uno por el otro. Esto es, el suceso 1 causa el
suceso 2 si, y sólo si, tienen la correcta relación espacio-temporal y si,
y sólo si, los sucesos de tipo 1 son siempre seguidos por los de tipo 2
y los de tipo 2 están siempre precedidos por los de tipo 1. Mientras
creemos poder explicar esta «conjunción constante» de los tipos de
sucesos diciendo que los sucesos de tipo 1 «causan» los sucesos de
tipo 2, en realidad, cuando hablamos de causalidad, estamos sólo re-
describiendo esa conjunción constante según Hume.
La cuestión no es tan simple para Hume, puesto que pregunta de
dónde sacamos la idea de que el suceso causa «hace necesario» el su
ceso efecto. Su comprensión de esto es que la necesidad no es reflejo
de una relación real entre los sucesos en el mundo sino, antes bien,
una proyección sobre el mundo de un fenómeno psicológico. Al ver
sucesos de tipo 1 acompañados siempre por sucesos de tipo 2, nos
acostumbramos a que los sucesos del primer tipo sean siempre segui
154 Filosofía de la física
dos por sucesos del segundo tipo. Así, cuando experimentamos un
suceso del primer tipo, nuestra mente inmediatamente salta a la ex
pectativa de que un suceso del segundo tipo ocurrirá. Esta expecta
ción, fundada en «la costumbre o el hábito», constituye el origen de
nuestra idea de que el primer tipo de sucesos hace necesario el se
gundo tipo de sucesos. Pero, afirma Hume, esto es cuestión de nues
tra psicología. Todo lo que hay en el mundo de los sucesos mismos
son las relaciones espacio-temporales de «contigüidad y precedencia»
y la conjunción constante de los sucesos de los tipos en cuestión.
Intimamente asociado a este análisis humeano de la causalidad
se encuentra un modelo de explicación científica denominado el
modelo deductivo-nomológico (aunque uno podría adoptar este
modelo sin ser un humeano). En él se arguye que explicar un suce
so es demostrar que el enunciado de la ocurrencia del suceso en
cuestión podría deducirse lógicamente de los enunciados de la ocu
rrencia de otros sucesos normalmente anteriores, si, además de la
descripción de esos sucesos explicativos, uno utilizase proposicio
nes de las «leyes de la naturaleza» conectando los distintos tipos de
sucesos. Para un humeano, estas leyes son solamente los enunciados
generales de las conjunciones constantes de los tipos relevantes de
sucesos.
Los proponentes de este modelo de explicación científica diri
gen nuestra atención a la íntima relación que existe entre la explica
ción que ellos han elaborado y los objetivos de predicción y control
compartidos por la mayoría de los agentes humanos. Si somos
capaces de explicar un cierto tipo de sucesos, entonces tenemos a
nuestra disposición las generalizaciones legales que conectan sucesos
de un tipo con otros tipos de sucesos utilizados en la explicación. Si
en otras circunstancias, pues, sabemos qué tipos de sucesos «causa»
han ocurrido, podemos, utilizando las generalizaciones descubiertas
en nuestra búsqueda de explicaciones deductivo-nomológicas, pre
decir qué sucesos ocurrirán. O podríamos, manipulando la ocurren
cia del tipo correcto de sucesos «causantes», controlar el mundo de
terminando qué tipos de sucesos manipulables ocasionarán (o
impedirán) sucesos del tipo que queremos que ocurran. Una vez
más, las conexiones entre los tipos apropiados de sucesos se revelan
en los enunciados de las leyes generales descubiertas en la búsqueda
de explicaciones.
Como veremos, algunas personas objetan que el modelo consis
La introducción de la probabilidad en la física 155
tente en deducir una descripción de un suceso a partir de las des
cripciones de otros sucesos y de enunciados generales de leyes, exige
demasiado de una explicación. Otrqs dicen que exige demasiado
poco. Un problema importante está conectado de nuevo a la noción
de causalidad. Si los sucesos explicativos y explicados no tienen la re
lación causal correcta, se arguye, las conexiones entre sus descripcio
nes no constituyen explicaciones, aun cuando se satisfagan las condi
ciones del modelo deductivo de explicación. Podríamos deducir la
posición de un planeta ayer a partir de las leyes de la dinámica y de
su posición y velocidad hoy, pero eso no explica por qué tenía la posi
ción que tenía ayer, se dice, ya que el pasado explica el futuro pero
no al contrario. Y esto es así,, se dice, porque la causalidad va en la
dirección del pasado al futuro. Explicar, se afirma, es desvelar las
causas. De nuevo, dos sucesos podrían estar correlacionados median
te una ley porque son el efecto común de un tercer suceso que es su
causa común. Los dos sucesos no se explican, pues, uno al otro, aun
que ambos son explicados por la causa común. Si una infección bac
terial provoca a la vez un sarpullido y una hinchazón, se dice, ni el
sarpullido explica la hinchazón, ni la hinchazón el sarpullido. Antes
bien, ambos son explicados por su causa, la infección bacteriana. Pero,
¿qué otro elemento adicional se necesita para la explicación además
de la conjunción constante?
Explicaciones que invocan la probabilidadMuchos de los que piensan que el modelo deductivo de explicación
exige demasiado aluden a explicaciones históricas. Aquí parecemos
aceptar descripciones explicativas que no hacen uso alguno de gene
ralizaciones legales. Después de todo, ¿cuáles son las leyes que go
biernan los sucesos históricos? Más interesantes para nosotros son
esas explicaciones en las que los sucesos están conectados por gene
ralizaciones, pero donde las generalizaciones no son leyes de la natu
raleza de pleno derecho, sino conexiones probabilísticas o estadísti
cas entre los sucesos. El fumar no siempre causa cáncer de pulmón,
pero ciertamente aumenta su probabilidad. ¿No damos, entonces,
una explicación al menos del cáncer de pulmón de alguien, si señala
mos su vicio de fumar, aun cuando el fumar no comporte la necesi
dad de contraer la enfermedad? ¿Qué clase de relación probabilística
156 Filosofía de la física
entre suceso explicativo y explicado es suficiente para poder decir
que el primero explica el segundo?
Un primer pensamiento natural es que un suceso es explicado si
podemos encontrar otros sucesos tales que la ocurrencia del suceso
en cuestión se siga con alta probabilidad de la ocurrencia de los su
cesos explicativos. El «seguirse de» es mediado por la existencia de
generalizaciones estadísticas legales que ocupan el lugar de las leyes
sin excepción utilizadas en las explicaciones deductivo-nomológicas.
Nos percatamos de inmediato de que tal «explicación estadística»
de un suceso será muy diferente de la explicación que se obtiene
cuando se utilizan leyes puras. Por ejemplo, en el caso deductivo, si
podemos explicar el suceso 1 y podemos explicar el suceso 2, pode
mos generar automáticamente una explicación del «suceso 1 ocurrió
y el suceso 2 ocurrió» juntando simplemente los recursos explicati
vos utilizados para explicar cada suceso individual. Pero si el suceso
1 se sigue de alguna base explicativa con «alta probabilidad», es de
cir, con una probabilidad mayor que alguna cantidad especificada, y
el suceso 2 se sigue de su base explicativa con parecida probabili
dad, eso no garantiza que «el suceso 1 y el suceso 2» se sigan de las
bases explicativas conjuntas con una probabilidad superior al valor
mínimo.
Es más, un suceso que tenga una probabilidad alta respecto a su
base explicativa, podría tener una probabilidad baja respecto a esa
base complementada con información adicional. Aunque podamos
decir que es altamente probable que alguien criado en un entorno
horrible tenga tendencias criminales, cuando nos digan, además, que
es el hijo de una familia rica, etcétera, reduciremos la probabilidad
estimada. Esto no puede suceder con sucesos explicados deductiva-
nomológicamente.
Pronto pensamos en casos donde presentimos que un suceso
puede ser explicado probabilísticamente aun cuando no tenga una
alta probabilidad en relación a lo que se propone como explicación.
La combustión de algo que arde espontáneamente se explica dicien
do que algunas veces, aunque muy raramente, dicho fenómeno tiene
lugar en la situación pertinente. ¿Cómo podemos explicar un suceso
haciendo referencia a hechos respecto a los que presenta una proba
bilidad baja? Se señala que sin los hechos explicativos, el suceso en
cuestión tendría una probabilidad aún más baja. Así podemos expli
car porqué algo sucede aludiendo a hechos que lo hacen más proba
La introducción de la probabilidad en la física 157
ble de lo que sería de otra forma, aun cuando después de añadir los
hechos explicativos, su probabilidad siga siendo baja.
Después se observa que hay muchos casos en los que explicamos
un suceso haciendo referencia a otro suceso, aun cuando aportando
la nueva información disminuyamos la probabilidad del suceso en re
lación a nuestro conocimiento de fondo. Un médico explica la muer
te de un paciente del que se sabe que padece una terrible enferme
dad señalando que, en este caso particular, fue el efecto secundario,
muy improbable, de un medicamento lo que mató al paciente, no la
enfermedad. La causa de la muerte puede ser el medicamento, aun
que la muerte por enfermedad, tratada o no tratada, sea mucho más
probable que la muerte producida por el efecto secundario del1 medi
camento.
Podemos combinar estas observaciones con otras similares a las
aducidas cuando quienes discuten una explicación deductivo-nomo-
lógica arguyen que, en la teoría de la explicación que entiende como
tal la inclusión bajo una generalidad, falta el elemento causal. Obte
nemos así una teoría que dice que explicar, tanto probabilísticamente
como por medio de leyes sin excepción, es indicar el origen causal
de un suceso. Pero ahora la causalidad se entiende como una rela
ción que admite una conexión probabilística. Aquí la idea es que un
suceso podría causar un número de sucesos diferentes, cada uno con
una probabilidad determinada de ser causado. Aunque una causa
pueda generar una multiplicidad de efectos, es todavía una relación
causal lo que produce el suceso efecto como consecuencia del suce
so causa. Mirando las cosas de esta manera, puede que se haga justi
cia a los casos arriba mencionados. También servirá para distinguir
las correlaciones que no son explicativas, siendo no causales, de
aquellas que son explicativas, siendo verdaderamente causales aun
que probabilísticas.
Pero aquí surgen otras cuestiones interesantes. Si damos una ex
plicación probabilística que es causal, ¿estamos obligados entonces a
mantener que hay relaciones causales irreduciblemente probabilísti
cas en el mundo? ¿Debemos afirmar que el mundo tiene, en su base,
una naturaleza genuinamente «tiquista», o azarosa, no sostenida por
relaciones causales completamente deterministas? No necesariamen
te. Algunos han argüido que puede haber explicaciones probabilísti-
co-causales que expliquen un suceso como el resultado «por puro
azar» (aunque un resultado causal) de algunos sucesos anteriores que
158 Filosofía de la física
presentan una disposición causal a generar sucesos del tipo que ha
de explicarse. En otros casos, la explicación probabilística, relevando
una vez más una estructura causal, puede ser explicativa al estar la
relación causal probabilística fundada en algunas relaciones causales
subyacentes enteramente deterministas. Veremos una defensa de este
punto de vista más adelante en este capítulo. En esta segunda clase
de explicación, el estado posterior de un sistema está completamente
determinado por su estado dinámico anterior. Pero, se arguye, mu
chos estados dinámicos iniciales son posibles candidatos consistentes
con la descripción inicial del sistema. Cada uno de dichos estados
iniciales conduce a un resultado futuro diferente. Cada evolución es
totalmente determinista. En este caso, la probabilidad se introduce
en la imagen explicativa cuando comenzamos a hablar sobre la «pro
babilidad de un estado dinámico inicial dado» consistente con la
descripción inicial del sistema. Así pues, tendremos elementos proba-
bilísticos en nuestra estructura explicativa. La estructura explicativa
descansará en el desvelamiento de los procesos causales subyacentes
que generan los sucesos que han de explicarse. Pero la probabilidad
se introducirá, no porque la relación causal sea «intrínsecamente
aleatoria», sino porque se están explorando simultáneamente muchas
posibles evoluciones causales diferentes. Más tarde, cuando discuta
mos la mecánica cuántica en el capítulo 4, veremos porqué tiene al
guna plausibilidad la afirmación de que en ese contexto se debe pos
tular una causalidad verdaderamente «incierta».
Desde esta perspectiva, pues, las demandas de una probabilidad
alta o aumentada parecen descaminadas. Lo que estamos intentando
hacer cuando explicamos probabilísticamente un suceso es ubicar di
cho suceso en una estructura de relaciones causales, donde la estruc
tura revelada es probabilística, bien porque las relaciones causales
son intrínsecamente indeterministas, bien porque se están conside
rando simultáneamente un número de evoluciones causales alternati
vas. Aun cuando el suceso considerado tenga una probabilidad baja,
o una probabilidad reducida, en la cadena de causalidad que condu
ce hasta él, podemos todavía dar una explicación del mismo. Por su
puesto,'esto no significa negar valor a la aliviadora sorpresa de mos
trar que un suceso es altamente probable, o de mostrar que es más
probable de lo que habríamos esperado de otro modo. Hacemos
estas cosas y las consideramos, en algún sentido, como suministrando
explicaciones.
La introducción de la probabilidad en la física 159
¿Significa toda la importancia concedida a la revelación de una
relación causal en la explicación que estamos dando la espalda a una
teoría humeana de lo que es para una cosa ser la causa de otra? No
necesariamente. Algunos afirmarían que como las explicaciones exi
gen que se haga referencia a relaciones causales entre los sucesos,
debemos presuponer la noción de una relación causal como un ele
mento primitivo en nuestro entendimiento de la naturaleza del mun
do. Otros buscan un entendimiento de lo que es la relación causal en
términos de otras relaciones que los sucesos presentan entre sí. Un
enfoque, ya presente en Hume en algunos lugares, es intentar enten
der la causalidad en términos de «lo que ocurriría» en el mundo si
las cosas fuesen diferentes a como son. Así, podría concebirse como
causa un suceso tal que, de no haber ocurrido, no habría ocurrido el
suceso efecto. En realidad, no es tan simple. Fenómenos tales como
la sobredeterminación (un efecto es múltiplemente causado) y la ante
posición (una cosa es causada por un suceso que, de no haber ocurri
do, habría dado pie a que un segundo suceso hubiera provocado el
efecto; siendo el primer suceso tal que obstaculizó la ocurrencia del
segundo suceso) requieren un análisis más sofisticado de la relación
entre «lo que hubiese ocurrido si» y lo que significa que un suceso
cause otro. Otros problemas adicionales surgen debido a conexiones
no causales que también están asociadas con dicho «lo que habría su
cedido». Por si fuera poco buscamos además un entendimiento de lo
que significa justamente ese discurso sobre lo que habría sucedido si
las cosas hubieran sido de otro modo, un entendimiento que de suyo
no descansa en la presuposición de una relación causal implícita.
Otros enfoques que analizan la causalidad recurren a la combina
ción de la conjunción constante de Hume con otros elementos reales
en el mundo. A menudo se recalca, por ejemplo, que la estructura
del mundo es tal que identificamos una conjunción constante como
una relación causal sólo cuando los sucesos bajo consideración están
unidos uno a otro por caminos adecuadamente continuos de sucesos
en conjunción constante. Debe haber, entonces, caminos de «influen
cia causal» o «propagación causal».
Finalmente, es muy importante reflexionar sobre el hecho de que
las regularidades totalmente legales o sólo probabilísticas que utiliza
mos en nuestras explicaciones científicas forman una jerarquía unifi
cada de proposiciones en una estructura teórica. Algunas generaliza
ciones son mucho más amplias, más profundas, y más fundamentales
160 Filosofía de la física
que otras. Puede argüirse que la diferencia entre meras correlaciones
y correlaciones causales aptas como explicación es que las últimas in
sertan la correlación de los sucesos en cuestión en los niveles más
profundos de correlación de las teorías más fundamentales. Así, se
arguye, la referencia al hecho de que tenemos causalidad, y por con
siguiente explicación, sólo cuando se pone al descubierto el mecanismo de la correlación de los sucesos, puede tomarse como indicativo,
no ya de que pueda producirse alguna relación causal misteriosa ade
más de la correlación, sino de que una correlación es explicativa sólo
cuando inserta la relación entre los sucesos bajo consideración en las
correlaciones fundamentales de nuestra teoría básica apropiada. ¿No
podría algo como esto hacer comprensible el debate entre quienes
piensan que las correlaciones conocidas entre el fumar y el contraer
cáncer son suficientes para afirmar que el fumar causa cáncer, y quie
nes lo niegan? ¿No están los últimos exigiendo causalidad como ex
plicación en el sentido de insertar la correlación entre el fumar y la
enfermedad en un contexto mucho más amplio y profundo? Tanto la
biología, como la química y la física son utilizadas para complemen
tar la manifiesta correlación con correlaciones mucho más finas fun
dadas en las leyes, mucho más profundas, de la ciencia. Detalles tales
como las correlaciones entre la inhalación de productos químicos,
estando la presencia de estos productos correlacionada a los cambios
genéticos, y siendo estos cambios seguidos en sus pormenores por
medio de las correlaciones más profundas de toda la física —que
muestran lo que sucede en el nivel molecular— son dados por estas
ciencias. Desde esta perspectiva, pues, la demanda de causalidad en
la explicación está garantizada, pero por razones básicamente hu-
meanas.
Este último aspecto del papel de la causalidad en la explicación
es particularmente relevante para nuestros propósitos presentes. Con
forme nos adentremos en los pormenores del papel de la probabili
dad en la teoría de la mecánica estadística, veremos que lo. que ahí
sucede es que una teoría «a nivel de superficie» del comportamiento
macroscópico, la termodinámica, se relaciona en un modo explicati
vo con una teoría dinámica «a nivel profundo». Esta teoría a nivel
profundo es la teoría del comportamiento de los sistemas fundada en
las leyes fundamentales de la dinámica de los componentes microscó
picos de los sistemas macroscópicos (tales como las moléculas de un
gas). Las consideraciones probabilísticas surgen cuando intentamos
La introducción de la probabilidad en la física 161
acoplar uno al otro estos dos niveles de descripción, utilizando la
teoría de nivel profundo para explicar la teoría de superficie. Se pre
supone, pues, que podemos dar una descripción causal de la evolu
ción del sistema en términos de la dinámica de sus constituyentes mi
croscópicos. Este es el nivel amplio, profundo y fundamental de la
descripción científica indicado más arriba. La probabilidad juega un
papel al insertar la descripción del sistema forjada en los términos
del nivel superior en esta imagen causal global. Como veremos, la re
lación entre correlación y causalidad introduce aquí sus propios enig
mas particulares.
Explicación y reducciónNuestra discusión ha procedido como si los acontecimientos indivi
duales fueran los objetos primarios del entendimiento científico, esto
es, como si lo que quisiéramos explicar fuesen sucesos particulares.
En ciencia es más habitual, sin embargo, el entendimiento de las ge
neralizaciones, leyes o correlaciones probabilísticas, que estamos bus
cando. ¿Cómo podemos ampliar nuestro entendimiento de las gene
ralizaciones legales? ¿Cómo podemos explicarlas?
La idea principal es que las generalizaciones, ya sean legales o es
tadísticas, se explican en función de generalizaciones más amplias,
más profundas o más fundamentales. Nuestras leyes forman una je
rarquía que abarca desde generalizaciones parcas, de superficie
(como la Ley de Snell de la refracción en óptica o la Ley de Ohm en
la electricidad), hasta las leyes extremadamente generales y profundas
de nuestras teorías físicas fundamentales. Explicamos leyes de un or
den inferior mostrando que se siguen de las leyes de un orden supe
rior. Las leyes de niveles inferiores puede que sólo sean válidas en
ciertas circunstancias especiales bien definibles (esto es, cuando la si
tuación posee las condiciones especiales apropiadas). Explicamos la
óptica geométrica mostrando que se sigue de la óptica física (ondula
toria), explicamos la óptica física como una consecuencia de la teoría
electromagnética, explicamos el electromagnetismo como un compo
nente del campo electrodébil descrito por la teoría cuántica de cam
pos, etcétera.
Generalmente, la idea es que las leyes más superficiales son expli
cadas mediante su derivación de leyes del tipo más general y funda
162 Filosofía de la física
mental. Pero las cosas son, en realidad, mucho más complicadas que
eso. Una afirmación habitual es que a menudo se encuentra que las
leyes más de superficie, una vez explicadas, no son realmente verda
deras. Con frecuencia son sólo buenas aproximaciones a la verdad y
eso sólo en ciertas circunstancias. Así, una vez comprendida la teoría
ondulatoria de la luz, nos percatamos de que la óptica geométrica
sólo es válida cuando la longitud de onda de la luz es pequeña com
parada con las dimensiones de los objetos físicos situados en la tra
yectoria de la luz. El hacer aquí rigurosa la noción de aproximación
no es una tarea fácil.
Más problemáticas son las cuestiones que surgen cuando las le
yes y las generalizaciones estadísticas menos profundas que se pre
tende explicar se han forjado en conceptos diferentes a los utilizados
en la gestación de los principios más profundos. Esto ocurre cuando
una teoría menos profunda es reducida a una teoría más profunda,
siendo necesario establecer una conexión entre los conceptos, a ve
ces bastante diferentes, de las dos teorías. Mientras la biología habla
de organismos y células, por ejemplo, la química molecular habla de
moléculas, gradientes de concentración, etcétera. ¿Cómo se relacio
nan las células, por ejemplo, con sus constituyentes microscópicos?
Aquí la respuesta parece clara, a saber, que las células están formadas
por moléculas, pero esto necesita ser completamente aclarado.
En el caso del que nos ocuparemos en este capítulo, esta cone
xión interteórica es aun más problemática. La teoría reducida que
describiré, la termodinámica, trata de características del mundo
como la temperatura, la cantidad de calor y la entropía. Pero la teoría
explicativa — reductora— se ocupa de los sistemas desde el punto de
vista de su construcción a partir de constituyentes microscópicos ta
les como moléculas. Aunque los objetos macroscópicos estén cons
truidos a partir de componentes microscópicos, el relacionar las pro
piedades de los sistemas que han sido utilizadas para caracterizarlos
en el nivel explicativo (temperatura y entropía, por ejemplo) con las
propiedades de los sistemas (el número de sus constituyentes micros
cópicos y el espacio en el que se encuentran confinados, por ejem
plo) y las propiedades de los propios constituyentes microscópicos
(su momento, energía, masa y tamaño, por ejemplo) es una cuestión
sutil y compleja.
Esto resulta doblemente difícil por la curiosa interacción entre
las leyes globales y las generalizaciones estadísticas en el esquema ex
La introducción de la probabilidad en la física 163
plicativo. Las leyes a explicar parecen tener inicialmente el estatus de
leyes sin excepción. Pero el hecho mismo de explicarlas arroja ciertas
dudas sobre esta suposición. En el nivel explicativo más profundo se
encuentran las leyes fundamentales de la dinámica de los constitu
yentes microscópicos. Estas son, de nuevo, leyes de pleno derecho,
aunque en la versión de la mecánica estadística que adopta la diná
mica cuántica como su teoría dinámica fundamental, estas leyes po
seen en germen, como veremos en el capítulo 4, un elemento funda
mentalmente estadístico. Lo que es importante por el momento es
observar que entre las leyes dinámicas fundamentales de los micro-
constituyentes, y las leyes explicadas de la teoría que se quiere redu
cir, encontramos generalizaciones que introducen elementos probabi-
lísticos o estadísticos en la imagen explicativa. Así, como veremos, a
menudo se alega que la dinámica fundamental explica el comporta
miento térmico en el nivel macroscópico presentándolo tan sólo
como el comportamiento ostensiblemente más probable o, en otros
casos, como el comportamiento medio que ha de esperarse.
Cuando uno intenta entender la mecánica estadística, las cuestio
nes más importantes e interesantes aparecen precisamente en este
punto. ¿Cómo están las generalizaciones estadísticas que forman los
postulados centrales de la teoría relacionadas, de un lado, con las le
yes dinámicas fundamentales que gobiernan a los constituyentes mi
croscópicos del sistema bajo consideración y, del otro lado, con las
leyes que gobiernan el comportamiento macroscópico de los sistemas
según su caracterización por los conceptos de la física térmica tradi
cional? La explicación del comportamiento en el nivel macroscópico
debe realizarse sobre la base de su entendimiento como una conse
cuencia de la constitución del sistema macroscópico a partir de sus
partes microscópicas y de las leyes fundamentales que gobiernan la
dinámica de esas partes. ¿Qué tipo de explicación será ésta? Como
veremos, se trata de un esquema explicativo que incorpora, en un ni
vel intermedio, nociones fundamentalmente probabilísticas y estadís
ticas.
Pero ¿en qué se fundamenta la introducción de estos postulados y
suposiciones probabilísticas adicionales? ¿Pueden ser derivados a
partir de la dinámica fundamental por sí misma? ¿O se necesitan
otros postulados fundamentales para introducirlos en la física? Esta
cuestión es muy difícil y compleja. Y es muy importante. Pues de la
respuesta que se dé a esta cuestión se seguirá justamente el tipo de
164 Filosofía de la física
explicación de los fenómenos macroscópicos que está proporcionan
do la física. Aunque hay casos en los que puede decirse que la gene
ralización en el nivel inferior es explicada por la teoría más funda
mental mediante la derivación de la primera a partir de la segunda,
con, presumiblemente, algunas nociones de aproximación intercala
das, en el caso de la mecánica estadística hay elementos importantes
que juegan un papel en la derivación; éstos son muy diferentes de los
elementos habituales de los modelos filosóficos estándar de la expli
cación estadística de las generalizaciones.
De la termodinámica a la mecánica estadística
TermodinámicaEl fenómeno del calor nos es familiar por nuestra experiencia diaria,
por lo que no es sorprendente que la física intentase entenderlo. Las
primeras tentativas incluyeron el desarrollo de dispositivos tales
como el termómetro diseñados para reemplazar por medidas numéri
cas precisas las impresiones subjetivas de calor y frío que experimen
tamos. Con no poco esfuerzo intelectual se hizo la distinción entre
grado de temperatura y cantidad de calor, siendo lo primero una
cantidad «intensiva» y lo segundo «extensiva». Esto es análogo a la
distinción entre densidad y cantidad de materia respectivamente. Así,
cuando a una cantidad de agua fría se añade una menor cantidad de
agua a una temperatura mayor se obtendrá la misma temperatura
final de la mezcla que cuando se añade una mayor cantidad de agua
a una menor temperatura, de manera que uno podría afirmar que en
los dos casos se añadió la misma cantidad de calor aunque las tempe
raturas fuesen diferentes.
Las primeras tentativas de entender estos resultados considera
ron el calor como un tipo de sustancia o materia, llamada calórico, y
la temperatura como un tipo de medida de la densidad del calórico
en la materia. Cuanto más calórico hubiese en una porción dada de
materia ordinaria, mayor sería la temperatura. Semejante concepción
substantivista hace justicia a muchos resultados experimentales cuan
do se introduce un principio de «conservación del calórico». Pero
hay otros resultados, en particular, la generación de nuevo calor por
acción mecánica o la conversión de calor en acción mecánica (como
La introducción de la probabilidad en la física 165
en una máquina de vapor alimentada por calor), que no encajan bien
en la concepción del calórico. Ya en un estadio muy temprano, algu
nos pensadores imaginaron que el calor era una suerte de movimien
to de minúsculos componentes del sistema, demasiado pequeños
para ser detectados por los procedimientos ordinarios.
Antes aún de que la teoría del calor como movimiento interno
triunfase, se avanzó notablemente en la formalización de una teoría
del calor. La reflexión acerca de la experiencia de quienes trabajaban
con máquinas de calor condujo a S. Carnot a la importante observa
ción de que la cantidad de calor que podía ser convertida en trabajo
mecánico, incluso en el caso de una máquina perfectamente eficiente,
estaba limitada por la diferencia de temperatura entre el calor intro
ducido en el motor y el calor disipado en su tubo de escape. Esto
condujo inmediatamente a la idea de un cero absoluto de temperatu
ra, la temperatura del calor extraído de un motor que podía transfor
mar todo el calor introducido en trabajo mecánico útil. R. Clausius y
otros desarrollaron una teoría formal del calor a partir de las ideas de
Carnot.
Primero se observó que, si bien el trabajo mecánico y el calor
pueden ser transformados uno en el otro, su cantidad total es inva
riante. Ésta es la llamada Primera Ley de la Termodinámica. Des
pués, el hecho de que la obtención de trabajo útil a partir de calor
requiriese que el calor introducido en el motor estuviese a una ma
yor temperatura que el calor extraído, condujo, tras una brillante re
flexión, al principio general de irreversibilidad, la llamada Segunda
Ley de la Termodinámica. Hay muchas formulaciones sutiles de esta
ley. Una de ellas dice básicamente lo siguiente: Sea un sistema ener
géticamente aislado. Supongamos que algún calor en él se transforma
en trabajo mecánico. Supongamos que el sistema parte de un estado
dado. Entonces, al final del proceso no puede encontrarse en su
estado inicial. Podría suceder que al final del proceso hubiésemos
transformado el trabajo obtenido de nuevo en calor, pero el resulta
do neto del proceso entero será que, si bien el calor total es el mismo
que cuando comenzamos, estará ahora a una temperatura menor y,
por lo tanto, menos «dispuesto» a ser convertido en calor.
La noción de estado de equilibrio de un sistema deviene crucial.
Supongamos que un sistema está aislado energéticamente del resto
del mundo. Más tarde o más temprano alcanzará un estado macros
cópicamente invariable, su estado de equilibrio. Así, una barra de
166 Filosofía de la física
hierro caliente en un extremo y fría en el otro alcanza un estado uni
forme de temperatura intermedia. Un gas inicialmente en una parte
de una caja alcanza una condición de densidad uniforme en toda la
caja. Una ley «Cero» de la termodinámica nos pide considerar tres
sistemas A, B, C, cada uno en su estado de equilibrio, y donde A y B son tales que cuando se les pone en contacto energético, permanecen
en el mismo estado de equilibrio. Supongamos que lo mismo puede
decirse de B y C cuando se ponen en contacto. Entonces, A y C per
manecerán en sus estados de equilibrio originales cuando se ponen
en contacto. Podemos etiquetar la «comunalidad» de equilibrio en
los sistemas mediante su temperatura común. Finalmente, es necesa
rio introducir el novel concepto de entropía. La entropía sigue de
cerca la «utilidad» del calor para ser convertido en trabajo mecánico.
Mientras la cantidad de calor a una temperatura alta y a una baja pue
de ser la misma, la primera tiene una mayor utilidad como fuente de
trabajo mecánico. Se dice entonces que tiene una entropía menor. Si
llevamos un sistema de un estado de equilibrio a otro, la cantidad de
calor transferida y la cantidad de trabajo mecánico realizado podrán
diferir de un proceso a otro con los mismos estados finales. Pero el
cambio de entropía de un estado a otro será el mismo. Así, los
estados de equilibrio de un sistema tienen una temperatura absoluta
definida y tienen una entropía definida (salvo una constante arbitra
ria). Estas, junto a otras propiedades (como la presión y el volumen
de una parte del gas en equilibrio) mecánicas (o eléctricas, etc.), ca
racterizan completamente la naturaleza de los estados de equilibrio.
El resultado final es, pues, una elegante teoría formal del calor.
Los sistemas tienen estados de equilibrio. En la conversión de uno
de estos estados a otro puede generarse o absorberse trabajo mecáni
co. También puede transferirse energía sin realizarse ningún trabajo.
Esto se llama flujo de calor. Los estados de equilibrio se caracterizan
por su temperatura, de forma que el calor fluye sólo entre sistemas
con temperaturas que difieren unas de otras. La cantidad de trabajo
que se puede obtener en una transición de un estado de equilibrio a
otro depende de la temperatura de los estados. Sólo si el estado final
tiene un cero absoluto de temperatura, se habrá transformado todo
el calor disponible en trabajo mecánico. La transformación de calor
en trabajo es, en máquinas no ideales, irreversible: Esto es, tú no pue
des transformar calor en trabajo en un sistema aislado y hacer a con
tinuación algo más de forma que termines donde habías empezado
La introducción de la probabilidad en la física 167
con todo el calor tan disponible como al principio para hacer todavía
más trabajo. Puedes obtener trabajo a partir de calor y transformar
entonces el trabajo de nuevo en calor. Terminarás con la misma can
tidad de energía en forma de calor con la que empezaste, pero ya no
estará disponible en la misma forma para ser convertida en trabajo
mecánico. Los estados de equilibrio no tienen solamente propieda
des mecánicas como la presión y el volumen; también tienen una
temperatura determinada y una entropía determinada (o al menos
una entropía determinada en relación al valor asignado arbitraria
mente a un estado). La entropía de un estado indica la disponibilidad
de su energía de calor interno a ser convertida en trabajo, siendo una
baja entropía indicativa dg una alta disponibilidad. Las leyes básicas
de la teoría son la transitividad del equilibrio (la ley Cero), la Conser
vación de la Energía (la Primera Ley), y la Ley de Irreversibilidad (La
Segunda Ley). Algunas veces se añade una Tercera Ley, la imposibili
dad de alcanzar el cero absoluto.
La teoría cinética del calorPara algunos físicos, la teoría de los fenómenos térmicos que acaba
mos de esbozar era plenamente satisfactoria como una teoría autóno
ma fundamental de la física. No veían ninguna razón para reducirla en
alguna forma a una teoría más profunda, ni ninguna necesidad de dar
explicaciones en cuanto a porqué sus proposiciones básicas eran ver
daderas. Pero para otros, la teoría clamaba por una explicación más
profunda. ¿Qué era, en último término, el calor, esa cosa convertible
en, y a partir de energía mecánica? ¿Cuál era la característica de los
sistemas por la que éstos poseían una temperatura específica? ¿Porqué
existían los estados de equilibrio de los sistemas y porqué, admitiendo
que existiesen, tenían la estructura particular que mostraban tener? Y,
lo más importante de todo, ¿cuál era el origen de la extraña asimetría
en el tiempo del mundo, la asimetría revelada en el hecho de que los
sistemas fuera del equilibrio, dejados a su suerte, se movían uniforme
mente hacia la condición de equilibrio, siempre en la dirección futura
del tiempo, y una vez obtenido el equilibrio, permanecían en él?
Aunque la idea de que el calor era un tipo de energía en movi
miento de pequeños componentes del sistema macroscópico, compo
nentes tan pequeños que sus movimientos individuales no eran de-
I6K Filosofía de la física
tcctables directamente a gran escala, fue objeto de especulación por
F. Bacon, J. Bernoulli y otros, fue sólo en el siglo XIX cuando esta idea
logró imponerse. Pero, aun cuando el calor fuese movimiento, ¿qué
tipo de movimiento era? Los sistemas podían, después de todo, tener
una estructura microscópica muy compleja y sutil. Dos pensadores
británicos, J. Herepath y J. Waterston, sugirieron ambos que la situa
ción era muy simple para los gases. Estos estaban formados, dijeron
estos pensadores, por partículas minúsculas que pasaban la mayor
parte de su tiempo en movimiento libre, interaccionando sólo por
colisión unas con otras y con las paredes del recipiente. El contenido
de calor de un sistema era meramente la energía de este movimiento
de sus partes microscópicas. Pero sus sugerencias fueron ignoradas.
Finalmente, cuando estas ideas fueron expuestas por los físicos ale
manes A. Krónig y Clausius, obtuvieron la atención que merecían.
Supongamos un gas en una caja compuesto por partículas peque
ñas en su mayoría en movimiento libre. Si suponemos simplemente
que el calor es la energía total de este movimiento y que está distri
buido uniformemente entre las moléculas, entonces resultados tales
como la Ley de los Gases Ideales, que establece una relación entre la
presión, el volumen y la temperatura del gas en equilibrio, pueden
derivarse fácilmente. La presión. es-al-reoultnckr t lcl -choque de las
partículas con las pare'descfeí recipiente, y la temperatura una medi-
~“da~de sus energías individuales de movimiento. Suponiendo qtre las
moléculas colisionan unas con otras, podemos resolver enigmas tales
como porqué, si las partículas (es decir, las moléculas) están en tan
rápido, casi libre, movimiento, la difusión de un gas de un lado a
otro de una habitación es tan lenta como indica su medición.
El siguíente avarice importante fue la observación hecha por J. C.
Maxwell en el sentido de que la suposición según la cual en el equili
brio cada molécula tenía la misma velocidad era inverosímil. Hacien
do uso de un argumento ingenioso, aunque no del todo convincente,
derivó una curva que establecía una distribución de velocidades para
las moléculas del gas en equilibrio. Algunas se movían muy despacio
y otras muy rápido, mostrando una concentración en torno a un va
lor medio. ¿Podía darse a este resultado una justificación mejor, más
convincente? Aquí L. Boltzmann nos dejó su mayor contribución.
Boltzmann preguntó cómo esperaríamos que evolucionase un gas
que no estuviera en equilibrio. La evolución tendría lugar debido al
movimiento de las moléculas y, en particular, al intercambio de ener
La introducción de la probabilidad en la física 169
gía entre unas y otras por colisión. ¿Podía demostrarse que si el gas
partía de una distribución de velocidades distinta a la de Maxwell, se
aproximaría por este proceso de intercambio de energía a la distribu
ción de Maxwell para permanecer en ella?
Mediante suposiciones plausibles, una de las cuales la examinare
mos en sus pormenores brevemente, Boltzmann fue capaz de derivar
una ecuación para la evolución de la función distribución de velocida
des. Mostró que la distribución maxwelliana era una solución estacio
naria de la ecuación, de manera que, una vez alcanzada, no cambiaría.
Fue capaz de definir una función distribución de velocidades y de
mostrar que, hasta que esta función no alcanzase su valor mínimo (ob
tenido para la distribución de Maxwell), la distribución de velocidades
no sería éstacionaria. Así pues, la distribución de Maxwell era la única solución estacionaria de la ecuación. En conjunto, esto parecía expli
car porqué un gas fuera del equilibrio evolucionaría hacia el equilibrio
y porqué, una vez alcanzado el equilibrio, permanecería en él.
Pero ahora comenzaron los problemas. Primero, los críticos ad
virtieron que los sistemas estaban supuestamente compuestos por
moléculas que obedecían las leyes de la dinámica clásica. Pero en
tanto que un tal sistema cualquiera esté aislado y la energía se con
serve, lo cual es cierto en este caso, debería evidenciar el resultado
de H. Poincaré: El sistema con punto de partida en un estado diná
mico dado retornaría un número infinito de veces a estados muy pró
ximos al estado original. Pero, entonces, ¿cómo podía tener razón
Boltzmann al afirmar que un sistema inicialmente en un estado de no
equilibrio evolucionaría al estado de equilibrio y permanecería en él?
Otro resultado de la dinámica clásica nos dice que si un sistema evo
luciona desde el estado 51 al estado 52, evolucionará desde un
estado similar al 52, salvo con todas las direcciones de movimiento
invertidas, al «inverso temporal» del estado 51. Llamemos a los
estados invertidos temporalmente 51' y 52'. La evolución de 52' a
51' ', si 52', al igual que 52, describe un estado de equilibrio, y 51', al
igual que 51, un estado de no equilibrio, violaría la ecuación de
Boltzmann, que siempre describe la evolución hacia el equilibrio.
¿Cómo puede entonces la ecuación de Boltzmann ser consistente
con la dinámica clásica? (Véase las figuras 3.1 y 3.2.)
Es en este punto donde las ideas probabilísticas comienzan a ju
gar un papel en las diferentes versiones de la teoría. ¿Podría suceder
que la ecuación de Boltzmann no describa cómo debe comportarse
170 Filosofía de la física
F ig u r a 3.1. La recurrencia de Poincaré. Trabajamos en el espacio de fases donde un
solo punto representa el estado microscópico exacto de un sistema en un momento
dado, esto es, la posición y velocidad de cada molécula en un gas. Poincaré demuestra
que para ciertos sistemas (un gas encerrado en una caja y aislado energéticamente del mundo exterior es uno de tales sistemas), si un tal sistema parte de un estado microscópico dado, o, entonces, excepto para un número «infinitamente pequeño» de dichos estados iniciales, cuando se sigue la evolución del sistema a lo largo de la curva p, se
encontrará que el sistema, para cualquier región pequeña de microestados en torno al microestado original, o, «regresará» a un microestado en esa pequeña región, E. Así pues, «casi todos» los sistemas de esta índole que parten de un estado dado regresarán en algún momento a un estado microscópico «muy próximo» al estado inicial.
cada sistema, sino sólo cómo se comportarán probablemente los siste
mas? Si bien, entonces esperaríamos una evolución hacia el equili
brio con una probabilidad abrumadora, también esperaríamos casos
raros donde un sistema en no equilibrio evoluciona apartándose aun
más del equilibrio o donde un sistema en equilibrio evoluciona a un
estado de no equilibrio. Pero aquí uno tiene que andar todavía con
mucho cuidado. El teorema de recurrencia de Poincaré nos dice que
podemos estar seguros probabilísticamente de que los sistemas que
parten de una condición dada de no equilibrio regresarán en algún
momento a una condición de no equilibrio tan próxima como uno
quiera a aquélla de la que partieron. Así, ¿cómo puede ser probable
una aproximación monótona al equilibrio? Además, para toda evolu
ción del no equilibrio al equilibrio, hay una posible evolución inver
sa. Entonces, ¿no deberían ser las evoluciones en ambas direcciones
igualmente probables?
La respuesta de Boltzmann, aclarada por P. y T. Ehrenfest, pre
senta varias componentes importantes. Primero está el descubrimien
to de Boltzmann de una nueva forma de derivar la distribución de
velocidades en el equilibrio. Imaginemos todas las formas posibles en
que las moléculas se pueden colocar en «cajas» pequeñas en un espa-
La introducción de la probabilidad en la física 171
b S(b) > S(a)
• a'
S(b') > S(a')F ig u r a 3.2. E l argumento de Loschmidt sobre la «reversibilidad». Sea un sistema que parte de un microestado a y evoluciona a un microestado b. Supongamos, como es de esperar, que la entropía del estado b, S(b), es mayor que la del estado a, S(a). Entonces, dada la invariancia bajo inversión temporal de las leyes dinámicas subyacentes que rigen la evolución del sistema, debe haber un microestado, b', que evoluciona a un microestado, a \ y tal que la entropía de b’ es igual a la de b y la entropía de a' es igual a la de a (según la definición por Boltzmann de entropía estadística). Así pues, a cada evolución «termodinámica» en la que la entropía aumenta debe corresponder una po
sible evolución «antitermodinámica» en la que la entropía disminuye.
ció abstracto, correspondiendo a pequeñas regiones de posición y mo
mento. El momento es crucial aquí: si utilizamos la velocidad o la
energía obtendremos resultados erróneos. Al mover una molécula de
una caja a otra, obtenemos un nuevo ordenamiento. No obstante, mu
chas permutaciones de las moléculas pueden corresponder a un mis
mo estado de «combinación», es decir, un estado caracterizado por
números de moléculas en cada caja, irrespectivamente de qué molécu
la particular se encuentre en cada caja. La distribución de equilibrio
es el estado de combinación correspondiente a la combinación domi
nante obtenida por un número ostensiblemente grande de permuta
ciones de las moléculas en las cajas. En general, las combinaciones
cerca del equilibrio son obtenibles por un amplio número de permu
taciones. Las combinaciones correspondientes a los estados macroscó
picos lejos del equilibrio son obtenibles sólo por un número muchísi
mo menor de permutaciones. Si consideramos que cada permutación
172 Filosofía de la física
Vv---- 'r - \ i—y - y
sistema
F ig u r a 3 .3 . La imagen «simétrica en el tiempo» de Boltzmann. En esta imagen del mundo, se propone que un sistema aislado cuya entropía es Ssl¡lrm «a lo largo de un tiempo infinito» pasa casi todo el tiempo en estados con entropía próxima al valor máximo, Smáxlmi¡, esto es, en el estado de equilibrio. Hay fluctuaciones aleatorias del sistema fuera del equilibrio. Cuanto mayor sea la fluctuación de un sistema a partir del equilibrio, con menor frecuencia se dará. La imagen es simétrica en el tiempo. Si encontramos un sistema lejos del equilibrio, deberíamos esperar que en el futuro se encontrase más cerca del equilibrio. Pero también deberíamos inferir que en el pasa
do estuvo asimismo más cerca del equilibrio.
es igualmente probable, en virtud de algún principio de indiferencia o
simetría, ¿no podríamos concebir el equilibrio como el estado «osten
siblemente más probable» del sistema?
Deberíamos entonces pensar en la situación como sigue: Un siste
ma dado, observado durante todo el tiempo y perpetuamente aislado,
pasará casi todo el tiempo en o cerca del equilibrio. Se darán desvia
ciones del equilibrio, pero cuanto mayor sea la desviación, menor será
su ocurrencia. La situación será simétrica en el tiempo, con transicio
nes desde el no equilibrio al equilibrio, y viceversa, con igual frecuen
cia. Todavía se cumplirá, sin embargo, que casi todo estado lejos del
equilibrio estará seguido por estados mucho más próximos al equili
brio, como establece la ecuación de Boltzmann. (Véase la figura 3.3.)
No es posible, empero, considerar que la ecuación de Boltzmann
da la evolución más probable de un sistema en un tiempo infinito,
porque esto entraría en conflicto con la recurrencia. Antes bien, la si
tuación debería verse de la siguiente forma: Tomemos una gran colec
ción de sistemas que parten todos de un estado de no equilibrio en
un momento dado determinado. Examinémoslos en intervalos discre
tos de tiempo, observando en cada intervalo de tiempo el estado del
sistema que puede ser obtenido por la mayoría dominante de siste
mas. Dibujemos una curva a través de esos estados evolventes «más
probables». Esa curva, la «curva de concentración» de la evolución de
la colección, obedecerá la ecuación de Boltzmann. Prácticamente
todos los sistemas se apartarán en algún momento del equilibrio, pero
estos excursos serán incoherentes, produciéndose en momentos dife
La introducción de la probabilidad en la física 173
Smax
Si
F ig u r a 3.4. La «curva de concentración» de una colección de sistemas. Sé considera
una colección de sistemas cuyos miembros tienen cada uno una entropía S¡ en el tiempo 1. Los sistemas evolucionan de acuerdo con sus microestados particulares departida en el tiempo inicial. En tiempos posteriores, 2, 3, 4, 5, 6....... la colección seexamina de nuevo. En cada tiempo una considerable mayoría de los sistemas tienen entropías en o cerca de los valores Sp -Vj, S„ 5̂ , ... , que están señalados sobre la «curva de concentración». Esta curva puede aproximarse monótonamente al valor de
equilibrio Smx, aun cuando casi todos los sistemas, individualmente, se aproximen y
se aparten de la condición de equilibrio en la manera ilustrada en la figura 3.3.
rentes para los diferentes sistemas. Después de un largo tiempo, casi
todos los sistemas se encontrarán en cualquier instante dado cerca del
equilibrio, tal como exige la ecuación de Boltzmann bajo esta nueva
interpretación. Así pues, esta interpretación probabilística de la ecua
ción de Boltzmann es consistente con los resultados de la recurrencia.
(Véase la figura 3.4.)
Pero necesitamos ir más lejos en nuestra reflexión. Si, como sugie
re esta nueva interpretación, el equilibrio es la condición «ostensible
mente más probable» de un sistema, ¿porqué se encuentra el mundo
en el que vivimos tan inmensamente lejos del equilibrio? Boltzmann
ofrece una serie de argumentos para soslayar esto. Primero, dice, el
universo es muy extenso en el espacio y en el tiempo. Podemos pos
tular, pues, que la región accesible a nuestra observación es muy pe
queña. Recordemos que este trabajo se estaba llevando a cabo en los
años ochenta del siglo XIX y que la existencia de galaxias fuera de la
Vía Láctea no se estableció hasta algún tiempo después. Ahora bien,
esperamos que partes pequeñas de sistemas grandes estén, durante
pequeños lapsos de tiempo, en estados lejos del equilibrio. Así, pode
mos entender el no equilibrio prevalente que experimentamos como
una «fluctuación local» en torno a una situación de equilibrio preva
lente.
17-4 Filosofía de la física
A continuación podríamos preguntar cómo es que nosotros nos
encontramos en una parte tan singular del universo en lugar de en la
región dominante de equilibrio espacio-temporal. Aquí la respuesta
hace referencia a un tipo especial de sesgo observacional. Para que
pueda haber organismos sostenidos, complejos (como nosotros mis
mos), capaces de realizar observaciones, debe haber flujos de energía.
Solamente éstos pueden contrarrestar el proceso normal de equilibrio
y mantener operando a un organismo activo sumamente estructurado
como es una forma de vida. Pero tal flujo de energía presupone una
situación de no equilibrio. Así pues, si ha de haber observadores,
éstos deben de encontrarse en las partes pequeñas, desviadas, en no
equilibrio del universo.
Ahora bien, es ostensiblemente probable que dicha parte del uni
verso que se encuentra fuera del equilibrio sea una que esté todavía
más lejos del equilibrio en una dirección temporal y más cerca en la
otra. Estas son mucho más corrientes que los raros casos extremos de
partes del universo que son puntos de retorno donde la región está
más cerca del equilibrio en ambas direcciones temporales, y aun más
probables relativamente que los casos extraordinariamente raros de
un estado lejos del equilibrio flanqueado en ambas direcciones tem
porales por estados todavía más lejos del equilibrio.
Pero, ¿porqué, en nuestra parte del universo, habríamos de hallar
a los estados más próximos al equilibrio en la dirección futura del
tiempo y no en la dirección pasada del tiempo? ¿No son las dos op
ciones igualmente probables? En este punto, Boltzmann sostiene que
lo que entendemos por dirección futura del tiempo es la dirección del
tiempo en la que aumenta la entropía local, es decir, la dirección del
tiempo en la que nuestro trozo local de universo se está aproximando
al equilibrio. Sostiene que la dirección del tiempo que se toma como
futuro será, probablemente, opuesta en regiones separadas del univer
so en las que el proceso hacia el equilibrio se da en direcciones tem
porales opuestas. Esto es como el «abajo» para alguien situado en
nuestras antípodas sobre la tierra, que se encuentra en la dirección es
pacial opuesta a nuestro «abajo». Y, dice, en la parte en equilibrio
prevalente del universo, no habrá distinción entre pasado y futuro,
aunque todavía habrá, por supuesto, dos direcciones opuestas del
tiempo. La analogía ahora se establece con el espacio vacío, donde
todavía existen todas las direcciones espaciales, pero donde ninguna
de ellas es «abajo» al no existir una dirección local de la fuerza gravi-
La introducción de la probabilidad en la física 175
tacional. Examinaremos críticamente estas brillantes ideas boltzman-
nianas brevemente.
La concepción ergódica de la mecánica estadística
Maxwell y Boltzmann aportan ocasionalmente un tratamiento algo di
ferente de la situación de equilibrio. La idea ahora es considerar una
colección infinita de sistemas similares al sistema en cuyos aspectos
macroscópicos específicos uno está interesado. Uno podría, por ejem
plo, considerar un gas con una energía interna determinada de sus
moléculas y encerrado en tin contenedor de tamaño estipulado. Uno
imagina entonces una colección en la que sus miembros tienen todos
la misma energía interna que el gas dado y están encerrados en conte
nedores del mismo tamaño, pero en la que cada uno de sus miembros
posee una condición microscópica de sus microcomponentes diferen
te. Esto es, uno considera muestras del gas con características macros
cópicas constantes, pero donde se actualizan todas y cada una de las
posibles posiciones y momentos individuales de sus moléculas.
A continuación se asigna una cierta distribución natural de proba
bilidades a estas condiciones microscópicas, de forma tal que el
estado microscópico de un caso situado en una serie específica de di
chos estados tenga una probabilidad definida. La distribución elegida
es casi inevitable. Se deduce, una vez más, aplicando un principio de
indiferencia o simetría. Pero, como indicamos en la sección sobre pro
babilidad, la aplicación de dicho principio significa ya la elección de
una caracterización preferida del sistema, que debe ser de suyo justifi
cada. Uno puede probar que la distribución de probabilidades especi
ficada no cambiará en el tiempo. Esto es, mientras cada gas en la co
lección sufrirá un cambio de estado microscópico, el número total de
sistemas con sus estados en una región dada permanecerá constante,
aun cuando los estados de algunos sistemas habrán abandonado esta
región y los estados de otros sistemas habrán entrado en la región.
Así, esta probabilidad parece natural para describir el equilibrio, un
estado macroscópico invariable.
A continuación identificamos los observables macroscópicos
(como la presión) con promedios de una función de los microestados
del sistema, donde los promedios se calculan utilizando la distribu
ción de probabilidades en cuestión. Es fácil demostrar que cuando
176 Filosofía de la física
esto se hace, las cantidades calculadas estarán relacionadas entre sí
como encontramos que lo están en los sistemas en equilibrio en el
mundo.
Este método para calcular los valores de equilibrio, identificándo
los con «promedios de fases» sobre una colección (o «conjunto») de
sistemas sujetos todos ellos a las mismas ligaduras macroscópicas, fue
formalizado y generalizado por J. Gibbs. Gibbs desarrolla conjuntos
(esto es, distribuciones de probabilidad sobre microestados del siste
ma) no solamente apropiados para sistemas energéticamente aislados,
sino también para los casos importantes de sistemas mantenidos en
contacto energético con una fuente de calor a temperatura constante
y de sistemas que pueden intercambiar moléculas con un manantial
exterior.
Observemos que hay algunas diferencias sutiles entre este método
y el enfoque alternativo de Boltzmann. Antes concebimos el estado de
equilibrio como el estado microscópico «ostensiblemente más proba
ble» del sistema. Ahora las cantidades de equilibrio se conciben, no
ya como cantidades válidas en los microestados ostensiblemente pro
bables, sino como promedios de cantidades sobre todos los estados
microscópicos posibles, incluyendo aquellos que son menos proba
bles. Sólo si la distribución de probabilidades sobre los estados mi
croscópicos tiene la propiedad de ser simétrica y estar sumamente
concentrada en torno el estado más probable, serán iguales (en gene
ral) las dos cantidades. Puede demostrarse, en el caso de las distribu
ciones de probabilidad utilizadas en la mecánica estadística y de las
cantidades calculadas con ellas, que las dos formas de calcular los va
lores de equilibrio coincidirán entre sí.
Si bien la imagen presentada por Boltzmann, y por quienes han
explicado su trabajo, posee alguna plausibilidad, y si bien esta nueva
explicación evita las contradicciones obvias con la dinámica subya
cente presentes en nuestro anterior entendimiento de la teoría,
todavía quedan muchos problemas por resolver. Una cosa es postular
una imagen semejante del comportamiento de los sistemas; otra muy
diferente es justificar la afirmación de que los sistemas se comporta
rán según esta nueva descripción; y otra aún es explicar porqué los sis
temas se comportan en esa forma boltzmanniana si es que, efectiva
mente, lo hacen.
Una de las primeras tentativas de justificar parte de los procedi
mientos estándar de lo que ahora puede denominarse mecánica esta-
La introducción de la probabilidad en la física 177
F i g u r a 3 .5 . La Hipótesis Ergódica. Sea un sistema que parte de cualquier microesta- do, representado por un punto a en el espacio de fases. Supongamos que c representa
cualquier otro microestado posible para el sistema. La Hipótesis Ergódica postula
que en un tiempo futuro u otro el sistema que partió en el estado a pasará eventualmente por el estado c. Pero el postulado es, de hecho, probablemente falso.
dística fue una sugerencia temprana de Boltzmann que, si se la pudie
ra hacer funcionar, justificaría la elección de la distribución de proba
bilidades estándar utilizada en el conjunto de equilibrio para un siste
ma energéticamente aislado, al tiempo que aportaría una justificación
parcial de su concepción de que un sistema a lo largo de un tiempo
infinito pasaría casi todo su tiempo cerca del equilibrio. Supongamos,
dice Boltzmann, que el estado dinámico microscópico de cualquier
sistema individual pasa en algún momento por todos y cada uno de
los estados dinámicos microscópicos compatibles con las ligaduras del
sistema. Estas ligaduras podrían venir dadas, por ejemplo, por la ener
gía total invariable del sistema y por el volumen de la caja en la que
se encuentra confinado. Llamemos a esta suposición la Hipótesis Er
gódica. (Véase la figura 3.5.)
178 Filosofía de la física
Muchas cosas se seguirían de la Hipótesis Ergódica si fuera cierta.
A partir de ella, uno podría demostrar que la distribución de probabi
lidades estándar no es sólo una distribución estacionaria bajo evolu
ción dinámica, sino que es la única distribución de dicha índole. Uno
podría no sólo demostrar que un sistema, a lo largo de un tiempo infi
nito, pasará casi todo su tiempo en o cerca del equilibrio, sino demos
trar incluso que el tiempo que el sistema pasa con su microestado en
una región particular de microestados será justamente esa proporción
de tiempo que la región tiene como una proporción del conjunto de
todos los microestados accesibles de acuerdo con la medida de proba
bilidad estándar. Esto permitiría identificar la «probabilidad» de un
microestado (determinada según la distribución de probabilidades es
tándar) con un tipo más físico de probabilidad, a saber, la proporción
de tiempo que el sistema pasa con su microestado dotado de una ca
racterística determinada. Todo esto será válido, sin embargo, sólo en
el límite de tiempo infinito. Si uno utilizase entonces el gran número
de grados de libertad de un sistema (su vasto número de moléculas) y
la naturaleza especial de las funciones utilizadas para calcular caracte
rísticas macroscópicas observables, contaríamos con una justificación
bastante completa de la identificación de los valores medios calcula
dos por medio de la medida de probabilidad estándar con los «valo
res ostensiblemente probables». Entonces, si consideramos el equili
brio como el estado ostensiblemente probable, contaríamos con una
justificación para considerar los valores medios de los conjuntos
como representativos del equilibrio.
Vaya, Boltzmann no pudo demostrar que la Hipótesis Ergódica
era cierta. De hecho, es falsa y puede demostrarse que lo es por me
dio de razonamientos topológicos (o de medida-teóricos) muy genera
les. Pero, como veremos, una modificación de la idea boltzmanniana
ha resultado ser inmensamente fructífera. '
La justificación de las afirmaciones de la teoría del no equilibrio
que describe la aproximación al equilibrio de sistemas que partieron
de ese estado es todavía más problemática. La nueva imagen boltz
manniana sugiere esto: Si partimos de la colección de todos los siste
mas posibles en un estado dado de no equilibrio, seguimos su evolu
ción en el tiempo, y tomamos nota del estado dominante de los
sistemas en cada instante, la curva a través de esos estados dominan
tes será la curva generada como solución de la ecuación de Boltz
mann. Pero, ¿lo será? Y si lo es, ¿por qué lo es? La forma en que los
La introducción de la probabilidad en ia física 179
sistemas se comportarán en realidad dependerá de dos cosas: el
estado dinámico microscópico del que partieron y las leyes de la di
námica que determinan cómo evolucionarán sus estados dinámicos
microscópicos a partir de ese estado inicial.
Así, una teoría estadística perfecta del no equilibrio nos debería
decir qué probabilidad atribuir a una clase de estados microscópicos
iniciales de sistemas preparados en una condición inicial dada de no
equilibrio. Nos debería explicar también por qué tenemos derecho a
esperar que esta distribución de microestados iniciales represente
verdaderamente, de algún modo apropiado, la distribución de los
estados iniciales de los sistemas reales en el mundo. Además, la teo
ría nos debería explicar cómo" es que cuando la colección de sistemas
evoluciona en el tiempo, sufriendo cada sistema individual un cam
bio de microestado de acuerdo con las leyes dinámicas dadas, la dis
tribución de probabilidades de las colecciones de sistemas, esto es, la
proporción de sistemas que se encuentran en dominios determinados
de microestados posibles, evolucionará de forma tal que las últimas
colecciones se parecerán cada vez más a la distribución de probabili
dades correspondiente al equilibrio.
Muy pronto se advirtió que Boltzmann, en la derivación de su fa
mosa ecuación de evolución, se había valido de una suposición cru
cial. Al describir la evolución de las moléculas de un gas simple, su
puso que la frecuencia de las colisiones en las moléculas con una
velocidad dada sería proporcional a la fracción de moléculas en el
gas con esa velocidad. Esta es su famosa Hipótesis Relativa a los N ú
meros de Colisión. Se supone que no hay una correlación especial
entre las moléculas antes de la colisión. La evolución de la colección
de gases hacia la colección de equilibrio en la versión estadística de
la teoría depende de una suposición similar, el Postulado del Caos
Molecular. Se supone que, no sólo al comienzo de la evolución, sino
también en cada instante posterior, puede aplicarse un postulado de
«aleatoriedad» de las colisiones de las moléculas. Pero la evolución
del conjunto está fijada por el conjunto inicial y por la evolución di
námica determinista de cada gas en la colección. ¿Es, entonces, consistente con la colección inicial apropiada y estas leyes el postular la
validez del Caos Molecular? Evidentemente, si la evolución está to
talmente determinada por el estado inicial y las leyes, uno debe justi
ficar la legitimidad de hacer tal suposición de realeatoriedad. Explo
raremos esto brevemente.
180 Filosofía de la física
Es importante observar que es justamente dicha suposición de
realeatoriedad, aplicada a las moléculas antes, pero no después, de
que colisionen, lo que aporta el origen de la asimetría temporal de la
ecuación de Boltzmann y de su solución, describiendo la aproxima
ción temporal-asimétrica al equilibrio en el futuro, pero no en el pa
sado. Pero las leyes de la dinámica no muestran dicha asimetría tem
poral. ¿Dónde se introduce físicamente? ¿Hay asimetrías ocultas en
las leyes de la dinámica? ¿Es nuestra idealización del sistema como
aislado del resto del mundo una idealización errónea? O ¿es el ori
gen de la asimetría algo sobre la naturaleza física del mundo que ha
ce de un conjunto inicial apropiado — uno que genera la asimetría en
el tiempo de la descripción probabilística conjuntista del mundo y, a
continuación, captura en nuestra teoría la asimetría observada del
mundo como se expresa en la Segunda Ley de la Termodinámica—
el correcto para ser elegido? Semejantes cuestiones, como veremos,
siguen siendo frecuentes en los fundamentos de esta disciplina.
El problema de la irreversibilidad y las tentativas de resolverlo
Los años que siguieron a este trabajo pionero en mecánica estadística
presenciaron un enorme progreso. La ampliación de los primeros tra
bajos con el objeto de aplicarlos a sistemas más generales que los ga
ses rarificados de los primeros estudios significó un gran avance. La
teoría de los sistemas en equilibrio ha sido generalizada para abarcar
sistemas tales como los gases densos, y sistemas de índole radical
mente diferente como la radiación en interacción con la materia. Sin
embargo, no se ha logrado un éxito comparable con la generalización
de la teoría del no equilibrio a los gases no densos, pues los métodos
de solución aproximada, que funcionan bien en el problema del
equilibrio, dejan de hacerlo normalmente cuando lo que se intenta
generalizar son las ecuaciones de no equilibrio. Pero incluso aquí se
ha realizado un progreso significativo.
Lina revisión fundamental de la teoría se dio cuando la dinámica
clásica, empleada para describir el comportamiento de los constitu
yentes microscópicos en la teoría original, fue reemplazada por una
nueva teoría dinámica fundamental, la mecánica cuántica. Tal y como
veremos en el capítulo 4, la mecánica cuántica comporta su propia
descripción probabilística de la evolución de los sistemas en el tiem
La introducción de la probabilidad en la física 181
po. Pero la concepción estándar es que sigue siendo imposible elimi
nar los elementos probabilísticos de la mecánica estadística, pues
describen un aspecto probabilístico del mundo más allá de cualquie
ra de los aspectos probabilísticos descritos al nivel mecánico-cuánti
co. El problema de reconciliar la teoría estadística, o probabilística,
que aporta un fundamento a la termodinámica, con la teoría dinámi
ca subyacente, pues, continúa siendo un problema abierto, aun cuan
do la teoría dinámica subyacente sea la mecánica cuántica. De hecho,
por ciertas razones técnicas, algunos de los argumentos justificativos
y explicativos que discutiremos en esta sección, argumentos que pre
suponen la dinámica clásica como teoría dinámica subyacente, dejan
de ser válidos en el nuevo contexto dinámico. Los fundamentos de
los postulados probabilísticos de la mecánica estadística resultan de
algún modo más difíciles de explicar, en lugar de más fáciles, en el
nuevo marco dinámico.
Aparte de en la generalización de la teoría y en su reconstrucción
sobre la nueva base dinámica, se ha realizado un enorme trabajo para
suministrar la justificación fundacional de la teoría, cuya necesidad
ya discutimos anteriormente. El programa general consiste en ver
qué parte de la postulación probabilística incluida en la teoría de la
mecánica estadística puede demostrarse que es no autónoma. Esto
es, deseamos averiguar hasta qué punto puede dotarse a las suposi
ciones probabilísticas (y a su uso en el cálculo de cantidades observa
bles) de un fundamento explicativo en fuentes no probabilísticas. En
particular, con lo que tenemos que trabajar es con los hechos sobre
la estructura de los sistemas en cuestión (que el gas está formado por
moléculas y está encerrado en una caja, por ejemplo) y los hechos so
bre la teoría dinámica subyacente (que las moléculas se mueven en
una forma especificada por la dinámica clásica, que su intercambio
de energía por colisión viene también descrito por esa teoría, etcéte
ra). ¿En qué medida podemos derivar los postulados requeridos por
la mecánica estadística de las características dinámicas fundamentales
del sistema? Entre los elementos de la mecánica estadística que que
rríamos deducir se encuentran la distribución de probabilidades es
tándar utilizada en la teoría del equilibrio, la identificación de canti
dades observables en el equilibrio con promedios derivados de su
distribución de probabilidades, el Postulado de Caos Molecular utili
zado en la teoría del no equilibrio, etcétera. Y si algunas de las supo
siciones probabilísticas básicas de la mecánica estadística no fuesen
182 Filosofía de la física
derivables de la estructura del sistema y de su dinámica subyacente,
¿qué cabida puede darse a las mismas en el mundo descrito por la fí
sica? Y si son postulados autónomos ¿cuál es la razón física que los
hace verdaderos?
Dado que el resto de esta sección sobre el problema de la irre-
versibilidad es bastante denso, permitidme esbozar la estructura que
tendrá. Primero examinaremos algunas tentativas de entender el
estado de equilibrio. Después discutiremos el problema general de la
aproximación al equilibrio. Acto seguido, distinguiremos algunos de
los enfoques «no ortodoxos» sobre el problema del equilibrio más
estándar. Luego examinaremos algunas variaciones del enfoque es
tándar de estas cuestiones. A continuación, examinaremos el proble
ma de caracterizar la distribución de probabilidades inicial que ha de
suponerse. Finalmente, examinaremos algunas tentativas de dar cuen
ta del problema fundamental de la irreversibilidad de los sistemas
que introducen resultados sobre la estructura global del cosmos en la
argumentación.
Caracterizando el equilibrioExaminemos primero el caso de la teoría del equilibrio. Como indi
camos anteriormente, el procedimiento estándar para calcular los va
lores de equilibrio de cantidades observables consistía en identificar
esas cantidades con los valores medios de ciertas funciones del
estado microscópico del sistema. El valor medio se calcula utilizando
la distribución de probabilidades estándar. La «imagen» de Boltz
mann de la justificación de este procedimiento era que el sistema ais
lado se encontraría en casi todo momento en o cerca del equilibrio.
Dado que la medida de probabilidad estándar podía interpretarse en
el sentido de indicar la proporción de tiempo que un sistema pasa
con su. microestado en una región determinada de condiciones, y da
do que, además, los estados ostensiblemente más probables prevale
cían absolutamente sobre los otros, de manera que los valores me
dios podían ser identificados con los valores más probables, el valor
medio de una cantidad, calculado según la medida de probabilidad
estándar, sería igual a su valor ostensiblemente más probable. Éste
sería entonces su valor de equilibrio. Según indicamos, se logró dar
una justificación de estas afirmaciones utilizando la Hipótesis Ergódi-
La introducción de la probabilidad en la física 183
ca —que el microestado de cualquier sistema pasaría por todos y ca
da uno de los microestados posibles en algún momento de su evolu
ción— . Pero la Hipótesis Ergódica era presumiblemente falsa. ¿Po
dría encontrarse algo que poner en su lugar?
Se probó un teorema en el sentido de que si un sistema satisfacía
una cierta ligadura determinada (esencialmente, la ausencia de cual
quier constante de movimiento «global» que no fuesen las utilizadas
para especificar el sistema), los promedios de fase para cantidades,
calculados utilizando la medida estándar, serían iguales a los prome
dios temporales de esas cantidades, al menos para la mayoría de los
sistemas. Esto es, excepto para un conjunto de sistemas con una pro
babilidad de tamaño cero en la medida estándar, el promedio sobre
un tiempo infinito de una cantidad para un sistema dado a medida
que los sistemas evolucionaban sería igual al promedio de esa canti
dad tomado sobre todos los sistemas en un mismo instante, utilizan
do la medida de probabilidad estándar para especificar el número de
sistemas con sus microestados en un dominio dado de dichos mi
croestados. Si esta condición se cumpliese, uno podría probar que,
para «casi todos» los sistemas, el tiempo pasado por el sistema en un
dominio de microestados determinado (en el límite de tiempo ten
diendo a infinito) sería igual a la probabilidad de ese dominio de mi
croestados en la medida de probabilidad estándar. Así pues, podría
derivarse una cierta «ley de los grandes números», a saber, que en el
límite de tiempo infinito, las proporciones temporales eran iguales a
probabilidades, aun cuando, en este caso, no estuviésemos tratando
con series probabilísticamente independientes sino, antes bien, con
una evolución determinista. Y uno podría probar, si la condición se
cumpliese, que la única medida de probabilidad que (1) era invarian
te en el tiempo y (2) asignaba una probabilidad cero a las clases de
microestados que tenían probabilidad cero en la medida estándar,
era la propia medida estándar. Estos resultados se aproximan a los
obtenidos utilizando la falsa Hipótesis Ergódica. (Véase figura 3.6.)
Pero ¿satisfacen los sistemas interesantes alguna vez la condición
en cuestión? Primero se encuentra una condición dinámica para que
un sistema sea ergódico (es decir, para que satisfaga la condición del
teorema esbozado). Se trata de una condición sobre la inestabilidad
de los caminos de evolución de los sistemas en sus descripciones mi
croscópicas y, esencialmente, exige que para cada microestado haya
microestados próximos tales que la evolución de los sistemas a partir
184 Filosofía de la física
F ig u r a 3.6. E l teorema ergódico. Sea un sistema que parte de un microestado, a. Sea
R una región cualquiera de microestados posibles del sistema dadas sus ligaduras. D ichas ligaduras podrían ser una especificación, por ejemplo, de la energía total del gas. Supongamos que R tiene un tamaño definido, distinto de cero, en el espacio de fases. Entonces, cuando un sistema es ergódico, sucederá que, excepto posiblemente para
un conjunto de microestados iniciales de tamaño cero, la trayectoria desde el microestado inicial a pasará en algún momento por la región R.
de ellos diverja de la evolución del sistema dado muy rápidamente.
Después se demuestra cómo ciertos modelos de sistemas satisfacen
esta condición dinámica y, por lo tanto, son sistemas ergódicos. En
particular, el sistema formado por «esferas rígidas en una caja» es
uno de tales sistemas ergódicos. Las partículas deben interaccionar
sólo instantáneamente por colisiones entre sí y con las paredes de la
caja, y las colisiones deben ser perfectamente elásticas. Perfectamente
elásticas significa que no se absorbe o se emite energía alguna en las
colisiones. Como este modelo es uno de los modelos estándar adop
tado para los gases ideales, parece que hemos encontrado un tipo de
justificación de la teoría del equilibrio utilizando solamente la estruc
La introducción de la probabilidad en la física 185
tura del sistema y las leyes de la dinámica que gobiernan los micro-
componentes.
Estos resultados son impresionantes. Pero debemos ser cautelo
sos. Para empezar, está el problema del «conjunto de medida cero».
Con la ayuda de los resultados ergódicos podemos demostrar que,
excepto para un conjunto inicial de condiciones iniciales de probabi
lidad cero en la medida de probabilidad estándar, todo sistema pre
sentará promedios temporales de sus cantidades iguales a los valores
medios calculados utilizando la probabilidad estándar. Pero, ¿por
qué suponer que, sólo porque un conjunto tenga probabilidad cero
en la medida estándar, es muy poco probable que un sistemé en el
mundo tenga una condición inicial semejante? Nuevamente, pode
mos demostrar que de todas las distribuciones de probabilidad que
asignan probabilidad cero a aquellos conjuntos con probabilidad
cero en la distribución de probabilidades estándar, sólo la distribu
ción de probabilidades estándar es constante en el tiempo. Pero, ¿por
qué restringir nuestra atención justamente a esas distribuciones de
probabilidad que «ignoran» (es decir, dan probabilidad cero a) los
conjuntos que tienen probabilidad cero en la medida estándar? Es
como si hubiésemos reemplazado nuestro postulado probabilístico
original, según el cual la medida de probabilidad estándar da la pro
babilidad correcta, por una suposición de probabilidad autónoma,
más débil, pero aún no trivial, a saber, que los miembros del conjun
to de condiciones iniciales que tiene probabilidad cero en la medida
estándar pueden ser ignorados. Estamos suponiendo que podemos
esperar con «certeza probabilística» que éstos no ocurrirán.
Otro importante problema se deriva del hecho de que, si bien las
condiciones necesarias para que el Teorema Ergódico sea válido son
probablemente ciertas para tales sistemas idealizados como el de las
esferas rígidas en una caja, probablemente no lo sean para sistemas
más realistas. Las moléculas en un gas no son esferas rígidas perfectas
que permanecen sin interaccionar unas con las otras o con las pare
des del contenedor hasta que se produce la colisión. En lugar de ello,
se da una interacción suave y gradual de las moléculas entre sí y de
las moléculas con las paredes, una interacción que varía con la sepa
ración de los componentes interactivos. En mecánica hay otro teore
ma, el Teorema de Kolmogorov-Arnold-Moser (o KAM), el cual nos
dice que en ciertos casos determinados habrá regiones en el espacio
de fases cuya medida es distinta de cero y tales que el estado de todo
186 Filosofía de la física
F ig u r a .3.7. E l teorema KAM. La curva cerrada, S, representa un sistema que parte
de un estado inicial dado, pasa a través de una serie de estados intermedios y regresa
después a su estado inicial exacto, repitiendo el proceso ad infinitum. Un ejemplo podría ser un planeta que, imperturbado, repite una órbita cerrada indefinidamente. E l teorema KAM dice que para sistemas que satisfacen sus requisitos, una perturbación
suficientemente pequeña del sistema (digamos, del planeta por el tirón gravitacional de otro planeta) producirá una órbita que, aunque ya no será cerrada, estará confinada a una región finita (indicada por el tubo Tí circunscribiendo (en el espacio de fases) la curva inicial S. Un sistema semejante no puede entonces ser ergódico y «vagar» por todo el espacio de fases disponible.
sistema cuyas condiciones iniciales estén en dicha región permanece
rá en la misma durante todo el tiempo. Estos sistemas poseen una es
tabilidad que les impide transitar por todos los lugares de la región
de microestados permitida, tal como requiere la ergodicidad. Aunque
no podemos (en general) probar que los sistemas realistas tengan la
condición necesaria para que se cumpla el Teorema KAM, es muy
plausible que lo hagan. Así pues, las idealizaciones más realistas de
un sistema no satisfarían las condiciones para la ergodicidad. (Véase
la figura 3.7.)
Lo que uno desearía demostrar en estos casos sería algo más mo
desto que la ergodicidad. Uno utilizaría el hecho de que los sistemas
reales de los que nos ocupamos están constituidos por un vasto nú
mero de microcomponentes tales como moléculas. Esto no se toma
en cuenta en absoluto en los resultados ergódicos. Después uno in
La introducción de la probabilidad en la física 187
tentaría demostrar que, para tales sistemas, la región de las trayecto
rias estables, requerida por el Teorema KAM, se hace muy pequeña
en la medida de probabilidad natural a medida que crece el número
de componentes en el sistema. Efectivamente, los modelos de orde
nador parecen demostrar que esto es cierto. La región restante de
inestabilidad no tendría por qué ser tan caótica como la región ines
table del sistema ergódico. Pero, aun cuando no se pudiera probar la
validez de la ergodicidad en la región de fases como un todo, ni si
quiera en la región de inestabilidad dominante, quizá uno pudiera
demostrar que en esta región se daba un tipo de inestabilidad. Esta
región constaría de la inmensa mayoría de los estados iniciales si se
medía en la forma natural. Esto sería suficiente para obtener algo pa
recido a los resultados de Boltzmann. Es decir, sería suficiente para
garantizar que el comportamiento a largo plazo de las trayectorias
que hubieran arrancado de esta región podía ser modelado por las
probabilidades estándar. La exploración de posibilidades como ésta
es un proyecto de investigación en curso en los fundamentos de la
mecánica estadística. Sin embargo, aun cuando se obtuvieran dichos
resultados, su aplicación requeriría la suposición de que las regiones
pequeñas de estabilidad en la medida de probabilidad natural fueran
realmente «pequeñas» en el mundo. Necesitaríamos demostrar que
es poco probable físicamente encontrar un sistema con su microesta-
do en una tal región de estabilidad. Esto no sería derivable de la di
námica subyacente.
Finalmente, deberíamos de reparar en la estructura de las expli
caciones estadísticas ofrecida por esta teoría del equilibrio. ¿Cómo
son explicadas probabilísticamente las características de equilibrio de
los sistemas por esta teoría? No se demuestra que éstas son las carac
terísticas de los sistemas que encontramos con gran probabilidad en
el mundo. De hecho, si esto se llegase a demostrar, nos encontraría
mos con un problema, pues, como sabemos, existe una alta probabi
lidad de que encontremos sistemas en el mundo que no están en
equilibrio. La teoría tampoco muestra en forma alguna que las ca
racterísticas del equilibrio sean más probables de lo que hubiése
mos esperado por la evidencia de fondo. Y tampoco aporta un tipo
de explicación estadístico-causal del equilibrio. No deriva el equili
brio de algunas propensiones causales tiquistas, ni deriva su probabi
lidad de una distribución probabilística sobre condiciones iniciales
causales. Dicha explicación probabilístico-causal, si es que puede
188 Filosofía de la física
darse en modo alguno, estará en el origen de la teoría mecánico-esta-
dística del no equilibrio y de la aproximación al equilibrio. Volvere
mos sobre esto en un momento.
En lugar de ello, la teoría nos permite comprender las caracterís
ticas de equilibrio de los sistemas en virtud de su demostración de
que bajo las condiciones adecuadas las características que se dan en
los sistemas cuando se observa que están en equilibrio son justamen
te esas características que dominan el comportamiento de un sistema
a lo largo de un tiempo infinito idealizado. Una vez más, como he
mos indicado, sólo el lograr establecer esto requiere una gran dosis
de idealización. La legitimidad de la idealización es una cuestión con
trovertida. Pero el modelo de explicación es ciertamente interesante.
Una característica macroscópica es identificada con el promedio de
la cantidad microscópica correspondiente utilizando una distribución
de probabilidades natural. La distribución de probabilidades está jus
tificada, demostrándose que es la única distribución estacionaria que
asigna probabilidad cero a las regiones que tienen probabilidad cero
en esa misma medida natural. El tiempo pasado en regiones de
estados microscópicos en el límite infinito se demuestra que es equi
valente al tamaño de la región según dicha medida natural. Y, con el
enorme número de componentes microscópicos introducido, puede
demostrarse que los promedios de las cantidades son equivalentes a
los valores ostensiblemente más probables, y éstos equivalentes a los
valores estándar en el equilibrio. Finalmente, y de gran importancia,
es la medida en que se puede dotar de un fundamento firme a la na
turalidad de la medida de probabilidad. Puede demostrarse, por lo
que se refiere a todos los requisitos que hemos indicado, que es la
medida de probabilidad «correcta». La demostración utiliza solamen
te la estructura del sistema y las leyes de la dinámica. En alguna me
dida, al menos, se ha reducido la necesidad de postular la medida de
probabilidad natural como una parte autónoma y fundamental de la
teoría. Como veremos, sin embargo, las cosas no son tan simples
cuando lo que está en juego es el no equilibrio.
La aproximación al equilibrio
¿Qué tipo de teoría deberíamos buscar para contar con una descrip
ción estadística general de la aproximación al equilibrio y con una
La introducción de la probabilidad en la física 189
explicación de los fenómenos de no equilibrio? Esperamos que nues
tra descripción incluya elementos probabilísticos, pues sabemos por
la estructura de la dinámica fundamental que los sistemas individua
les pueden, de hecho, comportarse en el modo «contradinámico».
Pueden dejar de moverse suavemente desde un estado de no equili
brio inicial a un estado de equilibrio. Será en el comportamiento de
una colección de sistemas, en la que cada sistema ha partido de la
misma condición de no equilibrio, donde encontraremos nuestra des
cripción de la aproximación al equilibrio. Y será algo referente a la
evolución del conjunto de sistemas o, más precisamente, algo referen
te a la evolución de una distribución de probabilidades inicial sobre
los posibles microestados de sistemas compatibles con la condición
de no equilibrio original del sistema, lo que representará para noso
tros la aproximación al equilibrio.
Hay una buena forma de caracterizar el tipo de comportamiento
que estamos buscando que haría justicia a las ideas de Boltzmann y
de los Ehrenfest discutidas más arriba. Esto fue aclarado por Gibbs.
Consideremos una distribución de probabilidades inicial del no equi
librio. Sigamos su evolución de acuerdo con las leyes dinámicas que
nos dicen cómo cada sistema en la colección, caracterizado por su
microcondición inicial específica, evolucionará. ¿Podría esta distribu
ción de probabilidades mismamente aproximarse en el tiempo a la
distribución de probabilidades del equilibrio para las ligaduras espe
cificadas? Por ejemplo, supongamos que en una caja tenemos gas que
comenzó en la parte izquierda y al que se permitió expandirse hasta
llenar la caja. Inicialmente la probabilidad está concentrada por com
pleto en los estados correspondientes al gas confinado en la parte iz
quierda de la caja. ¿Se aproximará esta distribución de probabilida
des inicial a la correspondiente distribución de equilibrio para un gas
expandido suavemente por toda la caja?
La respuesta es, probablemente, no. Un teorema fundamental nos
dice que la distribución de probabilidades original no puede difumi-
narse en esta forma. Pero puede «difuminarse». La distribución de
probabilidades, en un principio compacta y regularmente acotada,
puede convertirse en una distribución caóticamente deshilachada
que ocupa la región entera de microestados posibles en un sentido
«de grano grueso». A medida que el tiempo avanza, cada microestado
será uno de los ocupados por uno de los sistemas originales o uno de
los no ocupados en esta forma. La fracción de microestados ocupa-
190 Filosofía de la física
F ig u r a 3.8. Difuminación «de grano grueso» de un conjunto inicial. La región A representa la colección de puntos en el espacio de fases correspondiente a la colección de
sistemas preparados todos en una condición de no equilibrio que es macroscópicamente idéntica pero que permite una variedad de estados microscópicos iniciales. Conforme los sistemas evolucionan siguiendo la dinámica que rige el cambio de
estado microscópico, A se desarrolla en T(A). E l tamaño de T(A) debe ser igual al de
A por una ley de la dinámica, pero mientras A es una región simple confinada a una
pequeña parte del espacio de fases disponible, T(A) es una región deshilachada, compleja, que se extiende por todo el espacio de fases disponible «en un sentido de grano grueso». Una distribución uniforme sobre el espacio de fases disponible es lo que
corresponde al equilibrio en la teoría. T(A) no está en realidad difuminada de manera
uniforme en el espacio de fases pero puede, no obstante, considerarse que representa
una difuminación del conjunto inicial representativa de una aproximación al equili
brio.
dos se mantendrá constante. Pero la situación pasará de ser una en la
que todos los puntos ocupados están en una región compacta de los
estados accesibles, a una en la que, para cada pequeña región de mi
croestados posibles, una parte proporcional a esa región consistirá en
estados ocupados. Gibbs utiliza como analogía la mezcla de tinta in-
soluble y agua. Si bien cada parte del fluido, si se examina con el su
ficiente detenimiento, es siempre tinta o agua; la tinta, que comenzó
flotando en la superficie del agua, se deslíe en algún momento uni
formemente por todo el volumen permitido. Dicha aproximación de
grano grueso al equilibrio de la distribución de probabilidades inicial
de no equilibrio se corresponderá muy bien, como noción formal,
La introducción de la probabilidad en la física 191
con las ideas sobre la aproximación al equilibrio resumidas por los
Ehrenfest en su solución a la ecuación de Boltzmann, representando
la «curva de concentración» de la distribución de probabilidades
evolvente para la colección. (Véase la figura 3.8.)
Pero, ¿podemos demostrar que una probabilidad inicial corres
pondiente a una situación de no equilibrio evolucionará, efectiva
mente, en el sentido de grano grueso, hacia la distribución de proba
bilidades asociada con el equilibrio? Podemos obtener dicho
resultado si imponemos un enunciado general de un Postulado de
Caos Molecular a la teoría. Éste puede tomar formas diferentes, de
pendiendo de cómo queramos modelar matemáticamente la evolu
ción de la distribución de probabilidades. Pero, en cada caso, el pos
tulado, el descendiente de la Hipótesis Relativa al Número de
Colisiones de Boltzmann, debe ser añadido a los enunciados subya
centes sobre la estructura del sistema y a las leyes dinámicas subya
centes. ¿Cómo podemos estar de algún modo seguros de que la evo
lución así determinada tendrá, de hecho, el tipo de naturaleza
permanentemente «realeatoriadora» que se utiliza para derivar la
aproximación al equilibrio cuando se supone Caos Molecular? Aquí
hay problemas profundos de consistencia entre el postulado y las d i
námicas subyacentes.
Algunos enfoques no estándar del problemaAntes de abordar este problema, exploremos algunas de las concep
ciones acerca del origen físico de la aproximación al equilibrio de los
sistemas. La teoría ortodoxa supone que los sistemas en cuya evolu
ción estamos interesados pueden ser concebidos como verdadera
mente aislados del mundo exterior. Pero ¿es legítima esta suposi
ción? La teoría estándar supone leyes dinámicas de la naturaleza
subyacentes que son «invariantes bajo inversión temporal», y busca
la razón de la asimetría temporal de la termodinámica y de la mecá
nica estadística en algo diferente a una asimetría subyacente de las le
yes dinámicas básicas. ¿Es esta suposición correcta? El enfoque orto
doxo supone que la asimetría en el tiempo está fundada en alguna
cuestión de hecho sobre el mundo que requiere una explicación si
milar a las explicaciones físicas ofrecidas a otros fenómenos descu
biertos. Pero ¿es esto correcto, o podemos encontrar la justificación a
192 Filosofía de la física
las suposiciones probabilísticas de la teoría en algunas características
generales de la inferencia inductiva y probabilística, antes que buscar
su fundamento en algunos hechos sobre el mundo físico?
Los métodos estándar de la mecánica estadística tratan a los sis
temas como si verdaderamente pudieran aislarse energéticamente del
mundo exterior. Pero un aislamiento tan perfecto es, por supuesto,
imposible. Como mínimo se tiene la interacción gravitacional entre el
sistema y el entorno exterior, una interacción que no puede ser eli
minada. Las fuerzas debidas a la interacción pueden, empero, ser de
hecho muy pequeñas. Considerad un gas confinado en la parte iz
quierda de una caja. Dejad que se expanda por toda la caja. La con
cepción del aislamiento puro sostiene que en las posiciones y en los
momentos de las moléculas en un tiempo posterior se encuentra im
plícita la información sobre el estado original del gas. Pero, arguye el
intervencionista, incluso los cambios infinitesimales en el microesta
do inducidos por las débiles interacciones con el mundo exterior
modificarán el microestado del gas de tal forma que el microestado
real en un tiempo posterior perderá cualquier correlación que indi
que el estado macroscópico inicial del gas. La inversión temporal de
este microestado real, por oposición a ideal, no será un microestado
que evolucionará de nuevo a la situación del gas confinado en la par
te izquierda de la caja sino, antes bien, uno de los innumerables mi
croestados correspondientes al gas expandido en toda la caja. ¿Pue
den ser eliminadas de esta forma las paradojas de la reversibilidad?
La mayoría piensa que no. Hay casos especiales en los que el ais
lamiento es suficiente para que pueda construirse un verdadero tipo
de inversión de un estado. Podemos construir un microestado que
lleve al sistema a mostrar un comportamiento antitermodinámico. El
experimento del eco-espín es uno de ellos. Los núcleos con momen
tos magnéticos evolucionan desde un estado de equilibrio macroscó
picamente ordenado a uno aparentemente desordenado. Un pulso de
radio puede «voltear» los núcleos, de manera que el sistema parece
retroceder espontáneamente a su condición original ordenada de no
equilibrio. Aquí el aislamiento es suficiente para que el microestado
ulterior del sistema en equilibrio retenga la información sobre el
estado original de no equilibrio. El experimento puede ser también
realizado cuando los núcleos interaccionan magnéticamente entre sí.
Pero el sistema parece mostrar, hasta el «volteo», la aproximación
macroscópica al equilibrio habitual, indicando que debemos explicar
La introducción de ia probabilidad en la física 193
dicho comportamiento incluso cuando el aislamiento es «perfecto».
La mayoría de los físicos están todavía convencidos de que hasta los
sistemas perfectamente aislados del entorno exterior mostrarían la
asimetría temporal caracterizada por la Segunda Ley. (Véase la figu
ra 3.9.)
Los enigmas estándar concernientes a la reversibilidad suponen
también que las leyes dinámicas subyacentes tienen la propiedad de
invariancia bajo inversión temporal. Esto implicaría que el microes-
tado invertido de un sistema que ha evolucionado a partir del no
equilibrio sería uno que evolucionaría en el inverso temporal del
microestado original de no equilibrio. Se tendría entonces una evo
lución con retorno a una situación de no equilibrio. ¿Podría estar
equivocada* esta suposición de simetría temporal para las leyes diná
micas subyacentes, de manera que la asimetría temporal a este nivel
de la dinámica fundamental fuese realmente la fuente de la asimetría
termodinámica? La mayoría piensa que no. Las leyes de la dinámica
clásica, y también, se afirma habitualmente, las leyes de la dinámica
cuántica, son simétricas en el tiempo en el sentido convencional. En
realidad, para la mecánica cuántica, ésta es una cuestión que podría
ser controvertida. Según veremos en el capítulo 4, en la concepción
mecánico-cuántica del mundo existe un proceso denominado medi
ción que entraña una clase especial de asimetría temporal. La natura
leza y origen de esa asimetría son de por sí controvertidos, siendo
atribuidos por algunos a la asimetría termodinámica considerada
como la asimetría fundamental. Pero la opinión general es que las fa
miliares asimetrías de la termodinámica no tienen su origen en ningu
na asimetría semejante de la medición mecánico-cuántica, y que el
origen de la asimetría de la mecánica estadística debe buscarse en
otro lugar.
Curiosamente, hay fenómenos en la naturaleza que parecen de
mandar leyes fundamentales asimétricas en el tiempo. Esto salta a la
vista en el estudio de ciertas interacciones en el dominio de la teoría
cuántica de campos. Aquí, parece, encontramos procesos que son po
sibles de acuerdo a las leyes fundamentales, pero cuyas inversiones
temporales naturales son imposibles. Más concretamente, las proba
bilidades del proceso no son invariantes bajo inversión temporal. Se
han llevado a cabo algunos trabajos con el propósito de demostrar
que no podría derivarse ninguna explicación de las familiares asime
trías que nos ocupan aquí a partir de estos fenómenos, aun cuando
194 Filosofía de la física
- 0 O O O— O ' 0 o ot=A,0 " Q O 0
, = 2 a , 0 © o OF ig u r a 3.9. E l experimento del eco-espín. La fila de arriba de la figura representa una
colección de núcleos giratorios cuyos espines están alineados en la misma dirección
según un plano que es perpendicular a un campo magnético aplicado sobre el cristal a cuyos átomos pertenecen los núcleos en cuestión. En la segunda fila ha transcurrido un período de tiempo. Las direcciones de los espines han precesado, a diferentes velocidades, en torno al campo magnético aplicado, de manera que en este punto los espines, aunque todavia en el mismo plano, apuntan ahora en todas las direcciones «al azar». En la tercera fila, los espines han sido «volteados» por un pulso de frecuencia de radio. Los espines «más adelantados» en la «carrera de precesión» son ahora
los «más atrasados». E l resultado se muestra en la fila de abajo. E l tiempo es ahora el doble del transcurrido desde la fila de arriba a la segunda fila. Los espines se han «alcanzado» ahora unos a otros, de forma que todos ellos apuntan de nuevo en la misma dirección. Desde la tercera línea a la linea de abajo parece haber una condición
de equilibrio (espines aleatorios) que evoluciona espontáneamente a una condición de no equilibrio (todos los espines alineados).
éstos revelen una no invariancia bajo inversión temporal verdadera
mente legal en el mundo.
Finalmente, está la escuela que busca la justificación de las apli
caciones de la probabilidad en la mecánica estadística, no en el des
cubrimiento de proporciones reales en el mundo o en alguna caracte
rística especial de las leyes y estructuras de los sistemas como la
ergodicidad, sino en principios generales del razonamiento inductivo.
La introducción de la probabilidad en la física 195
En caso de equilibrio, se arguye, la justificación de la medida ordina
ria de probabilidad es el Principio de Indiferencia. Éste nos dice que,
a falta de una evidencia ulterior, tratemos de la misma forma, en tér
minos de peso probabilístico, todos los casos simétricos permitidos
por la evidencia disponible. Pero, como hemos indicado, el Principio
de Indiferencia estará vacío hasta que se proporcione una forma defi
nitiva de caracterizar los sistemas. ¿Dónde, si no es en las propieda
des de la dinámica y de la estructura, encuentran los «inductivistas»
esto?
En el caso de no equilibrio, los inductivistas arguyen que, con tal
que una situación sea «reproducible experimentalmente» en el nivel
macroscópico, uno puede justificar la concepción de que la entropía
aumenta con el tiempo. La idea es la siguiente: Podemos esperar que
sistemas idénticamente preparados en lo que a sus características ma
croscópicas respecta evolucionen a sistemas semejantes en sus carac
terísticas macroscópicas sólo si hay muchos más microestados que
correspondan a la situación macroscópica fundamental de los que
correspondían a la situación macroscópica original. Pero semejante
incremento en los microestados correspondientes a un macroestado
evolucionado es justamente la noción mecánico-estadística del au
mento de entropía estadística. Bien, de acuerdo. Pero lo que noso
tros queríamos explicar era por qué se da algo como la repro-
ducibilidad experimental de los sistemas cuando se describen
macroscópicamente. ¿Cómo es que sistemas constituidos por un vas
to número de componentes pueden ser descritos de manera sencilla
mediante un pequeño número de parámetros que evolucionan según
ciertas leyes? Y ¿por qué los sistemas descritos macroscópicamente
en esta forma evolucionan siempre en la misma dirección temporal
cuando se considera el movimiento hacia el equilibrio? ¿Cómo se ex
plica, si quieres, que los experimentos sean todos reproducibles ex
perimentalmente en la misma dirección temporal y algunos no lo
sean en la dirección opuesta? Y ¿cómo es que esta dirección tempo
ral es la que consideramos como el futuro?
Si observamos un sistema en un estado de no equilibrio, somos
capaces de inferir sus estados en tiempos diferentes solamente en
una dirección temporal. Sabemos que un sistema calentado por un
extremo y frío en el otro estará más tarde todo él caliente, mientras
dada una barra caliente no somos capaces de inferir el estado de no
equilibrio del que partió, ya que son muchas las condiciones de no
196 Filosofía de la física
equilibrio que evolucionan hacia el mismo estado de equilibrio. Pero
¿por qué existen tales caracterizaciones macroscópicas y su comporta
miento legal? ¿Por qué evolucionan los sistemas paralelamente unos
a otros en el tiempo? ¿Por qué es la dirección de aproximación al
equilibrio la dirección futura? Estos son los hechos que queríamos
explicar. La línea inductivista parece presuponer tan sólo que los fe
nómenos en cuestión existen y entonces señala las consecuencias de
su existencia y lo que esta existencia y naturaleza presuponen sobre
la evolución microscópica de los sistemas. Pero por qué se dan los fe
nómenos precisamente en esta forma es lo que queríamos explicar en
primer lugar.
Algunos enfoques estándar del problemaRegresemos a la escuela ortodoxa de pensamiento. Considerad un
sistema energéticamente aislado del resto del mundo y en una condi
ción de no equilibrio. ¿Cómo deberíamos representar su aproxima
ción al equilibrio en mecánica estadística? Pues bien, consideramos
toda condición posible de sus componentes microscópicos compati
ble con el estado de no equilibrio original del sistema. Nos imagina
mos una vasta (de hecho, infinita) colección de sistemas que tengan
todos los posibles microestados iniciales, e imponemos una distribu
ción de probabilidades sobre esos microestados. Cada sistema indivi
dual en la colección nos lo imaginamos ahora evolucionando de
acuerdo con su estructura y con las leyes dinámicas que gobiernan la
dinámica de los microcomponentes. Queremos mostrar que, dada la
distribución de probabilidades original y dadas esas leyes, se da una
evolución de las distribuciones de probabilidad que tiende, en un
sentido u otro, hacia la distribución de probabilidades en el equili
brio correspondiente a las ligaduras impuestas sobre el sistema.
Una primera cuestión a plantear es cómo serán las distribuciones
iniciales de probabilidad. Sólo se entiende bien un número limitado
de casos. Un caso es aquel en el que el sistema, si bien no está en
equilibrio, está cerca del equilibrio para empezar. Otro caso, más ge
neral, es aquel en el que el sistema, si bien no está en equilibrio, pue
de considerarse que posee regiones suficientemente pequeñas y sufi
cientemente próximas al equilibrio durante tiempos suficientemente
pequeños. Así, en este último caso, aunque no podamos atribuir una
La introducción de la probabilidad en la física 197
densidad, presión, temperatura o entropía al sistema, podemos consi
derar que parte con una cierta distribución de densidad, presión, den
sidad de entropía y temperatura. El gas confinado inicialmente en el
lado izquierdo de la caja tiene una alta densidad uniforme en la mi
tad del espacio físico ocupado y una densidad cero en la otra mitad.
La barra de hierro inicialmente caliente en un extremo y fría en el
otro no tiene una temperatura; tiene una distribución de temperatura
a lo largo de la longitud de la barra. En estos casos, las reglas que ge
neralizan la forma en que el Principio de Indiferencia se aplicaba
para obtener la distribución de probabilidades en el equilibrio, pue
den probablemente aplicarse para obtener las distribuciones iniciales
de probabilidad en el no equilibrio. En los casos donde ni siquiera
puede suponerse un «equilibrio local transitorio», no está claro cómo
debería ser nuestra distribución de probabilidades inicial. Pero, en
dicho caso, una vez más, tampoco existe realmente una teoría ma
croscópica que describa la aproximación al equilibrio que ha de de
ducirse y explicarse.
¿Podemos mostrar, en base solamente a la estructura del sistema
y a la dinámica de los microconstituyentes, sin invocar un postulado
tipo caos molecular de perpetua realeatoriedad, que esta distribución
de probabilidades inicial se aproximará a la distribución de equili
brio, al menos en la forma de grano grueso sugerida por Gibbs? En
algunos casos sí podemos —en cierto modo. En los casos en los que
podía probarse la ergodicidad en la teoría del equilibrio, como los de
esferas rígidas en una caja, pueden también probarse algunas veces
resultados más fuertes.
La ergodicidad no es suficiente para nuestros propósitos. Ima
ginemos una vasta colección de sistemas, preparados todos en una
condición dada de no equilibrio. Todos podrían ser ergódicos, evo
lucionando de forma tal que en un tiempo infinito estuviesen
normalmente en o cerca del equilibrio. Aún así, podría resultar que
la colección no se aproximase, como un todo, al equilibrio. Podría
darse una aproximación regular y uniforme de los sistemas a, y des
de, el equilibrio de una forma sincronizada, de manera que la distri
bución de probabilidades sobre todos los sistemas no pudiera mos
trar una aproximación uniforme al equilibrio ni siquiera en el sentido
de grano grueso. Es decir, podría haber momentos en el futuro en los
que la distribución de probabilidades estuviese alejándose de la dis
tribución de equilibrio, aun cuando cada uno de los sistemas indivi
198 Filosofía de la física
duales pasase la mayoría de su tiempo en o cerca del equilibrio del
sistema individual.
Sin embargo, un resultado más fuerte que la ergodicidad, «la
mezcla», puede probarse para sistemas idealizados del tipo de las es
feras rígidas en una caja. Lo que la mezcla dice, concisamente, es que
si comenzamos con cualquier distribución de probabilidades inicial
«no patológica», ésta, al menos en el paso al límite cuando el tiempo
tiende a infinito, se aproximará en el sentido de grano grueso a la
distribución de probabilidades en el equilibrio. «No patológica» sig
nifica esencialmente que la distribución de probabilidades inicial
asignará una probabilidad cero a toda región de microcondiciones
que tenga probabilidad cero en la medida estándar familiar.
Uno puede, efectivamente, probar resultados más fuertes que el
de la mezcla para tales sistemas. Se puede probar que son sistemas K. Ser un sistema K es tener un tipo de «indeterminación probabilísti
ca» de grano grueso. Supongamos que concebimos a los microesta
dos del sistema agrupados en pequeñas colecciones de microestados.
Si un sistema es un sistema K, no podremos determinar con probabi
lidad uno o cero en qué subcolección se encontrará el microestado
de un sistema en un instante de tiempo dado, aun cuando sepamos
en qué subcolección se encontraba el microestado del sistema en
todos los instantes anteriores de tiempo, discretamente separados,
hasta el pasado infinito. La única excepción se daría en el caso de ser
trivialmente verdadero que el sistema tiene una probabilidad uno o
cero de tener su microestado en la subcolección designada.
Y, todavía más fuerte, uno puede probar que los sistemas son sis
temas Bernoulli. Esto significa que uno puede construir conjuntos de
subcolecciones de microestados tales que la descripción en un tiem
po infinito de en qué subcolección se encuentra el microestado de
un sistema en cada momento de observación determina completa
mente la evolución estadística de la distribución de probabilidades.
Pero la información sobre las subcolecciones en las que el sistema ha
estado durante el pasado no aporta ninguna información probabilísti
ca sobre la subcolección en la que se encontrará en el instante de
tiempo subsiguiente. Cuando se trata de en qué subcolección se en
contrará el microestado, el sistema, si bien evolucionando determinis
tamente, se comporta justamente igual que los resultados de series de
lanzamientos de monedas probabilísticamente independientes. Así
pues, el determinismo al nivel de microestado exacto es compatible
La introducción de la probabilidad en la física 199
F ig u r a 3.10. Un conjunto mixto. T es una región del espacio de fases para el sistema
en la que el punto fásico para el sistema se encuentra localizado. A y B son dos regiones de puntos en el espacio de fases de tamaño distinto de cero. B se mantiene constante. Seguimos la evolución de los sistemas cuyos microestados iniciales se encuentran en la región A E l resultado es una serie de regiones T(A) a medida que pasa el tiempo. Un sistema «mixto» es uno en el que la región A evolucionará en una región T(A) en el límite «a medida que el tiempo tiende a infinito». Esta región T(A) está distribuida uniformemente sobre el espacio de fases en el sentido de grano grueso. Para
que esto suceda, la proporción de cualquier región B ocupada por puntos que evolucionan desde la región A ha-de ser igual en el límite de tiempo infinito a la proporción del espacio de fases ocupada originalmente por puntos» en la región A.
con el comportamiento más aleatorio imaginable al nivel de grano
grueso. (Véase la figura 3.10.)
¿Resuelven dichos resultados, de una vez por todas, todos los
enigmas sobre la aproximación al equilibrio? Ciertamente no. Prime
ro está el hecho de que cuando aplicamos la mezcla para elaborar un
modelo de aproximación al equilibrio, debemos ignorar los «conjun
tos de medida cero». Al suponer que podemos ignorar distribuciones
iniciales de probabilidad patológicas en las que la probabilidad dis
tinta de cero se concentra en colecciones de microestados que tienen
probabilidad cero en la medida estándar, estamos suponiendo que
dichas colecciones de microestados pueden ser ignoradas. Esto es
una vez más una suposición probabilística no derivable de la estruc
tura de los sistemas o de sus dinámicas.
Además está el problema de que la mayoría de los sistemas rea
listas no cumplirán las condiciones necesarias para que se dé la
200 Filosofía de la física
mezcla. Esto es debido a que se encuentran (probablemente) en el
dominio del teorema KAM. Esto requiere nuevamente la existencia
de regiones distintas de cero de microestados que generar trayectorias
estables, trayectorias que no se desplazan por toda la región disponi
ble de microestados. Así como esto hizo imposible la ergodicidad
para casos más realistas en la teoría del equilibrio, así también hace
imposible el resultado más fuerte de la mezcla. Al igual que antes, se
tendrá en alguna forma que recurrir en este punto al gran número de
constituyentes del sistema y a algún argumento en el sentido de que
las regiones de estabilidad serán muy pequeñas y de que fuera de
estas regiones el movimiento será lo bastante caótico para generar, si
no una mezcla en sentido puro, algún sustituto razonable de ésta.
Pero existe una dificultad mucho mayor que ésta para quien pre
tenda fundamentar la aproximación al equilibrio solamente en resul
tados de mezclas. Si un sistema está mezclado, entonces cualquier
distribución de probabilidades inicial no patológica sobre sus mi
croestados presentará una aproximación de grano grueso a la distri
bución de probabilidades en el equilibrio en el límite de tiempo infi
nito. Pero ¿qué sucederá «a corto plazo», esto es, en intervalos de
tiempo correspondientes a ésos en que nos hallamos interesados, los
tiempos típicos que tarda un sistema en no equilibrio en acercarse al
equilibrio?
La mezcla es compatible con cualquier comportamiento a corto
plazo que uno pueda imaginar. La distribución de probabilidades en
el no equilibrio puede aproximarse en el sentido de grano grueso a la
distribución en el equilibrio, alejarse de ella, permanecer como distri
bución de no equilibrio, o seguir cualquier modelo de aproximacio
nes, retrocesos, o quedar igual que uno quiera, y ser todavía la distri
bución de probabilidades de un sistema mezclado. Pero lo que
queremos modelar es la aproximación uniforme, a corto plazo, al
equilibrio de sistemas reales en no equilibrio. ¿Qué es lo que se ne
cesita añadir al hecho de que un sistema esté mezclado para asegu
rarnos de que nuestro modelo tendrá estas características?
Uno también puede ver que la mezcla por sí misma no basta
para responder a todas nuestras cuestiones, observando que es una
noción simétrica en el tiempo. Cualquier distribución de probabilida
des inicial no patológica para un sistema mezclado evolucionará tam
bién, conforme el tiempo tiende al pasado infinito, hacia una distri
bución de probabilidades que se asemeja en el sentido de grano
La introducción de la probabilidad en la física 201
grueso a la distribución de equilibrio. Apenas sorprende que cual
quier sistema que esté mezclándose hacia el futuro, esté mezclándose
hacia el pasado. Después de todo, la «mezclabilidad» de un sistema
se sigue de su estructura y de las leyes dinámicas subyacentes simétri
cas en el tiempo. Naturalmente, la asimetría temporal de la termodi
námica, y de la mecánica estadística que queremos para sustentar la
teoría macroscópica no puede derivarse de los elementos de la es
tructura y la microdinámica únicamente. De nuevo, debe añadirse
algo más.
Discutiremos en un momento el elemento adicional requerido,
pero reparemos antes en que el enfoque del no equilibrio por la me
cánica estadística que acabamos de discutir no es la única forma de
intentar justificar la teoría del no equilibrio. Hay un enfoque impor
tante y bastante diferente; su contraste con el enfoque que acabamos
de discutir es muy iluminador. Ciertos resultados nos dicen que si
idealizamos un sistema en la forma apropiada, en particular, dejando
que el número de moléculas en el gas tienda a infinito, que la densi
dad del gas tienda a cero, y que el tamaño de las moléculas del gas
comparado con el tamaño de la caja (el denominado Límite de Gra
do de Boltzmann) tienda a cero, entonces podemos demostrar que,
para períodos de tiempo suficientemente pequeños, «casi todos» los
sistemas (es decir, todos los sistemas excepto un conjunto de proba
bilidad cero) evolucionarán de acuerdo con la manera descrita por la
ecuación de Boltzmann. Esta es la «derivación rigurosa de la ecua
ción de Boltzmann».
Ahora bien, puede demostrarse que estos resultados son válidos
solamente para tiempos que son fracciones del tiempo esperado en
tre la colisión de una molécula con otra molécula y después con otra
molécula. Pero hay razones para pensar que se trata de resultados
verdaderos, aunque no se pueda probar, para tiempos más largos.
Este resultado, a diferencia del de la mezcla, proporciona una justifi
cación del hecho de tomar como válida la descripción estadística ha
bitual incluso para períodos breves y de considerar que la evolución
tiene la naturaleza unidireccional que esperábamos.
Pero los resultados aquí mencionados son de hecho enigmáticos.
Supongamos que consideramos que el resultado es válido en todo
momento, incluso cuando el tiempo tiende a infinito. Entraremos en
tonces en contradicción con el Teorema de Recurrencia. Este nuevo
resultado dice que casi todos los sistemas evolucionarán hacia el
202 Filosofía de la física
equilibrio y permanecerán en el mismo, pero el Teorema de Recu
rrencia nos dice que casi todos los sistemas retornarán a su condi
ción original de no equilibrio un número infinito de veces. Y el resul
tado es asimismo incompatible con la mezcla. No hay ninguna
contradicción matemática, por supuesto, pues aquí sólo se ha proba
do que los resultados son válidos en tiempos finitos, breves. Más im
portante aún es que sólo son válidos en el límite indicado. En ese lí
mite no se puede seguir representando el comportamiento del
sistema como un flujo de trayectorias a partir de microestados inicia
les, de manera que las condiciones necesarias para la recurrencia y la
mezcla que había que demostrar dejan de ser válidas.
Pero no es la ausencia de una contradicción matemática lo que
es más interesante. La cuestión principal es que este modelo de apro
ximación al equilibrio, un modelo que intenta demostrar que en una
idealización apropiada es altamente probable que un sistema evolu
cione desde el no equilibrio al equilibrio y permanezca entonces en
el equilibrio, está conceptualmente muy en desacuerdo con la ideali
zación familiar desde la clarificación por los Ehrenfest del programa
de Boltzmann. En esta idealización más familiar, la recurrencia es
aceptada y la mezcla es la idealización buscada del comportamiento
del no equilibrio. Lo que se espera de la solución a la ecuación de
Boltzmann no es que represente lo que casi todo sistema hará, sino,
en lugar de ello, la «curva de concentración» de la evolución de la
distribución de probabilidades. No es «la evolución más probable»,
sino «la evolución de las condiciones más probables» lo que ha de
representar la aproximación al equilibrio.
Lo que muestra la existencia de estos dos enfoques es que
todavía no hay un acuerdo tácito sobre cuál es la idealización correc
ta que ha de utilizarse para intentar representar el comportamiento
termodinámico en términos de las probabilidades y del comporta
miento dinámico microscópico. Un auténtico conflicto sobre cómo
debería.ser construida la teoría mecánico-estadística final y cómo ese
constructo debería ser utilizado para representar el mundo divide
todavía a la comunidad de teóricos. Deberíamos observar que los
problemas derivados de la introducción de la asimetría temporal en
el enfoque de la mezcla, a los que pronto regresaremos, aparecen asi
mismo en esta «derivación rigurosa del enfoque de Boltzmann» alter
nativa. Y deberíamos observar lo diferente que son los papeles que
juega el gran tamaño del sistema en los dos enfoques. Para el enfo
La introducción de la probabilidad en la física 203
que de la mezcla, el vasto número de microcomponentes aparece
sólo al final del argumento cuando queremos pasar de los valores
medios a los valores más probables de las cantidades. Para el otro en
foque, sin embargo, el hecho de que el sistema sea un sistema muy
suavizado con un número ilimitado de pequeños componentes es
crucial para la idealización desde un principio. Incluso un sistema de
dos esferas rígidas en una caja es una mezcla, pero el Límite del Gra
do de Boltzmann es crucial para la derivación rigurosa de la ecua
ción de Boltzmann.
El problema de las distribuciones iniciales de probabilidadTrabajaremos por el momento en el ámbito de la idealización que se
vale de la mezcla del conjunto inicial para representar la aproxima
ción al equilibrio. Como ya observamos, incluso si el sistema es un
sistema mezclado, se pueden encontrar conjuntos iniciales, esto es,
distribuciones iniciales de probabilidad sobre los microestados com
patibles con la condición macroscópica original de no equilibrio, que
mostrarán la apropiada aproximación de grano grueso, uniforme, a
corto plazo, a una distribución de probabilidades en el equilibrio.
Pero también se pueden encontrar conjuntos iniciales que mostrarán
cualquier otra clase de comportamiento a corto plazo. Consideremos,
por ejemplo, la distribución de probabilidades sobre microestados
que aparece cuando una distribución aun más alejada del equilibrio
evoluciona en la forma esperada a una compatible con la condición
dada de no equilibrio del gas. La inversión temporal de la última dis
tribución de probabilidades será una distribución de probabilidades
sobre microestados compatible con la condición de no equilibrio de
nuestro sistema que evolucionará a una condición de un «equilibrio
aún menor». (Véase la figura 3.11.)
Así pues, para obtener la correcta aproximación de grano grueso,
uniforme, a corto plazo, al equilibrio necesitamos partir de. una distri
bución de probabilidades inicial «apropiada». Esencialmente, quere
mos que la probabilidad se distribuya uniformemente (en relación a
la medida estándar) sobre una región de microestados que no sea de
masiado pequeña y que tenga una forma regular. La demanda de un
tamaño suficiente es para asegurar que la distribución inicial se pro
pague en forma de grano grueso con la suficiente rapidez como para
204 Filosofía de la física
F i g u r a 3.11. Reversibilidad al nivel del conjunto. Supongamos, como en (a), que A es una región del espacio de fases que evoluciona con el tiempo a la región fibrada, T(A). Se puede entonces mostrar, como en (b), que debe haber una región fibrada de
puntos fásicos, T l(A'), que según avanza el tiempo al futuro evoluciona a una región
simple compacta, como A'. Además, A ’ y la región de la que proviene tendrán ambas el mismo tamaño que A y su sucesor fibrado.
representar el «tiempo de relajación» efectivo que tardan los sistemas
reales en alcanzar el equilibrio. La demanda de una forma regular es
para excluir las regiones que pueden ser construidas para representar
un comportamiento anti-termodinámico.
Pero ¿por qué deberían elegirse dichas distribuciones iniciales de
probabilidad? ¿Qué hay en la naturaleza del mundo que las convier
te en los conjuntos iniciales correctos a elegir para obtener los resulta
dos que representan el mundo tal como es? Una explicación fue
ofrecida por el físico N. Krylov. Este parte de una crítica a quienes
La introducción de la probabilidad en la física 205
por toda explicación de la naturaleza especial de estas distribuciones
iniciales de probabilidad alegarían tan sólo la observación de que es
así como parece estar distribuida la probabilidad sobre los estados
iniciales en el mundo. Estos teóricos negarían la posibilidad de algu
na otra explicación más profunda. (Los filósofos hablan alguna vez de
la naturaleza «meramente de /acto» de la Segunda Ley, queriendo
decir que «sucede simplemente que los estados iniciales están distri
buidos así».) Krylov insiste en que este enfoque no hará justicia a la
naturaleza legal, incluso si es sólo estadísticamente legal, de la Segun
da Ley. También arguye que no puede hacer justicia al hecho de que
para los sistemas que son intermediarios en el proceso de eyolución
desde una condición de no equilibrio inicial hasta una de equilibrio,
dicha distribución de probabilidades uniforme en relación a su des
cripción macroscópica intermediaria no puede ser cierta, puesto que
sabemos que provenían de un estado inicial determinado aún más le
jos del equilibrio. Pero dichos sistemas obedecerán todavía a la Se
gunda Ley.
Krylov, cuya teoría positiva nunca recibió una exposición adecua
da debido a su muerte prematura, explica la naturaleza especial de la
distribución de probabilidades inicial apoyándose en un argumento
procedente de las primeras tentativas de entender la mecánica cuánti
ca. En el capítulo 4 discutiremos el denominado Principio de Incerti-
dumbre de la mecánica cuántica. Este principio nos dice que es impo
sible especificar simultáneamente la posición y la velocidad de una
partícula a un grado arbitrario de precisión. Una temprana interpreta
ción de este principio, hoy en día no aceptada ya por la mayoría de
quienes se ocupan de estas cuestiones, fue que el intento de nuestra
parte de medir una de las dos cantidades interfería físicamente con el
sistema de forma tal que «perturbaba» el valor existente de la otra
cantidad. Esta interacción física del observador con el sistema obser
vado era lo que generaba la «incertidumbre». Krylov arguye que la
sensibilidad de un sistema a una pequeña perturbación en su estado
inicial, de manera que una ligera variación en la posición o velocidad
de una sola molécula cambie sustancialmente la microevolución futura
del sistema, nos da un Principio de Incertidumbre de un «nivel supe
rior» al tratar con los sistemas de la termodinámica. A esta interferen
cia con el sistema, cuando el sistema está preparado en esta condición
de no equilibrio, se debe que la distribución de probabilidades sobre
los microestados tenga el tamaño y la regularidad apropiados.
2D6 Filosofía de la física
No está claro cómo podría hacerse que esto funcionase en sus
pormenores. Pero hay, además, un problema más profundo. ¿Qué
constituye la «preparación» de un sistema? Supongamos que exami
namos un sistema que está en no equilibrio en el momento de ser
creado (es decir, separado energéticamente del resto del universo).
También lo examinamos en el momento de ser destruido (es decir,
reintegrado al mundo exterior). Conviene suponer que a partir de la
condición inicial de no equilibrio tenderá a aproximarse al equili
brio. Así, la distribución de probabilidades apropiada sobre los mi
croestados en el instante inicial es la estándar. Pero si hiciésemos la
misma suposición respecto al estado final del sistema, nos veríamos
llevados a inferir, erróneamente, que este estado era una fluctuación
espontanea de estados más próximos al equilibrio. ¿A qué se debe
que sea apropiado atribuir la distribución estándar de probabilidades
sobre los microestados al comienzo de la evolución de los sistemas,
pero no al final?
Bien, el estado inicial es la forma en que el sistema ha sido «pre
parado». El estado final es el resultado, no de la preparación, sino de
la evolución. Pero, ¿qué constituye la preparación y por qué ella, y
solo ella, habría de tener la característica de requerir la correcta dis
tribución de probabilidades termodinámica sobre los microestados
asociados con los macroestados obtenidos por ella? Esencialmente, la
asimetría temporal de la mecánica estadística está siendo introducida
a través de la suposición de que siempre son los primeros estados de
los sistemas aislados los que están «preparados» y nunca sus estados
íinales. Intuitivamente pensamos que es cierto, pero dar un significa
do coherente a lo que la intuición capta, que no sea reiterar la asime
tría que queríamos explicar en primer lugar, es una cuestión intrin
cada.
Lna solución diferente, y más radical, al problema ha sido ofreci
da por I. Prigogine. Su solución presenta vanos elementos. Primero,
adopta el punto de vista extremadamente radical de que los sistemas
individuales no tienen microestados exactos. Mantiene, en lugar de
ello. que la inestabilidad radical de la dinámica significa que el mi
croestado exacto de un sistema, según se postula en la dinámica sub
yacente habitual, es una falsa idealización. Considera que la distribu
ción de probabilidades sobre microestados utilizada en mecánica
estadística debería ser considerada como caracterizadora del sistema
individual. Esta distribución de probabilidades, sostiene, no caracte
La introducción de la probabilidad en la física 207
riza a un supuesto colectivo compuesto por muchos sistemas cada
uno de los cuales tiene un microestado exacto. Una vez más, la mecá
nica cuántica y su interpretación son relevantes aquí. Como veremos,
existen «pruebas de variables no ocultas» en la teoría cuántica. Estas,
se alega algunas veces, nos demuestran que la característica de «in
certidumbre» de los sistemas en mecánica cuántica debería ser consi
derada como irreducible. No hay, se afirma, parámetros subyacentes,
ni siquiera incognoscibles, que determinen exactamente el curso fu
turo del sistema.
Ahora bien, en el caso de la mecánica estadística no encontramos
desde luego semejantes demostraciones de la no existencia de un mi
croestado enteramente determinista. De hecho, la posibilidad de in
versiones exactas del comportamiento, tal como ilustran los resulta
dos del eco-espín mencionados anteriormente, hacen de la negación
de un microestado exacto una pretensión bastante dudosa. Pero las
restantes partes de la concepción de Prigogine no dependen, en reali
dad, para su defensa de esta concepción ontológica radicalmente
nueva.
Prigogine esboza métodos por los que la distribución de proba
bilidades original, cuya evolución siguió las leyes invariantes bajo in
versión temporal derivadas de las leyes simétricas en el tiempo de
la dinámica subyacente, puede ser transformada en una nueva «re
presentación» con una evidente asimetría temporal en su evolución.
Esto funciona en casos en los que se da una condición de «caos» su
ficientemente fuerte, como es que el sistema sea un sistema K. Lo
que sucede aquí no es nada misterioso. Si un sistema tiene las carac
terísticas de mezcla adecuadas, mostrará una aproximación temporal
de grano grueso al equilibrio, aun cuando su evolución sea reversible
temporalmente en el micronivel. Las técnicas utilizadas aquí para
pasar a la nueva representación muestran esencialmente cómo este
comportamiento de grano grueso de la distribución de probabilida
des original puede ser reflejado en una nueva forma de representar
las estadísticas del conjunto de manera que la asimetría temporal, re
presentada solamente en el sentido de grano grueso en la representa
ción original, es ahora incorporada en la nueva forma de caracterizar
la distribución de probabilidades. Esta nueva distribución de proba
bilidades está determinada unívocamente dada la original y determi
na a ésta de manera unívoca. Genera los mismos valores medios de
todas las cantidades generados por la distribución de probabilidades
208 Filosofía de la física
original y es, por lo tanto, «estadísticamente equivalente» a la repre
sentación original.
¿Resuelve la existencia de dicha nueva representación de la pro
babilidad el problema de la asimetría temporal? No. Una razón para
esta respuesta negativa es que también hay una nueva representación
de la distribución de probabilidades original que es manifiestamente
antitermodinámica. Así como la distribución inicial se aproximaba en
la forma de grano grueso al equilibrio conforme el tiempo tendía a
menos infinito, así como a más infinito, así también hay dos transfor
maciones de la misma a una nueva representación — una que ma
nifiesta un comportamiento termodinámico y la otra antitermodiná-
mico.
Así pues, ¿de dónde procede la asimetría temporal? Prigogine
piensa que uno no puede captar esto utilizando una distribución de
probabilidades inicial no patológica, pues cualquiera de dichas distri
buciones tenderá en la forma de grano grueso al equilibrio en el lími
te de tiempo infinito, tanto en el futuro como en el pasado. En lugar
de ello, sugiere, deberíamos prestar atención a ciertas distribuciones
iniciales «singulares», unas que concentren toda la probabilidad en
una región de probabilidad cero en la medida estándar. Ahora bien,
en la representación original, semejante distribución inicial singular
no podría aproximarse a la distribución de equilibrio ni siquiera en
el sentido de grano grueso, pues siempre evolucionaría hacia una
nueva distribución cuyo tamaño es cero en la medida estándar. Pero,
señala Prigogine, puede suceder que, si bien la nueva representación
de la distribución original es también singular y de tamaño cero, las
nuevas representaciones de las distribuciones hacia las que evolucio
na puede que no sean singulares. Puede que, de hecho, evolucionen
hacia la distribución de equilibrio. Y si se elige adecuadamente la
distribución inicial singular, esto es justamente lo que ocurre. Quizá,
pues, la solución a la asimetría temporal se encuentre en la regla se
gún la cual, en la mecánica estadística, los sistemas físicos que co
menzaron en no equilibrio están siempre representados adecuada
mente por estos tipos de distribuciones de probabilidad inicial
singular.
¿Es ésta la respuesta? Yo creo que no. Primero, es importante
observar que también habrá distribuciones iniciales singulares de
probabilidad que son intrínsecamente antitermodinámicas. Éstas, cla
ro está, no pueden representar sistemas reales. Pero ¿no estábamos
La introducción de la probabilidad en la física 209
buscando la razón física de por qué es posible un tipo de comporta
miento y no el otro? Nosotros no pretendíamos solamente encontrar
una forma más de «enchufar» una característica asimétrica a nuestra
representación del mundo. Peor aún, el uso de dichas distribuciones
iniciales singulares de probabilidad parece inapropiado para algunos
casos físicos reales. Una situación que se adecúa al modelo de Prigo
gine sería, por ejemplo, un haz de partículas perfectamente paralelo.
Éste es un estado inicial de «probabilidad cero». Dicho haz perdería,
claro está, su asombrosa coherencia y orden originales, siendo esta
pérdida representada por la difuminación de la representación trans
formada de la distribución de probabilidades originalmente singular
elegida para representar el sistema. Pero ahora consideremos un gas
confinado én el lado izquierdo de una caja. Removamos la partición
que la divide por la mitad. La distribución de probabilidades inicial
apropiada en este caso no será una cuya probabilidad esté confinada
a una región de tamaño cero, ni siquiera una aproximación de una
distribución singular semejante. En su lugar, la forma correcta de re
presentar la física aquí sería la de una evolución de grano grueso al
equilibrio de una distribución inicial que no está, originalmente, difu-
minada en forma de grano grueso sobre la totalidad de microestados
disponibles, pero que tampoco está, originalmente, confinada a una
región de tamaño cero.
La cuestión es que los conjuntos iniciales correctos mostrarán
una evolución hacia el equilibrio incluso a corto plazo. Éstos pueden
representar correctamente la física incluso si en el límite de tiempo
infinito tienden hacia el equilibrio (en sentido estricto) en ambas di
recciones temporales. Los conjuntos iniciales singulares de Prigogine
parecen ser innecesarios y algunas veces no representan adecuada
mente las situaciones físicas reales de interés.
Cosmología e irreversibilidad¿Cuál, pues, es la razón física de la asimetría temporal? Prestemos
atención a un enfoque popular. Éste se funda en los resultados de la
cosmología. Como señalamos anteriormente, ya Boltzmann se había
valido de presuposiciones especulativas acerca de la estructura global
del universo a fin de reconciliar sus concepciones finales sobre el
equilibrio con los hechos observables sobre el predominio del no
210 Filosofía de la física
equilibrio en el mundo tal como lo encontramos. Revisemos un ins
tante la estructura de las afirmaciones boltzmannianas: Primero, el
universo es extenso en el espacio y en el tiempo. Se encuentra en la
mayoría de las regiones del espacio y en la mayoría de los períodos
de tiempo cerca del equilibrio. Pero hay pequeñas regiones que se
desvían del equilibrio durante breves instantes de tiempo. Segundo,
podemos esperar encontrarnos a nosotros mismos en una de dichas
regiones fluctuantes, puesto que solamente en una región semejante
podrían evolucionar y sobrevivir observadores. Tercero, la entropía
aumenta en la dirección futura del tiempo en nuestra región porque
por dirección futura del tiempo entendemos la dirección del tiempo
en la que aumenta la entropía de los sistemas, es decir, en la que lo
calmente éstos se mueven en paralelo unos con otros hacia el equili
brio.
Ahora bien, nosotros nos encontramos en un universo lejos del
equilibrio. Y hallamos que el aumento de entropía de sistemas aisla
dos temporalmente se produce en la misma dirección, la dirección
que llamamos el futuro. ¿Puede lo que ahora se sabe sobre la estruc
tura cosmológica, global, del universo darnos una explicación de
esto?
La imagen del cosmos que nos presenta la cosmología contempo
ránea es muy diferente a la del universo inactivo en su conjunto de
Boltzmann. El universo, o al menos esa parte accesible a nuestra ins
pección observacional, parece haber estado concentrado en un punto
singular de energía material hace diez billones de años. Desde enton
ces, el universo ha estado expansionándose. No se sabe si dicha ex
pansión continuará eternamente o si, por el contrario, volverá a con
traerse en algún momento para convertirse de nuevo en una
singularidad. Eso depende de la densidad de masa (energía material)
en el universo. El universo como un todo parece obedecer a la Se
gunda Ley, con un aumento de su entropía en la dirección futura del
tiempo.
Este aumento de entropía necesita una explicación. Aquí el
estado termodinámico de la condición singular que se dio en el ori
gen es crucial. Habitualmente se presupone que la materia estaba ori
ginalmente en una condición uniforme de equilibrio, siendo el
estado ordinario de las estrellas calientes, brillando en el espacio frío,
una clara situación de no equilibrio, una evolución ulterior. Pero
¿significa esto que la entropía disminuyó con el tiempo? No necesa
La introducción de la probabilidad en la física 211
riamente. La disminución entrópica en la materia fue, de acuerdo
con la mayoría de los teóricos, «pagada» con un vasto aumento en la
entropía del campo gravitacional o, si queréis, del espacio-tiempo
mismo. El espacio-tiempo, originalmente uniforme, desarrolló «gránu-
los» a medida que la materia pasó de su condición uniforme original
a su condición actual alejada de la uniformidad. Por razones especia
les relacionadas con la naturaleza puramente atractiva de la grave
dad, esta transformación de un espacio-tiempo suave en uno granula
do corresponde a un aumento de su entropía. Uno podría, pues,
achacar el aumento de entropía del cosmos a su condición espacio-
temporal original altamente organizada y de muy baja entropía.
¿Por qué habría de ser la.condición original una de baja entropía?
De todas las condiciones originales posibles, ésta es una «altamente
improbable». Aquí se ponen a prueba los límites mismos de la expli
cación científica. Nos vemos obligados a aceptar sencillamente como
un hecho que así fueron las cosas, pese a haber sido sugeridas una
diversidad de «explicaciones» de este hecho. Es importante observar
que la expansión del universo no es responsable por sí sola del au
mento de entropía. En un universo en contracción, según el punto
de vista prevalente, la entropía continuaría aumentando, conducien
do a una singularidad final, de naturaleza intrínsecamente compacta.
La inversión temporal de dicha recontracción sería compatible con
todas las leyes y representaría un universo en expansión con entropía
decreciente. La naturaleza especial del big bang y el big cruncb, siendo
el primero de baja entropía y el segundo de alta entropía, es lo que
distingue a un universo en el que la expansión seguida de una con
tracción es acompañada por un aumento, en lugar de por una dismi
nución, de la entropía.
¿Se funda entonces la Segunda Ley de la Termodinámica en su
aplicación a los sistemas individuales pequeños en el estado original,
singular, de baja entropía, del universo? Cuando se intenta que esta
concepción funcione,.surgen problemas. La propuesta habitual es tra
bajar con la noción de sistema derivado. Un sistema derivado es un
sistema individual aislado que originalmente estuvo en contacto
energético con el mundo exterior, fue posteriormente aislado del
mismo durante un tiempo y, finalmente, fue unido de nuevo al mis
mo al final de su tiempo de vida finito.
Supongamos que tenemos un sistema derivado aislado en una
condición lejos del equilibrio. Como el universo a nuestro alrededor
212 Filosofía de la física
está claramente en un estado de no equilibrio, es mucho más razona
ble suponer que el no equilibrio del sistema derivado es el resultado
de haber sido «separado» del sistema global en no equilibrio, a supo
ner que la condición de no equilibrio del sistema derivado es el re
sultado de una de las extrañísimas fluctuaciones del equilibrio espe
radas incluso en sistemas totalmente aislados.
Imaginemos ahora un gran número de sistemas derivados, cada
uno al comienzo de su vida y todos en una condición común de no
equilibrio. No podemos inferir un comportamiento para los sistemas,
puesto que no tienen una vida pasada, habiendo comenzado a existir
sólo recientemente como sistemas derivados. Si ahora hacemos la su
posición de que la distribución de probabilidades sobre los microes
tados de los sistemas es del tipo estándar, podemos inferir que en un
tiempo breve en el futuro el punto de concentración de los estados
del sistema estará más cerca del equilibrio. Este es el conocido mo
delo de Boltzmann. Descansa en una suposición probabilística acerca
de la distribución de microestados compatible con una condición
macroscópica dada. Pero, se alega, esta suposición no es de por sí asi
métrica en el tiempo. Así pues, el paralelismo de la evolución de los
sistemas derivados, el hecho de que el aumento de entropía de uno
tendrá lugar probablemente en la misma dirección temporal que el
aumento de entropía en cualquiera de los otros, ha sido derivado
simplemente de los resultados cosmológicos, del hecho de que los
sistemas son sistemas derivados y de una suposición probabilística
acerca de las microcondiciones iniciales que no es intrínsecamente
asimétrica en el tiempo.
H. Reichenbach dio una versión formal de este argumento. Rei-
chenbach coloca los estados de una colección de sistemas derivados
en una tabla, con los estados posteriores a la derecha de los anterio
res y los sistemas colocados en una lista vertical. Suponiendo que la
evolución de cada sistema es estadísticamente independiente de la
de todos los demás y suponiendo que los cambios en las distribucio
nes de los microestados en las columnas verticales (es decir, distribu
ciones de microestados sobre la pluralidad de sistemas de un tiempo
a otro) duplican los cambios esperados en un solo sistema a lo largo
del tiempo, es capaz de mostrar que, si la columna de la izquierda en
dicha tabla corresponde al no equilibrio, en el límite del tiempo ten
diendo a más infinito, la columna de la derecha representará el equi
librio. A dicha tabla la llama una «red de mezcla».
La introducción de la probabilidad en la física 213
¿Introduce realmente esta técnica la explicación del comporta
miento paralelo en el tiempo del cambio de entropía de los sistemas
en la imagen sin simplemente presuponerla? Pienso que no. Habi
tualmente se supone que la dirección del tiempo en la que se produ
ce un aumento paralelo de la entropía en los sistemas derivados es la
misma dirección temporal en la que aumenta la entropía del univer
so como un todo. Pero, curiosamente, la dirección del cambio de en
tropía del universo nunca se utiliza en el argumento. Lo único que se
utiliza es el hecho de que el universo está lejos del equilibrio, no la
dirección de su cambio entrópico. Esto sugiere que el paralelismo
entre unos sistemas derivados y otros también puede haber sido «in
troducido subrepticiamente» en el argumento.
De hecho, yo creo que lo ha sido. Suponed que consideramos
una colección de sistemas derivados, partiendo la mitad de ellos de
un estado de no equilibrio y terminando la otra mitad en el mismo
estado de no equilibrio. Ahora distribuidlos en una red al estilo Rei
chenbach con su estado de no equilibrio a la izquierda. La misma
clase de suposiciones que hicimos anteriormente nos llevará a espe
rar que los estados de los sistemas en o cerca del equilibrio estén a la
derecha. Pero eso correspondería a sistemas que habían partido del
no equilibrio y se aproximaron al equilibrio en el futuro y conduciría
a la inferencia de que los sistemas que terminaron en el no equilibrio
habían estado cerca del equilibrio ¡en el pasado distante! Esto, por
supuesto, es la inferencia errónea. Deberíamos inferir que los siste
mas que terminaron en el no equilibrio procedían de sistemas aisla
dos aún más alejados del equilibrio en el pasado.
Lo que ha sucedido aquí es algo con lo que estamos familiariza
dos a estas alturas. Es razonable imponer la distribución de probabi
lidades estándar a los microestados de un sistema en no equilibrio, si el estado de no equilibrio es un estado verdaderamente inicial en re
lación al proceso que uno está infiriendo. Es ilegítimo —da los resul
tados incorrectos— utilizar dicha distribución de probabilidades
para retrodecir el comportamiento de un sistema a partir de su con
dición de no equilibrio, si esa condición es una condición final y no
inicial en relación al proceso que pretendemos inferir. Esto es justa
mente reiterar el hecho de que los sistemas muestran efectivamente
un comportamiento termodinámico (es decir, aproximación al equili
brio) en una dirección temporal paralela y, de hecho, en la dirección
del tiempo que llamamos el futuro. Pero los argumentos que acaba
214 Filosofía de la física
mos de examinar no proporcionan una explicación física del hecho.
Antes bien, lo incluyen una vez más como un postulado en su des
cripción del mundo. La cosmología por sí misma, incluyendo el big bang su baja entropía, la expansión del universo y el aumento de en
tropía de ese universo en la dirección temporal en la que se está ex
pandiendo, no parece proporcionar la explicación del paralelismo en
el tiempo del aumento de entropía de los sistemas derivados. De he
cho, el comportamiento del cosmos según la Segunda Ley parece, des
de esta perspectiva, sólo un ejemplo más del comportamiento legal es
tadístico general de los sistemas, ya sean cosmológicos o derivados.
Así pues, el origen del comportamiento paralelo en el tiempo de
los sistemas sigue siendo en lo que a su incremento entrópico respec
ta algo misterioso. Sabemos cómo representar la asimetría en mecáni
ca estadística imponiendo una distribución de probabilidades sobre
los microestados de sistemas en no equilibrio solamente en una for
ma temporal asimétrica. Debemos suponer que la hipótesis estadísti
ca usual sobre cuán probable es un microestado es válida sólo si
tomamos el macroestado que estamos considerando como inicial, y
sólo si vamos entonces a utilizar la hipótesis estadística para inferir el
comportamiento futuro y no el pasado del sistema. Pero el por qué se
da el paralelismo temporal del aumento de entropía sigue siendo un
enigma.
Pero supongamos que el paralelismo se da efectivamente.
Todavía podríamos preguntarnos cómo es que la entropía crece en la
dirección futura del tiempo y no en la pasada. Aquí debemos una vez
más considerar la brillante sugerencia de Boltzmann de que el signifi
cado mismo de la distinción pasado-futuro de las direcciones del
tiempo se funda de por sí en el aumento paralelo de entropía. De
acuerdo con Boltzmann, y aquellos que le siguieron, lo que quere
mos decir con dirección «futura» del tiempo es justamente la direc
ción del tiempo en la que la entropía aumentará con una probabili
dad abrumadora. ¿Es esto plausible? Volveremos a esta cuestión en
«El problema de la dirección del tiempo».
ResumenLa estructura de las explicaciones probabilísticas en mecánica esta
dística es, como hemos visto, muy compleja. Sería muy agradable po
der informar que disponemos de una solución simple a todas las difi
La introducción de la probabilidad en la tísica 215
cultades que acabamos de revisar, pero no es el caso. Las cuestiones
aquí siguen siendo muy controvertidas, a pesar del hecho de que
estos problemas han sido explorados durante más de un siglo.
Hemos visto que uno puede dar una explicación interesante de
las características del equilibrio identificándolas con ciertos aspectos
de un sistema que se manifiestan en el límite de tiempo infinito. Pero
el tipo de «explicación» sobre los fenómenos observados que obtene
mos así dista mucho de la clase de explicación involucrando proba
bilidades que cabría esperar a tenor de las descripciones que los filó
sofos dan de la explicación estadística.
Cuando pasamos al caso de no equilibrio, la estructura explicati
va se parece más a la esbo&da por los filósofos. Pero subsisten mu
chos enigmas. Algunas descripciones de la aproximación al equilibrio
invocan el no aislamiento del sistema o la posibilidad de leyes de la
naturaleza no simétricas en el tiempo. Otras explicaciones descansan
sobre supuestas reglas generales de inferencia probabilística. Los en
foques más estándar descansan en la inestabilidad de las dinámicas
microscópicas del sistema y en el vasto número de microcomponen-
tes que forman el sistema. Pero incluso en el seno de estos enfoques
estándar, como hemos visto, hay ideas enfrentadas sobre el modelo
apropiado que ha de utilizarse y sobre la noción apropiada de expli
cación estadística a la que apelar.
También hemos visto cómo en el seno de los enfoques estándar
el problema del conjunto inicial o de la distribución de probabilida
des inicial correctos es crucial. Cómo elegir la correcta de dichas dis
tribuciones iniciales de probabilidad y, una vez elegida ésta, cómo
explicar por qué puede suponerse legítimamente válida en el mundo,
siguen siendo cuestiones abiertas. El problema fundamental de la asi
metría de los sistemas en el tiempo forma parte de este problema del
conjunto inicial.
Finalmente, hemos visto cómo, aunque uno invoque la asimetría
global en el tiempo del universo como un todo, el problema de la
asimetría en el tiempo de los sistemas individuales permanece abier
to. El problema general de adecuar el comportamiento termodinámi-
co de los sistemas a la descripción general de la dinámica de sus par
tes microscópicas sigue requiriendo un mayor conocimiento, no sólo
de la física de los sistemas, sino también de la estructura misma de lo
que consideramos como explicaciones probabilísticas legítimas en
nuestra descripción teórica del mundo.
216 Filosofía de la física
Hemos visto que la inestabilidad de las trayectorias dinámicas
del sistema contribuye al comportamiento predecible, estable, del sis
tema al nivel macroscópico. Sin embargo, la inestabilidad puede ser
también una característica del comportamiento macroscópico del sis
tema. A partir del trabajo de Poincaré, los físicos han descubierto
que el comportamiento de los sistemas es con frecuencia fundamen
talmente irregular e impredecible incluso al nivel de las descripcio
nes macroscópicas. Muchos sistemas pueden ser descritos por un pa
rámetro que caracteriza alguna propiedad del sistema. Para algunos
valores de este parámetro, el sistema mostrará un comportamiento
regular, pero para otros valores, el comportamiento del sistema varia
rá tan sensiblemente con su estado inicial que cualquier esperanza de
predecir el comportamiento futuro del sistema será vana. Tales siste
mas deterministas, pero irregulares, son llamados caóticos.
La descripción de los sistemas caóticos ha introducido un nuevo
ámbito de comportamiento en la física, un ámbito en el que los mo
dos de pensamiento probabilísticos pasan a ser herramientas impor
tantes. Y con estos nuevos modos de descripción surgen nuevas cues
tiones filosóficas. En el momento actual, los filósofos están ocupados
con algunas de estas cuestiones, tales como la definición de un siste
ma caótico, los modos de explicación utilizados en la caracterización
del comportamiento de dichos sistemas, y las cuestiones generadas
por el hecho de que los sistemas pueden ser completamente determi
nistas, pero presentar un comportamiento macroscópico fundamen
talmente impredecible. Aunque no será posible echar un vistazo a
estas cuestiones aquí, en las lecturas sugeridas al final de este capítu
lo hemos indicado algunas lecturas introductorias a este nuevo y ex
citante campo.
El problema de «la dirección del tiempo»
Las discusiones de las tesis de Boltzmann a menudo van acompaña
das por debates sobre si la asimetría entrópica representa una asime
tría del «tiempo mismo» o simplemente una asimetría del comporta
miento de los sistemas físicos en el tiempo. Los defensores de la
primera tesis señalan habitualmente la naturaleza profunda y preva-
lente de la asimetría. Los defensores de la segunda afirmación hacen
referencia con frecuencia a otros hechos sobre el mundo que son asi
l l -introducción de la probabilidad en la física 217
métricos temporalmente, pero en los que la asimetría no está genera
da por leyes de la naturaleza subyacentes asimétricas en el tiempo.
Éstos arguyen que únicamente las asimetrías legales podrían llevar
nos a inferir una asimetría del tiempo mismo.
Aquellos que mantendrían que la asimetría entrópica no refleja
una asimetría en la naturaleza subyacente del tiempo normalmente
tienen en mente que deberíamos postular asimetrías del espacio-
tiempo sólo cuando se necesitan para explicar asimetrías de las leyes
de la naturaleza. Un ejemplo, indicado en el capítulo 2, sería la pos
tulación de una diferencia espacio-temporal subyacente para explicar
la distinción legal en la naturaleza entre movimiento inercial y no
inercial. Sin dicha asimetría legal, arguyen, no se necesita postular
ninguna asimetría del espacio-tiempo mismo subyacente. Aquellos
que piensan que la asimetría entrópica nos exige que concibamos al
tiempo mismo como asimétrico negarán que la asimetría entrópica,
con su alcance fundamental y universal, pueda ser reducida a cual
quier «mera» asimetría de los sistemas. Se requiere, arguyen, una ex
plicación más profunda en la asimetría del tiempo mismo.
Como vimos en el capítulo 2, la noción misma de una estructura
espacio-temporal que explique alguna característica estructural entre
las cosas del mundo es de por sí muy problemática. Desde el punto
de vista de muchos relacionistas, dista de estar claro que tenga algún
sentido plantear la cuestión de si la asimetría del aumento de entro
pía es meramente una asimetría estadística universal de los sistemas
físicos en el tiempo o, por el contrario, representa una asimetría sub
yacente del tiempo mismo.
En cualquier caso, las cuestiones cruciales para Boltzmann no
dependerían de la respuesta a estas cuestiones. Boltzmann quiere
vindicar que nuestra distinción intuitiva entre pasado y futuro puede
«fundarse» en la asimetría entrópica. Se esfuerza en vindicar que si
hay partes locales del universo donde la entropía «corre hacia atrás»,
esto es, en la dirección temporal opuesta a aquella en la que crece en
nuestra región del universo, los recuerdos de la gente lo serían tam
bién de sucesos acontecidos en lo que denominamos la dirección fu
tura del tiempo, como lo serían sus registros. Y ellos pensarían que la
causalidad discurre desde esa dirección del tiempo que considera
mos el futuro a esa dirección del tiempo que consideramos el pasa
do. Pensarían en los sucesos en la dirección temporal que llamamos
futuro como fijos y determinados, y en los sucesos en la dirección
218 Filosofía de la física
temporal que llamamos pasado como abiertos. Pero, por supuesto,
según las tesis de Boltzmann, ellos, como nosotros, afirmarían recor
dar el pasado y tener registros del mismo y pensarían en la causali
dad como discurriendo del pasado al futuro. Ellos llamarían a la di
rección del tiempo que nosotros llamamos futuro la dirección
temporal pasada, y llamarían a lo que nosotros llamamos la dirección
temporal pasada el futuro del tiempo.
Algunas veces, la gente defiende las tesis de Boltzmann señalan
do que solamente a partir de hechos entrópicos es como podemos
determinar si una película está siendo proyectada en la dirección co
rrecta o, por el contrario, está siendo pasada hacia atrás por un pro
yector. Otros critican las tesis de Boltzmann señalando que para los
sucesos reales apenas necesitamos averiguar las características entró-
picas de los sistemas para determinar qué sucesos son posteriores a
qué otros. Estos dos argumentos, sin embargo, fallan por no entender
bien cuál es la tesis de Boltzmann.
Algunas veces los filósofos afirman que un dominio conceptual
se reduce a otro porque el significado mismo de las proposiciones en
uno de los dominios viene dada por afirmaciones en el otro. El argu
mento aquí es habitualmente que todos nuestros medios de deter
minar la verdad o falsedad de las proposiciones de la primera clase
dependen de proposiciones de la segunda clase. Así pues, el fe-
nomenalista arguye que hablar sobre objetos materiales se reduce a
hablar sobre datos sensoriales en la mente, y el relacionista espacio-
temporal arguye que toda conversación sobre el espacio y el tiempo
se reduce a una conversación sobre relaciones espaciales y tempora
les entre cosas y sucesos materiales. Pero yo no creo que sea razona
ble pensar que Boltzmann está afirmando que todo nuestro conoci
miento de la dirección en el tiempo que los sucesos tienen unos
respecto a otros lo derivamos de nuestro conocimiento acerca de las
relaciones entrópicas de los estados de unas cosas respecto a otras en
el tiempo. No es ese tipo de reducción filosófica de la asimetría tem
porada una asimetría entrópica lo que él tiene en mente.
Su noción de reducción, antes bien, está más cerca de lo que el
científico tiene presente al afirmar que la teoría de la luz se reduce a
la teoría del electromagnetismo, o cuando afirma que el hablar sobre
mesas se reduce a hablar sobre ordenaciones de átomos. Las ondas
luminosas son ondas electromagnéticas, según hemos descubierto, y
las mesas son ordenaciones de átomos. Es algo de este estilo lo que
La introducción de la probabilidad en la física 219
Boltzmann quiere decir cuando afirma que la asimetría futuro-pasado
del tiempo es justamente la dirección temporal fijada por los resulta
dos del aumento de entropía. Pero ¿qué tipo de afirmación es ésta?
Boltzmann nos habría hecho reflexionar sobre nuestra noción de
la dirección abajo en el espacio. Para Aristóteles, la dirección abajo
es una noción primitiva. El probablemente creía que en todos los
puntos del espacio existía una dirección abajo y que todos estos
«abajo» estaban en la misma dirección espacial. Pero ahora sabemos
que «abajo» es sólo la dirección en la que está apuntando la fuerza
gravitacional local. Ahora comprendemos que hay regiones del uni
verso en las que no hay una dirección abajo ni tampoco una arriba, y
aceptamos sin dificultad que 4a dirección abajo para alguien que se
encuentre en Australia no sea paralela a la de alguien que se encuen
tre en Nueva York. Esto es lo que sucede con la distinción pasado-
futuro, afirma Boltzmann. Donde no hay una asimetría entrópica
local, no hay una distinción futuro-pasado, aunque, por supuesto, hay
todavía dos direcciones opuestas del tiempo. Y donde los aumentos
de entropía tienen direcciones opuestas en el tiempo, sucede igual
con la distinción pasado-futuro.
¿Qué se necesitaría para justificar esa afirmación? Ni siquiera
una asociación legal del aumento de entropía con una dirección tem
poral intuitiva sería suficiente por sí sola para justificar la afirmación
de Boltzmann. Para ver que esto es así, necesitamos solamente obser
var que ahora parece claro que ciertos procesos entre micropartícu-
las de materia no son simétricos entre sistemas dextro- y levógiros.
Existe una asimetría legal entre derecha e izquierda en la naturaleza
que se revela, por ejemplo, en el hecho de que ciertos procesos de
desintegración que involucran partículas giratorias son posibles,
mientras las imágenes especulares de estos procesos no lo son. Pero
¿se sentiría alguien inclinado a argüir que nuestra misma distinción
entre lo que es un guante de la mano izquierda y lo que es uno de la
mano derecha, por ejemplo, depende en algún sentido de esa asime
tría legal en la naturaleza que estamos considerando? No por mucho
tiempo, pienso. No sólo no distinguimos la izquierda de la derecha
utilizando estos procesos espacialmente asimétricos, sino que nada
de la existencia o inexistencia de dichos procesos parece tener algo
que ver con la explicación de porqué se da la familiar distinción iz
quierda-derecha en nuestro esquema conceptual intuitivo. Pero es
muy diferente con la gravedad y el «abajo». Nos sentimos inclinados
220 Filosofía de la física
a decir que, incluso si no existiesen los procesos asimétricos descu
biertos recientemente por la física, la distinción izquierda-derecha
todavía existiría. Pero si no hubiera ninguna fuerza gravitacional, no
existiría simplemente una distinción arriba-abajo, ni en la naturaleza,
ni en nuestro esquema conceptual para tratar con la naturaleza.
La diferencia entre los dos casos es, pienso, la siguiente: En el
caso de la gravedad y el «hacia abajo», creemos que todos los hechos
relevantes sobre la dirección hacia abajo — que las rocas caen y los
globos de helio se elevan, por ejemplo— son explicados por los he
chos sobre la gravedad. Incluso el hecho de que podamos decir, sin
inferencia, qué dirección es la dirección hacia abajo es explicado por
los efectos de la gravedad sobre el fluido en nuestros canales semicir
culares. Pero nada sobre nuestras distinciones intuitivas entre objetos
dextrógiros y levógiros queda explicado en términos de los procesos
de la física que violan la denominada conservación de paridad. La
cuestión crucial es, pues, la siguiente: ¿se parece la conexión entre la
distinción futuro-pasado y la asimetría del aumento de entropía más
a la establecida entre la distinción arriba-abajo y la gravedad, como
Boltzmann pensaba, o se parece más a la conexión entre la distinción
izquierda-derecha y los procesos subatómicos que violan la simetría
de orientación?
Para responder a esta cuestión, tendríamos que caracterizar
todos esos aspectos fundamentales de la experiencia que tomamos
como básicos para la determinación de la distinción intuitiva futuro-
pasado. Después tendríamos que explorar la cuestión de si podría
mos explicar todos estos fenómenos asimétricos utilizando la asime
tría entrópica como el único factor asimétrico explicativo. Se han
llevado a cabo tentativas justamente en este sentido, pero por el mo
mento dejan mucho que desear.
Sin duda, una de las distinciones intuitivas más importantes entre
pasado y futuro es que hay trazos o registros del pasado, pero no del
futuro. Incluso la memoria, quizás, pueda considerarse como un sis
tema de registros del pasado. Pero ¿porqué tenemos registros y re
cuerdos del pasado y no del futuro?
Una respuesta a esta cuestión, dada por Reichenbach, se centra
en lo que él llamaba macroentropía. Aquí no es el orden y desorden
de los microconstituyentes de la materia lo que se cuestiona, sino di
chas clases más aparentes de orden y desorden que distinguirían,
pongamos, una disposición ordenada de objetos de tamaño medio de
La introducción de la probabilidad en la tísica 221
una colección caótica y desordenada de dichos objetos. ReiihiMibach
arguye que cuando encontramos un sistema con una macroentropiu
menor de la que habríamos esperado normalmente, debemos dar
cuenta de este macroestado improbable. Arguye que no es probable
que un microsistema de baja entropía sea una fluctuación espontanea
de un sistema aislado desde un microestado de alta entropía, sino
que es más fácil que se trate de un sistema que interaccionó con el
entorno exterior en el pasado. Después arguye que un sistema que
posea una macroentropía baja precisa también haber interaccionado
con el exterior para haber generado esa macroentropía baja. Una ma
croentropía baja, entonces, nos permite también inferir una interac
ción en el pasado. Y, afirma, esta inferencia de una interacción pasa
da es lo que aporta lo que entendemos por registro o traza.
Su ejemplo favorito es la huella sobre la arena de la playa. Espe
ramos encontrar una playa de macroentropía alta, esto es, una playa
suave con los granos de arena distribuidos aleatoriamente. Al encon
trar la huella, podemos inferir una interacción pasada de la playa con
algo diferente, el pie que produjo la huella. Así la huella es un regis
tro o traza de un suceso pasado.
Pero esta explicación presenta muchos problemas. Algunas veces,
los registros o las trazas son estados de macroentropía alta. Cuando
esperamos orden y encontramos desorden, también lo consideramos
indicativo de una interacción pasada. Los trozos dispersos de una ex
plosión son un registro de macroentropía alta. Algunas veces pode
mos inferir de estados de macroentropía baja a estados futuros. Algu
nos estados de macroentropía baja, por lo demás no esperados, son
pronosticadores de sucesos futuros. Estas situaciones son tales que, da
do que esos sucesos futuros ocurrirán, el suceso presente deviene
más probable. La señal en el radar de la pantalla puede muy bien ser
un buen indicador de una interacción futura, pongamos, del misil
dando en el objetivo, pero no es un registro de ese suceso futuro.
Una justificación real de la afirmación de Reichenbach sería una
razón para creer que hay un modelo general de inferencia de sucesos
pasados que es caracterizable en términos macroentrópicos y que no
rivaliza con un modelo similar de inferencia del futuro. Quizás po
dría llevarse a cabo algo de esta índole. Después de todo, mi periódi
co diario con sus caracteres ordenados es un indicador de lo que su
cedió anteriormente, y no hay nada parecido a un periódico para el
futuro. Pero la razón por la que esto es así sigue siendo muy confusa.
Filosofía de la física
Lo que es especialmente confuso es cómo va a ser utilizado el au
mento hacia el futuro de la microentropía, la irreversibilidad termo
dinámica del mundo, para dar cuenta de la clara asimetría real que
hay en la Forma en que podemos obtener conocimiento del pasado y
del futuro. La ruta a través de la macroentropía es especialmente des
concertante debido al problema de que lo que la macroentropía de
un sistema es, depende de cómo clasificamos los sucesos en clases o
tipos de macrosucesos. Nosotros veríamos algunas formas de hacer
esto como «naturales», y otras como «innaturales» o perversas en al
gún modo. Cualquier teoría que intente explicar cómo es que algu
nos estados ordinarios deberían ser tomados como registros del pasa
do, pero ningún estado ordinario debería ser visto como un registro
del futuro a pesar de la habilidad para inferir algunas veces el futuro
a partir de ellos, y que intente hacer esto invocando la noción de ma
croentropía, debe hacer plena justicia a estas cuestiones de clases de
sucesos naturales versus innaturales. Ni qué decir tiene que la ruta
desde el aumento de entropía termodinámica a una explicación de
porqué tenemos recuerdos del pasado y no del futuro es si cabe más
misteriosa, dado lo poco que sabemos siquiera sobre cuál es realmen
te la base física de la memoria.
Algunos enfoques que secundan las tesis de Boltzmann conside
ran la asimetría del conocimiento, el hecho de que existan registros
del pasado pero no del tuturo, como fundamental. Estos puede que
busquen derivar otras asimetrías, pongamos, nuestra creencia en que
la causalidad va del pasado al futuro, de la asimetría del conocimien
to. Otros enfoques puede que busquen primero una derivación de la
asimetría causal a partir de la entrópica, considerando los registros
como efectos de los sucesos de los que son registros, siendo los suce
sos que son registrados, por definición, la causa del registro de los
mismos.
Un ataque particularmente ingenioso a la asimetría causal que
busca una explicación de la misma en fenómenos que podrían estar
conectados a la asimetría entrópica ha sido propuesta por D. Lewis.
Lewis asocia la causalidad con los denominados condicionales con
tractuales. La idea es vieja: La causa de un suceso es el suceso tal
que, si rio se hubiera producido, el suceso considerado el efecto no
hubiera ocurrido. (La explicación completa es más complicada que
esto, pero la versión simple bastará para nuestros propósitos.) Pero
¿cómo determinamos qué condicionales contrafactuales son verdade
La introducción de la probabilidad en la física 223
ros? Lewis arguye que nuestras intuiciones son tales que cuando pre
guntamos qué habría sucedido si un suceso real no hubiera ocurrido,
o si hubiera ocurrido en una forma distinta a cómo en realidad lo hi
zo, tendemos a pensar en las clases de cambios que nos veríamos for
zados a hacer en el mundo si el suceso hubiera sido diferente a como
fue. Elegimos como lo que hubiera sucedido lo que sucede en un
mundo que es, en algún sentido, lo más próximo al nuestro posible,
dado que el cambio postulado se necesitó por ser el suceso diferente
a como en realidad fue. Nuestros criterios para hacer tales juicios de
«proximidades de mundos» tolerarán pequeñas violaciones de las le
yes de la naturaleza, pero no violaciones importantes o muchas de
ellas. Buscarán grandes regiQnes del espacio y el tiempo donde las
cosas permanezcan justo como son en este mundo, pero tolerarán
grandes cambios en realidades particulares, incluso si estas realidades
son importantes para nosotros. Los criterios de proximidad están
concebidos para que nuestros juicios intuitivos sobre «lo que sería el
caso» resulten correctos tan a menudo como sea posible.
Un resultado de este análisis es hacer que los «contrafactuales re
troactivos» resulten falsos. Éstos son contrafactuales que nos dicen
que si algún suceso se hubiese dado de otra forma, su pasado habría
sido diferente. Al menos resultan falsos en algunos casos. Los casos
son de los del tipo de la piedra lanzada al agua que genera una onda
expandiéndose en el estanque en el futuro del impacto de la piedra
con el agua. La idea es que mientras el no haber lanzado la piedra
habría requerido solamente un milagro menor en su pasado (mi neu
rona no disparando y no provocando en mí la volición de lanzar la
piedra), el impacto de la piedra en el agua se asocia a una vasta serie
de hechos dispersos espacio-temporalmente en el futuro del impacto.
Éstos son todas esas partes onduladas que aparecen, todas las ondas
luminosas que son emitidas desde ellas, etcétera. Según el análisis de
Lewis, entonces, resulta que si un suceso hubiera sido diferente a
como fue, el futuro de ese suceso habría sido diferente, pero el pasa
do habría sido el mismo, porque un suceso dado está «sobredetermi-
nado» por sucesos de su futuro. Hay muchos sucesos en el futuro de
un suceso dado que requieren la existencia de ese suceso, pero
pocos en su pasado que lo hagan. Y la causalidad siempre va, pues,
desde el pasado al futuro asimismo.
De nuevo hay muchos enigmas. En primer lugar, pensamos en la
causalidad como yendo del pasado al futuro, y no en la otra direc
224 Filosofía de la física
ción,'incluso en casos que no involucran dicha «propagación de or
den en el futuro». Aquí uno podría intentar una línea de argumenta
ción debida a Reichenbach según la cual nuestra idea básica de cau
salidad asimétrica se forma a partir de casos donde hay una
propagación macroentrópica. El concepto es entonces «proyectado»
por una suerte de analogía a los casos en los que no hay tal propaga
ción. (Pero ¿parece esto realmente plausible?) De nuevo existe el
problema de que todos estos hechos sobre la propagación de un ma-
croorden en el futuro dependen fuertemente de cómo son caracteri
zados los sucesos. Como antes, queda la posibilidad de caracterizar
los macrosucesos de una forma tan perversa que uno observa una
propagación de orden en la dirección temporal equivocada. Final
mente, como Lewis mismo establece, no está nada claro cómo rela
cionar la explicación de la asimetría de la causalidad aquí bosqueja
da con el aumento de la microentropía de la termodinámica. Podrían
hacerse sugerencias acerca de la manera en que esto podría funcio
nar, de la misma forma que existen explicaciones que intentan carac
terizar fenómenos como la propagación de la correlación en los fenó
menos ondulatorios por medio de las características termodinámicas
de los emisores y receptores de las ondas. Einstein intentó explicar la
asimetría de la propagación de ondas electromagnéticas en esta for
ma. Pero todavía hay mucho aquí que no se entiende bien.
Probablemente la única estimación justa de la situación en el mo
mento actual es que la tesis de Boltzmann no es manifiestamente ab
surda o incoherente. Es también una que reposa sobre un argumento
de fuerte plausibilidad. Después de todo, si la asimetría termodinámi
ca de los sistemas en el tiempo es la forma en que la asimetría tem
poral radical se manifiesta en el comportamiento de los sistemas físi
cos, ¿no es evidente que esta asimetría física global es responsable en
alguna forma de todas nuestras asimetrías intuitivas en el tiempo?
Una cosa es cierta: Las tentativas de tomar el tiempo como funda
mentalmente asimétrico en alguna otra forma, pongamos, basada en
algún análisis metafísico profundo de la naturaleza del «tiempo mis
mo» parecen fracasar inevitablemente en explicar la asimetría entró-
pica. Ni tampoco está claro cómo explican realmente las asimetrías
de conocimiento y causalidad. Sin embargo, debe admitirse que na
die ha demostrado nunca realmente que la tesis final de Boltzmann
pueda ser completada en la manera circunstanciada necesaria para
hacerla convincente.
La introducción de la probabilidad en la física
Supongamos que somos capaces de propon?*0i5&wjn«frftóU*b^
vincentes en el sentido de que todas nuestras asimetrías i!!Lflft\fc*en
el tiempo tienen un fundamento explicativo en la asimetría entropífca.
¿Cuál deberíamos entonces decir que es la conexión entre estas dos
relaciones: 1) la relación que un suceso presenta con otro cuando el
primero es posterior al segundo en el tiempo, y 2) la relación que un
suceso presenta respecto a otro cuando el primer suceso está separa
do en el tiempo del segundo suceso y donde también la dirección
temporal del primer suceso al segundo es esa dirección temporal en
la que la entropía de los sistemas aislados casi siempre aumenta? Una
sugerencia que con frecuencia se hace es que una extensión satisfac
toria del argumento explicativo nos llevaría a afirmar que las dos re
laciones son idénticas entre sí.
Aquí la analogía se establece con frecuencia con otras «identida
des descubiertas» en el dominio de la ciencia. Descubrimos que los
cristales de sal son —es decir, son idénticos a— ordenamientos de
iones de sodio y cloro. Descubrimos también que las ondas de luz
son —es decir, no son sino— un tipo de ondas electromagnéticas.
¿No es también justo decir que hemos descubierto que la dirección
«abajo» en el espacio en cualquier lugar es justamente —es justamen
te idéntica a— esa dirección del espacio en la que está dirigida la
fuerza gravitacional en dicho lugar? ¿No sería también plausible en
tonces que si el programa explicativo de Boltzmann pudiera ser desa
rrollado por completo, deberíamos simplemente vindicar una identi
dad entre la asimetría futuro-pasado en el tiempo y esa asimetría
generada por el aumento de entropía?
No obstante, se han dejado escuchar algunas dudas de que
podamos llegar tan lejos, aun cuando el éxito del programa explicati
vo esté garantizado. Estas dudas están relacionadas con las expresa
das en el contexto del problema filosófico mente-cuerpo acerca de la
tesis que identificaría ciertos procesos mentales, como sentir un
dolor o tener una cierta sensación visual, con el desarrollo de un
cierto proceso en el cerebro. Quienes expresan estas dudas no ponen
en tela de juicio, en el contexto de este argumento, que podría darse
el caso de que para todas esas cualidades sentidas o percibidas de la
vida mental, ciertos procesos cerebrales fueran condiciones necesa
rias y suficientes. Podrían incluso estar de acuerdo en que los proce
sos mentales fueron «sobrevinientes» en lo físico, lo cual significa
que dos personas cualesquiera con idénticos procesos cerebrales
22(i Filosofía de la física
deberían tener procesos mentales idénticos. Lo que se niega es que
los procesos mentales y físicos puedan, en alguna forma razonable,
considerarse como uno y el mismo proceso.
Algunas veces estas dudas se expresan en un formato modal que
se retrotrae a R. Descartes. Podemos imaginar un proceso mental del
tipo apropiado sin el proceso cerebral asociado, se dice, o el último
sin el primero. Así pues, los procesos no son necesariamente idénti
cos uno al otro. Pero todas las identidades auténticas son identidades
necesarias, lo cual no significa decir que su descubrimiento podría
no ser una cuestión empírica. De forma que la contingencia de la co
nexión cualidades/procesos cerebrales pone de manifiesto que es
una no identidad. El argumento debe llevarse más lejos, sin embargo,
porque pensamos que también podemos imaginar agua que no es
H-O, aunque el agua sea ciertamente idéntica a H 20 . Llegados a este
punto se da un argumento para explicarnos porqué no podemos real
mente imaginar agua que no es H 2Ot sino sólo sustancia que tiene
muchas de las características propias del agua sin ser agua. Se arguye,
sin embargo, que la «inmediatez» de nuestro acceso a las cualidades
mentales hace que las dos situaciones sean radicalmente diferentes.
A. Eddington propuso un argumento parecido, en el sentido de
que cualquiera que fuera la relación entre que un suceso se diera
después que otro y que un suceso se diera en la dirección temporal
J.e! -.nimentó de entropía con respecto al otro, no podría ser la identi
dad Sabemos, afirmó, cómo es la «posterioridad». Y sabemos cómo
es la noción entrópica de estar un estado más desordenado que otro.
Y sabemos, afirmó, que las dos relaciones simplemente no son la mis
ma relación. Así es justamente como sabemos que cualquiera que sea
la relación de la percepción mental a los procesos cerebrales, no es
una relación de identidad entre lo que está sucediendo.
Aquí, como Eddington recalcó, el papel especial del tiempo en el
mundo es importante. Con frecuencia logramos que las identificacio
nes funcionen eliminando del mundo físico algunas de las caracterís
ticas del objeto identificado y trasladándolas al mundo mental. Así
pues, cuando decimos que una onda luminosa azul es idéntica a una
onda electromagnética, no tenemos que preocuparnos por el hecho
de que las ondas electromagnéticas no pueden pensarse como azules.
Pues ya hemos presupuesto que el azul percibido de la onda lumino
sa no es una característica de la onda de luz física, sino solamente
una «cualidad secundaria» en la mente, generada causalmente por
La introducción de la probabilidad en la física 227
luz de un cierto tipo que alcanza nuestras retinas. Pero las relaciones
temporales entre los sucesos en el mundo, argüiría Eddington, son
características genuinas de esos sucesos. Y esa clase de temporalidad,
afirma, debe ser exactamente la misma clase de temporalidad que re
laciona los sucesos de la experiencia inmediata entre sí. Por estas ra
zones, razones que son muy difíciles de aclarar filosóficamente, pero
que no obstante son muy sugerentes, él piensa que la demanda de
identidad entre relaciones temporales, según se dan en el mundo y
según las experimentamos de forma inmediata, y relaciones tales
como las que se dan entre diferentes grados de orden, como es la di
ferencia de entropía, es implausible. La teoría entrópica de la asime
tría del tiempo tiene aspectos importantes y filosóficamente descon
certantes aun cuando el programa de Boltzmann como programa
explicativo pueda hacerse completamente plausible.
Lecturas adicionales
Reichenbach (1956) es una discusión seminal de las cuestiones de
este capítulo. Una discusión contemporánea es Horwich (1987). Da-
vies (1974) es una introducción excelente a diversos aspectos de la fí
sica. Sklar (próxima publicación) es una discusión sistemática de la fí
sica estadística desde una perspectiva filosófica.
Una buena introducción a la teoría de la probabilidad es Cramer
(1955). Feller (1950) da más detalles y es más avanzado. Un vivido re
sumen de la base axiomática por su inventor es Kolmogorov (1950).
Un estudio de las teorías filosóficas de la probabilidad puede encon
trarse en Kyburg (1970) o, más concisamente, en el capítulo 3 de
Sklar (próxima publicación). Para una introducción a la aleatoriedad
objetiva véase Earman (1986), capítulo 8.
Una visión de conjunto de lo que los filósofos dicen sobre las
explicaciones estadísticas puede encontrarse en Salmón (1984) y
Humphreys (1989). De nuevo, un breve resumen es el capítulo 4 de
Sklar (próxima publicación).
Los artículos más importantes de la historia de la mecánica esta
dística están traducidos en Brush (1965). Brush (1976) contiene una
buena cantidad de información sobre la historia de la disciplina. Eh-
renfest y Ehrenfest (1959) es una temprana exposición crítica de la
disciplina, también muy útil para formarse una idea histórica.
228 Filosofía de la física
Buchdahl (1966) y Pippard (1961) son buenas introducciones a
los conceptos de la termodinámica. El trabajo original de Gibbs
(1960) es una buena introducción a los fundamentos de la mecánica
estadística. Tolman (1938) es un tratamiento discursivo y sutil donde
se recalcan los aspectos fundacionales. Jancel (1963) cubre muchos
de los detalles de los enfoques fundacionales de la teoría.
El enfoque temprano de la teoría ergódica puede encontrarse en
Farquhar (1964). El enfoque más moderno es expuesto brillantemen
te (a un nivel matemático bastante sofisticado) en Arnold y Avez
(1968). Sinai (1976) es también conciso y profundo (pero difícil). Para
una discusión filosófica de los enfoques alternativos a la teoría del no
equilibrio, véase Sklar (próxima publicación), capítulo 7.
El enfoque «subjetivista» (mejor dicho, inductivista) de la mecá
nica estadística puede encontrarse en Jaynes (1983), Katz (1967), y
Hobson (1971). Las ideas fundamentales de Krylov se encuentran en
Krylov (1979). Véase también Batterman (1990) y Sklar (próxima pu
blicación), capítulo 7. Sobre el enfoque de Prigogine, véase Prigogine
(1980 y 1984). Véase también Sklar (próxima publicación), capítulo 7,
y Batterman (1991).
Una introducción no técnica al estudio de los sistemas caóticos
es Gleick (1987). Devaney (1986) es una introducción a los aspectos
matemáticos de la teoría. Schroeder (1991) explica la estructura de
muchos aspectos de la teoría del caos y discute, asimismo, otras áreas
donde el razonamiento probabilístico ha pasado a ser central en la
explicación científica.
Un trabajo clásico sobre la relación de la cosmología a la entro
pía es Tolman (1934). Davies (1974) es accesible y cubre muchos tó
picos importantes. R. Penrose (1979) es un tratamiento sutil acerca
del aumento de entropía y de los resultados cosmológicos. Sklar (pró
xima publicación), capítulo 8, es un breve estudio desde una perspec
tiva filosófica.
Sobre sistemas derivados, el origen de la discusión se encuentra
en Reichenbach (1956), especialmente en la sección 3. Davies (1974),
capítulo 3, esboza los sistemas derivados. El escepticismo sobre la co
nexión del aumento de entropía cósmica al aumento paralelo de en
tropía en los sistemas derivados se discute en Sklar (próxima publica
ción), capítulo 8.
Sobre el tema de la dirección del tiempo, Reichenbach (1956),
sección 4, es seminal. Las concepciones a lo Reichenbach se defien
L* introducción de la probabilidad en la física 229
den en Grünbaum (1973), capítulo 8. Mehlberg (1980), especialmente
los capítulos 5 y 8, ofrece una crítica. Una discusión penetrante de
las afirmaciones reichenbachianas se encuentra en Earman (1974).
Horwich (1987) ofrece, tanto una explicación de los orígenes cósmi
cos de la asimetría en sistemas derivados, como una tentativa de fun
damentar la asimetría temporal intuitiva en la asimetría de los siste
mas derivados. Sklar (próxima publicación), capítulo 10, y Sklar
(1985), capítulo 12, exploran cómo deberá ser la estructura de una
descripción reduccionista del orden temporal.
Capítulo 4
LA IMAGEN CUÁNTICA DEL MUNDO
La base experimental de la teoría cuántica
La teoría cuántica ha confrontado a científicos y filósofos de la cien
cia con una serie de cuestiones sorprendentes. Muchos piensan que
cualquier tentativa de comprender un mundo descrito por la teoría
cuántica requerirá una revisión en nuestro entendimiento de la natu
raleza de las cosas mucho más radical que la revisión en nuestro en
tendimiento de la naturaleza del espacio y el tiempo demandada por
las teorías de la relatividad. Se ha afirmado que para comprender la
teoría cuántica debemos revisar nuestro entendimiento mismo de
cuestiones tales como la naturaleza objetiva de la realidad y su inde
pendencia de nuestra percepción de ella, la naturaleza de un sistema
complejo y su relación con sus componentes, y la naturaleza de la de
terminación causal y de otros tipos en el mundo. ¿Qué es lo que en
esta teoría parece imponernos una revisión tan radical en nuestras
categorías básicas de la naturaleza?
Nos será de ayuda explorar muy brevemente algunos de los mo
mentos culminantes en el desarrollo histórico de la teoría. Primero,
hemos de remontarnos a la historia de las teorías sobre la naturaleza
de la luz. En el siglo xvn se propusieron dos modelos sobre la natu
raleza de la luz. Uno, adoptado tentativamente por Newton, decía
que la luz era una corriente de partículas emitidas desde una fuente
231
232 Filosofía de la física
y reflejadas por los objetos iluminados. El otro, propuesto por C.
Huyghens, entre otros, decía que la luz era una forma de movimiento
ondulatorio en un medio de transmisión, de forma parecida a como
el sonido es una onda generada por una fuente y transmitida como
un movimiento periódico a través del aire.
La teoría ondulatoria tuvo que superar algunas dificultades. ¿Có
mo podía una onda ser transmitida desde el sol a la tierra si existía
un vacío desprovisto de materia entre ellos? Haría falta postular un
medio de transmisión, el éter, que sirviese de soporte a las ondas ori
ginadas en el sol y recibidas en la tierra. Resultados ulteriores sobre
la polarización de la luz indicaron que si la luz fuese una onda, ten
dría que ser tal que su movimiento ondulatorio fuese perpendicular
a la dirección de propagación de la onda. Esto hizo la constitución
de este medio etéreo muy problemática, pues se pensaba que tales
ondas sólo podían transmitirse en un cuerpo rígido. En el caso del
movimiento ondulatorio, uno también espera fenómenos de difrac
ción. Podemos escuchar el sonido producido detrás de una pared en
la que sólo hay una pequeña abertura pues, una vez que el sonido
entra en la abertura, se propaga también detrás de la barrera. Pero
¿no proyecta la luz sombras nítidas, sin mostrar ninguno de dichos
efectos de dispersión, cuando es interceptada por una barrera? Eso
es lo que uno esperaría según la teoría corpuscular.
Pero en los siglos xvm y xix la teoría ondulatoria logró lo que a
todas luces parecía ser una clara victoria. Las mediciones indicaron
que, de acuerdo con lo esperado en la teoría ondulatoria y en con
flicto con las predicciones de la teoría corpuscular, la luz viajaba más
despacio en medios con índices de refracción mayores que en me
dios con índices menores. Una observación detenida reveló, además,
que los efectos esperados de difracción en una onda podían obser
varse en la luz. Anteriormente no habían sido detectados debido a
que la longitud de onda de la luz, a diferencia de la del sonido, es
muy pequeña comparada con el tamaño de los objetos macroscópi
cos. Esto hace que los efectos de dispersión asociados a la difracción
sean muy difíciles de discernir.
Lo más convincente de todo a favor de la teoría ondulatoria fue
el descubrimiento de los efectos de interferencia. Una onda es un fe
nómeno periódico, tanto en el espacio, como en el tiempo. Tiene una
amplitud que aumenta y disminuye periódicamente en cualquier lu
gar determinado, y aumenta y disminuye de un lugar a otro en un
La imagen cuántica del mundo 233
tiempo determinado. Las ondas pueden superponerse unas a otras. Si
la cresta de una onda se superpone a la cresta de otra onda, la ampli
tud de la onda resultante aumenta. Si la cresta se superpone a un
vientre, la onda compuesta resultante tiene una amplitud menor en
ese lugar y momento. Si una onda simple se divide en partes que se
superponen unas a otras a continuación, pongamos, haciendo pasar
la onda a través de dos rendijas separadas en una placa y haciendo
que los haces resultantes se superpongan e impresionen una pantalla,
entonces aparecerá una «figura de interferencia» como resultado de
la alternancia sistemática de superposiciones «constructivas» y «des
tructivas». Dicha figura, obtenible con luz, se considera claramente
indicativa de un fenómeno ondulatorio. Si la luz consistiese de partí
culas en fugar de ondas, esperaríamos encontrar la figura mucho más
simple de dos series de amplitud superpuestas, una por cada rendija,
en vez del sistema periódico de amplitudes grandes y pequeñas co
rrespondiente a una onda.
Hacia el final del siglo XIX, Maxwell convenció a la comunidad
científica de que la luz era una forma de onda electromagnética. Más
tarde, se fue abandonando gradualmente la idea del éter como un
medio de transmisión de la onda. El campo electromagnético mismo
fue visto como un tipo de entidad substantiva que podía ser transmi
tida a través de un vacío genuino, quedando así explicada la transmi
sión de la luz desde, por ejemplo, el sol a la tierra.
Los primeros signos de dificultades en la teoría ondulatoria es
tándar provinieron de las tentativas de entender la interacción entre
la materia y la luz. Un cuerpo material emitirá y absorberá luz. Man
tenido a una temperatura fija, ese cuerpo emitirá luz y la absorberá.
El cuerpo estará en equilibrio con la luz, cuya energía está distribui
da de acuerdo con una ley de distribución fija entre las diversas fre
cuencias posibles asociadas con cada onda. La ley puede ser determi
nada experimentalmente. La distribución de frecuencias variable con
la temperatura es conocida: uno puede ver cómo una barra de metal
calentada va cambiando de color a medida que va aumentando su
temperatura.
Varias tentativas de entender esta importante función de distri
bución espectral fueron llevadas a cabo. Un enfoque, partiendo de la
ley de distribución de Maxwell-Boltzmann para las moléculas de un
cuerpo caliente, dio lugar a la ley de Wien. Esta ley daba una buena
aproximación de la distribución de frecuencias observadas a altas
234 Filosofía de la física
temperaturas, pero fallaba a bajas temperaturas. Otro enfoque trabajó
también a partir de los postulados de la teoría de la mecánica estadís
tica discutidos en el capítulo 3, pero aplicó el razonamiento estadísti
co a la radiación misma. Esto dio como resultado la ley de Rayleigh-
Jeans. Dicha ley funcionaba bien a bajas frecuencias, pero daba
resultados imposibles —divergentes— a frecuencias altas.
M. Planck buscó una ley de compromiso que se adaptase mejor a
los hechos experimentales, y la encontró. Pero la reflexión sobre su
significado físico parecía conducir a una interpretación casi inevita
ble. La Ley de Planck podía ser considerada válida, sobre la base del
razonamiento teórico ordinario, únicamente si uno suponía que la
materia y la luz intercambiaban energía sólo en «paquetes» discretos,
siendo la energía de cada paquete igual a una constante fija multipli
cada por la frecuencia de la luz emitida o absorbida. Esto estaba en
fuerte contradicción con las suposiciones habituales de la teoría on
dulatoria, a saber, que la luz y la materia podían intercambiar energía
en cualquier cantidad y a cualquier frecuencia. ¿Cuál era el origen de
esta peculiar discontinuidad en el intercambio de energía?
Einstein llamó más tarde la atención sobre otro tipo de interac
ción entre la luz y la materia, a saber, la liberación de electrones por
un metal cuando éste era bombardeado con luz de alta energía, el lla
mado efecto fotoeléctrico, que también parecía sugerir que la energía
existía en la luz sólo en paquetes discretos. Los resultados experi
mentales indicaron una vez más que cada paquete tendría una ener
gía proporcional a la frecuencia de la luz que representaba. La ener
gía de los electrones liberados del metal dependía de la frecuencia
de la luz utilizada, pero no de su intensidad. Sólo el número de elec
trones liberados dependía de la intensidad de la luz. Era como si ca
da electrón fuese liberado por la interacción con un solo paquete de
energía luminosa («fotón») y como si la intensidad de la luz indicase
cuántos fotones había presentes a una frecuencia dada. La luz pare
cía, una vez más, poseer algo parecido a un aspecto corpuscular.
Inspirado por los aspectos corpusculares de la luz, un conocido
fenómeno ondulatorio, L. de Broglie sugirió que los familiares fenó
menos corpusculares podrían tener también un aspecto ondulatorio.
Las partículas componentes que forman el átomo, tales como el elec
trón, mostrarían entonces, bajo condiciones experimentales apropia
das, aspectos de un fenómeno ondulatorio como la difracción o la in
terferencia. Un ingenioso argumento procedente de la relatividad
La imagen cuántica del mundo 235
permitió a De Broglie asociar a una partícula, no ya una frecuencia
considerada proporcional a la energía como era el caso con los pa
quetes de energía luminosa, sino también una longitud de onda. Esta
longitud de onda se tomó como inversamente proporcional al mo
mento de la partícula.
Curiosamente, la confirmación experimental de la audaz conjetu
ra de De Broglie ya se había obtenido, si bien la importancia de los
datos reunidos no fue reconocida hasta que la tesis de De Broglie se
dio a conocer. Uno puede obtener fenómenos de interferencia a par
tir de una onda utilizando no sólo un dispositivo de rendija múltiple,
sino también dispersando la onda mediante un arreglo regular de
fuentes difusoras, tales como líneas gravadas en una placa reflectora,
una así denominada red de difracción. La onda es dispersada por ca
da línea, y las ondas dispersadas se combinan unas con otras, interfi
riendo y produciendo uno de los familiares patrones periódicos de
interferencia tan típicos de la interacción de una multiplicidad de on
das coherentes. Para el electrón, con su pequeña longitud de onda,
los átomos de un cristal proporcionan una tal red de difracción.
Efectivamente, si un haz de electrones es dispersado por la superficie
de un cristal, los electrones reflejados se distribuyen mismamente en
una figura cuya distribución angular es justo la que uno esperaría de
la figura de interferencia generada por una onda de la longitud de
onda asociada de De Broglie tras ser dispersada por una red de di
fracción con el espaciado apropiado al de los átomos en una red cris
talina. Si la luz, una onda, tiene un aspecto corpuscular, los haces de
electrones, haces de partículas, muestran un aspecto ondulatorio.
(Véase la figura 4.1.)
A continuación, E. Schródinger encontró la ecuación apropiada
cuyas soluciones representarían no sólo la onda asociada a un elec
trón libre, sino también las ondas asociadas a electrones sujetos a va
rios campos de fuerza. La aplicación de la ecuación a un electrón en
órbita alrededor del núcleo de un átomo dio por resultado que sólo
un número discreto de energías del electrón correspondían a ondas
que podían existir en una tal situación de partícula ligada. Efectiva
mente, las energías correspondían a esas energías permitidas de los
electrones en un átomo ya postuladas por una teoría atómica exis
tente.
Esta vieja teoría de los electrones y de su comportamiento en el
átomo, el modelo atómico de Bohr, condujo, curiosamente, al descu-
236 Filosofía de la física
F ig u r a 4.1. E l aspecto ondulatorio de los electrones revelado por la difracción en un cristal Se dispara un haz de electrones a la superficie de un cristal en una dirección que forma un cierto ángulo con la misma. E l haz reflejado es detectado por D en un ángulo
diferente. La curva C indica esquemáticamente ia variación en intensidad del haz reflejado conforme el ángulo de D al cristal y al haz incidente, e, va cambiando. Tiene una forma que sería la esperada si el haz de electrones fuese una onda que produjese
excitaciones que generasen nuevas ondas dispersándose desde cada átomo de la red cristalina, ondas que entonces «interferirían» entre sí.
brimiento de la teoría cuántica, la cual tomó un rumbo muy diferen
te al que se había seguido desde Planck a De Broglie y a Schródin-
ger. El movimiento de los electrones en un átomo da como resultado
la emisión de luz por el átomo. Pero el patrón de frecuencia de la luz
emitida, el denominado espectro del átomo, es muy diferente al que
se esperaría en las situaciones clásicas. Clásicamente, uno esperaría
que las frecuencias aparecieran en familias de una frecuencia básica y
de múltiplos enteros de la misma. Esto se sigue de unos teoremas clá
sicos muy fundamentales sobre la forma en que el movimiento de
una partícula cargada puede descomponerse en componentes sim
ples, básicos, y de la asociación clásica del tipo de movimiento de
una carga al tipo de luz emitida por esa carga. Lo que se descubrió
en su lugar fue que las frecuencias emitidas podían ser ordenadas en
familias caracterizadas por diferencias de enteros, antes que por sim
ples múltiplos de una frecuencia fundamental.
La imagen cuántica del mundo 237
Bohr ofreció una imagen del átomo que generaba este resultado,
aunque el modelo se apartaba fundamentalmente de lo que debería
ser posible de acuerdo con la teoría entonces estándar. Según la des
cripción de Bohr, los electrones podían existir en estados de energía
definidos, discretos, contrariamente al punto de vista clásico que per
mitía cualquiera de un continuo de estados. En la nueva imagen, los
electrones «saltaban» de un estado de energía a otro. En cada salto
se emitía o absorbía energía en una cantidad igual a la diferencia de
energía entre los dos estados. El cambio de energía en el átomo lleva
ba asociado la emisión o absorción de luz de una frecuencia asociada
con dicha energía por la regla de Planck. Esto se contrapone clara
mente al punto de vista clásico —en el que los electrones emitirían o
absorberían energía de manera continua. El modelo de Bohr era
capaz de generar estos estados de energía para los átomos más senci
llos por medio de un grupo de reglas simples, si bien algo infunda
das. Pero resultó incapaz de aportar un método general para determi
nar los estados de energía en casos más complejos e incapaz
asimismo de indicar una forma sistemática de determinar la intensi
dad y la frecuencia de la luz asociada a la emisión y absorción ató
micas.
W. Heisenberg acometió la resolución de estos problemas bus
cando una forma sistemática de tratar el problema de la interacción
entre los átomos y la luz. Dada la incompatibilidad del modelo de
Bohr con la teoría existente sobre el movimiento de los electrones,
buscó un esquema que evitara por completo el dar una imagen diná
mica del electrón en el átomo. El esquema intentaría, en lugar de
ello, calcular directamente las cantidades observables deseadas. Cu
riosamente, la teoría terminó por aportar, más bien, un nuevo sopor
te a la dinámica en su totalidad. El procedimiento de Heisenberg re
curría al método clásico de reducir los movimientos complejos a
movimientos simples y de asociar la radiación emitida con la canti
dad de cada componente simple de movimiento presente. Pero ahora
hizo falta un tipo de descomposición doble que respondiese a la ca
racterización de las frecuencias observadas por dos números, corres
pondiendo a diferencias en los estados de energía, en lugar de por un
solo número, correspondiendo al múltiplo del movimiento funda
mental, como en la física clásica.
En su nuevo formalismo, Heisenberg duplicó por analogía la es
tructura formal de las viejas reglas para calcular energías, frecuencias
Filosofía de la física
e intensidades. Así consiguió un procedimiento sistemático para de
terminar las energías permitidas del electrón en cualquier átomo, las
frecuencias correspondientes de la luz emitida y las intensidades de
la luz observada.
Así como Heisenberg, M. Born y P. Jordán trabajaron también en
la teoría, proponiendo una teoría dinámica enteramente nueva. Aun
que las matemáticas estaban claras, la interpretación física de la teo
ría era menos obvia. Las cantidades dinámicas básicas de posición y
momento habían sido hasta entonces representadas matemáticamen
te por funciones que asignaban números a la partícula como una fun
ción del tiempo. Estos eran la posición y el momento de una partícu
la en un instante dado. Ahora, sin embargo, las cantidades dinámicas
estaban representadas por objetos matemáticos llamados operadores.
Estos operadores aplicaban una entidad matemática abstracta, el
estado del sistema, de un estado a otro. Se construyeron reglas para
determinar, dado el estado de un sistema y dado el operador corres
pondiente a la cantidad en cuyos valores uno estaba interesado, los
posibles valores observados de la cantidad. Uno podía calcular, por
ejemplo, los posibles valores de la energía para un electrón en un
átomo de un tipo dado. Otras reglas permitían el cálculo de las «am
plitudes de transición» de un estado correspondiente a un valor de
una cantidad a otro en una situación física dada. Así, se podía calcu
lar la razón a la que los electrones saltarían de un estado de energía a
otro en un átomo, aun cuando el átomo estuviese sometido a alguna
interferencia exterior. Esto daba las intensidades de la luz emitida de
una frecuencia específica.
Pero ¿qué tipo de mundo físico correspondía a estas innovadoras
matematicas.' Algo muy nuevo había ocurrido en la física. Mientras
que anteriormente un modelo físico había conducido a una descrip
ción matemática, aquí teníamos una estructura matemática que fun
cionaba, cuya interpretación física parecía bastante problemática.
Pronto se propuso una forma de resolver estas cuestiones sobre
el significado tísico de la teoría de Heisenberg. Si uno calculaba los
posibles estados de energía de un electrón en un átomo según el mé
todo de Schródinger, considerando como tales los posibles valores
de la energía para ondas del electrón «estacionarias» en el potencial
del núcleo del átomo (algo parecido a las ondas de sonido estaciona
rias que pueden formarse en un tubo de órgano de una longitud da
da), uno obtenía valores predichos idénticos a los que se obtenían
La imagen cuántica del mundo 239
mediante las enigmáticas reglas de Heisenberg, utilizando el opera
dor correspondiente a la energía del átomo en cuestión. Si uno calcu
laba las tasas de transición entre estados por el método de Schródin
ger, utilizando un razonamiento similar al que explica cómo un
diapasón vibrando puede poner a otro en oscilación por resonancia,
uno obtenía los mismos valores que los obtenidos por Heisenberg al
calcular las amplitudes de transición con su misterioso cálculo de
operadores. Finalmente, Schródinger fue capaz de demostrar la rela
ción matemática entre las dos teorías que garantizaba que siempre
predecirían los mismos resultados observables. Matemáticamente, los
dos métodos eran «isomorfos» entre sí, debiéndose algunas diferen
cias en su apariencia al hecho de que mientras Schródinger incluía la
evolución temporal del sistema en la evolución de su función de on
da, Heisenberg trabajaba con un estado del sistema independiente
del tiempo e incluía la dinámica de la evolución temporal en la varia
ción en el tiempo de los operadores asignados a un observable físico
dado.
Ahora, parecía, teníamos al menos los rudimentos de un modelo
físico del electrón como una onda en la teoría de Schródinger. ¿No
podría verse la teoría de Heisenberg simplemente como un medio
matemático de tratar a los electrones y a las otras partículas como
verdaderas ondas físicas?
Esto fue lo que propuso Schródinger. Pero esta sencilla solución
a las dificultades pronto resultó difícil de aceptar. La función de on
da «dispersa» que describía al electrón tomaba de hecho la forma de
una onda en el espacio y tiempo físicos sólo en el caso de una sola
partícula. Cuando se consideraba un complejo de partículas, la fun
ción de onda se asemejaba a una onda sólo en un espacio coordena
do abstracto de más dimensiones, en el que las posiciones de todas
las partículas eran representadas simultáneamente por un solo punto.
Mucho peor era la aparente incompatibilidad de la interpretación del
electrón como una onda «real» dispersa con sus obvios aspectos cor
pusculares puntuales. Cuando aplicamos los aparatos experimentales
utilizados para detectar la presencia de un electrón, descubrimos que
todas sus manifestaciones, como la masa y la carga, pueden encon
trarse concentradas en una región física muy pequeña. Si no partícu
las «puntuales», los electrones son, al menos, bastante pequeños en
extensión. Pero la onda que describe la presencia de un electrón es
tá, de hecho, esparcida en un gran volumen físico que llega con fre
240 Filosofía de la física
cuencia hasta el «infinito», al menos en un grado pequeño. Así pues,
¿cómo puede una partícula localizada ser identificada con una onda
dispersa físicamente real?
Una cierta esperanza de reconciliar los aspectos corpusculares de
un electrón con su pretendida naturaleza física ondulatoria surgió del
hecho de que los fenómenos ondulatorios pueden mostrar con fre
cuencia una concentración estable de la energía de la onda en un vo
lumen pequeño. Se sabía por la teoría ondulatoria clásica de la exis
tencia de algunos casos de «paquetes de ondas» en los que el grueso
de la energía del campo está concentrada en un volumen muy peque
ño del espacio. En un caso excepcional, el oscilador armónico sim
ple, podía demostrarse que el paquete de ondas concentrado de un
electrón se mantenía estable en el tiempo. Pero, vaya, en el caso ge
neral podía demostrarse que el paquete de ondas concentrado co
rrespondiente a un electrón disipaba su concentración muy rápida
mente, dando lugar a una onda ampliamente dispersa en el espacio.
El problema de reconciliar la onda dispersa con la partícula localiza
da seguía abierto.
Nos vemos, pues, enfrentados a un dilema. La luz, de la que se
sabía hacía tiempo que mostraba claramente aspectos ondulatorios
de difracción, interferencia, longitud de onda y frecuencia, resultaba
ahora poseer asimismo un aspecto corpuscular. Cualquier detección
de luz por un aparato material, pongamos, un trozo de una película
fotográfica, revelaba que la luz interaccionaba con la materia en un
modo corpuscular. La energía en la luz parecía estar contenida en pa
quetes discretos que podían interaccionar con la materia sólo «uno
por uno». La materia en forma de partículas elementales, que se sa
bía de tipo corpuscular, con sus masas y cargas concentradas en un
pequeño volumen físico, se veía ahora que tenía también un aspecto
ondulatorio. Los haces de electrones eran difractados al pasar por pe
queños agujeros en paredes, como lo hacían los rayos de luz al pasar
por agujeros muy pequeños del tamaño de un alfiler. Los electrones
dispersados por una red cristalina mostraban una clara figura de in
terferencia exactamente análoga a la mostrada por la luz dispersada
por una red de difracción ordinaria.
Pero ¿cómo podía entenderse esto? ¿Cómo podían aplicarse tér
minos tales como longitud de onda o frecuencia a partículas localiza
das? ¿Cómo podían los constituyentes físicos descritos por una fun
ción de onda dispersa encontrarse, siempre que eran detectados,
La imagen cuántica del mundo 241
localizados en un pequeño volumen en la forma propia de las par
tículas discretas no dispersas?
Primeras tentativas de interpretar la teoría:
el principio de incertidumbre
Interpretando el formalismo: probabilidad, interferencia y mediciónUn vislumbre crucial para la comprensión de la teoría fue la descrip
ción por M. Born de la intensidad de la función de onda como indi
cativa de una probabilidad. Toda onda tiene una amplitud, la «altu
ra» de la magnitud onda. La intensidad de una onda, más o menos
proporcional al cuadrado de esa amplitud, es lo que normalmente re
gistramos, en el caso de la luz, como la luminosidad de la luz; es una
medida de la energía de la onda. Las amplitudes de las ondas de la
mecánica cuántica ondulatoria fueron expresadas en números com
plejos, pero sus «cuadrados» eran números reales que representaban
una cantidad física directamente interpretable. Fue idea de Born el
considerar a estas intensidades como representativas de la probabili
dad con la que se obtendría uno de los posibles valores de un obser
vable físico si se hacía una medición apropiada. La función de onda
puede ser representada por una función de distintas variables, por
ejemplo, por una función de la posición, o bien del momento, de la
partícula a la que está asociada la onda. Dependiendo de la represen
tación elegida, las probabilidades, pongamos, de encontrar a la partí
cula en una región si se efectuase una medición de la posición, o en
un intervalo dado de momentos si se efectuase, por el contrario, una
medición del momento, podían ser calculadas a partir de la intensi
dad apropiada sobre una región de la «onda de probabilidad» cuánti
ca, como algunos comenzaron a llamarla. Las probabilidades de tran
sición de una partícula desde un estado a otro también podían ser
determinadas a partir de las funciones de onda y sus interrelaciones,
tales como las amplitudes de transición asociadas con las intensida
des de luz espectral emitida, calculadas originalmente por el método
de Heisenberg.
Claramente, la idea de Born proporciona la primera clave sobre
cómo reconciliar la «dispersión» de la función de onda con la natura
leza localizada de las cantidades medidas. La onda no representaba
24 2 Filosofía de la física
una partícula real dispersa, sino sólo una probabilidad de encontrar
el valor localizado de la partícula en algún lugar de una región defini
da de valores.
Pero la simple identificación de la intensidad de la función de
onda con probabilidades entendidas en los términos habituales está
plagada de dificultades. El mejor lugar para ver dónde residen las di
ficultades es en el fenómeno de interferencia. Supongamos que un
resultado puede ser obtenido con un cierto grado de probabilidad en
una de dos formas, siendo las dos formas causalmente independien
tes una de otra. Representemos las probabilidades de los resultados
por P (0/A ) y P(0/B), donde O es el resultado y A y B son los dos
modos en los que puede ser obtenido. Normalmente esperaríamos,
dada la independencia causal de A y B, que la probabilidad del resul
tado O condicionada a haber sido obtenido por la ruta A o por la B fuese la suma de las dos probabilidades indicadas. Pero, en general,
esto no es cierto en la situación cuántica. Por ejemplo, la probabili
dad de que un fotón se detecte en un cierto punto de una pantalla
iluminada por dos rendijas no es la suma de la probabilidad de que
el fotón alcance dicho punto cuando sólo la rendija 1 está abierta
más la probabilidad de que el fotón alcance dicho punto cuando sólo
la rendija 2 está abierta. De hecho, si ambas rendijas están abiertas, la
probabilidad de que el fotón alcance un punto dado puede ser menor de lo que sería si sólo una de las dos rendijas estuviese abierta. En
términos ondulatorios esto es debido a que la onda de la rendija 1 y
la de la rendija 2 «interfieren destructivamente» una con otra para
dar la probabilidad reducida en cuestión. Pero si la función de onda
representa sólo una probabilidad y no una onda física en el mundo,
¿cómo puede darse semejante interferencia? Las probabilidades nor
males sencillamente no «interfieren» unas con otras.
Unos cuantos sencillos experimentos idealizados muestran lo cu
rioso que es en realidad el mundo cuántico. Consideremos primero
el experimento de la doble rendija. Aquí se deja pasar a un rayo de
luz simple a través de una placa con dos rendijas que pueden cerrar
se o abrirse indistintamente, y se deja que el rayo vaya a dar a una
pantalla. Si sólo una de las dos rendijas está abierta, se obtiene en la
pantalla una distribución característica de luz centrada en torno al
lugar donde está localizada la rendija abierta. Si ambas rendijas están
abiertas, sin embargo, la figura de la pantalla no es la suma de las fi
guras de cada rendija como indicamos anteriormente, sino que en su
La imagen cuántica del mundo 243
lugar se obtiene la famosa figura de interferencia. Es importante ad
vertir que esto mismo se obtiene cuando la intensidad del rayo es tan
débil que por término medio sólo un paquete de energía, un fotón,
está viajando en cada momento desde la fuente a la pantalla a través
de las rendijas. Esto indica que la figura obtenida no puede ser expli
cada como una interacción causal normal entre los fotones. Es como
si, antes bien, cada fotón pasase por las dos rendijas como una onda,
pero fuese absorbido en la pantalla como una partícula localizada.
(Véase la figura 4.2.)
Si uno modifica el experimento colocando detrás de cada rendija
un detector que indique si un fotón ha pasado o no por la rendija, la
figura de interferencia desaparece y la pantalla muestra, en su lugar,
el tipo de figura que se obtendría si se sumasen sencillamente las fi
guras de dos experimentos individuales de una sola rendija. La mis
ma figura se obtiene si cada rendija es iluminada con una fuente de
luz independiente, en lugar de tener una misma fuente iluminando
ambas rendijas. Éstas son la mayoría de las peculiaridades caracterís
ticas del mundo que el formalismo cuántico requiere a fin de que
puedan ser captadas.
Otro experimento idealizado, llamémoslo el experimento de la
doble trayectoria, toma un haz simple de partículas luminosas y lo di
vide en dos haces, recorriendo cada uno de estos haces una trayecto
ria diferente, y siendo los dos llevados en un momento dado a coin
cidir en un punto. La división del haz de luz puede efectuarse
utilizando un espejo con una sola mitad azogada que refleje la mitad
de la luz que incide en el mismo y deje pasar la otra mitad a su
través.
En el punto en el que los dos haces son llevados de nuevo a con
verger, podemos elegir el tipo de experimento de detección que que
remos realizar. En un experimento se colocan detectores de tal ma
nera que sólo se dispararán si la «partícula» que está siendo
detectada (el fotón) recorre uno de los caminos y no el otro. Si la in
tensidad del haz se divide uniformemente, este experimento registra
rá resultados compatibles con la hipótesis según la cual parece como
si el divisor del haz original escindiera un haz de partículas en dos
mitades, estando uno de los haces formado por las partículas que re
corrieron solamente el camino A y el otro por las partículas que re
corrieron solamente el camino B. Pero si, en su lugar, los dos haces
son recombinados en el nuevo punto de coincidencia, se puede obte-
244 Filosofía de la física
(a)
F ig u ra 4.2. E l experimento de las dos rendijas. Si se dirige un haz de partículas, e, a una pared con dos rendijas y las partículas se detectan sobre una pantalla situada al otro lado de la pared, se esperará una distribución de las partículas en la pared de la forma indicada en (a). Dos densidades de partículas, centrada cada una alrededor de
una de las rendijas, sencillamente sumadas una a la otra. Pero si se dirige una onda a la rendija, se espera obtener el patrón de interferencia para la intensidad de la onda indicado en (b). Esto se debe a que las ondas emitidas desde las dos rendijas pueden
sumarse una a la otra o cancelarse entre sí, dependiendo de las distancias relativas a un punto de la pantalla desde las dos rendijas. Si se dirige un haz de electrones, e, a un dispositivo de dos rendijas, el patrón indicado en (b) se detecta en la pantalla, a pesar de la naturaleza corpuscular de los electrones puesta de manifiesto en otros experimentos.
La imagen cuántica del mundo 245
F i g u r a 4 .3 . E l experimento de la doble trayectoria. Un haz de electrones, e, puede dividirse de manera que siga una de las dos trayectorias señaladas con a y b en la figura. En la esquina distante, donde las trayectorias se reencuentran, se podría colocar un
dispositivo R en el camino para recombinar los haces y detectar patrones de interferencia por medio del detector D¡ (mostrando de esta forma la naturaleza ondulatoria
de los electrones) o quitar el recombinador R y por medio de los detectores D2í y D2h detectar a los electrones como partículas que no recorrieron los dos caminos, sino
uno u otro solamente. Uno puede decidir realizar el experimento en un momento posterior al momento en el que el electrón se encuentra ya recorriendo su trayectoria
(bien las dos trayectorias como onda o bien una de las dos como partícula). Éste es el
experimento de «elección retrasada».
ner interferencia entre los dos haces. De hecho, un detector de inter
ferencia, o interferómetro, de este diseño es un dispositivo óptico clá
sico. Estos efectos de interferencia revelan datos en conformidad con
la hipótesis de que es como si el espejo medio azogado original u
otro dispositivo divisor hubiese separado de hecho una onda en dos
componentes, una de las cuales recorrió el camino A y la otra el ca
mino B, pero de forma que permanecieron en fase entre sí, permi
tiendo que las componentes mostrasen al recombinarse el típico fe
nómeno de coordinación conocido como interferencia de ondas. Es
como si cada partícula, si los haces se imaginan como haces de par
tículas, ¡viajase por ambos caminos simultáneamente! (Véase la figu
ra 4.3.)
Tal y como J. Wheeler ha señalado, es importante advertir que la
elección del tipo de experimento a realizar en el punto de coinciden
cia final puede hacerse mucho tiempo después de que el haz haya si
246 Filosofía de la física
do dividido y enviado a seguir su curso. Esto demuestra que el ape
lar a la elección de los experimentos como algo que determina cuál
de los aspectos corpuscular u ondulatorio del experimento propor
ciona en la división del haz la descripción real del mundo, no contri
buirá a explicar estos efectos.
Es como si en el momento de la división uno tuviera que pensar
en algo que tenga al mismo tiempo los aspectos de un haz de partícu
las dividido en dos haces de partículas separados y los aspectos de
una onda descompuesta en dos ondas componentes correlacionadas.
Otro tipo de experimento, el experimento de Stern-Gerlach, pue
de ayudar a visualizar todo el espectro de fenómenos cuánticos. Una
partícula elemental puede poseer una cantidad, conocida como es
pín, y una cantidad relacionada, el momento magnético de espín.
Esto presenta una relación con la magnetización clásica de una par
tícula giratoria cargada, pero, como la mayoría de los fenómenos
cuánticos, la relación es solamente por analogía. Para un electrón, el
momento magnético de espín se manifiesta como una «doble valora
ción» interna de la partícula. Si se envía a través de un campo mag
nético uniforme en todas las direcciones menos en una que es per
pendicular a la dirección de movimiento del electrón, el electrón se
verá desviado de su trayectoria hacia arriba o hacia abajo en la direc
ción de la inhomogeneidad magnética. Si elegimos entonces una di
rección como la dirección arriba-abajo, y dejamos que el campo sea
no uniforme en esa dirección, el haz de partículas se dividirá en un
haz de partículas «arriba» y un haz de partículas «abajo».
Sea un haz de partículas procedente de una máquina arriba-abajo
que absorbe todas las partículas abajo. Hagamos pasar el haz «arriba
puro» obtenido por una máquina cuya no uniformidad magnética es
perpendicular a la de la máquina arriba-abajo. Llamemos a esta nue
va máquina una máquina derecha-izquierda. Uno descubre que en el
producto final de la máquina derecha-izquierda, la mitad de las partí
culas salen en el haz izquierdo y la mitad en el haz derecho.
Ahora vienen los efectos cuánticos de interferencia característi
cos. Si bloqueamos el haz derecho de la máquina derecha-izquierda y
hacemos pasar su haz izquierdo por una nueva máquina arriba-abajo,
la mitad de las partículas saldrán de la máquina arriba-abajo arriba y
la mitad abajo. Lo mismo sucederá si bloqueamos el haz izquierdo
de la máquina izquierda-derecha y dejamos pasar sólo el haz derecho
por la nueva máquina arriba-abajo. La mitad de los electrones sal
La imagen cuántica del mundo 247
drán arriba y la mitad abajo. Pero si recombinamos los haces izquier
do y derecho procedentes de la máquina izquierda-derecha y envia
mos el haz recombinado a través de la segunda máquina arriba-abajo,
¡todos los electrones saldrán de esa máquina en el haz de arriba! Los
haces izquierdos y derechos procedentes de la máquina izquierda-de-
recha están correlacionados entre sí de forma tal que son capaces de
«recordar» la naturaleza original, puramente arriba, del haz introduci
do. Cuando los haces se recombinan, «interfieren» uno con el otro
para generar no una «mezcla» de partículas izquierdas y derechas, si
no un haz de partículas que están todas definidamente arriba. Sin
embargo, al igual que en el caso de las dos rendijas, si hubiésemos
colocado detectores en las trayectorias de los haces izquierdo y dere
cho a fin de anotar para cada electrón si salió de la máquina izquier-
da-derecha como una partícula izquierda o como una derecha, y lue
go hubiésemos recombinado los haces y los hubiésemos enviado a
través de la máquina arriba-abajo, la mitad de los electrones habrían
salido de esa máquina arriba y la mitad abajo. La medición de los es
pines producidos por la máquina izquierda-derecha hace que cada
uno de ellos sea definidamente izquierda o definidamente derecha y
destruye la coherencia de los dos haces, resultando imposible recons
truir el haz arriba puro por medio de su recombinación. Esto indica
que los efectos de interferencia no son sólo relevantes para la distri
bución espacial de las partículas, sino también para cualquier carac
terística observable que puedan tener. (Véase la figura -4.4.)
En los haces recombinados de productos izquierda y derecha
que generan un haz arriba puro se da una coherencia entre sus com
ponentes izquierda y derecha que no se encuentra en un haz en el
que una de sus mitades está compuesta por el producto de una má
quina izquierda y la otra por el producto de una máquina derecha in
dependiente de la anterior. El último haz se dice que es una «mez
cla» de partículas izquierdas y derechas. El primero se dice que es
una «superposición» de partículas izquierdas y derechas.. Dicho
estado de superposición contiene información no presente en un
estado mixto. En el caso que nos ocupa, la información es que el
producto de la máquina izquierda-derecha es el resultado de haberse
alimentado a la máquina con un haz arriba puro como entrada.
El fenómeno de interferencia hace problemática la interpretación
tradicional y simple de la función de onda como una medida de pro
babilidad. Podríamos probar a considerar la probabilidad como una
248
(a)
(b)
(c)
(d)
(e)
F i g u r a 4 .4 . E l experimento ele Slem-Gerlach. La mecánica cuántica permite a un electrón tener solamente uno de dos valores de espín a lo largo de cualquier eje elegido
E l aparato de Stern-Gerlach puede separar un haz de electrones en dos haces, teniendo todos los electrones de cada uno de los haces salientes el mismo valor de espín. En (a) un haz «aleatorio» de electrones (e) es enviado a una máquina de Stern-Ger- lach con el eje arriba y abajo. La mitad de los electrones salen en el haz arriba y la mitad en el haz abajo. En (b) el haz saliente puro-arriba de un aparato es enviado a otro aparato orientado según el mismo eje. Todos los electrones que entran en el segundo aparato salen del mismo en el haz arriba. En (c) un haz puro-arriba de un primer aparato es enviado a un segundo aparato cuyo eje de orientación forma un ángulo de 90° con el del primer aparato. Al enviar un haz puro-arriba a una máquina
izquierda-derecha se obtiene una mitad de electrones emergentes con espín derecha y una mitad con espín izquierda. En (d) la salida de (c) es registrada por detectores a la
derecha de la máquina izquierda-derecha. Los haces registrados son recombinados y enviados a una segunda máquina arriba-abajo. La mitad salen arriba y la mitad abajo. Esto es lo que uno esperaría si el haz introducido en la ultima máquina está com
puesto por una mitad de electrones con espín derecha y mitad de electrones con es pin izquierda. En (e) la interferencia para el espín del electrón se pone de manifiesto. Esta vez los haces resultantes de la máquina izquierda-derecha son recombinados sin
ser perturbados de ninguna forma (pongamos, por contadores). E l haz recombinado
es introducido en una máquina arriba-abajo. Ahora todos los electrones emergen de
la última máquina con espín arriba. A pesar del paso por la máquina izquierda-dere- cha, el hecho de que el haz que se introdujo en la máquina izquierda-derecha era un
haz «arriba puro» es «recordado» por la interferencia y se pone de manifiesto en la forma en que la salida final de (e) difiere de la de (d).
I t i e a gen cuántica del mundo 249
me<Hda de nuestro conocimiento de los valores de un sistema. Proba
ría m o s entonces a considerar la asignación de una probabilidad un
medio a las partículas de un haz que fuese izquierdo o derecho como
la afirmación de que cada partícula es definidamente izquierda o de
recha y de que una apuesta razonable sobre si es una cosa o la otra
tendrá las mismas posibilidades en el resultado. O podríamos probar
a considerar la función de onda como diciéndonos que la fracción de
partículas del haz que son izquierdas es un medio y que el resto son
derechas. Pero, como hemos visto, dicho acuerdo no es suficiente.
Pues también hemos de entender que cada partícula del haz recom-
binado está definidamente arriba, y esto distingue al haz de uno muy
diferente compuesto por una mitad de partículas definidamente iz
quierdas y ufia mitad definidamente derechas. La superposición en
tre izquierda y derecha no es la mezcla de izquierda y derecha, aun
cuando para ambos haces es correcto afirmar que una medición iz
quierda-derecha indicará que la mitad de las partículas eran izquier
da y la mitad derecha al ser medidas.
Reflexionando sobre la interrelación formal entre la teoría ondu
latoria de Schródinger y la dinámica formal de Heisenberg, J. von
Neumann y P. Dirac desarrollaron formalismos que se substraían de
los dos enfoques para captar la esencia de la teoría cuántica. En cada
descripción hay representantes matemáticos de los estados del mun
do y de los observables físicos. Supongamos que un sistema tiene un
estado definido. La evolución de su estado en el tiempo cuando está
sometido a una influencia causal exterior es el objeto de estudio de
la dinámica. Dado el estado en un instante determinado y una espe
cificación del observable que va a ser medido, los representantes ma
temáticos del observable especifican cuáles pueden ser los resultados
posibles de la medición, y este representante del observable combi
nado con el estado del sistema determina las probabilidades de que
sea uno de los resultados posibles el que de hecho se obtenga.
Si conocemos el estado de un sistema en un momento dado y las
influencias causales en momentos posteriores, podemos determinar
su estado según el sistema evoluciona. Pero ¿cómo determinamos el
estado inicial de un sistema? Lo hacemos preparando el sistema, un
proceso que constituye al mismo tiempo un tipo de medición de los
valores del sistema. Podemos, por ejemplo, determinar el estado de
espín inicial de una partícula como definidamente arriba en el instan
te = 0 sabiendo que la partícula fue emitida desde el canal superior
250 Filosofía de la física
de una máquina arriba-abajo en t = 0. Podemos entonces conocer el
estado de espín de la partícula en tiempos posteriores conociendo las
influencias causales (campos eléctricos y magnéticos en este caso) a
las que estuvo sometida desde el momento en que fue emitida por el
canal superior de la máquina arriba-abajo. Si entonces decidimos
efectuar una nueva medición de espín en el sistema, podemos deter
minar —a partir del operador correspondiente a la dirección del es
pín que decidimos medir— qué valores podrán obtenerse (en el caso
del electrón sólo dos, arriba o abajo en la dirección elegida) y a partir
de ese operador y del estado de la partícula en el momento de la me
dición podemos determinar la probabilidad de que se obtenga un va
lor dado del espín en la medición.
La atribución del estado apropiado a la partícula justo después
de su preparación descansa en el famoso Postulado de la Proyección
de Neumann. Este establece que si se acaba de realizar una medición
que revela un valor dado de un observable, entonces el estado del
sistema inmediatamente después de la medición es el que correspon
de al sistema con ese valor exacto para la cantidad medida. (En reali
dad, esto necesita un remedo para dar cuenta del hecho de que algu
nas veces la medición destruye un sistema y del hecho de que una
medición no determina normalmente todas las cantidades compati
bles de un sistema, pero para nuestros propósitos lo hará.) Un argu
mento principal de von Neumann es que solamente dicha atribución
de estados nos garantizará que, si la medición se repitiese a continua
ción, estaríamos seguros de obtener el mismo valor que obtuvimos
en la primera medición. La teoría formalizada expuesta por von Neu
mann, considerada la versión ortodoxa de la teoría cuántica, es
notable, pues, por presentar dos reglas diferentes para determinar el
cambio del estado de un sistema en el tiempo. Una, la regla dinámi
ca, nos dice cómo el mismo paso del tiempo y las influencias exter
nas, como la interacción del sistema con algún otro sistema, conduci
rán a una evolución dinámica del estado del sistema. La otra regla
nos dice que cualquiera que sea el estado de un sistema antes de una
medición, el estado del sistema después de haberse efectuado la me
dición corresponderá al sistema con el valor del observable recién
medido. El estado del sistema es «proyectado» en la medición al de
nominado estado característico correspondiente al valor observado o
medido que se ha obtenido en la medición. Cuando la medición tie
ne lugar, las reglas dinámicas de la evolución del estado son desecha
La imagen cuántica del mundo 251
das. Como veremos, la noción de medición como un proceso espe
cial ajeno a la dinámica ordinaria se convierte en uno de los grandes
apartados problemáticos de la teoría cuántica.
La interpretación de CopenhagueEl gran físico Niels Bohr intentó gestar una imagen global del mundo
que hiciera justicia a los extraños fenómenos cuánticos recién descu
biertos, y diseñar la estructura teórica apropiada. No es fácil resumir
limpiamente su denominada interpretación de Copenhague. Algunos
han visto en ella una nueva filosofía del ser y del conocimiento, cuya
importancia trasciende la mera clarificación de los aspectos cuánticos
del mundo. Otros se han mostrado más escépticos. Einstein en una
ocasión la llamó «la filosofía tranquilizadora de Heisenberg-Bohr
— ¿o religión?— », para decir a continuación que «proporciona una
mullida almohada al fiel creyente de la que no se le puede despertar
fácilmente», es decir, que «encubría» los aspectos problemáticos de
la imagen cuántica en lugar de ofrecer una descripción coherente e
inteligible de los fenómenos cuánticos.
Bohr considera que el objetivo de la ciencia ha de ser determinar
las interrelaciones entre cantidades observables del mundo. Para que
se entienda la teoría cuántica, se considera como observable, no «los
datos sensoriales directamente percibidos por la mente», como en la
filosofía positivista tradicional, sino, antes bien, los resultados de las
observaciones con aparatos de medida típicos. Pero la filosofía de
Bohr comparte algunos aspectos del positivismo tradicional, como el
hincapié en una clase de «los observables» dada de una vez por
todas y en la teoría como sólo un instrumento para obtener las co
rrectas correlaciones de unos observables con otros. Bohr afirmó que
en nuestra descripción de estos resultados observables de la medi
ción nos veremos siempre limitados a los típicos medios «clásicos»
para describir el mundo desarrollados por la física cuántica. Así, las
cantidades que leemos en nuestros aparatos de medida son cosas ta
les como la posición de una partícula, su momento, carga y momento
angular, etc. Un aparato de medida es algo caracterizable nuevamen
te en términos clásicos. Posee estados «salida» definidos, que están
correlacionados a las cantidades medidas de los microsistemas. La
marca depositada de plata metálica indicará, por ejemplo, que un
252 Filosofía de la física
fotón ha sido absorbido en alguna región limitada de una pelíecula
fotográfica; un destello determinado de un tubo detector puede indi
car el paso por una región de una partícula cargada, etc. En nuestro
registro de los resultados de una medición no habrá lugar para
estados de «superposición» cuánticos, sólo para estados descritos clá
sicamente.
El objetivo de los estados cuánticos es permitirnos hacer predic
ciones de probabilidad sobre los resultados del proceso de medida.
Una lectura clásica nos dice que un sistema ha sido preparado en un
estado cuántico dado. Las reglas dinámicas clásicas nos permiten se
guir la evolución a través del tiempo del estado cuántico asignado al
sistema. En un momento posterior, nos podemos valer de ese estado
cuántico para hacer predicciones probabilísticas sobre los valores
descritos clásicamente que se obtendrán en cualquier medición que
decidamos realizar. Pero es erróneo, desde este punto de vista, consi
derar que los sistemas entre una medición y otra poseen estados clá
sicos. Si podemos inferir del estado cuántico que en una medición
particular se obtendrá con seguridad un resultado específico, enton
ces, quizá podamos atribuir ese valor clásico al sistema aun cuando
no esté siendo medido. Pero, en general, cuando sólo pueden darse
probabilidades menores que la certeza de una variedad de valores
posibles para el resultado de una medición, es erróneo, bajo este
punto de vista, considerar que el sistema no medido posee alguno de
los valores posibles del resultado. Esto es muy diferente a lo que su
cede con la probabilidad clásica, donde nos figuramos que el sistema
tiene un valor definido pero desconocido, siendo la probabilidad
sólo una medida de nuestra ignorancia del estado real.
Bohr combinó esta concepción sobre la naturaleza de la medi
ción y sobre la escasa legitimidad de atribuir estados físicos clásicos a
los sistemas con lo que él llamó la idea de «complementariedad» a
fin de resolver algunas de las paradojas de la teoría cuántica. La com
plementariedad es una noción muy difícil de precisar completamen
te. Bohr mismo a menudo extiende la noción en formas bastante dra
máticas, hablando, por ejemplo, de las descripciones mentales y
físicas de la mente y el cerebro como complementarias. Pero, incluso
en el contexto teórico-cuántico, se da al término un uso muy amplio.
Los aspectos ondulatorio y corpuscular de una partícula se dice que
son complementarios uno del otro. Algunas veces son dos aspectos
de la descripción dinámica de un sistema — como la posición y el
2?3
momento— los que se toman como complementarios. La idea #0 neral es que un sistema puede ser descrito clásicamente en más de
una forma. En la física clásica, un sistema es, bien una onda, bien
una partícula, y un sistema tiene a la vez una posición definida y
un momento definido. En la teoría cuántica, sin embargo, estos pa
res de características aparecen curiosamente entrelazados. Los dos
aspectos complementarios del sistema son necesarios para su com
pleta caracterización. Pero es imposible describir el sistema simul
táneamente en términos de las dos características complementarias.
Podemos caracterizar los aspectos ondulatorios de un sistema, o
podemos caracterizar sus aspectos corpusculares. Pero no podemos
pensar en un sistema como ondulatorio y corpuscular al mismo
tiempo. Podemos imaginarnos un sistema que posea una posición
definida o un momento definido, pero, según Bohr, es imposible
atribuir simultáneamente una posición y un momento definidos a
una partícula.
La «exhaustividad conjunta pero mutua exclusividad» de las ca
racterísticas complementarias se manifiesta físicamente cuando pen
samos en formas posibles de utilizar la medición para asignar una
característica a un sistema. Podemos montar un dispositivo de inter
ferencia para descubrir los aspectos ondulatorios de un sistema,
como su longitud de onda y frecuencia. O podemos usar detectores
de partículas para determinar sus aspectos corpusculares, observando
por qué rendija pasa realmente la partícula. Pero el montar uno de
estos dispositivos experimentales imposibilita la construcción del
otro. Es físicamente imposible construir un dispositivo de medida
que pueda determinar simultáneamente dos de las características
descriptivas complementarias atribuibles a un sistema. Es lícito, en
tonces, concebir un sistema como ondulatorio, significando esto que,
si se realizase un experimento de carácter ondulatorio, el sistema re
velaría sus aspectos ondulatorios. Y es lícito concebir el sistema
como corpuscular, por razones similares. Pero nos vemos liberados
de la responsabilidad de atribuir aspectos contradictorios al sistema
debido al hecho de que nada de lo que hagamos en el ámbito de la
medición podrá poner de manifiesto estos aspectos contradictorios
simultáneamente.
Bohr pasa a mantener que es ilícito incluso pensar en el sistema
cuántico entre mediciones como dotado de la característica que que
remos atribuirle en un sentido absoluto, no relativizado. Valiéndose
214 Filosofía de la física
de una analogía con la demostración relativista de Einstein por la
que los intervalos de longitud y tiempo eran atribuibles a las cosas
sólo en relación a la elección de un particular sistema de referencia
de movimiento, Bohr argüyó que se podía atribuir estados a los sis
temas — en el sentido de atribuirles características tales como as
pectos ondulatorios o corpusculares— sólo en relación a una elec
ción de los aparatos de medida. En relación a un dispositivo
interferométrico experimental la luz era ondulatoria. En relación a
un dispositivo detector de partículas luminosas, o fotones, la luz
era corpuscular. Si no era en relación a una elección específica del
dispositivo experimental, no era nada en absoluto. (Naturalmente,
Einstein no aceptó de buen grado la analogía con la relatividad,
diciendo que ¡hasta un buen chiste podía contarse demasiadas
veces!).
Bohr argüyó entonces que en cualquier situación experimental
era esencial distinguir entre el sistema que estaba siendo medido, el
cual, hasta que la medición fuese realizada, debía describirse sólo en
estados cuánticos que expresaran potencialidades hacia valores ob
servables que se obtenían en la forma de probabilidades, y el aparato
de medida. El aparato de medida estaba, según Bohr, correctamente
caracterizado en términos clásicos, tanto en lo que se refería a su
construcción y finalidad prior a la medición, como a su estado final
que revelaba el valor medido correcto que había de atribuirse al sis
tema. Mientras que la teoría cuántica era universal en el sentido de
que cualquier sistema físico en el mundo obedecía las leyes básicas
de la teoría cuántica, en cualquier situación de medición uno tenía
que «separar» el mundo en dos componentes, el sistema medido y el
aparato de medida. El primero estaba correctamente caracterizado en
términos cuánticos; pero la descripción correcta para la parte restan
te de la medición del mundo estaba forjada en los conceptos físicos
clásicos tradicionales. Además, la medición no podía ser comparada
con la ipteracción física ordinaria, pues aunque esta última estaba re
gida por las leyes dinámicas de la mecánica cuántica, el proceso de
medida obedecía la regla independiente del Postulado de Proyec
ción.
Pero ¿en qué parte del mundo debía trazarse la línea divisoria
entre el sistema cuántico medido y el aparato de medida clásico? La
respuesta era que podía trazarse a cualquier nivel. Para algunos pro
pósitos era útil considerar únicamente a la partícula elemental como
La imagen cuántica del mundo 255
sistema cuántico y al resto del mundo físico como aparato de medi
da. Pero también podíamos, consistentemente, tratar cualquier parte
del aparato de medida como un sistema físico en interacción con la
partícula elemental, caracterizando al sistema conjunto formado por
la partícula y por esa fracción del aparato como un sistema cuántico.
Si hacíamos esto, reduciríamos el aparato descrito clásicamente a lo
que quedaría después de que la parte que inicialmente había reaccio
nado a la partícula hubiese sido traspasada al dominio cuántico. No
había nada en la física que marcase una línea divisoria estricta entre
la naturaleza cuántica y el aparato de medida clásico. La división po
día ser trazada a cualquier nivel. Pero la misma inteligibilidad de la
imagen cuántica demandaba que ésta fuera trazada en algún lugar.
Sería incoherente pensar en el universo entero como un sistema pu
ramente cuántico, pues la misma inteligibilidad de la atribución de
un estado cuántico a un sistema requería considerar al sistema como
medido por un aparato de medida descrito clásicamente, ajeno al sis
tema cuántico propiamente dicho.
La interpretación de Copenhague es una tentativa extraordinaria
mente ingeniosa de hacer justicia a todos los aspectos peculiares de
la nueva teoría cuántica. Abarca todo, desde la necesidad de descrip
ciones aparentemente incompatibles de un mismo sistema como on
dulatorio y corpuscular, hasta el papel especial jugado por la medi
ción y el Postulado de Proyección en el formalismo de la teoría. Pero
no es evidentemente una concepción del mundo fácil de entender.
Lo más sospechoso de todo es el papel especial que se reserva a los
aparatos de medida descritos clásicamente como esenciales para la
interpretación de la teoría. ¿Cómo puede haber tales cosas si, como
la teoría afirma, todo es en realidad un sistema cuántico? Y ¿cuál es
el papel especial reservado a los procesos de medida? ¿No son éstos
sólo interacciones de un sistema con otro sistema físico? ¿No pueden
ser descritas dichas interacciones por las reglas ordinarias de la teoría
cuántica? ¿Por qué debería haber una regla especial para los proce
sos de medida, si las mediciones no son más que otra variedad de in
teracción física? Y ¿es el punto de vista de Copenhague, con su rela
tivismo radical de los estados físicos de los sistemas respecto a las
elecciones de los aparatos de medida, capaz de proporcionarnos una
caracterización «realista» de cómo es realmente el mundo en su «pro
pia naturaleza»? Volveremos sobre estas cuestiones dentro de un mo
mento.
256
E l principio de incertidumbrePronto se vio que la teoría cuántica en cada uno de sus modos for
males conducía a una variedad de relaciones entre las características
de un sistema, que fueron resumidas como las Relaciones de Incerti-
dumbre. Una sencilla ilustración de estos resultados puede encon
trarse en la imagen ondulatoria de la versión por Schródinger de la
mecánica cuántica. Podemos preguntar por la probabilidad de encon
trar a una partícula localizada en alguna región espacial específica,
calculando las probabilidades según el grado al que la función de on
da está confinada a esa región. Alternativamente, podemos reescribir
la función de onda como una función del momento de la partícula,
encontrando así una nueva función que puede ser utilizada para de
terminar la probabilidad de encontrar a la partícula con su momento
en un intervalo dado. A través de la física ondulatoria clásica se vio
que había una relación recíproca entre el grado al que una función
de onda poseía una extensión espacial y el grado al que se encontra
ría dispersa en el «espacio de frecuencias» si la onda se reformulaba
en términos de varias componentes de frecuencias puras. Traducida
a términos cuánticos, esta relación recíproca conduce a la observa
ción de que cuanto menos dispersa en posición sea la distribución de
probabilidades para una partícula calculada a partir de su estado
cuántico, más dispersa tendrá que ser la distribución de probabilida
des para calcular su momento. Ningún estado cuántico podría gene
rar simultáneamente probabilidades fuertemente concentradas en
torno a un único punto en el espacio y a un único valor del momen
to. (Véase la figura 4.5.)
Desde la perspectiva de Heisenberg, este tipo de relación inversa
se manifestaba en el hecho de que los representantes matemáticos de
las cantidades observables, los operadores en su formalismo matemá
tico, eran «no conmutativos». Esto significa que el producto de dos
de ellos en un orden dado no era, en general, igual al producto
tomado en el orden inverso. Esta relación se cumple entre otras can
tidades conjugadas asimismo, no sólo entre la posición y el momento.
Si se pasaba a la representación abstracta de la teoría cuántica de von
Neumann y Dirac, era posible encontrar algunas relaciones matemá
ticas muy generales que resumían el Principio de Incertidumbre.
El grado de incertidumbre se toma como el producto de una me
dida de la dispersión de la probabilidad de las dos cantidades, cuan-
La imagen cuántica del mundo 257
« nPi
Aq2
F ig u r a 4 .5 . relaciones de incertidumbre. En cualquier estado cuántico de una partícula, hay una cierta probabilidad de que la partícula sea encontrada en una región
determinada del espacio y una cierta probabilidad de que su momento tenga un valor situado en una horquilla determinada de momentos. E n (a) se esboza un estado
en el que la posición de la partícula está fuertemente circunscrita por una estrecha
distribución de probabilidades (trazo q¡). La distribución de probabilidades correspondiente para el momento (trazo p¡) muestra una distribución de probabilidades muy «dispersa». En (b) se esboza un estado en el que la distribución de probabilidades para el momento (trazo p 2) tiene ahora un pico marcado. Ahora la distribución de
probabilidades para la posición (trazo q2) muestra una probabilidad ampliamente
«dispersa», de acuerdo con las relaciones de incertidumbre.
do estas distribuciones de probabilidad son calculadas a partir del
estado cuántico. Algunas veces la incertidumbre varia de un estado
físico a otro. En otros casos, por ejemplo, el de la posición y el mo
mento, había una incertidumbre mínima, fija, de validez universal.
Pero ¿qué significa físicamente esta «incertidumbre ineliminable»?
Al explorar este problema, Heisenberg ofreció una imaginativa
explicación de la incertidumbre, considerándola como indicadora de
una limitación fundamental de nuestra capacidad para fijar todas las
propiedades de un sistema a un grado arbitrario de precisión por
cualquier técnica experimental. La idea básica aquí era que cualquier
medición realizada sobre un sistema debe, inevitablemente, perturbar
físicamente al sistema medido. El fijar una cantidad a un grado deter
minado de precisión perturbaría, pues, el sistema de forma tal que
nuestro conocimiento del valor de alguna cantidad conjugada queda
ría reducido, pudiendo ésta tomar después de la medición cualquier
valor de un gran intervalo de valores.
25H Filosofía de la física
Un famoso experimento conceptual de Heisenberg para ilustrar
su interpretación del Principio de Incertidumbre es un tipo de mi
croscopio diseñado para determinar a un alto grado de precisión la
posición espacial de una partícula en un tiempo determinado. ¿Cómo
podría hacerse dicha determinación de posición? Solamente, arguye
Heisenberg, haciendo que una señal detectora interaccione con la
partícula en cuestión. Uno podría, por ejemplo, iluminar la partícula
con luz y buscar la luz dispersada por el choque con la partícula.
Viendo dónde ha sido dispersada la luz por la partícula obtendría
mos información sobre la localización de la partícula.
Pero el tratamiento clásico del uso de la luz en microscopía rela
ciona la capacidad de la luz para resolver pequeñas diferencias espa
ciales a la longitud de onda de la luz. La luz de corta longitud de on
da puede determinar diferencias espaciales a un grado más fino de lo
que puede hacerlo la luz de una longitud de onda mayor. Pero en la
teoría cuántica, la longitud de onda más corta está asociada a la fre
cuencia más alta y, por consiguiente, a una energía mayor para el pa
quete mínimo de energía de la luz, el fotón. Para poder observar la
partícula ai menos un fotón debe ser dispersado por ella. Cuanto ma
yor sea la energía de dicho fotón, mayor será la horquilla de valores
del «puntapié» que podría dar a la partícula, modificando su momen
to inicial a algún nuevo valor. Si se siguen todos los pormenores se
obtiene una imagen en la que un esfuerzo microscópico para situar la
posición de la partícula en una estrecha horquilla se ve acompañado
de una inevitable interferencia causal en la vida de la partícula, que
disminuye la precisión con que somos capaces de determinar el mo
mento de la partícula después de la medición de la posición.
Teóricamente, incluso en la física precuántica, cualquier medición
de un sistema debe interferir con el estado del sistema en un grado
mínimo. Pero, en la imagen clásica, dicha interferencia puede ser redu
cida a una cantidad tan pequeña como uno quiera. Para Heisenberg,
al menos en esta interpretación de la incertidumbre, el elemento esen
cial de la teoría cuántica era la ahora inevitable interferencia mínima
en el sistema, la perturbación irreducible de su estado, una perturba
ción que no podía ser reducida por ningún medio físico, y que debe
acompañar a cualquier tentativa de determinar el valor de una propie
dad dada del sistema dentro de un pequeño intervalo de valores.
Desde esta perspectiva, la incertidumbre se considera una limita
ción a nuestra capacidad de discernir los valores simultáneos exactos
La imagen cuántica del mundo 259
de dos propiedades conjugadas de un sistema. Esto es, consideramos
que el sistema tiene, por ejemplo, valores simultáneos precisos de la
posición y del momento, pero que nosotros somos incapaces, debido
a la interferencia inevitable del proceso de medida con el sistema, de
determinar con exactitud esos valores precisos, existentes conjunta
mente.
Bohr nunca quedó satisfecho con semejante interpretación de la
incertidumbre. Insistió desde el principio en que la especificación del
estado cuántico de un sistema constituía una descripción completa
de cada sistema individual del que ese estado cuántico era correcta
mente predecible. Era erróneo, argüyó, considerar que el estado
cuántico era válido en una colección de partículas, en la que cada
partícula posee de hecho un estado preciso más completo, si no com
pletamente cognoscible, de tipo clásico. Antes bien, argüyó, el estado
cuántico, con su «dispersión» intrínseca de los valores de las cantida
des clásicas representada por la dispersión de las distribuciones de
probabilidad asociadas con esos valores, era una descripción total del
estado real de la partícula. Para cualquiera de dichos estados cuánti
cos, como hemos indicado, habría conexiones entre los grados de
dispersión de las distribuciones de probabilidad para cantidades con
jugadas. Cualquier determinación de un estado cuántico que reduje
se la dispersión en la posición generaría automáticamente un estado
cuántico con una amplia distribución de probabilidades para el mo
mento. Pero, argüyó Bohr, era demasiado conservador interpretar
esta relación inversa como si se tratase meramente de una limitación
a nuestra capacidad de fijar con precisión valores conjugados simul
táneamente. En lugar de ello, uno debía considerar que cada partícu
la individual poseía — en el mejor de los casos— valores dispersos de
una cantidad clásica, si se insistía en considerar que las partículas no
poseían ninguna propiedad clásica entre mediciones.
Heisenberg se vio inducido a aceptar la lectura bohriana «ontoló-
gica». más radical, de la incertidumbre. Esto es, aceptó la idea de que
la incertidumbre refleja la dispersión irreducible de características
del sistema, no meramente una limitación en nuestro conocimiento
de propiedades conjuntas a grados arbitrarios de precisión. Más tar
de veremos algunas de las razones que le movieron a adoptar esta
postura más radical. Einstein, sin embargo, se vio consternado por la
teoría radical de Bohr y durante algún tiempo intentó hallar buenas
razones físicas para refutarla.
260 Filosofía de la física
Siguieron una serie de fascinantes debates entre Einstein y Bohr.
Einstein se propuso como cometido personal el encontrar una situa
ción experimental en la que se violasen las limitaciones a la especifi
cación exacta de cantidades conjugadas dictadas por las Relaciones
de Incertidumbre. Diseñó ingeniosos experimentos conceptuales
para intentar mostrar que uno podía determinar dos cantidades con
jugadas a un grado de precisión conjunta que el Principio de Incerti-
dumbre declaraba imposible. A cada una de las sugerencias de Eins
tein, sin embargo, Bohr argüía que el procedimiento experimental en
cuestión requería en último término la determinación de dos cantida
des básicas por uno de los procedimientos que, como podía demos
trarse utilizando argumentos heisenbergianos, limitaban nuestro co
nocimiento de las cantidades conjugadas necesarias de acuerdo con
las familiares limitaciones de la incertidumbre. Si uno acepta los con
traargumentos de Bohr, parecería imposible encontrar la manera de
soslayar las Relaciones de Incertidumbre por medio de algún experi
mento real que superase su limitación. Sin embargo, esto todavía deja
sin responder, incluso si el Principio de Incertidumbre es verdadero,
la cuestión de cómo exactamente han de entenderse las relaciones.
¿Deben de ser entendidas en el viejo, más modesto, sentido heisen-
bergiano como una limitación sobre lo que podemos determinar, o
en el- modo bohriano, más radical, que niega la existencia misma de
valores precisos de dos cantidades conjugadas?
¿Qué es la medición en la teoría cuántica?
El problema de la mediciónEl formalismo básico de la teoría cuántica es claro y su aplicación al
mundo de la observación y del experimento no es, en la práctica,
más polémico que el de cualquier otra teoría física formal. Pero la
teoría nos plantea un montón de problemas interpretativos sorpren
dentes. Miembros de la comunidad científica, que se muestran de
acuerdo plenamente con los resultados de la teoría cuántica aplicada
al mundo físico, se encuentran enfrentados entre sí cuando intentan
explicar justamente cómo «entienden» lo que la teoría nos dice sobre
la estructura fundamental del mundo.
La teoría asocia a los sistemas entre mediciones un estado cuánti
La imagen cuántica del mundo 261
co. Presumiblemente, pues, este estado «representa» en una forma u
otra el estado de naturaleza del sistema. Pero ¿qué es ese estado físi
co del sistema? y ¿cómo lo representa el estado cuántico? ¿Debería
considerarse al estado cuántico como una descripción de sistemas in
dividuales, pongamos, el de un fotón en el experimento de la doble
rendija? Después de todo, el hecho de que los resultados de la inter
ferencia sean válidos incluso si las partículas son enviadas una por
una a través de las rendijas, sugiere que cada fotón debe ser conside
rado de una forma u otra como «capaz de percibir» ambas rendijas
en la forma descrita por el estado cuántico. Pero ¿cómo puede des
cribirse correctamente una parfícula tan localizada por medio(de una
función de onda dispersa?
El uso‘ probabilístico de la función de onda, sugerido en primer
lugar por Born, hace alusión a una interpretación por la que la fun
ción de onda describiría, más bien, una colección, o «conjunto», de
sistemas, a la manera reminiscente del papel de las distribuciones de
probabilidad sobre posibles microestados de sistemas en la mecánica
estadística descrita en el capítulo 3. Dicha interpretación es también
sugerida por la lectura más obvia del Postulado de Proyección. Si la
función de onda es una descripción probabilística de una colección
de sistemas o, en una interpretación paralela, una representación de
nuestro conocimiento parcial del estado completo de un sistema in
dividual, entonces parece claro por qué descartar una función de on
da en favor de la correspondiente a un sistema en el que el valor
exacto de un observable dado se conoce tan pronto como ese valor
del observable haya sido obtenido en una medición. Si la medición
aumenta nuestro conocimiento específico de un sistema particular y
si la función de onda es relativa a ese conocimiento, no es sorpren
dente que se produzca un tipo de «colapso» no dinámico de la fun
ción de onda en la medición.
Pero esta interpretación también se encuentra plagada de dificul
tades. ¿Cómo explicamos los famosos efectos de interferencia tan pa
radigmáticos de la situación cuántica? El conocimiento parcial de
que el fotón pasó por la rendija uno no debería «interferir» con el
conocimiento parcial de que pasó por la rendija dos. Los fenómenos
de interferencia son característicos, más bien, de ondas físicas reales
dispersas. Hay también otras dificultades con la sencilla interpreta
ción conjuntista o del conocimiento parcial de la función de onda
cuántica. El complemento normal a considerar una representación
262 Filosofía de la física
como «parcial», a la manera de la descripción conjuntista estadística
de un sistema, es abrigar la esperanza de que una descripción ulte
rior es posible; la descripción ulterior localizará el sistema específico
como miembro de una colección más restrictiva de sistemas. De he
cho, lo que se espera normalmente es que exista una descripción de
un sistema por la que éste sea el único miembro de la «clase unidad»
de un, y solo un, sistema físico. Así, por ejemplo, si en mecánica esta
dística tenemos una descripción de un sistema como miembro de
una colección de sistemas caracterizados por su temperatura común,
pensamos que son posibles descripciones más completas de los siste
mas, siendo la más fundamental aquella que especificase exactamente
el microestado completo del sistema en cualquier instante de tiempo.
Pero Bohr insistió en que el estado cuántico de un sistema espe
cífico era una descripción completa del estado de ese sistema. Aunque
dicha descripción especificaba solamente probabilidades para los re
sultados de las diversas observaciones que podían ser realizadas so
bre el sistema, era la descripción «más fina» posible del sistema. Si
esto es así, entonces es erróneo pensar que la función de onda carac
teriza una colección o caracteriza un conocimiento parcial en el sen
tido de las interpretaciones tradicionales de la probabilidad. La cues
tión de si Bohr estaba en lo cierto sigue siendo controvertida. Sin
embargo, como veremos, muchos resultados han mostrado que si
Bohr estuviese equivocado, no seria una cuestión trivial explicar de
que manera exactamente podría una descripción cuántica ser com
plementada para dar una descripción más completa del estado de un
sistema individual. Algunas cuestiones que aparecen aquí implican la
posibilidad de seguir describiendo el estado de un sistema en los tér
minos clásicos tradicionales. ;Es posible, por ejemplo, pensar que
una partícula en un estado cuántico que es una superposición de dos
estados de espín posee, de hecho, una de las componentes del espín,
aunque no sepamos cuál de ellas es? Otros debates contemplan la
posibilidad cié complementar la descripción cuántica de un sistema
con una ¿aracterización más detallada del sistema que sea suficiente
para precisarlo en una manera no estadística, incluso en una forma
que evite los términos descriptivos clásicos. Por el momento basta
con decir que ni la simple interpretación del estado cuántico de un
sistema al modo de un estado tradicional físicamente disperso como
una onda clásica, ni la interpretación ingenua del mismo al modo de
una medida de probabilidad tradicional de una colección especifica
La imagen cuántica del mundo 263
da sólo mediante un conocimiento parcial del estado del sistema, pa
recen hacer justicia al papel que juega el estado cuántico en la teoría.
La teoría cuántica hace uso no sólo de los recién introducidos
estados cuánticos, sino también de los viejos estados clásicos. Bohr
interpreta que la función de onda especifica las probabilidades de los
resultados en las mediciones de varias cantidades. Pero, tal como
Bohr señala, estos resultados se especifican en los viejos términos clá
sicos. Una partícula sale de un aparato Stern-Gerlach de medida de
la componente del espín «definidamente en el haz de arriba» o «defi
nidamente en el haz de abajo». Un fotón que es sometido al experi
mento de las dos rendijas es finalmente localizado como habiendo
impresionado en alguna región definida la pantalla fotográfica. Alter
nativamente, si se han colocado detectores en las rendijas, el fotón es
detectado en el estado y «pasa definidamente por la rendija uno y
dispara el detector uno» o «pasa definidamente por la rendija dos
y dispara el detector dos».
Pero si todos los sistemas físicos pueden ser descritos adecuada
mente de acuerdo con las leyes de la mecánica cuántica —y la teoría
afirma esta universalidad— ¿cómo puede haber lugar en el universo
para instrumentos de medida cuyos estados de detección están carac
terizados en términos clásicos anticuados? ¿Existen realmente dos ti
pos diferentes de sistemas en el mundo, sistemas cuánticos y sistemas
clásicos, debiendo escribirse los primeros en términos de funciones
de ondas y los segundos en términos clásicos? O ¿es la práctica de
caracterizar en términos clásicos los resultados de las mediciones
algo que se ha de «eliminar» del contexto de la teoría cuántica como,
quizás, un tipo de «descripción aproximada», legítima pero condu
cente a errores, del estado real del aparato de medida? Si uno adopta
el argumento de que las descripciones clásicas de los aparatos de me
dida no son una descripción falsa de los mismos sino, al contrario, la
caracterización real de su verdadero estado físico, entonces surge la
cuestión de si no sería legítimo considerar a los sistemas cuánticos
medidos como poseedores de dichos estados clásicos.
Finalmente está la cuestión de la naturaleza del proceso de medi
da. Como indicamos, la teoría formal traza una clara línea de demar
cación entre los dos procesos, evolución dinámica y medición. Su
pongamos que conocemos el estado cuántico de un sistema en un
momento dado. ¿Cómo vamos a determinar el estado cuántico que
hemos de atribuirle en un tiempo posterior? Si el sistema no es ob
264 Filosofía de la física
servado en ningún momento entre los dos instantes de tiempo, en
tonces, de acuerdo con la teoría, tendremos que seguir la evolución
de la función de onda que describe el estado cuántico del sistema
utilizando la famosa ecuación de Schródinger. Esta ecuación es el
análogo en la teoría cuántica de las ecuaciones dinámicas de la diná
mica clásica que nos dicen cómo evolucionará en el tiempo el estado
dinámico clásico de un sistema, teniendo en cuenta que el sistema es
tuvo sometido a ciertas fuerzas y tenía una constitución interna espe
cífica. Al igual que en la física clásica, pues, existe un tipo de «deter
minismo» de la evolución de un estado cuántico. Un sistema
sometido a fuerzas determinadas y de una naturaleza dada que tiene
un estado cuántico definido en un momento dado, tendrá en un mo
mento posterior un estado cuántico definido relacionado al primero
por las leyes de la dinámica.
Pero, ¡esto no es así si se realiza una medición sobre el sistema en
dicho intervalo de tiempo! Pues, dice la teoría, cuando la medición
tiene lugar, la evolución dinámica ha de ser ignorada y, en su lugar,
debe aplicarse el Postulado de Proyección. La función de onda que
describe el sistema prior a la medición debe ser descartada y, en su
lugar, introducirse la función de onda correspondiente al valor de la
cantidad observable obtenido en la medición. (Si la medición no de
termina los valores de todas las cantidades observables del sistema
que podrían ser determinadas, entonces se utiliza en su lugar una
versión modificada del Postulado de Proyección, la Regla de Lüder.
Al igual que el Postulado de Proyección, empero, no se trata eviden
temente de un mero ejemplo de evolución dinámica ordinaria.)
Ahora bien, si pudiéramos librarnos de la interpretación de la
función de onda por la que ésta pasó a ser, como es el caso de algu
nas distribuciones de probabilidad clásicas, una representación de
nuestro conocimiento parcial del sistema, podríamos entender la me
dición y el Postulado de Proyección de una forma muy simple. Una
medición sería cualquier proceso que aumentase nuestro conoci
miento del estado del sistema. No es de extrañar, pues, que la fun
ción que describe nuestro conocimiento parcial del sistema «salte»
en la forma discontinua indicada por el Postulado de Proyección en
la medición. Pero, como hemos visto, dicha interpretación de la fun
ción de onda no llega a hacer plena justicia a sus otros aspectos — tí
picos de un estado físico— como es el de la interferencia. Si concebi
mos la función de onda como un tipo de estado físico del sistema.
La imagen cuántica del mundo 265
resulta mucho más difícil entender el lugar que ocupa en el formalis
mo el peculiar proceso denominado medición y entender el cambio
no dinámico de la función de onda en los procesos de medida.
¿Qué es lo que distingue, desde esta última perspectiva, un pro
ceso de medida de cualquier otra interacción dinámica ordinaria?
¿Cómo está el sistema relacionado a un aparato de medida en alguna
forma diferente al sistema meramente interaccionando con algún
otro sistema físico? Esa interacción tiene una descripción perfecta
mente clara en el seno de la teoría. Se trata de un aspecto de la diná
mica de los sistemas, en este caso de la dinámica que describe dos
sistemas inicialmente independientes uno de otro y más tarde en in
teracción física entre sí. Pero la evolución del nuevo sistema conjun
to (el sistema original combinado con el sistema físico con el que ha
llegado a interaccionar) no se parece en nada, de acuerdo con el for
malismo de la teoría, a ese proceso descrito por el Postulado de Pro
yección. Más decisivo es que, en la interacción dinámica ordinaria,
los efectos de interferencia debidos a encontrarse el sistema original
mente en una superposición de estados se conservan cuando el siste
ma interacciona con algún nuevo sistema físico. Las correlaciones
que caracterizan el proceso de interferencia son simplemente transfe
ridas al nuevo sistema conjunto.
Pero en un proceso de medida, según la descripción del Postula
do de Proyección, la interferencia se destruye. En el «colapso del pa
quete de ondas» que describe el Postulado de Proyección, los térmi
nos de interferencia sencillamente desaparecen. Un electrón descrito
por una función de onda extendida por todo el espacio está, una vez
que el electrón ha sido medido y localizado en una región espacial li
mitada, descrito por una función de onda confinada enteramente a esa
región. Un fotón descrito como una superposición de estados corres
pondientes a pasar por la rendija uno y por la rendija dos, está, des
pués de haber accionado el detector frente a la rendija uno, descrito
por una función de onda «pura» asociada a la rendija uno. ¿Por qué
las mediciones son diferentes de las interacciones físicas ordinarias?
La solución de Bohr y sus críticosHemos señalado anteriormente la ingeniosa y sutil tentativa de Bohr
de hallar una justificación de la naturaleza paradójica del mundo
266 Filosofía de la física
cuántico. En la Interpretación de Copenhague, la medición se toma
como una noción «primitiva». Un sistema interaccionando con el
mundo exterior puede ser medido y no sólo tomar parte en la inte
racción dinámica. Los resultados de los procesos de medida se consi
dera que constituyen los hechos verdaderamente incuestionables so
bre el mundo, y la teoría se considera un mecanismo cuyo único
papel es proporcionar correlaciones entre el valor basado en un pro
ceso de medida que prepara a un sistema en un estado cuántico da
do y el valor de alguna cantidad observable en una medición poste
rior. Entre una medición y otra no debe considerarse al sistema
poseyendo algún valor clásico dado pero desconocido. Antes bien,
posee meramente «potenciales» de revelar valores observables con
probabilidades especificables en relación a un aparato de medida ele
gido. Como la medición simultánea de algunas cantidades — las com
plementarias— no es posible, y carece de sentido preguntar por las
probabilidades de que el sistema posea dichos valores conjuntos, in
compatibles, de los observables complementarios.
Pero ¿es aceptable la Interpretación de Copenhague? Una obje
ción a la misma procede de Schródinger y Einstein. Al igual que
Einstein, Schródinger fue uno de los grandes inventores de la teoría
cuántica y al mismo tiempo uno de los más severos críticos de sus in
térpretes «ortodoxos».
Recordemos, en primer lugar, que para Bohr es incorrecto pensar
que un sistema que todavía no ha sido medido tenga un estado clási
co, salvo quizás en la situación poco corriente de tenerse la certeza
de que se obtendrá un valor particular al medir el sistema. Recorde
mos, además, que para Bohr cualquier medición consiste en la medi
ción de un sistema cuántico por un aparato que debe ser descrito en
términos clásicos. Y recordemos por último que, en la explicación
que Bohr da de la medición, la línea divisoria entre el sistema (des
crito por un estado cuántico) y el aparato (descrito por estados clási
cos) puede trazarse a cualquier nivel. Aunque debe haber una parti
ción en algún lugar entre el sistema cuántico medido y el aparato de
medida clásico, la línea divisoria entre uno y otro no es algo que esté
determinado por la física de la situación, sino que puede ser trazada
en cualquier lugar de la cadena que va desde el sistema microscópico
hasta el valor observado al final. De hecho, varios resultados de con
sistencia de la teoría cuántica muestran que se inferirán las mismas
probabilidades para los diversos resultados de una medición, tanto si
La imagen cuántica del mundo 267
consideramos que un sistema A es medido por un aparato compues
to B + C, como si consideramos en su lugar que el aparato C está
midiendo el sistema compuesto A + B.Sea ahora una caja en cuyo interior se encuentran un espejo divi
sor de haces y una fuente débil de fotones. Pongamos detectores en
las trayectorias del dispositivo y conectémoslos de manera que si el
detector uno se enciende primero, se produce una explosión por me
dio de una señal amplificada que mata a un gato en la caja. Es más,
dispongamos las cosas de manera que si el detector dos se enciende
primero, el mecanismo explosivo se desconecta. Schródinger nos pro
pone considerar lo siguiente: hasta que el fotón sea medido y locali
zado en una de las dos trayectorias, tenemos que figurárnoslo como
una superposición de haber estado en ambas trayectorias, cada una
con un peso asociado de un medio. Ahora podríamos considerar que
la medición ha tenido lugar tan pronto como uno u otro de los dos
detectores se enciende primero. En ese momento en el tiempo, pues,
el fotón habrá estado efectivamente en la trayectoria uno o efectiva
mente en la trayectoria dos. La superposición de los estados asocia
dos a las trayectorias colapsará a un único estado puro asociado a
una única trayectoria. (Véase la figura 4.6.)
Pero también podemos figuramos que la medición ha tenido lu
gar sólo en el momento en que hemos mirado dentro de la caja ce
rrada para ver qué había sucedido. La línea divisoria entre el mundo
cuántico y el aparato clásico podría ser, pues, correctamente trazada
tomándonos a nosotros como aparato de medida y a todo el conteni
do de la caja, incluyendo la fuente de fotones, el divisor del haz, los
detectores, los amplificadores, los mecanismos explosivos, los disposi
tivos interruptores del circuito, y el gato, como componentes todos
ellos de un único sistema cuántico complejo. Si trazamos la línea di
visoria en esa forma, entonces la concepción de Bohr nos obliga a
creer que, hasta que nosotros miremos en la caja, el fotón permane
cerá en una superposición de estados asociados a la trayectoria uno y
a la trayectoria dos. Pero lo mismo ocurrirá con el resto del sistema
acoplado al fotón y sus detectores. En otras palabras, hasta que no
miremos en la caja, es incorrecto decir que el gato está vivo o muer
to. En lugar de ello debemos decir que está «en una superposición
de estados vivo y muerto». No obstante, como Schródinger hace ver,
semejante concepción de algo que es macroscópico y animado es un
absurdo. Puede que sea posible (aunque difícil) figurarse un fotón en
268 Filosofía de la física
F i g u r a 4.6. El gato de Schródinger. En una caja cerrada herméticamente se monta un
aparato en el que un haz de partículas, e, es dividido en dos haces, siendo igual la probabilidad de que una partícula vaya por uno u otro camino. Si la primera partícula sigue la ruta que pasa por D¡, se activa un barril de explosivos, destruyendo a un
pobre gato colocado encima de él. Si la primera partícula pasa por D¡, el interruptor S se abre, salvando al gato de la posibilidad de ser dinamitado. ¿Cómo debería un observador que se encuentra fuera de la caja y es incapaz de saber lo que ha sucedido
en ella describir al gato tras un período de tiempo en el que no hay duda de que una partícula al menos ha pasado por Dt o ha pasado por D2? De acuerdo con la Interpretación de Copenhague, el observador no debería imaginarse al gato vivo o muerto, sino, antes bien, «en una superposición de estados vivo y muerto», de la misma manera que un electrón que sale de una máquina Stern-Gerlach izquierda-derecha sin
ser detectado debe imaginarse en una «superposición de estados de espín izquierda y espín derecha» hasta su detección. Pero ¿es aceptable semejante descripción del gato
(o de cualquier otro objeto macroscópico)? Si no lo es, ¿en qué momento antes de que el observador exterior haga una observación de lo que queda dentro de la caja
debería dicho observador considerar que el gato está «definidamente vivo» o «definidamente muerto»?
una superposición de estados de trayectorias o un electrón en una
superposición de estados de espín, pero ¿no es manifiestamente ab
surdo figurarse al gato ni muerto ni vivo, sino «en una combinación
de los dos estados con igual peso»? Recordad que el estar en una su
perposición no puede ser interpretado, de acuerdo con Bohr, como
estar en un estado definido u otro, sin saber en cuál de los dos se es
tá. Es una «combinación» efectiva de los dos estados.
Advirtamos, claro está, que Schródinger no demuestra en modo
alguno que la explicación de Bohr conduzca a observaciones des
La imagen cuántica del mundo 269
mentidas por el mundo. En el momento en que miramos al gato, por
supuesto, el paquete de ondas colapsa y encontramos al gato vivo o
muerto. De hecho, Bohr estaría sin duda alguna contento creyéndose
las consecuencias de su teoría. Todos los objetos en el mundo obede
cen a la mecánica cuántica, desde el más pequeño al más grande. Y
todos son susceptibles, pues, del tipo de efectos de interferencia que
nos obliga a considerar a los sistemas como si estuviesen en estados
de superposición. De nuevo, para Bohr estos estados son sólo poten
cialidades hacia resultados con probabilidades dadas en la medición.
El gato existe, al igual que el fotón mientras no es medido, en un
estado potencial que requiere referencia a una superposición. Pues,
en principio, podrían llevarse a cabo experimentos que revelarían la
interferencia latente en el estado del gato, así como podríamos quitar
los detectores y sustituirlos por una pantalla que pusiera de manifies
to la interferencia latente en la superposición de los estados trayecto
ria que es la condición cuántica del fotón.
Soluciones idealistasPero a otros les resulta absurdo pensar que el gato está en una super
posición de estados vivo y muerto. Llevando la sugerencia de
Schródinger un paso más adelante, E. Wigner introduce «el amigo de
Wigner». Sustituyamos el gato en la caja por un científico. Según
Bohr, hasta que miremos en la caja, deberíamos pensar que el cientí
fico está en una superposición de estados vivo y muerto, aunque, cla
ro está, el científico puede —en un momento en el que nos lo
estamos imaginando en dicha superposición— verse a sí mismo efec
tivamente volado, o no. Pero, dice Wigner, esto es absurdo. Esto lle
va a Wigner a una concepción de la medición y del mundo que es
bastante sorprendente procediendo de un físico, pero casi inevitable
como un camino alternativo para pensar en las perplejidades cuán
ticas.
¿Qué tiene de especial la medición, pregunta Wigner, en tanto
que opuesta a la interacción física ordinaria de dos sistemas físicos?
En una medición real, algún medidor debe «apercibirse» del valor
determinado por el proceso de medida. La concepción de Wigner
nos recuerda a la de los dualistas filosóficos, quienes consideran a un
ser humano (y, quizás, a otros seres sensibles) como una criatura mix
270 Filosofía de la física
ta compuesta al mismo tiempo de un cuerpo físico y de una mente
— un tipo de entidad no física «ligada» al cuerpo, quizás mediante
una causalidad mutua a través del cerebro. Así, Wigner piensa que
una medición ha tenido lugar cuando, y sólo cuando, una mente es
afectada por el sistema medido. El efecto sobre la mente puede ser
muy indirecto, produciéndose por mediación de muchos aparatos fí
sicos intermedios (incluyendo los órganos sensoriales, los nervios y el
cerebro del cuerpo).
Pero no podemos considerar la medición como una mera ganan
cia de información por parte de un sujeto y, por consiguiente, como
un cambio de su «función de conocimiento parcial». Como ya indica
mos, la concepción de una función de onda como un mero compen
dio de nuestro conocimiento de un sistema y la de su colapso en la
medición como tan sólo el familiar cambio discontinuo de una fun
ción de conocimiento cuando se adquiere nuevo conocimiento, no
hace justicia a las otras propiedades de la función de onda. Éstas son
las propiedades de interferencia, por las que la función de onda se
parece mucho más a una representación de un estado de un sistema
natural independiente del conocimiento. Para Wigner, antes bien, la
medición es una interacción de doble sentido entre la mente y el
mundo físico. El mundo afecta causalmente a la mente, diciéndole
qué valor determinado se ha medido en el sistema; el mundo hace
esto indicando a la mente en qué posible estado acabó el aparato de
medida físico. Pero la mente también actúa sobre el mundo. Pues el
solo hecho de estar el sistema físico en un estado clásico definido y
no más en una superposición, es un efecto de la interacción de la
mente con la materia.
Para Wigner, pues, la medición ha tenido claramente lugar una
vez que el científico en la caja sabe si está siendo volado, o no. Pro
bablemente, si los gatos tienen mentes, lo mismo es cierto para el ga
to de Schródinger. La concepción bohriana, que permite incluso a
los científicos y a los gatos formar parte de un sistema cuántico res
pecto a un medidor externo —como un científico fuera de la caja ce
rrada— se rechaza.
No es extraño que la descripción del mundo aportada por Wig
ner, con su metafísica dualista del mundo físico y las mentes observa
doras, no resulte atractiva para muchos. Además de tolerar lo que
muchos tacharían de metafísica absolutamente extravagante, la expli
cación de la medición ofrecida es de por sí problemática. El colapso
La imagen cuántica del mundo 271
de la función de onda causado por la acción de la mente sobre el sis
tema físico es algo que no se explica y que no compete a los físicos
explicar. Junto a los procesos legales de la naturaleza gobernados por
las leyes ordinarias de la física, en particular, por la ley dinámica de
la evolución dada por la ecuación de Schródinger, uno tiene ahora
un proceso «extrafísico» en el que algo de «fuera», la mente del ob
servador, interfiere en los mecanismos legales de la naturaleza física.
¿No podríamos encontrar una forma de explicar la medición que evi
te llegar a los extremos tolerados por estas explicaciones idealistas,
pero que evite asimismo, tanto la introducción de nociones primiti
vas de medición a la manera de Bohr, como la curiosa separación
ineliminable del sistema cuántico respecto al aparato de medida clá
sico propuesta por Bohr?
La medición como interacción físicaUn grupo de enfoques busca la caracterización de un proceso de me
dida, como distinto a las interacciones físicas ordinarias, viendo en el
mismo no una clase distinguida de proceso a la manera metafísica
del enfoque de Bohr o del enfoque idealista, sino intentando caracte
rizar una interacción por medición como una subclase específica de
las interacciones físicas ordinarias. Dentro de esta escuela, un grupo
de enfoques se centra en el hecho de que en un proceso de medida
el sistema cuántico interacciona con un instrumento de medida «ma
croscópico», y en el proceso de medida una microcaracterística del
sistema que está siendo medido se correlaciona con una macrocarac-
terística del aparato medidor en una forma que revela el valor de la
microcantidad.
En una operación que detecte por cuál rendija pasa la partícula,
por ejemplo, la partícula puede ser detectada al salir de la rendija
por medio de algún dispositivo de descarga electrónico (como un
contador Geiger) que amplifique el paso de la partícula por el detec
tor. Esto podría funcionar mediante la inducción al paso de la partí
cula de una cascada de un gran número de partículas cargadas segui
da de una gran descarga macroscópica de voltaje que involucre
enormes cantidades de partículas actuando concertadamente, reve
lando la presencia de la partícula microscópica. En una máquina de
Stern-Gerlach, las partículas con distintas componentes de espín en
272 Filosofía de la física
la dirección que se está midiendo son, primero, separadas espacial
mente unas de otras a distancias macroscópicas por el campo magné
tico inhomogéneo del aparato. Después son detectadas, bien en el
haz superior, bien en el haz inferior, por un aparato similar al descri
to más arriba. En el caso del gato de Schródinger, el aparato revela la
ruta tomada por la partícula amplificando la elección cuántica reali
zada a los estados macroscópicamente diferenciables de un gato ínte
gro con vida y un gato volado, muerto, disperso.
Hay, pues, dos importantes características de la medición que
debemos tener en cuenta. La primera es que el estado final del apara
to medidor involucra cantidades enormes de partículas y es identifi-
cable en una escala macroscópica. La otra es que los estados finales
del aparato son macroscópicamente diferenciables (son «puros» y no
una superposición de estados) y están perfectamente correlacionados
con los estados microscópicos del sistema cuántico que está siendo
medido.
Además, arguye esta escuela, debemos percatarnos de que en rea
lidad el aparato macroscópico es, al igual que el sistema cuántico ori
ginal, un sistema físico ordinario en el mundo. Desde este punto de
vista, el sistema macroscópico debe poder ser descrito por la teoría
cuántica, y su interacción con el sistema cuántico que está siendo
medido debe poder ser determinada por las leyes cuánticas ordina
rias de la interacción de dos sistemas físicos. Pero, en este punto, la
interpretación tropieza con una dificultad. La teoría cuántica nos di
ce que si un sistema interacciona con otro, estando el primer sistema
en un estado superposición antes de que se diera la interacción, el
sistema combinado formado por el primer y segundo sistemas des
pués de tener lugar la interacción debe estar en un estado super
posición. Esto es cierto incluso si el segundo sistema estaba ori
ginalmente en un estado puro o en uno de los estados mixtos
correspondientes a estar en uno u otro estado puro con diferentes
grados de probabilidad en el viejo sentido. Si una partícula con espín
a la izquierda interacciona con un aparato detector de espines en la
dirección arriba-abajo, la partícula entra en la interacción en una su
perposición de estados de espines arriba y abajo. El estado funda
mental del sistema partícula-más-aparato-medidor debe ser, entonces,
un estado superposición. Es la superposición de dos estados puros
—«la partícula con espín arriba y la máquina dice espín arriba» y «la
partícula con espín abajo y la máquina dice espín abajo»— . Pero si
La imagen cuántica del mundo 273
esto es así, ¿cómo puede la interacción representar una medición en
la que el resultado se supone que es un estado «partícula arriba y
máquina diciendo arriba» definido, o bien un estado «partícula abajo
y máquina diciendo abajo» definido?
Aquí se propone con frecuencia una manera de resolver esto que
hace referencia al hecho de que en una interacción por medición
puede considerarse a efectos prácticos que la superposición final no
existe en absoluto, aun cuando, propiamente hablando, la interacción
por medición tiene como resultado un estado superposición. En su
lugar, el estado superposición final puede ser reemplazado por un
estado mezcla similar. La idea fundamental es que, si bien la interac
ción del sistema y el aparato de medida debe, de acuerdo con las le
yes de la mecánica cuántica, retener esas correlaciones tipo interfe
rencia que distinguen una superposición de estados de una mezcla
de los dos estados, puede que en la práctica esta interferencia y sus
efectos sean irrecuperables después de haber tenido lugar la interac
ción.
¿Qué es lo que nos dice que el estado de una partícula espín-iz
quierda, después de haber sido enviada a través de una máquina de
espín arriba-abajo y no detectada, debe ser descrito como una super
posición de estados arriba y abajo, y no como una mezcla de los mis
mos? Si uno examinase el producto de una máquina de espín arriba-
abajo en cuanto a estados de espín arriba-abajo, encontraría a la
mitad de las partículas con espín arriba y a la mitad con espín abajo.
Ésta es la predicción que uno obtiene al describir a la partícula bien
en una superposición, o bien en una mezcla de estados de espín arri
ba y abajo con igual peso. Pero si uno enviase este producto a través
de un detector de espín izquierda-derecha, las partículas saldrían
todas a la izquierda. Eso es lo que la descripción tipo superposición
predice, pero no lo que la descripción tipo mezcla predice. Eso reve
la la interferencia remanente.
Pero si la partícula que sale de la máquina arriba-abajo se detecta
a la salida, será imposible en la práctica poner de manifiesto alguna
diferencia entre la mezcla de los estados «partícula arriba, aparato di
ce arriba» y «partícula abajo, aparato dice abajo» y su superposición.
Hacer esto requeriría un proceso que siguiera el curso exacto de
todos los microestados de todas las partículas en la cadena causal ini
ciada por la interacción del sistema de partículas y el detector. Tal
capacidad para poner de manifiesto la correlación debida a la interfe-
27A Filosofía de la física
renda remanente está fuera del alcance de cualquier posibilidad real.
Así pues, a los efectos predictivos de las probabilidades de los resul
tados de ulteriores experimentos que involucren a la partícula o al
aparato, bastara con la descripción tipo mezcla como una aproxima
ción de la verdadera descripción tipo superposición. La correlación
debida a la interferencia se ha disipado en el enorme número de gra
dos de libertad de las innumerables partículas que conforman el apa
rato macroscópico. Esta disipación se produce en el proceso amplifi
cador que revela el microestado de la partícula que está siendo
medida. Así pues, la superposición, aunque realmente presente, pue
de ser tratada como si se anulase cuando la medición tiene lugar.
Esta forma de considerar el proceso de medida cuenta con mu
chas ventajas. No se necesita introducir mentes que interaccionen
con el mundo físico mientras uno permanece fuera del mismo y sin
posibilidad de lograr una física comprehensiva que describa el mun
do. Ni se necesita la curiosa y elástica escisión del mundo en sistema
y aparato de medida que la Interpretación de Copenhague demanda.
En lugar de ello, hay solamente un mundo físico con interacciones fí
sicas ordinarias. Algunas de estas interacciones presentan las caracte
rísticas necesarias para que la verdadera descripción cuántica pueda
ser reemplazada por una aproximación falsa, pero adecuada. Estas
características son la macroscopicidad y la complejidad de los apara
tos de medida y ia perfecta correlación entre sus estados indicadores
y los estados microscópicos del sistema que está siendo medido. La
medición es. bajo esta concepción, sólo un tipo especial de interac
ción física y, cuando se la describe exactamente, cae bajo las leyes de
la dinámica cuántica y no fuera de ellas como sucede en las concep
ciones interpretativas idealistas o de Copenhague.
Pero esta forma de considerar la medición presenta problemas
propios. Los argumentos están diseñados para demostrar que uno
puede reemplazar una función de onda superposición por una fun
ción de onda mezcla a efectos predictivps cuando el sistema cuántico
medido interacciona con un aparato de medida suficientemente gran
de v complejo. Pero la medición de un sistema cuántico individual
da como resultado un sistema que debe tener, no la función de onda
mezcla, sino la función de onda pura de uno de sus componentes. Si
medimos el espín arriba-abajo de una partícula originalmente en un
estado que es una superposición de estados arriba y abajo, encontra
remos a la partícula en la medición definidamente arriba o definida-
La imagen cuántica del mundo 275
mente abajo. Esto es «el colapso del paquete de ondas». El argüir
que la superposición original de estados arriba y abajo, convertida
ahora en una superposición de sistema y estados del aparato combi
nados, puede ser reemplazada por un estado mezcla, parece estar de
acuerdo implícitamente con la idea de que la función de onda
debería ser considerada como una descripción, no de una sola partí
cula, sino de una colección de partículas. Pues es a una colección de
partículas medidas, algunas ahora definidamente arriba y otras defíni-
damente abajo, a la que se atribuye propiamente el estado mezcla.
Pero ¿cómo puede reconciliarse esta concepción implícitamente
conjuntista de la función de onda con los hechos que parecían indi
car que cada partícula individual tenía la cualidad de una función de
onda superposición? Por supuesto, puede responderse que esas cu
riosas correlaciones tipo interferencia de una partícula, las cosas que
nos mueven a decir que cada fotón individual «pasa por las dos ren
dijas», siguen siendo características del mundo cuántico. Lo que se
está defendiendo aquí, se dirá, es que podemos entender por qué en
un proceso de medida configuramos nuestra teoría para hablar como
si la interferencia desapareciese, cuando sabemos que realmente no
lo hace. El argumento es, de nuevo, que el tamaño y la complejidad
del aparato de medida nos asegura que los restantes potenciales de
interferencia realmente existentes nunca podrán ser detectados ob-
servacionalmente por ningún experimento practicable.
Hay, quizá, una objeción más profunda, pero una que al menos
tiene una respuesta potencial. Born, buscando desentrañar lo que sig
nificaba la función de onda, hizo la famosa sugerencia de que su in
tensidad debía ser tomada como la probabilidad de obtenerse un va
lor dado para el sistema. Confrontado con la cuestión de cómo era
posible que las probabilidades cuánticas difiriesen tan radicalmente
de las probabilidades clásicas, Bohr sugirió una sutil enmienda a la
idea de Born y habló de probabilidades en relación a la elección de
uno u otro de un conjunto de procesos de medida complementarios.
Pero estas interpretaciones, así como las idealistas, presuponen que
en algún momento los resultados de las mediciones son verdadera
mente caracterizables en términos clásicos. Pues, sólo podremos in
terpretar el estado cuántico como «potencial» de que el sistema reve
le aspectos clásicos, si conservamos los conceptos clásicos para
describir los resultados de las mediciones.
La interpretación de la que nos ocupamos ahora, sin embargo,
276 Filosofía de la física
debe tratar el papel de los conceptos clásicos en la interpretación de
la teoría en una forma mucho más compleja. Esto se debe a que, de
acuerdo con esta interpretación, no existen en realidad estados del
mundo físico que puedan ser descritos correctamente en términos
clásicos. La forma más correcta de caracterizar el estado total del
mundo — sistema y aparato de medida— será siempre por medio de
una función de onda cuántica. Pero si la función de onda debe de
suyo entenderse en términos de las probabilidades de estados descri
tos clásicamente, ¿cómo puede resolverse este dilema?
Se puede contar una historia que quizá explique cómo es posible
que podamos llegar a entender el significado de la función de estado
cuántica por una vía que «de paso» implica conceptos clásicos, aun
cuando en nuestro entendimiento final estos conceptos clásicos no
desempeñan ningún papel legítimo en la caracterización de los
estados del mundo físico. La historia dirá que nuestro anterior enten
dimiento precuántico del mundo es falso, pero que su suficiencia a
efectos prácticos para caracterizar los estados del mundo puede ser
explicada en última instancia por la relación de esta imagen falsa a la
verdadera imagen cuántica. Esta relación ha de fundamentarse en la
teoría de los procesos de medida indicada más arriba, donde la ca
racterización clásica del aparato de medida se explica como una «for
ma falsa pero adecuada de hablar». La historia nos dirá que, sobre la
base de un aparato conceptual que forma parte de, y depende de,
una falsa concepción del mundo, construimos la teoría cuántica co
rrecta, entendiendo inicialmente sus conceptos por referencia al mar
co de trabajo clásico anterior. Entonces, una vez en dominio del apa
rato cuántico, reconstruimos el marco de trabajo clásico anterior
como la imagen falsa, pero útil, del mundo que es. Después de utili
zar el marco de trabajo clásico a modo de escalera, nos deshacemos
de él una vez que hemos alcanzado nuestro objetivo.
Quizá. Pero surgen muchas preguntas. ¿Creemos realmente que
los objetos están efectivamente en estados de superposición en todo
momento? ¿Creemos realmente que no hay nada semejante a un gato
que esté, verdaderamente, del todo vivo o del todo muerto, sino que
permanece siempre en una superposición de estados? ¿Cómo
debemos de entender realmente dicha afirmación? ¿Habrá un
retorno final a la idea de que los conceptos clásicos son todavía ade
cuados para caracterizar lo que experimentamos directamente como
un tipo de característica de nuestra percepción inmediata, cuando no
La imagen cuántica del mundo 277
de todos los objetos físicos reales? Esto asemejaría los estados clási
cos a las «cualidades secundarias» de la tradicional metafísica lockea-
aa, esto es, características que son verdaderamente predecibles sólo
de los contenidos de la percepción inmediata y no de los objetos físi
cos «como son en sí mismos».
La interpretación de Kocben y las interpretaciones estocásticasDebería tenerse en cuenta que hay otras interpretaciones de los pro
cesos de medida que comparten con la que acabamos de discutir su
afirmación básica de que la medición debe ser considerada como
una especie de interacción física en general y no, como en la concep
ción de Bohr o en la concepción idealista, como un proceso diferen
ciado de la evolución dinámica ordinaria de los sistemas. Pero no
todas las concepciones semejantes del proceso de medida explicarán
la adecuación del Postulado de Proyección, esto es, la utilidad de ver
a la función de onda colapsando y perdiendo todos sus términos de
interferencia, como resultado del tamaño y de la complejidad del
aparato de medida y de la disipación consiguiente de interferencia en
irrecuperabilidad.
S. Kochen, por ejemplo, ha propuesto otra descripción del lugar
de la medición en la dinámica. Una vez más, es en la naturaleza de la
interacción del sistema medido con el aparato de medida, según la
descripción de la dinámica cuántica, donde es hallado el fundamento
para justificar el lugar ocupado por el Postulado de Proyección en la
teoría. No se reserva ningún papel a los aparatos de medida descritos
clásicamente, como en la teoría de Bohr, ni se invoca un reino espe
cial del ser fuera de la física y, por consiguiente, fuera de la mecánica
cuántica, como en las interpretaciones idealistas. Pero tampoco de
sempeñan un papel crucial el tamaño macroscópico y la complejidad
del aparato de medida. La naturaleza de la interacción que establece
correlaciones entre los estados puros del sistema medido y el aparato
de medida sigue, empero, siendo relevante.
La interpretación de Kochen descansa en un importante teorema
de la mecánica cuántica. Dejemos que dos sistemas interaccionen.
Existirán entonces propiedades de cada uno de los dos sistemas
componentes dotadas de una naturaleza especial. Si la función de on
da del sistema combinado se desarrolla en función de aquellos
278 Filosofía de la física
estados puros de los sistemas individuales basados en estas propieda
des especiales, entonces los términos de interferencia de esa función
de onda desaparecerán. Por lo que se refiere a estas propiedades,
pues, la función de onda del sistema combinado será igual a la que
caracteriza una «mezcla». Las propiedades especiales vienen determi
nadas por la naturaleza de los sistemas componentes y por la natura
leza de su interacción. En muchos casos existirá solamente una tal fa
milia de propiedades especiales. Aunque la costumbre en la teoría
cuántica ha sido expresar la función de onda del sistema interactivo
en función solamente de los estados puros relevantes para el sistema
aislado y del aparato, la nueva expresión elige una «base» para repre
sentar el estado dependiente de la naturaleza de la interacción. (La
matemática aquí es reminiscente de la posibilidad en física clásica de
representar sistemas dinámicos acoplados en «coordenadas norma
les». Si dos péndulos están acoplados mediante un muelle débil, por
ejemplo, la energía va y viene de un péndulo al otro dando lugar a
estados variables en el tiempo para los sistemas individuales. Pero
existen nuevas coordenadas en las que el movimiento puede ser ex
presado. Éstas dependen de la interacción. El estado del sistema aco
plado entero es estacionario cuando se mira en esta nueva, más com
pleja, representación coordenada.)
La idea de esta nueva interpretación es que el sistema y el apara
to, cuando interaccionan, puede considerarse que tienen uno respec
to del otro uno de los valores definidos de las propiedades que for
man la base de esta forma especial de representar la función de onda.
Asi pues, puede decirse que una partícula con espín, interaccionando
con la maquina Stern-Gerlach de medición arriba-abajo, está defini
damente arriba o definidamente abajo en relación al aparato de me
dida con el que está interaccionando. De manera similar, puede de
cirse que la máquina está definidamente en un estado «señala arriba»
o definidamente en un estado «señala abajo» en relación a la partícu
la cuyo espín está midiendo. Es la dinámica de la interacción lo que
determina en cualquier interacción por medición cuáles característi
cas del sistema y del aparato puede afirmarse que son definidas.
Pero hasta esta definitud es solamente una definitud del sistema
relativa al aparato y del aparato relativa al sistema. La partícula está
definidamente arriba o abajo según el «testimonio» del aparato de
medida, y el aparato señala definidamente arriba o abajo según el tes
timonio del sistema medido. En esta nueva interpretación no hay un
La imagen cuántica de! mundo 279
«colapso del paquete de ondas» en el sentido estipulado por la inter
pretación bohriana o por la idealista. En este aspecto se parece a la
interpretación discutida anteriormente que recurre al tamaño y com
plejidad del aparato de medida. La mecánica cuántica tiene un alcan
ce universal, y los teoremas que nos dicen que la superposición nun
ca desaparece realmente en la interacción, siguen siendo válidos. Se
puede ver esto si se considera el estado del sistema medido y del
aparato de medida combinados en relación a todo el entorno exte
rior, esto es, en relación al universo entero salvo la partícula interacti
va y el aparato de medida bajo consideración. Según el testimonio
del mundo exterior, la partícula y el aparato combinados presentan
el estado cuántico total de un sistema interactivo con todas las carac
terísticas correlaciónales de interferencia que ello implica.
Kochen llama a la observancia del sistema-más-aparato combina
dos por el mundo exterior «observancia pasiva», ya que no hay nin
gún acoplamiento dinámico del sistema-más-aparato al mundo exte
rior. A la observancia del sistema por el aparato y del aparato por el
sistema las llama «observancia activa», ya que hay un acoplamiento
dinámico entre el sistema y el aparato. Puede ser cierto, pues, que
una partícula espín-izquierda, después de interaccionar con una má
quina de medición arriba-abajo, tenga un espín arriba definido en re
lación al aparato de medida o un espín abajo definido en relación a
dicho aparato. Y el aparato tendrá una lectura arriba o abajo defini
das en relación a la partícula. Sin embargo, la información según la
cual la partícula era originalmente espín izquierda se conserva y la in
terferencia de los estados básicos para el sistema combinado (arriba
para la partícula y señala arriba para la máquina, abajo para la partí
cula y señala abajo para la máquina), interferencia que contiene la in
formación de que la partícula era originalmente espín izquierda, se
conserva y puede, en principio, ser revelada por una observación lo
suficientemente sutil.
Esta interpretación, pues, intenta hacer justicia a nuestra intui
ción de que, tras la medición, la partícula y el aparato poseen estados
definidos. Los tienen si los estados son los apropiados a la dinámica
de la interacción y si se considera que la partícula y el aparato tienen
estos estados puros según el testimonio de cada uno por el otro. E
intenta hacer justicia, asimismo, a la vindicación mecánico-cuántica
de que la superposición nunca se destruye. Esto se debe a que la su
perposición sigue estando presente en el estado del sistema y del
280 Filosofía de la física
aparato de medida combinados según el testimonio del mundo exte
rior. Por supuesto, queda aún mucho por decir en el sentido de in
tentar demostrar que esta interpretación hará justicia a todos los he
chos observacionales sin invocar la dicotomía radical entre medición
e interacción dinámica del punto de vista bohriano.
Algunas otras interpretaciones recientes proceden postulando un
reino de procesos físicos que discurren a un nivel inferior al del
estado cuántico. En este nivel más profundo se sugiere que tiene lu
gar un tipo de actividad aleatoria, o estocástica. Con una formulación
adecuadamente inteligente de dicha física adicional describiendo
nuevos procesos físicos, uno puede confiar en obtener una teoría en
la que, en ciertas circunstancias, el proceso físico subyacente de tipo
aleatorio pueda «conducir» un sistema originalmente en un estado
cuántico que es una superposición a un estado cuántico que es
«casi» un estado puro correspondiendo a un solo valor para la canti
dad medida. Naturalmente, estas circunstancias físicas se supone que
son las que corresponden a lo que tomamos por proceso de medida
en la versión ortodoxa. En todas estas teorías, sin embargo, el nuevo
estado no es en realidad el estado ondulatorio completamente colap-
sado que la mecánica cuántica predice después de que una medición
haya tenido lugar. Dicha teoría debe, pues, contener también elemen
tos que nos digan por qué es legítimo adoptar el Postulado de Pro
yección y suponer que el estado es un estado puro tras la medición,
cuando realmente no lo es. En este caso, los argumentos habituales
se construyen de manera tal que a todos los efectos prácticos las pre
dicciones realizadas utilizando el estado real y el estado puro aproxi
mado sean las mismas.
Las interpretaciones de «muchos mundos»Hay todavía otra interpretación, propuesta inicialmente por H.
Everett y J. Wheeler, que intenta hacer justicia a las desconcertan
tes características de la medición abogando por una nueva metafísi
ca del mundo. A diferencia del revisionismo metafísico radical de
Bohr, uno que niega en algún sentido una realidad objetiva al
mundo físico en su conjunto, conservando una realidad sólo en re
lación a la elección del aparato de medida, la nueva metafísica es
objetivista. Pero el mundo real que postula es tal que choca, de he
cho, con nuestras intuiciones.
La imagen cuántica del mundo 281En la explicación bohriana del proceso de medida se «desecha»
una parte de la función de onda siempre que se realiza una medi
ción. La partícula, con espín izquierda, entra en la máquina de medi
da arriba-abajo en una superposición de estados arriba y abajo. Pero
una vez que se ha realizado la medición, la partícula se encuentra de
finidamente arriba (y el aparato de medida señala definidamente arri
ba) o definidamente abajo (y el aparato de medida señala definida-
mente abajo). Pero de acuerdo con la dinámica cuántica, justo antes
del «colapso de la función de onda» el complejo partícula-y-aparato
estaba en una superposición de estados «arriba y señala arriba» y
«abajo y señala abajo» combinados. Supongamos que la medición da
el valor «arriba» para la partícula. ¿Qué pasó con la componente
«abajo y señala abajo» de la función de onda? Sencillamente desapa
reció del mundo. Y con ella desaparecieron también las posibilidades
generadas por interferencia latentes en su presencia conjunta con la
otra componente de la función de onda.
Pero Everett y Wheeler suponen que ambas componentes de la
función de onda continúan existiendo después de que la medición
haya tenido lugar. ¿Cómo puede ser éste el caso? Cuando una partí
cula se detecta a la salida de una máquina que mide el espín arriba-
abajo, ¿no está definidamente arriba o definidamente abajo? ¿Cómo
podría darse las dos cosas? La respuesta dada por esta interpretación
es que en cada medición el universo se desdobla en una multiplici
dad de mundos, uno por cada resultado posible del proceso de me
dida. Hay un mundo en el que la partícula sale de la máquina en el
estado espín-arriba. En ese mundo también se obtiene en la máquina
la lectura espín arriba, pues los estados de detección del aparato de
medida se supone, de nuevo, que están perfectamente correlaciona
dos con el valor de la cantidad medida en cuestión. Pero junto al
mundo que tiene una partícula espín-arriba y un aparato de medida
donde se lee arriba, hay también un mundo con una partícula espín-
abajo y una máquina que lee espín abajo. La función de onda de la
partícula con espín a la izquierda que entra en la máquina e interac-
ciona con ella podría escribirse como una superposición de estados
«espín arriba y señala arriba» y «espín abajo y señala abajo». En la in
terpretación «de los muchos mundos» que estamos considerando
ahora, cada componente de esta superposición representa lo que está
aconteciendo en alguno de los muchos mundos presentes que se «es
cinden» de un universo cada vez que se realiza una medición.
282 Filosofía de la física
Naturalmente, la interpretación requiere una forma de tratar la
probabilidad de los resultados. También requiere varios resultados
de consistencia para intentar convencernos de que la imagen de la
medición que nos está ofreciendo dará resultados observacionales
consistentes con los conocidos resultados resumidos en el formalis
mo estándar de la mecánica cuántica. Naturalmente, tampoco esta in
terpretación está libre de críticas. En primer lugar, la imagen metafí
sica es considerada por muchos grotesca y extravagante, lo cual no
sorprende. Después de todo, nosotros experimentamos sólo uno de
los posibles estados resultantes como producto de una medición, no
una variedad de todos los productos posibles. Es por esto por lo que
hablábamos del «colapso del paquete de ondas» en primer lugar.
¿Qué razón, que no sea una predilección por la simetría frente a la
experiencia, tenemos realmente para suponer que todos los otros re
sultados también ocurrieron y permanecen ocultos para nosotros de
bido a que son experimentados por otras «derivaciones» nuestras
que existen en otras derivaciones del universo? La teoría también
presenta problemas internos en lo que se refiere a cuándo tiene lugar
la escisión. ¿Ocurre con cada interacción? ¿Sólo en las interacciones
por medición? En el caso de estas últimas, ¿qué las distingue de las
evoluciones dinámicas ordinarias en una forma que justifique la me
tafísica de la escisión del universo? Y ¿a lo largo de qué dimensiones
tiene lugar? Una función de onda puede ser descompuesta en com
ponentes diferentes. ¿Representan escisiones todas estas descomposi
ciones? ¿De qué manera? O, ¿hay una descomposición preferida que
rige la forma en que el universo se divide, pongamos, determinada en
la manera que la interpretación kocheniana de la interacción deter
mina la propiedad medida y la propiedad de medición especiales?
En los últimos años algunos han combinado la concepción «de
los muchos mundos» y la concepción idealista de la medición en una
interpretación de «muchas mentes» (D. Albert y B. Loewer). En ésta,
solamente hay un mundo físico descrito en todo momento por la
función de onda evolvente que sigue la evolución dictada por la
ecuación de Schródinger y que nunca colapsa. Pero cualquier mente
que registre el valor de una cantidad medida se disocia en una varie
dad de mentes, cada una de las cuales experimenta uno solo de los
resultados posibles del proceso de medida. De nuevo, se proponen
pruebas de consistencia para intentar convencernos de que en cues
tiones tales como la comunicación de los resultados de nuestras me
La imagen cuántica del mundo 283
diciones a otros, o la recepción de comunicaciones de su parte (me
diadas por el mundo físico), o en la repetición de las mediciones, ob
tendremos los conocidos resultados probabilísticos predichos por la
teoría cuántica.
La lógica cuánticaHemos estado explorando enfoques diseñados para explicar las cu
riosas características del mundo implicado por la mecánica cuántica;
estos enfoques descansan en programas que explican los fenómenos
por referencia a características metafísicas del mundo. Ya sea que los
programas postulen una dualidad flexible entre sistema cuántico y
aparato de medida clásico, como hace la teoría de Bohr; un papel re
manente para los conceptos clásicos en el reino de la mente fuera de
la realidad física, como hacen los enfoques idealistas; una visión del
mundo como uno en el que la dinámica cuántica rige universalmen
te, como hacen los enfoques que se apoyan en el tamaño y la com
plejidad del aparato de medida o en la interpretación de la interac
ción por Kochen; o una ampliación radical de nuestra ontología para
explicar los fenómenos, como hacen los enfoques tipo muchos mun
dos; todos buscan la solución en alguna modificación de nuestras
concepciones tradicionales sobre la naturaleza de los sistemas físicos
del mundo.
Un enfoque algo diferente busca la resolución de los problemas
en una modificación de nuestras ideas tradicionales concernientes a
algunos de los modos más difundidos y generales que tenemos para
describir el mundo. Quizá sea necesaria una reinterpretación radical
de los esquemas más generales de que disponemos para asimilar los
fenómenos del mundo, se arguye, si se quiere comprender el sentido
de las misteriosas propiedades cuánticas que hemos indicado.
Uno de dichos enfoques recalca el importante papel que la pro
babilidad juega en la teoría. Algunas de las desconcertantes propieda
des cuánticas pueden ser resumidas haciendo notar cuán radicalmen
te difieren en su forma de operar las probabilidades cuánticas de las
probabilidades más familiares de la física clásica. Tomemos, por
ejemplo, el experimento de la doble rendija. Nos figuramos que la
luz está compuesta de fotones localizables porque los detectores co
locados en las rendijas indican que toda la energía luminosa pasa por
2H4 Filosofía de la física
una de las rendijas o por la otra, fotón por fotón, y nunca por ambas
al mismo tiempo. ¿No deberíamos, entonces, concebir la probabili
dad de que un fotón alcance la pantalla como el resultado de dos
procesos «independientes», el fotón llegando a x después de pasar
por la rendija uno y el fotón llegando a x después de pasar por la
rendija dos? Pero, entonces, las reglas clásicas de la probabilidad nos
llevan a esperar que la probabilidad de que un fotón llegue a x pa
sando, bien por la rendija uno, bien por la rendija dos, será la suma
de las dos probabilidades separadas. Por supuesto, esto no es así,
pues tenemos los ya familiares efectos de interferencia. Quizá, pues,
deberíamos rechazar nuestras conocidas reglas para combinar proba
bilidades condicionadas por causas independientes.
Otra característica anómala de la probabilidad en la teoría cuán
tica puede verse cuando consideramos las denominadas distribucio
nes compuestas. Supongamos que tenemos una población de seres
humanos cuyos pesos se distribuyen de acuerdo con alguna distribu
ción de probabilidades de pesos. Y supongamos también que hay
una distribución del color de los ojos, caracterizable de nuevo por
una distribución de probabilidades. Entonces tiene sentido preguntar
por la distribución compuesta del peso y del color de ojos a la vez. Si
hay una cierta probabilidad de que una persona mida por encima de
un metro ochenta centímetros, y una cierta probabilidad de que una
persona tenga ojos azules, hay entonces una probabilidad compuesta
de que tenga ojos azules y una altura superior a un metro ochenta
centímetros.
Pero, como sabemos, dichas distribuciones de probabilidad com
puesta no siempre son posibles en mecánica cuántica. Puede que ha
ya una probabilidad dé encontrar a una partícula en una región par
ticular del espacio y también una distribución de probabilidades que
determine cuándo el momento de la partícula se encuentra dentro
de una horquilla determinada de valores del momento. Pero no ha
brá una probabilidad compuesta de encontrar a la partícula a la vez
en un intervalo espacial definido y en un intervalo de momentos de
finido. Bohr trata esto haciendo notar la imposibilidad física de reali
zar mediciones simultáneas de la posición y el momento. Posición y
momento son, en sus términos, complementarios entre sí. Y para los
observables complementarios uno no puede esperar de la mecánica
cuántica funciones distribución de probabilidad compuesta bien defi
nidas. Una de las sugerencias actuales es que quizá esta ausencia de
La imagen cuántica del mundo 285
funciones de probabilidad compuesta pueda ser fundamentada en al
guna nueva teoría, no estándar, de la probabilidad.
Un diagnóstico todavía más profundo de los problemas concep
tuales de la mecánica cuántica busca la raíz de los problemas en
cuestiones sobre la naturaleza misma de la lógica propiamente dicha.
La lógica dicta las reglas básicas que rigen las relaciones vinculantes
que presentan entre sí nuestras proposiciones sobre el mundo. La ló
gica clásica nos dice, por ejemplo, que una proposición y su negación
no pueden ser las dos verdaderas, que una o la otra debe ser verda
dera; que si dos proposiciones son verdaderas, su unión también es
verdadera; etcétera. ¿Podría una revisión de la lógica clásica ayudar
nos a comprender el sentido de los fenómenos cuánticos? Nosotros
hemos considerado a la lógica como si de algo inmutable e indepen
diente de nuestro conocimiento experimental del mundo se tratase.
Pero, después de todo, también pensábamos lo mismo de la geome
tría hasta hace dos siglos. Quizá la lógica sea una cuestión empírica
en la misma medida que ahora consideramos que la química y la geo
metría lo son.
Una sugerencia en esta dirección fue realizada por H. Reichen-
bach, quien pensó que dando cabida a proposiciones que no fueran
ni ciertas ni falsas, algunas de las características de los sistemas cuán
ticos podrían representarse adecuadamente. Una afirmación sobre la
posición de una partícula era verdadera o falsa después de que se
hubiese realizado una medición de la posición. Pero para una partí
cula en un estado cuántico entre mediciones, en el que la posición
tuviera un valor definido con probabilidad uno, ¿no podríamos decir
que las afirmaciones sobre la posición tenían un valor de verdad «in
determinado», no siendo ni verdaderas ni falsas?
Una sugerencia mucho más fructífera de una revisión lógica para
ayudarnos con la mecánica cuántica tiene sus orígenes en el trabajo
de G. Birkhoff y J. von Neumann. Este trabajo presenta a la vez un
aspecto polémico y otro no polémico. El no polémico procede del
proyecto general de intentar discernir en la teoría cuántica las carac
terísticas más básicas que condujeron a los desconcertantes fenóme
nos cuánticos. Ya hemos observado que la teoría fue desarrollada ini
cialmente en dos formalismos que al principio parecieron tener muy
poco que ver uno con otro, la mecánica matricial de Heisenberg y la
mecánica ondulatoria de Schródinger. Schródinger mostró la equiva
lencia formal de las dos teorías, y Dirac y von Neumann pasaron a
286 Filosofía de la tísica
exponer la teoría en un modo más abstracto, que tomó de los dos en
foques su núcleo común.
Pero incluso estas formulaciones estándar de la teoría cuántica
podrían contener, a la par que elementos esenciales, elementos que
son inesenciales, artificios meramente de un modo particular de ex
poner la teoría. ¿Podríamos hallar una forma de encontrar los ele
mentos más esenciales de la teoría, aquellos que tendrían que apare
cer en cualquier «representación» de los hechos físicos?
Birkhoff y von Neumann señalaron que una forma de hacer esto
es centrándonos en las relaciones entre estados de sistemas, relacio
nes que podrían ser consideradas como un tipo de «lógica» de pro
posiciones sobre el sistema. Supongamos que una partícula pasa efec
tivamente, es decir, con probabilidad igual a uno, a través de un
filtro que sólo permite el paso de partículas espín-arriba. Entonces
podemos decir que «espín arriba» es verdadero para la partícula. Si
la partícula pasa definidamente a través de un filtro que deja pasar
tanto partículas espín-arriba como partículas espín-abajo, diremos
que en este caso «espín arriba qo espín abajo» es verdadero. Si una
partícula pasa efectivamente a través del filtro p y a través del filtro j
diremos que en este caso «p qy s» es verdadero.
Consideremos ahora la «ley distributiva» de la lógica tradicional,
la ley que dice que sí p es verdadero para algo y r o s es verdadero
para algo, entonces, bien p y r son verdaderos para el sistema, o bien
p y s son verdaderos para el mismo. Si un hombre es alto y tiene los
ojos azules o bien marrones, entonces el hombre es alto con ojos azu
les, o bien alto con ojos marrones. ¿Es «qy» distributiva sobre «qo»
de la misma forma que «y» es distributiva sobre «o»? No lo es. Con
sideremos una partícula que es «espín izquierda qy (espín arriba qo
espín abajo)». Cuando todas las partículas relevantes hayan pasado a
través de la máquina (arriba qo abajo), «arriba qo abajo» será verda
dero para cada partícula. Las partículas que son «espín izquierda qy
(espín arriba qo espín abajo)» son. pues, sólo las partículas definida-
mente espín-izquierda. Pero ninguna partícula tendrá probabilidad
uno de pasar a través de una máquina espín-izquierda y probabilidad
uno de pasar a través de una máquina espín arriba. Pues, espín iz
quierda y espín arriba son propiedades complementarias, y ningún
sistema puede definidamente tener estas dos propiedades al mismo
tiempo. Lo mismo es cierto para el espín izquierda y para el espín
abajo. No hay, pues, nada que sea «espín izquierda qy espín arriba» y
La imagen cuántica del mundo 287
nada que sea «espín izquierda qv espín abajo», y, en consecuencia,
nada que sea «(espín izquierda qy espín arriba) qo (espín izquierda
qy espín abajo)». Aunque muchas partículas son «espín izquierda qy
(espín arriba qo espín abajo)», es decir, todas las que son espín iz
quierda, ninguna partícula es «(espín izquierda qy espín arriba) qo
(espín izquierda qy espín abajo)». Por consiguiente, «qy» no es distri
butiva sobre «qo» en la forma que «y» es distributiva sobre «o».
Uno puede formular una lógica de proposiciones del tipo ordina
rio utilizando el «no» ordinario, el «y» ordinario y el «o» ordinario.
Dicha lógica tiene la propiedad distributiva indicada más arriba y se
denomina una álgebra booleana. Uno puede formular una estructura
formal del tipo apropiado a «qy» y «qo» (junto con una negación
cuántica apropiada). Se denomina una red modular ortocomplemen-
tada. (En realidad, la estructura requerida por la mecánica cuántica
es, por razones que no vienen al caso, un poco más débil, una red
modular «débil»). El uso no polémico de dicha nueva «lógica» es el
siguiente: Uno puede captar los elementos esenciales de la estructura
de superposición, tan característica de los sistemas cuánticos, repre
sentando la estructura de las proposiciones acerca de los sistemas
cuánticos como una red modular. Entonces uno puede explicar por
qué la formulación estándar de la mecánica cuántica funciona tan
bien como lo hace demostrando que «representa» la red de proposi
ciones. (De un modo similar, uno puede justificar la introducción de
un espacio de fases clásico en la mecánica clásica como una repre
sentación del álgebra booleana de proposiciones sobre los sistemas
clásicos).
El asunto se torna más controvertido, de hecho, muy controverti
do, cuando se hace la propuesta (en su día por H. Putnam, por ejem
plo) de que la «lógica» cuántica debería ser interpretada como lógica
en el pleno sentido del término. La idea ahora es que, así como la re
latividad nos mostró que la geometría euclídea, en su día considera
da como válida para el mundo, era en realidad falsa y debía ser reem
plazada por razones empíricas por la geometría no-euclídea del
espacio-tiempo, así la mecánica cuántica nos dice que la lógica boo
leana estándar a la que estábamos acostumbrados es incorrecta como
lógica del mundo. Los hechos empíricos nos llevan a ver que la ver
dadera lógica del mundo es una caracterizada por la lógica no distri
butiva de la mecánica cuántica y no por la lógica distributiva que,
creíamos, describía correctamente las relaciones entre proposiciones
288 Filosofía de la física
sobre el mundo. Desde este punto de vista, «qy» es en realidad «y» y
«qo» es «o». Sucede únicamente que algunas cosas que considerába
mos verdaderas sobre «y» y «o» son falsas, ocupando otras verdades
su lugar.
Es fácil ver por qué una concepción de esta índole resultaría
atractiva. Consideremos un haz de partículas, todas las cuales fueron
preparadas en el estado de espín-izquierda. El haz se envió entonces
a través de una máquina de medida de espín arriba-abajo con ambos
canales arriba y abajo abiertos. Los rayos emergentes se recombina-
ron a continuación. Nos gustaría decir de este haz que es un haz es
pín-izquierda definido. También nos gustaría decir de sus partículas
constituyentes que son, bien espín arriba, bien espín abajo. Pero no
queremos decir de ninguna de las partículas en el haz que está en un
estado «espín izquierda y espín arriba» o «espín izquierda y espín
abajo», pues espín izquierda y espín arriba son propiedades comple
mentarias, como lo son espín izquierda y espín abajo. Ninguna partí
cula, pues, puede ser definidamente espín izquierda y definidamente
espín arriba, y ninguna partícula puede ser definidamente espín iz
quierda y definidamente espín abajo.
Pero en la lógica cuántica podemos afirmar que las partículas en
el haz son todas espín izquierda, y que cada partícula en el haz es
«espín arriba o espín abajo», siempre que leamos el «y» como «qy» y
el «o» como «qo». La paradoja se evita porque, dada la no distributi-
vidad de «qy» sobre «qo», el decir que cada partícula es «espín iz
quierda y (espín arriba o espín abajo)» con estas nuevas lecturas para
la conectivas, no implica que sea forzosamente verdad que cualquier
partícula en el haz haya de ser «espín izquierda y espín arriba» o «es
pín izquierda y espín abajo».
Pero ¿nos muestra realmente la mecánica cuántica que debería
mos sustituir nuestra lógica clásica por una nueva lógica? Y ¿elimina
mos con ello realmente los aspectos paradójicos del mundo cuánti
co? Una objeción es que aunque «qy» y «qo» jueguen un papel útil,
sería totalmente erróneo pensar en ellos como sustitutos de «y» y
«o». Un problema es que «y» y «o» todavía juegan, en su significado
tradicional, un papel en la descripción cuántica del mundo. Un haz
mixto de partículas procedente de una máquina arriba-abajo, partícu
las que han sido detectadas a la salida de los canales correspondien
tes de la máquina arriba-abajo, antes de haber sido recombinadas, es
uno en el que las partículas están correctamente descritas por «espín
La imagen cuántica del mundo 289
arriba o espín abajo», dando a «o» su significado clásico. Solamente
el haz superposición de esas partículas que pasaron por los canales
sin ser detectadas y luego fueron reunidas en el haz recombinado, es
tá correctamente descrito por «espín arriba qo espín abajo». Es, pues,
erróneo pensar que en la imagen cuántica del mundo «qy» y «qo» reemplazan, antes que complementan, a «y» y «o». Otra objeción co
rriente a la tesis de la sustitución es que la argumentación utilizada
en la propia discusión supone las reglas de la lógica estándar.
También internamente, en su tentativa de reconstruir la descrip
ción cuántica del mundo, el enfoque revisionista lógico encuentra di
ficultades. Es cierto que en la lógica cuántica «p qy (r qo s)» no es
equivalente a «(p qy r) qo (p qy s)». Pero incluso en la lógica cuántica
el segundo contiene al primero, esto es, si el segundo es verdadero, el
primero debe ser también verdadero. Es sólo en la dirección del pri
mero al segundo en la que no se da la inclusión. Supongamos ahora
que aplicamos la teoría estándar de la probabilidad a nuestra nueva
lógica. Un resultado básico de la teoría de la probabilidad es que si t contiene a w, entonces la probabilidad de w es como mínimo tan
grande como la de t. Después de todo, si el ser t verdadero garantiza
que w sea verdadero, sin duda es al menos tan probable que w sea el
caso como que lo sea t.En el caso de las dos rendijas en la teoría cuántica, esta conexión
entre inclusión y probabilidad parece sugerir que, dadas la lógica
cuántica y la teoría estándar de la probabilidad, la probabilidad de
que una partícula aterrice en un punto x sobre la pantalla, suponien
do que las dos rendijas estuvieran abiertas, debería ser al menos tan
grande como la probabilidad de que aterrice en x, suponiendo que
una de las dos rendijas está abierta, pero no las dos. La primera pro
babilidad es la probabilidad asignada a la aserción «aterriza en x y pa
só por la rendija uno o pasó por la rendija dos». La segunda probabi
lidad es la de «aterriza en x y pasó por la rendija uno o aterriza en x y
pasó por la rendija dos». Y, una vez más, este segundo fenómeno con
tiene al primero. Pero el fenómeno de interferencia permite que la
probabilidad de aterrizar en x cuando las dos rendijas están abiertas
sea menor que la probabilidad de aterrizar en x suponiendo que una
de las rendijas está abierta, y mucho menor que la suma de las proba
bilidades derivadas de estar las dos rendijas abiertas individualmente.
Esto al menos parece indicar que la lógica cuántica, por sí sola, no re
solverá todos nuestros dilemas sobre las paradojas cuánticas.
Filosofía de la tísica
ResumenAcabamos de examinar, de una forma muy rápida y superficial, varias
de las tentativas de «dar sentido» a la peculiar naturaleza del mundo
revelada por la teoría cuántica. El lector debería percatarse de que
cada una de las interpretaciones aquí mencionadas es una sutil, y al
gunas veces muy compleja, tentativa de hacer justicia a la plétora de
hechos que la teoría cuántica pone de manifiesto. Cada interpreta
ción precisa de un examen detenido de sus virtudes y de sus debili
dades críticas antes de que pueda juzgársela adecuada o inadecuada
para la tarea asumida.
El mismo alcance de las cuestiones que permanecen sin respues
ta definitiva es intimidador. ¿Cuál exactamente es el papel de los
conceptos clásicos en la descripción cuántica del mundo? ¿Son ellos
los conceptos primitivos e ineliminables del mundo necesarios para
describir la parte del mundo en el lado de la medición de un «corte»
flexible entre el sistema cuántico y el aparato de medida clásico?
¿Son ellos los términos ineliminables mediante los que ha de descri
birse la experiencia de mentes fuera del reino físico? ¿O son esos
conceptos clásicos sólo las maneras falsas, pero provechosamente fic
ticias, que son legítimamente aplicadas para describir estados verda
deramente cuánticos en circunstancias especiales, donde los concep
tos sirven para caracterizar «aproximadamente» los estados de los
sistemas? Más aún, ¿en qué medida pueden ser aplicados a los siste
mas entre mediciones? ¿Son totalmente inaplicables a estos sistemas,
o hay alguna forma en la que podamos legítimamente considerar a
los sistemas evolventes como caracterizados por valores clásicos, aun
cuando éstos nos sean desconocidos?
Y ¿cuál es la naturaleza del estado cuántico representado por la
función de onda? ¿Es una caracterización de los sistemas individua
les o sólo de una colección de sistemas? ¿Es la caracterización de un
aspecto físico real del mundo, o deberíamos de considerarla, por el
contrarío, como un tipo de mecanismo de cálculo intermedio que no
representa ninguna realidad física? Dado el papel de esa función de
onda en el cálculo de probabilidades de los resultados de una medi
ción, ¿puede considerarse que es algo muy parecido a una probabili
dad precuántica, pongamos, una medida de proporción en una colec
ción o un grado de creencia racional? O ¿dejan claro los fenómenos
de interferencia, más bien, que se trata de algo más parecido a una
La imagen cuántica del mundo 291
función de onda física? Más aún, ¿es el estado cuántico de un siste
ma relativo a un proceso de medida particular, como insiste Bohr?
¿Qué podemos decir del peculiar proceso de medida? ¿Debe ser
considerado como una componente ineliminable de la teoría, de nin
gún modo asemejable a las evoluciones dinámicas o interacciones de
los sistemas ordinarias? ¿Es el «colapso del paquete de ondas» una
descripción de un fenómeno físico real o algo similar al cambio sufri
do por una distribución de probabilidades clásica cuando cambia la
base de conocimiento del agente? ¿Qué es lo que caracteriza exacta
mente las situaciones que son mediciones frente a las que son inte
racciones físicas ordinarias? ¿Nos da una distinción bohriana entre el
sistema y el aparato de medida clásico la clave? ¿Es esencial la pre
sencia de una «mente» que actúe sobre el mundo? ¿O es el proceso
de medida sólo un caso especial de una interacción cuántica ordina
ria caracterizada, ya sea por el tamaño y la complejidad de uno de los
sistemas interactivos, o por la naturaleza especial de la interacción en
relación a alguna propiedad preferida del sistema y el aparato?
¿Debemos postular una ontología radicalmente nueva de universos
desdoblados para hacer justicia a los hechos sobre la medición?
Claramente, aquí hay un conjunto complejo de cuestiones inter-
conectadas. El desarrollo pormenorizado de las cuestiones ha arroja
do mucha luz sobre lo peculiar justamente que es en realidad la ima
gen cuántica del mundo. La comprensión de algunas de las
interpretaciones de la medición requiere ahondar profundamente,
tanto en los hechos observacionales del mundo cuántico, como en el
formalismo de la teoría que intenta hacer justicia a estos hechos. El
lector que vaya a explorar la literatura más detallada, y algunas veces
bastante sofisticada en su aspecto formal, sobre estos temas, debería
sin embargo tener presente ciertos hechos básicos. Siempre es bue
no repasar con asiduidad las peculiaridades fundamentales de los
experimentos básicos. La luz que pasa por una pantalla con dos
rendijas muestra una figura de interferencia fácilmente explicable si
la luz es una onda dispersa cuya energía pasa por las dos rendijas al
mismo tiempo. Las partes individuales de las ondas se recombinan
después en el lado opuesto de la pantalla que contiene las rendijas.
Pero todo experimento diseñado a fin de detectar la energía de la
luz, encuentra a esa energía en una forma localizada. Los detectores
colocados en las rendijas muestran que los fotones pasan por una
rendija o por la otra, nunca por las dos simultáneamente. La luz ab
29 2 Filosofía de la física
sorbida por la película fotográfica siempre se pone de manifiesto por
la interacción de un fotón con una molécula iónica de plata, nunca
tomo una onda dispersa de energía. Los electrones, al ser detectados,
se manifiestan asimismo como partículas localizadas. Pero cuando los
electrones son difractados por una red cristalina, aun cuando sean di
fractados uno a uno, el haz difractado recibido en los detectores
muestra la típica figura de interferencia de una onda interaccionando
con una red difractora. ¿Cómo puede cada electrón individual, si es
que es sólo una partícula «puntual», «saber», al encontrarse con el
cristal, que está interaccionando con un ordenamiento regular distri
buido espacialmente de átomos difractores en la red del cristal?
Hechos como éstos y sus análogos para otras características,
como los efectos de interferencia observados en los experimentos de
medición del espín, son los que demandan la revisión radical de
nuestro formalismo físico, desde el de la física clásica al de la mecáni
ca cuántica. No es de extrañar que dichos hechos peculiares requie
ran, no ya una revisión de detalle, pongamos, modificando algunas de
las leyes de fuerzas que gobiernan los sistemas, sino un replantea
miento radical de lo que significa ser un sistema en el mundo, de lo
que significa para semejante sistema tomar un valor, y de lo que sig
nifica que dicho valor sea revelado en un proceso de medida. Como
veremos en el resto del capítulo, éste no es el último de los enigmas
con los que nos confronta la teoría cuántica.
El problema de las variables ocultas y el determinismo
Deterninismo e indeterminismoEl influjo de la imagen dinámica mecanicista newtoniana del mundo
condujo a un nuevo énfasis en una vieja doctrina, el determinismo.
La idea del determinismo — que a partir del estado del mundo en un
momento dado, las leyes de la naturaleza fijan completamente el
estado del mundo en momentos posteriores— apenas es nueva. Ideas
de la misma índole habían formado parte de la especulación en la
Grecia antigua. Pero el modelo de un sistema de partículas interac
cionando unas con otras mediante fuerzas, de forma tal que una con
dición inicial dada del sistema genere su condición posterior en todo
momento del futuro siguiendo las famosas leyes del movimiento de
Newton, proporcionó un ímpetu renovador a esta visión determinis
La imagen cuántica del mundo 293
ta del mundo. La famosa afirmación del físico Laplace en el sentido
de que si conociera el estado del mundo en un momento dado, po
dría inferir su estado en todos los instantes futuros, caracteriza esta
nueva concepción.
Naturalmente, dicha doctrina tiene también sus consecuencias
preocupantes. Si, como T. S. Eliot lo expresa, «el tiempo pasado y el
tiempo futuro están en el tiempo presente, y el tiempo presente en el
tiempo pasado», si todo lo que ha de ser, está ya determinado por lo
que ha sido, ¿dónde hay lugar en el universo para la «libre elección»?
¿Cómo puede nuestra capacidad de decisión, determinando como
hace — al menos a un cierto grado— lo que será nuestra vida futura,
ser considerada de suyo nada menos que el resultado del estado del
mundo anterior incluso a nuestro nacimiento, algo obviamente fuera
de nuestro control? No tendré más que decir sobre tales cuestiones
filosóficas ampliamente debatidas.
Examinemos más detenidamente el determinismo. Ni siquiera en
la física clásica está claro que pueda decirse con seguridad que en el
mundo impera un determinismo ingenuo. En el caso de la mecánica
corpuscular newtoniana, existe la posibilidad de colisiones multicor-
pusculares. Si las partículas se conciben como partículas puntuales
para las que son válidas las leyes de fuerza usuales, no podemos, en
general, derivar el estado del mundo posterior a la colisión a partir
del estado anterior a la colisión. También existe la posibilidad, en
cualquier momento, de partículas «procedentes del infinito» de for
ma tal que resulte imposible determinar el estado en un tiempo pos
terior a partir de un estado suficientemente anterior. En contextos
relativistas generales, cuestiones acerca de la complejidad de la topo
logía del espacio-tiempo pueden incluso poner en tela de juicio la
noción de «el estado del mundo entero» en un instante dado. El es
tudio de la posibilidad de «superficies de Cauchy», es decir, de
estados del mundo «en un instante» suficientes para determinar los
estados del mundo en todos los tiempos posteriores, es una cuestión
teórica intrincada. De nuevo, como vimos en el capítulo 3, está la
cuestión de la inestabilidad radical del movimiento, incluso en la
descripción newtoniana. Un sistema puede estar constituido de tal
forma que haya estados tan próximos como uno quiera a cualquiera
de sus condiciones iniciales; pero estos estados pueden conducir a
estados futuros del sistema que diverjan radicalmente de aquellos a
los que conduce la condición inicial dada. No importa cuán precisos
Filosofía de la física
puedan ser nuestros aparatos de medida, puede que seamos incapa
ces de determinar el estado inicial de un sistema a un grado de preci
sión que nos permita en alguna forma predecir su estado futuro tras
un intervalo de tiempo siquiera mínimo. De hecho, hay quienes argu
yen que, ante dicha inestabilidad radical, es irrazonable pensar que el
sistema tiene alguna condición inicial exacta que determine comple
tamente su evolución futura, aunque esta concepción es, evidente
mente. minoritaria.
Pese a estas incertidumbres, hay claramente aspectos de la mecá
nica newtoniana, y de otras teorías físicas clásicas como la teoría del
electromagnetismo, que nos llevan a considerar el mundo descrito
por ellas como genuinamente determinista. Y estos resultados de la
física tienen un impacto en las concepciones filosóficas que intentan
describir el mundo como uno en el que todo lo que sucede está de
terminado a suceder por algún acontecimiento pasado y por las cone
xiones legales entre los estados del mundo en un instante y sus
estados en algún otro instante.
La idea de que todo suceso tiene su causa, de que para cada ocu
rrencia en el mundo puede encontrarse una «razón suficiente» para
dicha ocurrencia en los sucesos pasados, fue considerada como un
postulado metafísico fundamental por Leibniz. Kant argüyó que el
principio de «causalidad universal» era una regla del funcionamiento
del entendimiento humano. Con ello estaba respondiendo en parte al
escepticismo de Hume, según el cual no podía encontrarse en el
mundo nada que correspondiese a la noción del metafísico de la «co
nexión necesaria» de unos sucesos con otros (nada, esto es, aparte de
las actuales regularidades «de hecho» del acontecer y de las expecta
tivas psicológicas generadas por ellas). De acuerdo con Kant, podía
mos saber a priori que el mundo de nuestra experiencia estaba sujeto
a los principios de causa y efecto. (De hecho, no está nada claro que
las dudas sobre el determinismo generadas por la teoría cuántica que
vamos a explorar seguidamente hubieran desalentado realmente a
Kant. habida cuenta del papel que éste reserva al principio de «todo
suceso tiene una causa».)
Un grupo de filósofos hallaron el principio de que todo suceso
tiene una causa universalmente verdadera, pero no como una verdad
metafísica a la manera de Leibniz o como una verdad «trascenden
tal» a la manera de Kant. Para ellos, el principio de que cada suceso
era tal que podía hallarse un suceso pasado suficiente para garantizar
La imagen cuántica del mundo 295
la ocurrencia del suceso dado era un «dictado metodológico». Era
una decisión nuestra el no abandonar la búsqueda de un suceso an
terior explicativo. Si se daba un suceso para el que no pudiésemos
encontrar un suceso anterior que lo explicase causalmente, ¿no po
dríamos entonces mantener que simplemente no habíamos mirado
bien o el tiempo suficiente? Después de todo, ¿cómo podíamos estar
seguros de que no existiese semejante suceso explicativo? Nuestra
mera incapacidad para haber encontrado ya uno podía siempre ser
tomada, alegaban estos filósofos, como una señal, no de la inexisten
cia de un suceso que aportase una explicación causalmente adecua
da, sino simplemente de nuestra incapacidad de determinarlo.
Quizá el impacto más ^interesante de la teoría cuántica sobre
estas cuestiones sea la afirmación por muchos de que por primera
vez contamos con una teoría del mundo que nos permite negar, para
un suceso dado, que pueda siempre hallarse cualquier suceso pasado
que sea adecuado causalmente para explicar porqué el suceso dado,
en lugar de algunas alternativas especificables del mismo, ocurrió.
Aquí, se afirma, existen razones para negar la existencia de la causa
necesaria, no sólo razones para pensar que dicha causa ha escapado
simplemente a nuestra percepción. Pasaremos a explorar los tipos de
argumentos propuestos para rebatir dicho argumento. El lector
debería notar, sin embargo, que ocultas en el fondo se encuentran
toda suerte de desconcertantes cuestiones filosóficas que nosotros no
vamos a explorar. Por ejemplo, la misma noción de determinismo
presupone la noción de una ley científica, una generalización que co
necte sucesos en un instante a sucesos en algún otro instante. Pero
como B. Russell señaló, si admitimos cualquier tipo de descripción de
los sucesos como legítima y cualquier generalización que haga uso de
dichas descripciones, resulta una cuestión trivial que cada suceso
pueda ser conectado «legalmente» a algún suceso anterior. Así pues,
quedan por resolver muchas cuestiones importantes, puramente filo
sóficas, si queremos saber con certeza qué significa verdaderamente
la afirmación de que el mundo es determinista.
Argumentos contra las variables ocultasPero regresemos a nuestra preocupación central. ¿Qué nos movería a
decir que la mecánica cuántica muestra que el mundo es indetermi-
Filosofía de la física
nisia.’J Supongamos que un sistema está preparado en un estado
cuántico dado en un momento determinado. Supongamos ahora que
durante un intervalo de tiempo ese sistema permanece aislado de
cualquier interacción con el mundo exterior a él. ¿Está el estado
cuántico de ese sistema al final de dicho intervalo de tiempo comple
tamente «determinado» por su estado cuántico al inicio del interva
lo? La respuesta es que lo está. La evolución dinámica del estado
cuántico está regida por la ecuación de Schródinger. Y esta ecuación
determina completamente el estado cuántico en el instante posterior
a partir de su forma al inicio del intervalo de tiempo. Nada, pues, en
la evolución de los propios estados cuánticos sugiere un nuevo inde
terminismo debido a la teoría cuántica.
Es, antes bien, en la determinación de los valores de los resulta
dos de una medición donde podría surgir el indeterminismo. Dada la
cantidad observable que queremos determinar mediante una medi
ción, queda fijada una clase de resultados posibles para ese proceso
de medida. Pero el estado cuántico atribuido al sistema sólo permite
inferir que se obtendrá uno en particular de dichos resultados con
una cierta probabilidad. Solamente en casos muy excepcionales, el
estado cuántico asignará una probabilidad de uno a un resultado po
sible y una probabilidad de cero a cada uno de los restantes resulta
dos posibles. Así pues, el saber que un sistema ha sido preparado de
una manera determinada en un instante dado, e incluso el saber que
el sistema no ha sufrido interferencias en un intervalo de tiempo da
do, no nos permitirá por lo general predecir que se obtendrá un, y
solo un, valor de un observable, si ese observable es medido al final
del intervalo de tiempo.
Pero, por supuesto, eso todavía es compatible con el determinis
mo que se da en el mundo. Pues aunque el estado cuántico no de
termina completamente cuál de los resultados se obtendrá, eso po
dría todavía quedar determinado en cualquier caso por algún factor
no tomado en cuenta en el estado cuántico. Hay argumentos diseña
dos para convencernos de que la cantidad obtenida en una medición
no debe ser considerada, en general, como una cantidad poseída por
el sistema antes de la medición. Consideremos una partícula de la
que se sabe que está en un estado espín izquierda, por ejemplo. Si se
realiza una medición izquierda-derecha sobre esa partícula, sabemos
que la partícula resultará ser definidamente espín izquierda. Si se re
aliza una medición arriba-abajo sobre la partícula, se tendrá que la
La imagen cuántica del mundo 297
mitad de las partículas son espín arriba y la otra mitad espín abajo.
Pero ninguna partícula es «definidamente izquierda y definidamente
arriba» y ninguna es «definidamente izquierda y definidamente aba
jo». Sería erróneo, pues, considerar a la colección de partículas antes
de la medición como una colección en la que el cien por cien son es
pín izquierda, el cincuenta por cien espín arriba y el cincuenta por
cien espín abajo. Consideraciones de esta índole llevaron a muchos a
sugerir que el proceso de medida no «determina un valor preexisten
te para una cantidad» sino, antes bien, «crea la cantidad». Como ve
remos, incluso el considerar la medición de esta forma, al menos el
considerarla como un tipo de proceso causal que cuando actúa sobre
el sistema produce el estado medido del mismo, tiene sus propias di
ficultades.
Sin embargo, ¿no podríamos pensar que la partícula antes de ser
medida tiene alguna cantidad «variable oculta» que determina com
pletamente el valor obtenido como resultado de la medición? Pensad
en la partícula que es definidamente espín izquierda. ¿No podría ha
ber algún otro factor propio de la partícula que determine su natura
leza, bien de forma tal que en una medición arriba-abajo se encuen
tre que está en el estado arriba, o bien de forma tal que en una
medición arriba-abajo se encuentre que está en el estado abajo? Este
factor no es tenido en cuenta en el estado cuántico del sistema, en el
hecho de que el sistema es definidamente espín izquierda. El estado
cuántico de espín-izquierda genera las probabilidades correspondien
tes a ser espín arriba o espín abajo si se realiza una medición arriba-
abajo. Pero eso no significa de por sí que no exista un factor oculto,
uno ignorado por el formalismo cuántico. Bohr negó explícitamente
que dicho factor pudiera existir, insistiendo en que el estado cuánti
co era una descripción completa del sistema cuántico. Pero la mera
insistencia dogmática, aun cuando provenga de alguien tan versado
como Bohr, no es un argumento. Einstein, como es sabido, fue impla
cable a la hora de insistir en que el indeterminismo del formalismo
cuántico indicaba que la teoría era incompleta. No podía creer, ase
guraba, que Dios «jugase a los dados» con el universo. ¿Podrían los
estados cuánticos, al igual que los estados estadísticos clásicos, po
seer por debajo una descripción más detallada de los sistemas que
reintrodujese un determinismo total en la descripción del mundo?
Para entender porqué muchos han negado la posibilidad misma
de variables ocultas que reintroduzcan el determinismo, necesitamos
298 Filosofía de la física
seguir hasta el final un largo argumento que ha sido desarrollado a lo
largo de muchos años. Primero necesitamos la noción del valor espe
rado de una cantidad en un estado cuántico dado. En un estado
cuántico determinado, un observable dado podría tener muchos va
lores posibles en la medición. Cada valor posible tendrá su probabili
dad de ocurrencia. Multipliquemos cada valor por su probabilidad y
sumemos los productos de cada uno de los posibles valores. El resul
tado es el promedio o valor medio de la cantidad medida para un
sistema en un estado cuántico dado. Se le denomina el valor espera
do de esa cantidad en ese estado cuántico.
Ahora bien, algunas cantidades pueden ser escritas como funcio
nes de otras cantidades. Un caso muy simple, por ejemplo, es el cua
drado del momento de una partícula, el cual es una sencilla función
de su momento. Algunas cantidades son funciones de un número da
do de cantidades diferentes. Por ejemplo, la energía total de una par
tícula es la suma de su energía potencial y de su energía cinética.
Ahora bien, si el observable C es, por ejemplo, una función de los
observables A y B ¿cómo se relacionará el valor esperado de C con
los valores esperados de A y B en un estado dado? Si A, B y C son
cantidades simultáneamente mensurables, sin duda el valor esperado
de C será la misma función de los valores esperados de A y B que el
observable C lo es de los observables A y B. Pues podríamos medir
simultáneamente los valores de A, B y C para un sistema y obtener el
valor de C de dos formas diferentes, una directamente y otra calcu
lándolo a partir de los valores obtenidos para A y B. Los resultados
deben ser consistentes para cantidades simultáneamente mensu
rables.
Pero supongamos ahora que A, B y C no son cantidades simultá
neamente mensurables. En el ejemplo dado anteriormente, por ejem
plo, la energía total, la energía cinética y la energía potencial no son
en general simultáneamente mensurables. La energía potencial es una
función ele la posición y la energía cinética una función del momen
to, y las energías potencial y cinética son ejemplos típicos de cantida
des bohrianas complementarias. Podemos preparar un sistema en un
estado cuántico dado, al que corresponderá entonces ciertos valores
esperados de la energía potencial, la energía cinética y la energía to
tal. Aún si estas cantidades no son simultáneamente mensurables,
¿será el valor esperado de la energía total para sistemas en ese estado
cuántico igual a la suma del valor esperado de la energía potencial en
La imagen cuántica del mundo 299
ese estado cuántico y el valor esperado de la energía cinética en ese
estado cuántico, si la energía total puede definirse como la suma de
las energías potencial y cinética? La respuesta es sí, incluso si las can
tidades no son simultáneamente mensurables. Un teorema sencillo
de la teoría cuántica es justamente que los valores esperados se com
portarán de esta manera para todos los observables en cualquier
estado cuántico.
Pero nosotros no estamos ahora tan interesados en los estados
cuánticos como lo estamos en los pretendidos estados subyacentes
«más profundamente», donde todas las variables ocultas no tenidas
en cuenta por el estado cuántico tienen valores definidos. Para cada
uno de estos estados, el resultado de cualquier observación relativa a
la especificación del estado más profundo es que un valor de la can
tidad observada tiene probabilidad uno y todos los otros valores tie
nen probabilidad cero. ¿Podían existir dichos estados? Un argumen
to al respecto fue diseñado por von Neumann para demostrar que
no podían existir. Von Neumann supuso que para dichos estados va
riables ocultos se cumple la misma relación entre valores esperados
que la que se cumple en los estados cuánticos, es decir, que el valor
esperado de la cantidad C será la misma función de los valores espe
rados de las cantidades A y B que el observable C lo es de los obser
vables A y B. Esto se denomina la «suposición de linealidad». Par
tiendo de esta suposición, fue capaz de probar que la existencia de
dichos estados variables ocultos conllevaría una violación de las inte-
rrelaciones de las probabilidades de los resultados predichas por la
mecánica cuántica. La postulación de variables ocultas sería, enton
ces, incompatible con las predicciones hechas por la mecánica cuán
tica. He aquí un argumento en el sentido de que las variables ocultas
no existen. Éste sostiene que no se trata simplemente de que la teo
ría cuántica no haga predicciones deterministas sobre los sistemas. Su
tesis es que si existiese un tal nivel subyacente de valores de paráme
tros totalmente determinativos, aun cuando éstos nos fueran desco
nocidos, su misma existencia confirmaría que las predicciones esta
dísticas hechas por la mecánica cuántica deberían estar equivocadas.
Durante muchos años el argumento de von Neumann fue visto
por muchos como una refutación decisiva de la compatibilidad del
determinismo con la mecánica cuántica. Nos había demostrado, se
argumentaba, que si el determinismo era válido, la mecánica cuántica
debía estar equivocada. La mecánica cuántica no podía, pues, ser vis-
Filosofía de la física
(a como una teoría estadística que se asentaba sobre una descripción
determinista subyacente del mundo, como se veía a la mecánica esta
dística clásica asentada sobre la dinámica determinista subyacente de
los microestados de los sistemas por ella descritos.
Más tarde, sin embargo, surgieron dudas acerca de la legitimidad
de la prueba de la «no existencia de variables ocultas» dada por von
Neumann — no acerca de su razonamiento matemático, claro está, si
no de la legitimidad de una de las suposiciones básicas sobre la que
descansa. Se trata de la suposición de linealidad cuando se extiende
más allá de los estados cuánticos a los estados variables ocultos y, en
particular, cuando se aplica a observables que no son simultáneamen
te mensurables. ¿Es en realidad tan obvio que, incluso para observa
bles que no puedan ser medidos simultáneamente, el valor esperado
de C en un estado variable oculto dado debe ser la suma de los valo
res esperados de A y B, siempre que el observable C sea la suma de
los observables A y B? ¿No podríamos imaginar lo siguiente?: Hay un
estado variable oculto. Todo sistema en el mismo estado variable
oculto dará el mismo valor determinado cuando se mide la energía
total. También se obtendrá el mismo valor determinado cuando se
mide la energía potencial. Y el mismo valor determinado cuando se
mide la energía cinética. Pero la energía total de los sistemas en ese
estado no será la suma de las energías potencial y cinética. Si pudié
semos determinar simultáneamente todos estos valores para un siste
ma único, esto parecería absurdo; pero, tal y como Bohr insistió una
y otra vez, en ningún sistema podemos realizar las tres mediciones al
mismo tiempo.
Que la suposición de von Neumann era demasiado fuerte, reci
bió confirmación adicional. Su fortísimo resultado mostraba que nun
ca podrían existir variables ocultas, ni siquiera para las cantidades
observables más sencillas. Pero, para los casos más sencillos, se pueden de hecho construir teorías de tipo variables ocultas. Considere
mos, una vez más, una partícula que presente sólo dos estados com
ponentes de espín respecto a una elección determinada de un eje de
dirección, como un electrón que presenta un valor arriba o abajo de
su componente de espín a lo largo de cualquier dirección arriba-aba
jo que uno decida medir. Supongamos un haz de electrones com
puesto por electrones que son todos definidamente espín izquierda.
Si los hacemos pasar a través de un aparato de medida arriba-abajo,
midiendo su componente de espín perpendicular a su conocida di
La imagen cuántica del mundo 301
rección de espín izquierda, la mitad saldrán espín arriba y la otra mi
tad espín abajo. La dirección arriba-abajo es perpendicular a la direc
ción izquierda-derecha. Elijamos cualquier otra dirección distinta a la
dirección izquierda-derecha y a la dirección arriba-abajo. La teoría
cuántica asignará probabilidades definidas a la componente del espín
del electrón que sale en una de las dos direcciones posibles a lo largo
del nuevo eje elegido.
Resulta que en este caso puede proponerse una teoría de variables
ocultas muy simple para dar cuenta de las relaciones probabilísticas
entre esas componentes de espín en el caso de una sola partícula
cuya componente de espín en-una dirección dada puede tener sólo
uno de dos valores (arriba o abajo en esa dirección), como sucede
con el electrón. Supongamos que la partícula tiene espín izquierda
definidamente. Uno puede entonces imaginar un parámetro adicional
que describa la partícula; el valor del parámetro puede variar en un
cierto dominio. Elijamos cualquier dirección en la que medir la com
ponente del espín. Supongamos que si el parámetro oculto está en un
cierto subconjunto de su dominio, la partícula será encontrada con
espín arriba en esa dirección. Puede construirse un modelo con las
siguientes características: A cada dirección en la que se mida el espín
y a cada posible resultado de esa medición, arriba o abajo en esa d i
rección, se les asigna un conjunto de valores del parámetro oculto.
Cuando la partícula tiene un espín definido en una dirección dada,
queda entonces determinada una distribución de probabilidades so
bre los valores del parámetro oculto. La probabilidad de que una
partícula sea encontrada con espín arriba, pongamos, en una direc
ción elegida, será entonces la probabilidad, de acuerdo con esta dis
tribución, de que el valor del parámetro caiga en el subdominio de
valores del parámetro correspondiente a este resultado en esta direc
ción. Una única distribución de probabilidades para el parámetro
oculto dará la probabilidad correcta para cada resultado en cada d i
rección posible, como predice la mecánica cuántica. En otras pala
bras, en el caso especial de una sola partícula con sólo dos posibles
estados componentes de espín en cualquier dirección, la totalidad de
las predicciones probabilísticas de la mecánica cuántica puede, de
hecho, duplicarse mediante un sencillo modelo de variables ocultas
en el que cada uno de sus resultados está determinado por el valor
que tiene la variable oculta en un caso particular. Las probabilidades
de un resultado dado para un sistema en un estado cuántico dado
302 Filosofía de la física
quedarán, pues, fijadas simplemente por las probabilidades de que
los valores de las variables ocultas subyacentes se encuentren en el
subdominio correspondiente de los posibles valores variables ocultos.
Ahora bien, en este argumento no hay nada diseñado para de
mostrar que los resultados de la mecánica cuántica en este caso espe
cial quedan, efectivamente, explicados por semejante variable física
oculta real. Antes bien, el argumento está diseñado para demostrar
que, en este caso especial, no hay nada inconsistente en la postulación
de dicho modelo determinista, de variables ocultas, de los fenómenos
y de las predicciones probabilísticas de la mecánica cuántica. Pero si
el argumento de von Neumann hubiera de tomarse como concluyen-
te, si tuviésemos que aceptar el fortísimo postulado de von Neu
mann, entonces las variables ocultas serían inconsistentes con los re
sultados mecánico-cuánticos incluso en este sencillo caso de una
única partícula con sólo dos valores posibles de la componente del
espín en cualquier dirección. El argumento parece demostrar, pues,
que la suposición de von Neumann es demasiado fuerte para ser legí
tima.
Pero esto no es desde luego el final de la historia. Si von Neu
mann supone demasiado en su prueba de la «imposibilidad de varia
bles ocultas», quizá un argumento que suponga menos, de hecho uno
que suponga solamente postulados que parezcan intuitivamente ne
cesarios para cualquier teoría auténtica de variables ocultas, servirá
para fundamentar de una manera más sólida la prueba de imposibili
dad. Tales argumentos han sido, de hecho, construidos. Supongamos
que las variables ocultas existen. Entonces, en cualquier estado en el
que se especifiquen completamente los valores de todas las variables
ocultas, deberían quedar completamente determinados todos los re
sultados de un conjunto de observaciones — todas las cuales pueden ser realizadas simultáneamente. Esto es, si hay un conjunto máximo
de posibles mediciones simultáneas (o una multiplicidad de conjun
tos), el tfalor de las variables ocultas debería determinar para cada
uno de dichos conjuntos de posibles mediciones un, y solo un, resul
tado efectivo en cada medición. Estos resultados deben ser compati
bles con las predicciones mecánico-cuánticas, si es que la teoría de
variables ocultas ha de respaldar a la mecánica cuántica en vez de
ocupar su lugar como una teoría falsa refutable. ¿Puede existir seme
jante teoría de variables ocultas? Observemos que aquí no se está ha
ciendo la suposición de von Neumann, según la cual, incluso en
La imagen cuántica del mundo 50)
estados de variables ocultas, se cumplirá la relación de linealidad
para los valores esperados de observables incluso incompatibles.
Todo lo que se supone es que entre los resultados de cualquier con
junto de mediciones, todas ellas realizables simultáneamente, se cum
plirán las correctas relaciones mecánico-cuánticas. Y esto se supone
para cada uno de dichos conjuntos de observaciones simultáneamen
te realizables.
Que ninguna teoría de variables ocultas puede siquiera satisfacer
este, más modesto, requisito, se sigue de un teorema de A. Gleason o,
más directamente, del trabajo de Kochen y E. Specker. Su trabajo
muestra que ninguna teoría de variables ocultas reproducirá los re
sultados de la mecánica cuántica para ningún sistema siquiera un pa
so más avanzado del sistema discutido más arriba: la partícula única
con dos posibles resultados en una observación. En este último caso,
el más simple, sabemos que un modelo de variables ocultas es consis
tente con la mecánica cuántica. Pero para el caso siguiente en orden
de complejidad no puede hallarse una teoría de variables ocultas que
satisfaga el requisito mencionado más arriba.
Una ilustración del teorema, ideada por Kochen y Specker, dará
al lector una idea básica de cómo funciona la prueba, aunque los
pormenores de la misma no serán indicados aquí. Sea un sistema con
las siguientes características: una medida del cuadrado de la compo
nente del espín en cualquier dirección dará el valor 1 o el valor 0. En
cualquier triplete de tres direcciones, donde cada una forma ángulos
rectos con las otras dos, el sistema tendrá un valor 1 del cuadrado
del espín en dos de las direcciones y un valor 0 del cuadrado del es
pín en la tercera de estas direcciones al ser medido. Y para uno cual
quiera de dichos tripletes de direcciones mutuamente perpendicula
res, las tres mediciones pueden realizarse simultáneamente de
acuerdo con la teoría cuántica. ¿Podrían existir variables ocultas que
caracterizasen más completamente al sistema, yendo más allá de la
caracterización cuántica que nos da las relaciones entre los valores
indicados más arriba, pero proporciona sólo predicciones probabilís
ticas sobre si una dirección dada tendrá el valor 1 o el valor 0? Para
una asignación dada de variables ocultas completamente especifica
da, el que una dirección dada tenga un valor 1 o 0 es algo que debe
estar completamente determinado, y las relaciones cuánticas entre
estos valores indicadas más arriba deben ser satisfechas por esta ca
racterización más completa del sistema.
304 Filosofía de la física
Ninguna teoría de variables ocultas semejante es posible. El argu
mento por el que esto es así utiliza solamente resultados de la geo
metría elemental. Puede demostrarse que es sencillamente imposible
asignar los valores 1 y 0 (o cualquier otro par de valores diferentes) a
las direcciones a partir de un punto dado en forma tal que para cual
quier triplete de tres direcciones mutuamente perpendiculares, se
asigne a dos de las direcciones el valor 1 y a la otra el valor 0. Así
pues, ninguna teoría de variables ocultas podría determinar comple
tamente el valor correcto del cuadrado del espín para todo conjunto
de tres direcciones mutuamente perpendiculares. Y ninguna teoría
de variables ocultas podría ser tal que se cumpliesen las correctas re
laciones mecánico-cuánticas entre los resultados de cada conjunto de
posibles mediciones simultáneas que uno pudiera realizar sobre el
sistema.
Pero el proponente de la concepción según la cual la mecánica
cuántica es una teoría estadística incompleta que precisa de una teo
ría determinista completa subyacente, no se dará por vencido tan fá
cilmente. Si examinas cómo funciona la prueba anterior de la «no
existencia de variables ocultas», descubrirás que el paso fundamental
es observar que cada dirección a partir de un punto puede ser consi
derada como miembro de una infinidad de tripletes de direcciones
perpendiculares. Así pues, el valor de la cantidad medida en una di
rección debe ser consistente, de acuerdo con las predicciones de la
mecánica cuántica, con los valores en las otras dos direcciones per
pendiculares a ella para muchos tripletes de direcciones. A esto se
debe que la prueba pueda demostrar la inconsistencia de las varia
bles ocultas con la mecánica cuántica. Partiendo de una asignación
de 1, 1 y 0 a tres direcciones perpendiculares, uno puede encontrar
una diversidad de tripletes de direcciones que contienen una o más
de las direcciones del conjunto original. Uno prosigue entonces ese
proceso hasta que se ve obligado a asignar el valor 0 a una dirección
a la que se le asignó en un principio el valor 1. (Véase la figura 4.7.)
Pero ¿qué sucederá si declaramos que el valor de la cantidad me
dida en una dirección dada relativa a una elección de las otras dos
direcciones perpendiculares no es la misma cantidad física que ese
valor relativo a otra elección de las dos direcciones perpendiculares?
Pues tener el valor 1 para cada cantidad física «relativa» semejante y
0 para la otra no será una contradicción flagrante. Pero ¿cómo po
dríamos nosotros, desde un punto de vista físico, sostener que seme-
La imagen cuántica del mundo
z0
305
F ig u r a 4.7. Un sistema utilizado en un argumento contra las variables ocultas. Existe un sistema cuántico que es tal que para cualesquiera tres direcciones mutuamente perpendiculares una cierta cantidad debe tener el valor 0 en una de esas direcciones y el valor 1 en las otras dos direcciones. ¿Podría un único conjunto de variables ocultas determinar todos esos valores? E l argumento de que esto no podría ser se apoya en
el hecho de que cualquier dirección dada es parte integrante de innumerables triple- tes de direcciones mutuamente perpendiculares. Por ejemplo, z en la figura es miembro del triplete (z, x, y), pero también lo es del triplete (z, x , y ) . Se puede demostrar que es imposible asignar valores O' y V a todas las direcciones que parten de un
punto de forma tal que para todo triplete de direcciones mutuamente perpendiculares, una dirección tenga el valor 0 y las otras dos el valor 1. Pero mientras los valores a lo largo de cualesquiera tres direcciones mutuamente perpendiculares son «simultáneamente mensurables» (pongamos, a lo largo de z, x e y), los valores no serán en general simultáneamente mensurables a lo largo de, pongamos, x y x". Esto conduce a una concepción de las variables ocultas en la que los valores determinados puede
que varíen con el conjunto de medidas simultáneamente posibles elegidas.
jante relativización de la cantidad en cuestión es razonable? La res
puesta reside en el hecho de que, si bien los valores de la cantidad
en las tres direcciones perpendiculares son todos simultáneamente
mensurables, los valores de esa misma cantidad en otras direcciones
306 Filosofía de la física
no son por necesidad simultáneamente mensurables con las tres can
tidades en cuestión. Asi, aunque se podrían determinar tres valores
en tres direcciones perpendiculares en una medición, no se podrían
determinar todos los valores en todas las direcciones simultáneamen
te. Quizá, entonces, el cambio en el aparato de medida que medía el
valor en una dirección, A, al tiempo que determinaba el valor de esa
cantidad en otras dos direcciones, B y C, respecto al aparato diferen
te necesario para medir el valor en la dirección A y en dos direccio
nes diferentes perpendiculares a la misma, D y E, afecte causalmente
al sistema. Esto podría arrojar como resultado que el valor de la can
tidad en la dirección A relativo a la medición de B y C está determi
nado por las variables ocultas de manera diferente a como la canti
dad en la dirección A está determinada por esas variables ocultas
cuando los valores en las direcciones D y E están siendo medidos a
la vez. ¿No podríamos imaginar que el mismo acto de cambiar el
aparato de medida que actúa sobre el sistema interacciona causal
mente con las variables ocultas del sistema para producir la diferen
cia? Después de todo, el resultado de la medición del valor en la di
rección A es el resultado causal conjunto de las variables ocultas del
sistema y del aparato de medida a la vez. Así, la medición de A junto
con una medición de B y C podría muy bien dar un valor en la direc
ción A diferente al que se obtendría midiendo el valor en la direc
ción de ,4 junto con una medición en las direcciones D y E. Con
todo, en ambos casos, los valores de las variables ocultas subyacentes
son los que determinan completamente cuál será el resultado de
todos esos valores medidos.
Si adoptamos una concepción «contextual» semejante de la natu
raleza de una cantidad medida, entonces la prueba bosquejada más
arriba, la prueba de que las interrelaciones entre los valores medidos
predichos por la teoría cuántica son incompatibles con cualquier po
sibilidad de que estos valores estén completamente determinados
por valores subyacentes de parámetros ocultos, no será válida. ¿Pode
mos encontrar otro tipo de prueba de la «no existencia de variables
ocultas» que sea inmune al tipo de razonamiento utilizado más arriba
para hacer que el contextualismo no parezca demasiado implausible
desde un punto de vista causal, determinista? La respuesta es que sí
podemos, y a esos argumentos vamos a dirigir ahora nuestra aten
ción.
La imagen cuántica del mundo 307
La inseparabilidad de los sistemas
El argumento de Einstein, Podolsky y RosenBohr y Einstein fueron, respectivamente, los dos exponentes más
eminentes de dos concepciones contrarias de la teoría cuántica. Para
Bohr, la teoría cuántica proporcionaba una descripción fundamental
del mundo. Por supuesto, cualquier explicación cuántica del mundo
requería ser complementada por esas teorías pormenorizadas que
nos informaban sobre el tipo de fuerzas que actuaban entre las partí
culas elementales, los constituyentes básicos del mundo; pero, hasta
donde alcanzaba la descripción subyacente de los estados básicos de
la naturaleza y su evolución dinámica, la descripción cuántica sumi
nistraba un suelo firme. Si un sistema era preparado en un estado
cuántico dado, mediante una de esa clase de mediciones que deter
minaban, para el sistema tras la medición, los valores de algunos
miembros de un conjunto de observables compatibles, simultánea
mente mensurables, ese estado cuántico era una descripción comple
ta del estado del sistema después del proceso de preparación. Cual
quier inferencia que pudiera derivarse concerniente a los posibles
resultados de una medición futura del sistema, o a la posibilidad de
que dichos resultados se dieran, tendría que ser derivada de nuestro
conocimiento del estado cuántico del sistema. Si estas inferencias de
resultados medidos en un futuro fueran como mucho probabilísticas,
como es el caso normalmente en mecánica cuántica, también lo sería
el sistema. La mecánica cuántica nos demostraba que, en su nivel
más profundo, el mundo era genuinamente indeterminista. Contraria
mente al ideal determinista, respaldado al menos en cierta medida,
como hemos indicado, por los resultados de la física clásica, el mun
do tenía una naturaleza irreduciblemente «tiquista», o de carácter
azaroso.
Einstein, al contrario, no cedió en su concepción de que la mecá
nica cuántica no podía ser una teoría completa del mundo. Como
teoría estadística, capaz a lo sumo de predicciones probabilísticas so
bre el mundo, debería verse necesitada de un sostén en la forma de
una teoría determinista de los sistemas que descansase en una des
cripción de los mismos a un nivel más profundo que el suministrado
por la descripción cuántica. Un sistema preparado en un estado
cuántico tenía que tener, pues, otros factores propios del mismo, in-
«08 Filosofía de la física
duso si no sabíamos cuáles eran éstos, y mucho menos cuáles eran
los valores particulares de estas características ocultas que poseía el
sistema particular. Estos factores subyacentes determinarían exacta
mente el resultado de cualquier medición que se realizase sobre el
sistema, y las predicciones meramente probabilísticas derivables del
estado cuántico del sistema habrían de ser vistas como un reflejo del
hecho de que el estado cuántico proporcionaba sólo una descripción
parcial, no una completa, del estado del sistema.
Para Bohr, un proceso de medida «creaba» el valor de la canti
dad medida. Antes de la medición, el sistema no tenía ese valor de la
cantidad medida, a no ser que estuviese en un estado cuántico muy
especial en el que dicho valor se obtuviera con certeza en la medi
ción para empezar. Y antes de la medición, el sistema no era caracte
rizable por ningún otro parámetro interno que determinase comple
tamente que el resultado de hecho obtenido era el que se hubiera
obtenido si el sistema hubiese interaccionado con el aparato de me
dida apropiado. Para Einstein, esto era inaceptable. Si el sistema re
sultaba poseer efectivamente un valor determinado cuando se realiza
ba la medición, algo en el mundo que caracterizaba el estado previo
del sistema (y, quizá, del aparato de medida) tendría que dar cuenta
de que se hubiese obtenido dicho valor, y no ninguno de los otros
resultados posibles.
En 1935 Einstein, en colaboración con B. Podolsky y N. Rosen,
publicó un artículo seminal en el que se cuestionaba la forma bohria-
na de ver las cosas. Este artículo dio pie a una larga discusión en tor
no al tipo de «experimento conceptual» que Einstein propuso. Final
mente, estos estudios condujeron a una serie de resultados que
parecían plantear las más serias dificultades a un entendimiento de la
mecánica cuántica desde el punto de vista einsteiniano.
La idea de Einstein parte de la consideración de un sistema que
está compuesto por dos partes componentes. Éstas podrían ser, por
ejemplo, dos partículas nucleares unidas en un núcleo de dos partí
culas. Los sistemas pueden ser construidos de forma tal que el valor
de una cantidad para una de las partículas en el sistema compuesto
esté exactamente correlacionado con el valor de esa misma cantidad
para la otra componente. De hecho, el sistema puede ser tal que,
para toda una familia de propiedades, si la partícula uno tiene un va
lor dado de una de las propiedades en la familia, la partícula dos
debe tener un, y solo un, valor correlacionado de esa propiedad.
La imagen cuántica del mundo 309
Einstein utilizó originalmente propiedades de la posición y el mo
mento para su modelo, pero nosotros utilizaremos en su lugar el
modelo de dos partículas con espines correlacionados. Éste es el sis
tema que se utiliza normalmente para explicar el experimento con
ceptual y sus consecuencias. Las partículas podrían ser, por ejemplo,
electrones que posean las familiares propiedades de espín que hemos
indicado en las secciones anteriores. Para cualquier dirección dada,
la componente del espín de cada partícula tendrá uno de dos valo
res, «arriba» en esa dirección o «abajo» en esa dirección. Los siste
mas compuestos en los que estaremos interesados son los que están
en un estado «singlete». En un tal estado, las partículas están correla
cionadas de forma tal que si el espín está arriba en una dirección da
da, el espín de la otra debe estar abajo en esa misma dirección. (El
nombre singlete proviene de la espectroscopia, donde los estados sin-
gletes corresponden a líneas espectrales que no son divididas cuando
el sistema se coloca en un campo magnético externo. Otros sistemas
acoplados podrían ser, por ejemplo, un estado «triplete», donde la lí
nea espectral se divide en tres líneas cuando se sumerge al sistema en
un campo magnético.)A continuación, hemos de imaginar al sistema compuesto dividi
do en sus dos componentes. Cada una de éstas se alejará en el espa
cio hasta que las partículas componentes originalmente constituyan
ahora dos partículas bien separadas en el espacio. Al mismo tiempo,
se supone que la división ha sido realizada por algún método que no
perturba las correlaciones de espín que las partículas tienen entre sí.
Esto puede hacerse mediante una intervención física apropiada sobre
el sistema desde el exterior. Bajo estas circunstancias, ¿cuál es la des
cripción correcta de las partículas una vez que han sido separadas,
según la mecánica cuántica? La respuesta es que todavía se las debe
considerar conjuntamente como un sistema compuesto en un estado
singlete de espín. Propiamente hablando, no existe un estado cuánti
co de una partícula que ignore a la otra, aunque para algunos propó
sitos se puede construir un tipo de estado «reducido» para una sin la
otra. (Véase la figura 4.8.)¿Cuáles son las predicciones que podemos hacer sobre las medi
ciones del espín de las partículas, dado su estado cuántico conjunto?
Pues bien, para cualquier dirección podemos predecir la probabili
dad de que una de las partículas se encuentre, si su espín se mide en
esa dirección, en un estado espín arriba o espín abajo. En este caso,
310 Filosofía de la física
(a) oo (P1 + P2)
F ig u r a 4.8. La inseparabilidad de ios sistemas cuánticos. En (a) se muestra un sistema
que está compuesto por dos partículas (Pt y P2). E l sistema es tal que los valores de
espín de las partículas en cualquier dirección serán encontrados, si se miden, en direcciones opuestas entre sí, independientemente del eje que se elija para hacer la medida. En (bl las partículas son separadas y enviadas lejos una de la otra en direcciones opuestas. La separación se efectúa de forma tal que se conserve la «anticorrelación»
de espín entre las dos partículas. Uno puede decidir medir el espín de la partícula P¡ en una dirección cualquiera utilizando el detector D¡, y medir el espín de la partícula
P2 en una dirección cualquiera utilizando el detector D2. Los valores obtenidos presentan en mecánica cuántica relaciones correlaciónales probabilísticas definidas entre
si. Se puede demostrar que ninguno de los conjuntos de variables ocultas postulados, capaces de determinar los resultados de las mediciones en D¡ y D¿ con independen
cia de ¡a medición elegida en cada caso, dará las predicciones correctas para las probabilidades de todas las correlaciones predichas por la mecánica cuántica. Además, ahora es difícil imaginar que la elección de una medición sobre una de las partículas atecte a la variable oculta que determina el resultado de la medición en la otra partícula, va que las dos mediciones se hacen a distancias y a proximidades en el tiempo
tan colosales que hacen la interacción causal entre ellas imposible.
cada una de esas probabilidades es de un medio. Estas probabilida
des se seguirían ambas del estado cuántico total del sistema com
puesto y de los estados reducidos que podemos atribuir a cada partí
cula por separado. Pero, de la naturaleza del estado conjunto se sigue
algo distinto, a saber, la perfecta correlación de las partículas. No im
porta lo distantes en el espacio que lleguen a estar las partículas, po
demos siempre inferir, suponiendo que nada interaccione con ellas
desde el exterior entre la división del sistema original y las medicio
nes realizadas, que si en una medición se encuentra que una partícu
la tiene espín arriba en una dirección dada, se encontrará sin duda
que la otra partícula tiene espín abajo si su espín se mide en la mis
La imagen cuántica de! mundo 311
ma dirección. Además, si se realiza una medición sobre una partícula
en una dirección dada y se anota el resultado, se encontrarán probabi
lidades definidas para el resultado de una medición del espín sobre la
otra partícula en cualquier otra dirección elegida. Estas probabilida
des condicionadas del resultado de una medición sobre la partícula
dos al resultado de una medición sobre la partícula uno se siguen del
estado cuántico total del sistema compuesto. Éstas son eliminadas en
las descripciones reducidas que pueden construirse para las partículas
en cada momento, razón por la que dichas descripciones reducidas
no sirven para especificar el estado cuántico total del mundo.
Ahora bien, dice Einstein, miremos desde el punto de vista boh-
riano al estado de la partícula dos antes y después de que el estado
de la partícula uno haya sido determinado mediante una medición.
De acuerdo con Bohr, antes de realizarse una medición, ninguna de
las partículas tiene un espín definido. Ni tienen, de acuerdo con
Bohr, una propiedad por la que tendrían necesariamente un valor
definido de espín en una dirección definida en caso de realizarse una
medición. Más bien, antes de una medición, las partículas poseen
únicamente una disposición a aparecer con un valor de espín dado
en una dirección dada con probabilidad un medio, junto a la disposi
ción a tener sus valores de espín, si se miden los dos, correlacionados
en la forma descrita por la función de onda del estado singlete. Pero
supongamos que se mide el espín de la partícula uno en una direc
ción dada, pongamos, A. Supongamos que se obtiene el valor «arri
ba». En ese mismo instante, de acuerdo con Bohr, la segunda partí
cula, aunque se encuentre a una distancia de años luz, «salta»
instantáneamente al estado cuántico apropiado para que su espín
tenga la dirección «abajo» en la dirección A. Esto es cierto porque
una vez que se ha determinado que el espín de la partícula en la po
sición «arriba» está en la dirección A, es seguro que el espín de la
partícula dos se encuentra «abajo» en esa dirección, y la única fun
ción de onda que otorga esa probabilidad a la partícula dos sería una
función de onda «abajo pura en la dirección A». Esta función de on
da para la partícula dos difiere mucho de la asignación a la partícula
dos, en unión con la partícula uno, de una función de onda previa
correspondiente a la partícula dos formando parte de un sistema
compuesto en un estado singlete.
Ahora bien, dice Einstein, si concebimos la función de onda
como una caracterización física completa de la partícula, este tipo de
Filosofía de la física
cambio es absurdo. Bohr concibe la medición como la «creación» de
un valor para la observación del sistema, un valor que no existía an
tes de haberse realizado la medición, y no como la revelación de un
valor preexistente (o al menos predeterminado) para esa cantidad.
Esto puede ser plausible si nosotros interaccionamos físicamente con
el sistema cuando lo medimos, pero carece de sentido si el sistema
no se ve perturbado lo más mínimo por nuestra medición. Eso es lo
que sucede en el caso del sistema acoplado que estamos consideran
do. Medimos el valor del espín en la partícula dos haciendo interac-
cionar nuestro aparato de medida con la partícula uno. La medición
que realizamos determina el valor del espín en la dirección A para la
partícula uno. Eso nos dice inmediatamente cuál es el valor del espín
para la partícula dos, es decir, qué valor del espín en la dirección A mostraría ahora una medición de la partícula dos. Pero, como no
tocamos para nada en absoluto, en el sentido físico, a la partícula dos
durante el proceso de medida, sea lo que fuere lo que determina que
la partícula dos tenga un valor definido de espín en la dirección A si
se mide, deberá haber sido cierto para la partícula dos antes de nuestra medición de la partícula uno. Pero, antes de nuestra medición de la partícu
la uno, la función de onda que describía las partículas no asignó un
valor definido de espín en la dirección A a la partícula dos. Y, repito,
la partícula dos debe haber poseído semejante valor determinado del
espín en la dirección A aun antes de nuestra medición de la partícula
uno. Por lo tanto, concluyen Einstein y sus colaboradores, el estado
cuántico del sistema compuesto antes de la medición no contenía
una descripción total del estado actual del mundo. No asignó, por
ejemplo, una disposición definida de la partícula dos a mostrar un, y
solo un, valor de espín en la dirección A, una disposición que la par
tícula dos debe haber tenido «desde un principio», de acuerdo al ar
gumento que acabamos de exponer.
Concluyen, pues, que la mecánica cuántica es una teoría incom
pleta. La función de onda, arguyen, debe considerarse que represen
ta, no el estado físico total de un sistema, sino sólo nuestro conoci
miento parcial de ese estado. El cambio instantáneo de la función de
onda en la medición deja así de resultar misterioso. Supongamos que
sabemos que una peseta se encuentra, bien en una caja de cerillas en
la Tierra, bien en una caja de cerillas en un planeta de Alpha Centau-
ri. Podemos representar esto por una función de probabilidad que
asigna, pongamos, la probabilidad de un medio a cada posibilidad.
La imagen cuántica del mundo 313
Miramos ahora en la caja de cerillas en la Tierra y vemos la peseta.
Por supuesto, la probabilidad de que la peseta esté en la otra caja de
cerillas se reduce instantáneamente a cero. Pero esto no implica un
cambio físico misterioso de la caja de cerillas en el planeta distante,
sólo un cambio en lo que nosotros sabemos sobre ella. Pues si la caja
de cerillas distante resulta estar vacía, debe haber estado vacía aun
antes de que mirásemos en la caja de cerillas en la tierra.
Bohr no se mostrará en absoluto de acuerdo con este argumento.
Es verdad, responde, que la función de onda asignada a un sistema
es relativa a la elección de alguna medición. Antes de que la medi
ción se haya realizado sobre la partícula uno, la función de onda ade
cuada para caracterizar a la partícula dos es la que la caracteriza
como una componente del sistema original compuesto en estado sin
glete. En relación a la medición inicial de preparación, ésta es la fun
ción de onda correcta para describir el mundo. Después de que la
partícula uno ha sido medida y se ha hallado que tiene un valor defi
nido de espín en la dirección A, la función de onda correcta para
describir el mundo es la que asigna a cada partícula un espín defini
do en la dirección A Asigna a la partícula uno el valor de espín de
terminado por la medición, y asigna a la partícula dos el valor de es
pín que debe tener debido a la perfecta correlación de los espines de
las dos partículas. La medición de la partícula uno, pues, cambia
efectivamente la función de onda atribuida a la partícula dos. Pero
esto no implica, ni que la función de onda sea meramente un com
pendio de nuestro conocimiento y no una especificación total del
estado físico, ni que la medición de la partícula uno tenga un efecto
«causal» sobre la partícula dos. Antes bien, es una característica de la
relatividad de la función de onda respecto al proceso de medida. Es
este aspecto relacional de la mecánica cuántica, a saber, que los
estados existen sólo en relación a las mediciones, lo que Bohr preten
de en su explicación de la situación, argumentando que la relatividad
de la función de onda respecto a la medición realizada es algo análo
go a la relatividad de la longitud de una vara de medir respecto al
movimiento de un observador en la relatividad. El cambio del estado
de movimiento de uno mismo respecto a la vara de medir cambia la
longitud de la vara de medir respecto a uno mismo como observa
dor. Pero esto no significa un cambio causal en la vara de medir, tal y
como la teoría del éter lo habría explicado. Ni significa que la longi
tud es una característica subjetiva de la vara de medir. La longitud es
114 Filosofía de la física
relativa al sistema de referencia. De manera similar, afirma Bohr, la
(unción de onda es física, pero relativa.
1:1 Teorema de Bell¿Podría cualquier argumento servir para ayudar a determinar cuál de
estas posturas respecto a la función de onda es la correcta? Al menos
podríamos confiar en hacer lo siguiente: podríamos ser capaces de
determinar si la postulación de variables ocultas que fijan los estados
de los dos sistemas separados individualmente, así como el estado de
la partícula distante independientemente de la medición que decida
mos realizar en la partícula más cercana, es consistente con todas las
predicciones probabilísticas hechas por la mecánica cuántica. Noso
tros vamos a considerar ahora la afirmación de que una postulación
semejante, una que esté de acuerdo con la imagen de Einstein de la
función de onda como una descripción incompleta del mundo soste
nido por un nivel de descripción más completa, determinista, ya nos
sea o no conocida, no es de hecho consistente con la mecánica cuán
tica. Un teorema de J. Bell, y algunas extensiones del mismo, están
diseñados para demostrar que la imagen que Einstein sugiere cómo
la correcta interpretación de la función de onda asignada a sistemas
correlacionados no puede ser correcta.
¿Cómo funciona la demostración? Para empezar, supongamos
que Einstein está en lo cierto. En el caso de las dos partículas corre
lacionadas con posibles valores de espín que se ha descrito más arri
ba, supongamos que tan pronto como las partículas se separan una
de la otra, cada partícula arrastra consigo un valor de un parámetro
oculto. El valor del parámetro oculto asociado a una partícula deter
minará completamente, para esa partícula, si aparece arriba o abajo
en cualquier medición de espín realizada sobre la misma en cual
quier dirección que elijamos. Supongamos, también, que sucesos
muy distantes en el espacio y próximos entre sí en el tiempo, de for
ma tal que, por relatividad, ninguna señal causal pudiera ser enviada
desde el uno al otro, no pueden afectarse mutuamente. Una conse
cuencia de esto es lo siguiente: Supongamos que medimos la partícu
la dos en la dirección B. El resultado de esta medición no debe de
pender de ninguna elección por nuestra parte de la dirección en la
que decidamos medir el espín de la partícula uno. Después de todo,
La imagen cuántica del mundo 315
podríamos disponer las dos mediciones, una vez que las partículas se
hubiesen separado una distancia entre sí, de forma tal que una medi
ción no pueda afectar causalmente a la otra. Así, la elección de la di
rección en la que mediremos el espín de la partícula uno no debería
tener efecto alguno sobre el resultado de una medición de espín en
la partícula dos en la dirección elegida para hacer esa medición.
Supongamos ahora que decidimos efectuar dichos pares de medi
ciones del espín en una clase amplia de pares de partículas, todas
preparadas de la misma forma, con las mismas correlaciones de espín
predichas por la mecánica cuántica. Suponemos que cada resultado
está completamente determinado por el valor del parámetro oculto
que cada partícula arrastra en cada uno de los experimentos. Tam
bién suponemos que las probabilidades de los resultados de las me
diciones en una de las partículas son independientes de qué medi
ción de espín elijamos hacer sobre la otra partícula. La probabilidad
de que se obtenga un valor dado en una medición sobre una partícu
la dada en una dirección dada debería, entonces, depender sólo de la
probabilidad con la que los diversos valores posibles de los paráme
tros ocultos para cada partícula están distribuidos.
Introduzcamos la siguiente notación: es un símbolo con
seis lugares disponibles. Los tres lugares anteriores al punto y coma
corresponden a la partícula uno y los tres después del mismo a la
partícula dos. Cada uno de los tres lugares a cada lado del punto y
coma corresponde a una dirección A, B y C. Consideraremos medi
ciones de la componente del espín de cada partícula en cada una de
estas tres direcciones. Un símbolo «i-» en un lugar significa que el
valor del espín para esa partícula en esa dirección está determinado
por los parámetros ocultos a aparecer en la dirección arriba. Un sím
bolo «—» significa que está determinado a aparecer abajo. (Cuál de las
dos direcciones se toma como arriba y cuál como abajo para cada A, B y C es indiferente). Un «0» en un lugar significa que el parámetro
oculto tiene un valor tal que el espín en esa dirección aparecerá arri
ba o abajo, es decir, cualquier valor consistente con los más y los me
nos asignados a los otros lugares. Recordad que las partículas tienen
una correlación perfecta, de manera que si aparece un más, ponga
mos, en el primer lugar a la izquierda del punto y coma, eso forzará
un valor menos en el primer lugar a la derecha del punto y coma.
Por ejemplo, el símbolo (+,0,0;0,0,+) indicará la probabilidad de que
en una medición de la primera partícula en la dirección A aparezca
316 Filosofía de la física
necesariamente un espín arriba en esa dirección, y en una medición
de la segunda partícula en la dirección C aparezca necesariamente un
valor arriba en la dirección C del espín.
Consideremos la siguiente ecuación:
Ecn. A-C: (+,0,0;0,0,+) = (+,+,—~ ,—,+) + (+,—,—;—,+,+)
Aquí nos apoyamos en los dos argumentos siguientes: 1) si se ob
tiene el valor + para una partícula en una dirección, el valor de la
otra partícula en esa dirección es forzosamente menos; 2) dados los
valores determinados para los espines de las partículas uno y dos en
las direcciones A y C, quedan solamente dos posibilidades para el va
lor de estos espines en la dirección indeterminada B. Como todas
estas probabilidades están bien definidas y son independientes de la
medición que decidamos realizar sobre cada partícula, parece razona
ble sobre la base de los postulados elementales de la teoría de la pro
babilidad que la probabilidad total de que la partícula uno resulte
más en la dirección A y la partícula dos resulte más en la dirección C
es la probabilidad de ese suceso y también de que la partícula uno
resulte más en la dirección B (con la partícula dos resultando menos
en esa dirección) más la probabilidad de que se dé el resultado men
cionado y que la partícula uno resulte menos en la dirección B (con
la partícula dos resultando más en esa dirección). Esto se debe a que,
dado el resultado mencionado, estas dos otras posibilidades para el
resultado en la dirección B se excluyen mutuamente y agotan todas
las posibilidades que pueden darse.
Siguiendo exactamente el mismo razonamiento se obtiene una se
gunda ecuación:
Ecn. B-C: (0,+,0;0,0,+) = (+,+,— ,—,+) + (—,+,—;+,—,+)
y una tercera ecuación:
Ecn. A-B.: (+,0,0;0,+,0) = (+,-,+;-,+,-) +
Ahora viene la observación que pone en duda la postulación de
las denominadas variables locales ocultas subyacentes a las probabili
dades mecánico-cuánticas. Si miramos al lado derecho de la Ecn. A-C,
observamos que el primer término en el mismo aparece en el lado
La imagen cuántica del mundo 317
derecho de la Ecn. B-C y el segundo término aparece en el lado dere
cho de la Ecn. A-B. Ahora bien, los otros términos en el lado derecho
de cada una de estas dos últimas ecuaciones deben ser mayores que,
o iguales a, cero porque representan probabilidades, y las probabili
dades nunca son números negativos. Así pues, si sumamos los lados
izquierdos de las Ecns. B-C y A-B, debemos obtener un número que
sea al menos tan grande como el lado izquierdo de la Ecn. A-C. Di
cho en palabras esto se reduce a lo siguiente: «La suma de las proba
bilidades de que la partícula uno aparezca arriba en la dirección B y
la partícula dos aparezca arriba en la dirección C con la probabilidad
de que la partícula uno aparezca arriba en la dirección A y la partícu
la dos aparezca arriba en la dirección B no puede ser menor que la
probabilidad de que la partícula uno aparezca arriba en la dirección
A y la partícula dos aparezca arriba en la dirección C. Esto debe ser
cierto para todas las direcciones A, B y C.»
Pero resulta que hay direcciones de A, B y C en las que ¡esta des
igualdad se ve violada por las probabilidades predichas por la mecá
nica cuántica! En mecánica cuántica, la correlación probabilística de
la dirección A con la dirección C puede ser mayor que la suma de la
correlación de la dirección A con alguna otra dirección, B, y la corre
lación de esta otra dirección, B, con la dirección C. Parece que el
postular que todas las probabilidades indicadas están bien definidas
es incompatible con las predicciones mecánico-cuánticas sobre pro
babilidades de resultados conjuntos. Y los postulados tras la existen
cia de estas probabilidades parecen ser, entonces, incompatibles con
las predicciones probabilísticas mecánico-cuánticas. Estos postulados
son, primero, que hay valores de parámetros ocultos que determinan
los resultados de todos los experimentos de espín que puedan reali
zarse sobre las partículas separadas y, segundo, que el resultado de
una medición sobre la segunda partícula es independiente de la me
dición de espín que hagamos para medir el espín de la primera partí
cula (y viceversa). Parece como si estuviésemos obligados a pensar
que el realizar una medición particular sobre la primera partícula tie
ne un efecto determinante sobre la distribución de probabilidades
para el resultado de mediciones sobre la segunda partícula. Este efec
to no puede ser comparado con el caso clásico donde hay una proba
bilidad ya determinada para cada resultado en la segunda partícula,
independientemente del experimento que realicemos sobre la prime
ra, sirviendo el experimento sobre la primera partícula sólo para per
318 Filosofía tle la física
mitirnos hacer inferencias más profundas acerca de la segunda por
un tipo de condicionamiento probabilístico.
Suponed que admitimos que los parámetros ocultos portados por
cada una de las partículas no determinan con certeza el resultado de
cada una de las mediciones que pueden realizarse sobre las partícu
las; fijan el resultado sólo indeterminista y probabilísticamente. Aquí,
pues, las variables ocultas no restaurarían el determinismo en la físi
ca. Pero ¿no podrían al menos restaurar la «localidad»? ¿No podría
mos pensar que cada partícula, después de la separación, porta su
propia probabilidad de dar un resultado específico en cualquier me
dición que se realice sobre ella, aun si la partícula no porta un resul
tado completamente determinado para cada posible medición? Vaya,
si se hace una suposición de «localidad» natural, adicional, esta ver
sión de las «variables ocultas locales estocásticas» es también incon
sistente con la mecánica cuántica. La suposición adicional es que la
probabilidad determinada para los resultados de todas las posibles
mediciones sobre la partícula dos por su variable estocástica oculta
es independiente del resultado de cualquier medición que realicemos
sobre la partícula uno. En el caso de variables ocultas deterministas,
supusimos que el resultado sobre la partícula dos era independiente
de la elección del experimento realizado sobre la partícula uno. Aho
ra suponemos, asimismo, que la probabilidad de un resultado en la
partícula dos es independiente del resultado que podríamos obtener
en una observación hecha en la partícula uno. Seguramente ésta es
una suposición razonable si lo que pretendemos es construir una teo
ría que esté de acuerdo con el desiderátum de Einstein de que el
estado de la partícula dos, una vez separada de la partícula uno de
cualquier modo causal ordinario, es independiente de lo que pueda
sucederle a la partícula uno.
Aun en el caso de una teoría de variables ocultas probabilística,
la suposición de localidad para la variable oculta, interpretada natu
ralmente, está en desacuerdo con las predicciones cuánticas. Se da
una suerte de «enmarañamiento» entre los sistemas, en su momento
unidos y ahora separados, que no puede ser reducido al mero hecho,
clásicamente inteligible, de que cada uno de ellos, independiente
mente del otro, porta un registro de su existencia pasada como com
ponentes de un sistema compuesto con propiedades determinadas.
Es cierto que juntos portan un registro de ese estado anterior, pero
parece que este registro no puede ser factorizado en características
La imagen cuántica del mundo 319
independientes de las dos partículas tomadas como sistemas físicos
independientes y distintos.
La idea de que el realizar un experimento en un lugar parece, de
acuerdo con la mecánica cuántica, producir un efecto en las probabi
lidades de los resultados de otro experimento realizado en algún lu
gar distante evoca la posibilidad de una comunicación que sobrepasa
los límites impuestos a la transmisión de la energía por la famosa afir
mación relativista de que la luz es la señal más rápida posible para la
transmisión de una señal causal. Pero un examen detenido de la si
tuación muestra que no hay nada que un experimentador pueda ha
cer en el lugar de la partícula uno para modificar cualquier resultado
que un experimentador obtenga en el lugar de la partícula dos y que
pudiera ser utilizado para informar al segundo experimentador de
que, por ejemplo, el primer experimentador había de hecho decidido
medir el espín de la partícula uno en una dirección particular o de
que había obtenido resultados específicos al hacerlo. Las correlacio
nes entre los espines de las partículas que se obtendrían si se hicie
ran dos mediciones particulares sobre dos partículas correlacionadas
particulares separadas del mismo sistema compuesto original en
estado singlete, las correlaciones predichas por la mecánica cuántica,
no son reproducibles mediante variables ocultas locales, ya sean del
tipo determinista o del estocástico. Pero ninguno de estos hechos so
bre la correlación podría ser utilizado para violar los límites relativis
tas sobre la velocidad o transmisibilidad de una señal causal.
Parece falso, pues, que las probabilidades de las componentes se
paradas de un sistema, en su momento unificado, puedan ser fijadas,
deterministamente o simplemente probabilísticamente, por caracte
rísticas locales a este sistema aislado y en forma tal que las probabili
dades de resultados en mediciones de los sistemas individuales satis
fagan todos los resultados correlaciónales sobre los productos de las
mediciones dictados por las leyes de la mecánica cuántica. Y es falso
si uno hace las suposiciones fundamentales contenidas en estos argu
mentos sobre «variables ocultas no locales». Existen tentativas de
soslayar estos argumentos que se fundan, por ejemplo, en teorías pro
babilísticas no estándar. Pero la rareza del mundo implicado por
estas teorías es al menos tan extrema como la aparente no localidad
de los sistemas que normalmente se asume como consecuencia de
estos argumentos.
Pero ¿podría estar la mecánica cuántica equivocada en sus pre
320 Filosofía de la física
dicciones sobre las correlaciones de estados de sistemas separados?
No parece probable. Se ha llevado a cabo un trabajo experimental
(no con la clase de partículas que utilizamos en nuestro ejemplo, sino
con fotones de luz polarizada para los que se puede probar un resul
tado relacionado de «variables no ocultas»). Este parece mostrar, sin
ser motivo de sorpresa, que las correlaciones entre los estados de las
partículas en su momento unidas son justo como predice la mecánica
cuántica.
Así, el seguimiento de la astuta idea de Einstein de apelar a siste
mas que en su momento habían interaccionado causalmente pero
que, en el momento en que se realizaron las mediciones sobre ellos,
constituían sistemas ampliamente separados que no podían ser consi
derados en contacto causal entre sí, ha tenido el efecto opuesto al
que Einstein pretendía. Einstein consideró absurdo que una medi
ción en un lugar y tiempo pudiera provocar un cambio real en otro
lugar y tiempo no conectado causalmente al primero, y que esto de
mostrase que el estado cuántico debía ser tomado como una repre
sentación de nuestro conocimiento parcial del estado del mundo y
no como una descripción completa de ese estado. Pero los resultados
del teorema de Bell parecen indicar, antes bien, que no es plausible
un entendimiento de la mecánica cuántica como una teoría estadísti
ca sobreimpuesta a una teoría de variables ocultas local subyacente.
Dichos resultados van más allá de los discutidos en «Argumentos
contra las variables ocultas» en que, en los casos que estamos consi
derando ahora, la solución dada por los teóricos de variables ocultas
al dilema —primero tomando los observables como contextúales y
relativos a otras cantidades observadas y después considerando las
otras mediciones realizadas simultáneamente como actuando causal
mente sobre las variables ocultas que determinan el resultado de la
medición en cuestión— no parece ser válida. Si admitimos que la
elección de qué medición realizar sobre una partícula en un momen
to dado, y el resultado obtenido en esa medición, no pueden afectar
causalmente a los valores de las variables ocultas de la otra partícula
a una gran distancia y cuya medición se realiza en un tiempo próxi
mo al de la primera medición, esta forma de soslayar los resultados
de «variables no ocultas» queda ahora invalidada.
La imagen cuántica del mundo 321
ResumenLos resultados esbozados en E l argumento de Einstein, Podolsky y Rosen y en el Teorema de Bell no pueden, por sí mismos, determinar cuál
de las posibles interpretaciones metafísicas de la mecánica cuántica y
del proceso de medida es la correcta. Parecen, no obstante, inclinarse
a favor de las interpretaciones que proponen revisiones radicales en
nuestro entendimiento de la naturaleza del mundo y en contra de
quienes afirman que podríamos entender la nueva teoría con sólo re
visiones más o menos menores en nuestros conceptos sobre cómo es
el mundo. Estas eran, por ejemplo, esas interpretaciones del Princi
pio de Incertidumbre que veían en el mismo una limitación mera
mente en nuestro posible conocimiento del estado de un sistema.
Nosotros no podíamos conocer, argumentaban estas interpretaciones,
valores simultáneos exactos de la posición y del momento de una
partícula. Pero podíamos suponer, continuaba el argumento, que di
chos valores todavía existían. No obstante, el hecho de que ninguna
variable oculta no contextual de ningún tipo pudiera generar los re
sultados probabilísticos correctos para todas las mediciones posibles
sobre un sistema parecería militar contra esta concepción y a favor,
antes bien, de la argumentación más radical de Bohr, según la cual
las características atribuidas a un sistema, cuando éste era medido y
se encontraba que tenía ciertos valores de una cantidad observable,
eran «creadas» por la medición y no se encontraban previamente
presentes en el sistema.
Los aun más sorprendentes resultados del Teorema de Bell pare
cen permitirnos ir un poco más lejos. Una cosa es considerar la medi
ción como una «creación» del estado observado del sistema por me
dio de un tipo de proceso causal, el resultado de la interacción
causal entre el aparato de medida y el sistema medido. Después de
todo, somos conscientes del hecho de que, incluso en la física pre-
cuántica, el acto de medir una cantidad de un sistema puede cambiar
el estado del sistema. La introducción de un termómetro en un líqui
do para medir la temperatura de ese líquido cambiará la temperatura
del líquido en el proceso. ¿No podría considerarse de este modo el
«efecto de la medición sobre el sistema medido»? La diferencia entre
el caso clásico y el cuántico residiría entonces en el hecho de que en
el caso precuántico es posible, en principio, hacer que la perturba
ción del sistema por el aparato de medida sea tan pequeña como uno
522 Filosofía de la física
quiera, mientras que en mecánica cuántica el límite irreducible sobre
la cantidad mínima de energía transferida en un proceso de medida
(debido a la naturaleza cuántica de la energía transferida desde un
sistema a otro) podría hacer imposible reducir dicha perturbación a
«casi cero». Semejante forma de entender la incertidumbre tuvo sus
partidarios, especialmente en la primera interpretación del Principio
de Incertidumbre.
Pero, tal y como hemos visto, la mecánica cuántica parece reque
rir que una medición pueda ejercer un efecto sobre un sistema aun
cuando el aparato de medida y el sistema no están en contacto causal
de ninguna forma. La medición del espín en la partícula uno cambia
el estado cuántico de la partícula dos. Como hemos visto, este cam
bio no puede ser reducido a la simple modificación en las probabili
dades que resulta de un aumento en nuestro conocimiento del mun
do para cuyo propósito servirá un modelo clásico. La inexistencia de
variables ocultas locales parece implicar esa conclusión. Así Bohr pa
rece estar en lo cierto cuando mantiene que los estados del mundo,
estados cuánticos de los sistemas, poseen una cierta clase de relativi
dad respecto a la elección y al resultado de la medición que no es
comparable, ni a una modificación causal del sistema por la medi
ción, ni a la consideración del estado cuántico como sólo una des
cripción parcial del sistema, un compendio de nuestro conocimiento
sobre el mismo cuya modificación en la medición es comprensible en
una forma clásica. Los resultados de los teoremas de «variables no
ocultas» refuerzan la vindicación de que la mecánica cuántica nos
exigirá un replanteamiento radical de la naturaleza del mundo, una
vez que hallamos logrado algo parecido a un entendimiento coheren
te de la misma.
No se sabe bien en qué consistirá dicho replanteamiento. Como
mínimo parecería que la mecánica cuántica sitúa bajo una luz muy
diferente la vieja cuestión de si Leibniz estaba en lo cierto al pensar
que todo suceso que ocurría tenía una «razón suficiente». Si la mayo
ría de los intérpretes de la mecánica cuántica están en lo cierto, no
hay sencillamente razón causal alguna en absoluto por la que un nú
cleo de un elemento radioactivo se desintegraría en un intervalo de
tiempo dado, mientras un núcleo idéntico de la misma clase no lo
haría. Peor aun, como hemos visto, las causas estocásticas o probabi-
lísticas parecen descartadas, si se supone que la causalidad — aun si
es indeterminista— es una relación puramente local en la que los
La imagen cuántica del mundo 323
estados de las cosas están determinados solamente por lo que está
sucediendo en su vecindad espacio-temporal. Junto a la noción de
una cadena causal del acontecer en el mundo discurre nuestra no
ción de lo que significa explicar por qué ocurren los fenómenos. Po
demos explicar las correlaciones observadas en las mediciones de es
pín de las partículas distantes por referencia a su origen como
componentes de un sistema compuesto en estado singlete. Pero a di
ferencia de la habitual explicación clásica de dichas correlaciones, no
podemos explicar esta correlación mostrando cómo el origen históri
co de las partículas proporciona para cada una, independientemente
de la otra, una probabilidad definida de ocurrencia, siendo la correla
ción la consiguiente distribución de probabilidades compuestas para
un par de resultados, cada uno de los cuales es descrito probabilísti-
camente. En lugar de ello, la correlación es un hecho «irreducible», y
la explicación de ello es directa y no a través de semejantes probabi
lidades independientes, pues sabemos que cualquier asignación de
las mismas sería incompatible con las correlaciones que se dan efecti
vamente.
Finalmente, aunque más indirectamente, los resultados de «varia
bles no ocultas» refuerzan las afirmaciones de que un entendimiento
total del mundo descrito por la mecánica cuántica requerirá una re
valuación radical de nuestra imagen metafísica del mundo. Para algu
nos, esto significa pasar de la presuposición de la imagen mecanicista
clásica de un único mundo material a una en la que suposiciones
idealistas, bastante anticuadas, sobre la existencia de estados menta
les ontológicamente independientes de los soportes físicos desempe
ñan un papel. Para otros, significa la negación, mucho más radical, de
un mundo físico unitario, y su sustitución por una versión u otra de
una ontología de «muchos mundos» en la que, en cada momento, ca
da uno de una diversidad de resultados posibles de un proceso se
realiza en los diferentes «universos derivados». Para otros, el cambio,
todavía más radical, sería la negación absoluta de cualquier noción
de un mundo objetivo que exista con independencia de nuestras ten
tativas de llegar a conocerlo, sustituyendo esta tradicional concep
ción objetivista por algún tipo de versión de una imagen bohriana, en
la que el mundo está descrito por estados cuánticos, pero estos
estados son de suyo relativos a la elección de una medición a rea
lizar.
Una vez más, el lector debería reflexionar sobre los fenómenos fí
Í 24 Filosofía de la física
sicos que. condujeron a estas osadas especulaciones en primer lugar.
Es importante recordar que tales fenómenos como la naturaleza dual
de la luz como una onda mostrando fenómenos de interferencia y
como una partícula mostrando transferencia de energía en una forma
sumamente localizada; la presencia de fenómenos de interferencia
para las partículas materiales fundamentales del mundo tal y como se
revela, pongamos, en la dispersión de electrones por un cristal; la
aparición de interferencia en otros aspectos del mundo además del
espacial, como en los experimentos de espín que muestran la reten
ción de memoria del espín original de una partícula en una dirección
incluso después de que el haz de partículas haya sido dividido en ha
ces puros de partículas con espines arriba y abajo en alguna otra di
rección; los resultados correlacionados de posibles mediciones simul
táneas sobre un sistema no compatibles con el hecho de estar
determinados por cualquier variable oculta no contextual para el sis
tema, por razones geométricas muy elementales; y la existencia de co
rrelaciones distantes cuya explicación no descansa en una interacción
local pretérita de los sistemas separados, pero que no puede ser re
construida como explicable por parámetros locales portados por ca
da uno de los sistemas separados individualmente. Estas característi
cas del mundo, demostrables experimentalmente, no son parte de
ningún formalismo esotérico, sino características totalmente distinti
vas reproducibles en el laboratorio. Cuanto más se reflexiona sobre
ellas, más difícil es dar con una explicación unitaria plausible que no
recurra a una redefinición absolutamente radical de la naturaleza del
mundo.
Lecturas complementarias
Tres introducciones básicas a la filosofía de la mecánica cuántica que
son fácilmente accesibles son Pagels (1982), Squires (1986) y Rae
(1986). Gibbins (1987) estudia también, con alguna sofisticación filo
sófica, el material básico. Heisenberg (1930) sigue siendo un clásico
de una exposición elemental brillante. Hughes (1989) contiene una
exposición del formalismo de la teoría, con una explicación cuidado
sa de por qué desempeña el papel que desempeña. D ’Espagnat (1971)
es un tratamiento sofisticado de muchos problemas centrales que ha
ce uso de una mayor cantidad de aparato formal que las obras más
La imagen cuántica del mundo
sencillas. Jammer (1974) es de una envergadura enci?fót^édigtfijwgj|
trando la mayor parte de las líneas más importantes de interpretados
a través de la historia de la disciplina.
Jammer (1966) es una historia comprehensiva de los orígenes de
la teoría cuántica que hace hincapié en el desarrollo de los principa
les conceptos. Ludwig (1968) contiene traducciones de los artículos
originales en el campo de la teoría cuántica. Bohm (1951) contiene
también capítulos con una exposición clara sobre la base experimen
tal de la teoría y sobre su desarrollo temprano.
Hay numerosos textos introductorios sobre la teoría cuántica.
Bohm (1951), Dicke y Wittke,(1960), y Gottfried (1960) son todos ex
celentes. Presentaciones formales clásicas de la teoría son Dirac
(1930) y von Neumann (1955). Introducciones a las matemáticas ne
cesarias para formular la teoría pueden encontrarse en Hughes (1989)
y Jordán (1969). El material más avanzado es examinado en Jauch
(1968).
Sobre las interpretaciones tempranas de la teoría, Jammer (1974),
capítulos 2 al 6, es comprehensiva. Heisenberg (1930) es también una
lectura esencial. Una introducción al debate, junto con muchos de
los importantes artículos originales, se encuentra en Wheeler y Zurek
(1983).
Sobre la medición, la lectura de los capítulos 2 y 4-6 de Wheeler
y Zurek (1983) es vital. D ’Espagnat (1971), parte 4, es exhaustiva y cla
ra. Jammer (1974), capítulo 11, abarca las principales teorías.
La formulación del «estado relativo» en la teoría por Kochen
puede encontrarse en Kochen (1985). Una exposición y una discu
sión completas de este enfoque se encuentra en Healy (1989). Una
interpretación relacionada puede encontrarse en van Fraassen (1991).
Propuestas que vinculan la medición cuántica al tipo de irreversibili-
dad discutida en el capítulo 3 del presente libro pueden encontrarse
en el capítulo 5 de Wheeler y Zurek (1983). La concepción según la
cual la medición es el resultado de «puntapiés aleatorios» al sistema
desde un nivel físico «más profundo» pueden encontrarse en Ghirar-
di, Rimini y Weber (1986). Una crítica de esta concepción y de la
concepción de Kochen puede encontrarse en Albert y Loewer (1990).
La interpretación de «muchos mundos» de la teoría cuántica se dis
cute en la sección 11.6 de Jammer (1974) y 2.3 de Wheeler y Zurek
(1983), así como en el capítulo 20 de D ’Espagnat (1971).
La versión de Reichenbach de la «lógica cuántica» se encuentra
326 Filosofía de la física
en Reichenbach (1944). Un estudio de los principales temas de la ló
gica cuántica se encuentra en el capítulo 8 de Jammer (1974). Los ca
pítulos 9 y 10 de Gibbins (1987) exponen ambos la naturaleza de la
pretendida lógica cuántica y ofrecen una crítica de esas posturas filo
sóficas que consideran a la «lógica» cuántica como una revisión de la
lógica propiamente dicha. Hughes (1989) es también una buena fuen
te sobre este tópico.
Para una variedad de teorías de variables ocultas véase Jammer
(1974), capítulo 7, y Belinfante (1973). Sobre la inseparabilidad de los
sistemas, Düspagnat (1971), parte 3, es excelente. Importantes artícu
los originales de Bell se encuentran en Bell (1987).
REFLEXIONES SOBRE LA INTERDEPENDENCIA DE LA FILOSOFÍA Y LA CIENCIA
Capítulo 5
Acabamos de explorar una abundante variedad de tópicos a los
que pueden aplicarse tanto los recursos de la física contemporánea
como los de la filosofía de la ciencia. La profusión de ejemplos y la
forma en que la física y la filosofía juegan un papel intrincadamente
entrelazado en su intento por llegar al fondo de las cuestiones plan
teadas deberían convencer al lector de que la física y la filosofía son
dos formas sumamente interdependientes de tratar de entender el
mundo y nuestro lugar como conocedores del mismo.
Tradicionalmente, la filosofía ha intentado describir la naturaleza
del mundo en términos de máxima generalidad. Eludiendo la des
cripción pormenorizada y la clasificación del gran número de fenó
menos de la naturaleza, dejando esto como cometido a las ciencias
especiales, la filosofía se ha preocupado por la naturaleza del ser a
los niveles de máxima abstracción. ¿Existen particulares solamente, o
debemos postular universales, propiedades, como dotados de una
existencia propia? ¿Se agota la sustancia del universo en el ser mate
rial, o debemos también tolerar un reino de existencia no material a
fin de dar cuenta de los fenómenos de la mente? Éstas son las clases
de preguntas que esperamos que planteen los filósofos.
La filosofía también ha considerado de su incumbencia el exa
men crítico de las ciencias específicas. Aunque la ciencia infiere la
naturaleza del futuro y de lo inobservado a partir de los datos limita
327
328 Filosofía de la física
dos de que disponemos por las observaciones realizadas hasta el mo
mento, la filosofía se interesa por la justificación del razonamiento in
ductivo que permite la proyección de un supuesto conocimiento más
allá del reino de lo observado. La ciencia reúne los resultados de ob
servaciones, resultados gestados en los términos derivados en último
término del lenguaje de la experiencia cotidiana. Después explica
estos resultados haciendo referencia a un dominio de entidades teóri
cas inobservadas y de propiedades de las mismas. La filosofía, por
contraste, inquiere sobre la legitimidad de dicha extrapolación allen
de el reino de lo observable al reino de lo inobservable. ¿Cómo pue
den racionalizarse o justificarse dichas inferencias? Profundizando
aún más, ¿cómo pueden los conceptos que pretenden hacer referen
cia a lo inobservable tener siquiera un significado para nosotros, da
do el papel que supuestamente juega la asociación de un concepto
con la experiencia en la fundamentación del significado?
La filosofía de la ciencia es a menudo caracterizada por reservar
para sí cuestiones en el reino de la metodología. Mientras la acumu
lación real de resultados observacionales y su asimilación en teorías
explicativas generales ha de ser la tarea del científico en su disciplina
especial, es el filósofo de la ciencia quien ha de explorar los métodos
con los que la ciencia acomete su tarea. ¿Cómo se formulan, com
prueban, aceptan y recusan las teorías en la ciencia? ¿Qué papel jue
ga la confrontación con los datos? ¿Qué papel juegan elementos tales
como la simplicidad ontológica o la elegancia formal en el proceso
continuo de construcción y selección de teorías? ¿Cuáles son los me
dios con los que el científico ofrece un entendimiento del mundo so
bre la base de observaciones y teorización? ¿Cómo son las explicacio
nes formuladas por el científico? ¿Cuáles son los recursos tras los
esquemas explicativos, y de qué manera la existencia de una explica
ción científica nos aporta un mayor entendimiento de la naturaleza
del mundo? Pero, como hemos visto, la necesidad de teorías revolu
cionarias en la física que traten de los fenómenos de la naturaleza a
los niveles de mayor generalidad y de mayor profundidad ha obliga
do a los propios científicos a confrontar cuestiones del tipo justamen
te que han sido tradicionalmente reservadas a los filósofos.
Cuando estamos tratando con las cuestiones más fundamentales
concernientes al espacio y el tiempo y al lugar que ocupan en la na
turaleza, las cuestiones concernientes al tipo de ser que puede existir
y que puede ser invocado en nuestras descripciones explicativas pa
Reflexiones sobre la interdependencia de la filosofía y la ciencia 329
san a un primer plano. Esto era ya obvio en el siglo xvn cuando,
como hemos visto, pensadores de la talla de Newton y Leibniz force
jearon con las cuestiones metafísicas que parecían inextricables des
de sus concepciones sobre la naturaleza del espacio y el tiempo. Aho
ra, con las revoluciones en nuestras concepciones del espacio y el
tiempo a las que nos hemos visto forzados por la teoría especial de la
relatividad y la teoría general de la relatividad, estas viejas cuestiones
sobre la substantividad del espacio y el tiempo han resurgido. Pro
fundizando aún más, como hemos visto, pensadores tales como Bohr,
confrontados con los extraños fenómenos a los que la mecánica
cuántica debe hacer justicia, han encontrado necesario ocuparse de
cuestiones concernientes a la objetividad misma del mundo como
una entidad supuestamente independiente de las acciones acometi
das por quienes intentan llegar a conocer su naturaleza. Las viejas
cuestiones filosóficas de la autonomía del mundo respecto a nuestra
comprensión sensible e intelectual del mismo, cuestiones con las que
se debatió, por ejemplo, Kant, pasan a formar parte de una tentativa
de entender el formalismo de la teoría diseñado para tratar los insóli
tos hechos sobre la interacción de la materia con la radiación de los
que la mecánica cuántica debe ocuparse.
Hemos visto asimismo que el enfoque epistemológico crítico de
la filosofía ha jugado un papel en los fundamentos de algunas de
estas teorías físicas contemporáneas. Aunque los espacio-tiempos re
volucionarios de las teorías especial y general de la relatividad surgen
en parte de la necesidad de nuevas descripciones del espacio y el
tiempo que hagan justicia a los hechos experimentales recientemente
descubiertos acerca del comportamiento de la luz, el movimiento de
las partículas, y los resultados de mediciones con relojes y varas de
medir, un papel igualmente importante en la formulación de estas
teorías es jugado por el examen crítico de los conceptos desde el
punto de vista epistémico. Este programa crítico alcanza su culmina
ción en el trabajo de Einstein. Einstein nos incita una y otra vez a la
discusión teórica pidiéndonos que reflexionemos sobre el significado
de nuestros términos básicos referentes al espacio y al tiempo. Nos
pide que consideremos el funcionamiento de estos términos en nues
tras teorías, haciendo especial hincapié en el grado en que nuestras
teorías aceptadas están fundamentadas en hechos del mundo que
nos son verdaderamente accesibles epistémicamente. Haciendo uso
de un examen crítico de los términos e hipótesis que depende de
330 Filosofía de la física
una exploración de los límites de nuestra conciencia epistémica del
mundo, Einstein revigoriza las teorías físicas a nuestra disposición
para tratar de la estructura espacial y temporal del mundo. En la ten
tativa de resolver las características aparentemente paradójicas del
mundo que nos describe la mecánica cuántica, encontramos de nue
vo pensadores como Bohr y Heisenberg intentando convencernos de
que un entendimiento correcto de la teoría, y del mundo que ésta
describe, nos exige dar marcha atrás y reflexionar sobre nuestra capa
cidad de llegar a conocer el mundo. Esta reflexión se hace desde una
perspectiva crítico-epistemológica.
A modo de ejemplo de cómo los resultados de la física requieren
un replanteamiendo de algunas cuestiones metodológicas, podríamos
considerar la forma en que la mecánica estadística muestra que hay
modos de explicación de los fenómenos que parecen requerir mode
los de explicación estadística de sorprendente originalidad. El papel
de las probabilidades en la mecánica estadística, la razón de su atri
bución a los microestados de ciases particulares de sistemas, su papel
en dar cuenta de los fenómenos macroscópicos de los que se ocupa
la termodinámica, y la relación de estas probabilidades con las conse
cuencias de tipo estadístico derivadas de las leyes de la dinámica
subyacentes, todo esto muestra la pertinencia de un replanteamiento.
Debemos pensar enérgicamente sobre la relación de las condiciones
iniciales con las leyes, y sobre el papel que ambas juegan en la expli
cación de por qué sucede lo que sucede en el mundo. Hemos visto
también cómo las consecuencias de la mecánica cuántica, como las
pruebas de imposibilidad de variables ocultas locales, sugieren que la
ciencia nos ha impuesto una nueva actidud hacia lo que constituye
una explicación completa de las correlaciones descubiertas entre
unos fenómenos y otros cuando estos fenómenos no están en interac
ción causal en el momento en que ocurren. De hecho, la naturaleza
mismj de la causalidad y cómo ésta ha de ser buscada e invocada en
la ciencia adquieren una apariencia diferente en el contexto cuántico.
No podemos esperar, pues, hacer filosofía sin referencia a los re
sultados de la física. Que esto es cierto para la metafísica, la investiga
ción en la naturaleza del mundo a los niveles de la mayor generali
dad, parece de lo más obvio. Es evidente que nuestro entendimiento
de las clases fundamentales de cosas y propiedades que debemos
postular para abarcar la naturaleza del mundo debe tomar en cuenta
lo que la ciencia nos dice sobre el mundo. Repetidas veces la filoso
Reflexiones sobre la interdependencia de la filosofía y la ciencia 331
fía que intenta razonar a priori, con independencia de los datos de la
observación y el experimento, y llegar a conclusiones sobre cómo
debe ser el mundo, se ha visto turbada por las revelaciones de la
ciencia. Esto nos ha hecho ver lo limitada que ha sido la imaginación
de los filósofos aprioristas al pretender delimitar el reino de las posi
bilidades para la naturaleza del mundo. Sin los resultados de la física,
¿qué filósofo habría considerado la amplia variedad de posibilidades
para la naturaleza del espacio y el tiempo, de la causalidad, y de las
clases de objetividad y su carencia que las recientes teorías radicales
de la física han postulado como posibilidades para nuestra considera
ción?
Pero no es la metafísica la única que debe prestar atención a los
resultados de la ciencia. Muchos filósofos de la teoría del conoci
miento han argumentado en los últimos años que la esperanza en
una teoría racionalizada y apriorísticamente formulada de la inferen
cia a la verdad es también una proposición dudosa. Al decidir cuáles
son las reglas razonables para ser utilizadas en desentrañar la verdad,
han argumentado, debes valerte de tus mejores intuiciones sobre la
naturaleza del mundo cuyas verdades estás intentado desvelar. Pero,
si esto es así, sin duda debemos tomar en consideración esas teorías
de las ciencias, sea la física fundacional o la neuropsicología y las
ciencias cognitivas de la percepción y el pensamiento, que nos dicen
lo que sabemos sobre la naturaleza del mundo que estamos intentan
do descubrir y sobre nuestra relación con el mismo como percepto
res y teorizadores. Como hemos visto, nuestra misma noción de lo
que significa comprender ese mundo, entender sus mecanismos y
aportar descripciones explicativas de lo que sucede en él dependerá
mismamente de la propia naturaleza de ese mundo. Así, en sus come
tidos epistemológicos y metodológicos, la filosofía necesitará referirse
continuamente a lo que las ciencias avanzadas, incluyendo la física
fundacional, nos dicen sobre el mundo.
Es importante observar que esta dependencia respecto a las cien
cias no es una mera dependencia de las mismas como fuentes de
datos básicos solamente. Por supuesto, los resultados observacionales
que empujan a la ciencia de la física a la invención de las radicales y
noveles teorías que hemos estado examinando son cruciales en lo
que a su impacto sobre la filosofía respecta. Pero también la capaci
dad de los practicantes de estas ciencias de imaginar nuevos esque
mas conceptuales que toman en cuenta los nuevos datos proporciona
332 Filosofía de la física
a la filosofía un espectro de incomparable riqueza de nuevas formas
conceptuales de tratar con el mundo. Las imaginaciones de científi
cos como Boltzmann, Einstein y Bohr son la fuente de formas de
pensamiento completamente nuevas acerca de la naturaleza de la rea
lidad, nuestro conocimiento de ella y nuestra capacidad para dar una
descripción explicativa de la misma. Ellas proporcionan una fuente in
comparablemente fértil de enriquecimiento al filósofo que busca
nuevas formas de tratar los problemas tanto viejos como nuevos, pre
sentados por el mundo de la experiencia.
Pero si la filosofía debe prestar una atención detenida a los resul
tados de la física fundacional, está claro que la física fundacional pre
senta a su vez una dependencia de la filosofía. Al explorar las raíces
de las teorías fundacionales en el corazón de la física moderna, he
mos visto una y otra vez que la formulación de estas teorías no se re
duce a una extrapolación trivial por un razonamiento obvio de los
datos observacionales. Antes bien, la formulación de una teoría apro
piada y la justificación suministrada por esa elección, cuando se
adopta una postura teórica particular y se defiende contra las críticas,
depende de los tipos de razonamiento que los filósofos han explora
do y debatido. Esto puede verse claramente, por ejemplo, en las justi
ficaciones tras las teorías especial y general de la relatividad ofrecidas
por Einstein y en las tentativas de Bohr por proporcionar un enten
dimiento coherente del formalismo de la mecánica cuántica. Aquí
cuestiones filosóficas tales como la indistinción entre las consecuen
cias de una teoría comprobables por la observación y aquellas inmu
nes a la confrontación; el papel del examen crítico de los significados
de los conceptos no observacionales de las teorías; la justificación de
principios para la elección de teorías que descansan en consideracio
nes como la de simplicidad ontológica; la conveniencia de generaliza
ciones para proporcionar explicaciones auténticas de los fenómenos;
y la cuestión de cuándo una explicación puede ser considerada defi
nitiva, juegan todas ellas un papel crucial en el seno de la dialéctica
científica que lleva a la formulación y aceptación de teorías. Es como
si cuestiones tradicionalmente filosóficas tuviesen que pasar a formar
parte del pensamiento científico mismo cuando las teorías científicas
bajo consideración son de una generalidad y fundamentalidad tan
notables como las que hemos discutido en los capítulos precedentes.
En cierta época, los físicos teóricos recibían normalmente una
formación en filosofía y su historia. En aquellos tiempos, podía en
Reflexiones sobre la interdependencia de la filosofía y la ciencia 333
contrarse referencia explícita al tipo de razonamiento filosófico que
respaldaba el razonamiento físico en los trabajos de algunos de los
grandes científicos. Einstein y Bohr proporcionan dos ejemplos no
tables. Aunque la especialización de la formación académica en las
décadas recientes ha hecho que dicha familiaridad con la filosofía
tradicional sea menos habitual entre los científicos, incluidos los
científicos más teóricos, la necesidad del tipo de pensamiento filosó
fico que hemos venido discutiendo como parte del pensamiento
científico se ha hecho ahora clara. Esto es así independientemente de
que el científico quiera o no afrontar el hecho. Evidencia de ello
puede verse en el tipo de pensamiento cuasi-filosófico que ha pasado
a formar parte de la especulación cosmológica y la teorización sobre
el big bang en la cosmología científica.
El hecho de que las teorías científicas mismamente estén basadas
en un pensamiento de tipo filosófico, ya se haga esto explícito en la
historia científica o sólo implícito y esperando a ser desenterrado por
el historiador y el filósofo, significa también que uno debe estar aler
ta ante la tentativa demasiado ingenua de resolver cuestiones filosófi
cas tradicionales haciendo referencia a los resultados de la ciencia.
Los argumentos en el sentido de que un resultado dado de la ciencia
resuelve conclusivamente una cuestión filosófica tradicional en una
dirección u otra pierden de vista con demasiada frecuencia la forma
en que ciertas presuposiciones filosóficas implícitas se han insertado
en la teoría que está siendo utilizada para resolver el debate. Si se hu
bieran hecho otras elecciones filosóficas en la ciencia misma, las im
plicaciones de la ciencia para la filosofía podrían parecer de hecho
muy diferentes.
En cualquier caso, está bastante claro que en sus niveles de máxi
ma generalidad y en sus tentativas de tratar a la naturaleza en su ni
vel más fundamental, la ciencia es una disciplina que en su naturale
za no puede ser diferenciada radicalmente de la filosofía. Y la mejor
forma de hacer filosofía es utilizar un método que, como la ciencia,
siempre remita en su teorización a la naturaleza de las cosas según
nos es revelada por esa refinada experiencia que llamamos observa
ción científica y experimento.
BIBLIOGRAFÍA
Albert, D., y B. Loewer (1990), «Wanted Dead or Alive: Two Attempts to
Solve Schródinger’s Paradox», en Fine, M. Forbes y L. Wessels eds.,
PSA-1990, vol. 1. East Lansing, MI, Philosophy of Science Association.
Alexander, H., ed. (1956), The Lebtiiz-Clarke Correspondence, Manchester,
Manchester University Press.
Anderson, J. (1967), Principies of Relativity Pbysics, Nueva York, Academic
Press (*).
Arnold, V., y A. Avez (1968), Ergodic Problems of Classical Mechanics, Nueva
York, Benjamín (**).
Barbour, J. (1989), Absolule or Relative Motion?, vol. 1, The Discovery of Dynamics, Cambridge, Cambridge University Press.
Batterman, R. (1990), «Irreversibility and Statistical Mechanics: A New Ap-
proach?», Philosophy of Science, 57, 395-419.
— (1991), «Randomness and Probability in Dynamical Theories: On the
Proposals of the Prigogine School», Philogophy of Science, 57, 241-263.
Belinfante, F. (1973), A Survey of Hidden Variable Theories, Nueva York, Per-
gamon (*).
Bell, J. (1987), Speakable and Wnspeakable in Quantum Mechanics, Cambridge,
Cambridge University Press.
Bohm, D. (1951), Quantum Theory, Englewood Cliffs NJ, Prentice-Hall (*)•
— (1989), The Epecml Theory of Relativity, Reading, MA, Addison-Wesley.
Las obras que requieren algún conocimiento previo de matemáticas y física teórica (por ejemplo, en un nivel de estudiante universitario) van señaladas con un asterisco (*). Los textos que precisan de una mayor familiaridad con conceptos técnicos ymétodos se señalan con dos asteriscos (**).
335
336 Bibliografía
Brush, S. (1965), Kinetic Theory, Oxford, Pergamon Press.
— (1976), TheKindofMotion Tbat WeCallHeat, Amsterdam, North-Holland.
Buchdahl, H. (1966), The Concepts of Classical Thermodynamics, Cambridge,
Cambridge University Press (*).
Cramér, H. (1955), The Elements of Probabihty Theory and Some of Its Applications, Nueva York, John Wiley.
Davies, P. (1974), The Physics of Time Asymmetry, Berkeley, University of Cali
fornia Press.
D ’Espagnat, B. (1971), Conceptual Foundations of Quantum Mechanics, Menlo
Park, CA, Benjamín (**).
Devaney, r. (1986), An Introduction to Chaotic Dynamical Systems, Menlo Park,
CA, Benjamin-Cummings (**).
Dicke, R., y J. Wittke (1960), Introduction to Quantum Mechanics, Reading,
MA, Addison-Wesley (*).
Dirac, P. (1930), The Principies of Quantum Mechanics, Oxford, Oxford Uni
versity Press (*).
Earman, J. (1974), «An Attempt to Add a Little Direction to 'The Problem of
the Direction of Time’», Phylosophy of Science, 41, 15-47.
— (1986), A Primer ofDeterminism, Dordrecht, D. Reidel.
— (1989), World-Enough andSpace-Time, Cambridge, MA, MIT Press.
Eddington, A. (1920), Space, Time and Gravitation, Cambridge, Cambridge
University Press.
Ehrenfest, P., y T. Ehrenfest (1959), The Conceptual Foundations of the Statisti- calApproach in Mechanics, Ithaca, NY, Cornell University Press (*).
Einstein, A., et al. (1923), The Principie of Relativity, Nueva York, Dover.
Farquhar, I. (1964), Ergodic Theory in Statistical Mechanics, Nueva York, John
Wiley (*).
Feller, W. (1950), An Introduction to Probability Theory and Its Applications, Nueva York, John Wiley (*).
Friedman, M. (1983), Foundations of Space-Time Theories, Princeton, Princeton
University Press (*).
Geroch, R. (1978), General Relativity from A to B, Chicago, University of Chi
cago Press.
Ghirardi, G., A. Rmini y M. Weber (1986), «Unified Dynamics for Microsco
pio and Macroscopic Systems», Physical Review, D 34, 470-479 (*).
Gibbins, P. (1987), Particles and Paradoxes, Cambridge, Cambridge University
Press.
Gibbs, J. (1960), Elementary Principies in Statistical Mechanics, Nueva York,
Dover (*).
Gleick, J. (1987), Chaos: Mabinga New Science, Nueva York, Penguin Books.
Gottfried, K. (1960), Quantum Mechanics, Nueva York, Benjamín (*).
Graves, J. (1971), The Conceptual Foundations of General Relativity Theory, Cambridge, MA, MIT Press.
Bibliografía 337
Grünbaum, A. (1973), Philosophical Problems of Space and Time, 2d ed., Dor-
drecht, Reidel.
Hawking, S., y G. Ellis (1973), The Large Scale Structure of Space-Time, Cam
bridge, Cambridge University Press (**).
Healy, R. (1989), The Philosopby of Quantum Mecbanics, Cambridge, Cambrid
ge University Press.
Heisenberg, W. (1930), The Physical Principies of the Quantum Theory, Nueva
York, Dover.
Hobson, A. (1971), Concepts in Statistical Mecbanics, Nueva York, Godon and
Breach.
Horwich, P. (1983), Asymmetries in Time, Cambridge, Massachusetts, M IT
Press. , ,
Hughes, R. (1989), The Structure and Interpretation of Quantum Mecbanics, Cam
bridge, Massachusetts, Harvard University Press.
Humphreys, P. (1989), The Chances of Explanation, Princeton, Princeton Uni
versity Press.
Jammer, M. (1954), Concepts of Space, Cambridge, Cambridge University Press.
— (1966), The Conceptual Development of Quantum Mecbanics, Nueva York,
McGraw-Hill.
— (1974), The Philosopby of Quantum Mechanics, Nueva York, John Wiley.
Jancel, R. (1963), Funda tío ns of Classical and Quantum Statistical Mechanics, O x
ford, Pergamon Press (*).
Jauch, J. (1968), Foundations of Quantum Mechanics, Reading, Massachusetts,
Addison-Wesley (**).
Jaynes, E. (1983), Papers on Probability, Statistics and Statistical Pbysic, Dor-
drecht, Reidel.
Jordán, R. (1969), Linear Operators for Quantum Mechanics, Nueva York, John
Wiley (*).
Kant, I. (1929), The Critique of Puré Reason, trad. de M. Kemp Smith, Nueva
York, Macmillan.
— (1950), Prolegomenon to Any Future Metaphysic, Nueva York, Liberal Arts
Press.
Katz, A. (1967), Principies of Statistical Mechanics, San Francisco, Freeman (*).
Kochen, S. (1985), «A New Interpretation of Quantum Mechanics». En P.
Lahti y P. Mittelstaedt, eds. Symposium on the Foundations of Modem Physics, Teaneck, NJ, World Scientific Publishing (*).
Kolmogorov, A. (1950), Foundations of the Theory of Probability, Nueva York,
Chelsea (*).
Krylov, N. (1979), Works on the Foundations of Statistical Physics, Princeton,
Princeton University Press.
Kyburg, H. (1970), Probability and Inductive Logic, Londres, Macmillan.
Lucas, J., y P. Hodgson (1990), Spacetime and Electromagnetism, Oxford, O x
ford University Press.
338 Bibliografía
Luwig, G. (1968), W'ave Mechanics, Oxford, Pergamon Press.
Mehlberg, H. (1980), Time, Causality and the Quantum Theory, Dordrecht, D.
Reidel.
Mellor, D. (1981), Real Time, Cambridge, Cambridge University Press.
Misner, C., K. Thorne y J. Wheeler (1973), Gravitation, San Francisco, Free-
man (**).
Moller, C. (1952), The Theory of Relativity, Oxford, Oxford University
Press (*)•
Nerlich, G. (1976), The Shape of Space, Cambridge, Cambridge University
Press.
Newton-Smith, W. (1980), The Structure ofTime, Londres, Routledge and Ke-
gan-Paul.
Pagels, J. (1982), TheCosmicCode, Nueva York, Bantam Books,
Pensorse, R. (1979), «Singularities and Time Asymmetry». En S. Hawking y
W. Israel, eds., General Relativity: An Einstein Centenary Survey, Cambridge,
Cambridge University Press.
Pippard, A. (1961), The Elements of Classical Thermodynamics, Cambridge,
Cambridge University Press.
Poincaré, J. (1952), Science and Hypothesis, Nueva York, Dover.
Prigogine, I. (1980), Frotn Being to Becoming, San Francisco, Freeman.
— (1984), Oder Out of Chaos, Nueva York, Bantam Books.
Putnam, H. (1967), «Time and Physical Geometry», Journal of Philosophy, 64,
240-247.
Rae, A. (1986), Quantum Physics: IIlusión or Reality?, Cambridge, Cambridge
University Press.
Reichenbach, H. (1944), Philosophic Foundations of Quantum Mechanics, Berke-
ley, University of California Press.
— (1956), TheDirection ofTime, Berkeley, University of California Press.
— (1958), The Philosophy of Space and Time, Nueva York, Dover.
Rietdijk, C. (1966), «A Rigorous Proof of Determinism from the Special
Theory of Relativity», Philosophy of Science, 33, 341-344.
Ridnler, W. (1977), EssentialRelativity, Nueva York, Springer-Verlag (*).
Salmón, W. (1984), Scientific Explanation and the Causal Structure of the World, Pripceton, Princeton University Press._
Schoroeder, M. (1991), Fractals, Chaos, Power Laws, Nueva York, Freeman (*).
Sinai, Y. (1976), Introduction to Ergodic Theory, Princeton, Princepton Univer
sity Press (**).
Sklar, L. (1974), Space, Time, and Spacetime, Berkeley, University of California
Press.
— (1985), Philosophy and Spacetime Physic, Berkeley, University California Press.
— De próxima publicación, The Physics of Chance, Cambridge, Cambridge
University Press.
Smart, J., ed. (1964), ProblemsofSpace and Time, Nueva York, Macmillan.
Bibliografía 339
Squires, E. (1986), The Mystery of the Quantum World, Bristol, Adam Hilger.
Stein, J. (1991), «On Relativity Theory and Openness of the Future», Philo-
sophy of Science, 57, 147-167.
Synge, J. (1956), Relativity: the Special Theory, Amsterdam, North-Holland (*).
Taylor, E., y J. Wheeler (1963), Spacetime Physics, San Francisco, Freeman.
Tolman, R. (1934), Relativity, Thermodynamics and Cosmology, Oxford, Oxford
University Press.
— (1938), The Principies of Statistical Mechanics, Oxford, Oxford University
Press (*).
Toretti, R. (1978), The Philosopby of Geometry from Riemann to Poincaré, Dor-
drecht, Reidel.
— (193), Relativity and Geometry, Oxford, Pergamon Press (*).
Van Fraasen, B. (1970), An Introduction to the Philosopby of Time and Space, Nueva York, Random House.
— (1991), Quantum Mechanics: An Empiricist View, Oxford, Oxford Univer
sity Press (*).
Von Neumann, J. (1955), Mathematical Foundations of Quantum Mechanics, Princeton, Princeton University Press (**).
Wald, R. (1984), General Relativity, Chicago, University of Chicago Press (*).
Wheeler, J., y W . Zurek, eds. (1983), Quantum Theory and Measurement, Prin
ceton, Princeton University Press (*).
Winnie, J. (1977), «The Causal Theory of Space-Time», en J. Earman, C.
Glymour y J. Stachel, eds., Foundations of Space-Time Theories, Minnesota Studies in the Philosopby of Science, vol. 8, Minneapolis, University of M in
nesota Press.
ÍNDICE ANALÍTICO
Aceleracióny espacio-tiempo de Minkowski, 60,
62 (figura), 64, 115-116
y espacio-tiempo neo-newtoniano, 66
y gravedad, 67, 68, 69, 70, 71, 99-1003 teoría de Newton, 42, 67, 115-116
y teorías de la relatividad, 44-45. 47, 60, 61 (figura), 64-65
Véase también movimiento y velocidad de la luz, 47-50, 52, 94, 98
Véase también luz, naturaleza de la
Aditividad contable, 142
Agujeros negros, 82, 83
Albert, D., 282 Antirrelacionismo, 42-47
Aristóteles, 13, 14, 39, 152,219 Aritmética, 29, 30, 31, 32
Asimetría temporaly aproximación al equilibrio, 196-197,
201,202,203 y asimetría entrópica, 217-219, 224-
227y cosmología, 209-214, 215
y macróentropía, 221-222
y mezcla, 202-203 y preparación, 206-207
y modelo de Prigogine, 206, 208
y teoría cuántica de campos, 193, 194,
195y teoría de Krylov, 207 en termodinámica, 167-168, 174-176,
180-181, 191, 192, 193, 224 Astronomía, 28, 50, 67-68. Véase también
movimiento planetario Átomos, 233-240. Véase también mecánica
cuántica, teoría cuántica
Agustín, san, 36
Bacon, F., 168Banda de Mobius, 81 (& figura)
Bell, J., 314Bernoulli, J., 168Birkhoff, G„ 285, 286Bohr, Niels, 29, 259, 260, 329, 330
acerca de la descripción cuántica, 262,
263, 298, 299, 307 y naturaleza del átomo, 236, 237, 238 Véase también Interpretación de Co
penhagueBoltzmann, L . Véase ecuación de Boltz
mann
Bo lya iJ., 72, 73Born, M., 238, 241-242, 261, 275-276
341
342 Indice analítico
Calor. VVa.it- termodinámica
Carnot, S., 165
Causalidad
asimetría de, 222-225 y asimetría entrópica, 217-218, 221-
222y condicionales contrafactuales, 222-
224y curvatura del espacio-tiempo, 79-
82y determinismo, 293-296, 322-323
y espacio-tiempo, 134-137
y explicación, 152-155, 157-161
y espacio-tiempo de Minkowslci, 64-
65, 133(figura) y mecánica cuántica, 24, 293-296, 322,
329-330 y metafísica, 31-32
y teoría cuántica, 19, 250
teorías del espacio-tiempo de Robb, 127-131
y topología del espacio-tiempo, 131- 134, 132 (figura), 133 (figura), 135
Church, A., 147
Cinemática, 45-46 Clausius, R., 165, 168
Clifford, W„ 76
Complementariedad, 252-254 Conjuntos, 175-177
Conocimiento, 14-15, 331en la filosofía griega clásica, 27-29
asimetría de, 222e Interpretación de Copenhague, 251-
255equivalencia estructural, 102-107
geometría como paradigma de, 28-30, 31, 32, 33, 85-87, 106-109
y metodología, 31, 95-97
pragmatismo, 105-107
y teoría cuántica, 261-263, 270
teorías positivistas, 99-103 y escepticismo, 30, 31, 32, 95, 99, 101,
105-106simplicidad teórica, 61-63, 64-65 Véase también explicación; medida; tó
picos específicos Conos de luz, 57-58
Contracción de longitudes, 50-52, 59
Corrimiento al rojo gravitacional, 71 (fi
gura)Críticas epistemológicas, 19-20, 134-136,
329. Véase también metodología
Curva de concentración, 172-174, 173
(figura), 191 Cosmología, 16-17, 79-83, 209-214, 333
Véase también teoría del big bang Condicionantes contrafactuales, 222-
224Curvatura del espacio-tiempo, 55
y conservadurismo metodológico, 96-
97y cosmología, 79-83
y universos vacíos, 120
y gravedad, 70-71, 75-81, 78 (figura), 83-85
y geometrías no-euclídeas, 72-81
y hechos observables, 94-95 y simplicidad teórica, 98-99
Véase también relatividad, teoría gene
ral de la
De Broglie, L ., 234 De Laplace, P. S., 123-124, 125, 293
Descartes, René, 226
Determinismoargumento de inseparabilidad de
Einstein-Podolsky-Rosen, 307-314,
310 (figura) y causalidad, 293-295, 222-223
y física clásica, 292, 293, 294 e Interpretación de Copenhague, 297-
300, 307-309, 321
Teorema de Bell, 314-323
y teoría general de la relatividad, 123- 127
y mecánica cuántica, 126, 295-306, 305 (figura), 307-309, 321-324
teoría de von Neumann, 299-301, 302-303
Dinámica, 21, 46, 169, 249-253, 263, 264
Dios, 41,42Dirac, P., 249-250, 256, 285-286
Distribución de materia, 121-122
Distribuciones compuestas, 284
Indice analítico 3-43
Ecuación de Boltzmann, 168-173, 173 (figura), 182
y cosmología, 209, 210, 212
y curva de concentración, 173-174, 173 (figura), 191
y dirección del tiempo, 172, 173, 214, 216-227
clarificación por los Ehrenfest, 170, 189, 191, 202
y concepción ergódica, 175-180
derivación rigurosa de la, 201, 202- 203
e Hipótesis Relativa a los Números de
Colisión, 179-180, 191-192
y naturaleza de la luz, 233-234
y Ley de Wien, 233-234
Eddington, A., 226-227 Efecto Doppler, 70
Efecto fotoeléctrico, 234 Ehrenfest, P , 170, 189, 191, 202
Ehrenfest, T„ 170, 189, 191, 202
Einstein, Aibert, 20, 21, 46, 47, 70, 224, 234, 259, 260
acerca de la Interpretación de Copen
hague, 251, 254 acerca del determinismo, 297, 307,
308, 309argumento de inseparabilidad, 307-
314, 310 (figura)Véase también entradas a relatividad; es
pacio-tiempo
Electromagnetismo, 21, 118, 123-124, 218-219, 225,233
Elliot, T. S., 293Energía de conservación, Véase Primera
Ley de la Termodinámica
Entropía, 195,210, 220, 221asimetría de la, 210, 211, 213, 216-
220, 222, 226-228 véase también asimetría temporal
Equivalencia estructural, 102-105 Equivalencia masa-energía, 61, 123
Escepticismo, 30, 31, 32, 33, 95-96, 99- 101, 105-106
Espacio, 22-23, 32-34como continente de la materia, 34-35,
39-41, 43-44, 45-47
y estados de equilibrio, 174-176
y teoría general de la relatividad, 24, 328, 329
y gravedad, 68-69
teoría de Leibniz, 38-42
y metafísica, 110-112
teoría de Newton, 42, 44, 45, 46, 54,
58, 61, 64, 115, 116 no orientabilidad, 81-82
teoría de Poincaré, 88-89, 91-92 y posibilidad, 40, 41, 42, 43
y teoría especial de la relatividad, 19,
47-55, 328-329 Véase también entradas a geometría; mo
vimiento; entradas a relatividad; es
pacio-tiempo
Espacio-tiempo, 55-65, 56 (figura)y asimetría entrópica, 210-211, 216-
219y causalidad, 64-65, 80-81, 127-137,
132 (figura), 133 (figura)y cuestiones epistemológicas, 329,
330,331
y metafísica, 111-138 neo-newtoniano, 65-67, 82-83
y debate sustantivista-relacionista, 123-127
y teoría machiana, 118-122
topología de, 130-134, 132 (figura),
133 (figura), 134-135Véase también curvatura del espacio-
tiempo; entradas a relatividad
Espacio-tiempo de Minkowski, 55-64, 56
(figura)y aceleración, 61, 62 (figura), 64, 115-
117y causalidad, 63-64, 133 (figura) y determinismo, 125
y espacio-tiempo neo-newtoniano, 65, 82-83
y geometría, 57-58, 66, 78
y teoría general de la relatividad, 121
Espacio-tiempo galileano. Véase espacio- tiempo neo-newtoniano
Espacio-tiempo neo-newtoniano, 64-67,
83Espectroscopia, 309-310
Estados de equilibrio, 165-167
y cosmología, 209-214
344 índice analítico
concepciones ergódicas, 175-181, 177
(figura), 181-185, 186 (figura), 187, 188
explicación de, 146-147
Teorema KAM , 186 (figura), 186-189, 200
y teoría cinética del calor, 168-176, 170 (figura), 171 (figura), 172 (figura)
Véase también estados de equilibrio, aproximación a los
Estados de equilibrio, aproximación a los, 189-191, 190 (figura)
y aislamiento de sistemas, 191-193 experimento del eco-espín, 192-193,
194 (figura) y cosmología, 209-214
problema de la distribución inicial de
probabilidad, 202-210, 204 (figura) mezcla, 198-203, 199 (figura), 206-207 teorías no estándar, 191-196
Postulado de Caos Molecular, 179,181, 191, 197
modelo de Prigogine, 206, 207, 208
teorías estándar, 195-203
Véase también estados de equilibrio Euclides, 72, 73 Véase también geometría
Everett, H., 280, 281
Experimento de la doble trayectoria, 242-244, 245 (figura)
Experimento de las dos rendijas, 242- 243, 244 (figura), 247, 260-261, 265-266, 290-291
y lógica, 284-285, 289-290
Experimento de Michelson-Morley, 49, (figura)
Experimento del eco-espín, 193, 194 (figura)
Experimento de Stern-Gerlach, 246, 248 (figura), 263, 271,278
Explicación, 155-163, 187, 214-215. Véase también conocimiento
Filosofía
historia de, 13-16, 21, 27-31
importancia de la física para, 21-24, 331-334
y física moderna, 16-22 y ciencia, 13-16, 327-333
Véase también tópicos específicos Filosofía griega clásica, 13, 14, 27-29, 292.
Véase también filósofos específicos Fuerzas inerciales, 43, 45-47, 115-117,
118-120. Véase también aceleración; movimiento
Galilei, Galileo, 42, 47, 53, 61, 67, 68, 87
Gato de Schródinger, 268 (figura), 268- 270, 271
Gauss, K .F., 72, 73, 74, 82
Generalización, 160-162, 180, 295. Véase también conocimiento; metodología, reducción
Geodésicas, 77, 78 (figura), 79-80, 82-84, 94, 101-102
Geometría. Véase geometría euclídea; geometría no-euclídea; conocimiento
Geometría euclídea
como paradigma del conocimiento, 29-30,31-33,85-87, 107-108
y espacio-tiempo de Minkowski, 56, 57, 58, 64, 65, 66
y naturaleza del espacio, 34-35, 41-42, 45-46
teoría de Poincaré, 88-91
Geometría no-euclídea, 70-83
y conocimiento, 85-87, 107-109
teoría de Poincaré, 88-96, 100 y teoría especial de la relatividaár'7’8-
79, 107-108
G ibb sJ ., 176, 189, 190, 197 Gleason, A., 303
Gódel, K., 121, 122 (figura)Gravedad
y aceleración, 67, 68, 69, 98-100
V curvatura del espacio-tiempo, 70, 75-80, 78 (figura), 82-84
y entropía, 210, 211, 217-219
y hechos observables, 92-93, 95-97
y mecánica estadística, 191-192
y dilatación del tiempo, 72-73, 79-80
Véase también relatividad, teoría general de
Grecia. Véase filosofía griega clásica
Indice analítico 345
Hechos observables, 22-23, 47, 108-109,254, 331
y conocimiento, 27, 29-30, 31, 87, 88, 89-92
y estados de equilibrio, 172-174
y gravedad, 92, 95-97
y lenguaje, 99-102 teoría de Poincaré, 88-91, 93-96, 98
y Principio de incertidumbre, 21-22, 205
Véase también conocimiento; medida; tópicos específicos
Heisenberg, W„ 237, 238, 239, 249, 256, 257, 258, 285, 330. Véase también P rin c ip ió le Incertidumbre
Herepath, J., 168Hipótesis ergódica, 176-178, 177 (figura),
183-184Hipótesis Relativa a los Números de Co
lisión, 179, 191-192
Hume, David, 30, 31, 153, 159, 294 Huyghens, C., 232
Inferencia, reglas de. Véase generalización; conocimiento; metodología; hechos observables; reducción
Interacción mente-cuerpo, 270, 274, 275, 282
Interferencia, 241-249, 262, 269, 273, 275, 276, 290-291,324
Interpretación de Copenhague, 21, 251 -
255, 283, 291y argumento de inseparabilidad de
Einstein-Podolsky-Rosen, 307-308,
311,312-315 y determinismo, 297-299, 307-309,
320-321y distribuciones compuestas, 284-285
e interpretación por interacción de
Kochen, 277, 279
e interpretaciones de «muchos mundos», 280, 281
y la medición como interacción física, 271-272, 274-275, 276
Respuesta de Schródinger, 266-269
Interpretación de las «muchas mentes», 282
Intervalo temporal coordenado, 60-61
Irreversibilidad, 215-217y enfoques ergódicos, 182-185 y teorema KAM , 185, 186, 187, 198
y teoría cuántica de campos, 192-194 Véase también estados de equilibrio,
aproximación a; asimetría temporal.
Jordán, P., 238
Kant, Immanuel, 14, 30, 31, 46, 329
acerca de la causalidad, 31, 294-295 y geometrías no-euclídeas, 85-87, 88,
89, 107-108
Kepler, Johannes, 67, 68, 80
Kochen, S„ 277, 279, 283, 303 Krónig, A., 168
Krylov, N , 204, 205
Lenguaje, 100-103, 104-106
Ley Cero, 167Ley de irreversibilidad. Véase Segunda
Ley de la Termodinámica Ley de Planck, 234, 236
Ley de un gas ideal, 168-169
Ley distributiva, 286-287 Ley de Rayleigh-Jeans, 234
Ley de Wien, 233, 234 Leyes de los Grandes Números, 143,
144, 145, 183 Leibniz, Gottfried Wilhelm von, 14, 46,
125, 294, 329 y causalidad, 128, 129, 130, 131, 135,
322y espacio-tiempo, 38-42, 115-117
Lewis, D , 222, 223Lím ite de Grado de Boltzmann, 201,
202, 203
Lobachevsky, N .I., 72, 90 Locke, John, 277
Loewer, B., 282
Lógica, 14, 283-289
Lógica booleana, 286-289
Lorentz, H., 20
Loschmidt, J., 171 (figura)
346 índice analítico
Luz
naturaleza de la, 231-241, 236 (figura), 323-324
velocidad de la, 46-53, 62-63, 94, 98-99
Mach, E , 45, 118
Macroentropía, 220-222
Matemáticas, 14, 29, 30, 31, 32, 46, 238, 239, 278, 279
Maxwell, J. C„ 47, 99, 168, 169, 175, 233, 234
Mecánica cuántica, 20-21, 180-181, 329-
330Teorema de Bell, 314-322 argumento de inseparabilidad de
Einstein-Podolsky-Rosen, 307-314,
310 (figura) y asimetría temporal, 193 y causalidad, 24, 294-295, 322, 323,
330y determinismo, 124-125, 294-306,
305 (figura), 307-309, 321-324
y distribuciones compuestas, 284
e interpretación de Kochen, 277-279 y lógica, 285-286
medida, 193, 262-264 Principio de Incertidumbre, 21,205,321
Véase también teoría cuántica
Mecánica estadística, 160-164, 187-188, 191-192, 215, 329. Véase también estados de equilibrio; estados de
equilibrio, aproximación a Medida, 248-255, 260-265
Teorema de Bell, 314-323
argumento de inseparabilidad de
Einstein-Podolsky-Rosen, 307-314, 3,10 (figura)
y asimetría temporal, 192-193 como interacción física, 255-256, 271-
277, 282como interacción mente-mundo, 270-
271,274-275 y determinismo, 293, 296-299
e interferencia, 262, 268, 273-276, 277-278, 323-324
interpretación de las «muchas men
tes», 282-283
interpretación de los «muchos mundos», 279-280, 323-324
interpretación por interacción de Ko chen, 277-279, 282
interpretaciones idealistas, 267-270, 282-283
y el gato de Schródinger, 267-269
y Principio de Incertidumbre, 256-258
Véase también Interpretación de Copenhague; mecánica cuántica; teoría cuántica
Metafísica, 38, 108-110, 328-329, 331
y espacio-tiempo, 84-85, 109-138
y debate sustantivista-realista, 114-119
rechazo por Hume de,' 30, 31, 32, 33
y teoría cuántica, 277, 280-283
Metodología, 14, 15, 31, 95-97, 328, 329 Véase también críticas epistemológicas;
conocimiento
Mili, J. S„ 32Modelo deductivo-nomológico, 153-155,
157Momento, 170-172
Mónadas, 38-39Movimiento, 42, 44-52, 49 (figura). Véase
también aceleración; entradas a relatividad
Movimiento planetario, 68, 80, 87. Véase también astronomía
Newton, Isaac, 21, 66, 67, 68, 231, 329
y determinismo, 123-124, 292, 293, 294
acerca de la gravedad, 67, 77-78, 82- 83, 87, 94, 95, 97, 98
acerca del espacio, 43, 44, 45, 46, 47.53-55, 57-59, 61, 64, 115-117
debate Leibniz-, 38, 42-47
No orientabilidad, 81 (& figura)
Orden temporal, 62-63, 63 (figura)
Paradoja de los gemelos, 61, 62 (figura) Planck, M„ 234, 236
Platón, 14, 34
índice analítico 347
Podolsky, B., 308Poincaré, Henri, 88-92, 90 (figura), 216
respuestas a, 91-109
y termodinámica, 169, 170 (figura) Posiciones de sucesos-puntuales, 55-56
Positivismo, 99-105, 108-109 Posibilidad, 40, 42, 43
Postulado de aditividad, 142*143
Postulado de Caos Molecular, 179, 181-182, 191, 197
Postulado de las paralelas, 70-73
Postulado de linealidad, 94-95
Postulado de proyección, 250-251, 254, 261,264, 265, 277, 280
Prigogine, I., 206-209
Primera Ley de la Termodinámica, 164- 165
Principia (Newton), 67
Principio de equivalencia, 70
Principio de Incertidumbre, 21, 205-206, 255-260, 257 (figura), 321, 322, 323
Principio de indiferencia, 150-151, 175,195
Principio G IG O , 24 Probabilidad
Teorema de Bell, 314-323
y argumento de inseparabilidad de Einstein-Podolsky-Rosen, 310, 311-
312y estados de equilibrio, 179-180, 195-
196y explicación, 155-161, 187-188
e Interpretación de Copenhague, 251-253, 266
e interpretación de los «muchos mundos», 281-282
interpretaciones objetivistas, 144-148
interpretaciones subjetivistas, 148-152
y lógica, 283-284, 285-286
y mecánica cuántica, 180, 181, 309- 310, 311, 313-322
y medida, 260, 261-262 y Principio de Incertidumbre, 256
y reducción, 163-164
y sistemas caóticos, 216
teoría formal de, 141-144
y teoría cuántica, 241-242, 255-256, 260-261,262
y termodinámica, 169-170 Véase también estados de equilibrio;
estados de equilibrio, aproximación
a; mecánica estadística
Problema mente-cuerpo, 224-225 Probabilidad condicionada, 143-144
Problema del «agujero», 126-127 Putnam, H ., 287
Quine, W. V., 15
Red de mezcla, 212-214
Redes modulares, 287
Reducción, 160-163, 217-219
Véase también generalización
Reichenbach, H ., 212, 220, 221, 224, 285
Relacionismo, 38-43, 45-46, 114-118,123-127
Relatividad, teoría general de, 19-20, 44*46, 96-98
y debate sustantivista-relacionista, 122-127
y determinismo, 124-128
y geometrías no-euclídeas, 77-78, 87* 88, 106-107
y naturaleza del espacio, 24-25, 328- 329
orígenes de, 69-84
y simplicidad teórica, 98-100
y teoría machiana, 118-122
teoría de Gódel, 121, 122 (figura) Relatividad, teoría especial de, 17-19, 20-
21,44-46, 328-329
y causalidad, 128-130, 135 espacio-tiempo neo-newtoniano, 65-69
y geometrías no-euclídeas, 107-108
y hechos observables, 93-95 e Interpretación de Copenhague, 254
orígenes de, 47-55
y simplicidad teórica, 97-99 y tiempo, 17-19, 47-55, 62, 63 (figura),
328-329
Véase también espacio-tiempo
Revoluciones conceptuales, 18-20, 85, 235-36
Riemann, B., 72, 74, 77, 82, 84
348 índice analítico
Robb, A., 129, 130, 131, 136 Rosen, N., 308Rotación de la materia, 118-120, 121,
122 (figura)
Russel, B„ 124, 125, 295
Saccheri, G., 72Schródinger, E„ 236, 238, 239, 249, 256,
264, 285, 296
e Interpretación de Copenhague, 266,267, 268 (figura), 271-272
Segunda Ley de la Termodinámica, 164- 166, 179-181, 192, 205, 211-212, 214
Ser. Véase metafísica
Simplicidad teórica, 97-100, 101-103
Simultaneidad, 51-54, 53 (figura), 57-59, 66
y causalidad, 127, 128, 129 y hechos observables, 93. 94, 95
y metafísica, 111, 112, 113, 114
Singularidades, 125-126 Sistemas de Bernoulli, 198
Sistemas caóticos, 215-216
Sistemas K , 198, 199, 207 Specker, E ., 303
Sueños, 37Superficies de Cauchy, 293 £Sustantivismo, 24, 46-47, 114-118, 123-
127
Taquiones, 64-65
Temporalidad. Véase tiempo Tensor de energía-momento, 78-79 Teorema de Bell, 314-322 Teorema ergódico, 183-187, 184 (figura)
Teorema de Kolmogorov-Arnold-Mo- ser (KAM), 186 (figura), 185-189, 198
Teorema de Recurrencia, 201-203
Teorema KAM . Véase Teorema de Kol- mogorov-Arnold-Moser (KAM)
Teoría cinética del calor, 168-175, 170 (figura), 171 (figura), 172 (figura)
Teoría cuántica, 18-19, 289-292Interpretación de Copenhague, 251-
255,266-271
base experimental de, 231-241, 236
(figura)y conocimiento, 261-262, 270
y determinismo, 294-295
e interferencia, 242-249, 244 (figura), 245 (figura), 324
y lógica, 283-289
medida, 249-255, 260-283
y metafísica, 277, 279-282
Principio de Incertidumbre, 255-260, 257 (figura)
y probabilidad, 240-242, 247
Véase también teoría de campos cuántica; mecánica cuántica
Teoría cuántica de campos, 193-194 Teoría de partículas. Véase teoría cuán
ticaTeoría del big bang, 16, 17, 82, 125, 143,
214, 333 Teoría del big crunch, 211
Teoría de campos, 21, 122-124
Teoría del éter, 59, 97-98, 232-233
Teoría especial de la relatividad. Véase relatividad, teoría especial de
Teoría general de la relatividad. Véase relatividad, teoría general de
Teoría ondulatoria. Véase teoría cuántica
Términos. Véase lenguaje
Termodinámica, 160, 162-163, 164-167, 180-181
y asimetría causal, 223-225
incertidumbre en, 205-206
teoría cinética del calor, 167-175, 170 (figura), 171 (figura), 172 (figura)
Véase también estados de equilibrio, aproximación a; asimetría temporal
Tercera Ley de la Termodinámica, 167- 168
Tiempo, 23-24, 34, 35, 36, 44, 45, 46,183, 185
dilatación de, 50, 51, 59, 60, 61, 62 (figura), 70, 80-81
dirección de, 174-175, 213-214, 216- 227
espacio-tiempo neo-newtoniano, 65-67
y gravedad, 68-70, 71 (figura) y mecánica cuántica, 180-181
y metafísica, 110-112
Indice analítico 349
no orientabilidad, 81-82
teoría de Aristóteles, 36, 37, 38 teoría de Leibniz, 39-42
y teoría especial de la relatividad, 17- 18, 44-55, 62-64, 63 (figura), 328
Véase también irreversibilidad; espacio-
tiempo; asimetría temporal Timeo (Platón), 34
Transformaciones de Lorentz, 55
Universos de Robertson-Walker, 82
Universos vacíos, 118-122
y Teorema de Bell, 314, 318, 320, 321,
322teoría de von Neumann, 299, 300,
302Velocidad de la luz. Véase luz
Von Mises, L ., 147Von Neumann, J., 249, 250, 256, 285,
299, 300, 302
Waterston, J., 168
Wheeler, ]., 245, 280, 281
Wigner, E , 269, 270
Variables ocultas, 295-305, 305 (figura) Zenón de Elea, 36