50

LAntimatiere.pdf

Embed Size (px)

Citation preview

L’antimatière Didier Lauwaert. Copyright © 2013. I. Introduction II. La relativité Repères ; La relativité restreinte ; Relation entre masse et énergie ; Energie cinétique ; Autre formule ; Les photons ; Energie négative

III. La mécanique quantique Mécanique quantique ondulatoire ; Principe d’indétermination ; Description par les états ; Evolution et mesure

III.1. Mécanique quantique relativiste Recherche d’une formulation relativiste ; Défauts de la formulation ; Théorie de Dirac ; Avantages et défauts ; Effet tunnel ; La barrière ; Des états d’énergie négative inévitables ; Stabilité

III.2. La mer de Dirac Principe d’exclusion ; La mer de Dirac ; Excitations d’un état d’énergie négative ; Comportement du trou ; Annihilation ; Le positron ; Difficultés

III.3. Théorie quantique des champs L’oscillateur harmonique ; Champs libres ; Espace de Fock ; Champs en interaction ; Etats d’énergie négative

IV. Symétries discrètes Les symétries en physique ; Les symétries discrètes ; Symétrie P ; Symétrie C ; Symétrie T

IV.1. Antimatière Combinaisons de symétrie ; Symétrie CPT ; Antimatière ; Antiatomes

IV.2. Interactions Création ; Annihilation ; Positronium ; Source d’énergie ; Stockage

IV.3. Violation des symétries IV.3.1. Violation C et P Les neutrinos ; Hélicité ; Violation P ; Violation C ; Conservation CP

V.3.2. Violation CP Les particules élémentaires ; Exemples d’interactions entre particules ; Violation de la symétrie CP ; Deux mésons neutres ; Superposition d’états ; Observations expérimentales ; Oscillations ; Asymétrie matière – antimatière

V. L’antimatière dans l’univers Observation de l’univers ; Les rayons cosmiques ; Rayonnement caractéristique ; Des zones sans contacts ; La naissance de l’univers

V.1. Les conditions Sakharov Les conditions de Sakharov ; Matière favorisée ; Déséquilibre thermique ; Violation du nombre de baryon

V.2. Antigravité Attraction universelle ; Formulation gravitationnelle de l’antimatière ; Univers jumeaux ; Données expérimentales ; Vérification directe

VI. Références

I. Introduction L’antimatière est quelque chose d’omniprésent en science-fiction ou elle a été mise à toutes les sauces, souvent avec de nombreuses erreurs à la clef. En réalité, les particules d’antimatière sont des particules comme les autres. Elles ont simplement des charges (électriques ou autres) opposées aux particules. Vu de cette manière, l’antimatière semble quelque chose de simple et sans mystère. En réalité, c’est tout de même un peu plus subtil et il subsiste des inconnues. Nous allons donc creuser le sujet dans cette petite étude, en commençant par deux sujets nécessaires : une introduction à la relativité et à la mécanique quantique.

II. La relativité

Repères Pour pouvoir faire des mesures, des expériences, des études de phénomènes physiques, il est nécessaire de donner de valeurs numériques précises aux positions et aux instants auxquels se produisent les phénomènes. Cela se fait en utilisant des repères précis par rapport auquel on détermine la position des objets. Un exemple bien connu est le système des latitudes et longitudes qui repèrent les lieux par rapport à la Terre. En plus de repérer les positions, on détermine les instants à l’aide d’horloges. Considérons deux observateurs A et B, chacun équipés de son horloge. Par facilité, nous

considérerons la situation suivante.

L’observateur A est situé au point O, il utilise trois directions (x, y et z non représenté) pour identifier

la position de chaque objet ou événement auquel il attribue ainsi trois coordonnées x, y et z. Il a aussi

une horloge indiquant le temps t. Ce système de repérage constitue son repère (K) par rapport

auquel il peut donner des coordonnées (position et instant) précis à chaque événement. Nous avons

l’habitude de tels repères quand on dit « la colline est à trois kilomètres de ma maison » ou « l’île se

situe à 45° de longitude ouest avec le méridien de Greenwich », anciennement on utilisait le

méridien de Paris).

De même, l’observateur B est situé au point O’ et utilise les trois directions (axes) x’, y’, et z’ et il

dispose d’une horloge indiquant le temps t’. Le repère sera noté K’. Les axes sont disposés comme

sur la figure.

L’observateur B est en mouvement par rapport à A à la vitesse V, qui est aussi la vitesse de O’ par

rapport à O (ou de O par rapport à O’ avec renversement du sens de la vitesse) ou la vitesse de K’ par

rapport à K. Lorsque les points O et O’ coïncident, on choisit les coordonnées du temps telles qu’à cet

instant t = t’ = 0 (c’est juste une question de facilité).

Par exemple, A pourrait être immobile sur le quai d’une gare et B pourrait être dans un train où il

effectue toutes ses mesures par rapport à sa propre position.

Seule les variables x, t et x’, t’ seront utilisées ci-dessous.

La relativité restreinte La relativité utilise deux postulats :

Principe de relativité restreinte : tous les repères inertiels sont équivalents. Un repère inertiel est un repère en mouvement à vitesse constante où l’on ne ressent aucune accélération et où les lois classiques de la mécanique (les lois de Newton) sont valides. Ce principe signifie que les lois physiques décrivant les phénomènes doivent garder la même forme quel que soit le repère utilisé pour les formuler. Cela ne signifie évidemment pas que ces repères sont identiques et que tout ce qui s’y passe aussi. Par exemple, notre observateur A sur voit le train en mouvement tandis que B considère que le train ne bouge pas par rapport à lui. Ce principe est en fait assez naturel. Il est difficile d’imaginer un repère absolu, spécial, par rapport auquel repérer les événements. Par exemple, on pourrait dire que A a un « meilleur » repère que B car il est immobile tandis que B est dans un train. Mais le repère de A est-il si bon ? Après tout la Terre n’est pas immobile, elle tourne autour du Soleil. Et l’ensemble Terre – Soleil tourne autour de la Galaxie. En réalité, il n’y a pas de repère absolu. Il n’y a que des choix arbitraires, humains. C’est nous qui choisissons de déterminer les positions par rapport à tel ou tel repère. Ce choix n’influence évidemment pas la manière dont les phénomènes physiques se produisent (un passager sur le quai laisse tomber son billet : ce phénomène se produit autant du point de vue de A que de B). Ce choix n’influence que la manière de décrire le phénomène. On souhaite donc que cette description soit la plus universelle possible et ne dépende pas du repère. Le choix des repères inertiels est un choix restreint, d’où le nom de relativité restreinte. On généralisera plus tard.

La vitesse de la lumière dans le vide, c, est constante et invariante. Cela signifie que cette vitesse ne varie pas au cours du temps et qu’elle est identique pour tout observateur. Cette vitesse a été mesurée dans de nombreuses circonstances et à l’aide de nombreux moyens. Ce postulat est vérifié expérimentalement avec une précision extrêmement grande (à tel point qu’on se sert maintenant de la vitesse de la lumière pour définir le mètre étalon pour la mesure des longueurs). La vitesse de la lumière ne dépend pas du mouvement de l’émetteur ni du récepteur. En physique classique, cela peut sembler étrange. En effet, si l’observateur B émet un rayon lumineux vers l’avant du train et que ce rayon se déplace à la vitesse c par rapport à lui, on s‘attend à ce que la vitesse du rayon lumineux mesurée par A soit V + c. Ce n’est pas ce qui est expérimentalement constaté. De toute évidence, la simple addition des vitesses ne marche pas lorsque l’on envisage des vitesses très élevées comme celle de la lumière. Comme la vitesse n’est rien d’autre qu’une certaine distance parcourue en un certain temps, cela signifie qu’il doit y avoir des changements dans les concepts d’espace et de temps. Ces changements ne nous concernent qu’indirectement, puisque nous nous intéressons qu’à l’énergie.

La mesure de l’espace peut se faire en utilisant des règles étalons disposées de la manière indiquée pour les repères ci-dessus. La mesure du temps peut se faire en utilisant des horloges. Il reste un détail important à régler. Comme on a deux observateurs, on a deux horloges. Comment

les synchroniser ? En fait, comme les observateurs vont noter des phénomènes se produisant à

différents endroits, il faut aussi se poser la question : comment mesurer le temps à un endroit

différent de O ou O’ ?

Pour cette deuxième question on peut, au moins par la pensée, disposer des horloges un peu partout

de façon à en avoir une à chaque endroit où l’on désire mesurer le temps. Il reste donc la question de

synchronisation des horloges. Voici une procédure possible (procédure d’Einstein, plusieurs

procédures sont possibles et elles sont équivalentes au prix, éventuellement, d’une redéfinition des

coordonnées).

Pour A, on dispose un ensemble d’horloges immobiles par rapport à A. C’est-à-dire que les

coordonnées x, y, z de chaque horloge ne varient pas au cours du temps. Ainsi, la distance

entre O et chaque horloge peut être mesurée en utilisant le repère et cette valeur ne change

pas.

A synchronise alors toutes ses horloges avec l’horloge H située en O. Pour ce faire, il envoie

des signaux entre les horloges en tenant compte du temps de propagation du signal entre

chaque horloge. S’il utilise la lumière, connaissant la distance entre les horloges et

connaissant la vitesse de la lumière, le temps de propagation est facile à calculer. Ainsi,

l’ensemble des horloges mesurera un temps t concordant dans l’ensemble du repère K.

B peut faire de même avec des horloges immobiles par rapport à O’ (donc différentes de

celles utilisées par A même si d’aventure elles peuvent se croiser) et il les synchronise par

rapport à son horloge H’ située en O’.

Pour pouvoir comparer les mesures effectuées par A et B, il reste à synchroniser les horloges

H et H’. La définition des repères ci-dessus en donne la clef. Au moment où O et O’ se

croisent, les horloges H et H’ sont situées au même endroit. On peut aisément les

synchroniser en réglant t = t’ = 0, puis A et B synchronisent les autres horloges comme

expliqué ci-dessus.

Avec les conventions précédentes, la théorie de la relativité restreinte donne les règles permettant de relier les variables x, t et les variables

x’, t’ pour un événement donné E mesuré à la fois par A et B. La relation entre les variables est donnée par les transformations de Lorentz :

( )

(

)

Le facteur gamma vaut :

Sans entrer dans les détails techniques, notons deux choses importantes :

Il entre dans les différentes relations en relativité, un facteur, appelé « facteur gamma » ( )

qui est environ égal à un pour des vitesses V faibles et qui diverge lorsque V tend vers c. La

valeur de gamma ne diffère de un que pour des valeurs notables de V par rapport à la vitesse

de la lumière. Ainsi, même à 100000 km/s, gamma vaut seulement 1.06.

En général, pour un événement donné E, on aura , même si l’on a synchronisé les

horloges.

Relation entre masse et énergie La relativité montre qu’il existe une relation entre l’énergie et la masse des objets. Pour un objet au repos, c’est-à-dire immobile dans le repère considéré, on a :

Formule célèbre s’il en est. Pour un objet en mouvement, avec un facteur gamma donné, on a : Cette énergie croît donc très vite. En fait, même pour un objet au repos, l’énergie propre donnée ci-dessus est très élevée, à cause du facteur (carré de la vitesse de la lumière, en mètres par seconde, il vaut 90000000000000000). Ainsi, l’énergie d’un électron au repos est de 512000 électronvolts, à comparer aux 13.6 de l’ionisation de l’hydrogène.

Energie cinétique La formule pour l’énergie d’un objet en mouvement peut s’écrire autrement. En exprimant gamma en fonction de la vitesse, on peut réécrire la formule comme une somme :

Les petits points représentant des termes de très petite valeur. On voit que l’énergie est donnée par l’énergie propre, plus l’énergie cinétique classique, plus une correction due à la relativité. Cette correction est très faible. Par exemple, pour un objet se déplaçant à 1000 kilomètres par heure, vaut seulement (avec des vitesses exprimées en mètres par seconde) 0.00000007.

Si on a une énergie potentielle, par exemple une liaison chimique ou autre, il faut bien entendu ajouter le terme correspondant U.

Autre formule L’énergie peut aussi être mise sous une autre forme. L’impulsion classique d’une particule vaut . Mais en relativité, on obtient . Un peu de travail donne alors la relation très utile : Pour une particule au repos (p = 0) on retrouve l’énergie propre habituelle.

Les photons La lumière, composée de grains de lumière appelés photons, est assez particulière puisque elle se déplace toujours à la vitesse c, du moins dans le vide. Cela veut dire qu’il n’y a pas de sens à parler de photon au repos. De plus, l’expérience montre que la lumière n’a pas de masse. On peut d’ailleurs aussi le voir avec la formule donnant l’énergie d’un objet en mouvement. Pour la vitesse de la lumière, le facteur gamma devient infini et si la masse était non nulle, l’énergie de la lumière serait infinie. Avec m= 0, la formule devient « zéro fois l’infini », ce qui est indéterminé. La formule perd son utilité. Par contre, la dernière formule donné ci-dessus reste valide. Pour m = 0, on obtient : En fait, cette formule sert surtout à donner l’impulsion du photon. L’énergie doit être donnée autrement et la mécanique quantique montre que l’énergie d’un photon est donnée par où h est la constante de Planck et (nu) est la fréquence de l’onde électromagnétique.

Energie négative La formule est en fait celle qui se déduit directement en relativité à partir des postulats. Et pour un objet au repos, il y a deux solutions : et . Une solution d’énergie négative peut sembler étrange. Les énergies négatives sont légions en physique. Ce que l’on observe ce n’est jamais l’énergie de quelque chose mais seulement les variations d’énergie, qui se mesure à travers les échanges d’énergies entre divers systèmes (par exemple la chaleur fournie par un radiateur ou l’énergie fournie à un corps pour le mettre en mouvement). Par conséquent, on peut choisir un état particulier, arbitraire, et lui affecter la valeur E = 0, tout comme le choix de la glace fondante pour la température 0° est arbitraire. Suivant le choix, les autres états du système peuvent avoir une énergie négative. Toutefois, pour un système relativiste, il y a une échelle d’énergie non arbitraire imposée par et les variations autour de cette énergie au repos. On peut se poser la question de la validité de l’autre borne . Plusieurs constat peuvent alors être fait :

Pour un objet en mouvement, la relation précédente donne deux solutions :

c’est-à-dire l’énergie au repos plus l’énergie cinétique due au mouvement. Et : C’est-à-dire que l’énergie de l’objet diminue lorsqu’il est mis en mouvement.

Du fait de la conservation de l’énergie, un tel objet fournirait de l’énergie en se mettant en mouvement. Le mouvement perpétuel n’est plus très loin ! Inutile de dire que cela n’est jamais observé : il faut fournir de l’énergie pour mettre un objet en mouvement et pas l’inverse. D’ailleurs, l’énergie fournie, le travail comme on l’appelle aussi, est donné par la force appliquée à l’objet fois la distance parcourue en appliquant cette force. Cette grandeur est donc positive et jamais négative. La valeur est négative s’il faut freiner un objet. Cela voudrait dire qu’un tel objet d’énergie au repos négative aurait tendance à se mettre en mouvement tout seul et qu’il faudrait appliquer une force pour le retenir.

L’énergie étant conservée, l’énergie d’un système formé de parties indépendantes est donnée par la somme des énergies de chaque partie et si toutes ces quantités sont positives, en enlevant une partie il reste encore une quantité positive (plus petite).

L’énergie peut varier continument, par exemple par émission d’un rayonnement ou en freinant. Mais arrivé à il y a une barrière. Pour passer à il faut franchir un « gap » de d’un seul coup, aucune variation continue n’est possible.

Ces diverses raisons font considérer, en physique classique, la solution comme un artefact mathématique sans signification physique. On ne garde que la moitié des solutions correspondant à ce qui est observé dans la nature. On peut donc ignore ce « monde d’énergie négative » … pour le moment !

III. La mécanique quantique La mécanique quantique est la théorie qui s’applique aux atomes et aux particules élémentaires. En

toute rigueur, elle s’applique à toutes les situations, y compris par exemple le lancer d’une balle de

golf. Mais les corrections infimes apportées par la mécanique quantique à ce genre de cas et la

difficulté des équations rendent inutile son usage et l’on préfère alors utiliser les théories

« classiques » (mécanique classique, hydrodynamique, etc.) Elle est malgré tout utilisée dans certains

cas complexes tel que la chimie ou des objets macroscopiques (superfluides, supraconducteurs,

ferromagnétisme, …) à l’aide de la physique statistique ou d’outils mathématiques particuliers.

La mécanique quantique est une théorie très puissante. C’est la théorie la mieux vérifiée de toutes

les théories, dans tous les domaines (sauf la gravité) et toutes les expériences, avec une précision

exceptionnelle. Elle explique nombre de phénomènes : les atomes, le magnétisme, la chimie, le laser,

etc. La liste est longue.

On ne va pas tout présenter en détail, loin de là. On va expliquer un minimum pour comprendre

l’essentiel des bases (ce sera déjà assez costaud comme ça). De même, on ne verra pas toutes les

subtilités, propriétés, mystères et aspects parfois intriguant. C’est intéressant mais trop vaste pour

cette petite étude sur l’antimatière.

Rappelons brièvement les bases mathématiques de la mécanique quantique.

Un système a un état décrit par un vecteur dans un espace de Hilbert H complexe, il sera noté typiquement comme .

Les variables physiques sont des opérateurs agissant sur les vecteurs d’état.

Les variables mesurables (les observables) sont des opérateurs hermitiques, c’est-à-dire tel que .

Les valeurs prises par les variables sont le spectre des valeurs propres de l’opérateur (ces valeurs sont réelles pour les observables). Les

seules valeurs mesurables sont ces valeurs.

L’espace de Hilbert étant un espace vectoriel, on peut définir différentes bases, totalement équivalentes. Par exemple les bases (ou bases

d’un sous-espace) positions, impulsions, spins, énergie, etc.

Le passage d’une base à l’autre s’effectue par une transformation unitaire U (avec ).

Le commutateur de deux opérateurs est : [ ] .

Pour la quantification, on part de l’hamiltonien classique (au moins quand il existe) et on obtient l’hamiltonien quantique après

symétrisation (du type ab+ba) et remplacement des variables par des opérateurs. On impose entre valeurs conjuguées la relation

[ ] où est la constante de Planck divisée par .C’est suffisant pour résoudre tout problème typique.

L’évolution dans le temps peut adopter plusieurs point de vue : ce sont les états qui varient (Schrödinger), ou les observables (Heisenberg)

ou des cas mixtes (représentation interaction). On passe de l’un à l’autre par une transformation unitaire (qui ne correspond pas à un

changement de base). Par exemple, dans le point de vue de Heisenberg, l’équation d’évolution d’un opérateur O est donné par :

[ ]

Qui a l’avantage de mettre clairement en évidence les grandeurs constantes et le rapport à la physique classique (équation d’évolution dans

l’espace des phases utilisant les crochets de Poisson).

Dans le point de vue de Schrödinger, on a :

On travaille souvent dans la base position, dans ce cas les composantes d’un état s’obtiennent par le produit scalaire (complexe) ⟨ ⟩ où

est la base position. On peut écrire ce produit scalaire comme une fonction de la position : ( ) appelé fonction d’onde. Pour

une particule de masse m soumise à un potentiel V, l’équation de Schrödinger prend la forme :

Elle peut être utilisée, par exemple, pour calculer les fonctions d’ondes et les niveaux d’énergie (valeurs propres de l’hamiltonien) d’un

électron dans le potentiel coulombien d’un noyau (cas typique de l’hydrogène).

Mécanique quantique ondulatoire Une représentation typique des particules quantiques (électrons, photons,…) est sous forme d’ondes

(phénomène étendu et variant dans l’espace et le temps, comme une vague ou une corde qui

ondule). Cela peut sembler étrange aux néophytes, qui auraient tendance à voir un électron comme

une petite bille, mais la représentation sous forme d’ondes est bien plus proche de la réalité.

Comme exemple, citons juste l’expérience de Young :

Dans cette expérience, on envoie des vagues à travers deux ouvertures. Lorsque le creux d’une vague

passant par une ouverture rencontre la basse d’une vague passant par l’autre ouverture, on obtient

ce qu’on appelle une interférence : le niveau de l’eau s’égalise. On observe ainsi une figure

d’interférences typique qui peut servir, par exemple, à calculer la longueur d’onde (la distance entre

deux bosses de l’onde).

Cette expérience peut être réalisée avec de la lumière (ayant une longueur d’onde bien précise, avec

un laser), le résultat est semblable. Cela montre le caractère ondulatoire indubitable des ondes

électromagnétiques.

Mais l’expérience peut aussi être réalisée avec des électrons.

Une figure d’interférences est aussi observée. Cela montre que les électrons ont un caractère

ondulatoire.

Il y a tout de même une différence typique par rapport aux vagues. Les impacts sur la cible sont

ponctuels. Les électrons se comportent aussi, tout au moins lors de l’interaction avec la cible, comme

de petits corpuscules. Mais cela ne concerne que l’interaction, pour l’essentiel l’électron se

comportant bien comme une onde.

Notons que ces impacts ponctuels s’observent aussi avec la lumière si on utilise une lumière

suffisamment faible pour avoir un photon à la fois.

L’expérience montre aussi qu’il y a une correspondance univoque entre l’énergie de la particule et sa

fréquence : où est la fréquence et h la constante de Planck. C’est Planck avec l’émission du

corps noir puis Einstein avec l’effet photoélectrique (électrons arrachés d’un métal par de la lumière

ultraviolette) qui ont découvert cette relation avec la lumière, montrant son caractère corpusculaire

(petits paquets d’ondes d’énergie bien définie).

Il existe aussi une relation univoque entre la longueur d’onde et l’impulsion de la particule (pour une

particule massive comme l’électron, c’est la masse fois la vitesse). C’est Louis de Broglie qui a

découvert cette relation.

Notons que ces relations ainsi que le caractère ondulatoire des électrons sont utilisés couramment

dans divers dispositifs comme, par exemple, les microscopes électroniques.

Principe d’indétermination L’onde correspondant à l’électron est généralement appelée fonction d’onde. Une représentation

d’un électron localisé dans une petite région de l’espace peut être le paquet d’ondes :

La particule (le paquet d’ondes) a une certaine largeur que l’on peut noter qui représente aussi

une certaine incertitude sur la position de la particule puisque cette position n’est pas tout à fait

précise.

De plus, il ne s’agit pas d’une onde sinusoïdale (une onde de forme précise dans la grandeur des

bosses reste constante dans l’espace et le temps, avec une longueur d’onde précise et une fréquence

de vibration précise). Les lois mathématiques sur les ondes montrent que la longueur d’onde a aussi

une certaine incertitude . Les deux étant lié par :

Et ce quel que soit la forme du paquet d’ondes.

Puisque l’on peut relier la longueur d’onde à l’impulsion, la masse fois la vitesse, on trouve :

Où h est la constante de Planck.

On voit que la position et la vitesse ne peuvent pas être infiniment précis simultanément. Il y a

forcément une certaine incertitude. Notons aussi que cette incertitude minimale est fort petite car la

constante de Planck est minuscule. Ce n’est que pour des objets ayant une masse m très petite que

cette incertitude devient appréciable (des électrons, par exemple).

Cette relation est appelée relation d’indétermination de Heisenberg. On peut la vérifier

expérimentalement de toutes sortes de manière. Elle est parfois vue comme un effet de la mesure,

les particules quantiques étant tellement légère que la moindre perturbation modifie leur position et

leur vitesse. Il est vrai que des expériences de pensée impliquant toutes sortes de dispositifs

ingénieux et tenant compte de ces perturbations conduisent à ces relations. Mais en réalité cette

indétermination est plus fondamentale qu’une simple incertitude de mesure et est liée à la nature

ondulatoire des particules.

Ce phénomène a fait couler beaucoup d’encre et il a même semblé insupportable à certains (dont

Einstein) au début de la mécanique quantique, et même encore maintenant pour quelques

irréductibles. Les débats sur ce « principe d’incertitude » sont souvent interminables. Pourtant, vu

sous l’angle ondulatoire, il n’est pas si mystérieux.

On peut montrer qu’il existe d’autres principes d’indétermination. L’un fort important est le suivant. Considérons un processus changeant d’énergie, E, en un temps t. Il y a là aussi une certaine incertitude sur les valeurs que l’on notre et . Alors on doit avoir :

Cette relation peut aussi se démontrer avec les propriétés ondulatoires du paquet d’ondes, avec le rapport entre fréquence de l’onde et durée du paquet. Attention, cela ne signifie pas que l’énergie devient imprécise. Elle est simplement comme les autres

grandeurs en mécanique quantique.

Description par les états L’explication ondulatoire a toutefois ses limites car les particules quantiques ne sont pas des ondes

classiques. Plusieurs aspects les en distinguent. Citons les deux principaux :

On l’a vu plus haut, les interactions entre particules (électrons et cibles ci-dessus) sont

ponctuelles. Ce n’est pas du tout comme ça que réagissent des ondes classiques comme les

vagues ou le son où l’effet de l’onde est répartit tout le long du front d’onde (par exemple la

trace mouillée très étendue d’une vague sur le sable).

Lorsque l’on a deux particules, la théorie nécessite de les décrire comme un tout. Il faut donc

une onde décrite par sept paramètres : six variables positions (trois par particules) plus le

temps. Alors qu’une onde classique a une valeur qui ne dépend que de quatre paramètres

(trois de position et une de temps). En règle générale, il n’est pas possible de décomposer

l’onde quantique totale en une somme ou un produit ou une quelconque relation

mathématique générale de deux ondes classiques.

Il est donc utile d’introduire un autre formalisme. Nous allons le présenter ici mais sans entrer dans

les aspects mathématiques qui ne seront pas nécessaires. Ce formalisme a l’avantage aussi d’être

fort parlant et intuitif. Il nous sera fort utile pour parler du spin.

Considérons un système physique quelconque : une particule, un atome, un caillou, … Celui-ci peut

être dans différents états que l’on peut caractériser par un certain nombre de variables tel que

position, vitesse, etc. Nous représenterons l’ensemble de ces variables par α. L’état physique du

système s’écrit symboliquement : appelé un ket. Peu importe sa signification mathématique,

c’est avant tout une représentation simple et commode.

Parfois, seules certaines variables nous intéressent. Par exemple, si la particule est à la position x, on

écrira son état , en ignorant volontairement le détail des autres variables comme la vitesse, par

exemple.

Une particularité de ces états est qu’ils sont soumis au principe de superposition. Par exemple, si

l’état est une solution possible pour l’état d’un système dans une situation donnée, et si

est une autre possibilité, alors la somme est aussi une solution possible.

Comment interpréter cette solution ? Prenons un exemple. Soit une particule qui peut se trouver en

ou bien en , alors elle peut être dans les états ou indiquant que la particule est à la

position précise concernée. Mais l’état est aussi une possibilité. Cet état signifie que la

particule peut être aussi bien en qu’en . Cela ne signifie pas que sa position est précise mais

inconnue. C’est plutôt comme si la particule était aux deux endroits en même temps !

Ce caractère ubiquitaire des particules peut sembler extrêmement étrange. Il l’est beaucoup moins

après ce que nous avons vu ci-dessus. Nous savons que la position peut être imprécise et qu’il s’agit

d’une caractéristique fondamentale de la particule. Si on la représente comme une onde, on aurait

une représentation pour cet état comme suit :

Notons que les ondes aussi sont soumises au principe de superposition. Quand deux ondes sont deux

solutions possibles d’une équation des ondes, leur somme est aussi une solution possible.

Supposons que l’on ait une particule dans l’état , on aimerait savoir si dans cet état on peut la

trouver à la position x ou bien si on peut la trouver avec une vitesse v. On écrira ça comme, par

exemple :

⟨ ⟩

Peu importe sa signification mathématique. On peut le traduire par « c’est la possibilité que la

particule dans l’état soit aussi dans l’état », c’est-à-dire que la particule avec les propriétés

α soit à la position x. On traduit cela par le terme amplitude, c’est l’amplitude que la particule soit

dans l’état demandé.

L’ensemble de tous les états possibles forme un espace mathématique aux propriétés assez simples.

Il permet en particulier de choisir des bases d’états qui d’une certaine manière couvrent toutes les

possibilités.

Un exemple est la base position : c’est l’ensemble des états pour toutes les positions x

possibles.

Notons que, puisque ces états décrivent des situations de « position x précise », alors :

⟨ ⟩

La particule ayant une position x précise est évidemment trouvée en x.

Et :

⟨ ⟩

(pour des positions différentes)

La particule ayant une position x précise ne sera évidemment pas à un autre endroit.

Revenons à notre particule décrite par . On aura, pour toute position x, une

valeur ⟨ ⟩ sauf dans deux cas :

⟨ ⟩ ⟨ ⟩ ⟨ ⟩

Et

⟨ ⟩

C’est-à-dire que la particule a autant de chance d’être dans une des deux positions. En fait, pour être

exact on devrait écrire 1/2 (une chance sur deux) mais nous ferons le lien avec les probabilités plus

bas. D’ailleurs mathématiquement on n’a ni 1 ni 1/2, mais peu importe. Ce qui compte ici c’est que

les deux positions donnent des résultats identiques.

Tout état peut se décrire comme une superposition des états de base :

En disant qu’elle peut être en x, en y, en z, etc… C’est dans ce sens que la base couvre toute les

possibilités.

Notons que cette gymnastique n’est pas inutile. Il est plus facile de travailler uniquement avec les

états de base, bien définis et peu nombreux, que sur l’infinie possibilité de tous les états possibles.

Il est également possible de choisir d’autres bases, par exemple la base des vitesses précises .

Toutes les bases sont équivalentes d’un point de vue mathématique. On passe aisément de l’une à

l’autre par des opérations mathématiques élémentaires. On peut choisir toute base qui s’avère

pratique pour les raisonnements. Notons juste que ⟨ ⟩ ne peut pas être non nul pour une seule

position précise, à cause du principe d’indétermination.

Pour terminer cette petite excursion élémentaire dans les notations et leur usage, notons que l’on

notre traditionnellement :

( ) ⟨ ⟩

Qui est juste une autre notation. On l’appelle fonction d’onde, un terme que vous avez sûrement

déjà entendu.

On peut aussi montrer qu’il y a une équivalence mathématique totale entre la représentation sous

forme de ket (aussi appelés vecteurs d’état) et la représentation ondulatoire (non classique) avec la

fonction d’onde.

Pour les explications, les deux sont parfois utiles. On peut aisément passer de l’une à l’autre.

Mais attention en raisonnant, car sans connaitre le formalisme mathématique rigoureux caché

derrière il peut être impossible de voir pourquoi tel ou tel raisonnement est correct et tel autre

complètement erroné. Une connaissance vulgarisée permet de comprendre certain aspects mais

n’offre pas la moindre aide pour bâtir ses propres raisonnements, ce n’est qu’une traduction

grossière d’un raisonnement mathématique rigoureux. C’est une faute très fréquente chez le

néophyte qui, en plus, n’est même pas armé pour découvrir par lui-même qu’il commet une telle

faute. Vous voilà prévenu, aussi décevant que cela puisse être. Aller au-delà d’une simple

compréhension « superficielle » nécessite un travail certain impliquant d’absorber des connaissances

mathématiques.

Revenons au cas de l’énergie. Pour un système S quelconque, il y a une série d’états correspondant à

des énergies précises : , , etc. Formant là aussi une base (la base énergie). Et un état

quelconque peut être dans une superposition quantique d’états d’énergie différente.

Selon les systèmes, on peut avoir une série d’énergies bien séparées (spectre discret), toutes les

valeurs possibles (spectre continu) ou une partie des valeurs discrètes et une partie continue.

Ces états d’énergie bien définie ont une particularité : ils sont « stables » c’est-à-dire qu’ils ne varient

pas au cours du temps (en dehors de l’oscillation de l’onde). Ils sont donc aussi « éternels » (ce qui en

pratique n’arrive jamais vraiment, mais un état peut être de durée très longue).

Pour un état de courte durée, on a forcément une superposition d’états d’énergie différente. C’est

de là que vient le principe d’indétermination de l’énergie.

Evolution et mesure On peut écrire une équation d’évolution pour la particule qui n’est autre qu’une équation d’ondes

(comme l’équation décrivant l’évolution d’une vague, l’équation décrivant une onde sonore, etc.).

Quoi d’étonnant ? Ecrivons là sous une forme simplifiée :

Ici représente la variation de l’état au cours du temps. H est appelé hamiltonien du système. Il

contient sa description physique permettant de calculer son évolution et il a même un lien important

avec l’énergie.

La seule chose qui nous importe ici est que cette équation est linéaire (on dit même unitaire qui a

une signification plus forte mais dont nous n’avons pas vraiment besoin ici). Cela signifie qu’elle

respecte le principe de superposition. Si on a une autre solution de la même équation :

Alors on a aussi :

( ) ( )

Cette propriété que l’on prouve mathématiquement (ce qui est élémentaire) est à mettre en

parallèle avec ce que nous avons dit sur le principe de superposition.

Supposons que notre particule soit dans l’état avec diverses possibilités pour sa position : x, y,

z,… Que se passe-t-il si on mesure sa position ? Dans ce cas, le postulat de probabilité de Born dit

que l’on aura une certaine probabilité de la trouver en x, en y ou en z. Cette probabilité est reliée à

l’amplitude (peu importe comment, le lien n’est pas trivial, ce qui compte c’est que si l’amplitude est

grande, la probabilité aussi).

De plus, la somme des probabilités pour toutes les possibilités doit être égale à un (cent pour cent de

chance de la trouver quelque part). Par exemple, avec notre particule à deux endroits, on aura une

chance sur deux (1/2) de la trouver en l’une ou l’autre position. D’autres valeurs sont évidemment

possibles, par exemple 1/4 et 3/4.

Supposons maintenant que je mesure la position de la particule dans l’état et que je la trouve à

la position x. Dans ce cas, nous savons maintenant avec certitude qu’elle est en x : c’est là que nous

l’avons trouvé. Son état peut donc être décrit par . On dit que l’état de la particule s’est réduit à

un état plus précis (pour la variable concernée). On parle de réduction du vecteur d’état ou de

réduction de la fonction d’onde. C’est le postulat de réduction.

Bien qu’il semble que nous ayons déduit clairement ce résultat, il s’agit en fait bien d’une hypothèse supplémentaire. Après tout, le fait de savoir que la position est x n’exclut nullement d’autres possibilités.

III.1. Mécanique quantique relativiste

Recherche d’une formulation relativiste Le défaut de la mécanique quantique telle qu’elle a été présentée est qu’elle est non relativiste. La relativité ne remet pas en cause ses fondations, mais seulement l’équation d’évolution qui n’obéit pas aux lois de la relativité. Cette équation prend la forme : Où l’apostrophe est utilisé ici pour indiquer la variation de la fonction d’onde au cours du temps et H est l’hamiltonien décrivant le système. Cette équation n’est en fait que la traduction de la conservation de l’énergie :

Où E est l’énergie totale, le premier terme est l’énergie cinétique due au mouvement et U l’énergie potentielle. On peut montrer en mécanique quantique que la grandeur « énergie » est associée à l’opérateur « variation au cours du temps » et que l’opérateur « vitesse » (plus exactement l’impulsion, la masse fois la vitesse) est associée à l’opérateur « variation dans l’espace ». En utilisant ces règles et la conservation de l’énergie, on peut retrouver l’équation de Schrödinger classique. Pour avoir une formulation relativiste, il faut partir de la forme relativiste de l’énergie :

En utilisant les mêmes règles de substitution on obtient une nouvelle équation d’évolution de la fonction d’onde sous forme totalement relativiste. C’est l’équation de Klein-Gordon.

Défauts de la formulation Cette formulation a deux défauts :

Elle décrit des particules sans moment angulaire (spin 0), c’est-à-dire sans rotation propre. Alors qu’on peut montrer que les électrons (la préoccupation principale à l’époque de ces recherches) a une rotation propre (dont les propriétés sont telles qu’on lui attribue une grandeur appelée spin de valeur 1/2).

Les particules décrites peuvent avoir une énergie négative. Nous reviendrons sur ce dernier point qui n’est qu’une conséquence de la relativité, le même problème que nous avions vu dans l’introduction à la relativité. Cette équation, appliquée à l’étude de l’atome d’hydrogène, donne d’ailleurs des résultats assez médiocres et en désaccord avec l’expérience.

Théorie de Dirac Dirac cherchant à résoudre ce problème d’énergie négative chercha une autre approche. L’équation de Klein-Gordon a un défaut (apparent) : elle n’est pas linéaire comme l’équation de Schrödinger. Dirac chercha une formulation relativiste et linéaire. Et il la trouva. Elle est appelée équation de Dirac.

Avantages et défauts Le gros avantage de cette formulation est qu’elle décrit des particules de spin 1/2, propriété qui semble essentielle pour bien décrire le comportement de l’électron (en particulier en présence de champs magnétiques). Appliquée à l’atome d’hydrogène elle marche extrêmement bien donnant des corrections relativistes à la théorie de Schrödinger, parfaitement en accord avec l’expérience. Mais cette formulation a toujours le même défaut : les électrons de la théorie de Dirac peuvent avoir une énergie négative. Ce qui est assez ironique puisque cette formulation fut recherchée pour résoudre cette difficulté. De plus, on sait maintenant qu’il existe des particules de spin 0 et l’équation de Klein-Gordon s’y applique parfaitement. Il n’est pas étonnant que le problème des énergies négatives subsiste car c’est une conséquence de la relativité. Mais avant de voir pourquoi ici ces états d’énergie négative sont un tel problème, faisons un petit détour par une propriété quantique importante.

Effet tunnel Supposons qu’une particule se dirige vers une barrière de potentiel répulsive. Ce peut-être par exemple un électron se dirigeant vers une zone où règle un champ électrique ou bien un atome dont les électrons repoussent celui qui s’amène (les charges électriques de même signe se repoussent). Supposons d’abord que la particule est décrite par la physique classique.

Si la particule a suffisamment d’énergie cinétique (proportionnelle au carré de sa vitesse) elle va franchir la barrière. Pendant la traversée de celle-ci, son énergie est plus faible et elle va moins vite. C’est la ligne bleue. Si par contre son énergie cinétique, sa vitesse, est insuffisante (la ligne noire), elle sera repoussée et fera demi-tour. Pourtant, en mécanique quantique, une particule n’ayant pas assez d’énergie peut quand même avoir une certaine chance de passer à travers la barrière. C’est l’effet tunnel (dont le nom vient du fait qu’elle traverse la barrière comme s’il y avait un tunnel à travers elle). Il y a deux moyen qualitatif d’expliquer cet effet.

La particule étant une onde avec un certain étalement, le paquet progressant vers la droite, même si la position moyenne de la particule n’a pas encore atteint la barrière, une petite partie du paquet d’ondes se trouve malgré tout déjà de l’autre côté. Le calcul montre qu’un petit paquet d’ondes passe et un gros paquet d’ondes est réfléchit. Leur taille est proportionnelle à la probabilité que la particule passe ou soit réfléchie. On peut aussi voir le phénomène comme étant lié au principe d’indétermination.

Même si elle se situe avant la barrière, la position étant imprécise, elle a une certaine probabilité d’être trouvée de l’autre côté et donc de passer. Les deux descriptions sont liées puisque ce caractère indéterminé résulte justement de l’étalement du paquet d’ondes. Notons de plus qu’à un paquet d’ondes très étroit (position très précise) correspond une énergie très incertaine. Cette fois la particule a une certaine probabilité d’avoir suffisamment d’énergie pour passer aussi. La probabilité de passage est inversement proportionnelle à la largeur de la barrière et à la hauteur de cette barrière. L’effet est observé expérimentalement avec des barrières très fines (de l’ordre du millième de millimètre).

La barrière Revenons à la variation d’énergie d’une particule et à la barrière égale à entre les états d’énergie positive et les états d’énergie négative. Même si l’énergie varie doucement, la particule a une certaine probabilité de basculer dans les états d’énergie négative par effet tunnel.

Des états d’énergie négative inévitables Et c’est en effet ce que montre le calcul. Par exemple, si on calcule l’évolution d’un petit paquet d’ondes d’énergies uniquement positive, on trouve qu’au cours du temps, des composantes d’énergie négative apparaissent. Ces états d’énergie négative semblent totalement inévitables avec la théorie de Dirac. On ne peut plus les ignorer comme on le ferait en physique classique.

Stabilité Considérons l’atome d’hydrogène constitué d’un noyau chargé positivement et d’un électron, chargé négativement, attiré par le noyau et tournant autour. La théorie de Schrödinger permet de calculer l’énergie d’un électron et celle-ci ne peut prendre que des valeurs précises indicées par un nombre n appelé nombre quantique principal.

L’état de plus basse énergie est l’état n = 0. Si l’électron est excité, par exemple s’il est dans l’état n = 1 d’énergie supérieure, il peut retomber dans l’état n = 0 en émettant un photon d’énergie correspondant à la différence des deux états, donc une fréquence précise. Donnant à l’atome d’hydrogène un spectre lumineux aussi précis qu’une empreinte digitale et étudiée en spectroscopie. Voyons le spectre calculé avec la théorie de Dirac. Nous n’indiquons pas les petites corrections données par le calcul relativiste.

En plus des transitions habituelles, l’électron peut tomber dans un état d’énergie encore plus négative en émettant des photons. Il n’y a plus d’état d’énergie minimale et l’atome peut émettre indéfiniment de l’énergie. L’atome n’est plus stable. Le calcul montre même que cet électron d’énergie négative s’éloigne de plus en plus de l’atome. C’est évidemment absurde et non observé.

Quelle est la solution à ce problème gênant ?

III.2. La mer de Dirac

Principe d’exclusion C’est Pauli qui a découvert le principe d’exclusion qui porte son nom. Celui-ci affirme que deux électrons ne peuvent pas se trouver exactement dans le même état quantique (même énergie, même vitesse, etc.) C’est en fait le cas de tous les fermions, les particules de spin demi-entier comme électron, proton, neutron,… Ceux n’obéissant pas à ce principe s’appellent des bosons avec un spin entier comme le photon (la particule composant la lumière). Ceci explique par exemple que les électrons remplissent progressivement les orbites de l’atome (les électrons ne pouvant pas tous être sur la même orbite, la même valeur de n, à cause du principe d’exclusion) et de là la structure des atomes, la chimie,…

La mer de Dirac Dirac a postulé que tous les états d’énergie négative étaient occupés, empêchant les électrons de tomber dans les états d’énergie négative. Ce qui résolvait le problème de la stabilité des atomes. Il y a une infinité de tels états, donnant une mer infinie d’électrons mais comme ils sont coincés dans cette mer (ils ne peuvent pas changer d’état puisque tous les états sont occupés) elle est inobservable. C’est la mer de Dirac.

Excitations d’un état d’énergie négative Il est toutefois possible d’interagir avec cette mer puisque les états d’énergie positive sont libres. On peut imaginer qu’un électron de la mer absorbe un photon ou subit un choc pour passer dans un état d’énergie positive.

Il faut qu’il acquière au moins d’énergie, ce qui est considérable. Il faut pour cela au moins un photon de rayonnement gamma (très énergétique). En fait, étant donné la conservation de l’énergie

et de l’impulsion, un tel processus est impossible a moins d’avoir une autre particule pour balancer la variation d’impulsion, par exemple un atome ou un autre électron percuté par le photon. Le résultat est qu’un atome est « arraché » à la mer donnant un électron libre et un trou dans la mer.

Comportement du trou Ce trou correspond à un manque d’énergie négative dans la mer, il se comporte donc comme un objet d’énergie positive. De plus, un état étant libéré, des électrons d’état voisin peuvent l’occuper avec une faible variation d’énergie.

Par exemple, si l’on applique un champ électrique (avec des plaques métalliques portant des charges électriques ou branchées à une source de courant électrique) les électrons sont attirés dans le sens inverse du champ (à cause de leur charge électrique négative). Les électrons sautant dans l’état libre libèrent un nouveau trou. Donc, le trou se déplace en sens inverse, c’est-à-dire dans le sens du champ électrique. Le trou se comporte donc comme une particule d’énergie positive, de charge électrique positive et de masse identique à l’électron.

Annihilation Si un électron d’énergie positive vient à occuper l’état d’énergie négative libéré, il y a émission d’une énergie d’au moins .

Par exemple par émission de photons gammas (à nouveau, pour des raisons de conservation de l’impulsion, il faut au moins deux photons). On dit qu’il y a annihilation entre l’électron et le trou.

Le positron La théorie prédit donc l’existence d’une nouvelle particule, de même masse que l’électron mais de charge opposée et pouvant s’annihiler avec lui. On a cru un instant qu’il s’agissait du proton, mais celui-ci est trop massif et a des propriétés trop différentes. Et heureusement pour la stabilité de la matière, les protons et électrons ne s’annihilent pas ensemble. Il faut donc réellement une nouvelle particule, appelée antiélectron ou positron (à cause de sa charge positive). C’est la première manifestation théorique de l’antimatière. Le positron fut découvert expérimentalement en 1932 par Carl D. Anderson dans le rayonnement cosmique (des particules émises par le Soleil et d’autres étoiles). Ce fut une confirmation éclatante de la théorie.

Difficultés Mais la théorie n’est pas sans difficulté.

Une mer infinie est très étrange. Plus encore, sa masse est infinie. Elle devrait se manifester par la gravité ce qui n’est clairement pas le cas.

La théorie ne marche que grâce au principe d’exclusion, empêchant que des électrons tombent dans des états d’énergie négative s’ils sont occupés. Mais qu’en est-il de l’équation de Klein-Gordon pour les bosons ? Là aussi on a ce problème d’énergie négative. Et on a vu que cette équation est valable. En particulier, les photons pouvant avoir une énergie aussi faible que l’on veut pourraient avoir une énergie arbitraire, y compris négative. Mais on n’observe jamais de photons d’énergie négative.

On a donc besoin de mieux. Notons que la mer de Dirac est une théorie à plusieurs particules. Si l’on considère les électrons d’énergie positive et les trous, c’est même une théorie à nombre variables de particules puisqu’il peut y avoir création et annihilation. Les équations de Schrödinger, Klein-Gordon et Dirac sont a contrario des théories à nombre fixe de particules (en général une ou deux car au-delà les calculs deviennent inextricables). On a donc besoin d’une véritable théorie à nombre variables de particules permettant création et annihilation.

III.3. Théorie quantique des champs Le défaut de la mécanique quantique tel que nous l’avons vue jusqu’ici c’est qu’elle ne décrit que des systèmes avec un nombre bien déterminé de particules. Or, l’expérience montre que des particules peuvent être créées ou détruites dans divers processus. Ce phénomène est particulièrement flagrant

avec la lumière, les photons, car une simple lampe électrique produit un flot ininterrompu de photons qui clairement ne sont pas présent initialement dans l’ampoule, leur énergie correspond d’ailleurs à l’énergie apportée à l’ampoule et non à une « baisse d’énergie » de l’ampoule qui perdrait des photons préexistants. L’expérience montre aussi la création de particules dans d’autres phénomènes (plus énergétiques) tel que la radioactivité ou des collisions violentes entre particules. Ce phénomène n’est pas très étonnant à cause de la relativité. Celle-ci établit une équivalence entre masse et énergie : . Il n’est donc pas surprenant qu’en présence d’énergie suffisante, une particule de masse puisse être produite. Avec les photons c’est encore plus facile puisque la lumière n’a même pas de masse. Il faut donc trouver un moyen de décrire des systèmes comportant un nombre quelconque et variable de particules. La solution est la quantification du champ. Elle consiste à considérer un système non plus constitué d’une particule mais d’un champ (c’est-à-dire une grandeur prenant une valeur en tout point) et de lui appliquer les méthodes quantiques que nous avons vues. Dans ce cas, les excitations du champ sont quantifiées et deviennent les particules, en nombre variable (nombre variables d’excitations du champ). Cette approche est assez évidente pour le champ électromagnétique puisque au départ l’objet fondamental est déjà un champ (les champs électriques et magnétiques, le champ électromagnétique étant la lumière, les infrarouges, les ultraviolets, les ondes radios, les rayons X et les rayons gammas, avec pour seule différence la fréquence de vibration des ondes électromagnétiques). Dans le cas des électrons, il n’y a pas d’équivalent en physique classique. Mais nous avons déjà une description d’un électron seul. On part alors de la fonction d’onde de cet électron (décrite par l’équation de Dirac qui est la version relativiste de l’équation de Schrödinger) et on considère cette fonction d’onde non plus comme une description quantique mais comme un champ classique. Ensuite, on peut quantifier ce champ. C’est cette approche qui a parfois fait appeler la procédure seconde quantification puisque l’on part d’une équation quantique, mais cette appellation est impropre car on effectue la quantification qu’une seule fois, le champ de Dirac étant ici considéré comme classique, non quantique. Voyons cela d’un peu plus près.

L’oscillateur harmonique Le cas d’un oscillateur harmonique est celui d’un système ou la force de rappel est proportionnelle à la distance. C’est le cas d’un ressort idéal dont la longueur (ou plutôt l’écart à la position d’équilibre) est proportionnelle à la force. La résolution des équations d’un tel système, en physique classique, montre que les solutions sont des oscillations de fréquence bien déterminée (qui dépend du système, par exemple la raideur et la masse du ressort) d’amplitude quelconque. On peut alors passer à la description quantique de ce système. On constate alors que les vibrations ne peuvent plus être quelconques. L’énergie de l’oscillateur est :

(

)

Où h est la constante de Planck et n un nombre entier prenant des valeurs 0, 1, 2, … Le spectre d’énergie de l’oscillateur est alors très simple :

Un point intéressant est que l’état de base (l’état d’énergie minimale) a pour énergie :

Cette énergie n’est donc pas nulle. C’est une conséquence du principe d’indétermination. Le ressort -(par exemple) ne peut jamais être totalement au repos car il aurait alors une longueur (équilibre) et une vitesse (zéro) parfaitement déterminée, ce qui n’est pas possible en mécanique quantique. Prenons l’état de l’oscillateur dans le nième niveau d’énergie . On peut écrire des opérateurs appelés opérateur de création et opérateur de destruction ( et a) qui agissent sur un état pour obtenir un état avec n différent. A ce stade ces opérateurs ne correspondent pas à quelque chose de physique, c’est juste une opération mathématique. On a : (à une constante de multiplication près sans importance pour nous ici). Ces opérateurs ajoutent ou soustraient donc un quantum d’énergie au système. On peut donc s’en servir pour décrire des opérateurs ayant une signification physique et permettant de modifier l’état de l’oscillateur. Par exemple, l’opérateur qui donne l’énergie d’un état (appelé hamiltonien) s’écrit très simplement comme :

Champs libres Revenons à notre champ. Les solutions classiques peuvent être des ondes. Nous l’avons vu avec les ondes électromagnétiques. Ces ondes peuvent être d’amplitudes et de fréquences quelconques.

Pour chaque fréquence on peut considérer que c’est l’oscillation correspondant à un seul oscillateur de fréquence . Classiquement, cela revient à modéliser un champ comme une association d’une infinité de petits oscillateurs, comme des ressorts :

Sauf qu’ici, à cause des vibrations collectives de l’ensemble des ressorts, toutes les fréquences sont possibles. Mathématiquement cela revient donc à considérer le cas d’une infinité d’oscillateurs, un pour chaque fréquence d’oscillation d’une onde. La quantification devient alors évidente, c’est exactement comme ci-dessus mais pour une infinité d’oscillateurs de fréquences différentes.

Espace de Fock Quels sont les états possibles pour le champ quantifié ? On peut pour cela partir des opérateurs de création et destruction que nous avons vu. Sauf qu’il y en a une paire pour chaque fréquence possible. Définissons d’abord l’état de base que nous appellerons le vide et que nous noterons . C’est l’état tel que , pour tout opérateur de destruction. On ne peut pas enlever d’énergie à cet état. Appliquons l’opérateur de création pour une fréquence, disons , et appliquons le fois. De même, appliquons l’opérateur de création pour fois, etc. L’état obtenu sera qui décrit un état avec quanta d’énergie , quanta d’énergie , etc. On dira que l’état contient particules d’énergie etc. L’ensemble de tous les états possibles forme ce que l’on appelle l’espace de Fock du champ. Notons qu’il faut aussi ajouter quelques détails supplémentaires que nous avons négligés : direction de l’onde / excitation / particule, d’éventuelles autres propriétés tel que la polarisation (direction du champ électrique pour une onde électromagnétique), etc. Nous avons atteint notre but, du moins la première étape. L’application de cette procédure au champ électromagnétique seul (sans charge électrique présente, d’om le nom de champ libre) donne le même résultat que ci-dessus, les particules étant appelées photons.

La procédure appliquée au champ de Dirac donne deux sortes de particules, l’électron et le positron (identique à l’électron mais de charge positive, c’est un antiélectron ou particule d’antimatière). Mais nous reviendrons bientôt sur ce point qui mérite quelques détails. Notons que nous avons une difficulté. Quelle est l’énergie de l’état de base ? Nous avons vu que l’énergie d’un oscillateur n’était jamais zéro. Si on ajoute l’énergie d’une infinité d’oscillateurs, on obtient un résultat infini. Ce qui est évidemment problématique ! La solution est celle-ci. Ce que l’on n’observe ce n’est jamais l’énergie de l’état mais seulement ses variations, par l’ajout ou la suppression de quanta d’énergie bien définie . L’énergie du vide n’est donc pas directement observable. Il faudrait pour cela détruire le vide pour en récupérer l’énergie, ce qui semble plutôt difficile ! On prend alors la convention arbitraire de dire que l’énergie du vide est zéro. Tout simplement. Mathématiquement, cela revient à veiller dans les opérateurs à mettre l’opérateur de destruction à droite (avec une petite manipulation mathématique). Par exemple, l’opérateur énergie devient : Appliqué à l’état de base, il donne bien zéro. Dans le cas d’un champ, c’est la même relation mais on doit faire la somme sur toutes les fréquences (les opérateurs création destruction pour toutes les fréquences). Notons qu’il y a d’autres complications. Elles ne nous concernent pas ici, notre objectif c’est la masse, mais pour l’exemple, citons le cas du champ électromagnétique. Nous avons vu deux choses :

- Les ondes électromagnétiques sont transverses (champs E et B perpendiculaires à la propagation).

- Il existe un arbitraire de jauge. On ne peut pas facilement fixer ici l’arbitraire de jauge. Le choix de la jauge de Coulomb fait disparaitre la forme relativiste (bien qu’une telle approche reste envisageable, elle s’appelle « électrodynamique quantique en jauge de Coulomb » et est surtout pratique à faible énergie). Et le choix de la jauge de Lorentz mène à une situation où la procédure de quantification ne marche plus (il y a violation du principe d’indétermination, inutile de creuser pourquoi ici). L’idée est alors de quantifier sans la jauge. Mais le résultat est étrange : on obtient quatre types de photons, deux photons transverses (les deux directions perpendiculaires), un photon longitudinal (correspondant à une onde vibrant dans le sens de propagation) et un photon scalaire (sans direction de vibration). Les deux derniers n’ont pas d’existence physique. De plus, les probabilités calculées avec les états peuvent être négatives ! Ce qui est absurde. On impose alors une condition aux états permettant de reproduire la jauge de Lorentz au moins en moyenne. On constate alors que les photons longitudinaux et scalaires disparaissent de toutes les formules représentant des quantités physiques et les probabilités redeviennent toutes positives. Cela illustre bien les difficultés mathématiques (que nous ne pouvons pas voir ici) qu’il faut surmonter.

Champs en interaction L’étape suivante est de considérer plusieurs champs en même temps. Nous savons par exemple qu’une charge électrique est la source d’un champ électromagnétique et que, de même, un champ

électromagnétique influence le mouvement d’une charge électrique. Par conséquent il doit exister un couplage entre les deux. Ce couplage est connu à travers les équations de l’électromagnétisme classique. On peut donc prendre les équations des deux champs et leur adjoindre un terme supplémentaire décrivant le couplage entre les deux champs. Ce couplage est proportionnel à la charge électrique mais il est plus intéressant de faire apparaitre une constante de couplage ne dépendant pas des unités de mesure. Dans ce cas précis on obtient une constante appelée constante de structure fine qui vaut environ 0.01. On peut ensuite appliquer les procédures quantiques à ce résultat. Malheureusement, la situation est infiniment plus complexe et il n’est pas possible de donner des solutions directes aux équations. On est obligé de recourir à diverses approximations. Certains problèmes simples peuvent toutefois être abordés. Puisque les deux champs sont couplés (un peu comme si on avait deux chaines de ressorts, comme ci-dessus, parallèles, pour les deux champs, et reliées par de petites ficelles). Les excitations d’un champ vont avoir un effet sur l’autre champ. En effet, on vérifie sans peine que des excitations d’un des deux champs peuvent se transformer en excitations de l’autre champ. La seule règle étant que l’énergie totale reste conservée ainsi que la charge électrique totale. Avec ce que nous avons vu, nous savons que les excitations du champ ne sont rien d’autre que des particules. Ainsi se trouve traduit l’observation expérimentale que des particules peuvent être créées ou annihilées. Certains cas simples permettent un traitement direct des calculs. Par exemple, lorsqu’une charge subit une accélération brutale, celle-ci émet un rayonnement appelé rayonnement de freinage ou bremsstrahlung. C’est en effet ce que le calcul montre.

Lorsque la particule subit une brusque accélération (par exemple suite à une collision avec une autre particule, comme un atome), elle émet un flot de photons. On peut calculer le spectre en énergie de ces photons et leurs directions. Le résultat correspond parfaitement à l’expérience. Notons qu’une chose curieuse est constatée. L’énergie totale émise est finie. Mais le nombre de photons est infini ! Ceci est dû au faut que le résultat donne un nombre arbitrairement grands de photons de trait faible énergie, arbitrairement petite, appelés photons mous. Comme les détecteurs sont insensibles à des photons de trop faible énergie (qui sont aussi de très grande longueur d’onde et un capteur doit au moins être égal à la moitié de la longueur d’onde pour réagir au passage de cette onde, c’est une limite d’origine ondulatoire), ce nombre infini de photons ne peut jamais être constaté. Il suffit dans le calcul de tenir compte de la résolution finie des appareils de mesure, ce qui

coupe une partie de l’émission d’énergie totale très petite. Ce genre de phénomène, qui se traite sans difficulté, s’appelle divergence infrarouge (les rayons infrarouges ayant une plus grande longueur d’onde que la lumière visible, l’expression vient de là, bien que dans ce flot de photons mous ont aie aussi des longueurs d’onde encore plus grandes, dans le domaine des ondes radios).

Etats d’énergie négative En toute rigueur, la procédure de quantification appliquée à l’équation de Dirac donne des électrons d’énergie positive et des électrons d’énergie négative. Quelque chose d’assez particulier doit être signalé concernant les particules en théorie quantique des champs. Elles sont donc des excitations du champ, c’est-à-dire des ondes qui se propagent. La propagation du champ est décrite par une fonction qui varie de manière périodique (des fonctions trigonométriques comme sinus et cosinus) dont l’argument varie comme : (à un facteur multiplicatif près) Où est la longueur d’onde (la distance entre deux bosses de l’onde) et sa fréquence (le rythme auquel les bosses passent en un point). Supposons que la fonction utilisée prennent une valeur maximale pour la valeur 0, c’est-à-dire indique un endroit où on a une bosse de l’onde. Alors on a à cet endroit . Considérons la même situation un peu plus tard, c’est-à-dire que t augmente. Dans ce cas, cette expression restera égale à 0 si x augmente un peu (pour le signe moins dans l’expression) ou si x diminue un peu (pour le signe plus). Donc, cela décrit respectivement une onde qui se déplace vers les valeurs de x croissant ou x décroissant. Mais la fréquence est liée à l’énergie. On aurait très bien pu écrire E/h au lieu de la fréquence. Que se passe-t-il, disons pour une onde se déplaçant vers les x croissant si l’énergie est négative. Dans ce cas, le signe devant t change de signe et l’onde devrait aller dans l’autre sens. Elle ne se déplace dans ce sens que si… elle remonte le temps ! Une particule d’énergie négative est donc une particle qui remonte le temps. Il reste donc à faire le lien entre cette chose très bizarre et les antiparticules. Ce n’est pas si difficile, mais il faut faire un détour par les symétries pour bien saisir les conséquences.

IV. Symétries discrètes

Les symétries en physique En physique on appelle symétrie toute transformation (des coordonnées ou de variables décrivant un système physique qui laissent les équations invariantes et donc laissent inchangées le comportement du système. Prenons un exemple simple. Soit des boules de billard blanches et noires qui bougent, s’entrechoquent,… Partons d’une configuration donnée et laissons les boules évoluer.

Reprenons les mêmes boules et réalisons l’opération de symétrie qui consiste à échanger la couleur des boules. On laisse évoluer puis, enfin, on échange à nouveau les couleurs. On retrouve alors la situation finale précédente. On dit alors que changer les couleurs est une symétrie de ce système. Ici la raison en est évidente car la couleur de la boule de billard n’influence pas son mouvement. Mais dans des cas plus subtils ce n’est pas nécessairement aussi simple. On parle encore d’opération de symétrie même dans le cas où l’invariance n’est pas tout à fait respectée. On parle alors de violation de la symétrie. On a ainsi les déplacements dans l’espace, les rotations, etc.

Les symétries discrètes On va s’intéresser ici plus particulièrement aux symétries discrètes. C’est-à-dire que l’opération n’admet qu’un nombre fini de transformations possibles (on parle aussi de transformations discrètes pour un nombre infini de transformations mais repérées par un nombre entier). On va regarder ici les symétries appelées symétrie P, symétrie C et symétrie T qui jouent un rôle important en physique des particules.

Symétrie P La symétrie P ou symétrie de parité consiste à prendre l’image inversée d’un objet par rapport à un point.

Peu importe le point O utilisé, on a dans ce cas au plus un décalage de l’image.

Cette symétrie ressemble fort à la symétrie miroir, si ce n’est que le miroir effectue une opération d’inversion par rapport à un plan alors qu’ici on l’effectue par rapport à un point. Le miroir inverse l’avant et l’arrière mais pas le haut et le bas (la gauche et la droite sont inversée aussi car on les définit par rapport au sens avant – arrière). Les lois de l’électromagnétisme, décrivant les champs électriques, magnétiques, les charges électriques, les aimants et la lumière, sont invariantes sous la symétrie P. Pour peu, bien entendu, que l’on effectue la transformation sur la totalité du système et tout ce qui peut l’influencer.

Symétrie C La symétrie C est une symétrie d’inversion des charges. Les charges électriques négatives deviennent positives et vice et versa. Elles affectent toutes les charges. Non seulement les charges électriques mais aussi toute autre forme de « charge » introduite par la physique des particules. L’électromagnétisme est encore une fois invariant sous cette symétrie. Notons que c’est également le cas de l’interaction nucléaire liant protons et neutrons au sein des noyaux d’atomes ainsi que de la gravité. Tout comme pour la symétrie P.

Symétrie T Enfin, il reste la symétrie T. C’est la symétrie par renversement du temps. Elle consiste dans les équations à remplacer la variable t (mesure du temps) par –t. Bien entendu, il s’agit d’une opération purement formelle. On ne remonte pas le temps ! L’invariance par rapport à cette opération signifie qu’un système peut aussi bien évoluer de l’état A vers l’état B que de l’état B vers l’état A. L’exemple typique est un pendule qui peut balancer aussi bien dans un sens que dans l’autre. On peut aussi considérer le cas suivant.

On jette une pierre au loin. Celle-ci parcourt un arc de parabole. Elle arrive à la fin de sa trajectoire avec une vitesse V. On applique alors la symétrie T, c’est-à-dire qu’on prend la pierre au même endroit et on inverse le sens des vitesses V -V. La pierre parcourt alors exactement la même trajectoire en sens inverse. Il existe des systèmes irréversibles, c’est-à-dire violant cette symétrie. Mais il s’agit toujours de systèmes macroscopiques (sauf un cas que nous verrons plus tard), et ils impliquent des phénomènes tel que les frottements, la chaleur,… Ils sont du ressort non pas de la physique des particules mais de la physique statistique traitant du comportement d’un nombre extrêmement élevé de particules. Les interactions gravitationnelles, électromagnétiques et nucléaires sont encore une fois invariantes sous cette transformation. Revenons à nos particules. Rappelons-nous la forme que prend une onde, elle dépend d’une valeur où l’on trouve le terme décrivant la progression de l’onde.

Si l’on change le signe de t, alors on change le signe de ce terme. Cela revient exactement au même que de changer le signe de l’énergie. La particule qui remontait le temps avec une énergie négative va maintenant dans le bon sens avec une énergie positive ! Voilà qui nous intéresse, mais un dernier détail reste à régler car rien ne dit qu’appliquer T n’a pas une influence, on ne sait pas a priori si la symétrie est parfaitement respectée, on ne peut pas l’appliquer à l’aveugle. Nous avons dit qu’elle est respectée pour de nombreuses interactions, mais ce n’est pas toujours le cas et cela jouera un rôle très important dans la suite. Pour l’heure nous avons besoin d’une opération plus sûre.

IV.1. Antimatière

Combinaisons de symétrie On peut combiner plusieurs symétries ensembles. Par exemple, on peut changer le signe des charges et effectuer une inversion autour d’un point, c’est la symétrie CP, ou bien effectuer à la fois une inversion spatiale et un renversement du temps, combinant ainsi P et T.

Symétrie CPT On peut aussi combiner les trois transformations, c’est la symétrie CPT. Un théorème utilisant la mécanique quantique et la relativité montre que tout système doit être invariant sous la combinaison des trois symétries. Ce n’est pas une conséquence de la théorie quantique des champs ni des propriétés de l’une ou l’autre interaction. Une violation de la symétrie CPT remettrait en cause des choses aussi basiques que la localité relativiste, le principe de superposition de la mécanique quantique ou le caractère unitaire des équations quantiques (ce qui serait très gênant car ce principe est lié au fait que la probabilité de trouve un système dans un état quelconque est 100%).

Antimatière On peut donc considérer sans risque que cette symétrie est toujours respectée et on peut l’appliquer sans changer fondamentalement le comportement du système. Prenons nos états d’énergie négative ayant la propriété désagréable de remonter le temps. Appliquons la symétrie CPT. En particulier, C et T donnent :

La symétrie T donne à ces particules la propriété correcte d’aller du passé vers le futur et d’avoir une énergie positive.

La symétrie C inverse toutes les charges. Comme de plus l’existence des états d’énergie négative est une conséquence directe de la relativité, on peut dire que ce théorème prédit : A chaque particule correspond une antiparticule, de même masse, de charges opposés et ayant un comportement physique identique (même couplage au champ électromagnétique, par exemple). Ainsi, à l’électron correspond le positron. Au proton correspond l’antiproton, de charge électrique négative, au neutron correspond l’antineutron (il est électriquement neutre mais il a une structure interne et porte des charges associées à l’interaction nucléaire). Le photon n’ayant aucune charge il reste lui-même.

En 1955, grâce au grand accélérateur de particules de Berkeley, en Californie, Emilio Segrè observa l’antiproton. Depuis, on a découvert de nombreuses autres particules et à chaque fois l’antiparticule correspondante a été observée.

Antiatomes Un atome est constitué d’un noyau, contenant des protons et des neutrons, et d’électrons tournant autour. Par exemple, l’hydrogène est constitué d’un proton et d’un électron. On peut donc imaginer qu’en associant un antiproton et un antiélectron on puisse obtenir un atome d’antihydrogène. C’est en effet le cas. Ce n’est pas une opération facile car les antiparticules produites dans les grands accélérateurs sont animées d’une très grande vitesse. Il faut donc les ralentir puis les rassembler. Le CERN a ainsi pu créer et stocker de nombreux atomes d’antihydrogène. Bien entendu, tout est relatif. Par nombreux on entend « des centaines », ce qui fait moins d’un milliardième de milliardième de gramme. C’est encore une quantité infime, mais suffisante pour une étude des propriétés des antiatomes.

IV.2. Interactions

Création Comme on l’a vu, des chocs violents entre particules, apportant de l’énergie, peuvent entrainer des excitations des champs couplés à ces particules, c’est-à-dire la création de nouvelles particules. Si on fournir suffisamment d’énergie, on peut donc créer des antiparticules. Par exemple, on peut envoyer des électrons extrêmement rapides (donc ayant une énergie cinétique très élevée) les uns contre les autres.

A la sortie, on a va retrouver, par exemple :

- Les deux électrons initiaux (ils pourraient aussi avoir totalement disparu). - Des tas de photons. - Une paire électron – positron.

Les antiparticules sont toujours créées par paires : particule – antiparticule. La raison est liée au fait que certaines quantités se conservent lors de la collision (cela aussi est d’ailleurs relié à certaines symétries). En particulier ici :

La charge électrique totale. Le nombre leptonique égal au nombre d’électrons moins le nombre de positrons (il faut

aussi ajouter les neutrinos et antineutrinos, nous en reparlerons bientôt).

Annihilation Inversement, lorsqu’une particule rencontre son antiparticule, elles s’annihilent en produisant un flot de particules plus légères. Par exemple, un électron et un positron, se rencontrant à faible vitesse (sinon on aurait création de pleins de particules comme ci-dessus), s’annihilent en deux ou trois photons gammas. Un proton et un antiproton s’annihilent aussi facilement, mais étant donné qu’ils sont mille fois plus lourd que l’électron, ils produisent tout un flot de particules légères : 85% de photons et de neutrinos, et 15% d’électrons et de positrons.

Positronium Puisque le positron a une charge électrique positive comme le proton, on peut imaginer remplacer ce dernier par un positron dans l’atome d’hydrogène. Cela donne le positronium, un « atome » où un électron et un positron tournent l’un autour de l’autre.

Mais ils ne restent pas éloigné l’un de l’autre, conséquence de leur caractère ondulatoire, de l’incertitude dans leur position, et la durée de vie du positronium est courte : très rapidement l’électron et le positron s’annihilent. Toutefois, il est facile à créer et il a été énormément étudié expérimentalement où on a mesuré toutes ses propriétés (durée de vie, modes d’émission des photons de l’annihilation,…). Les résultats sont en parfait accord avec la théorie quantique des champs.

Source d’énergie Du fait que l’annihilation produit énormément d’énergie (toute la masse est convertie), l’antimatière a déjà fait rêvé en tant que source d’énergie, surtout dans les œuvres de science-fiction. Toutefois, il faut éviter de spéculer n’importe quoi car l’antimatière, il faut la produire. Créer une paire électron – positron coûte au moins 1 Mev (deux fois où m est la masse de ces particules), sans compter les pertes extrêmement importantes (une collision comme ci-dessus produit tout un flot de particules éventuellement perdues). Et l’annihilation de l’électron et du positron ne fera

jamais que rendre ce 1 MeV sous forme de rayonnement gamma (un rayonnement qui n’a rien de pratique comme source d’énergie : il est extrêmement pénétrant et difficile à récupérer). L’antimatière n’est donc au mieux qu’une forme de conversion (très inefficace) d’énergie.

Stockage On pourrait imaginer stocker l’antimatière, ce qui cette fois serait un moyen efficace de stocker des quantités fabuleuses d’énergie dans un petit volume. Mais du fait de l’annihilation, l’antimatière est extrêmement difficile à stocker. Le moindre contact avec de la matière, ne fut-ce qu’un seul atome, entraine l’annihilation et une forte libération d’énergie qui risquerait de briser l’enceinte de confinement utilisée pour le stockage. Ce serait plus une bombe à explosion spontanée qu’une bonne batterie ! Dans la pratique, avec les grands accélérateurs de particules, on produit des positrons et des antiprotons qui sont stockés dans des anneaux dit de stockage où ces particules circulent dans un tube sous vide guidées par des champs magnétiques. Il faut des vides très poussés pour éviter de voir rapidement disparaitre les antiparticules stockées. On peut également stocker des antiatomes dans un vide très poussé à condition de les isoler des parois. Cela peut se faire avec des champs magnétiques très intenses exploitant le fait que les atomes se comportent comme de petits aimants ou à l’aide de lasers puissants poussant les antiatomes. Malgré ces méthodes élaborées, le stockage ne dépasse pas quelques minutes avant de voir les antiatomes s’annihiler avec de la matière résiduelle restant dans ce vide. De plus, les antiatomes étant électriquement neutres, ce genre de piège magnétique ou à laser ne marche que si ces antiatomes sont extrêmement lents. Ces difficultés expliquent le très faible nombre d’antiatomes que l’on peut stocker. Cela suffit toutefois pour leur étude.

IV.3.1. Violation C et P

Les neutrinos Le neutrino est une particule apparentée à l’électron mais très légère et sans charge électrique. Il est émis lors de la radioactivité bêta due à la désintégration d’un neutron. Celui-ci se désintègre en un proton, un électron très énergétique (rayonnement bêta) et un antineutrino. Cette désintégration du neutron est due à une interaction dont nous n’avons pas encore parlé : l’interaction faible. Elle est d’intensité extrêmement faible et de portée très courte (elle ne porte pas plus loin que le diamètre d’un proton). Sa faiblesse extrême explique que le neutrino soit si « fantomatique ». Celui-ci est en effet insensible aux forces nucléaires et sans charge électrique, il n’agit que par l’intermédiaire de l’interaction faible (et de la gravité). Pour donner une idée, le Soleil émet à chaque seconde un flux intense de neutrinos. Ils sont produits au cœur du Soleil par les réactions thermonucléaires (fusion des noyaux d’atome d’hydrogène formant des noyaux d’atomes d’hélium) qui alimentent le Soleil en énergie. Ces neutrinos traversent la totalité du Soleil, arrivent jusqu’à nous et traversent la totalité de la Terre. La plupart passent sans même interagir. Le temps que vous lisiez ces quelques lignes, des milliards de neutrinos solaires sont passés à travers vous. Pour les détecter il faut des détecteurs grands comme des piscines olympiques

(comme le détecteur Super Kamiokande placé au fond d’une mine pour éviter les rayonnements parasites) qui ne captent que quelques dizaines de neutrinos chaque année.

Hélicité Comme beaucoup de particules, les neutrinos sont animés d’une rotation propre (comme une toupie). En avançant, elles décrivent donc un parcours en forme d’hélice.

Si l’hélice tourne dans le sens des aiguilles d’une horloge (en regardant par derrière) on parle d’hélicité droite, sinon d’hélicité gauche.

Violation P L’expérience a montré qu’il n’y avait que des neutrinos d’hélicité gauche. Si l’on prend l’image par la symétrie P, une hélicité gauche devient une hélicité droite. Par conséquent, sous la symétrie P, un neutrino gauche devient un neutrino droit. Mais ces derniers n’existent pas. La symétrie P n’est donc pas respectée par les neutrinos. Si l’image par symétrie P n’est pas superposable à son image, on dit que l’objet possède une parité. Comme un gant gauche dont l’image dans un miroir est un gant droit. On constate ainsi que l’interaction faible ne respecte pas la parité.

Violation C Pour passer d’une particule à une antiparticule, il faut effectuer la transformation CPT. Sous cette transformation, le neutrino gauche devient un antineutrino droit. Et effectivement, dans la nature on ne trouve que des antineutrinos droits. Sous la symétrie C un neutrino gauche deviendrait un antineutrino gauche. Donc, la symétrie C est également violée par les neutrinos (et l’interaction faible).

Conservation CP Par contre, si l’on applique la symétrie CP, un neutrino gauche devient un anti neutrino droit, ce qui est correct. On a longtemps cru que la symétrie CP était une symétrie de la nature, toujours respectée. Jusqu’à

l’étude des mésons K, des particules exotiques découvertes dans les grands accélérateurs de

particules.

Le méson K une particule élémentaire assez massive découverte avec les accélérateurs de particules.

Elle fait partie d’une classe de particules appelées particules étranges car elles contiennent un quark

appelé quark étrange. Les autres quarks sont haut et bas (ceux composant les neutrons et protons),

charme, beauté et vérité. On voit que les physiciens sont parfois un peu poètes.

L’étude de la désintégration des mésons K a montré une légère violation de la symétrie CP. Il en est

de même du méson B (contenant un quark beauté).

Nous savons que la combinaison CPT doit être respectée. Si CP est légèrement violé, CPT ne peut être

respecté que si T est légèrement violé aussi et compense la violation due à CP. Cette violation a aussi

été confirmée par l’expérience.

C’est quelque chose qui nous intéresse beaucoup. Nous allons donc regarder de plus près le méson K

et ses modes de désintégration.

V.3.2. Violation CP

Les particules élémentaires Voyons d’abord d’un peu plus près les particules élémentaires. Voici une liste non exhaustives de

celles-ci.

Particule Charge électrique

Photon 0

Electron -1

Proton +1

Neutron 0

Neutrino 0

Méson pi +1, 0, -1

Muon -1

Tau -1

Méson K +1, 0, -1

Lamdba 0

Delta plus +1

Ksi moins -1

Eta 0

Rho +1, 0, -1

Omega 0

Nous avons indiqué sous quelles charges électriques on rencontre ces particules. Nous n’avons pas

indiqué les antiparticules (par exemple, l’antiélectron ou positron, de charge +1). D’autres propriétés

distinguent ces particules (spins, masse,..) Nous allons en voir un peu plus dans ce qui suit.

Peu importe ici la raison de cette multiplicité de particules.

Exemples d’interactions entre particules Les particules peuvent se désintégrer ou être créées dans des collisions. Ces réactions suivent

certaines règles liées aux interactions et à la conservation de certaines grandeurs comme la charge

électrique. Ces règles de conservation peuvent varier selon les interactions concernées, par exemple

l’interaction faible viole l’étrangeté (une grandeur associé aux particules contenant un quark

étrange). Nous n’aurons pas besoin de tout savoir sur ces lois de conservation dans ce qui suit. Les

exemples servent surtout à illustrer ce qui se passe.

Une interaction typique est la désintégration du muon :

est un positron, les neutrinos notés sont de plusieurs sortes (neutrinos électroniques, muoniques et tauiques, identifiés par un indice) et la barre au-dessus du neutrino muonique indique qu'il s'agit d'un antineutrino. Ou

Notons que des muons sont produits dans la haute atmosphère par les collisions très violentes des rayons cosmiques avec les atomes d'oxygène et d'azote de l'air (les rayons cosmiques sont essentiellement des protons et des électrons très énergétiques produit par le Soleil et d'autres étoiles). Le bouclier magnétique de la Terre (produit par son champ magnétique) nous protège efficacement contre les rayons cosmiques (les particules chargées étant aisément déviées par le champ magnétique) mais ces derniers arrivent parfois à pénétrer aux points les plus faibles du champ magnétique (les pôles Nord et Sud), en particulier lors des tempêtes Solaires (de violentes éruptions de gaz à la surface du Soleil pendant les périodes tous les onze ans environ où le Soleil est à son maximum d'activité). Les collisions des rayons cosmiques avec l'atmosphère produisent les magnifiques aurores boréales et australes. Les muons ainsi créés (appelés muons atmosphériques) ne devraient pas, normalement, atteindre le sol, même à une vitesse proche de la vitesse de la lumière, car leur durée de vie est trop courte. Mais la dilatation du temps leur permet d'atteindre les détecteurs placés au sol, ce qui constitue une démonstration flagrante de la relativité restreinte. Une autre interaction typique est la diffusion d'un neutrino par un électron : Notons que la section efficace (l’efficacité) de cette diffusion est très petite à cause de la faiblesse de l'interaction faible. Les hadrons aussi peuvent subir l'interaction faible. L'exemple le plus connu est la désintégration du neutron que nous avons déjà vu. Ce processus est aussi appelé "désintégration β (bêta)" car c'est à travers ce processus que ce produit la radioactivité bêta de certains atomes, nommée ainsi car le flux d'électrons énergétiques émis fut appelé initialement "rayons bêta" (on avait classé les trois types de radioactivité connues en alpha, bêta, gamma). On a aussi la désintégration des mésons pi (ou pions) :

Ou

Notons que plusieurs désintégrations sont possibles selon certaines probabilités (ce qui est fréquent en physique quantique, comme on s'y attendrait) ou (cela revient au même pour ce type de processus) une certaine section efficace. D'autres désintégrations de hadrons plus lourds et plus instables sont possibles : Notons que la réaction de désintégration peut s'inverser dans une collision (avec une section efficace extrêmement faible, d'autant que la désintégration prend beaucoup de temps, par exemple environ vingt minutes pour un neutron, la plus longue connue à part peut-être le proton, alors que la collision est extrêmement rapide) : Une autre collision possible est :

On a aussi des réactions faisant intervenir des hadrons et changeant l'étrangeté comme la désintégration du méson K :

Ou la désintégration du lambda :

Enfin, il existe des processus de désintégration des hadrons avec violation de l'étrangeté :

Tous ces exemples ne sont pas exhaustifs. Dans d'autres processus, l'interaction faible intervient en partie mais est fortement masquée par les effets des autres interactions (électromagnétiques et fortes), par exemple les processus avec seulement des hadrons (désintégrations et collisions) et sans modification de l'étrangeté.

Violation de la symétrie CP Comme nous l’avons dit, l’interaction faible viole (légèrement) la symétrie CP.

Ce phénomène implique le méson K neutre noté .

Deux mésons neutres On trouve en fait deux types de méson . Le lui-même et son anti particule le . Ils se distinguent par le signe de l'étrangeté, +1 et -1. La plupart des réactions de collisions, ne faisant pas intervenir l'interaction faible, conservent l'étrangeté. Dressons un tableau de la valeur de l'étrangeté pour quelques particules, telle qu'elle a pu ainsi être mesurée dans les collisions :

Etrangeté

S -2 -1 0 +1

Baryons

p (proton)

, n (neutron)

Mésons

Ainsi, la réaction :

N'est jamais observée car elle ne conserve pas l'étrangeté. Par contre, on peut avoir des réactions telles que :

La difficulté est de distinguer les deux types de mésons neutres. En effet, ils n'ont aucune charge électrique et sont donc indétectables dans les appareils. Ils sont instables et se désintègrent mais ces désintégrations faisant intervenir l'interaction faible ne conservent pas l'étrangeté et ne permet pas nécessairement de savoir quel méson s'est désintégré.

Par contre, ces mésons peuvent eux-mêmes provoquer des collisions secondaires, ce qui permet de savoir quel méson a été produit. Par exemple, on peut avoir :

Alors que le ne peut produire ce type de réaction. Ainsi, si dans une expérience on détecte un produit par un méson K neutre (ou plutôt, on détecte les produits de désintégration du qui est lui-même neutre), alors on est certain que le méson était le .

Notons que ce méson est particulier : toutes les autres charges sont nulles. Il n'a pas de charge baryonique (le nombre de baryons se conserve) ni de charge électrique ni leptonique (le nombre de leptons se conserve, les leptons étant les particules comme électron, muon, neutrino,..). Par conséquent, seule l'étrangeté distingue les deux types de méson neutre. Or l'interaction faible ne conserve pas l'étrangeté. On peut imaginer un processus qui pourrait transformer un méson en mais cela ne peut se produire que via l'interaction faible. Cela fait du méson K une particule assez exceptionnelle très importante dans l'étude de l'interaction faible. Une seule autre particule manifeste la même propriété : le méson B portant une charge de "beauté" également violée par l'interaction faible. Plus lourd et plus difficile à produire, il a été intensément étudié ces derniers temps pour valider les modèles décrivant la violation CP et en mesurer certains paramètres. En effet. On peut calculer l'action de la symétrie CP sur le méson K. On trouve : Ces particules n'ont donc pas de symétrie CP bien définie. Nous allons voir que la violation de l'étrangeté peut amener une violation de la symétrie CP (bien que ce ne soit pas une condition suffisante puisque de toute façon la valeur CP de ces mésons n'est pas définie).

Superposition d’états On peut obtenir des états avec une symétrie CP bien définie en combinant les états ci-dessus.

Les mésons et

ne correspondent pas à de nouveaux mésons car leur état n'est pas indépendant des deux précédents. Ce sont des états superposés des états habituels du méson K neutre. Nous savons que toutes les bases sont équivalentes et il n'y a pas de raison de considérer ces deux nouveaux états d'un point de vue différent. Ce sont deux autres façons de décrire les deux états possibles du méson K neutre. Par exemple, on peut écrire :

Si l'on regarde les transformations ci-dessus, on voit que :

Et

Ces deux états sont donc des états bien définis de la symétrie CP, le premier avec la valeur +1, le

deuxième avec la valeur -1. Notons que, par contre, et

n'ont pas de valeur bien définie de l'étrangeté.

Observations expérimentales L'observation montre que le méson K neutre se désintègre le plus souvent en deux ou trois mésons π. Ces combinaisons de deux ou trois mésons pi ont une parité bien définie et on peut calculer leur valeur sous la transformation CP. Si celle-ci était bien conservée, on obtiendrait :

Et

Les autres désintégrations étant impossibles. Bien entendu, si la symétrie CP n'est pas conservée, nous ne pouvons en être sûrs à cent pour cent. Le test de la collision produisant un reste expérimentalement nécessaire. Le et le étant symétriques (matière et antimatière), on s'attend à des durées de vies

identiques, mais qu'en est-il de et

?

Le ne pouvant se désintégrer qu'en trois mésons au lieu de deux, on s'attend à ce que la

désintégration se produise moins facilement et que la durée de vie du soit plus longue. Même si

la symétrie CP n'est pas tout à fait exacte, si elle est faiblement violée, les désintégrations ci-dessus seront quand même les plus fréquentes. C'est en effet ce que l'on observe. L'analyse des données

expérimentales montre que le a une durée de vie de seconde (un peu moins d'un

dixième de milliardième de seconde), on dit qu'il est à "courte période" (courte durée de vie). Le

méson a lui une durée de vie de seconde (plus de cinq cent fois plus). Il est à "longue

période" (longue durée de vie, moins d'un millionième de seconde mais tout est relatif, bien sûr). Notons que malgré l'asymétrie des modes de désintégration, la durée de vie des deux types de méson aurait pu être identique. La justification ci-dessus n'est qu'heuristique. Après tout, ces deux

mésons sont a priori aussi totalement symétriques (ce sont des combinaisons parfaitement équilibrées des mésons et ). Le fait qu'il y ait une telle asymétrie n'est pas clairement comprit. Il existe bien des modèles montrant que c'est théoriquement possible, mais les valeurs des paramètres dans les équations de ces modèles sont choisies de manière ad hoc pour coller aux données expérimentales et personne ne sait pourquoi il y a ces valeurs exactement.

Oscillations Imaginons maintenant un flux de méson produit par un processus de collision.

Le est en fait composé d'une superposition de

et . Mais la durée de vie de ces deux

composantes n'est pas la même. Au bout d'un court instant, les étant très instables, ils se seront

presque tous désintégrés. Il restera donc sur la fin du parcourt uniquement des (la moitié des

mésons initiaux car la superposition ci-dessus montre que le a une probabilité 1/2 d'être dans un

des deux états ou

). Mais ces sont eux-mêmes une superposition de et de (avec une

probabilité 1/2 chacun). Donc, on peut dire que un quart des mésons initiaux ont changé. De ils sont devenus . Ce que l'on peut observer en plaçant une cible et en observant la production de .

Un calcul précis montre qu'il y a en fait une "oscillation" entre les deux états. Ce que l'expérience confirme (il suffit de déplacer la deuxième cible pour mesurer la quantité de au cours du trajet).

On voit qu'au cours du temps (au cours du trajet), la quantité de oscille pour tendre vers

une valeur d'environ un quart. Pour les états ou

on obtient (à partir de cette courbe) une courbe oscillante analogue. Mais ces états ont une valeur CP bien définie et différente. Donc, avec la transformation d'un état en l'autre, on a un changement de la valeur CP. La symétrie CP est violée !

Notons que la violation n'est pas maximale et elle est même en réalité assez faible car la transformation est progressive et ne se fait pas à 100 %.

Asymétrie matière – antimatière Les résultats qui précèdent montre qu’il existe une asymétrie entre matière et antimatière. En effet, les mésons et sont antiparticules l’un de l’autre. Ils ont même masse, des charges opposées (pas la charge électrique qui est absente mais l’étrangeté). Pourtant le graphique précédent montre qu’au cours du temps, on a un déséquilibre qui se produit dans la quantité de ces deux particules, elle tend vers 25% de et 75% de . Cette différence de comportement entre matière et antimatière est la seule connue avec le méson B. Notons aussi que la symétrie T est violée. Cela se voit aussi sur le graphique, l’évolution n’étant clairement pas symétrique dans le temps. Cette asymétrie est logique car la symétrie CPT est toujours valide, si CP est légèrement violé alors T doit l’être aussi pour compenser cette violation et garder la combinaison des trois symétries invariante.

V. L’antimatière dans l’univers

Observation de l’univers L’antimatière ayant les mêmes propriétés que la matière, à l’inversion des charges près, cela signifie que des antiatomes ont également les mêmes propriétés. En particulier, les niveaux d’énergie des positrons autour de l’antinoyau sont les mêmes que les niveaux d’énergie des électrons autour du noyau. Un antiatome a donc exactement le même spectre de rayonnement qu’un atome. Ce fait est en cours d’étude par les physiciens du CERN. Cela signifie qu’il n’est pas possible de distinguer les antiatomes par leur rayonnement lumineux. S’il existes des antiétoiles dans l’univers, leur observation à travers la lumière qu’elles émettent ne permettrait pas dans les distinguer d’étoiles normales. Au moins de ce point de vue, rien n’exclut que certains objets observés dans l’univers à travers les grands télescopes soient des objets constitués d’antimatière.

Les rayons cosmiques Mais les rayonnements électromagnétiques ne sont pas les seules informations qui nous parviennent du cosmos. Nous avons déjà parlé des rayons cosmiques, constitués essentiellement d’électrons et de protons, provenant du Soleil et d’étoiles voisines. Ces rayons cosmiques, étant constitués de particules chargées, sont fort sensibles aux champs magnétiques. Les particules qui le composent sont donc guidées par les champs magnétiques planétaires, stellaires et galactiques. Leur trajet peut être notablement compliqué, en particulier au voisinage de la Terre, bien protégée par son bouclier magnétique. On ne détecte dans ces rayonnements cosmiques que très peu d’antimatière. Essentiellement quelques positrons. Ces antiparticules sont toujours extrêmement énergétique, jamais moins de un milliard d’électrons-volt, ce qui est considérable. Ils ont donc une origine violente tel que des supernovas (explosion d’étoiles massives arrivées en fin de vie). Leur mode de production est alors analogue à la production d’antiparticules dans les grands accélérateurs de particules.

Il est donc certain que notre galaxie ne contient essentiellement que de la matière. Les rayons cosmiques ne viennent toutefois guère de plus loin sauf pour quelques très rares rayons cosmiques d’énergie particulièrement élevée.

Rayonnement caractéristique L’annihilation d’un électron et d’un positron entraine l’émission de rayonnement gamma de 512000 eV. Une énergie précise correspondant à une fréquence précise de ce rayonnement. Il agit comme une véritable signature de ces annihilations. Les observations montrent que ces annihilations sont rares et toujours concentrées en des endroits où se produisent des phénomènes extrêmement violents : supernovas, coalescence d’étoiles à neutrons (étoiles extrêmement massives résidus de supernovas), matière tombant dans un trou noir, … Ce qui est en accord avec les rayons cosmiques observés. Ces résultats qui concernent cette fois tous l’univers visible montrent la rareté de la cohabitation matière – antimatière.

Des zones sans contacts Si des zones d’antimatière existent, elles doivent être isolées, totalement isolées. Sinon au contact de la matière, l’émission intense du rayonnement gamma serait visible comme le nez au milieu de la figure. Ces rayonnements intenses et largement distribués ne sont pas observés. Si des zones d’antimatière existent, elles ne doivent avoir aucun contact avec la matière ordinaire. Autour de ces zones, il doit y avoir une large zone vide faisant tampon. Toutes les observations indiquent que de telles zones vides sont absentes. Il y a toujours des traces de gaz résiduel ainsi que des étoiles proches sources de rayons cosmiques. Un tel isolement semble donc hautement improbable. Le seul endroit où cela est encore possible est au-delà de la partie visible de l’univers (la lumière n’ayant pas encore eu le temps de nous parvenir puisque celle-ci se propage à vitesse finie et que l’univers est âgé de 13.6 milliards d’années). Ce serait malgré tout étonnant. Dans un univers qui semble si homogène à grande échelle, pourquoi brusquement une zone si différente et si loin ? Cela ne reste pas exclu mais est de toute façon invérifiable. L’univers connu, en tout cas celui visible, semble bien fait entièrement (ou peu s’en faut) de matière.

La naissance de l’univers Le Modèle Standard de la cosmologie (théorie de Big Bang) très largement étayé par les observations montre que l’univers était initialement dans un état dense et chaud puis s’est expansé jusqu’à ce que le gaz soit suffisamment froid pour commencer à s’effondrer sous son propre poids et former les premières étoiles. Etant donné la symétrie entre matière et antimatière, il semble plausible qu’il y avait au début autant de matière que d’antimatière. Au début, l’univers étant extrêmement chaud et dense (on parle en milliards de degrés) les collisions fréquentes et très violentes entre particules et antiparticules

devaient créer autant de paires qu’il y avait d’annihilation. Puis, l’univers se refroidissant avec l’expansion, l’annihilation a dû prendre le pas transformant matière et antimatière en rayonnement. Nous sommes capables de mener les calculs pour un tel état de l’univers et de déterminer les processus de nucléosynthèse, c’est-à-dire de formation des premiers atomes. Cela donne environ 75 % d’hydrogène (en masse), 25 % d’hélium et en plus petite quantité du lithium, du deutérium et quelques autres atomes légers. Ces résultats sont confirmés par l’observation de la matière dans l’univers, en particulier les nuages de gaz préservés depuis le début (très pauvres en éléments lourds issus de la combustion des étoiles). Ce calcul montre qu’environ un milliard de photons gammas ont été produits par particule restante. C’est-à-dire qu’il devait y avoir au début environ 500000000 d’antiparticules pour 500000001 particules, la petite différence formant la matière que nous observons (nous sommes une cendre du Big Bang). Cette quasi égalité semble conforter l’hypothèse d’une quantité égale d’antimatière et de matière. Mais il y a quand même un écart : environ deux dixième de millionième de pourcent. Un écart vraiment infime ! Infime mais significatif. Sans lui, nous n’existerions pas, toute matière et antimatière se serait annihilée. Les physiciens n’aiment pas les paramètres réglés de manière aussi précise et sans explication. Quelle est donc l’origine de ce minuscule écart ?

V.1. Les conditions Sakharov On peut partir de l’idée qu’au début l’équilibre était parfait et qu’une petite différence de comportement matière – antimatière a produit un déséquilibre.

Les conditions de Sakharov Sakharov a étudié le problème et énoncé trois conditions nécessaires pour que cela soit possible.

Il doit exister une petite différence de comportement dans les interactions favorisant la matière au dépend de l’antimatière.

Il doit se produire un déséquilibre thermique au cours de la phase où cette différence se manifeste.

Il doit exister un processus violant le nombre baryonique. Voyons cela de plus près.

Matière favorisée Nous connaissons un tel processus. La désintégration du méson K manifeste une asymétrie matière – antimatière. Les calculs montrent toutefois que la période où cela a pu se produire (période suffisamment chaude et dense de l’univers pour avoir beaucoup de mésons K produits par les collisions) est extrêmement courte. La violation CP du méson K étant très faible, l’écart aurait dû être insuffisant malgré la faiblesse de l’écart nécessaire. Il n’est toutefois pas exclu qu’à très haute énergie des violations plus prononcées existent.

Déséquilibre thermique Par définition, un état d’équilibre n’évolue pas. Dans un univers très chaud en état d’équilibre thermique, il y a autant de créations de particules et d’antiparticules que de paires qui s’annihilent. Si on veut que le processus favorisant la matière joue son rôle, il faut un déséquilibre. Les calculs de physique statistique montrent que, pour autant que nous le sachions, l’équilibre a toujours été maintenu avec une très grande précision. Il n’est pas exclu qu’au tout début de l’univers, pendant la première fraction de seconde, il puisse y avoir eu des périodes de déséquilibre. Au tout début de l’univers s’est produit une période dite d’inflation. Une période où la taille de l’univers a augmenté de manière considérable en un très court instant. Cette période est spéculée mais elle résout énormément de problèmes de la cosmologie et, de plus, le calcul des fluctuations dans le rayonnement fossile suite à cette inflation correspond très bien aux observations. Le rayonnement fossile est un rayonnement d’ondes radios qui baigne l’univers et qui fut émis à une époque où l’univers (alors âgé de 300000 ans) était devenu suffisamment froid pour que les électrons se combinent aux atomes. L’univers alors devenu brusquement transparent, ce rayonnement fut libéré. Il a été enregistré avec une très grande précision par le satellite Planck. L’origine de l’inflation est inconnue, mais elle peut être liée à certains phénomènes encore mal compris en physique des particules (brisure électrofaible, une brisure de symétrie qui a provoqué une différence de comportement entre électromagnétisme et interaction faible décrit actuellement par une théorie les unifiant et remarquablement confirmée par l’expérience). A elle seule, l’inflation n’est pas un facteur de rupture de l’équilibre thermique. Mais des calculs effectués en gravitation quantique montrent que des particules pourraient avoir été créées massivement par le champ de gravitation rompant l’équilibre thermique. Tout cela reste à confirmer.

Violation du nombre de baryon A l’instar du nombre de leptons, le nombre baryonique est égal au nombre de protons, neutrons et autres particules exotiques du même genre – le nombre de leurs antiparticules. Il correspond en fait au nombre de quarks (composant ces particules) moins le nombre d’antiquarks. Il est conservé dans toute interaction. La désintégration du méson K favorisant la matière ne suffit pas car un méson est formé d’un quark et d’un antiquark. Ce processus ne modifie donc pas le nombre baryonique. Il faut une violation du nombre baryonique pour avoir plus de protons que d’antiprotons (on a la même problématique avec le nombre leptonique d’ailleurs, mais celui-ci inclus les neutrinos, très difficiles à détecter, et donc difficile à estimer, tandis que les protons composent la matière ordinaire, les noyaux des atomes, et c’est donc les protons qui constituent l’essentiel de la matière visible). Aucun processus de ce type n’est connu. Il existe une théorie, appelée supersymétrie, qui unifie les fermions et les bosons. Cette théorie est particulièrement élégante et séduisante. Elle résout de plus certains problèmes de la physique des particules. Elle prédit une instabilité du proton (qui aurait toutefois une durée de vie considérable,

aucune désintégration de proton n’a jamais été observée malgré de gros efforts) et donc une violation du nombre baryonique. Cette théorie n’est pas encore confirmée. Et les données actuelles du LHC, le plus puissant accélérateur de particules jamais construit, ne sont pas vraiment en sa faveur. Mais elle n’a pas non plus été invalidée et la porte est encore largement ouverte. Il faut encore attendre. Les solutions restent encore spéculatives.

V.2. Antigravité

Attraction universelle On sait que toute masse de matière attire la matière, c’est la loi de Newton de la gravité universelle. Par exemple, la Terre attire la pomme qui tombe de l’arbre, le Soleil attire les planètes qui tournent autour de lui. Etant donné la symétrie entre matière et antimatière et étant donné que la gravité est invariante sous les transformations C, P et T, on doit également avoir la même loi d’attraction universelle pour l’antimatière. Mais que dire si les deux sont ensemble ? Est-ce que la matière et l’antimatière s’attirent aussi ou est-ce que dans ce cas la gravité est répulsive (antigravité) ?

Formulation gravitationnelle de l’antimatière Il est possible de formuler différemment le passage de la matière à l’antimatière tel que nous l’avons fait en faisant intervenir la masse des particules et les effets de la gravité. Dans cette formulation spéculative, la violation CP est reliée à la masse des particules. Cette formulation reste spéculative.

Univers jumeaux L’évolution de l’univers dans son ensemble est essentiellement dictée par la gravité et donc par la théorie de la relativité générale (théorie relativiste de la gravitation d’Einstein). Cette théorie donne, par exemple, une solution avec un univers homogène en expansion tel que nous l’observons. Mais il y a d’autres solutions possibles. Par exemple, il est possible d’avoir des univers jumeaux. Deux univers totalement symétriques avec des flèches du temps inversées, la naissance de l’un étant la fin de l’autre. L’univers jumeau serait constitué entièrement d’antimatière, expliquant le fait que dans notre univers on y voir seulement de la matière. Le seul contact entre les deux univers serait ces extrémités et les effets de la gravitation. On constate que dans notre univers, une partie de la masse présente nous échappe. Lorsque l’on observe le mouvement des étoiles dans la galaxie, le mouvement des galaxies dans les amas de galaxies ou d’autres effets (la déviation de la lumière par la gravité, appelé effet de lentille gravitationnelle) on constate que la masse totale doit être beaucoup plus grande que la masse observée. On appelle cela la masse manquante.

Dans cette théorie, cette masse manquante serait due aux effets gravitationnels de l’univers jumeau. Les trous noirs sont des états extrêmes des étoiles très massives qui se sont effondrées sous leur propre poids à la fin de leur vie. Elles sont tellement denses que même la lumière ne peut s’en échapper au-delà d’un horizon appelé aussi horizon des événements (car on ne peut avoir aucune information issue de ce qui se passe en dessous de l’horizon). Ces trous noirs sont maintenant observés un peu partout et ils sont bien décrits par la relativité générale. La plupart des trous noirs sont en rotation rapide. Il existe une vitesse de rotation limite au-delà de laquelle un trou noir prend la forme d’un anneau. D’après la formulation issue des univers jumeaux, le passage par le centre de l’anneau provoquerait une inversion du temps et un échange matière – antimatière. Ces trous noirs constitueraient donc des portes entre notre univers et son jumeau. Dans cette théorie, matière et antimatière se repoussent sous la gravité. Mais l’inversion de sens entre univers jumeau et le nôtre implique une interaction attractive entre les deux univers, non pas répulsive.

Données expérimentales Cette théorie fait très « science-fiction » et elle reste encore fort spéculative. Mais qu’en dit l’expérience ? La théorie habituelle dit que la violation CP des mésons B doit être plus faible que celle des mésons K car les mésons B ont une durée de vie beaucoup plus courte, ne laissant pas beaucoup de temps aux oscillations de prendre place. A contrario, la théorie basée sur la gravité dit que la violation CP des mésons B doit être plus forte car ils ont une masse nettement plus élevée. Les mésons B ont été largement étudiés par l’expérience Babar et leurs propriétés décryptées. Les résultats sont en faveur de la théorie orthodoxe. On a pu aussi dresse des cartes de la masse manquante, que l’on appelle parfois matière noire car la plupart des astrophysiciens pensent qu’elle est constituée d’une forme inconnue de matière n’interagissant pratiquement pas avec les ondes électromagnétiques. Ces cartes ont été dressées en étudiant les anomalies gravitationnelles. Les constations sont que la matière noire est distribuée à peu près comme la matière ordinaire, ce qui est normal en présence d’une attraction. Mais on observe aussi des écarts très instructifs (par exemple, lorsque deux galaxies entrent en collision, elles freinent et fusionnent à cause de la viscosité du gaz qui les constituent. La matière noire, elle, continue sur sa lancée formant deux halos de part et d’autre). Les résultats sont que la matière noire se comporte comme un fluide extrêmement chaud et sans viscosité. Ce qui serait le cas de particules massives interagissant peu avec le champ électromagnétique. De plus, la masse manquante est nettement plus élevée que la masse ordinaire. La situation est donc loin d’être symétrique.

Tout cela ne va pas en faveur d’une explication gravitationnelle de l’antimatière.

Vérification directe Il reste à observer directement les effets de la gravité : est-ce que sur Terre les antiatomes tombent ou s’envolent ? C’est difficile à vérifier. L‘idéal serait de le vérifier avec, par exemple, des positrons. Malheureusement, ces particules sont chargées électriquement et les forces électromagnétiques surpassent des très loin les forces de la gravité. Il faut des particules neutres comme des antiatomes. On a vu les difficultés de production et stockage des antiatomes. Mais les travaux de création et stockage existent et la vérification des effets de la gravité sont en cours au CERN. Les réponses sont pour bientôt.

VI. Références - Annie Baglin, Jean-Marc Richard, Antimatière, Encycopedia Universalis.

- Jacques Franeau, Physique, Tome Premier, Editions Lielens, Bruxelles.

- Charles W. Misner, Kip S. Thorne, John Archibald Wheeler, Gravitation, W. H. Freeman and

Comany, New York.

- V. Ougarov, Théorie de la relativité restreinte, Editions Mir, Moscou.

- Feynman, Leigthon, Sands, Le cours de physique de Feynman, Mécanique quantique,

InterEditions, Paris.

- Claude Itzykson, Jean-Bernard Zuber, Quantum Field Theory, McGraw-Hill International

Editions, Physics Series.

- N. Nelipa, Physique des particules élémentaires, Editions Mir, Moscou.