Transformation de Lorentz — Les-mathematiques.net The most powerful custom community solution in the world

Transformation de Lorentz

Bonjour amis des maths,

Je me propose dans ce post d'exposer une démonstration détaillée des formules de Lorentz.

J'ai établi cette nième démonstration car je n'étais pas satisfait des textes que j'avais pu lire sur le sujet. Je trouvais dans tous les raisonnements que j'ai pu

analyser jusqu'à ce jour (sur internet, ou dans la littérature) un manque de rigueur ou de clarté sur certains points.

Evidemment, il n'est pas dans mes intentions de remettre en cause, voire de dénigrer, tout le travail réalisé par la communauté scientifique (les physiciens avant

tout) sur ce sujet.

J'ai écris ce texte dans ce forum, dans le seul but d'y exposer une démonstration de Lorentz que j'estime conforme à une certaine rigueur mathématique.

Merci pour vos retours.



Démonstration mathématique des transformations de Lorentz

On se limite à un espace-temps mono dimensionnel, où 2 repères R et R' sont en déplacement uniforme l'un vers l'autre à vitesse v.
Un évènement E aura pour coodonnées x,t dans R et x',t' dans R'

On part de l'hypothèse que :
x'=F(x,t)
t'=G(x,t)

avec F et G dérivables sur R*R

On suppose :
-l'homogénéité dans l'espace-temps et dans la transformation des intervalles spatiotemporel.
-l'invariance de la vitesse de la lumière
-le principe de relativité

Traduction de l'homogénéité dans l'espace-temps:
Soient 2 évènement E1 et E2 de coordonnées x1,t1 et x2,t2 dans R et x'1,t'1 et x'2,t'2 dans R'.

Si E1 et E2 sont simultannés, la distance de ces 2 évènements dans R' ne dépend que de d.

Ainsi pour 2 autres évènements E3(x3,t) et E4(x3+d,t) simultannés de R et, espacé de d dans R, leur distance métrique dans R' sera la même que celle des évènements E1

et E2 dans R'.

Autrement dit :
$$
F(x_{1}+d,t)-F(x_{1},t) = F(x_{3}+d,t)-F(x_{3},t) , \hspace{1cm} \forall (x_{1},x_{3},d,t) \in R^3*R^+ $$

d'ou

$$
\frac{F(x_{1}+d,t)-F(x_{1},t)}{d} = \frac{F(x_{3}+d,t)-F(x_{3},t)}{d}$$

et donc en faisant tendre d vers 0

$$\frac{\partial F(x_{1},t)}{\partial x} = \frac{\partial F(x_{3},t)}{\partial x}, \hspace{1cm} \forall (x_{1},x_{3},t) \in R^2*R^+ $$

Ceci nous amene à dire que

$$ \frac{\partial F(x ,t)}{\partial x} = Constante , \hspace{1cm} \forall (x,t) \in R*R^+ $$


On démontre de même

$$ \frac{\partial F(x ,t)}{\partial t} = Cte $$
$$ \frac{\partial G(x ,t)}{\partial x} = Cte $$
$$ \frac{\partial G(x ,t)}{\partial t} = Cte $$

Ainsi
x'=Ax+Bt (1a) (1)
t'=Cx+Dt (1b)

Maintenant, nous allons calculer les valeurs A, B, C et D au moyen de 4 équations.
2 découleront de l'invariance de la vitesse de la lumière,
une proviendra de la définition de la vitesse v
et une autre découlera du principe de relativité.

Considérons un rayon lumineux et tous les évènements E(x,t) ou E(x',t') sur la "pointe" de ce rayon lumineux.
En raison de l'invariance de la vitesse c de la lumière dans les 2 reprères, à tout moment x=ct et x'=ct'
D'ou d'après (1)
ct'=Act+Bt
t'=Cct+Dt

dou Act+Bt=cCct+cDt
en supprimant le t, Ac+B=c²C+cD (une première équation) (a)


Un autre rayon lumineux qui part vers les x négatifs.
En raison de l'invariance de la vitesse c de la lumière dans les 2 reprères, à tout moment x=-ct et x'=-ct'
D'ou d'après (1)
-ct'=-Act+Bt
t'=-Cct+Dt

dou -Act+Bt=cCct-cDt
en supprimant le t, -Ac+B=c²C-cD (une deuxième équation) (b)

D'après (a) et (b), A=D et B=c²C (c) , il ne reste plus que C et D comme inconnues.

Maintenant, pour le point O'(0,t') se déplacant avec R', 0=A(vt)+Bt d'ou
-B/A=v= -c²C/D (d) (une troisième équation)

Ainsi comme on a 3 équation pour 4 inconnues, on va définir toutes nos inconnues par rapport à D.
D'après (c) et (d) on a
A=D
B=-vD
C=-vD/c²

Il ne reste plus qu'à découvrir D.

Prenons un observateur fixé sur O dans R qui mesure une durée de 1seconde. Il génère 2 évènements top pour marquer le début du chronomètre et la fin E1(0,0) et E2

(0,1).
Ces 2 évènements dans R' donnent E1(0,0) et E2(x', D) d'après l'équation (1b).
Donc 1 seconde dans R reprèsente D seconde dans R'

Prenons maintenant un observateur fixé sur O' dans dans R' qui mesure une seconde. Il génère 2 évènements top pour marquer le début du chronomètre et la fin E1(0,0)

et E2(0,1) dans R'.
Ces 2 évènements dans R donnent E1(0,0) et E2(x, t) d'après l'équation (1b).
1=Cvt+Dt dou t= 1/(Cv+D)
Donc 1 seconde dans R' reprèsente 1/(Cv+D) seconde dans R

Maintenant nous allons appliquer le principe de relativité.
Nous avons D=1/(Cv+D) (quatrième et dernière équation)

En remplacant C par -vD/c² on a
D²=1/(1-v²/c²)

D'ou les équations de Lorentz

Vos remarques seront les bienvenues.

Réponses

  • Salut,
    Sur le développement à partir des postulats, j'ai lu en diagonal, rien vu de choquant (pour un cas où l'espace se réduit à une droite), mais je ne vois pas non plus quoi que ce soit de neuf. Dans cette conversation Serge_s t'avait indiqué plusieurs ouvrages, j'ai déjà lu le premier (Relativité Restreinte. Bases et Applications. Claude Semay et Bernard Silvestre-Brac Dunod (2005) ) et viens de constater qu'on peut le retrouver sur internet, je te laisse comparer avec la section 2 du chapitre 6.
  • Bonjour Titi,
    Merci pour l'attention que tu as portée à mon message.

    J'avais déjà lu ce raisonnement , mais je trouvais le passage de l'équation 6.2 à la déduction que les dérivées partielles sont constantes (en invoquant l'homogénéité de l'espace temps), trop rapide ou bien manquant d'explication ou pas évidente à mon gout (voir ci-dessous).
    Dans le texte que j'expose, j'utilise 4 événements formant 2 "segments" de "même longueur" et pose par une équation l'égalité de leurs distance dans le nouveau repère R' pour en arriver à la constance des dérivées partielles (en passant par des taux d'accroissement). Et, c'est en cela que la démo me semble plus rigoureuse ou explicite.


    (Texte évoqué par Titi)
    En reprenant les notations (6.1), écrivons, par exemple, la loi de transformation
    d’une différence infinitésimale dx
    Celle-ci peut s’obtenir par différentiation
    $$dx' = \frac{\partial L_{x}}{\partial t} dt + \frac{\partial L_{x}}{\partial x}dx + \frac{\partial L_{x}}{\partial y}dy + \frac{\partial L_{x}}{\partial z}dz. (6.2)$$

    En vertu de l’hypothèse d’homogénéité de l’espace-temps, la quantité dx doit être
    indépendante de l’origine spatiotemporelle choisie, c’est-à-dire des coordonnées (t,x,y,z), et ceci en quelque point de l’espace-temps où l’on se place. Cela implique donc que les coefficients des grandeurs dt, dx, dy et dz sont indépendants
    de ces coordonnées et doivent être des constantes $$ \frac{\partial L_{x}}{\partial t} = A, \frac{\partial L_{x}}{\partial x} = B, ...$$
    Par intégration directe de la relation (6.2), on trouve
    Lx (t,x,y,z) = A t + B x + C y + D z + E (6.3)
  • Ah... Ok!
    C'est vrai que beaucoup de physiciens ont beaucoup tendance à passer par des histoires "d'infinitésimaux", ça permet de faire plein de choses sans le savoir et ça peut tourner à la marotte. Là c'est vrai que c'est un peu étrange, parce qu'avant cette formule 6.2 il y a cet extrait:
    [...] En particulier, les propriétés de transformation d’un intervalle spatiotemporel $(\Delta t, \Delta x, \Delta y, \Delta z)$ ne peuvent dépendre que de l’intervalle lui-même et non pas de la position absolue de ses extrémités.
    En gros ça signifie, comme tu l'indique que $L$ est affine, mais c'est vrai de dire ça, puis de passer par des "infinitésimaux" pour finalement y revenir, mais il est possible que ce choix de rédaction ait pour but de ne pas avoir à discourir avant d'écrire les coefficient sous la forme $\frac{\partial L}{\partial x}$.
    *****
    petite digression:

    C'est un détail qui ne te posera pas de problème, mais cje crois que c'est mieux d'avoir $L_x(x+\Delta x, y+\Delta y)= L_x(x,y)+\Delta x \frac{\partial L}{\partial x}+\Delta t \frac{\partial L}{\partial t}$ que d'une part une relation avec le $\Delta x$ et une avec le $\Delta t$. Je crois que dans ton cas, on part du principe que le "groupe d'homogénéité" (voir ci-dessous) est $(\mathbb{R}^2,+)$. Vu qu'on est sur un forum de math, on pourra aussi se demander pourquoi on peut bien se permettre d'écrire les variations sous la forme d'une constante multiplié par $\Delta x$, je n'ai pas de mal à montrer que les endomorphisme de $(\mathbb{Q}^n,+)$ sont les "applications linéaires", mais j'ai un petit doute avec $(\mathbb{R}^n,+)$. Si quelqu'un a une idée, un lien ou un exercice, ça m'intéresse, et pendant qu'on y est, j'ai parfois un problème de définition sur les branches des maths, si pour $(\mathbb{Q}^n,+)$, je classe ça en algèbre sans me poser de question, pour $\mathbb{R}$, je ne sais pas si ça se classe en algèbre, en topologie, ou en analyse :-S.

    fin de la digression.
    *****
    Je vais me permettre ces commentaires, même si il est possible que tu vois aussi les choses ainsi:

    Pour un maximum de "rigueur et clarté, je te conseille de définir un maximum de notions qui sont utilisées dans les postulats, là on a au moins trois termes super importants. Notons qu'en ce qui concerne les deux premiers termes, l'interprétation qu'on fait des postulats c'est plutôt "dans chaque référentiel galiléen, ces trucs sont respectés, mais en plus l'action d'une transformation de Lorentz n'opère qu'un isomorphisme sur l'action de groupe en question" (enfin j'interprète ça comme ça, il y a beaucoup de définitions trop implicites en physique et on se débrouille comme on peut).
    - Homogénéité: La définition en lien passe par l'action d'un groupe sur un ensemble, notion qui est probalement très importante en physique, mais hélas on peut avoir un master en physique théorique sans n'avoir jamais entendu cette expression. Ici on postule que la transformation de Lorentz doit respecter l'homogénéité, c'est ce que tu fais ici avec tes variations et le groupe $(\mathbb{R}^2,+)$.
    - Isotropie: Je sais que tu t'en fous parce que ton espace n'a qu'une dimension. Je n'ai hélas pas la définition rigoureuse de cette notion, je crois que c'est une sorte d'homogénéité sur des "directions" autour d'un point (la direction, j'ai une idée de ce que c'est quand je peux définir les notions de chemins et de droites, ça se fait bien dans certains espace métrique). Notons bien que dans le développement, on ne se pose pas de question, on part complétement d'un espace euclidien qu'on sait être homogène et isotrope (on aime bien les espaces métriques et affines, je crois bien que parmi eux, seuls les espaces euclidiens sont isotropes) et on prend $(x,y,z)$ des coordonnées d'un repère cartésien.
    - "structure de groupe des transformation de Lorentz" (tu préfères parler de "principe de relativité"), au delà de l'associativité des fonctions qu'on peut composer ensemble et de l'existence de la réciproque, je crois que la notion pertinente désignée par cette expression est encore une fois liée à l'homogénéité de l'ensemble des référentiels galiléens.

    En ce qui concerne les postulats que tu as choisis: tu préfères postuler que la vitesse de la lumière est la même dans tout les référentiels, j'aime bien ce qui est dit dans l'introduction de la section 6.2 du livre et le point de la page 108 sur le paramètre $\kappa$, ça remplace ton postulat par un autre, qui se présente juste sous forme de choix sur un paramètre que tu es obligé de fixer: ce truc est nul et tu retombe sur "galiléen classique", sinon, on met un pied dans la relativité restreinte...
Connectez-vous ou Inscrivez-vous pour répondre.
Success message!