A relativitás elmélet alapjai

Innen: TételWiki
A lap korábbi változatát látod, amilyen 84.3.248.174 (vitalap) 2009. szeptember 12., 16:22-kor történt szerkesztése után volt.

Vonatkoztatási rendszer

Amikor egy test pozícióját, vagy pályáját akarjuk megadni, valamihez azt viszonyítanunk kell. Viszonyítási alapként felveszünk egy koordinátarendszert (origó, és bázisvektorok, illetve a rendszer időfejlődése, pl.: mozgása, forgása) és ebben tárgyaljuk a mozgásokat. Vannak kitüntetett vonatkoztatási rendszerek, ezeket Newton első törvényével tüntetjük ki: ahol a tehetetlenségi axióma teljesül, azok inerciarendszerek. Különböző mozgású koordinátarendszerekben fellépnek egyéb nemfizikai erők is, az inerciarendszerekben definícióból kifolyólag ilyenek nincsenek. A többi Newton-törvény is inerciarendszerekre érvényes.

Galilei-transzformáció

Newton második axiómája a mozgásokra vonatkozik, azonban az itt tárgyalt differenciálegyenletben van egy szabad konstans, amely a deriválások miatt kiesik, ezért erre invariáns a második axióma. Ez az invariancia a Galilei-transzformációban foglalható össze:

r^\prime=r+vt\,

t^\prime=t\,

Szavakban elmondva az egymáshoz képest egyenes vonalú egyeneltes mozgást végző koordinátarendszerekben a mechanikai jelenségek azonosan mennek végbe. Az egyes rendszerek között a Galilei-transzformációval térhetünk át.

A Lorentz-transzformáció

Amikor a XIX.-XX. század fordulóján a megpróbálták egységes képbe összehozni a mechanikát és az elektrodinamikát, egyre problémásabb lett az a felismerés, hogy a hullámegyenlet nem invariáns a Galilei-transzformációra. Úgy tűnt, mintha az elektrodinamikában lenne kitüntetett koordinátarendszer, szemben a mechanikával. A korabeliek három feloldását képzelték el a problémának, csökkenő valószínűség szerint:

  • A Maxwell féle elmélet hibás, a valódi elmélet Galilei-invariáns.
  • A mechanika Galilei-invariáns, az elektrodinamikában van kitüntetett koordinátarendszer, amelyben a fény terjedését lehetővé tevő éter nyugszik.
  • Létezik egy mind a mechanikára, mind az elektrodinamikára érvényes relativitási elv, ami nem a Galilei-féle, és ez egyben azt is jelenti, hogy a mechanika törvényeit kell megváltoztatni.

A Maxwell-féle leírást rengeteg kísérlet támasztotta alá, és minden jóslatát sikerült ellenőrizni. A második lehetőséget nem sikerült alátámasztani kísérletekkel, azonban egyre irreálisabb megszorításokat lehett rá adni, amik végső soron tarthatatlanná tették az elméletet. Az új relativitási elmélet kidolgozását Einstein végezte el, két posztulátumra építve:

  • A természet törvényei, és a kísérleti eredmények azonosak az egymástól csak egyenes vonalú egyeneltes mozgásban különböző inerciarendszerekben.
  • A fénysebessége véges, és forrásának mozgásától független.

Ha feltesszük, hogy a tér izotrop, továbbá az új transzformáció is csoportot alkot a Galileihez hasonlóan, és megengedjük, hogy az idő is transzformálódjon az áttéréskor (és nem szeretnénk véges sebességekből kiindulva végtelen sebességeket kapni a transzformációk és sebességösszeadások során), akkor a 2. posztulátumból és az izortópiából következik az ívelemnégyzet állandósága (ds^{2}=dt^{2}-dx^{2}-dy^{2}-dz^{2}), a többi feltételből pedig levezethető a Lorentz-transzformációk alakja (1+1 dimenzióban):

t^\prime=\gamma(t-\frac{v}{ c^{2} }x)

x^\prime=\gamma(x-vt)\,

ahol \ \gamma =  \frac{1}{ \sqrt{1 - { \frac{v^2}{c^2}}}} a Lorentz-faktor.

A c konstans értékét a kísérletek adják meg, itt csak az derül ki, hogy határsebesség, mégpedig felső, az kísérleti tény, hogy ez egyezik a fénysebességgel.

A Michelson-Morley kísérlet

A relativitás elmélet kialakulása felé az egyik nagy lökést ez a kísérlet szolgáltatta azzal, hogy nem mutatta ki az éter hatását. Az elméletileg feltételezett éter a fény terjedésének közege lett volna. Ha ez igaz lenne, akkor a közeghez képest relatív mozgást végző megfigyelő másnak méri a fénysebességet. A kísérletet ezért félév különbséggel megismételték, ekkor ugyanis a Föld éppen ellenkező irányban halad a feltételezett éterben, akármilyen mozgást is végez az. A kísérleti elrendezés egy fényforrásból állt, annak a fényét egy féligáteresztő tükörrel kettéosztották, majd az azonos utakon visszaverődő fénysugarakkal interferenciát hoztak létre. Ez az elrendezés ha az azonos utakon más a fénysebesség eltérést tesz láthatóvá az interferencia segítségével. Az elméletileg megjósolt eltérések a vizsgálati időpontokban nem jelentkeztek, ezért erőteljesen kétségessé vált az éter elmélet tarthatósága.

A Lorentz transzformációk következményei

A Lorentz-transzformációk képleteiből több a klasszikus gondolkodással szembenálló jelenség vezethető le. Ezeken felül hasznos, a különböző rendszerek közötti összefüggések is levezethetőek.

Az inerciarendszerek relatív sebessége

Ahogy korábban láttuk, a Lorentz-transzformációk is csoportot alkotnak. Belátható, hogy a transzformáció csak a sebességtől függ, ezért egyparaméteres a csoport, ekkor van úgynevezett kanonikus paramétere. Ez azt jelenti, hogy ha egymásután csoportelemeket hattatunk, akkot az eredő transzformáció előállítható az egyes elemek paramétereinek összegeként (analógiaként gondoljunk 2D-s forgatásokra: az eredő forgatási mátrix előállítható a részforgatások szögeinek összegeként). A Lorentz-transzformációk ezen paraméterét rapiditásnak nevezzük, ez tehát összeadódik. Definíciója: \chi = \operatorname{arcth}\frac{v}{c}

Levezethető a transzformációs szabályokból, hogy bármely két inerciarendszer (amelyek között a \chi paraméterű Lorentz-transzformáció visz át) relatív sebessége:

V=c \cdot \operatorname{th}\chi

amiből az is következik, hogy ez a sebesség nem lehet c-nél nagyobb. VIGYÁZAT Ez az egész csak 1 idő és 1 tér dimenzióban igaz, amikoris a tér-tengely egyirányú a sebességgel. Az általános eset bonyolult, azt érdemes megjegyezni, hogy két egymás utáni, de különböző irányú rendszerbe való áttranszformáció (boost) eredője egy megfelelő irányú boost és egy forgatás. Ennek ellenére a rapiditás paraméter az egyirányú boostok kezelésére igen alkalmas, például egy kísérletben a nyaláb és a labor rendszer közötti transzformációkra, amikor a lényeges mozgások egy irányba esnek.

Sebességek összeadása

Az előző formulából a tangens-hiperbolikusz szögösszeadási formuláját felhanszálva:

V_3=\frac{V_1+V_2}{1+\frac{V_1 V_2}{c^{2}}}

Ennek kis sebességű (v << c) határesete visszaadja a klasszikus V_3 = V_1 + V_2 formulát.

Paradoxonok

A paradoxonok az egyidejűség relativitására vezethetőek vissza: ha egy koordinátarendszerben adott egy két esemény, akkor létezik olyan koordinátarendszer is, amelyekben ezek egyidejűek, illetve olyanok is, ahol az egyik, és olyanok is, ahol a másik történik hamarabb.

Az egyidejűség relatív, függ attól, hogy a koordinátarendszerek mekkora sebességgel mozognak egymáshoz képest!

A legfontosabb paradoxonok a következőek:

  • Az álló megfigyelő a mozgó tárgyakat rövidebbnek látja: Lorentz-kontrakció
  • Az álló megfigyelő a hozzáképest mozgó rendszerekben eltelő időt hosszabbnak látja: idődilatáció.
  • Ikerparadoxon: két iker közül az egyik a Földön marad, a másik egy gyorsuló űrhajóban elmegy, majd visszajön a Földre. Ez utóbbi személy fiatalabbként ér vissza. A gyorsuló rendszerekben inerciarendszerváltás történik, ezekben a pillanatokban változik az egyidejűség is.


Sajátidő

A relativitáselmélet egyik elsőre szokatlannak tűnő következménye az idő relativitása, az, hogy az idő az egymáshoz képest mozgó koordinátarendszerekben nem ugyanúgy telik. Az álló koordinátarendben levő megfigyelőhöz képest (fénysebességgel összemérhető sebességgel) mozgó rendszerben az idő lassabban telik. Érdemes kiszámolni egy a téridő általános görbéje mentén mozgó részecske számára eltelt időt (azt az időt, amit a részecskével együtt mozgó óra mérne). Ha a részecske mozgása nem egyenletes, akkor a hozzá rögzített koordinátarendszer nem inerciarendszer, de minden pillanatban választható egy pillanatnyi inerciarendszer, aminek a sebessége pont megegyezik a részecske sebességével. Egy általános inerciarendszerben (legyen ez a megfigyelő koordinátarendszere) fel lehet írni (egy t pillanatban) a részecske pályáján számított infinitezimális ívhosszat: \operatorname{d} s^2 = c^2 \operatorname{d} t^2 - \operatorname{d} x^2 - \operatorname{d} y^2 - \operatorname{d} z^2 Ez az ívelemnégyzet megegyezik a pillanatnyi inerciarendszerben felírt ívelemnégyzettel. A pillanatnyi inerciarendszerben a részecske áll, így itt \operatorname{d} x' = \operatorname{d} y' = \operatorname{d} z' = 0, csak az idő telik, így:  \operatorname{d} s^2 = \operatorname{d} s'^2 = c^2 \operatorname{d} t'^2. Ebből kifejezhető a részecske pillanatnyi inerciarendszerében vett infinitezimális időtartam:

 \operatorname{d} t' = \operatorname{d} t \sqrt{1 - \frac{ \operatorname{d} x^2 + \operatorname{d} y^2 + \operatorname{d} z^2 }{c^2 \operatorname{d} t^2 } } = \operatorname{d} t \sqrt{1 - \frac{v^2}{c^2} }


Itt v a részecske sebessége a megfigyelő inerciarendszeréhez képest, a t időpontban. Ha adott a részecske pályája a megfigyelő rendszerében (a megfigyelő rendszerében eltelő idő függvényében), akkor az előző egyenletet integrálva megkaphatjuk, hogy mennyi \tau idő telik el a részecskével együtt mozgó rendszerben a megfigyelő rendszerében eltelt T idő alatt:

\tau (T) = \int_0^{\tau} \operatorname{d} t' = \int_0^T \operatorname{d} t \sqrt{1 - \frac{v^2}{c^2}}

Az első integrál a mozgó rendszerben van felírva, ezt írtuk át a megfigyelő rendszerében elvégezhető integrállá, v a részecske pillanatnyi sebessége a megfigyelő rendszerében. A gyökös kifejezés értéke mindig kisebb, mint 1, így láthatóan a mozgó rendszerben eltelő idő rövidebb: \tau < T. Az első integrál mindig a pillanatnyi inerciarendszerekben értendő (amikhez képest a részecske áll), így  \operatorname{d} t' = \frac{\operatorname{d} s}{c}, így a kiszámolt \tau mennyiség a téridőbeli görbe ívhosszával arányos. A \tau mennyiséget a részecske sajátidejének nevezzük, és értéke bármely inerciarendszerből számolva ugyanaz (az ívhossz invariáns), így jól alkalmazható a téridőbeli görbék paraméterezésére.


4-es formalizmus, kinematika

A helyvektor

A téridőben egy pontot egy valamely inerciarendszerhez viszonyított 4 (egy idő- és 3 tér-) koordinátával lehet meghatározni. Érdemes ezeket egy 4 komponensű vektorba foglalni: x = (ct,x,y,z). A vektor komponenseit jelölő indexet ebben az esetben fentre szokás tenni, és a számozás 0-tól indul. Így: x^0 = c t \quad x^1 = x \quad x^2 = y \quad x^3 = z. Az indexeket általánosan görög betűkkel szokás jelölni (egy egyenletben x^{\mu} jelölheti az x 4-esvektor bármelyik komponensét; \mu=0,1,2,3)

Áttérve egy másik koordinátarendszerbe egy Lorentz-transzformációt kell elvégeznünk. A transzformáció kifejezhető a fenti vektor egy mátrixxal szorzásával: x'^{\mu} = \sum_{\nu = 0}^{3} \Lambda^{\mu}_{\nu} x^{\nu}, ahol \Lambda a Lorentz-transzformáció mátrixa (az összegzőindexe alul van). A továbbiakban az ehhez hasonló képletekből a \sum jelet elhagyjuk (ahogy az az irodalomban megszokott), a kétszer (egy alul és egy felül) előforduló indexekre automatikus összegzés értendő. A Lorentz-transzformáció mátrixa például x irányú boost esetén:


\Lambda^{\mu}_{\nu} = \left ( \begin{array}{cccc} \operatorname{ch} \chi & \operatorname{sh} \chi & 0 & 0 \\ \operatorname{sh} \chi & \operatorname{ch} \chi & 0 & 0 \\ 0 & 0 & 1 & 0 \\ 0 & 0 & 0 & 1 \end{array} \right )


Alsó indexes vektorok, abszolút érték

Az alsó indexes vektorok bevezetése a metrikus tenzor segítségével történhet, ami a speciális relativitáselméletben:

\eta_{\mu \nu} = \left ( \begin{array}{cccc} 1 & 0 & 0 & 0 \\ 0 & -1 & 0 & 0 \\ 0 & 0 & -1 & 0 \\ 0 & 0 & 0 & -1 \end{array} \right )

Megjegyezzük, hogy a metrikus tenzor -1-szerese is jó választás lenne, az irodalomban mindkettő előfordul, egy relativitáselmélettel foglalkozó számolás elején érdemes leszögezni, hogy az ember éppen melyik konvenciót használja. Az alsó indexes vektorokat az x_{\mu} = \eta_{\mu \nu} x^{\nu} képlettel definiáljuk (itt is természetesen \nu = 0,1,2,3-ra összegzés értendő), így x_{\mu} = \left ( c t, -x, -y, -z \right ). A metrikus tenzorral szorzást az indexek lehúzásának nevezzük. Az egyenletekben általános szabály, hogy egy indexnek mindkét oldalon ugyanott (vagy alul, vagy felül) kell szerepelnie. Természetesen az indexek lehúzása invertálható, az alsó indexes vektorokból a x^{\mu} = \eta^{\mu \nu} x_{\nu} összefüggéssel kaphatunk felső indexeseket, ahol az \eta^{\mu \nu} az alsó indexessel numerikusan megegyező mátrix, algebrai értelemben azonban az inverze, az alsó és felső indexes \eta-kat összeszorozva a 4 \times 4-es egységmátrixot kapjuk:

 \eta^{\mu \nu} \eta_{\nu \rho} = \delta^{\mu}_{\rho} = \left ( \begin{array}{cccc} 1 & 0 & 0 & 0 \\ 0 & 1 & 0 & 0 \\ 0 & 0 & 1 & 0 \\ 0 & 0 & 0 & 1 \end{array} \right )

Ha egy alsó indexes vektort akarunk transzformálni, ahhoz a Lorentz-mátrix indexeit is le- illetve fel kell húznunk, ami a vektorindexekhez hasonlóan tehető meg.

Egy 4-esvektor abszolútértéknégyzetén az x_{\mu} x^{\mu} = \eta_{\mu \nu} x^{\mu} x^{\nu} szorzatot értjük. Ennek a lényege az, hogy ilyen definíciókkal számolva egy infinitezimális elmozdulásvektor abszolútértéknégyzete éppen az ívelemnégyzetet adja:

\operatorname{d} x^{\mu} \operatorname{d} x_{\mu} = c^2 \operatorname{d} t^2 - \operatorname{d} x^2 - \operatorname{d} y^2 - \operatorname{d} z^2 = \operatorname{d} s^2

Általános 4-es tenzorok

Természetesen nem csak a koordináták, illetve a különbségeik alkotnak 4-esvektort, hanem bármilyen olyan 4 fizikai mennyiség, amik egy másik inerciarendszerbe áttérve a koordinátákhoz hasonlóan (a megfelelő Lorentz-transzformációs mátrixxal) transzformálódnak. Ilyenek például az elektrodinamikában a potenciálok (az elektrosztatikus potenciál és a vektorpotenciál 3 komponense).


Be lehet vezetni a többindexes 4-estenzorokat is, ezeknek az a definíciója, hogy a másik koordinátarendszerbe áttérve mindegyik indexük a 4-esvektorokhoz hasonlóan transzformálódik:

 F'^{\mu \nu} = \Lambda^{\mu}_{\rho} \Lambda^{\nu}_{\sigma} F^{\rho \sigma}

Az elektrodinamikában például az elektromos és mágneses térerősségek komponenseiből lehet egy 4-es tenzort alkotni.

A fizikai egyenletekre való követelmény az, hogy mindkét oldalon ugyanúgy transzformálódó mennyiségek legyenek.


Pontrészecske pályájának a leírása

Egy pontrészecske mozgását egy inerciarendszerből nézve megadhatjuk annak a pályáját (azaz a 4-es helyvektort) valamilyen paraméter függvényében. Az egyik legegyszerűbb választásnak tűnik, hogyha a részecske koordinátáit az inerciarendszerbeli idő függvényében adjuk meg. Sok esetben hasznosabb viszont, ha a koordinátákat az eltelt sajátidő függvényében adjuk meg (azaz a x^{\mu} (\tau) függvényt adjuk meg), ami a geometriában a görbék ívhossz szerinti paraméterezésének felel meg (az sajátidő az ívhosszal arányos).


A részecske sebességénél egy adott rendszerből nézve megadhatjuk az abban a rendszerben mért sebességet (a koordináták idő szerinti deriváltját), ez az adott rendszerben jellemzi a mozgást. (Az idő egy négyesvektor komponense, így minden rendszerben más, így az idő szerinti deriválás eredménye nem lesz négyesvektor.) Hasznos bevezetni a részecske 4-es sebességét, ami a helykoordinátáknak a sajátidő szerinti deriváltja:

u^{\mu} = \frac{\operatorname{d} x^{\mu}}{\operatorname{d} \tau}

Mivel a hely négyesvektor és a sajátidő skalár, ezért a négyessebesség is 4-esvektor lesz, viszont a komponensei nem mérhetőek közvetlenül, a szokásos sebességméréssel a klasszikus mechanikában megszokott hármas sebességet tudjuk mérni. Kihasználva a sajátidőre vonatkozó \operatorname{d} \tau = \operatorname{d} t \sqrt{1 - \frac{v^2}{c^2}} összefüggést, a négyessebesség komponensei kifejezhetőek a mérhető hármas sebességgel:

u = \left ( \frac{c}{\sqrt{1 - \frac{v^2}{c^2} } }, \frac{\mathbf{v}}{\sqrt{1 - \frac{v^2}{c^2} } } \right )

Itt \mathbf{v} a hármas sebesség (a helykoordináták idő szerinti deriváltja a megfigyelő inerciarendszerében).

A négyessebesség abszlútértéke: u_{\mu} u^{\mu} = \frac{c^2}{1 - \frac{v^2}{c^2} } - \frac{v^2}{1 - \frac{v^2}{c^2}} = c^2


Érdemes még definiálni a négyes gyorsulást is, amit a négyessebesség további (sajátidő szerinti) deriválásával kapunk:

a^{\mu} = \frac{\operatorname{d} u^{\mu}}{\operatorname{d} \tau} = \frac{\operatorname{d}^2 x^{\mu}}{\operatorname{d} \tau^2}

A négyessebesség abszolútértékére kapott egyenlőség deriválásával könnyen belátható a a_{\mu} u^{\mu} = 0 összefüggés is.


Egyenletesen gyorsuló mozgás

(ez egy jól követhető, szemléletes példa lenne az előző szakaszban bevezetett fogalmakra és gyakorlati alkalmazásukra)


Dinamika, részecskék ütközése

Négyesimpulzus, impulzusmegmaradás

A nemrelativisztikus esethez hasonlón bevezetjük a részecskék négyesimpulzusát:

p^{\mu} = m u^{\mu} = \left ( \frac{m c}{\sqrt{1 - \frac{v^2}{c^2}}}, \frac{m \mathbf{v}}{\sqrt{1 - \frac{v^2}{c^2}}} \right ) = \left ( \frac{E}{c}, \mathbf{p} \right )

Az itt nem részletezett elméleti (Lagrange-féle) tárgyalásból következik, hogy a nulladik komponens a részecske energiája (a fénysebességgel osztva), a három térszerű komponens pedig a hármas impulzus. A fenti képleten egyértelműen látszik, hogy ezeknek az értéke természetesen nem egyezik meg a klasszikus mechanikában használt energiával és impulzussal (bár a fogalom hasonló), az hármas imulzusnál az eltérés a nevezőben levő gyökös kifejezés. Ha bevezetjük az m^* = \frac{m}{\sqrt{1 - \frac{v^2}{c^2}}} effektív tömeget (és az eredeti, eddig szereplő m tömeget nyugalmi tömegnek hívjuk), akkor az így adódó Értelmezés sikertelen (Hiányzó <code>texvc</code> végrehajtható fájl; a beállítást lásd a math/README fájlban.): \mathbf{p} = m^* \mathbf{v}<\math> képlet alakja megegyezik a klasszikus esetben használt összefüggéssel, ezt szokás úgy értelmezni, hogy a részecskék tömege mozgás közben megnő. Ez az értelmezés bizonyos esetekben szemléletes, más esetekben viszont elbonyolíthatja a számolásokat (hiszen számon kell tartani, hogy <math>m^* is változik, és például a deriválások elvégzésekor nem szabad elfelejteni a gyökös kifejezésben szereplő v^2-et is deriválni, illetve vannak elméletek, ahol egy másfajta effektív tömeget kell bevezetni), így a továbbiakban ezt a jelölést nem használjuk, a képletekben szereplő m mindig a nyugalmi tömeget jelöli, aminek az értéke állandó, megelégszünk azzal, hogy a 4-es sebesség és -impulzusok közötti összefüggés alakja ugyanaz, mint klasszikus esetben (ott természetesen a nyugalmi tömeg szerepel). Természetesen, ha a részecske sebessége a fénysebességhez képest kicsi (a klasszikus határesetben), akkor a gyökös kifejezés értéke majdnem 1, így határesetben a klasszikus képletet kapjuk.

A négyesimpulzus abszolútértéknégyzete (kihasználva, hogy a négyessebességé c^2):

p_{\mu} p^{\mu} = \frac{E^2}{c^2} - p^2 = m^2 c^2

Ezt az összefüggést átalakítva, az energia és impulzus (illetve a sebesség) közötti összefüggéseket kapjuk:

E = \frac{m c^2}{\sqrt{1 - \frac{v^2}{c^2}}} = \sqrt{m^2 c^4 + p^2 c^2}

Álló részecskére a híres E = m c^2 képlet adódik. Abban az esetben, ha a részecske sebessége a fénysebességhez képest nagyon kicsi, az energia sebességtől függését adó képletet sorbafejthetjük:

E \approx m c^2 + \frac{1}{2} m v^2

Az összeg első tagja az olyan reakciókban, amik nem járnak a részecskék átalakulásával, állandó, így klasszikusan nem mérhető, a második tag a klasszikus mechanikából ismert mozgási energia.

A klasszikus mechanika energia- és impulzusmegmaradási tételéhez hasonlóan a négyesimpulzus megmaradó mennyiség; egy zárt rendszer teljes négyesimpulzusa megmarad. Ez azt jelenti, hogyha egy rögzített inerciarendszerből nézünk egy eseményt, akkor a négyesimpulzus mindegyik komponense megmarad. Természetesen, ha áttérünk egy másik inerciarendszerbe, a négyesimpulzus komponenseit egy Lorentz-transzformációval kell áttranszformálni (így a komponensek transzformálódnak, egy rendszer energiája a különböző mozgó koordinátarendszerekből nézve nem ugyanaz), az viszont igaz, hogy a négyesimpulzus abszolútértéke (a részecske vagy rendszer nyugalmi tömege) minden inerciarendszerből nézve ugyanaz.

Részecskék ütközése

Relativisztikus fizika

A relativitáselméletben csak olyan mennyiségeket engedünk meg, amelyek invariánsak a Lorentz-transzformációra. Ez azt jelenti, hogy a klasszikusan ismert mennyiségeket valahogy át kell alakítani, hogy ne a Galilei-transzformációra legyenek invariánsak, hanem a Lorentzre. Az általános an levezethető 3+1 dimenziós Lorentz-transzformáció az ívelemnégyzetet változatlanul hagyja:

ds^{2}=dt^{2}-dx^{2}-dy^{2}-dz^{2}\,

Ez úgy interpretálható, hogy a relativitáselméletben a tér és az idő együtt alkot egy kovariáns mennyiséget. Hasonlót láthattunk a klasszikus geometriában, az ottani transzformációk a térbeli távolságnégyzetet (skalárisszorzatot) tartották változatlanul, ezzel definiáltuk a vektorokat. Ezzel az analógiával élve vezetjük be itt is a vektorokat, melyeket megkülönböztetésképpen négyesvektornak nevezünk, a négyesvektorok skalárisszorzatát a Lorentz-transzformáció változatlanul hagyja. A klasszikus mennyiségekből tehát négyesvektorokat kell létrehoznunk. Például:

k = \left( \frac{\omega}{c}, k_1, k_2, k_3 \right)
p = \left( \frac{E}{c}, p_1, p_2, p_3 \right)

Ez utóbbi különösen jelentős, hiszen ennek a hossznégyzete a részecske nyugalmitömegével áll kapcsolatban:

p^{2} = \frac{E^{2}}{c^{2}} - |p|^{2} = m^{2}c^{2}

Ebből az is következik, hogy ez minden rendszerben ugyanaz. Belátható, hogy az itt definiált négyesimpulzussal egybefoglalható az energia és az impulzusmegmaradás, mert a négyesimpulzus maga a megmaradó mennyiség a relativitáselméletben. Ezt átrendezve az E-p összeüfggést kaphatjuk meg, ami diszperziós relációként is felfogható:

E = \sqrt{ m^{2}c^{4} + p^{2}c^{2} }

Ez pedig álló részecskére a híres:

E = mc^{2}\,

képletet adja. Nemrelativisztikus esetekben továbbra is visszakapjuk a klasszikus képleteket. A relativisztikus dinamika alaptörvényeként a Newton-törvény relativisztikus megfogalmazását vehetjük. A klasszikus F = ma-val egyenértékű kis sebességekre az

F = \frac{d}{d\tau}p,

ez utóbbi azonban relativisztikusan is igaz, itt \tau a részecske nyugalmi rendszerében mért idő (sajátidő), ami kis sebességekre a mindenkori idővel helyettesíthető. Fontos, hogy az időderiválás alól a tömeg nem emelhető ki, hiszen ez is függ a sebességtől, tehát sebességváltozáskor ez is változik.

A fenti energia kifejezésnek van még egy fontos következménye. Ha egy rendszer két állapota közötti átmenet energia kisugárzással, vagy elnyeléssel jár, akkor az a rendszer tömegét is megváltoztatja. Ennek legékesebb példája a periódusos rendszerben megfigyelhető moláristömegek értéke. A periódusosrendszerben szereplő magok mélyebb energiaszinten vannak, mint az alkotóik külön-külön összeadva, ezért a két állapot közötti különbség valamikor felszabadult, és ekkor tömeget is elvitt, tehát a periódusos rendszerbeli tömegek mindig kisebbek, mintha a protonok, és neutronok szabad tömegét adnánk össze. Ezt az effektust nevezik tömegdefektusnak.

Az elektrodinamika relativisztikus formája (*)

Az elektrodinamika már eleve egy relativisztikus diszciplína, így a Maxwell-egyenletek relativisztikus általánosára nincs szükség. Ez úgy fejezhető ki, hogy a Maxwell-egyenletek átírhatók szembeötlően kovariáns egyenletekké.

div \vec{B} = 0

Következésképpen B felírható mint egy vektorpotenciál rotációja:

\vec{B}=rot \vec{A}

Ha ezt behelyettesítjük az elektromos tér rotációját leíró egyenletbe, akkor akövetkezőt kapjuk:

rot \left( \vec{E} + \frac{\partial \vec{A}}{\partial t} \right) = 0

így a zárójelben lévő kifejezés felírható, mint egy skalártér gradiense:

\vec{E} + \frac{\partial \vec{A}}{\partial t} = - grad \phi

Ez a \phi skalár- és \vec{A} vektorpotenciálok szokásos definíciója. Könnyen belátható, hogy a potenciálok egyértelműen meghatározzák a térerősségeket, de ez fordítva nincs így. A potenciálok rögzítéséhez mértéket szokás előírni. Ezt a feltételt pedig érdemes úgy megadni, hogy maga is szembeötlően kovariáns legyen. Olyan megszorítást érdemes megtenni, hogy a skalár- és vektorpotenciálokból egy (\phi, \vec{A}) négyesvektort lehessen csinálni.

Belátható, hogy a j_{\mu}=(\rho, \vec{j}) áramsűrűség egy négyesvektor. Ekkor az elektrodinamika kontinuitási egyenlete:

\partial^{\mu} j_{\mu} = 0

Most emlékezzünk vissza Lorenz-mérték definíciójára:

\frac{\partial \phi} {\partial t} + \nabla \vec{A} = 0

és arra, hogy ezen mértékben a négyespotenciálokra a következő hullámegyenletek adódtak:

\left( \frac{\partial^2}{\partial t^2} - \nabla^2 \right) \phi = \frac{\rho}{\epsilon_0}
\left( \frac{\partial^2}{\partial t^2} - \nabla^2 \right) \vec{A} = \frac{\vec{j}}{\epsilon_0}

Namost, mivel a jobboldal négyesvektor, és a d'Alembert operátor a koordinátarendszer megváltozásával nem változik, ezért az A_{\mu}=(\phi, \vec{A}) is négyesvektor. Négyesvektor jelölésben a hullámegyenlet:

\partial_{\nu}\partial^{\nu}A_{\mu}=\frac{j_{\mu}}{\epsilon_0}
Záróvizsga tematika
Tételek A klasszikus mechanika alapjai | A klasszikus mechanika elméleti tárgyalása | A relativitás elmélet alapjai | Egzaktul megoldható fizika problémák | Folytonos közegek mechanikája | Fenomenologikus termodinamika | Elektro- és magnetosztatika, áramkörök | Elektrodinamika | Hullámegyenlet és hullámoptika | Geometriai optika és alkalmazásai | A kvantumelmélet alapvető kísérletei | A kvantummechanika elméleti háttere | Atom- és molekulaszerkezet | A magfizika alapjai | A termodinamika statisztikus alapozása | Kvantumstatisztikák | Kölcsönható rendszerek, mágneses anyagok | Kristályos anyagok fizikája | Nemegyensúlyi folyamatok leírása | Az asztrofizika alapjai