本篇文章使用的是複數歐幾里得空間,其實很多的書籍教授的是採用閔可夫斯基度規的形式,但鑑於個人偏好本人只提供了一種方式的推導,物理思想是相通的,希望對採用另一種方式的同學也有點幫助。
另外,如果你需要的話,本篇文章也提供slidev(你也可以從中導出 pdf 等格式)。
在學習物理競賽的過程中,我曾發現中文資料中關於狹義相對論 (STR) 四維矢量的文章乃至書籍都極為稀缺。鑑於此,我希望能結合個人所學,撰寫一篇相關文章,以期為有志於此的同學提供一份學習參考。
為什麼要使用四維矢量#
在學習 STR 的時候,我時常會為各種場景的 “本徵” 狀態而煩惱,很多練習題的解析甚至是題目本身存在著一定的謬誤,這也是我對場景的理解變得紊亂。可是用這種 “經典” 的變換式為什麼會感到這麼的違反直覺?究其根本,大概是我們腦中對時間,空間的理解建立在經典的伽利略時空,可是這在愛因斯坦的狹義相對論理論是行不通的,因為它的時空並不是獨立的,這基於狹義相對論的兩個公設:
- 光速不變原理:真空中的光速在所有慣性參考系中都是同一個常數,與光源和觀察者的運動狀態無關。
- 相對性原理:物理定律在所有慣性參考系中的形式都相同;不存在一個 “絕對靜止” 的慣性系。
根據這些我們可以得到什麼結論呢?
由光速不變,我們可以導出 x2+y2+z2−c2t2=0
這一結論的導出只需設想不同時間段兩束光的波陣面的方程即可得到(這裡不再贅述,比較不是介紹 STR 的基礎文章)
看到這裡,既然是舊有的時空體系導致了理解的複雜度,那麼是否有一種方式來解決呢。答案是肯定的,閔可夫斯基就提出了這樣的一種空間,因為其實狹義相對論本質上就是洛倫茲群的不變式的理論,故而只要構造這樣的一種時空,便可以優雅地解決這個問題,那就是閔可夫斯基時空。
閔可夫斯基時空中的基礎四維矢量#
由上述的不變式
x2+y2+z2−c2t2=0
我們可以得到第一組四維矢量
(x,y,z,ict)
那麼如何由他得到基礎的洛倫茲變換呢?也即是 (x,y,z,ict) 與 (x',y',z',ict') 的關係。
從一般變化式出發
x′y′z′ict′=a11a21a31a41a12a22a32a42a13a23a33a43a14a24a34a44xyzict
接下來就是考慮坐標原點 O 在 S′ 系中的運動方程
x′=a14t ,y′=a24t , z′=a34t , t′=a44t
vx′=dt′dx′=−v , vy′=dt′dy′=0 , vz′=dt′dz′=0
對坐標原點O’,應有速度關係
a11vx+a12vy+a13vz+a14=0a21vx+a22vy+a23vz+a24=0a31vx+a32vy+a33vz+a34=0
vx=v , vy=0 , vz=0
a44=γ
則由以上式子可以得到
x′=γx+a12y+a13z−γvty′=a22y+a23zz′=a32y+a33zt′=a41x+a12y+a13z+γt
將上式代入
x′2+y′2+z′2−c2t′2=0
再加上位置空間的各向異性得
x′2+y′2+z′2−c2t′2=x2+y2+z2−c2t2
由系數對比可知
γ=±1−β21 , β=cva41=c2γv , a12=a13=a42=a43=0a222+a232=a322+a332=1 , a22a23+a32a33=0
又因為y-z空間的變化為恆等變換,應該有
a22=a33=1 , a23=a32=0
再由v=0的變換為恆等變換可知 γ 為正
綜上可得到
x′y′z′ict′=γ00−iγβ01000010iγβ00γxyzict
這就是最基礎的時空坐標四維矢量,那麼還有哪些比較基礎的四維矢量呢
- 四維波矢
kp=(kx , ky , kz , icω)
可以通過
kr−wt=0
來理解
- 四維電流密度矢量
jp=(jx , jy , jz , icρ)
可以通過
∇⋅j+∂t∂ρ=0
來理解
- 四維動量矢量
pμ=(px , py , pz , icW)
其實我們可以用這些量來推導很多的四維矢量
比如四維速度,就是對時空坐標進行微分,不難得到
Uμ=dτdxμ=γ(u,ic)
不難看出
pμ=mUμ , jp=ρUp
而對於動力學,對 P 進行微分既可以得到四維力矢量 K,這裡不再贅述(btw,其實他也可以用四維加速度去得到,有興趣的讀者可以自己推導一下)
四維矢量的特性#
其實講了這麼多,我們還是沒有很好介紹一下四維矢量的特性,但這是我們後邊解決實際問題的關鍵,下面我來介紹一下幾個四維矢量的特性
洛倫茲協變性#
這是四維矢量的一個重要性質,下面我們來推導一下
這是四維矢量的一個重要性質。在狹義相對論中,物理定律的形式在所有慣性參考系中都相同。這意味著物理量在洛倫茲變換下應保持某種不變性。四維矢量的引入正是為了在數學上實現這種不變性。對一個四維矢量 X=(x,y,z,ict) 和另一個四維矢量 Y=(x′,y′,z′,ict′).它們的內積定義為:X∘Y=xx′+yy′+zz′+(ict)(ict′)=xx′+yy′+zz′−c2tt′此內積是一個標量。在所有慣性參考系中具有相同的值。因此在洛倫茲變換下保持不變。我們來推導一下。設四維矢量 X 在 S 系中表示為列向量 X.在 S′ 中表示為 X′.且它們通過洛倫茲變換矩陣 L 相關聯:X′=LX。類似地,Y′=LY。(值得注意的是,在採用虛時間分量 ict 的坐標系中,洛倫茲變換矩陣 L 是一個正交矩陣。)即它滿足 LTL=I,其中 I 是單位矩陣。這個性質確保了在變換後內積的數值不變。)那麼,變換後的四維矢量 X′ 和 Y′ 的內積為:X′∘Y′=(X′)TY′=(LX)T(LY)=XTLTLY由於洛倫茲變換矩陣 L 在虛時間坐標系中滿足正交條件 LTL=I,因此上式變為:XTLTLY=XTIY=XTY=X∘Y這證明了洛倫茲協變性:在經過洛倫茲變換後,四維矢量的內積數值保持不變。這一特性使得我們可以通過構造洛倫茲不變量(如四維矢量的模長)來簡化對物理量的處理。而不必擔心選擇不同的慣性參考系會導致數值變化。例如,四維矢量的模長 X∘X=x2+y2+z2−c2t2 在任何參考系中都是不變的。
一些特殊四維矢量的內積與守恆#
- 四維速度的內積
U∘U=U∘U=−c2
- 四維動量的內積
P∘U=m(U∘U)=−mc2=−E0 , P∘P=−m2c2
- 四維動量是守恆的
你是否注意到因為洛倫茲協變性,我們可以得到
P∘P=−(cEtot)2+p2 , P′∘P′=−(cE0)2
這就是著名的相對論能量 - 動量關係
Etot2=E02+p2c2
那麼這樣的話對光子就有
Etot=−p⋅c , P∘P=0
四維矢量解決各類時空與碰撞問題的妙用#
相對論情形下的多普勒效應#
由四維波矢,可以得到
kx′=γ(kx−c2vω) , ky′=ky , kz′=kz , ω′=γ(ω−vkx)
即有
ω′=γω(1−cvcosθ)
這就是相對論情形下的多普勒效應
粒子碰撞堙滅產生光子#

對各個粒子,會有以下四維動量:
- 入射粒子:
P1=γm⋅(v , 0 , 0, ic)
- 靜止粒子:
P2=M⋅(0 , 0 , 0, ic)
- 垂直出射的光子束:
P3=chf1⋅(0 , 1 , 0 , i)
- 傾斜出射的光子束:
P4=chf2⋅(cos(θ) , −sin(θ) , 0 , i)
由四維動量守恆有
P1+P2=P3+P4
可以得到:
E_1 + E_2 = E_3 + E_4\\
E_1 \cdot \frac{v}{c} = E_4 \cdot cos(\theta) \\
E_3 = -E_4 \cdot sin(\theta)
\end{gathered}
所以可以有
E42−E32=E12⋅c2v2(E1+E2)⋅(E4−E3)=E42−E32E4−E3=E1+E2E12⋅c2v2
又有
c2v2=1−γ21=1−E12E22=E12E12−E22
得到
2⋅E4=E1+E2+E1+E2E12⋅E12E12−E22=E1+E2+E1−E2=2⋅E1
所以
E_1 = E_4 \\
E_2 = E_3
\end{gathered}
cos(θ)=cv=1−E12E22
光照射粒子產生新粒子#

對各個粒子,會有以下四維動量:
- 入射的光:
P1=chf⋅(1 , 0 , 0 , i)
- 靜止粒子
P2=M⋅(0 , 0 , 0 , ic)
- 新粒子
P3
由四維動量守恆可以得到
P1+P2=P3
平方有
P1∘P1+2P1∘P2+P2∘P2=P3∘P3
若原來的粒子相當中 >> 新的粒子,則有:
0+2⋅h⋅f⋅M+(M⋅c)2≈(M+2⋅m)2⋅c2
化簡就可以得到
h⋅f≈2⋅m⋅c2+2⋅m2⋅c2/M=2⋅m⋅c2⋅(1+Mm0)
由此可知:如果涉及的粒子是電子,那麼入射量子的能量必須至少是產生粒子的靜止能量的兩倍。
粒子的完全非彈性碰撞生成一個新粒子#

對各個粒子,有以下四維矢量:
- 入射粒子:
P1
- 被入射粒子:
P2
- 生成粒子 :
P3
由四維動量守恆可得:
P1+P2=P3
平方可得
P1∘P1+P2∘P2+2P1∘P2=P3∘P3
即為
m12+2γ1γ2m1m2⋅c2(c2−v1v2)+m22=m32
這就可以得到
m3
而由四維動量守恆可以得到:
v3=γ1⋅m1+γ2⋅m2γ1⋅m1⋅v1+γ2⋅m2⋅v2
粒子的完全彈性碰撞#

對各個粒子,有以下四維矢量:
- 入射粒子:
P1=γ1m⋅(v , 0 , 0, ic)
- 靜止粒子:
P2=M⋅(0 , 0 , 0, ic)
- 生成粒子 1:
P3=γ3M⋅(wcos(θ) , wsin(θ) , 0 , ic)
- 生成粒子 2:
P4=γ4m⋅(rcos(α) , rsin(α) , 0 , ic)
由四維動量守恆有
P1+P2=P3+P4
平方可以得到
P1∘P1+P2∘P2+2P1∘P2=P3∘P3+P4∘P4+2P3∘P4
又因為
P1∘P3+P2∘P3=P3∘P3+P4∘P3=P3∘P3+P1∘P2
可以得到
P1∘P3=γ1⋅γ3⋅m⋅M⋅(c2−v⋅w⋅cos(α))P2∘P3=γ3⋅M2⋅c2,P3∘P3=M2⋅c2P1∘P2=γ1⋅m⋅M⋅c2
可以解得
由能量守恆和動量守恆便可以解得了
γ4=γ1+mM−mM⋅γ3rx=(γ1⋅v−γw⋅mM⋅wx)/γrwx=w⋅cos(α)β=sin−1(rx/r)
康普頓散射#

對各個粒子,有以下四維矢量:
- 入射的光:
P1=chf⋅(1 , 0 , 0 , i)
- 靜止粒子
P2=m⋅(0 , 0 , 0 , ic)
- 新粒子 1
P3=chf′⋅(cos(θ) , sin(θ) , 0 , i)
- 新粒子 2
P4=γm⋅(v , ic)
由四維動量守恆有
P1+P2=P3+P4
平方可以得到
P1∘P1+P2∘P2+2P1∘P2=P3∘P3+P4∘P4+2P3∘P4
即是
P1∘P2=P3∘P4
又因為
P1∘P3+P2∘P3=P3∘P3+P4∘P3=P1∘P2
即是
λh⋅λ′h(1−cosθ)+m0⋅c⋅λ′h=m0⋅c⋅λh
得到了
λ′−λ=m0⋅ch⋅(1−cosθ)
這就是康普頓散射的經典結論!
逆康普頓散射#

對各個粒子,有以下四維矢量:
- 入射的光:
P1=chf⋅(1 , 0 , 0 , i)
- 高速粒子
P2=γ2m⋅(v , 0 , 0 , ic)
- 新粒子 1
P3=chf′⋅(1 , 0 , 0 , i)
- 新粒子 2
P4=γ4m⋅(v′ , 0 , 0 , ic)
由四維動量守恆有
P1+P2=P3+P4
平方可以得到
P1∘P1+P2∘P2+2P1∘P2=P3∘P3+P4∘P4+2P3∘P4
即是
P1∘P2=P3∘P4
又因為
P1∘P3+P2∘P3=P3∘P3+P4∘P3=P1∘P2
即是
γ2mc22⋅h⋅f⋅h⋅f′+h⋅f′⋅(1−cv)=h⋅f⋅(1+cv)≈2⋅h⋅f
若 v 接近於 c,會有
h⋅f′⋅(γ2m0c21⋅h⋅f+21⋅(1−cv))=h⋅f
這就得到了 f 與 f‘的關係!
對四維矢量的思考#
我希望這篇基礎的介紹性文章可以給你一些啟示,但其實四維矢量的妙用遠不只於此,鑑於篇幅問題這篇文章便想在此作結了(也許後邊可以開個系列記錄一下:P 我們看到四維矢量為理解相對論現象提供了統一且優雅的數學框架,希望這些可以給你一些啟示與思考,也許有時候抽象的數學工具可以大大推動我們對物理的思考。
PS:對於四維矢量可不可以再中學物理競賽使用的問題,我目前的經驗是對於極其有把握的題目可以嘗試,但是一旦出錯不要有念想會有過程的分數,沒辦法物理競賽也是應試,最基礎的最經典的方法往往最受青睞(但是四維矢量用來驗證還是很好的:D