物理實驗誤差測量中的不確定度是指什麼?數據表示應該怎麼寫? | 知乎問答精選

 

A-A+

物理實驗誤差測量中的不確定度是指什麼?數據表示應該怎麼寫?

2017年08月14日 知乎問答精選 暫無評論 閱讀 33 ℃ 次

【xinranli的回答(6票)】:

能問這個問題說明物理實驗課沒有白上~鼓掌撒花!你的實驗報告絕對是打動人心的!

第一次認真的回答問題,如有講的不明白的、錯誤和胡話請指出!非常感謝!

回答問題之前先繞個彎子。

竊以為誤差的處理是實驗,不僅是物理實驗,的真正重點所在。在花了大量的心血和勞動(搬磚搬磚搬磚。。。)以後得到了實驗數據,但是實驗數據意味這什麼呢?我能夠從中得出什麼結論?這個結論是否可信?如何來定量的描述它們?

打個比方說測體重。減肥一個月了,自己到底輕了多少呢?一過秤,發現少了2斤,不錯,很開心。但是如果你是做實驗物理的,一個幽幽的聲音會在腦子裡告訴你:你有63%的概率掉了0~4斤肉!如果你是一個樂觀的實驗物理工作者,那個聲音會告訴你:你減重多達2斤的可信度是50%!(喂。。。這個人做實驗已經做瘋了。。。當然數字都是隨便寫的啦~領悟一下思想就可以了~)

好了,下面回到題主的問題。在講解各種具體的公式和表達之前,首先要對基本的概念有所瞭解。

什麼是不確定度?

不確定度就是一個實驗測量量不確定的程度。(這不是跟沒說一樣嗎!)實驗數據得到的過程往往是非常複雜的。而在最終的paper/實驗報告上所展示的只能是簡潔的最終結果。那麼如何體現實驗的具體過程對結果的影響呢?甚至於理論對於實驗結果的影響?我們需要一個度量來表徵測量值的可信度,或者不確定度,它擔負著表達整體實驗過程和實驗員人品(這是什麼鬼。。)的重任。一個孤零零的數值甚至可以說是毫無意義的,就像彩票中了500萬的人不能想當然的以為下一次還會中一樣。

舉個栗子:

小李來實驗室的路上看到有剛出鍋的糖炒栗子,於是買了2斤。到了實驗室覺得不對,掂著沒有2斤啊!本著天生的物理素養,他決定用實驗的方法來驗證他的猜想。(在實驗室吃栗子還有什麼素養。。。)

首先,他搬來一個電子天平,用標準砝碼較一下准,然後栗子放上去一稱,0.875kg,果然輕了!他看了一眼天平的感量和說明書上給出的誤差,嗯,不確定度最多+-0.001kg,肯定是輕了!

這時候天邊來了一條閃電劃過他的腦洞:還有空氣的浮力!所以有可能實際上質量是1kg沒錯。怎麼辦呢?用動力學法來測吧!於是他搭了一套滑輪,找出剛才那個標準砝碼,光電門,計時器,折騰了一天,測出來質量為0.86kg,不確定度為+-0.02kg。難不成做實驗的時候栗子被人偷吃了?小李陷入了沉思。。。

我們來正經的分析一下這個小李的實驗和實驗結果。

首先澄清一件事情,我們假設小李只是腦洞大了一些,實驗操作和數據處理是沒有任何問題的。可以看到,直接的測量給出的結果比間接(動力學法)不確定度要小很多。因為複雜的實驗在過程之中會引入各種各樣的不確定度,比如滑輪有沒有摩擦呀?繩子的質量有沒有被計入啊?等等。所以給出的不確定度就會很大。在科研中,比如測量higgs栗子,錯了,粒子的質量,可以通過不同的衰變道和衰變產物來測量,有一些很簡單只要測量10個末態粒子;有一些衰變過程很複雜,需要測量100個末態粒子的參數(數字都是打比方)。那麼後一種的實驗不確定度自然會比第一種方法要大。所以一個負責人的實驗物理學家會給出盡量準確(注意不是盡量小,而是盡量正確!)的不確定度估計,來表徵他這個實驗的整體。當然了,一個自信的實驗員相信自己的技術,可能給出的不確定度偏小,一個保守的人就可能偏大。這種主觀性在複雜的實驗中是不可避免的。所以說,不確定度還和實驗員的人品有關(與之相關的,更加深入的還可以看一看關於貝葉斯統計和先驗概率的知識)。當然啦,如果為了發paper,給出的不確定度估計過於激進,自然會被同行打臉的。

好,那麼現在瞭解了什麼是不確定度和它的作用,我們來看它是如何完成這一使命的。

這裡先做一個簡單的說明,具體的可以參看段家祈《普通物理實驗》的誤差分析一章,或者任何一本概率統計的書。

我們知道,在實驗中是存在很多的隨機性的。這些隨機性具體表現出來就是在多次測量同一個物理量的時候可能得出不同的結果,並且這些結果會呈現出一定的概率分佈。而由於小李的精力和生命長度的限制,實驗不可能無限的重複下去,消除漲落得到真實值。所以我們就要做一定的假設,來表徵測量量可能的概率分佈。比如說最常提到的高斯分佈,這是由大數定律所保證的。或者說在數據量較少時使用泊松分佈來進行估計,(直觀來講,比如質量這種量總不能是負的,而一個方差與均值相近的概率分佈就會有很大的出現負值的概率,這時候很明顯高斯分佈的估計就是錯誤的了。這時候,一個看上去正確的不確定度估計可能會是2+3/-1kg)。

在有了這個分佈的估計後,就需要找到一種方法來表達它。這裡就涉及一個置信區間的問題。

置信區間是指測量值具有一定的概率落到這個區間之內。比如對於高斯分佈,使用正負1sigma來表示63%的置信概率。而當分佈不是高斯的時候,為了一致性,通常也採用63%這一概率來給出置信區間。這時候就有可能會看到正負不一致的不確定度估計。

現在就有兩個問題了:

首先,概率分佈僅僅是一個猜測,從數據中如何得到?和真實情況之間的差別怎麼辦?其次,置信區間意味著什麼?如何通過給出的區間估計和數據值分析得出結論?

首先來回答第一個問題。

數據永遠不會無限的獲得,通過數據的分佈來估計測量量的概率分佈永遠會有一定的誤差。而且一般情況線沒有條件來獲得足夠多的實驗數據進行分佈的估計。這時候有兩種辦法來解決:第一,做模擬,第二,選取合適的統計量。做模擬這個很好理解,通過計算機模擬來獲得大量的實驗數據並研究其分佈特性,然後根據這個分佈對真實實驗值的不確定度,或者說置信區間進行估計。具體細節非常冗雜了,我也說不太清楚。

選擇合適的統計量是更加有效和必須的方法。在實驗中,很少有單一的測量。一般來講實驗結果由多個測量量,或者說多個隨機變量來決定。除了普物實驗中涉及到的誤差傳遞的知識,更加科學和系統的方法是定義統計量。定義一個新的量,是所有測量量的函數,由於一定的統計特性,使得其滿足特定的分佈。比如說,n個滿足N(mean,sigma)的獨立隨機變量X1,X2...Xn的平均值滿足N(mean,sigma/n)的分佈(註:N(mean,sigma)表示期望為mean,方差為sigma的高斯分佈)。但是sigma的值我們只能給出估計值,即方差,而不能給出真實值。在數據量比較小的時候,我們就會計算標準偏差

,它作為統計量的好處在於其滿足自由度為n-1的t分佈,與隨機變量本身的方差、均值等無關,在n很大的時候,就會趨於高斯分佈。然後根據這個統計量來給出區間估計就相當準確了。這就是為什麼書上出現了很多奇怪的公式。。。他們都是為了給出合理的統計量並給出正確的區間估計。這也是題主所問的問題。前面說道的實驗員主觀的估計,會被吸收到統計量的構造之中。可以這樣理解,任何一個誤差來源都對應一個測量值以外的隨機變量,就是統計量的一個新的參數,就會使得統計量發生變化。,它作為統計量的好處在於其滿足自由度為n-1的t分佈,與隨機變量本身的方差、均值等無關,在n很大的時候,就會趨於高斯分佈。然後根據這個統計量來給出區間估計就相當準確了。這就是為什麼書上出現了很多奇怪的公式。。。他們都是為了給出合理的統計量並給出正確的區間估計。這也是題主所問的問題。前面說道的實驗員主觀的估計,會被吸收到統計量的構造之中。可以這樣理解,任何一個誤差來源都對應一個測量值以外的隨機變量,就是統計量的一個新的參數,就會使得統計量發生變化。

下面就是第二個問題,我們定義了如此醜陋的統計量,有可能一點物理意義都沒有,那麼我們是怎麼得出結論的呢?

是這樣的,真正的實驗都是在做一件叫做假設檢驗的事情,(我自己的理解也不是很深刻,詳情參見任何一本概率統計教材)。在實驗時,我們有一個理論,做出了一個假設,然後根據實驗數據來驗證這個假設,然後給出一個區間,如果實驗數據在這個區間之內,我們就有一定的概率否定假設。拿最簡單的長度測量來說,我們的實驗結果是:「一個長度真值是在10+-0.1cm之間一個值x」的假設以63%的概率不被否定(@_@報告,觀眾在這裡已經暈了。。。沒關係,看不懂就還按照「真值落在10+-0.1cm這個區間的概率是63%」來理解吧。。。沒有什麼太大的問題)。對於簡單的實驗,這一套理解似乎非常拗口。但是對於複雜的分析,就相當有用了。比如說,我們要尋找一個新的栗子,粒子, 實驗有了數據,那麼結論到底是有還是沒有呢?我們會說:這種新粒子的強度90%的置信區間為小於XX。即新粒子強度大於XX的假設都被以大於90%的置信概率否定掉了。

換句簡單的話來講,在複雜的實驗中,最重要的是給出正確的置信區間估計,這個區間才真正聯繫著最終的物理結論。

講了這麼多,就是希望看到的人能對實驗誤差的重要性有一個新的認識,能夠真正理解做實驗的人是在做什麼,為什麼實驗結果就是有說服力的,另外也能夠有更大的動力去認真的完成一篇合格的精悍的實驗報告。

如果可能的話可以去看一看概率統計和實驗數據處理方面的書,會有一些大體的瞭解。而想要真正的理解實驗中的誤差處理恐怕需要一段的時間和工作經歷。

最後來推薦幾本書好了:

段家忯 《普通物理實驗》這本書前面有一些基礎的講解,提到了關於誤差的基本概念和處理方法,包括如何進行簡單的誤差合成與傳遞,如何進行最小二乘法擬合,如何進行假設檢驗等等。

在瞭解了基本概念以後可以看一些概率與統計的書。瞭解一下關於假設檢驗的內容。

如果對這個問題非常感興趣,或者想在專業方向上深入瞭解,可以看Glen Cowan, Statistical Data Analysis. 裡面詳盡的講解了物理科研中遇到的各種實驗數據處理問題。內容稍微側重於高能物理實驗方面,因為高能實驗過於複雜,數據量巨大,想要得到令人信服的結論必須動用適當的統計方法。另外還有一本非常好的書,Data analysis in high energy physics : a practical guide to statistical methods, 這本書中講解了高能實驗中實際會遇到的各種問題和處理方法。作者是ROOT的開發者之一。專業內的同學可以來看一看。

【王奇的回答(3票)】:

這個問題涉及到很多的數學公式,無法全面的做講解,所以只是簡單介紹一下幾個知識點,希望有所幫助。

1.測量不確定度是指由於測量誤差的存在而對被測量值不能肯定的程度。

表示形式:x=「測量的平均值」+-「u(p)」,其中u為測量不確定度,p為包含真值的概率。表示真值在落在(平均值-u,平均值+u)之中的概率為p.

2.不確定度又分為A類不確定度和B類不確定度,最終的不確定度由兩者合成。A類不確定度可以用概率統計的方法來評定。B類不確定度評定是用來評定測量範圍內無法按照統計規律做評定的不確定度。

3.殘差:各測量值與平均值之間的差值。

方差:一組數值的殘差的平方之和,除以(n-1),n為數據個數

隨機變量的標準誤差(又稱根方差):方差的平方根。

平均值的標準誤差:用隨機變量的標準誤差除以(根號下n,n同上。)

這些知識點都是物理實驗數據處理中的基本問題,並且不確定度的計算不只涉及到這幾個。因為公式沒法表示,又沒辦法用語言描述,所以只能推薦去看書。在大學物理實驗的基礎教材中應該可以找到。

標籤:-物理實驗


相關資源:





給我留言