方差為什麼能表示離散程度? | 知乎問答精選

 

A-A+

方差為什麼能表示離散程度?

2018年08月13日 知乎問答精選 暫無評論 閱讀 10 ℃ 次

就比如我把需要平方的地方改成四次方,把需要開方的地方開四次方,就不能這樣表示麼?關於其能夠表示離散程度我無異議,不過最重要的疑問在於是否只能是「平方」?

【G_will的回答(11票)】

看了一下回答,都是所問非所答啊。

我回答一下,

方差憑什麼能表示離散程度?

不憑什麼,人規定的。

就比如我把需要平方的地方改成四次方,把需要開方的地方開四次方,就不能這樣表示麼?

可以。

關於其能夠表示離散程度我無異議,不過最重要的疑問在於是否只能是「平方」?

不是。

關於另外的回答,我說幾點:

1. 為什麼不直接定義絕對值?很大程度上的原因是為了方便,使用絕對值會出現「尖點」,即不可導的點,這在很多地方會造成不便。

2. 我們約定「離散度」是一個非負概念,所以用偶次冪就可以很好的符合這一直觀概念。

【Smith Shi的回答(5票)】

1 絕對值不可取,如果是絕對值的話距離只有線性差別。而我們的感覺是,偏離遠的我們會更加關注。其實平方也是增加權重的一種方式,距離越遠,權重越大。

2 從人的思維角度來說,我們只對一個範圍內的數據敏感,太大的數我們其實沒有什麼感覺。不宜用四次方或更高次冪。

3 從計算的角度來說,平方無論從硬件還是軟件來說都比較容易實現。

【壽天學的回答(3票)】

補充一下

這是概率論裡面的內容,不同階中心矩的意義是不一樣的,不能隨便交換用。

原點矩是數學期望

一階中心矩應該恆等於0

二階中心矩就是方差,衡量隨機變量和數學期望的偏離程度

三階中心矩衡量隨機變量分佈的偏斜程度,對稱分佈時為0

四階中心矩衡量隨機變量在均值附近的聚集程度,也叫峰度,越大則數值越集中,越小越發散

【郝智恆的回答(1票)】

奇數次方有可能會正負相抵,降低離散度量吧。當然,除了平方外,絕對值也可以。方差只是度量離散程度的一種。

【崔飄揚的回答(1票)】

離散程度是一個比較含糊的概念,實際上這其中的語義暗含的是數據樣本全部的分佈信息的特徵。由於樣本的數量可能很多,分佈千變萬化,單純的幾個數學參數,是不可能反映樣本的全部離散程度信息的。

反過來說,像絕對值、方差、四階中心矩等不同的參數,(其實等同於說不同的權重分佈),反映的是樣本分佈中不同側重的信息。比如,由四階中心矩引出的峰度,其就對遠離平均值的偏移更加敏感的。兩個數量相同的樣本,在方差相同的情況下,某分佈的峰度高就意味著它的方差更多是由低頻度的大於或小於平均值的極端差值引起的,可見其提供了與方差不完全相同的信息。用絕對差值總和相同,但方差不同的例子也可以反映方差與絕對差值提供的信息有所區分的事實。

如果是泛泛地講到離散程度,那麼用絕對值差或者方差都比較合適,在這一點上,確實是人為的,因為人一方面對數據的偏離有一定的敏感,但又沒有敏感到高次冪的那種程度(個人感覺),所以一般不會取兩次以上的偶次冪。再結合可導性和計算方便性的需求,取方差為多。

但在數學演算中,哪個更「正統」完全是毫無意義的事,重要的是哪一種離散程度的刻畫更符合實際問題的性質和需求。

【張延寬的回答(0票)】

隨機變量有更廣義的數字特徵——「矩」。原點矩定義為E(X^k),中心矩定義為E{[X-E(X)]^k}。

比如一階原點矩就是期望(平均數),二階中心矩就是方差。

所以我覺得,高階的中心矩也能達到反映變量特徵的效果,但至於還是不是描述偏離程度,求高人考證。

【魏曉宇的回答(0票)】

由切比雪夫不等式,數據的離散程度能用各階矩刻畫。高階矩存在能推出低階矩存在,因而階數越低能夠刻畫的範圍就越廣,但一階矩光滑性不好,分析上難以處理,因此統計裡最常用的是二階矩。

標籤:-數學 -概率 -G_will -定義


相關資源:





給我留言