預期壽命是如何統計出來的? | 知乎問答精選

 

A-A+

預期壽命是如何統計出來的?

2019年05月17日 知乎問答精選 暫無評論 閱讀 4 ℃ 次

【王相及的回答(13票)】:

預期壽命是通過抽樣調查,算出 生命表 ,然後再從生命表中算出來的。生命表定義可見:zh.wikipedia.org/wiki/%

人口統計學家會劃一群有代表性的樣本,每年入戶調查看看上一年還活著的某個年齡段的人口,這一年還活著的概率,編纂出生命表。這個概率就可以用來計算「預期」壽命,也就是說,一個0歲的嬰兒,按這個概率來來死,他的「期望」壽命是多少。形象點說,用計算機模擬10000個樣本,按這個概率10歲前死一批,20歲前又死一批,etc. 然後算這10000個樣本的平均壽命是多少。這個計算也就是所謂的"0歲預期壽命",媒體上常常報道的其實是這個。

預期壽命不是平均死亡年齡。確切說統計平均死亡年齡沒什麼意義

我舉個極端的例子來說明,為什麼不能通過統計「去年我們國家死亡人口平均年齡」來計算預期壽命。

假設某國全部由40歲以下新移民組成。那麼在這一年間,所有死亡事件發生時,死者的年齡必然<40歲。如果統計平均死亡年齡,那麼就出現了平均壽命<40歲的荒謬結果。可見平均死亡年齡是嚴重受人口年齡結構影響的,醫療條件一樣時,年齡結構年輕的國家大量死亡事件必然出現在年輕人身上,算出來的平均壽命必然低,所以沒有任何指標意義。

第三個問題,「1970年的人還沒死怎麼算預期壽命」? 題主給的數據,其實是 "1970年統計的預期壽命",也就是回答 "1970年如果出生一個孩子,按照1970年的生活水平,預期壽命是多少?「我上面說了,通過入戶調查,1969年定一批包含各個年齡段有代表性的樣本,1970年再統計一下這些人還活著的概率,就能很容易算出來。

所以不難看出,預期壽命的提高 = 各個年齡段人口在一年內死亡概率下降。而不是」死的人越來越老"了。

【niaocu的回答(2票)】:

謝邀。問問題的大概是位中學生小朋友,所以我可能答得囉嗦點。

先解釋下統計術語:預期壽命,其實就是平均壽命。之所以被稱為『預期』,大概源自統計學中的期望值(expected value),也就是某隨機變量(比如壽命)的概率分佈加權平均數,體現該變量向某一中心值聚攏的集中趨勢

壽命之所以是隨機變量(random variable),首先是因為你觀測到的的每個人的壽命都不一樣,所以是個變量。而之前冠以隨機的修飾,則表明該變量對於短期、個別觀測對像來說是無法預測的,在長期、大量觀測來說卻存在某種有規律、可預測的模式。單就一個人的壽命來說,你無法預測:迪拜王子富甲天下卻英年早逝;鄰居某位流浪街頭撿垃圾為生的老太卻可以活到80幾歲。但是對人群進行大量觀察,死亡率就是一個相對固定的數字:比如美國18-22歲年齡段男青年的死亡率是0.15%,同年齡段女青年的死亡率是0.05%——每10000名該年齡段裡頭大約有5位會死去,只是不知道厄運會降臨哪5個。

對於隨機變量,計算期望值的目的就是用於描述其分佈的中心,以此作為典型值(typical value)、『一般來說』值(generally-speaking value)、以及預測值。比如當有人問你,中國人在2011年能活多長,雖然魯迅的兒子周海嬰(1929-2011)活了82歲、佛山『小悅悅』(2009-2011)只活了2歲,但你給的回答卻會用平均值——73.49歲,表明一般來說,中國人會活到73歲多。顯然,73.49歲不是具體就某一個人而言,只是反映一種向心傾向,提供一種猜測。

--------------正式回答分割線---------------

問題1:2011年預期壽命為73.49歲,應該是統計該年去世的人的壽命,然後得到的平均數。而不是你所理解的『「2011年還活著的人能活73歲」或「2011年出生的人可以活73年」』。

因為活著的人,你根本不知道他還能活多久,算平均壽命時,不會用到活人的數據,而只會用死者的數據。

問題2:『怎麼統計的』,如問題1所回答的,用當年死者的年齡算平均數得到的。如果想知道還沒死的人的壽命,只能用死去的人的壽命的平均數(期望值)來預測——要知道未來,你必須先回顧過去。

問題3:調查「1970年出生的人平均壽命有多少」怎麼入手?如果要得到精確的答案,大概要等該年出生的所有人都去世後,你才能回答這一問題,否則就要犯抽樣框不全的錯誤,難免被說成『以偏概全』。如果等不及,那麼有一個替代的辦法就是,用最新的人口預期壽命值來猜測。

標籤:-經濟學 -數據統計 -統計學 -統計


相關資源:





給我留言