基於次線性期望(Sublinear expectation)的概率論體系有何價值? | 知乎問答精選

 

A-A+

基於次線性期望(Sublinear expectation)的概率論體系有何價值?

2019年09月20日 知乎問答精選 暫無評論 閱讀 2 ℃ 次

【王洪城的回答(14票)】:

瀉藥。

回答這個問題得從金融風險測度開始談起。

風險管理的基礎工作是度量風險,為此必須選擇合適的風險度量的指標。有關風險和風險度量的文章非常多,涉及到金融、保險、經濟和管理等諸多學科領域。其中一類方法是度量風險與某一目標值之間的離散程度,典型代表是Markwitz提出的均值-方差理論,其中把均值當作收益水平的度量,方差當作風險水平的度量。另一類是度量為了彌補潛在損失所需要準備的資本或風險溢價。典型方法是VaR(Value at Risk),該方法由J.P.Morgan提出,並很快得到廣泛的應用,並且成為事實上的標準。Artzner在1999年在金融風險測度領域取得突破性的進展,提出了風險測度的公里化理論,提出一致性風險測度模型,即CVaR。之後又有其他人研究CVaR的凸性理論,對模型做了不少改進。至此幾乎沒有中國人什麼事。

再談一致性風險測度的4條公理。對於任意隨即變量

,其中

是構成一Borel測度的概率空間,要測度X的風險就是要建立從

到R的映射,即

.

(1)平移不變性:

.

(2)單調性:

.

(3)次可加性:

(4)正齊次性:

上文提到的VaR不滿足一致性原則中的次可加性,因此受到一些學者如Artzner的批評。

山東大學的彭實戈院士提出的次線性期望理論,是用一族線性泛涵的上確界,即

,來表示次線性期望。次線性期望滿足單調性、正齊性、保常性和次可加性,其中他用保常性代替平移不變性,因為平移不變性存在不合理性,由此得到修正的一致性風險測度。定義

,則

是一致風險測度;反之若

是一致性風險期望,則

是次線性期望。次線性期望提供了穩健的方法來度量風險損失,並且滿足其他的一些很好的性質,實在是內涵豐富,結構優雅。

古典概率極限定理是概率論、統計學的基石,但是這類極限定理只能考慮可加概率或可加期望,但是事實上,很多不確定的現象不能被可加概率或可加期望所解釋,對於統計、量子力學、風險管理中的很多問題都不具備可加性,因此很多研究通過容度和非線性期望來描述和解釋這些不具備可加性的現象。彭實戈院士給出了次線性期望下隨即變量獨立同分佈的概念,得到了次線性期望下的大數定律和中心極限定理,把經典的結果從線性清醒推廣到非線性情形,能夠更好地研究風險測度和金融模型的不確定性。可見次線性期望有著深厚的理論基礎和重要性,且切合金融的實際情況,日後一定會有重要的應用的。

【知乎用戶的回答(6票)】:

我的回答:價值在於風險度量可以由非(或次)線性期望表示;完全符合金融應用特徵。

Keywords:

風險度量,Risk Measure

一致風險度量,Coherent Risk Measure

倒向隨機微分方程,Backward Stochastic Differential Equations

首先介紹點背景吧。金融中的sublinear-E或者nonlinear-E,主要是由一群喜歡找數學美感的數學家將概率論、凸分析、泛函分析應用到金融風險管理的產物,同時誕生了風險度量。個人感覺歐洲大陸,比如法國,德國,瑞士的數學家和金融數學家對其興趣勝於美國學者,所以因為流派差別,接受美國數學、數學教育影響的朋友們可能會比較陌生。

Risk Measure領域兩個極其重要的人物Freddy Delbaen(風險度量之父)和Hans Follmer在ETH Zurich完成了對RM的主要研究;而本人也受到了這一學術流派的影響:在ETH Zurich耳濡目染,偶爾能見到兩位大師和Shige Peng等Risk Measure領域大牛,接受了少量相關知識,並且在Zurich聽過一門專講Risk Measure的數學課。

References

Coherent Measure of Risk, Artzner, Delbaen, Eber, Heath

personal.fmipa.itb.ac.id

Stochastic Finance, Hans Follmer, Alexander Schied

不論sub-E還是nonlinear-E,其概念上都存在兩個內涵:

1. sub-, nonlinear-

2. Expectation

分別闡述。

1. sub-, nonlinear-

傳統線性期望linear-E可以看成一個將隨機變量映到實數的映射,定義為隨機變量在特定概率分佈下的平均值,根據數學表示,它是線性的。線性性不懂的自己去查書,任何一本概率論都有。

顯然並不是所有的隨機變量到實數的映射都是線性的,我們可以定義非線性映射;比如VaR,CVaR,它們就是將隨機變量映射到實數的非線性映射,檢查定義,它顯然不滿足線性性。sub-直覺上的理解就是由於隨機變量的off-setting effect,兩個隨機變量加起來的「期望」並沒有它們各自期望之和那麼多:對應的金融內涵是:loss random variable由於可能的相關性是在某種risk measure下是可以互相(部分)抵消的。比如

CVaR(X+Y) <= CVaR(X)+ CVaR(Y)

Risk measure是指這樣一個映射,將一個loss random variable賦予一個實數風險值,並滿足一定的常識性假設,比如monotonicity, translation invariance等。有以上例子中sub-additivity這一性質的risk measure叫coherent risk measure。根據前一段的解釋,它是更符合金融建模的。

圖片來自於Paul Embrechts在Quantitative Risk Management的講義, ETH Zurich.圖片來自於Paul Embrechts在Quantitative Risk Management的講義, ETH Zurich.

其中(Ax2)即sub-additivity。

2. Expectation

Nonlinear-E中的expectation的意思,我認為是:它們僅僅滿足linear-E的部分性質(比如translation invariance, monotonicity等),而不滿足linearity的映射。簡單地說,它就是一個比linear-E更一般的映射!如果有時間這一概念,我們可以類比linear-E定義條件期望。

出自出自people.maths.ox.ac.uk/c, Samuel N. Cohen, Shaolin Ji, Shige Peng

大家可以觀察到coherent risk measure中的sub-additivity與sublinear-E中sublinear的定義匹配的很好。於是我們可以自然地聯想到risk measure和nonlinear-E有很緊密的關係(或者存在區別)。想要知道其中內涵,我覺得還得自己去讀教材。

因此,直覺告訴我們,Nonlinear-E在金融中的應用就是:常見的多數risk measure,比如VaR,CVaR都是nonlinear-E或與它們有表示上的聯繫。這種表示理論可能就是nonlinear-E在risk measure中最偉大的應用。

此外,一些具體的risk measure或者非線性映射,經常可以用和linear-E有關的運算表示,或者它們可以由某種測度下的積分表示,比如Choquet integral,可以參考Stochastic Finance。

例如coherent risk measure可以通過linear-E這樣表示:

又比如VaR可以表示成又比如VaR可以表示成

這樣的形式。這樣的形式。

所以,直覺認為sublinear-E就是滿足非線性的一種映射,如圖片中的rho;可以檢驗這些映射滿足期望的一些性質,但又不滿足線性或者次線線;這樣的映射可以是我上文所舉的risk measure;這也就是非線性映射的金融應用了。

Risk measure的內涵還很多,遠非幾頁紙遠可以概括。根據個人所學,基礎的risk measure理論在研究定義risk measure時附帶的假設之間的關係,以及削弱假設後risk measure的性質,以及這些假設與其他什麼假設等價,或者誰強誰弱;risk measure理論和具體risk measure有什麼關係,等。

補充

關於nonlinear-E:

比較經典的有g-E和G-E,是由backward stochastic differential equations的解引導出來的映射;根據BSDE解的結構以及性質,比如comparison theorem等,就有了類似「期望」的性質,比如monotonicity等;但仍然不具有線性性。Shige Peng在此領域做出了重大貢獻;比較新的概念是ETH Zurich另外一個教授Martin Schweizer近年的學生Marcel Nutz(現在在哥大數學系任教)做出的stochastic g-E。

【陸遙的回答(2票)】:

蟹妖。

個人對金融、經濟體系沒有什麼認識,只從數學和計算機的角度談一下十分粗淺的瞭解。

首先,在計算機科學中有一個分支,叫做Machine Learning and Data Mining(機器學習與數據挖掘)。說白了,就是在已有一定數據量的情況下,從這些已有的數據中找尋規律,從而再根據這些規律做出預測。

這是目前炒的很熱的「大數據」的底層技術。

為什麼這個領域在整個計算機行業裡面如此特殊?因為這個技術領域在實現模式上與其它「傳統」應用存在本質的不同。

粗略定義「算法」為「解決問題的具體步驟」。

在絕大部分的計算機應用中,算法的創造是由程序員或者對業務體系很瞭解的人直接給出,這樣的算法經過一線的編程人員「翻譯」成計算機可識別的代碼後由計算機執行。

打個比方,計算機是運動員,算法的創造人員是教練。教練告訴運動員具體要做什麼。

但是這種模式在數據挖掘領域不是非常適用,因為在面對海量數據的時候,人很難直接在數據中找到明確的規律。所以就不存在很明確的步驟去分析數據,從而沒有直接明確的算法交給計算機執行。

因此,我們不當教練,我們當教練的教練。這就是學習型算法:我們不知道怎麼直接解決問題,但是我們知道去什麼地方找什麼資料,這些資料怎麼用,看哪一章哪一節。「教練」看完這些資料以後,總結出具體的算法,再交給運動員。這裡的「教練」不是人,是一個程序。

這些「找資料」並且學習資料的算法是以概率論為基礎。其中很重要的就是貝葉斯公式。

貝葉斯公式請度娘。雖然表面上這個公式的思想和推導過程十分簡單,但它是機器學習領域的核心思想。

舉一個例子:假設我們有二維平面上看似「隨機」分佈的n個點,現在需要找到一條直線將這些點分成兩部分。這條直線必須盡可能的保證也將尚未在平面上出現的另外m個點分成「合理」的兩部分。

在這個例子中,「合理」可以代表某種在金融領域的目標,比如「利潤最大化」。

一開始已經有的n個點就是「Training Set」(訓練數據集合),代表我們已經知道的事實。

那條直線代表某種金融領域的策略(比如重組收購)。

現在就是要找到這樣的策略,以使得這個策略對未來可能出現的另外m個點盡可能「合理」。

我們發現,為了預測未來的m個點的位置,我們需要分析現有的n個點,找到某條直線。但是,因為未來是不定的,我們只能根據現有的n個點找到未來m個點的某種分佈概率。比如,這n個點中90%出現在第一象限,10%出現在第三象限,那麼我們可以認為這樣的分佈概率對尚未出現的m個點也適用(所謂「認為」,請參考貝葉斯公式,是一種概率)。

以上只是一個十分粗略的例子,實際操縱中的數據建模是個很複雜的過程,比如那條劃分的直線在具體領域和問題上代表什麼。

另外,上例中只是二維平面,現實中很可能出現三維或者高維度的情形。

還有,上例中使用直線來劃分這些點,這個叫做Linear Classification,是一種相較而言最淺顯最不用動腦筋的劃分方式。在實際中幾乎一定會使用Non-linear Classification,比如使用一條曲線甚至曲面來劃分。

最後,上文只是Classification(劃分),還有其它多種情形,比如不是劃分多個點,而是找到曲線以使Training Set各點到曲線的平均距離最小,然後根據這條曲線預測尚未出現的m個點會出現在什麼位置(這個過程即「expectation」,使用非直線預測就是Non-linear Expectation)。

--------------------------------------------------------------------

總之,這是個十分蛋疼、糾結,又無限有用的領域。

P.S. 所謂「大數據」就是我的Traing Set足夠大,這樣規律好找,做出的預測就比較準確。

P.P.S: 這個領域不僅僅是對金融領域很有用,其實對任何需要做出預測的事情都很有用,比如淘寶給顧客推薦顧客可能喜歡的商品,比如做天氣預測等等。

【李駿的回答(0票)】:

謝邀。第一次被邀請,不過我只能遺憾的說,這個問題我不懂。我最近在做一些machine learning的東西,而且只是學生。不過我可以減少一下大家查資料的時間,並且提出一些我自己的觀點,僅供參考。

上谷歌學術上搜了相關論文,基本是彭實戈院士提出來的。從這篇Sublinear Expectations and Martingales in discrete time; 瞭解了一下相關定義。我曾經試圖想搞過模型這一塊,我粗淺的觀點是,在金融應用的領域中,一個每個人都可以提出只要合理的模型,但是為大家所承認是另外一個事情。經典模型比如股票價格符合布朗運動,引出Black Scholes模型,這些模型肯定都是有一些假設的。現實生活中影響股票價格的因素很多,你抽像一下,建立一個模型,可能有用,可能沒有用(干擾因素太多),有用的話,用的人多了,你的模型就經典了。

彭院士肯定也是抽取了金融應用中相應產品的特徵,然後建立了這個。從被引用次數看來,在國內搞金融的跟著這個潮流發發paper應該是沒問題的;大家搞金融建模的數學推導都不會出大簍子,但是假設最關鍵,看看你留下的假設是不是最關鍵的,不容易被其他東西所干擾的。

如果在實際的金融產品中用這個,要有魄力或者等其他人驗證下(當然是數據驗證啦)。

嗯,在搞這個的人中間,估計肯定有兩派觀點。

PS1:搞金融模型的被搞統計理論的鄙視,後者被搞數學的鄙視。我已經被鄙視很多年了,因為前兩個都不夠嚴謹。這個鄙視鏈很常見,不僅存在於學生,更存在於老師中。

PS2:我也不打算搞這個東西了,最近在搞計算(computational XXX).

PS3: 我認識這個方向比較厲害的人,可惜他們不玩知乎。

【宋思源的回答(0票)】:

因為 很多模型的股價波動的假設是 Geometric Brownian motion.

這個是基礎 所以就非線性了~

至於為什麼選用幾何布朗運動(我不保證漢語翻譯準確度,因為學的只有英文)是因為為了使的股價對應前一之間的幾何的增長為隨機量,就是乘以的係數為隨機量,而非直接在原來股價上增加隨機量,因為後者很有可能出現股價出現負值的情況

【徐聰的回答(0票)】:

謝邀。我也是學基礎數學的,這個方向真心沒做過。折疊吧。

【KevenHowe的回答(0票)】:

線性期望就是傳統的數學期望滿足E(x+y)=E(x)+E(y)且E(ax)=aE(x)基於此可以構建經濟學與博弈論中的廣義期望效用理論,但是線性情況無法解決Alias悖論與St.Petersburg悖論問題,故Pardoux-Peng提出的BSDE中的g-期望是一種新的非線性期望,能夠解決傳統理論的局限(還有一種非線性期望叫做Choquet期望)

【丁瑞真的回答(0票)】:

謝邀~ 很遺憾不能提供太多幫助

對於這種學科針對行的問題,需要在小領域專業範圍去詢問,同屬數學專業方向不同很有可能幫不上忙(比如我,很遺憾~)。或者你可以詢問對於如何去分析研究此知識的應用

搜索相關論文,以及相關領域人群,純理論的話去翻找學校的研究。或者有可能直接聯繫論文作者

新知識的實際應用,需要深入瞭解兩者之間的共同之處,並作出模型判斷,簡單的分析解釋不能說明什麼問題!建議做個短期的研究項目,花點時間去驗證,當然,求驗證結果,科普下!

【知乎用戶的回答(0票)】:

瀉藥~

表示不會~

【曹淼的回答(0票)】:

謝邀,才疏學淺,真的不會,抱歉。

【cherish的回答(0票)】:

謝邀。但是這個真沒學過太深,也沒做過相關研究。

只能說非線性在應用方面的確比線性有更大的優越性,線性的更傾向於研究模型、理論,非線性能更貼合實際。

求折疊。

【知乎用戶的回答(0票)】:

謝邀,不過我對這個真是外行,雖然做著統計工作,但是基礎統計和應用統計,忽略了中間的計算過程,所以對計算過程不懂,不過我覺得概率論是統計學尤其是在調查中是最基礎的,也是最偉大的理論之一,.折疊

標籤:-數學 -統計學 -概率論 -計量經濟學


相關資源:





給我留言