彭博、萬得之類的數據終端,其數據權威來源於哪裡? | 知乎問答精選

 

A-A+

彭博、萬得之類的數據終端,其數據權威來源於哪裡?

2016年07月09日 知乎問答精選 暫無評論 閱讀 89 ℃ 次

【BruceAshbey的回答(13票)】:

我把數據歸為兩類,一類叫做標準數據,一類叫做非標準數據。

所謂的標準數據就是誰做都知道這個數據什麼是對的,比如說行情

不同的數據公司不可能收盤價不一樣。同樣還有諸如財報數據,因為有權威的數據發佈源,所以同樣的公司的銷售收入大家一定都是一樣的。

另外一類數據是非標準數據,很大程度上是在標準數據上做的衍生加工,大家的方式方法、模型不同導致了最後的數據結果不同。你很難說誰一定對,誰一定錯。典型的比如說盈利預測數據和EDB中的一些數據。

有了以上的概念以後,我這裡只講標準數據,因為非標準數據裡面牽涉到的問題太多。

標準數據,從國內來說,數據源相對來說比較單一,就是個大交易所和相關的機構網站

他們提供了相應的數據發佈,特別是上市公司的財務報表和各類重大事項,因為披露的要求所以通過交易所網站都能獲得。但是這點在國外就有點不同了,很多國家沒有這種要求,所以需要數據公司到各個公司自己的主頁上面去收集年報數據,從這點來說國內的數據還算比較好做的。

至於數據加工的過程中,裡面涉及到的東西太多了,不同的數據有不同的方式方法。僅僅以財務數據舉例。因為國內的財務報表格式基本統一的,所以處理的過程自動化程度很高,基本上都是自動入庫的,然後人工做一些審核。錯誤率基本上很低,財務數據大概一個報告期因為錄入原因導致的錯誤一般來說不超過5個,而且很快都能發現的。國外的錄入相對來說更先進,見過某家(因為商業關係不方便說具體名字)介紹錄入平台,他們系統完全處理好,人也只是在上面審核打鉤而已。因為工作沒有太多的技術含量,所以歐美的這類公司一般都會把類似的工作放到印度、菲律賓等國家。

那麼財務數據處理的難點在哪裡?其實是格式的統一,特別是海外公司不同行業,不同國家有自己的財務會計標準,所以難度在於如何把不同會計準則的報告歸並到一個統一的財務格式中,這個需要很強的財務背景的人設計相應的模型,這個也是我上面提到的各家模型不同可能會導致數據不同的原因之一。順便說一下,美國上市公司財務數據處理最好的不是bloomber也不是Reuters而是Compustat,現在在標準普爾下面。

最後說一下這個行業的價值。很多人覺得是數據值錢,我導一下數據就可以了。恰恰相反,歷史數據不值錢,因為太容易copy了。這個行業的技術含量在於持續生產數據的能力,再往下轉化下去就是對數據處理的規則。你能看到原始的數據,你能知道最後出來的表結構,但是背後有太多的數據規則,這個需要很長時間的消化和積累,也算是行業的一個重要門檻。

最後ps一點國內的現狀,因為巨潮和深交所的關係,所以國內絕大多數的數據提供商都開始轉為購買巨潮的數據了,包括wind也是購買巨潮的數據。甚至有公司因為購買了巨潮的數據把自己錄入國內財報數據的團隊給砍了,真正從最原始的pdf處理到數據庫裡面的已經很少了,更多的已經是在做數據的再加工工作了。

【陳傑的回答(6票)】:

感謝

其實用的人多了,就成為了標準,比如wind,大部分機構研究人員都用,即使研報中數據錯誤,也會引用數據來源於wind。

這裡只說財報,行情數據都來源於交易所下的信息公司,差別不大。

先說說三家公司:

Bloomberg,起源於債券交易,後來是新聞、其經濟數據質量比較高。起源是美林的一個類似定制項目。後續定位從交易端轉向媒體。

Wind,主要是數據終端,整體業務發展很傳統。但還算能踩在點兒上。是個不錯的本土公司,契機是互聯網的發展,使其快速成長。

Reuters,發展還比較中規中矩,現在是Thomson Reuters,也是較早進入國內的行情終端機,那時候期貨公司看外盤行情,都用它。但是由於定價策略,使其發展規模有限。後來被國內某信息公司擊敗,但是中國情結一直都在。

再說數據從哪裡兒來:

一般來說國內的數據來源於以下幾個方面:

1、上市公司資料,來源於交易所下面的數據商,比如巨潮

2、有些內容是結構化直接入庫,有些非結構化需要人工收錄,如財報附錄部分

3、行業數據,中經網之類的,一些商品的現貨數據也有從慧聰或阿里來。

4、一些特殊行業的收錄,需要與行業協會洽談收錄。

數據的質量:

1、一般財報發佈是一個集中的過程,數據團隊需要24小時的輪班倒。這裡就產生一個時效性問題。因為信息商發來數據後,需要有核對,補充,收錄的過程。

2、目前來講,我覺得Reuters的數據質量和時效性,以及數據錄入KPI機制最好。從機制上他們是按錄入量和質量給bonus的。這樣有效的保證了數據的質量。

3、收錄的全面性,市場預期--數據發佈--後續影響分析--橫縱向分析等。其實很多公司都想做產業鏈的分析,但是真正做到上下游關聯,對於數據的收錄和展現都是個挑戰,到最後都是交織在一起,很難三維立體的表達。

就到這了,休息,休息一會兒。若有偏頗,請其他大神補充。

標籤:-數據 -金融工程學


相關資源:





給我留言