-數據分析 | 知乎問答精選

 



為什麼那麼多牛人成天在研究討論算法,系統自動推薦的東西還是不能令人滿意呢?

【陳鎮波的回答(61票)】: 下面是我在如何看亞馬遜個性化推送商品問題中的回答,我想對這個問題同樣有效:我記得10年前,互聯網剛興起的時候就有人研究如何通過機器算法推送用戶信息的算法,其方式和亞馬遜採用的一樣,無非是對用戶數據的深度挖掘(瀏覽行為、性別、年齡........),然後匹配用戶感興趣的廣告,這就是所謂的精確廣告投放的概念。 Amazon的給用戶推薦商品的推薦算法給用戶推薦其本...



金融行業有哪些領域需要大量運用數據分析?具體有哪些職位?

【XinZou的回答(9票)】: 就我所在的信用卡領域來說,大量用到數據分析的主要可以分為risk和marketing兩大部門。 1.Risk 1.a Modeling risk score,預測客戶default/charge off的風險。 fraud modeling,預測刷卡fraud的可能性等等 1.b Business Strategy 諸如給客戶確定credit line, APR等都需要用到數據分析,這裡面可能會用到modeling提供的各種score。 1.c Corporation Risk 諸如loss foreca...



大數據最核心的價值是什麼?

【HanHsiao的回答(609票)】: 2014年4月29日更新了兩張圖,修改一些拼寫錯誤。 - 下面是一些長篇的討論,這裡我把大數據的核心價值理解為核心商業價值。 「很多人還沒搞清楚什麼是PC互聯網,移動互聯網來了,我們還沒搞清楚移動互聯的時候,大數據時代又來了。」——馬雲卸任演講 本文嘗試從三大產業的角度將大數據的核心商業價值分類討論。 首先例舉一些大數據的典型應用,然後解釋大數據的定義,最後總結大...



為什麼廣州地鐵的客運強度這麼高?

【hat600的回答(31票)】: 首先表格反映的不是廣州地鐵運力高,而是坐的人多。廣州地鐵運能沒有上海大的。 其次題主研究的指標叫做客運強度。 - 本答案並不是針對廣州的,而是針對客運強度這個指標的。對廣州的分析也相對較少,尤其廣州是3+而不是2+,領先第二名將近0.9的具體原因並未涉及,有可能的話請其他同學補充。 - 下圖是各年度北京地鐵年客運量除以上一年末線路總長度的折線圖(含機場線,與題主口...



在數據分析、挖掘方面,有哪些好書值得推薦?

【肖智博的回答(1142票)】: 2014.2.1更新,由於經常接到私信要求在這個書單之內再推薦兩三本,每個人的行業背景也不一樣,所以就把下面的書單歸類整理一下。 入門讀物: 深入淺出數據分析 (豆瓣) 這書挺簡單的,基本的內容都涉及了,說得也比較清楚,最後談到了R是大加分。難易程度:非常易。 啤酒與尿布 (豆瓣) 通過案例來說事情,而且是最經典的例子。難易程度:非常易。 數據之美 (豆瓣) 一本介紹性的...



有什麼證據可以證明全球變暖不是因為海盜減少而引起的?

【zcwgaizhili的回答(43票)】: 我來細化一下上邊某大神,原諒我不知道如何用手機@你。 相關性不代表因果性,這句話很多人喜歡說,但是這不代表我們無法甄別真正的因果關係和虛偽的相關關係,尤其是這種顯然的謬誤。 有一些讀過一些書的半吊子,例如邏輯思維,聽到一些奇特的相關性,不禁大驚小怪,認為人類的認知方式和知識體系都完蛋了,殊不知其實已經發展出一套可以很好解決這種問題的方法了。 例如這種...



同比和環比有什麼區別?

【岳占凱的回答(11票)】: 統計學中的「環比」,就是報告期(例如某月(年)對應上月(年),上月(年)對應前月(年)的逐期之比。以一期為一環,取環環相比的形像比喻。 而「同比 」則是同期之比的意思,一般指本年某月的累計指標與上年相同月份的累計指標之間的對比。 環比增長率=(本期數-上期數)/上期數*100% 反映本期比上期增長了多少 同比增長率=(本期數-同期數)/同期數*100% 指和去年同期相...



新浪微博評論功能暫時關閉,會對用戶的行為產生什麼影響?

因為眾所周知的一些原因,新浪微博和騰訊微博會在3月31日8點到4月3日8點暫時關閉評論功能。http://www.zhihu.com/question/20151557 原因就是這樣了,但是結果未必會朝著那群人想像的方向走。 我們其實也可以把它看成是傳播機制改變對用戶行為影響的一個實驗,各位覺得微博評論關閉會對用戶行為產生什麼影響? 【楊帆的回答(27票)】: 我的第一反應是,霍矩哭了。。。 霍矩的這篇文章http://blog.devep.net/...



R 和 Python 在金融界的發展前景怎樣?

【WenTian的回答(19票)】: 國內不太清楚,只說美國。 R vs. SAS 美國大型金融機構幾乎前篇一律的用SAS。最重要原因的在於用SAS省卻了盡職調查。R作為一款免費軟件,有大量第三方的library或者package。你說你用吧,挺方便,但是每用一次你就得給這個來一次盡職調查。不然銀行內的model validation team,internal audit或者美聯儲都回來挑麻煩的。或者你不用,不過自己把所有需要的工具自己寫一遍也夠累的...



學習 R 語言對金融分析人士有何意義?

【知乎用戶的回答(49票)】: 說一說我的背景,大學裡c入門,轉入R。在學校裡弄了一陣生統與經濟。現在搞雲端理財的網站,後端是用R實現的,搞量化風險管理和資產組合的,其中要用到很多運算。R已用了有些年頭,見過一些寫金融包的男神女神,時常會通信見面(@任坤,github看過了,拜拜你哈哈),去過芝加哥的Rfinance大會,看看R在金融保險的前沿是什麼樣的。網站已經進入了第二開發週期。對R有了另一種感悟...