-統計 | 知乎問答精選

 

NEW

方差分析和回歸分析的異同是什麼?

【慧航的回答(36票)】: 謝邀。 又有人提出這個問題,依稀想起來剛來知乎的時候,我跟幾個學統計學的人的辯論。 直接告訴你,方差分析是特殊情形的回歸分析,是回歸分析的特例。方差分析就是解釋變量全為分組的dummy的回歸分析。 不信?看Wikipedia: ANOVA is considered to be a special case of linear regression which in turn is a special case of the general linear model. All consid...

NEW

國內有什麼 R 相關的線上或線下社區嗎?

R = 開源統計軟件包 【阿穩的回答(8票)】 統計之都:http://cos.name/cn/ 【鄒日佳的回答(0票)】 除了上述的線上網站,還有每一年開展的全國R語言大會,今年的是5月27號及28號在人民大學 【G_will的回答(0票)】 沒有比COS更靠譜的中文R社區了。 【杜宇的回答(0票)】 再補充兩個扣扣群: 10955291和96920767 【李獻光的回答(0票)】 人大經濟論壇也有一個R的版塊~ 標籤:-數學 -數據統計 -翁詩...



如何運用斷點回歸的方法來檢測數據造假?

【慧航的回答(75票)】: 謝邀。 (回答問題之前先問個問題,running variable 該怎麼翻譯??) 這是08年JoE的paper,但是題主的問題問的不好,因為這篇文章講的不是用斷點回歸來檢測數據造假,而是要檢驗斷點回歸的running variable是不是被操縱(造假)。 比如我現在規定,全校學生某次考試超過90分的就可以上實驗班。因為這個90分對於學生來說是common knowledge,所以有些學生,可能本來可以考90分以上...



大數據時代對統計學和經濟學有何影響?

【劍橋橋頭的回答(42票)】: 統計學具體不太瞭解, 大數據對經濟學的影響如下: 短答案: 經濟學界追求 casual inference 和 大數據追求的 predictive modeling 被廣大經濟學家認為有天壤之別, 所以大數據 (或者準確的說 statistical learning方法) 對目前經濟學研究, 公共政策指定還沒有實質性的幫助. 但是提供了不少實證方面的新思路新方法, 也對計量經濟學提出新挑戰 ( 社交網絡數據 ). 未來障礙一個個突破...



目前社會科學實證研究中的「因果識別」都有哪些方法和新發展?

【JunyiHou的回答(24票)】: Sufficient statistic method 其實充分統計量這個方法不算新,但是以前一直用得不多,被主流的方法甩出好幾條街,現在重新發現他的價值,所以又重新被拿出來用。 不想看二手資料的同學可以移步 Sufficient Statistics for Welfare Analysis: A Bridge Between Structural and Reduced-Form Methods. Raj Chetty對這一方法的一個很好綜述。 一句話總結:充分統計量方法的引入解決...



預期壽命是如何統計出來的?

【王相及的回答(13票)】: 預期壽命是通過抽樣調查,算出 生命表 ,然後再從生命表中算出來的。生命表定義可見:https://zh.wikipedia.org/wiki/%E7%94%9F%E5%91%BD%E8%A1%A8 人口統計學家會劃一群有代表性的樣本,每年入戶調查看看上一年還活著的某個年齡段的人口,這一年還活著的概率,編纂出生命表。這個概率就可以用來計算「預期」壽命,也就是說,一個0歲的嬰兒,按這個概率來來死,他的「期望」壽命是...



關於網站排名,哪家網站統計的最精確?

有很多可以查詢關於網站排名、流量訪問量、頁面瀏覽量的網站,但是統計的差異卻是非常大,不知道哪家最精確。希望專家給推薦一下最好的統計網站。 【蘇秦的回答(6票)】: http://alexa.chinaz.com,這個查中國的網站 http://alexa.com外國的網站 【bettermanlu的回答(1票)】: http://Alexa.com 【王佳琳的回答(1票)】: 首先要說,問題問的不嚴謹; P. 這個網站排名是指什麼? 流量? 用戶覆蓋? 廣告收入? 廣告主...



為什麼許多變量可以用正態分佈很好的描述?

【陳浩的回答(13票)】 中心極限定理 http://en.wikipedia.org/wiki/Central_limit_theorem 注1:由@吳濤的評論,我指出一下,此定理是嚴格的數學定理,不是規律總結。 注2:應用時,注意「獨立同分佈隨機變量「這一條件。所以不是什麼都呈正態分佈。見@郝顯 的答案。 【郝智恆的回答(7票)】 我覺得不是自然界會出現正態分佈,而是我們將自然界中出現的這種隨機的現象總結抽像命名為正態分佈。我覺得不應該...



有哪些「神奇」的數據獲取方式?

【LiuCao的回答(981票)】: update: 強烈不推薦搞學術、做量化使用此方法,此方法只適用於商科PPT犬,做一些定性分析時使用。 ----- 我不是搞經濟學的,但是最近做實習,要找N多千奇百怪的data,其中有些變態的數據,找來找去都找不到。 但是在某個一霎那,你會突然發現某個report/paper 裡剛好有我們想要的數據。就像這樣: 來源:來源:http://www.colliers.com/-/media/files/marketresearch/apac/chin...



如何規範確定一條多項式曲線的階數?

【慧航的回答(11票)】: 謝邀。非常抱歉剛剛看到這個問題,希望不晚。 如果你試過上述方法不行的話,可以考慮一下cross-validation的方法。這個方法很簡單,假設你有N個樣本,那麼對於一個階數L,你做N次擬合,每次擬合把第i個變量刪掉,然後再計算第i個觀測的殘差的平方和,然後找到那個使得這個數值最小的L。即: 其中 為刪掉第i個觀測之後的估計值。 這個方法的缺點是比較慢,比如如果你有10000個觀...