-機器學習 | 知乎問答精選

 



句法分析 (syntactic parsing) 在 NLP 領域的應用是怎樣的?

【金凱的回答(27票)】: 謝邀。這裡面有兩個問題:1. 在opinion extraction/IR中如何使用句法分析;2. 句法分析在多大程度上對這兩個任務有幫助(原題)。 由於我自己主要還是做句法分析本身,暫時很少做上層應用,所以簡單談談我對應用的理解,拋磚引玉。 1. 在opinion extraction/IR中如何使用句法分析。 舉幾個例子吧。 比如在opinion extraction中我們常常要抽取評價對像(aspect): 例:「...



Dirichlet Processes 是一個什麼樣的隨機過程?

【heartsteel的回答(12票)】: 今天重新擼了一遍DP,來複習一下。先說點廢話。 這問題之所以容易讓人難以摸清楚,其實是一個觀念問題。傳統意義下,當我們想到隨機變量的時候,我們都很自然的認為是對一組向量賦予它一個概率值,這種方式的引入是直觀易懂的,但是卻不是嚴格的。歷史上,概率論在被嚴格化以前確實是這麼被人們所理解,所以就會產生諸多悖論,甚至被排除在數學的大家庭以外。要理...



物理專業自學計算機應該學些什麼?

【MiloYip的回答(19票)】: 其實在計算機圖形學裡有很多與物理相關的課題,例如物理模擬(剛體、柔體、流體等)、基於物理的渲染(光源、材質、媒介等),還有一些涉及物理的跨學科課題,例如生物力學、基於物理的聲音渲染、光場攝影等等。簡單介紹幾本書 Physically Based Rendering, Second Edition (豆瓣) Fluid Simulation for Computer Graphics (豆瓣) Game Physics (豆瓣) Physics Based Animati...



Python 在網頁爬蟲、數據挖掘、機器學習和自然語言處理領域的應用情況如何?

【謝科的回答(49票)】: python在網頁爬蟲、數據挖掘、機器學習和自然語言處理領域的應用情況如何? Python的快速迭代能力讓它收到青睞。按照樓主的問題一個個回答,結合我有限的經驗: 1)爬蟲Scrapy,簡單易用。用rq-queue結合的話很容易構造一個分佈式的爬蟲。我曾經這樣爬下了整個豆瓣的好友關係圖。 2)數據挖掘裡常用的算法python裡都有實現。肖智博提到的scikit learn可謂翹楚。不僅文檔清晰,且幾乎...



機器學習數據挖掘類工程師平時主要的工作內容是怎樣的?

【何明科的回答(26票)】: 舉一個真實的例子。 背景: 當初所在的產品團隊所做的是一款類似於Steam的產品,遊戲下載是核心需求之一。但是因為國內用戶的機器普遍比較差,許多大型而高配置的單機/網絡遊戲,下載後基本跑不起來,極大傷害用戶體驗。因此為用戶下提供了配置檢測功能,在下載前根據用戶的機型配置告訴其能否玩某款遊戲 對機器配置打分以及對遊戲最低配置要求打分都是基於很粗糙的經驗公式,...



Extreme learning machine (ELM) 到底怎麼樣,有沒有做的前途?

【WeicongLiu的回答(20票)】: 利益相關:我本科時候做過這個,發過兩篇ELM的會議,其中一篇被推薦到某不知名SCI期刊。不過讀了phd之後就不做了。 我覺得做ELM這些人最大的問題在於: 1. 喜歡把以前SVM上曾經有過的一些idea直接套用。比如加入一些正則項,或者考慮imbalanced dataset,或者ensemble幾個ELM,就可以將原算法改頭換面發個新paper。因為以前SVM上這類paper太多了,照搬的話就可以寫出很多很多...



即時戰略遊戲(比如 WAR3)的 AI 是怎樣實現的?

【苗憶南的回答(171票)】: War3的AI沒有必要使用你提及的算法,或者說,根本無法使用。 有相關經驗表明,遊戲的AI如果採用神經網絡等算法,會傻得出奇。 使用學院派算法的AI總會做出匪夷所思的動作,讓人無法理解,遊戲性盡失。 其主要原因在於遺傳算法、模擬退火算法、神經網絡算法、各種分類算法等等,都是高度概括化的,旨在找到最優解/或者找到全局關係。但是我們的AI實際不需要最優解和全局關係,一是...



能否用一句話描述下究竟什麼叫「最優化」 問題?

【王小龍的回答(152票)】: 最優化,就是: 1. 構造一個合適的目標函數,使得這個目標函數取到極值的解就是你所要求的東西; 2. 找到一個能讓這個目標函數取到極值的解的方法。 下面通過兩個例子進行解釋。 一、圖像去噪 假設你手頭有一張照片《沙塵暴下依然堅持工作的攝像師》: 你打算讓計算機幫你去個噪,把圖像變清晰。你對計算機說:你打算讓計算機幫你去個噪,把圖像變清晰。你對計算機說: 你看...



如何在程序員中區分二逼和天然萌?

本人文科生一枚,基於忘了是啥理論說,人總是對自己不擅長的東西懷有羨慕崇敬之情,於是我也不可避免地對程序猿有點盲目瞎崇拜心理。 但是朋友說這樣是不對的,你得區分二逼程序猿和可愛技術宅。 於是特前來請教~ 【程劭非的回答(52票)】: 二逼程序員的特徵: 1.遇到不會的,就去google找一段現成代碼,粘上試試行不行 2.到論壇問問題,會說"求解決方案,最好有代碼",「能再詳細點嗎」 3.只要解決領導要求...



機器學習專家與統計學家觀點上有哪些不同?

【絲襪殺手Lee的回答(124票)】: 不太能同意那一大段英文翻譯來的對統計的解釋。怎麼說呢,搞機器學習的在業界用的火,統計理論比較嚴謹,在學術界的人多一些。在業界混久了,難免「能吹」,在學術界混久了難免對嚴謹性有過高的苛求。 對於這句話:統計學家更關心模型的可解釋性,而機器學習專家更關心模型的預測能力。 我想大部分統計學家不能同意吧。統計學家不是更關心模型的可解釋性,統計學家更加注重...