百度和 Google 的搜索技術是一個量級嗎? | 知乎問答精選

 

A-A+

百度和 Google 的搜索技術是一個量級嗎?

2017年08月09日 GOOGLE, 百度, 知乎問答精選 暫無評論 閱讀 6 ℃ 次

【KennyChao的回答(2714票)】:

很多答案是從使用上講的,我加兩個技術方面的。

  1. 搜索引擎需要對抓取到的結果進行管理。當索引結果越來越多時,保證存儲和查詢速度,保證數萬台服務器內容一致的難度越來越高。Google於03至06年左右公佈了三篇論文,描述了GFS、BigTable、MapReduce三種技術以解決這些問題。由於Google並沒有公佈算法細節,因此由雅虎牽頭,在06年左右建立了開源項目Hadoop,目的是根據Google的三篇論文,實現一個大規模的管理計算系統。但直到08年,Hadoop同Google公佈的一些關鍵指標仍有幾倍的差距。百度曾經由王選院士的一個博士帶領,想基於Google論文獨立實現(金字塔計劃)一個自己的系統,但開發難度過大項目夭折,最終也轉向了Hadoop。如今,Amazon、Facebook、Yahoo包括百度都在大規模應用Hadoop,而Google已經從2010年開始遷移到新的三駕馬車Caffeine、Pregel、Dremel上了。單就搜索技術而言,Google不是領先百度,而是領先全世界。
  2. 2009-2012年,Google公佈了世界上第一個全球化的數據庫系統Spanner,這套系統將分佈在全球各地的數據中心連接到一起,利用原子鐘和GPS,打破了地理間隔,實現了全球規模具有一致性和實時性的數據庫。在Google之前,很多人認為這種系統不可能做出來,但Google做到了[1]。

另外,除了搜索,Google在深度學習和機器人方面也是全球領先的,尤其是後者。儘管百度也有深度學習研究院,但在這兩方面跟Google比起來完全是空白。

事實上,讓百度來和谷歌比是很不公平的,搜索只是Google的一個部門,但卻是百度一整個公司。Google的競爭對手是Apple、Amazon、Facebook和Microsoft,百度的競爭對手是360、搜狗。Google沒了搜索,還有Chrome、Android、Youtube,百度沒了搜索,那就什麼都沒有了。

[1] Exclusive: Inside Google Spanner, the Largest Single Database on Earth

【君臨的回答(3349票)】:

好吧,既然大家都一致鄙視百度,為谷歌歡喜鼓舞的叫好,我就來插一腳,為百度打抱不平一下吧。

聲明立場:我承認谷歌在很多方面很強,這裡只是說一些百度也不錯的地方。給大家提供一些新的思維,希望能夠對大家有啟發。

1,在搜索江湖的早期歷史中,李彥宏的技術創新領先於谷歌。

1994年,infoseek公司成立,其後推出搜索引擎服務,很快成為了市場上最受歡迎的搜索技術提供商。作為技術的領先者,這家公司的產品被網景瀏覽器設置為默認的搜索引擎。要知道,在那個年代的美國市場上,網景瀏覽器佔有了90%以上的市場份額。於是,在網景春風得意的歲月裡,搜索引擎=infoseek。

——infoseek的CTO是威廉張,曾經以「次線性文本匹配算法上的突破性成果獲得了美國加州大學的計算機博士學位」,其後於2006年加入百度成為首席科學家。

——infoseek的核心研發工程師是李彥宏,其首創的「超鏈分析」技術是現代搜索引擎的基礎發明之一。這個技術率先解決了如何將基於網頁質量的排序與基於相關性的排序完美結合的問題,並獲得了美國專利。

在搜索引擎的早期發展史中,李彥宏+威廉張,無疑是技術的領先者。在1998年的布裡斯班世界互聯網大會上,李彥宏是主講台上的技術布道者,而谷歌的兩位創始人仍是坐在台下聆聽的學生而已。

infoseek的衰落,不是因為技術,而是因為商業模式,他僅僅是隱藏在網景瀏覽器背後的技術提供者。隨著網景在與微軟IE瀏覽器的競爭中失利,infoseek無可避免的出現了大幅虧損,賤賣給迪士尼後不適應於傳統企業的官僚管理作風,更加加速了自己的末日到來。

同一年,谷歌推出自己的搜索引擎,以精準廣告為商業模式,成功解決了持續成長的問題,在搜索江湖的較量中熬到了最後。谷歌今日引以為榮的網頁評級機制pagerank技術,直到2001年才被授予美國專利,比李彥宏的1996年申請的超鏈分析專利技術晚了5年。

注意:我以上這段要說的是,李彥宏的技術水平並不輸於谷歌的兩位創始人。看輕百度那你就無知了。

2,百度從一開始就和谷歌走上了不同的發展方向。

谷歌在2000年就已經建立了搜索行業的統治地位,而在這一年,李彥宏才回國創業,無論在資金還是人才上都處於絕對劣勢地位。

百度如果要跟谷歌比拚搜索精度,那是飛蛾撲火,李彥宏當然不會犯下這種蠢事。從一開始,百度所選擇的就是一條農村包圍城市,側翼攻擊的路線。

在早期的網頁搜索上,百度的原則是能用就行。所以,你在百度上搜到的,幾乎都是網站的首頁,而谷歌的都是內頁。

百度的真正重點是,提供谷歌不能提供的服務。2002年,百度率先推出mp3音樂搜索,2003年推出圖片,貼吧,新聞,搜索風雲榜服務。正是這些多元化的垂直服務,讓百度實現了在中國市場上的後來者居上。如果你瞭解百度的歷史,你就知道,在早期的百度流量中,mp3盜版音樂的搜索和下載,一度貢獻了40-50%的用戶來源。貼吧同樣獲得巨大成功,在2004年的超級女聲熱潮中,大量的音樂粉絲湧入貼吧為他們的偶像加油,這個產品一度為百度帶來了超過20%的流量。

mp3,圖片,貼吧,是百度早期最重要的三項服務,他們的流量貢獻加起來甚至超過了網頁搜索。

3,百度真正在搜索技術上開始發力,是在2009年後。這一年,百度推出框計算,在一站式生活搜索方面,開始超越谷歌。

舉個例子:

——————

判斷百度和谷歌在搜索技術上是不是一個量級的標準是什麼?

技術是不是一個量級,不是由一堆玄而又玄的技術名詞決定的,而是由行業發展過程中對實際需求的滿足變化決定的。

舉個例子,

飛機時代的劃分,

一代機:噴氣發動機

二代機:高空高速,2倍音速

三代機:中低空機動敏捷性

四代機:隱身性能

二代機比一代機性能更好,飛的更高,速度更快,但是到了三代機的時代,即使你的飛行能夠去到3萬米高度又怎麼樣?這個時代更講究的是低空的格鬥性能。

到了四代機的時代,隱身性能才是決定性的,你機動性再好也沒用了,你發現不了敵人。

到了今日,智能無人機技術又是起決定性作用的技術,其他的都不重要了。

技術的發展並不是線性的,而是理念的改變,帶來了更革命性的進步。

一架性能差點的隱形機,比一架沒有隱形性能的三代機,誰的作戰效果更好?什麼,你認為隱形技術不是技術,發動機性能才是技術?別腦殘了好不好。

說回搜索引擎技術的發展,無非就是為了讓人們更好的找到自已需要的信息,是搜索結果的準確性,而不是收錄的網頁數量,擁有的專利數量決定的。

第一代搜索引擎:以雅虎為代表,目錄式結果呈現。

第二代搜索引擎:以谷歌和百度為代表,網頁引用評級技術呈現結果,至於權重設置的不同考慮不能體現差距。

第三代搜索引擎:不知道各位的劃分標準是什麼,是什麼gps和原子鐘技術麼?實際使用中差別有革命性變化麼?反正我是感覺不出來。

谷歌的技術創新能力很強,在安卓系統、無人駕駛汽車、谷歌眼鏡這些技術上都有很多創新,但在搜索引擎技術上,我的感覺是,最近5年來並沒有明顯的進步。

相反,百度從2008年到2013年這5年,我的使用體驗感覺是進步很明顯的。

在我看來,搜索引擎發展到今天這個時代,更重要的趨勢是智能化的語義理解,而不是一樓答案所說的「gps和原子鐘技術,打破了地理間隔,實現了全球規模具有一致性和實時性的數據庫。」

收錄的網頁多一些,搜索的速度快0.001秒,這些微不足道的區別,就相當於IPHONE4和IPHONE4S的區別,或許是挑戰了新的技術極限,但是對於普通用戶的實際體驗來說,區別不大。

而三星的大屏智能手機,在很多人看來並沒有什麼高深的技術,但是偏偏是更滿足用戶的使用體驗和需求的,於是三星的市場份額就不斷壯大了。

百度所發展的框計算技術,在我看來,恰恰是更適合搜索引擎行業發展趨勢的。

讓你的搜索更能理解你的問題,給你更準確的答案,

——不用跳轉就將答案直接呈現在你的面前。什麼?你認為百度這樣違背了搜索的公平公正精神?別腦殘了,搜索就是為用戶服務的,誰能夠在最短的時間內讓用戶得到最正確的答案,對於用戶來說就是最好的搜索體驗。將來語音搜索技術成熟了,你說告訴我王菲唱過什麼流行歌?百度直接就將歌曲列表呈現出來,按熱門度排列供你選擇播放,谷歌先問你,我這裡有**,**,**,音樂公司提供的服務,請選擇,進了音樂公司的鏈接,音樂公司又說,請先登錄會員,登陸會員後……如此一番下來,誰的服務更好,自己考量吧。

——通過知道、貼吧、百科、第三方網站的接入,綜合滿足你的多方位搜素需求,而不是只提供一個單一的網頁。你想去某個地方,告訴你汽車、火車、飛機不同交通手段的通行方式,告訴你花費的時間,購買的費用,直接購買的入口,而不是只有一個冷冰冰的第三方鏈接。你輸入一個名人的名字,呈現給你相關的照片、影視作品、最新的新聞、粉絲討論的社區、與名人存在社交關係的名人鏈接,所有這些服務,都是非常直觀的,而不是只像谷歌一樣給你一個維基百科了事。

——搜索的問題不止於「等於」,而是「相當於」等類似問題都能聽懂。所謂智能,不就是即使我語法用錯了,也能聽懂麼?

在這一點上,或許谷歌在英文上也有一些應用提供,但是百度做的更加深入、更加完善,從這個角度來說,他們不但是一個量級的,百度也有領先谷歌的地方。

很多人認為百度的搜索答案都只是人工干預的結果,沒有技術含量,我感到很遺憾。

或許早年是如此,但是現在應該已經有很大的改進了。

我舉個例子。

前面的謝霆鋒的身高的問題,為什麼百度能夠給我答案,谷歌給不了呢?

百度該不會無聊到這麼細節的問題都專門去優化一下答案吧,當然不是了,這些答案都是依托於百科裡用戶自行編寫的答案,百度不過是把他們的知識有機的整合起來,通過程序的設計,巧妙的呈現到你的面前。

是的,谷歌的搜索技術很先進,但他的所有答案都是依托於外部鏈接的,他沒有自己的知識庫。這就像一個人,他的邏輯思維和知識是割裂的,可以給你答案,但這答案必然是生硬的,無法做到水乳交融。

百度不同的是,他是有自己的知識庫的,知道,貼吧,百科,這三個社區的知識可以跟他的思維進行有機整合,將得票最高的熱門答案很直觀的呈現到你的面前。

…………

正是因為有前面這些有機整合為基礎,

百度可以通過邏輯思考,a推出b,b推出c,c推出d的結論,將答案d呈現到你的問題結果裡。

但谷歌就做不到,他只能給你答案b,c之後的結論就只能由你自己去尋找了。

這就是為什麼我問張柏芝的兒子的爸爸的身高,百度能夠告訴我的原因。

所謂深度學習,不就是人類知識庫的有機整合嘛,谷歌的思維和知識庫的割裂,導致了在這方面的進步必然要慢於百度,原理就像是一個人的頭腦指揮自己的手腳必然比兩個人的合作效率更高。

因此在未來的搜索技術競爭中,我認為百度的路線是正確的。

有朋友問,為什麼你問謝霆鋒的身高就能搜到答案,我問陳冠西或者毛澤 東就搜不到呢?

請記住,這些類似問題的答案完全取決於用戶在社區裡的編寫。在張柏芝的百科裡有提及,兒子是謝振軒,在謝振軒的百科裡有提及,老子是謝霆鋒,在謝霆鋒的百科裡有提及,身高是174,那麼你就能搜到這個答案。

如果其中任何一個環節出現了缺失,你就無法得到答案。

答案的正確與否,取決於知識庫的自我完善和糾錯。就像你問百度是個大SB嗎?百度知道的高票答案告訴你百度就是個大SB。這能說明這個答案是百度的人工干預嗎?很明顯不能嘛,這只能說明SB用戶太多了而已。

就像知乎的答案一樣,開始問題提出的時候,高票答案是錯誤的,沒有關係,慢慢的新的正確答案會被頂上去,錯誤答案會被折疊或者報錯。

人類的知識庫是在不斷的自我完善和豐富的,百度的算法也是在不斷改進的,目前這些技術仍然處於起步階段,請以發展的眼光來看待他。

PS:那些說我偏袒百度的朋友們:

在這個提問下面,為谷歌敲鑼打鼓,大聲讚美的答案還不夠多麼?難道你們的心裡就不能容忍一個不同的聲音,非要我也來高呼,谷歌千秋萬代,一統江湖,你才滿意麼?!

說我不懂谷歌關鍵字搜索技巧的朋友們:

我怎麼會不懂呢?但是一定要懂關鍵字,搜索引擎才能聽懂,換個字眼,換個語法,他就不懂了,這語言理解水平也太爛了吧?你確定你不是在黑谷歌?!

搜索引擎行業的技術發展方向,一定是「自然語言人機對話+智能化邏輯思考」。 不要跟我說,百度是給你答案,谷歌是給你思考,人永遠是懶惰的動物,希望產品適應人的需求,而不是人去適應產品的要求。

在這個方面,百度的技術發展水平與谷歌的差距是越來越接近的。

須知,技術的研發來自金錢的投資和人才的聚集,百度在2008年後才逐漸擁有一定的家底,開始加大在搜索技術的研發投入;而谷歌,她的研發重點已經轉移至其他的領域了。這就是百度與谷歌在搜索技術的發展水平越來越接近的主要原因。

update:

剛剛看了百度發佈的2013Q4財報——

百度2013年度總營收為319.44億元,同比增長43.2%;淨利潤為105.19億元,同比增長0.6%。

之所以會出現,營收高速增長,而利潤停滯不前的狀況,主要的原因是著眼於未來的研發投資在以更高的速度增長:2013年全年,百度研發投入達人民幣41.07億元,相比2012年增長78.2%,佔全年總營收的比例接近13%,2012年這一比例為10%,單單在第四季度,百度的員工就增加了5300人,其中絕大部分是研發人員。

與之相比,谷歌的營收規模雖然更高,但是營收增長速度只有12%,研發投入占營收比例在12%左右。

在分析師會議上,百度強調,目前的研發重點在:移動端搜索、雲服務、LBS(基於位置的服務)三個方面。

引用一篇新聞報道:

2013年,百度多項創新技術取得突破,如人臉搜索、圖像識別、語音識別等。如今,百度已經擁有業界領先的人臉檢測、特徵點定位、性別判斷、身份識別以及大規模人臉檢索等常規的人臉識別技術。並且,很大一部分已經被廣泛用於圖像搜索、貼吧、百度知心、百度框、雲相冊、媒體雲等重要產品線上。

同時,百度的圖像識別技術也已成功產品化,如憑借趣味性和無窮創意走紅網絡的百度「實物翻譯」,用戶只需打開實物翻譯功能,對著物體拍張照,軟件就能迅速識別並翻譯成英文。百度翻譯憑借實物翻譯功能受到用戶歡迎,成為一款同類軟件根本無從模仿的應用,這不僅是百度在交互模式領域的一次具有跨時代意義的探索,更顯示其背後的巨額科研投入的努力。

提到語音識別技術,百度在經歷了摸索期之後同樣迎來了開花、結果,其語音識別準確率已經超越競爭對手。不僅如此,在「2013百度世界大會」上,百度還宣佈向開發者免費開放整個語音識別平台,致力於打造一個聽得懂人類語言背後隱藏意圖的「大腦神經系統」。

除此之外,百度在2013年更是將Deep Learning提到核心技術創新地位,建立公司歷史上第一個研究院Idl(Institute of Deep Learning,深度學習研究院)。在全球範圍內,目前除斯坦福大學等高校研究機構外,唯有百度、IBM、谷歌、微軟四家企業設立了專門研究機構,形成深度學習研究的第一陣營。

通過Idl,2013年百度在多個前瞻性科研項目上取得豐碩果實。比如,自然場景OCR,其作用是在自然場景拍攝的圖像中準確檢測並識別出其中的文字內容,它在信息搜索、地理位置信息服務、文字翻譯、盲人輔助閱讀、圖像標注、人機交互等眾多場合下有著廣闊的應用前景。

【布丁的回答(890票)】:

前百度員工,現 Google 員工,在兩個公司做的都不是搜索相關項目。

先一句話回答:在與搜索相關的基礎技術方面,百度距離 Google 仍有很大的差距,但今天是否還存在量級上的差距存疑。

開頭先扯個不相干的領域,蘇聯 1960 年代裝備的 Mig-25 [1] 截擊機,這是世界上第一款能飛雙三(三倍音速,30000米升限)的戰鬥機。西方世界面對這變態的性能參數驚詫莫名,推斷蘇聯在航空技術上已全面超越西方。直到別連科駕駛 Mig-25 叛逃西方,他們終於有機會接觸真機,才發現它使用的技術其實沒那麼先進,變態的性能指標都是用普通的技術基礎硬幹上去的,飛機非常笨拙以至有「直線戰鬥機」的稱號,可憐的發動機要真飛一次三倍音速落地就得報廢。蘇聯的航空技術並沒有他們想像的這麼逆天。

2009 年我在百度,面對 Google 公開的技術資料和百度的內部系統,我首先想起的就是 Mig-25. 就跟這臺戰機一樣,當時的百度,在中文搜索結果質量的各項指標上,對比 Google 還是有優勢。百度的工程師非常聰明,也非常努力,在某些點上也做得很細很出色,但是在與搜索相關的基礎技術上,百度還是全面落後。百度的搜索質量提高,有很大部分是依靠人工做大量細緻的策略調整硬拉上去的。

用普通技術飛上雙三,Mig-25 本身是個了不起的工程成就。下一代戰機,不管是蘇聯的 Su-27 還是美國的 F-15, 乃至四代機 F-22, 都沒有能飛出雙三來的,但這些下一代戰機在技術水準和整體性能上,無疑遠勝 Mig-25, 這應該能算得上題主所說的量級差異。技術的量級差異不能拿某個特定指標或孤例評估(Mig-25 還曾擊落過 F/A-18 呢),也不能只比較某些技術點上的優劣,而往往是決定於基礎技術水平。

在 2009 年,我可以很肯定地說百度搜索相關的基礎技術對比 Google 有量級差距。據我瞭解,這些年百度在基礎技術方面進步很快,當然同時 Google 也在快速進步。它們在今天是否有量級的差異,我不確定。

下面列幾個重要的而且公開資料較多的基礎技術:

  • 大規模機群建設與管理。Google 的情況可以參見 [2] The Datacenter as a Computer: An Introduction to the Design of Warehouse-Scale Machines, Second Edition. Google 擁有世界上最大的計算機集群,論機器數量的話能在量級上超過所有其他公司。同時,它有一整套自動化管理軟件,以便工程師申請和使用這些硬件資源(大致可以理解成一套 Amazon EC2)。就我的瞭解,現在在普通工程師使用機群硬件資源的方便程度和可以使用的量上,百度還是遠遠不及。
  • 大規模計算與存儲。Google 論文老三篇 GFS, MapReduce, BigTable 不再贅述,近年 Google 在這些方面的研發和進步沒有停滯甚至在加快。當然百度也在努力追趕,百度不僅使用 Hadoop, 而且基於 Hadoop 做了大量改進和擴展,並貢獻回 Hadoop 開源社區。百度在 SSD 存儲技術等方面也很有心得,比如 flash 存儲方面最近中了的一篇 ASPLOS '14 SDF: Software-Defined Flash for Web-Scale Internet Storage System.
  • 機器學習和人工智能。被吹得神乎其神的 deep learning 和 Google Brain 等等。在 deep learning 這個相對較新的領域,百度追趕的更快,水平也更接近。

機群管理的技術水平決定你能擁有和有效使用多少硬件資源,大規模計算與存儲決定你能在這些硬件上做多大規模的事情 —— 而最後,搜索引擎本身就是一套大規模機器學習系統。

在純技術之外,我想特別提一點極大影響技術進步,而至少在 2009 年百度與 Google 差距巨大的因素:普通工程師所能使用的工具水平。我在 Google 感覺最爽的事情是我可以很容易獲得大量的計算資源,做以前無法想像的大規模數據分析。要驗證一個想法,我可以基於一整天的搜索記錄做分析,只需幾分鐘就能得到結果(參見 [3]),進行調整和下一步分析;而如果沒有這套基礎軟件和可以隨意使用的硬件資源,我可能得等一整天才能有結果,或者只能分析小規模的抽樣數據。在我自己的知識和技術水平不變的前提下,Google 這套系統極大地提高了我的工作效率,讓我能做到以前完全無法想像的事情。

我覺得作為一個技術人員,黑或者捧哪個公司毫無意義,技術的事情很直接的,身在哪個公司都無法影響基本判斷。還在百度的時候,我就經常想,Mig-25 的故事是個很好的警示,人很容易為類似「雙三」這樣的成就沾沾自喜,而對實打實的基礎技術差距視而不見,不圖進步,那前景就相當危險了。幸好據我所知的情況,百度可沒有這麼不爭氣。

[1] Mikoyan-Gurevich MiG-25

[2] The Datacenter as a Computer: An Introduction to the Design of Warehouse-Scale Machines, Second Edition

[3] Dremel: Interactive Analysis of Web-Scale Datasets

【春雨的回答(963票)】:

我是來反對@君臨大大 及其它部分網友答案的,如果覺得有道理請點贊幫忙頂起來,謝謝!:(提醒,多圖長文)

一.

在搜索江湖的早期歷史中,李彥宏的技術創新領先於谷歌

1.我的理解,題主問題的語境是當下,就算是「曾經領先」並不能說明什麼。

2.到底是不是曾經領先呢?

在搜索引擎的早期發展史中,李彥宏+威廉張,無疑是技術的領先者。在1998年的布裡斯班世界互聯網大會上,李彥宏是主講台上的技術布道者,而谷歌的兩位創始人仍是坐在台下聆聽的學生而已。

這一說法是有一些爭議的,曾經有網友置疑過,我摘錄如下:(完整鏈接:東拉西扯:超鏈分析和PageRank的專利問題)

以前我曾在很多地方看到,李彥宏說上世紀90年代中期,他在澳大利亞講超鏈分析,有兩個斯坦福的學生坐在台下,後來這兩個學生做出了Google。不過我一直沒太搞清楚這事兒的先後次序,到底是李彥宏的啟蒙在前,還是Page和Brin的實踐在前。終於梁冬的書中找到了答案,這個會議的時間是1998年4月,地點是澳大利亞的布裡斯班。如果沒有搞錯,這應該就是第七屆國際WWW大會。不過這時候,Google的前身BackRub已經在斯坦福大學的網絡上運行了兩年多。

我在這次大會的網站上,找到了一些更有趣的信息。Larry Page和Sergey Brin著名的論文,《一種大規模超文本Web搜索引擎的分析》就是在這次大會上提交的,作為對PageRank技術最早的公開闡述,這個論文後來被大量引用。

不過,在這個網站上,我沒能找到有關Robin Li的任何信息,包含Page和Brin的網頁,倒是可以找到一些。

還有我找到的資料:

  • 李彥紅的超鏈接分析技術專利,提交時間是1997年2月5日,批准時間是1999年7月6日,鏈接:United States Patent: 5920859;
  • PageRank專利,提交時間是1998年1月9日,批准時間是2001年9月4日鏈接 :United States Patent: 6285999。
  • Google成立的時間是1998年,百度成立時間是2000年。
  • Google的服務器還放在學校的時候,由於太火爆曾把斯坦福網絡拖垮了,這從側面說明了Google的PageRank技術強於infoseek的超鏈接分析技術。(此時infoseek還有沒有用超鏈接分析技術有待考證,反正當時Google是秒殺一切其它引擎就是了)

小結:從專利提交時間上來說超鏈接分析技術專利比PageRank要早,@君臨說的似乎在理。但是,離開了時間談強弱是沒有意義的!打個比方,我會上知乎碼字,孔聖人不會,我比聖人牛逼?非也。要比技術的話,要麼比同一時間的,要麼比同一發展階段的,而這兩個,百度並不佔優。

另:@君臨這段話有點問題:

同一年,谷歌推出自己的搜索引擎,以精準廣告為商業模式,成功解決了持續成長的問題,在搜索江湖的較量中熬到了最後。谷歌今日引以為榮的網頁評級機制pagerank技術,直到2001年才被授予美國專利,比李彥宏的1996年申請的超鏈分析專利技術晚了5年。

  1. Google 2000年才開始出售廣告的,而不是Google成立的同一年。維基:Google
  2. PageRank專利提交時間比超鏈接分析技術晚了不到一年,批准時間晚了一年多,君臨拿李彥紅超鏈接分析技術專利的提交時間跟Google PageRank批准時間比是不科學的。

二.

百度從一開始就和谷歌走上了不同的發展方向

這段話我基本同意,但是這也並不能說明百度的技術比Google強,Google並非不能而是不願提供mp3搜索之類的東西,要知道這個是侵權的啊。——金錢還是底線?Google選擇了後者,多麼有節操啊!而且,為了跟百度競爭,Google甚至自己購買了一些音樂的版權,並把它們放在網上供網友下載,正版高質量音樂啊!

三.

2009年後,百度推出框計算,2013年推出輕應用,在一站式生活搜索方面,是超過了谷歌的。

谷歌2006就開始做OneBox(鏈接blogspot.com 的頁面),而百度的框計算是2009年推出的(鏈接:框計算)。時間上Google比百度早了三年,技術上,不是專業人員,無法具體分析。

-----------UPDATE------------

君臨大大更新了,再駁之:

追求網頁精度的就是技術,追求更好答案內容匹配的就不是技術?

想起了當年聯想樂應用的傳言,用客服MM們根據用戶提交的錄音手工轉換成文字內容然後反饋到手機客戶端,這個比Siri的技術更強?(未經證實,只是舉例)

谷歌在李開復時代就打不過百度,被牆的也只是一些敏感詞內容,難道你天天就只搜索敏感詞啊,市場上百分之99%的搜索需求都跟政治無關的好不好。

看來君臨大大很少用Google啊!!!!當年搜個「胡蘿蔔」都會被牆啊!!!!只因為那個「胡」跟聖上衝突了啊!!!!一牆就是10分鐘不能用啊!!!!

手機時代的劃分。

一代手機:模擬技術

二代手機:數字技術

三代手機:智能技術

君臨大大按這個邏輯得出百度跟Google是一個量級的結論,於是我得出了另一個結論:我深圳大山寨廠跟蘋果是一個量級的,你看,不都是智能手機麼?

百度所發展的框計算技術,在我看來,恰恰是更適合搜索引擎行業的「智能」發展趨勢的。

我倒覺得Google Now才是最適合搜索引擎行業的「智能」發展趨勢,你百度還要個框,人家Google直接幫你把事兒安排好了。

update:

君臨大大再次更新,再駁:

很多人認為百度的搜索答案都只是人工干預的結果,沒有技術含量,我感到很遺憾。

或許早年是如此,但是現在應該已經有很大的改進了。

我舉個例子。

前面的謝霆鋒的身高的問題,為什麼百度能夠給我答案,谷歌給不了呢?

百度該不會無聊到這麼細節的問題都專門去優化一下答案吧,當然不是了,這些答案都是依托於百科裡用戶自行編寫的答案,百度不過是把他們的知識有機的整合起來,通過程序的設計,巧妙的呈現到你的面前。

用君臨的例子,同的樣問題,張柏芝兒子的爸爸,有結果,把「爸爸」換成「爺爺」就沒結果了:

換成「謝霆鋒的爸爸」又有結果了,整合乎?人工乎?

---------------------------上面是反對,下面是看法,中間是分割線--------------------------

到底誰技術更強呢,我們來模擬一下日常使用場景:

1.娛樂類的,最喜歡李安了,想瞭解一下:

Google右邊給出了簡介,他的作品,其它用戶的搜索推薦。簡單的瞭解,掃一眼簡介,想瞭解他的作品,點擊他的電影後是這樣的:

又漂亮,又利於獲取信息,有木有?正文鏈接,除了第二個都是相關新聞外,Google給出前三的答案分別為:維基、豆瓣、Mtime,百度的是:百度百科、知乎、百度貼吧,你覺得哪個消息源更可靠?

小結:

一般人在搜索李安時想得到什麼樣的答案?作為一位名導演,通常人們感興趣的是:1.他本人的一些情況,2.他的作品,3.再延伸到他作品大概是什麼樣的。

看看Google的,簡介,看右邊,作品,在右邊下面的位置,詳細情況:維基、豆瓣、Mtime。在國內,電影類的豆瓣和Mtime應該是相關度最高,資料最全面,質量最好的的網站吧?維基百科就不用多說了,準確、公正,比百度百科只強不差。想瞭解作品的用戶呢?直接點作品,然後在頁面上面出現了他所有的作品,你可以在一個頁面內瀏覽它,又全面又方便。

百度呢?光看搜索結果頁,並不能瞭解他有哪些作品。再看具體結果:百度百科、相關新聞、知乎、百度貼吧、電影網、維基、百度視頻、百度圖片、豆瓣、追夢人李安(央視)、CNTV、百度知道,十二個結果,有五個是百度自家的,而且這樣的排序,我想不出來背後的邏輯。

下面有知友說『如果有百度百科作為這類承載為何不可』,事實上,很多Google的搜索的結果會指向百度的產品(百科、知道、貼吧),比方說同樣作為娛樂人物的周傑倫,Google結果第二個就是百度貼吧(除去新聞那一個),而Mtime和豆瓣放到第二頁去了,說明對於想瞭解周傑倫的用戶而言,貼吧的權重更高,這也更符合事實,不是麼?

所以,我的結論是在這方面Google做得更好。

2.有道題不會算,搜一下:

兩個都能達到目的,不過,Google的要漂亮一些,不是嗎?

小結:

功能都沒問題。百度的計算器默認未展開,想再次計算不太方便,界面採用類似IOS6的擬物化設計,跟整體風格不太搭配。Google的計算器默認展開,扁平化設計,風格跟網頁統一。

個人更喜歡Google。

3.再來看匯率:

都能達到目的,不過Google給出了匯率波動的折線圖。(最好的搜索方法是在兩個幣種之間敲空格,根本不用打那麼一堆的,例:「1美元 人民幣」)

小結:

兩者差不多,Google給出了匯率波動折線圖,稍勝。

3.路線搜索:

百度似乎勝一籌,但是我們再看看具體內容,百度前三結果:攜程(廣告推廣)、去哪兒(百度旗下)、百度地圖,Google前三:去哪兒、攜程、火車票網(火車時間表),在網頁最下面顯示了Google地圖。

再換一個短一點行程的:

百度,第一個是去哪兒,第二個是百度地圖。Google,第一個是地圖,第二個是火車票網(火車時刻表)。

規划行程最好的還是地圖吧?,再來比較一下:

Google默認展開最佳路線,路線相當詳細,收費路段用紅字標明,而且界面比百度漂亮,有沒有?

而且,最最最厲害的是,如果你在用Google Now,當你在google上搜索過行程後,無需任何設置,到了時間,Google Now會自動提示你,第一次使用的時候,我那個驚喜啊。。。。

小結:

百度是能滿足需求的,框內應用質量也非常高,只是我覺得百度有推自家產品之嫌。

再來看Google,我舉了兩個例子,一個長途,一個短途,從廣州到上海,很少人開車去吧?最常見的交通方式應該是飛機和火車,所以Google優先放的是這兩個。地圖放最下面,說明它的權重不夠(哪怕是自家產品),還可以滿足部分想駕車的用戶。短途,東莞到深圳,駕車的就多了吧?所以Google把地圖放在第一位了。我覺得這說明Google理解了搜索背後的那個用戶。而且如果你開通了Google Now的話,那百度跟Google的差距就大了。

個人覺得兩個都不錯,相對而言,百度可能更適合國人的味口,畢竟,對於旅行來說,去哪兒和攜程是個不錯的選擇。但是我覺得谷歌更理解搜索背後的思維。所以技術上來說還是Google更勝一籌,如果加上Google Now的話,Google可以直接甩掉百度了。(國內沒開通Google Now,不過可以通過某些方法達到,需要的請自行Google^_^

4.剛需,看片:

百度是生怕你找不到,Google是生怕你找到了,百度讓人「心神不寧」,Google讓人火冒三丈。當然對於成人而言,這些都沒問題,但是,如果是你未成年的子女在用呢?Google默認開啟了安全搜索,在你搜索某些內容時會過濾。

小結:

看片要種還是找度娘吧。

5.圖片搜索:

印象中這個功能是Google先推出的

這個功能,其實兩都都不算太強。

百度提供了「文件格式(常見的圖片格式都有了)、尺寸、分辨率、是否收費」四個篩選器。Google提供了大小(分辨率)、顏色、類型(臉部特寫相片、剪貼畫、素描畫、動畫)、時間這四個篩選器。(2014年1月4日多了版權這個篩選器)Google更豐富,百度更符合國人習慣。

以圖找圖:

印象中這個功能是Google先推出的。Google提供了拖動找圖的功能,百度沒有。再看結果:

百度識別為周傑倫,Google識別為魔傑座。(另:一次複製鏈接找圖,百度無結果<下面的推薦中出現了一堆讓人心神不靈的圖片>,Google準確識別,本想截圖的,忘記鏈接了未能再現。)

小結:

百度更符合國人習慣,經常找素材的設計師應該會喜歡。Google提供了顏色分類,人個覺得更有技術含量一點。以圖找圖,Google更方便,結果也比百度稍准(這裡可能會有不同看法,顯示周傑倫好還是周傑倫的魔傑座好,個人偏向後者)。

還有一些其它的,我就不一一比較了,再分享一些Google實用技巧,這些掌握了才算是真正的會用Google啊:(轉自知乎,鏈接:一周看點1. 學會 Google 用法,走遍天下都不怕)

如何用好 Google 搜索引擎?

崔凱,搬磚工。求工作!

搜索引擎命令大全!

1、雙引號

把搜索詞放在雙引號中,代表完全匹配搜索,也就是說搜索結果返回的頁面包含雙引號中出現的所有的詞,連順序也必須完全匹配。bd和Google 都支持這個指令。例如搜索: 「seo方法圖片」

2、減號

減號代表搜索不包含減號後面的詞的頁面。使用這個指令時減號前面必須是空格,減號後面沒有空格,緊跟著需要排除的詞。Google 和bd都支持這個指令。

例如:搜索 -引擎

返回的則是包含「搜索」這個詞,卻不包含「引擎」這個詞的結果

3、星號

星號*是常用的通配符,也可以用在搜索中。百度不支持*號搜索指令。

比如在Google 中搜索:搜索*擎

其中的*號代表任何文字。返回的結果就不僅包含「搜索引擎」,還包含了「搜索收擎」,「搜索巨擎」等內容。

4、inurl

inurl: 指令用於搜索查詢詞出現在url 中的頁面。bd和Google 都支持inurl 指令。inurl 指令支持中文和英文。

比如搜索:inurl:搜索引擎優化

返回的結果都是網址url 中包含「搜索引擎優化」的頁面。由於關鍵詞出現在url 中對排名有一定影響,使用inurl:搜索可以更準確地找到競爭對手。

5、inanchor

inanchor:指令返回的結果是導入鏈接錨文字中包含搜索詞的頁面。百度不支持inanchor。

比如在Google 搜索 :inanchor:點擊這裡

返回的結果頁面本身並不一定包含「點擊這裡」這四個字,而是指向這些頁面的鏈接錨文字中出現了「點擊這裡」這四個字。

可以用來找到某個關鍵詞的競爭對收,而且這些競爭對手往往是做過SEO 的。研究競爭對手頁面有哪些外部鏈接,就可以找到很多鏈接資源。

6、intitle

intitle: 指令返回的是頁面title 中包含關鍵詞的頁面。Google 和bd都支持intitle 指令。

使用intitle 指令找到的文件是更準確的競爭頁面。如果關鍵詞只出現在頁面可見文字中,而沒有出現在title 中,大部分情況是並沒有針對關鍵詞進行優化,所以也不是有力的競爭對手。

7、allintitle

allintitle:搜索返回的是頁面標題中包含多組關鍵詞的文件。

例如 :allintitle:SEO 搜索引擎優化

就相當於:intitle:SEO intitle:搜索引擎優化

返回的是標題中中既包含「SEO」,也包含「搜索引擎優化」的頁面

8、allinurl

與allintitle: 類似。

allinurl:SEO 搜索引擎優化

就相當於 :inurl:SEO inurl:搜索引擎優化

9、filetype

用於搜索特定文件格式。Google 和bd都支持filetype 指令。

比如搜索filetype:pdf SEO

返回的就是包含SEO 這個關鍵詞的所有pdf 文件。

10、site

site:是SEO 最熟悉的高級搜索指令,用來搜索某個域名下的所有文件。

11、linkdomain

linkdomain:指令只適用於雅虎,返回的是某個域名的反向鏈接。雅虎的反向鏈接數據還比較準

確,是SEO 人員研究競爭對手外部鏈接情況的重要工具之一。

比如搜索

linkdomain:http://cnseotool.com -site:http://cnseotool.com

得到的就是點石網站的外部鏈接,因為-site:http://cnseotool.com 已經排除了點石本身的頁面,也就是內部

鏈接,剩下的就都是外部鏈接了。

12、related

related:指令只適用於Google,返回的結果是與某個網站有關聯的頁面。比如搜索

related:http://cnseotool.com

我們就可以得到Google 所認為的與點石網站有關聯的其他頁面。 這種關聯到底指的是什麼,Google 並沒有明確說明,一般認為指的是有共同外部鏈接的網站。

上面介紹的這幾個高級搜索指令,單獨使用可以找到不少資源,或者可以更精確地定位競爭對

手。把這些指令混合起來使用則更強大。

inurl:gov 減肥

返回的就是url 中包含gov,頁面中有「減肥」這個詞的頁面。很多SEO 人員認為GVM和學校網

站有比較高的權重,找到相關的GVM和學校網站,就找到了最好的鏈接資源。

下面這個指令返回的是來自.中國教育和科研計算機網CERNET,也就是學校域名上的包含「交換鏈接」這個詞的頁面:

inurl:.中國教育和科研計算機網CERNET 交換鏈接

從中SEO 人員可以找到願意交換鏈接的學校網站。

或者使用一個更精確的搜索:

inurl:.中國教育和科研計算機網CERNET intitle:交換鏈接

返回的則是來自中國教育和科研計算機網CERNET 域名,標題中包含「交換鏈接」這四個字的頁面,返回的結果大部分應

該是願意交換鏈接的學校網站。

再比如下面這個指令:

inurl:中國教育和科研計算機網CERNET*register

返回的結果是在.中國教育和科研計算機網CERNET 域名上,url 中包含「forum」以及「register」這兩個單詞的頁面,也就是

學校論壇的註冊頁面。找到這些論壇,也就找到了能在高權重域名上留下簽名的很多機會。

下面這個指令返回的是頁面與減肥有關,url 中包含links 這個單詞的頁面:

減肥 inurl:links

很多站長把交換鏈接頁面命名為links.html 等,所以這個指令返回的就是與減肥主題相關的交換

鏈接頁面。

下面這個指令返回的是url 中包含http://gov.cn 以及links 的頁面,也就是GVM域名上的交換鏈接頁面:

allinurl:gov.cn+links

最後一個例子,在雅虎搜索這個指令:

linkdomain:http://cnseotool.com -linkdomain:http://cnseotool.com

返回的是鏈接到點石網站,卻沒有鏈接到我的博客的網站。使用這個指令可以找到很多連向你

的競爭對手或其他同行業網站,卻沒連向你的網站的頁面,這些網站是最好的鏈接資源。

高級搜索指令組合使用變化多端,功能強大。一個合格的SEO必須熟練掌握這幾個常用指令的

意義及組合方法,才能更有效率地找到更多競爭對手和鏈接資源。

找外鏈的時候你可以用這幾種命令組合,例如site:.com inurl:blog 「post a comment」 -」comments closed」 -」you must be logged in」 「輸入你的關鍵詞「,

site:.com 是 指, 只顯示.com的網站。 如果你想要 org的鏈接,就換成 site:.org,inurl:blog 是指博客。

「post a comment」 -」comments closed」 -」you must be logged in」 是指, 「能夠寫評論的」 減去「 關閉評論的」 再減去「 必須要登錄才能寫評論的」。

總結:

  • 搜索技術上,我覺得Google是領先的,如果你肯花點時間學習一下,Google能給你的肯定會更多更好。(搜索跟使用的關鍵詞有關,或者說跟用戶有關,如果你找不到你想要的結果,請考慮一下是不是關鍵詞使用不當?
  • 百度是夠用的,由於人工調整和資源整合的緣故,它可能在某些方面更符合國內用戶習慣(比方說看片這個宅男剛需,還有快遞查詢之類的合作)。

  • Google的結果更公正,百度明顯偏向自家的產品,但因為這些產品(百度知道、貼吧、音樂等)佔據了很大的市場份額,跟國內公司的合作也比較深入,導致就算這樣結果也還算理想,造成「百度更懂中文」的假像(這句話應該改成「百度更懂中國人」才對啊)。
  • 搜索只是個工具而已,在某種意義上,夠用的就是好的,但是我相信把兩者結合起來用才會發揮「搜索」的最大威力。

【劉雨陽的回答(220票)】:

僅從搜索結果質量的角度做一個對比。

百度與 Google.cn 的眼球跟蹤(Eye Tracking)對比圖(07年,來源:Chinese Eye Tracking Study: Baidu Vs Google ):

Google.cn 的結果體現了較好的「黃金三角」特徵,很可能是因為用戶在前幾個搜索結果中就找到了要找的鏈接。而百度的結果較分散,很可能是因為用戶不滿意前幾個搜索結果,繼續向下瀏覽。

【徐天宇的回答(177票)】:

不是一個量級。

Google的準確率真不是蓋的,一般不用滾動頁面即可看到所需的結果。而百度,排在前面的時常是些不明所以的頁面。非中文的搜索就更不用說了。

個人感覺,百度的優勢在於對諸如」百度知道「」百度貼吧「之類的信息渠道有更好的掌控。拜中國龐大的網民基數所賜,很多需要搜索的問題都已經有人問過,這樣即使用戶輸入的關鍵詞很」搜索引擎不友好「,也能通過簡單的模型得到比較正確的結果。

舉個例子,同樣是搜索」章魚和八爪魚是不是一個東西「(不要吐槽這個查詢,這個是我同學剛剛去搜的orz...),百度的前三條結果是:

而Google的前三條結果是:

可以看出,百度只是將用戶查詢進行了簡單的分詞、停用詞剔除等操作,然後基於出現的字詞去查詢結果;而Google對於查詢語句明顯有一定語義理解。從中可以管窺兩公司的技術差異。

13年暑期與某個前百度搜索部門員工共事,談及離開百度的原因,他說百度的很多所謂」核心技術「只不過是將已經發表多年的論文算法實現一下而已,永遠在追趕別人,沒意思,所以出國讀博。

【知乎用戶的回答(83票)】:

update =========

說google強沒人否認,但是個別指標百度並不弱。而且百度走的是完全不同的路,既引導用戶貢獻有價值的內容,比如百度知道,文庫,貼吧,百科,還有框計算引入第三方貢獻的內容。google強調的是作為工具的中立公正和高效。

發展思路不同而已,說baidu技術一無是處的也沒有什麼有說服力的證據。僅僅是因為baidu人為干擾排序結果就完全否定baidu的技術嗎?恐怕太片面了吧。

============================================

看不到任何有實際內容的答案。

我不是業內人士,但據我有限的知識和觀察。

百度對於非中文的搜索,排序比起google幾乎毫無戰鬥力。

對於中文,百度並不弱於google。就分詞來說百度還略強於google。這也不奇怪,中文收索和英文區別不是一星半點。只是google得益於強大的研發實力,現在已經幾乎平手。

google強大的是在維護收索結果的公平公正方面的技術實力,包括網頁相關性,去除排名干擾(反作弊)。百度這方面差距較大。

最後差距更大的其實不是技術層面。google的理念是「讓使用者找到自己想找的」;百度是「讓使用者看到百度想讓他看的」。

【時國懷的回答(48票)】:

題主問的是技術,那麼我就說說技術上的事情吧,因為恰好我畢業論文做的就是搜索引擎:

簡單說一下歷史:其實兩家公司可以算是同時起步的,Google稍早一些,PageRank概念是Google最早提出來的,百度雖然晚了幾年,但百度的那一套東西,最早用的是北大的天網搜索的技術,我記得北大還寫了一本書,不過早就絕版了,書裡討論的就是中文搜索的基本思路。

如果討論技術對比,那麼前提是只看中文搜索,因為百度的非中文搜索太爛了,並且收錄的非中文網頁也實在太少。另外,百度的非中文搜索也不是完全沒有,比如這個(百度日語搜索,國內可能打不開):baidu.jp

搜索引擎的主要技術指標包括:

1、準確度和排序。

2、收錄速度。

3、收錄網頁總規模。

註:這裡沒有提搜索速度,是以為商業搜索引擎基本上都能在一秒內完成搜索,而一般網頁頁面打開也需要接近一秒的時間,所以一般來說搜索速度不是重點的技術指標。

然後說說搜索引擎技術的基本原理:

網頁搜索引擎跟大多數人的理解不同,不是說用戶來了請求就到數億的網頁裡搜索結果,這樣做太慢了,並且超級計算機做起來都很困難。

舉個簡單的例子,有以下幾個網頁:

A網頁內容:中國大學的就業率與高考考試成績不成正比。

B網頁內容:大學考試很簡單。

C網頁內容:高考錄取率很高,上了重點高中就等於上了大學。

當搜索引擎收錄網頁的時候,會拆出網頁的關鍵詞,比如:

大學出現在:A/B/C頁面

高考出現在:A/C頁面

考試出現在:A/B頁面

那麼當有人搜索「高考考試」的時候,只需要求一下兩個關鍵字結果集合的交集(即相同的部分),就可以得到結果了。用數學表示就是:

{A, C} ∩ {A, B} = {A}

所以搜索引擎是在收錄網頁時就完成了預處理,實際搜索的過程中不是去數億的頁面裡去直接搜索。

搜索引擎簡單的結構是(只能說簡單的說是這樣的):

爬蟲系統(收錄網頁)==>預處理系統(過濾干擾字符)==>分詞系統(建立索引)==>網頁數據庫==>用戶搜索處理

===================囉嗦了半天,現在開始看技術比較===================

1、準確度和排序:之前的回答有各種各樣的比較,但是這裡回答問題的人大多數都是技術行業、互聯網行業相關的,普通用戶搜索的東西與我們會是一樣的嗎?看看這裡:百度搜索風雲榜,看看大多數中國人在關心什麼。因為大多數拉丁文字都是自動成詞的,但漢字不是。比如下面的這個笑話:

小心地滑可以拆成:小心地/滑 和 小心/地滑,這個例子不是用來證明Google的分詞沒做好,因為這不是搜索結果,我只是在這裡強調一下分詞是一件多麼麻煩的事情

普通用戶可能更多的搜索「從北京南站到首都機場」而不是「OSLOADER 符號表」這些。我也不否認技術類的東西百度搜的更準確,但中國幾億上網用戶有多少是搞技術的?

Google把「用戶想要的東西」更多的局限於網頁結果上,而百度則是把用戶想要的東西直接展示給用戶。比如「個稅計算器」、「萬年曆」這些。肯定有人會說我耍賴,把百度應用/API這些東西也算搜索結果,但是我問一句:用戶上網搜索就是只為網頁嗎?用戶是要結果。

在中文搜索方面,尤其是分詞方面Google沒有太大的優勢,排序方面二者基本相當,但百度把一些關鍵詞做了人為干預,實際上這種干預目前來看還是很成功的。

所以在結果和排序上,中文搜索百度略微佔優勢。

P.S 看某些評論裡有人提到了美劇的搜索,如果名字是英文的,請用Google,如果名字是中文的,請用百度。

2、收錄速度,之前有人回答了百度比Google慢,這個我比較認同,大多數情況下Google收錄的新東西更快。但Google有一個問題就是結果太少,雖然用戶實際上不會看到幾十頁以後的結果,但是百度一般能給出將近100頁的結果,Google只有十幾頁左右。另外,突發事件的時候百度人工干預的痕跡很明顯,但Google則一般都是機器做的,這一點Google明顯強於百度。

3、網頁規模,Google的總網頁規模是百度的10倍左右(06年官方數據,百度12億,Google82億),網頁規模越大,複雜度的增長不是線性的,並且Google搜索的時候,不管是中文還是英文,都是在同一個網頁池裡搜索的,這裡既有中文,也有英文。早期(2005年左右)的時候我記得有論文說Google的搜索不是分佈式的,而是集中式的,這一點無法考證,但現在應該早就不是集中式的了。

找不到太精確的兩家收錄的總頁面數,但可以確認的是Google完爆百度。

網頁規模擴大十倍,不是說服務器增加十倍就可以搞定的,因為服務器越多,負責調度的節點的負擔就越重,對於磁盤I/O,網絡帶寬的使用都變大,而這些東西都是有上限的,不是說簡單的翻倍就可以的。

就技術來說百度也就是在中文分詞和排序方面略強於Google,但其它方面還遠遠落後於Google,當然中文分詞至今也沒有誰能說自己做的最完美,因為畢竟中文實在是太複雜了——就比如前面的那個小心地滑。

=========================暫時能想到的就這麼多=========================

我強調一下我的立場,去這裡百度搜索風雲榜看看普通用戶搜索什麼,再來比較準確度的問題,每個人搜索行為都不一樣,自己一個人不能代表全部上網用戶。

【PPPhoenix海鵬x的回答(32票)】:

百度和谷歌單就搜索技術而言,二者從來就不是一個量級的。

想知道兩者誰的技術更牛逼,那麼我們看一下二者誰掌握的專利技術多就可以了。

Google有一個專利檢索引擎,我們可以在裡面找到自一九七幾年到二零一一年之間的專利技術

Google點擊左側這個鏈接可以進入專利檢索頁面。

:語法inassignee:""是限制公司名稱。

因為搜索引擎只是Google公司眾多業務的一部分,同時近幾年蘋果以及Google公司的專利大戰等因素導致Google公司的專利技術激增。所以我在搜索條件中分別加入關鍵詞「搜索」以及英文「Search」,用以更加精確的去檢索出關於「搜索」以及「Search」相關的專利技術。

同時使用英文與漢語同時進行檢索,我們可以看到2者之間的差距。

===================下面是百度的專利===================

不過,就像其他答案中提到的一樣,鑒於Google現在在大陸的狀態以及中英文之間的差距(分詞技術),在日常生活中,百度還是用起來比較順手的。

但是,既然提問者問的是技術,這個答案比上面的多數答案更有說服力(得意的笑)

【謝德俊的回答(32票)】:

反駁 @君臨的回答。

你為什麼不提及這些結果?

【知乎用戶的回答(39票)】:

百度一直是站內搜索好麼

【張曉敏的回答(45票)】:

我不懂搜索技術,我是來反駁@君臨的。

首先,搜索引擎只是獲取信息的一個工具,不必要回答問題的時候就上來給各位知友扣上「用谷歌用出優越感」的帽子吧?其次,題主問的是:就搜索技術而言,百度和gooogle是一個量級嗎?這其中的比較主體是百度和google,比較的內容是搜索技術。

好了,現在開始逐條反駁。

1.李彥宏的搜索技術再牛逼,就必然百度的搜索牛逼嗎?舉個栗子:我們球隊隊長,職業球員退役,拉出來單練基本功和技術,秒我們幾個友隊的任何人。那又怎樣?我們球隊的成績也只是中游偏上而已。再從我個人的使用上來說,在我開始做銷售的時候,我需要大量有效的潛在客戶信息,百度出來前兩頁幾乎是競價排名,google能精準地滿足我的需求。

2.單獨拉出來mp3,圖片搜索,貼吧比較。貼吧是社交平台,正在這個問題下就不討論了。圖片搜索,百度比google牛?這個真沒有,小米拍照作弊,牆紙大賽都是google圖片搜索的功勞吧?再說mp3搜索,這個有點不公平了,原因大家都懂得。我們國家只能一夫一妻,某個國家一夫多妻,只有一個老婆的我被人說泡妞能力比不上娶了好幾個老婆的某人,我不福氣啊。

3.「谷歌追求的是最快找到你需要的網頁,然後離開;百度追求的是在百度上找到你所需要的所有東西,然後留下來。」這是君臨的原話,恰巧@和菜頭剛剛在微信寫過一篇文章「為什麼我不去百度」,其中有關於搜索引擎價值的判斷「百度是搜索引擎公司,搜索引擎的天生八字就是:拿了就跑。用戶飛快地跑來,找到內容轉身就走。一個搜索引擎公司越是成功,用戶單次訪問的時間也就應該越短---這意味著用戶可以在最短時間內找到自己想要的內容,也就體現了公司的最大價值。」我個人很認同這樣的判斷方法。這不正說明google的搜索價值是大於百度嗎?

反駁完結!

扯個蛋:作為一名工具使用者,google讓我更喜歡,我相信這背後是有強大的技術支撐。

另外,這是由MX2完成,很辛苦,求贊。

【迷島的回答(50票)】:

有人說谷歌也推廣,因為我自己沒遇到過,就說谷歌不推廣,抱歉啦...

截個百度的搜索結果吧,搜索內容為360網盤,看看百度怎麼干涉搜索結果的,我認為,即使再怎麼鬥爭也不至於處處推廣自己吧,聲明一下,我個人不是360的粉。

不是一個量級的,上邊那些舉搜索的例子都是不公允的,雖然能局部的說明問題,谷歌和百度真正拉開檔次的學術搜索,無論是期刊還是代碼,不公開的說個事實,谷歌搬到香港之後網頁不穩定,對某些科研單位或者大學影響很大,有的學校會建立谷歌專線,速度快並且穩定。百度也許很賺錢,打開百度首頁看看吧,百度殺毒?百度衛士?把百度設為主頁?為了推廣自己的產品降低用戶體驗,瞧一瞧谷歌的主頁,什麼時候強制推廣了,無非就是跟360競爭麼,作為一個「國際」大公司就這點風度?看一個公司是否強大看看它的競爭對手,百度的競爭對手,360算一個,搜狗也算,騰訊也勉強入圍,也許這樣做很賺錢,也許這樣做能保護自己搜索「壟斷」的地位,但是,百度永遠不是一個偉大的公司,無論它推出的硬件產品(小度WiFi、小度路由和小度TV)還是其他軟件產品(百度聊天,百度網購,百度理財,百度衛士,百度殺毒,百度播放器,百度操作系統,百度手機,百度...)基本都是失敗的。

PS:前邊提到的谷歌專線恕不能公佈,但是告訴大家個小竅門,谷歌的主頁默認是跳轉到香港的,即.hk,不穩定的情況經常有,不穩定的原因大家都懂得,可以把後綴改成.tw,看拼音就明白了吧,速度和穩定性都值得推薦!

【知乎用戶的回答(25票)】:

是百度知道、貼吧把百度的關鍵詞準確率拉高了

從搜索結果出發,看我舉個例子 搜索:美國總統是誰?

google結果:

百度結果:百度結果:

百度告訴我是布什。。。。。

結論:谷歌比百度強

【WuShao的回答(22票)】:

樓上某些人的截圖很不負責任啊,你們比較應該是用它們最擅長的語言好不好?應該是百度的中文搜索比較谷歌的英文搜索,我現在舉幾個例子。你不要用香港谷歌,用美國谷歌試試。而且語法盡量符合美國人習慣

首先是冬奧會的

湖人隊,這個看各位排版喜好了湖人隊,這個看各位排版喜好了

然後是油價換算,這個百度根本不行,然後看看美帝的油價然後是油價換算,這個百度根本不行,然後看看美帝的油價

然後是匯率然後是匯率

地理,以日落時間為例地理,以日落時間為例

位置搜索位置搜索

行程,都有飛機,都很貼心的說行程,都有飛機,都很貼心的說

城市中餐館搜索城市中餐館搜索

人物搜索,以兵庫北為例,谷歌顯然內容更豐富,排版更漂亮人物搜索,以兵庫北為例,谷歌顯然內容更豐富,排版更漂亮

公司搜索,谷歌提供了當日股市行情

知識覆蓋與理解:知識覆蓋與理解:

這個真是中國特色這個真是中國特色

然後是航班查詢

5s發佈日期5s發佈日期

一款汽車查詢一款汽車查詢

動漫查詢,百度給出了觀看鏈接,非常人性化動漫查詢,百度給出了觀看鏈接,非常人性化

世界盃相關,顯然百度和谷歌各有偏好世界盃相關,顯然百度和谷歌各有偏好

空氣質量指數,美國空氣太好了,沒人用的原因嗎?空氣質量指數,美國空氣太好了,沒人用的原因嗎?

問兩地多遠的問題問兩地多遠的問題

生活查詢,比如可口可樂的熱卡生活查詢,比如可口可樂的熱卡

科學計算科學計算

外語翻譯,百度還是很多語言沒有收錄,貌似只有幾種,舉個西班牙語的例子外語翻譯,百度還是很多語言沒有收錄,貌似只有幾種,舉個西班牙語的例子

簡單的單位換算簡單的單位換算

看了這麼多圖,我認為,其實兩家各有所長樓上各種噴子還是休息吧,我用谷歌只是覺得它更加美觀而已。其實什麼搜索技術最直接的表現不是在這些日常應用上面麼?那些高精深的東西又有多少人會去用呢?鑒於國內網站含水量太高,我個人還是推薦谷歌的,畢竟在美國享受到了各種便利。

【zckevin的回答(17票)】:

簡要概括一下大家的思路:

  • 誰專利多誰就牛逼;
  • 誰框計算做得好看誰就牛逼;
  • 誰會算加減乘除誰就牛逼;
  • 誰能告訴我明星生日誰就牛逼;

  • 誰能搜IT開發相關的文章誰就牛逼;
  • 誰搜圖搜得准誰就牛逼;
  • 。。。。。。

360的周老闆在GeekPark的演講裡說,「當時我的技術比Google屌,你們都不信吧。。。」

所以,我覺得,不是業內人士,沒做過搜索,可能連Lucene都沒玩過,就開始在一個題目叫「就搜索技術而言,百度和谷歌 (Google) 是一個量級的嗎?」的問題下互噴,實在是。。。對吧?

完全可以把題目細分成:「就[中文/英文][生活類/技術類][用戶體驗/檢索數目]而言,百度和谷歌 (Google) 是一個量級的嗎?」

【宋黎的回答(6票)】:

搜索引擎的量級你要考慮到以下二點

覆蓋區域 覆蓋人數

谷歌的覆蓋區域是全世界

百度的覆蓋區域主要是國內

谷歌的覆蓋人數是拋出中國 朝鮮等的所有能上網的人

百度的覆蓋人數是中國+部分海外華人

好了請你告訴我單就技術而言 這兩種規模下的搜索引擎會是一個量級麼

【劉覽的回答(4票)】:

兩家公司的側重點不同而已,我看過一個數據,但記不太清楚了,大概是百度80%以上的收入來自推廣,谷歌只有20%;谷歌覆蓋的面更廣泛,所以在未來百度是否在其他地方和谷歌比肩,敬請期待;

---------------------------------------------------------------------------------------------

多謝評論幾位的提醒,我後來在199IT中查了下,確實谷歌在2013年Q2的財報中有提到

谷歌第三季度營收(廣告及其他業務)為137.7億美元,在總營收中所佔比例為92%,比去年同期的115.3億美元增長19%。

原文就不做修改了,附上財報鏈接:199it.com/archives/1619

-----------------------------------------------------------------------------------------------

另外,我還是表達我自己的觀點,百度在破壞更多中小型網站的利益,之前在知乎也和別人討論過這個問題,百度開發如此的多的產品,無疑是想把用戶留在百度頁面上,看似很接地氣,多方便我們的網友,而背後卻是多家網站的競爭,被百度利用乖乖的貢獻了自己的資源,最後百度一腳踢開自己玩;

所以我的理解,

百度:我的就是我的,你的你願意也是我的,不願意也遲早變成我的;什麼,你是富二代,那我們可以合作的;

谷歌:我有資源,我帶著你們中小網站玩,只要你有區別於其他網站的內容,有錢大家一起賺;

針對上面一點有異議的,每個人看法不同,不想再做討論了;

最後和@劉秦政 交流下,之所以百度有這麼多的搜索結果展示樣式,是因為百度在這上面有N多個部門,光我接觸過的就有3.4個,每個部門涉及的種類不同,每個種類還有不同的樣式,所以看就覺得太亂。

【劉惟楚的回答(12票)】:

只想說一點:「因為百度是中國的所以更懂中文」純粹是流氓話。前後沒有任何因果關係。

特別是以我至今的經驗來看,所有用上一句話來論證百度在中文搜索上比google好的,甚至都看不到「自然語言分析」這個關鍵詞。

這種誤導性很強的瞎話到底是騙過了多少少女的心啊!

標籤:-科技 -百度 -搜索引擎 -搜索技術


相關資源:





給我留言