新浪微博目前的實時搜索質量如何?存在哪些優點和不足? | 知乎問答精選

 

A-A+

新浪微博目前的實時搜索質量如何?存在哪些優點和不足?

2017年08月26日 知乎問答精選 暫無評論 閱讀 9 ℃ 次

【姚旭的回答(16票)】:

優勢: "實時"

"實時搜索"強調的是"速度", 這是針對於傳統搜索引擎而言, 要足夠快的發現信息源進行抓取收錄, 能被用戶檢索到.

微博作為一個獨立的信息源, 天生就不存在信息發現的問題, 加上強大的媒體性, 很多第一手資料都是直接出自自身平台. 現在新浪微博信息內容已經可以做到快速響應. 在時間這一維度上並沒發現問題.

問題:

  • 噪音

和傳統搜索引擎一樣, 在解決了信息源的問題後, 隨之而來的問題是信息過剩. 每一分鐘, 微博可能都在產生大量沒有被搜索意義的信息. "實時"這個標籤下"時間"是很強的排序因子, 帶來的結果就是對於普通用戶大量的無意義信息(但對於商業推廣可能是有意義).

為了解決信息質量的問題, 新版的微博搜索加入了"熱門"這個標籤, 按照信息質量進行排序. 但仍沒能根本解決問題, 熱門信息的"停滯"感太強, 多次看到重複的熱門榜, 減少了這個功能的使用頻率和作用.

可能的改進: 是將"時間"+"熱門"結合起來, 在自然搜索結果裡, 結合兩個因素, 同時做到過濾低質量和保證時效性.

  • 相關性分析

由於微博自身的特性是"短", 一篇微博的文字數量導致很難從文本角度或者語義角度找到真正的"關鍵詞". 很多只是出現搜索詞, 但和搜索目標相差很遠的信息也可以被搜索到. 或者被一些spammer惡意添加一些熱門標籤.?

可能的改進: 受限於微博文字的信息量和更新速度, 這個改進空間比較小.

  • 信息的組織形式

目前微博搜索採取的方式仍是傳統搜索的套路, 將搜索結果排列展示出來. 對於微博這樣的新平台, 數據自身都是自己可掌控的, 可以做一些不同於傳統搜索的方式. 將信息進行重組.

1. 將搜索結果按照信息的重複程度進行聚類, 變成一個信息簇. 將零散的信息變成一個"事件"

2. 將微博內引用的外部鏈接作為信息的補充來源, 對"事件"在微博外的發展進行描述.

3. 將一個"事件"的發展過程捕捉到, 從發展到傳播到爆發到消失的過程通過圖表的方式展示出來. 將各個點上的里程碑內容重點突出給用戶.?

搜索結果可以將2次重組後的"事件"作為展示給用戶的搜索結果, 不僅僅是目前的微博內容.

  • 個性化

這個維度的重要性被人說爛了, 不再多說. 微博自身的數據特性, 為這個維度的發展提供了很好的平台. ?

總體上看, 新浪的微博搜索未來還有很多可以展望的功能, 有很多不同於傳統搜索的事情可做.

【劉路的回答(3票)】:

有老版和新版兩種。

如果你的微博沒有升級,恭喜你!你可以使用老版微博搜索。不過就在我回答這個問題的同事,我的新浪微博被強制升級了。新浪微博這個流氓!!

老版可以搜索到的信息:

-含有所有搜索詞的微博條數,可見條數為:1000條。

-可按照評論量,轉發量排序。

-可分揀微博發佈時間段,精確到每小時,24小時,自定義時間段搜索,不過這個基本是個擺設。

-可分揀我的,我關注的,定義某個人的含搜索詞微博。

-可將搜索詞分類展示,微博,找人,帶圖片的微博,帶音樂,視頻,短連接等等。

-可分揀地域,你的所在地,你的附近,全部。

-如果你的搜索詞是找人的,可以按暱稱,單位,學校,標籤來分揀。還有性別,地域,年齡層次,是否是認證用戶。在人的搜索中,大於500,則不可見準確數量,可見人數:500人。

-你還可以在微群,活動,應用中搜索,但只在你個人頁面有入口啊,你在這些集成頁面是找不到入口的親。

新版,好吧,新版就是在老版的基礎上減少了很多搜索信息,再也沒有按評論轉發什麼排序功能,再也不能按照時間段搜索,不能按年齡段搜索,over~~

【pandonix的回答(2票)】:

其實一直很關注基於SNS的社交搜索。作為微博用戶,我一直都有這樣的需求:每天這麼大量的信息,除了能吸引眼球的信息,大部分都是掃一眼就過。在大腦中只會留下一個簡單幾個標籤而已。例如,某個朋友分享了關於鼓浪嶼旅遊相關的信息,照片也好,日誌也罷,當時來不及細看就忽略掉,只留下鼓浪嶼這個關鍵詞。突然某天回憶起來,覺得有用時就會想到去搜索出來細看。往往這種時候,直接百度或者採用目前微博的搜索,幾乎會無功而返。因為這個信息的傳播範圍可能很小,沒有被搜索引擎捕獲到,即使被cover到了,也會出現一些自己不期望獲得的結果,例如,鼓浪嶼酒店預訂廣告。如果基於我關注的人或好友這條關係鏈去獲取搜索結果結果就比較準確,而且基本不會出現干擾源。好吧,貌似有點跑題:(

【張大川的回答(1票)】:

主要兩個問題

1)信息不全

2)排序不對

要說第二點 做到效果很好有難度。。。那第一點也有問題,就不太好理解。。。數據都是他們自己的,為什麼明明自己發過的東西,搜不出來?

標籤:-姚旭 -搜索引擎 -新浪微博


相關資源:





給我留言