新浪微博的「按興趣排序」是用什麼算法篩選出來的? | 知乎問答精選

 

A-A+

新浪微博的「按興趣排序」是用什麼算法篩選出來的?

2019年09月22日 知乎問答精選 暫無評論 閱讀 0 ℃ 次

主頁上新增的功能,除了傳統的按時間倒序排列微博外,現在可以按「興趣」對微博進行排序。號稱「以下是關注的人發表且你可能會感興趣的內容」。這是通過什麼算法來篩選的呢?是根據關注的話題、標籤這些元素來的嗎?還是有語義分析的過程在裡面?

強調一下,我要問的不是「感興趣的人」,而是「對微博按興趣排序」。剛剛有幾位朋友的回答可能都沒有看清楚問題。

【姚旭的回答(13票)】:

推測幾個排序因素吧

  • 用戶關係: ?用戶之間的評論轉發歷史積累+共同好友數量等等, 可能還有互動型關係和瞻仰型關係的細節區分, 我看到的結果裡面, 互動型的似乎權重高一點.?
  • 微博質量: 基本的評價手段就是轉發+評論, 同時參考轉發源的這些特徵
  • 時間: 可以認為是一個(當前時間-發表時間)這麼一個參數

簡單瞎猜一下就是一個簡單的三參數的線性函數?

F(用戶關係, 微博質量, 時間)

  • 時間段分組: 這個是可選項, 是比較大枝的過濾型條件, 不參與rank
  • 語義分析的特徵: 從目前的效果看, 沒有判斷出可能的主題識別, 推測新浪目前還沒有用到

之前@黃榮升 也做了類似的chrome微博排序插件, 思路上差不多, 就是數據太難拿了.

這類個性化rank, 從之前的認識看, 有幾個有意思的問題

  1. 個性化的rank結果, 無法準確評估效果, 說不准效果好還是不好.?
  2. "時間"這個因子, 很難把握, 權重太高的話就和timeline一樣了, 太低的話又會錯過最新鮮的內容. 至於這個因子該怎麼定, 又依賴於1)中的評估方法, 還是比較頭疼的.?

---------------------------------------------

權威聲音: 來自@mingsheng1的評論

沒有時間因子,我去掉的,太複雜。簡單些,提供時間篩選。

【潘欣的回答(1票)】:

個人感覺:

1、根據好友之間的交互次數判斷的

2、過往自己發、評論的微博內容判斷的——應該是有語義分析的——但是說不好,因為推送的感興趣的內容準確度不高很龐雜

3、標籤

4、好像跟自己關注的話題沒關係,奇怪。。。

【吳志遠的回答(1票)】:

按雙方互動的頻度。

【KirkCong的回答(0票)】:

興趣這個排序,讓我很沒底,我對預期沒有確定感,我自己都不知道什麼是我感興趣的內容,電腦怎麼知道?

也許是互相評論,@,或者標籤?

新浪要開發timelines之外,第二個feed維度,感覺好難

【蘇化語的回答(0票)】:

本來以為是通過用戶發過的微博內容進行語義分析主題識別然後按頻度排列,看結果又不是特別像

根據現有結果猜測:

1)看用戶之間的關係(@,互相評論,標籤)

2)關注的話題

【鄔潔林的回答(0票)】:

用戶關係強弱係數(共同好友+共同關注情況+相似個人資料/標籤)

關注的人跟自己的轉發和評論的互動情況

微博質量(原創性+傳播性+互動性)和新鮮程度(最新評論+最新微博)

微博時間

【陳金餅的回答(0票)】:

用戶之間的轉發和評論的互動

用戶對平台的貢獻度

時間

話題

IP地址

【mysqlops的回答(0票)】:

這個功能應該是需求多樣化的,按時間是最常用的,粉絲之間的互動頻率,個人興趣的話題(就可能需要想辦法讓用戶弄點設置,或者語義分析),粉絲的分組也可能是一種,應該還會有其他的

而且需求之間甚至可能出現交雜的,就會更複雜,相信隨微博的發展,會越來越重視此方面的需求,畢竟若你關注上百或者上千的人,信息量就大了,會出現應接不暇!

【劉運周的回答(0票)】:

用戶間的關係來關聯的

【蘇湘迅的回答(0票)】:

早先的推薦機制:一個是Msn或郵箱聯繫人

別的,好像還不如騰訊的標籤關聯,新浪上我還是通過轉發,評論,和生活中相關聯的來互粉

不過,真正的建立合作機制的還是不多

最新推薦機制:有多少共同關注的好友,推薦你關注,但對用戶來說效果,如何呢

我去點了下,發現增加了,時間和興趣排序,主要還是對關注的人,做的調整,也許是為了更好推送閱讀,初步判斷:大約是互動度,就是參與評論和轉發,系統記錄後,進行推送,個人觀點

to@mingsheng1 ,希望能自定義首頁閱讀,比如設置某個分組為首頁,分組數量20個也不夠用…,你們與其推薦,還不如自定義

【胡楊的回答(0票)】:

餘弦相似度,看看算的書就知道了啊

【Curt的回答(0票)】:

按照目前的程度,肯定有人工的參與,但以目前的用戶基數看,長期不太現實,做不到個性化

【林倩雯aarianna的回答(0票)】:

我感覺不到那些問題是我喜歡的 新浪所推薦的

標籤:-算法 -姚旭 -新浪微博


相關資源:





給我留言