久久精品人人爽,华人av在线,亚洲性视频网站,欧美专区一二三

如何用Map/Reduce來做好友推薦

152次閱讀
沒有評論

共計 2552 個字符,預計需要花費 7 分鐘才能閱讀完成。

這篇文章主要講解了“如何用 Map/Reduce 來做好友推薦”,文中的講解內容簡單清晰,易于學習與理解,下面請大家跟著丸趣 TV 小編的思路慢慢深入,一起來研究和學習“如何用 Map/Reduce 來做好友推薦”吧!

SNS 網站都有一個功能,就是好友推薦(或者 Follower 推薦)。例如,在人人網上出現的“你可能認識的人”。怎么來實現呢,有一個很簡單的辦法。如果小剛和小明不是好友,但是他們有很多的共同好友。那么可以認為,A 和 B 很可能相識。

怎樣用 Map/Reduce 來做好友推薦

從圖論的講法上看,就是先列出一個人 (記為小 A) 的所有朋友的朋友,在尋找小 A 和這些人之間有多少長度為 2 的通路。將這些通路數排序,尋找最高的那幾個就可以了。

所以我們的 Map/Reduce 的任務就是:找出所有人的十個 Top“推薦好友”。

社會化網絡的圖一般都很簡單。我們假設輸入是按 name 排序的。

ricky = [jay , peter , phyllis]

peter = [dave , jack , ricky , susan]

我們使用兩輪 Map/Reduce 任務來完成這個操作。

第一輪 MR 任務

這個任務的目的是計算每一對距離是 2 的人之間的通路數。

在 Map 函數中,我們先將每對朋友做一個笛卡爾乘積,說的不大清楚,舉個例子,比如

ricky = [jay , john , mitch]

那么結果就是

[jay , john], [jay , mitch], [john , mitch]

他們都是通過 ricky 牽線搭橋認識的。將已經是朋友的組合篩選掉,再排好序。傳給 Reducer。

在 Reduce 函數中, 相同的組合必定會傳給 Reducer。所以 Reducer 只要數好有幾個相同的組合傳給他就行了.

Input record … person – connection_list

e.g. ricky = [jay , john , mitch , peter]

also the connection list is sorted by alphabetical order

def map(person, connection_list)

# Compute a cartesian product using nested loops

for each friend1 in connection_list

# Eliminate all 2-degree pairs if they already

# have a one-degree connection

emit([person, friend1, 0])

for each friend2 friend1 in connection_list

emit([friend1, friend2, 1], 1)

def partition(key)

#use the first two elements of the key to choose a reducer

return super.partition([key[0], key[1]])

def reduce(person_pair, frequency_list)

# Check if this is a new pair

if @current_pair != [person_pair[0], person_pair[1]]

@current_pair = [person_pair[0], person_pair[1]]

# Skip all subsequent pairs if these two person

# already know each other

@skip = true if person_pair[2] == 0

if !skip

path_count = 0

for each count in frequency_list

path_count += count

emit(person_pair, path_count)

Output record … person_pair = path_count

e.g. [jay , john] = 5

怎樣用 Map/Reduce 來做好友推薦

第二輪 MR 任務

這一輪的 MR 任務是為了列出每個人距離為 2 的好友,查出他們直接究竟有幾條路徑。

在 Map 函數中,我們將每一組數據重新排列,保證一個人信息落在一個 reducer 上

在 Reduce 函數中,只要將每個人的可能好友之間的路徑數排個序就可以了.

Input record = Output record of round 1

def map(person_pair, path_count)

emit([person_pair[0], path_count], person_pair[1])

def partition(key)

#use the first element of the key to choose a reducer

return super.partition(key[0])

def reduce(connection_count_pair, candidate_list)

# Check if this is a new person

if @current_person != connection_count_pair[0]

emit(@current_person, @top_ten)

@top_ten = []

@current_person = connection_count_pair[0]

#Pick the top ten candidates to connect with

if @top_ten.size 10
for each candidate in candidate_list
@top_ten.append([candidate, connection_count_pair[1]])
break if @pick_count 10

Output record … person – candidate_count_list

e.g. ricky = [[jay , 5], [peter , 3] …]

Follower 推薦

如果我想要做 Follower 推薦而不是好友推薦怎么辦呢?

很簡單。只要將第一步的 MR 任務改為求“Follow 關系”和“Followed”關系的笛卡爾乘積就可以了。這里就不列偽碼了。

感謝各位的閱讀,以上就是“如何用 Map/Reduce 來做好友推薦”的內容了,經過本文的學習后,相信大家對如何用 Map/Reduce 來做好友推薦這一問題有了更深刻的體會,具體使用情況還需要大家實踐驗證。這里是丸趣 TV,丸趣 TV 小編將為大家推送更多相關知識點的文章,歡迎關注!

正文完
 
丸趣
版權聲明:本站原創文章,由 丸趣 2023-07-15發表,共計2552字。
轉載說明:除特殊說明外本站除技術相關以外文章皆由網絡搜集發布,轉載請注明出處。
評論(沒有評論)
主站蜘蛛池模板: 抚顺县| 黄石市| 广河县| 舟山市| 尚义县| 永丰县| 武宣县| 遵义县| 景洪市| 广安市| 正阳县| 张家界市| 柏乡县| 神木县| 盐池县| 腾冲县| 登封市| 柘城县| 襄垣县| 泽库县| 东阿县| 珲春市| 汉阴县| 伊金霍洛旗| 佛教| 达拉特旗| 青龙| 始兴县| 金阳县| 景宁| 西平县| 大理市| 永嘉县| 莱芜市| 大名县| 河源市| 麻江县| 沙坪坝区| 新绛县| 呼伦贝尔市| 定州市|