際際滷

際際滷Share a Scribd company logo
Samantha
Map + Reduce  ->  一危磯ゼ 豌襴 蠍一 Map :  企  data  讌 覦れ 襦  data 襯 燕  process Reduce :  Map   襷れ伎  data 襯 覈 豕譬朱  蟆郁骸襯 襷  process
Map : <  ,  螳 > -> < も ,  螳 > Map  れ 螳 朱 覦れ 襦 れ 螳 朱 蟲燕  list   Reduce :  < も ,  螳 > ->  螳 Reduce  螳 るゼ 螳讌 覲旧 螳 覦れ  0  蠏 伎 螳  碁煙 炎骸 觜蟲 Map :   伎襯 螳語  覲 煙 豢豢 Reduce :  蠏瑚  碁煙る 覈
DATA DATA DATA Map Map Map Reduce Reduce
Map Map Reduce Reduce  1 螳 2  2 螳 2 A=X  A 螳 X B=Y,Z  B 螳 Y  B 螳 Z Map :  襦 る 螳  Reduce :  螳 れ 螳 牛
覯蟒蟲 伎 蟲 伎 docID=1 docID=2 覯蟒  蟲    伎 (301)  (101) (201) (203)   蟲    伎 (302) (101) (201) (203)  WordID 蟲 101  201 伎 203 覯蟒 301  302 WordID docID 豺 101 1 1 2 1 201 1 2 2 2 203 1 3 2 3 301 1 0 302 2 0
Shuffle Map Reduce Shuffle : Map  豢レ 襴 螳 れ 螳 覈 ル  data  (wordID) 螳 (docID) 301 1 :  0 101 1 : 1 201 1 : 2 203 1 : 3  (wordID) 螳 (docID: 豺 )  襴ろ 101 1:1  2:1 201 1:2  2:2 203 1:3  2:3 301 1:0 302 2:0  (docID) 螳 ( ろ ) 1 覯蟒覓危蟲 伎 2 覓危蟲 伎  (wordID) 螳 (docID) 302 2 : 0 101 2 : 1 201 2 : 2 203 2 : 3 螳  (wordID=docID :  豺 , ) 101 = 1:1, 2:1 201 = 1:2, 2:2 203 = 1:3, 2:3 301 = 1:0 302 = 2:3
Counter 譟郁唄 襷  data   瑚鍵 覿  grep file  轟 覓語伎   谿城  program 覿  sort   data 襯  襦  Map-Reduce   shuffle  螻殊  data 螳 れ 襦 る 轟炎讌  襷  list  伎襦覿 襷 覲企ゼ 豢豢
Master MapReduce  豌 蟯襴 , woker 蟆 覿 Woker Master  蟲 磯  Map Reduce 襯 ろ 螳螳  woker   Map, Reduce  企 讓曙企 ろ GFS Map Reduce Map Reduce GFS woker woker Master
ろ 蟲 MapReduce  襯 覯 ろ蠍  襾語 覦 ~ 豌  螳螳 襾語  覲旧  CPU  覃覈襴レ逢 覿 朱誤 M & R : 2 螳 朱誤 伎 M :  ロ殊 覿  _  殊 蠍一 磯 伎 R :  譴螳 殊 覿壱  _ 螳覦 讌
襦貉襴 譬 螻糾 螳ロ 覈 蟆れ 豌襴伎  data  ′ 覿襯 狩 蟆 Work Queue 企ろ 伎  覈 襾語  CPU  覿 ろ 覿襯 螳螻 り 覿螳 蟆 蟇碁  襾語蟆 豌襴襯 ろ襦 襷ろ磯ゼ  覦煙 襷ろ Map 螻  Reduce 螳 朱 讌   狩 豌襴襯 覲旧 襾語  ろ Backup Task
覿一襴襯  螻  DSL DSL:Domain-Specific Language 覯 襦蠏碁覦 語伎 覓伎企 螳ロ 蟆 讌襷 ,  轟  伎 襷れ  GFS   螳  一危一 覲 詞 Filter : Map  企麹 豌襴 Aggregator : Reduce  企麹 蟆

More Related Content

Google 4

  • 2. Map + Reduce -> 一危磯ゼ 豌襴 蠍一 Map : 企 data 讌 覦れ 襦 data 襯 燕 process Reduce : Map 襷れ伎 data 襯 覈 豕譬朱 蟆郁骸襯 襷 process
  • 3. Map : < , 螳 > -> < も , 螳 > Map れ 螳 朱 覦れ 襦 れ 螳 朱 蟲燕 list Reduce : < も , 螳 > -> 螳 Reduce 螳 るゼ 螳讌 覲旧 螳 覦れ 0 蠏 伎 螳 碁煙 炎骸 觜蟲 Map : 伎襯 螳語 覲 煙 豢豢 Reduce : 蠏瑚 碁煙る 覈
  • 4. DATA DATA DATA Map Map Map Reduce Reduce
  • 5. Map Map Reduce Reduce 1 螳 2 2 螳 2 A=X A 螳 X B=Y,Z B 螳 Y B 螳 Z Map : 襦 る 螳 Reduce : 螳 れ 螳 牛
  • 6. 覯蟒蟲 伎 蟲 伎 docID=1 docID=2 覯蟒 蟲 伎 (301) (101) (201) (203) 蟲 伎 (302) (101) (201) (203) WordID 蟲 101 201 伎 203 覯蟒 301 302 WordID docID 豺 101 1 1 2 1 201 1 2 2 2 203 1 3 2 3 301 1 0 302 2 0
  • 7. Shuffle Map Reduce Shuffle : Map 豢レ 襴 螳 れ 螳 覈 ル data (wordID) 螳 (docID) 301 1 : 0 101 1 : 1 201 1 : 2 203 1 : 3 (wordID) 螳 (docID: 豺 ) 襴ろ 101 1:1 2:1 201 1:2 2:2 203 1:3 2:3 301 1:0 302 2:0 (docID) 螳 ( ろ ) 1 覯蟒覓危蟲 伎 2 覓危蟲 伎 (wordID) 螳 (docID) 302 2 : 0 101 2 : 1 201 2 : 2 203 2 : 3 螳 (wordID=docID : 豺 , ) 101 = 1:1, 2:1 201 = 1:2, 2:2 203 = 1:3, 2:3 301 = 1:0 302 = 2:3
  • 8. Counter 譟郁唄 襷 data 瑚鍵 覿 grep file 轟 覓語伎 谿城 program 覿 sort data 襯 襦 Map-Reduce shuffle 螻殊 data 螳 れ 襦 る 轟炎讌 襷 list 伎襦覿 襷 覲企ゼ 豢豢
  • 9. Master MapReduce 豌 蟯襴 , woker 蟆 覿 Woker Master 蟲 磯 Map Reduce 襯 ろ 螳螳 woker Map, Reduce 企 讓曙企 ろ GFS Map Reduce Map Reduce GFS woker woker Master
  • 10. ろ 蟲 MapReduce 襯 覯 ろ蠍 襾語 覦 ~ 豌 螳螳 襾語 覲旧 CPU 覃覈襴レ逢 覿 朱誤 M & R : 2 螳 朱誤 伎 M : ロ殊 覿 _ 殊 蠍一 磯 伎 R : 譴螳 殊 覿壱 _ 螳覦 讌
  • 11. 襦貉襴 譬 螻糾 螳ロ 覈 蟆れ 豌襴伎 data ′ 覿襯 狩 蟆 Work Queue 企ろ 伎 覈 襾語 CPU 覿 ろ 覿襯 螳螻 り 覿螳 蟆 蟇碁 襾語蟆 豌襴襯 ろ襦 襷ろ磯ゼ 覦煙 襷ろ Map 螻 Reduce 螳 朱 讌 狩 豌襴襯 覲旧 襾語 ろ Backup Task
  • 12. 覿一襴襯 螻 DSL DSL:Domain-Specific Language 覯 襦蠏碁覦 語伎 覓伎企 螳ロ 蟆 讌襷 , 轟 伎 襷れ GFS 螳 一危一 覲 詞 Filter : Map 企麹 豌襴 Aggregator : Reduce 企麹 蟆