WordCount 의사코드
• Map(key, value)
– value: a line of text
• Tokenize value
• For each token
– emit(token, 1)
• Reduce(key, list(values))
– key: a word
– values: a list of count (1)
• Iterate values and sum them up
• emit (key, sum)
'빅데이터 > 빅데이터Hadoop' 카테고리의 다른 글
[ 빅데이터 Tip ]- WordCount 의사코드 (0) | 2015.12.11 |
---|---|
[ 빅데이터 Tip ]- WordCount 의사코드 (0) | 2015.12.10 |
[ 빅데이터 Tip ]- Scheduler (0) | 2015.12.10 |
[ 빅데이터 Tip ]- Job & Tasks (0) | 2015.11.20 |
[ 빅데이터 Tip ]- Job Tracker (2) (0) | 2015.11.20 |