지난 빅데이터공부하기에서는 Local Reducer에 대해서 알아보았는데요.
이번 글은 Mapper출력을 어느 Reducer로 하는지 알아보도록하겠습니다.
mapper 출력의 키를 바탕으로 어느 reducer로 보낼지 결정
- 이 때 사용되는 것이 바로 partitioner !
- 디폴트로 사용되는 것이 HashPartitioner(단순 나머지 연산 !)
- Job 클래스의 setPartitionerClass 메소드로 커스텀 partitioner를 지정가능
public class HashPartitioner<K, V> extends Partitioner<K, V>
{
Public int getPartition(K key, V value, int numReduceTasks)
{
return(kev.hashCode() &Integer.MAX..VALUE)%numReduceTasks;
}
}
'빅데이터 > 빅데이터Hadoop' 카테고리의 다른 글
빅데이터공부하기 46-3 Reducer단의 준비 (0) | 2014.09.18 |
---|---|
빅데이터공부하기 46-2 Mapper의 출력버퍼링 (0) | 2014.09.18 |
빅데이터공부하기 46 Local Reducer (0) | 2014.09.17 |
빅데이터공부하기 45-2 주요 writableComparable타입 (0) | 2014.09.15 |
빅데이터공부하기 45-1 밸류타입과 키 타입 (0) | 2014.09.15 |