빅데이터 하둡 프로그래밍 교육과정 ]Mapper출력을 어느 Reducer로?

행복한짱짱이 2017. 1. 31. 19:50

2017. 1. 31. 19:50

실무개발자를위한 실무교육 전문교육센터학원

www.oraclejava.co.kr에 오시면 보다 다양한 강좌를 보실 수 있습니다.

Mapper출력을 어느 Reducer로?

■ mapper 출력의 키를 바탕으로 어느 reducer로 보낼지 결정

- 이때 사용되는 것이 바로 partitioner!

- 디폴트로 사용되는 것이 HashPartitioner (단순 나머지 연산!)

- Job 클래스의 setPartitionerClass 메소드로 커스텀 partitioner를 지정가능

public class HashPartitioner<K, V> extends Partitioner<K, V> {

public int getPartition(K key, V value, int numReduceTasks) {

return (key.hashCode() & Integer.MAX_VALUE) % numReduceTasks;

}

빅데이터 하둡 프로그래밍 교육과정 ]Reducer단의 준비작업 (0)	2017.01.31
빅데이터 하둡 프로그래밍 교육과정 ]Mapper의 출력 버퍼링 (0)	2017.01.31
빅데이터 하둡 프로그래밍 교육과정 ]Local Reducer (0)	2017.01.31
빅데이터 하둡 프로그래밍 교육과정 ]주요 WritableComparable 타입들 (0)	2017.01.31
빅데이터 하둡 프로그래밍 교육과정 ]키 타입 (0)	2017.01.31

it개발자스터디공간