빅데이터 하둡 프로그래밍 교육과정 ]Version 1
빅데이터 하둡 프로그래밍 교육과정 ]Version 1
실무개발자를위한 실무교육 전문교육센터학원
www.oraclejava.co.kr에 오시면 보다 다양한 강좌를 보실 수 있습니다.
Version 1
■ V1은 아무런 최적화작업없이 WordCount를 조금 바꾼 형태로 구현된다.
■ WordCount에서는 텍스트부분을 파싱한 다음에 만들어진 토큰들에 대해 다음과 같이 reducer로의 출력쌍을 만들었다.
- context.write(word, new LongWritable(1));
■ InvertedIndex에서는
- context.write(word, new Text(docID));
■위와 같이 단어키에 대해 docID를 밸류로 내보낸다.
■ Reducer 부분에서는 그냥 넘어오는 docID를 계속해서 스트링버퍼에 append한 후 결과물로 내보낸다.
'빅데이터 > 빅데이터Hadoop' 카테고리의 다른 글
빅데이터 하둡 프로그래밍 교육과정 ]Version 1의 문제 (0) | 2017.02.10 |
---|---|
빅데이터 하둡 프로그래밍 교육과정 ]Version 1 - reduce (0) | 2017.02.10 |
빅데이터 하둡 프로그래밍 교육과정 ]Inverted index v1, v2 and v3 개요 (0) | 2017.02.10 |
빅데이터 하둡 프로그래밍 교육과정 ]MyMapper.setup (2) (0) | 2017.02.10 |
빅데이터 하둡 프로그래밍 교육과정 ]MyMapper.setup (1) (0) | 2017.02.09 |