빅데이터 하둡 프로그래밍 교육과정 ]개요
빅데이터 하둡 프로그래밍 교육과정 ]개요
실무개발자를위한 실무교육 전문교육센터학원
www.oraclejava.co.kr에 오시면 보다 다양한 강좌를 보실 수 있습니다.
개요
■ 2M 영문 위키피디아 페이지(2M.ID.CONTENTS)들에 있는 단어들의 수를 빈도수를 계산.
■ 앞서 본 WordCount와 크게 안 다름. 몇 가지 차이점
- 입력파일의 형태가 다름. ID\tContent. ID는 그냥 무시.
- KeyValueTextInputFormat을 입력포맷으로 사용.
- Combiner를 사용 (Reducer를 그대로 적용).
* Combiner는 mapper 출력에 적용되는 로컬 reducer! 교환법칙과 결합법칙 성립 오퍼레이션에만 적용가능.
- 카운터 사용
'빅데이터 > 빅데이터Hadoop' 카테고리의 다른 글
빅데이터 하둡 프로그래밍 교육과정 ]Combiner의 동작확인 (0) | 2017.02.03 |
---|---|
빅데이터 하둡 프로그래밍 교육과정 ]코드 (0) | 2017.02.02 |
빅데이터 하둡 프로그래밍 교육과정 ]데이터 다운로드 (0) | 2017.02.02 |
빅데이터 하둡 프로그래밍 교육과정 ]데이터 준비(2) (0) | 2017.02.02 |
빅데이터 하둡 프로그래밍 교육과정 ]데이터 준비 (1) (0) | 2017.02.02 |