빅데이터 하둡 프로그래밍 교육과정 ] Version 2




빅데이터 하둡 프로그래밍 교육과정 ]Version 2

실무개발자를위한 실무교육 전문교육센터학원

www.oraclejava.co.kr에 오시면 보다 다양한 강좌를 보실 수 있습니다.


Version 2


■ 앞에서 설명했듯이 이 버전은 Mapper에서 단순무식하게 (word,docID) 쌍을 출력하는 것이 아니라 HashSet을 이용한 unique한 (word,docID)쌍을 내보낸다. 



■ StringTokenizer를 이용해 파싱이 끝나면 루프를 돌면서 단어들을 HashSet에 집어넣은 다음에 HashSet을 iteration하면서 나온 단어들과 해당문서의 docID를 Reducer로 넘긴다.



+ Recent posts