빅데이터 하둡 프로그래밍 교육과정 ]SequenceFileOutputFormat
빅데이터 하둡 프로그래밍 교육과정 ]SequenceFileOutputFormat
실무개발자를위한 실무교육 전문교육센터학원
www.oraclejava.co.kr에 오시면 보다 다양한 강좌를 보실 수 있습니다.
SequenceFileOutputFormat
■ SequenceFile 포맷의 파일을 쓸때 사용하는 포맷
- 특히 여러 하둡잡들을 체인닝하여 작업을 할때 굉장히 유용 (퍼포먼스 측면).
■ 퍼포먼스를 고려하면 반드시 사용해야할 출력포맷. setOutputCompressionType 메소드를 통해 압축방식 지정가능 (BLOCK, NONE, RECORD)
■ 헤더의 존재로 인해 파일이 내용이 없는 경우에도 크기가 0가 아님.
'빅데이터 > 빅데이터Hadoop' 카테고리의 다른 글
빅데이터 하둡 프로그래밍 교육과정 ]카운터 터미널 출력예 (0) | 2017.02.01 |
---|---|
빅데이터 하둡 프로그래밍 교육과정 ]카운터 (0) | 2017.02.01 |
빅데이터 하둡 프로그래밍 교육과정 ]TextOutputFormat (0) | 2017.02.01 |
빅데이터 하둡 프로그래밍 교육과정 ]기타 (0) | 2017.02.01 |
빅데이터 하둡 프로그래밍 교육과정 ]Identity Reducer (0) | 2017.02.01 |