빅데이터 하둡 프로그래밍 교육과정 ]TextInputFormat
빅데이터 하둡 프로그래밍 교육과정 ]TextInputFormat
실무개발자를위한 실무교육 전문교육센터학원
www.oraclejava.co.kr에 오시면 보다 다양한 강좌를 보실 수 있습니다.
TextInputFormat
■ 디폴트 입력포맷클래스는 TextInputFormat
- FileInputFormat에서 계승됨.
- 텍스트파일 대상이며 .gz로 압축된 것도 처리.
- 라인 하나 (\n, \r)가 하나의 입력레코드
- 키: 라인의 파일 오프셋. LongWritable 타입
- 밸류: 라인 전체 스트링. Text 타입
■입력포맷클래스의 변경은 Job클래스의 setInputFormatClass로 지정
'빅데이터 > 빅데이터Hadoop' 카테고리의 다른 글
빅데이터 하둡 프로그래밍 교육과정 ]SequenceFileInputFormat (0) | 2017.01.25 |
---|---|
빅데이터 하둡 프로그래밍 교육과정 ]KeyValueTextInputFormat (0) | 2017.01.25 |
빅데이터 하둡 프로그래밍 교육과정 ]Mapper갯수의 결정방식 (0) | 2017.01.25 |
빅데이터 하둡 프로그래밍 교육과정 ]Mapper 출력타입 (0) | 2017.01.25 |
빅데이터 하둡 프로그래밍 교육과정 ]Mapper 입력지정 (0) | 2017.01.25 |