빅데이터/빅데이터Hadoop
빅데이터 하둡 프로그래밍 교육과정 ]TextInputFormat
행복한짱짱이
2017. 1. 25. 19:34
빅데이터 하둡 프로그래밍 교육과정 ]TextInputFormat
빅데이터 하둡 프로그래밍 교육과정 ]TextInputFormat
실무개발자를위한 실무교육 전문교육센터학원
www.oraclejava.co.kr에 오시면 보다 다양한 강좌를 보실 수 있습니다.
TextInputFormat
■ 디폴트 입력포맷클래스는 TextInputFormat
- FileInputFormat에서 계승됨.
- 텍스트파일 대상이며 .gz로 압축된 것도 처리.
- 라인 하나 (\n, \r)가 하나의 입력레코드
- 키: 라인의 파일 오프셋. LongWritable 타입
- 밸류: 라인 전체 스트링. Text 타입
■입력포맷클래스의 변경은 Job클래스의 setInputFormatClass로 지정