이번 빅데이터공부하기 39번째글은 MAIN함수코드 설명입니다.
먼저 Main 함수부터 공부해보겠습니다. ^^
main 함수
Configuration과 Job 인스턴스 생성
두 인스턴스를 이용해서 수행하려는 잡의 환경설정
- mapper, rduecer 클래스지정
- 입렵/출력포맷 지정
- 입력파일위치, 출력디렉토리 지정
둘다 HDFS(혹은 AWS의 S3도 가능)
여러개 잡들의 chaining도 가능
public static void main(String[] args) throws Exception
{
Configuration conf = new Configuration();
Job job = new Job(conf, "wordcount");
job.setJarByClass(WordCount.class);
job.setMapperClass(Map.class);
job.setReducerClass(Reduce.class);
job.setOutputKeyClass(Text.class);
job.setOutputValueClass(LongWritable.class);
job.setInputFormatClass(Text.class);
job.setOutputFormatClass(TextOutputFormat.class);
FileInoutFormat.addlnputPath(job, new Path(args[0]));
FileOutputFormat.setOutputPath(job, new Path(args[1]));
job.watiForCompletion(true);
}
여!기!까!지
다음 빅데이터 글에서 또만나요 ^^
'빅데이터 > 빅데이터Hadoop' 카테고리의 다른 글
빅데이터공부하기 41 Reducer클래스 (0) | 2014.09.02 |
---|---|
빅데이터공부하기 40 mapper 클래스 (0) | 2014.09.01 |
빅데이터공부하기 38 MAPREDUCE 프로그램의 기본골격 (0) | 2014.08.29 |
빅데이터공부하기 37 WordCount 프로그램 (0) | 2014.08.27 |
빅데이터공부하기 36-4 예제프로그램 실행확인 (0) | 2014.08.27 |