빅데이터 하둡 프로그래밍 교육과정 ]명령어 맛보기 - FOREACH
빅데이터 하둡 프로그래밍 교육과정 ]명령어 맛보기 - FOREACH
실무개발자를위한 실무교육 전문교육센터학원
www.oraclejava.co.kr에 오시면 보다 다양한 강좌를 보실 수 있습니다.
명령어 맛보기 - FOREACH
■max_temp = FOREACH grouped_records GENERATE group, MAX(records.temperature);
■ Foreach는 그 다음에 나오는 relation의 그룹 리스트를 하나씩 스캔하면서 Generate 다음에 명시된 필드들로 새로운 relation을 만들어냄.
■ GENERATE 다음에 바로 나온 group은 키워드로 앞서 사용된 그룹의 키 필드를 가리킨다. 이 경우 처음 records relation의 year 필드가 된다.
■ MAX는 그룹핑된 tuple에서 지정된 필드들중 가장 큰 값만을 선택한다.
- 즉 같은 year를 갖는 records 레코드들 중에서 temperature가 가장 큰 값을 계산해내게 된다. MAX 이외에도 AVG, COUNT등의 함수(Eval함수라고 부름)를 쓸 수 있으며 필요한 기능이 있으면 UDF로 확장가능.
'빅데이터 > 빅데이터Hadoop' 카테고리의 다른 글
빅데이터 하둡 프로그래밍 교육과정 ]WordCount in Pig (0) | 2017.04.03 |
---|---|
빅데이터 하둡 프로그래밍 교육과정 ]명령어 맛보기 - STORE (0) | 2017.04.03 |
빅데이터 하둡 프로그래밍 교육과정 ]명령어 맛보기 - Group (0) | 2017.04.03 |
빅데이터 하둡 프로그래밍 교육과정 ]명령어 맛보기 - Load (0) | 2017.04.03 |
빅데이터 하둡 프로그래밍 교육과정 ]Pig 스크립트의 실행방법 (0) | 2017.03.31 |