빅데이터 하둡 프로그래밍 교육과정 ]명령어 맛보기 - FOREACH




빅데이터 하둡 프로그래밍 교육과정 ]명령어 맛보기 - FOREACH

실무개발자를위한 실무교육 전문교육센터학원

www.oraclejava.co.kr에 오시면 보다 다양한 강좌를 보실 수 있습니다.



명령어 맛보기 - FOREACH


■max_temp = FOREACH grouped_records GENERATE group, MAX(records.temperature);


■ Foreach는 그 다음에 나오는 relation의 그룹 리스트를 하나씩 스캔하면서 Generate 다음에 명시된 필드들로 새로운 relation을 만들어냄.


■ GENERATE 다음에 바로 나온 group은 키워드로 앞서 사용된 그룹의 키 필드를 가리킨다. 이 경우 처음 records relation의 year 필드가 된다. 


■ MAX는 그룹핑된 tuple에서 지정된 필드들중 가장 큰 값만을 선택한다. 

 - 즉 같은 year를 갖는 records 레코드들 중에서 temperature가 가장 큰 값을 계산해내게 된다. MAX 이외에도 AVG, COUNT등의 함수(Eval함수라고 부름)를 쓸 수 있으며 필요한 기능이 있으면 UDF로 확장가능.



+ Recent posts