빅데이터공부하기 9] 웍플로우 실행 및 관리

 

이번 빅데이터공부하기 9번째 글은 웍플로우 실행 및 관리에 대해서 올립니다.

빅데이터공부하시는 분들 !!! 아자아자!! 파이팅하자구요 ^----^

 

그럼 빅데이터공부하기 9번째 글을 써보도록 할께요..

 

웍플로우 실행 및 관리

 

- 계속정으로 발생하는 데이터의 처리를 위해 처리작업들의 실행이 자동화되어야함

* 복잡한 ETL 작업의 경우 수십개의 job들의 chaining이 필요

 

* 주기적으로 혹은 데이터가 특정 위치에 생기면 특정 Job을 시작하게 하는

   메커니즘이 필요. 즉, 웍플로우 관리가 필요.

 

 

- 몇개의 오픈소스 프로젝트가 널리쓰임.

* Oozie, Cascading, Azkaban, Hamake, ...

 

 

빅데이터공부하기 9] 웍플로우 실행 및 관리

 

잠깐만요 !!

빅데이터RHADOOP 오프라인 강좌를 원하신다면!!

클릭을 눌러주세요^^

 

 

 

+ Recent posts