빅데이터공부하기 20 하둡배포판

 

빅데이터공부하기 20번째글은 하둡배포판에 대해서 공부를 해보겠습니다.

 

 

 

 

하둡배포판

 

- 아파치재단(Apache Foundation)이 제공하는 하둡은 0.10버전부터 시작해서 현재 0.23까지 나와있으면 이중 일부 버전은 1.0과 2.0의 메이저버전으로 존재합니다.

 

- 지금 현재 액티브하게 개발되고 있는 버전들은 다음과 같습니다.

* 2.x.x: 현재 베타전(0.23.x기반)

* 1.x:현재 안정버전(0.22.x기반)

 

- 뒤에서 랩세션에서는 1.0.3의 하둡을 사용할 것입니다.

 


 

 

3rd 파티 하둡 배포판

 

- 대표적으로 클라우데라(Cloudera)나 홀튼웍스(HortonWorks),MapR등의 회사도 하둡배포판을 만듬

 

- 참고로 클라우데라의 배포판들은 http://www.cloudera.com/hadoop/ 에서 더 자세한 사항을 볼 수 있는데 실질적으로 가장 많이 사용되는 배포판이며 흔히 CDH라 부릅니다.

 

- 홀튼웍스의 배포판은 폴튼웍스 데이터 플랫폼이라 불리우며 HDP라 부르기도 합니다.

http://hortonworks.com/products/hortonwoksdataplatform/ 에서 다운로드 가능

 

- 둘다 역시 오픈소스이며 개인이 사용할 경우 무료이다.

 

- MapR의 배포판은 AWS의 ElasticMapReduce에서 사용

 

- VMWare가 가상화버전의 Hadoop을 발표 (2012 Hadoop Summit)-ProjectWerengeti

 

 

 

빅데이터공부하기 20 하둡배포판

 

+ Recent posts