하둡 소개

 

 

 

 

하둡은 대용량의 데이터를 분산처리해줄 있도록 해주는 아파치 레벨 오픈소스 프로젝트
순전히 소프트웨어 프레임웍이며 자바로 작성.
Nutch/Lucene 프로젝트의 서브컴포넌트로 시작하여 2006년에 독립프로젝트로 분리.
크게 분산파일시스템(HDFS) 분산처리시스템(MapReduce)으로 구성

  

* 이밖에도 하둡커몬(Common)이라고 위의 시스템에서 모두 필요한 라이브러리들도 하둡의 일부.

 

 

 

 

 

+ Recent posts