빅데이터/빅데이터Hadoop

빅데이터 하둡 프로그래밍 교육과정 ] 하둡이란

행복한짱짱이 2017. 12. 31. 09:28

빅데이터 하둡 프로그래밍 교육과정 ] 하둡이란

 

빅데이터 하둡 프로그래밍 교육과정 ] 하둡이란

 

 

 

실무개발자를위한 실무교육 전문교육센터학원
www.oraclejava.co.kr에 오시면 보다 다양한 강좌를 보실 수 있습니다.

 

 

 

하둡이란

 

 

 

 - 대용량 데이터를 분산 처리할 수 있는 자바 기반의 오픈소스 프레임워크
 - 분산 파일 시스템인 HDFS(Hadoop Distributed Files System)에 데이터를 저장하고 분산  처리 시스템인 맵리듀스를 이용해 데이터를 처리
 - 2005년에 더그 커팅(Doug Cutting)이 구글이 논문으로 발표한 GFS(Google File System)와  MapReduce를 구현한 결과물
 - 데이터의 복제본을 저장하기 때문에 데이터의 유실이나 장애가 발상했을 때도 데이터의 복구가 가능함

 

*정형 데이터  RDBMS저장 (RDBMS는 라이선스 비용이 비쌈)
  - RDBMS: 데이터가 저장된 서버에서 데이터를 처리

* 비정형 데이터(사이즈 큼)  Hadoop 저장
  - 하둡: 여러 대의 서버에 데이터를 저장하고, 데이터가 저장된 각 서버에서 동시에 데이터를 처리