빅데이터 하둡 프로그래밍 교육과정] 빅데이터분석의 시초
빅데이터 하둡 프로그래밍 교육과정] 빅데이터분석의 시초
실무개발자를위한 실무교육 전문교육센터학원
www.oraclejava.co.kr에 오시면 보다 다양한 강좌를 보실 수 있습니다.
빅데이터분석의 시초
- GFS(Google File System) 논문 (2003)
: 여러 컴퓨터를 연결하여 저장용량과 I/O성능을 scale
: 이를 구현한 오픈소스 프로젝트인 Hadoop HDFS
- MapReduce논문 (2004)
: Map과 Reduce연산을 조합하여 클러스터에서 실행, 큰 테이터를 처리
: 이를 구현한 오픈소스 프로젝트인 Hadoop MapReduce
- Hive
: MapReduce 코드를 짜는건 괴롭다
: 쿼리로 MapReduce의 거의 모든 기능을 표현할 수 있다!
: HDFS등에 있는 파일을 읽어들여 쿼리로 분석 수행
: HiveQL 을 작성하면 MapReduce 코드로 변환되어 실행
'빅데이터 > 빅데이터Hadoop' 카테고리의 다른 글
빅데이터 하둡 프로그래밍 교육과정] RDD (0) | 2018.03.18 |
---|---|
빅데이터 하둡 프로그래밍 교육과정] MapReduce / Hive (0) | 2018.03.18 |
빅데이터 하둡 프로그래밍 교육과정] sqoop (0) | 2018.03.18 |
빅데이터 하둡 프로그래밍 교육과정] Flume 활용 (0) | 2018.03.18 |
빅데이터 하둡 프로그래밍 교육과정] Flow 설정 (0) | 2018.03.18 |