빅데이터 하둡 프로그래밍 교육과정] RDD
빅데이터 하둡 프로그래밍 교육과정] RDD
실무개발자를위한 실무교육 전문교육센터학원
www.oraclejava.co.kr에 오시면 보다 다양한 강좌를 보실 수 있습니다.
RDD
Resilient Distributed Dataset
탄력적으로 분산된 데이터셋
클러스터에 분산된 메모리를 활용하여 계산되는 List
데이터를 어떻게 구해낼지를 표현하는 Transformation 을 기술한 Lineage(계보)를 interactive하게 만들어 낸 후, Action을 통해 lazy하게 값을 구해냄
클러스터 중 일부의 고장 등으로 작업이 중간에 실패하더라도, Lineage를 통 해 데이터를 복구
'빅데이터 > 빅데이터Hadoop' 카테고리의 다른 글
빅데이터 하둡 프로그래밍 교육과정] Spark (0) | 2018.03.18 |
---|---|
빅데이터 하둡 프로그래밍 교육과정] MapReduce / Hive (0) | 2018.03.18 |
빅데이터 하둡 프로그래밍 교육과정] 빅데이터분석의 시초 (0) | 2018.03.18 |
빅데이터 하둡 프로그래밍 교육과정] sqoop (0) | 2018.03.18 |
빅데이터 하둡 프로그래밍 교육과정] Flume 활용 (0) | 2018.03.18 |