빅데이터/빅데이터Hadoop
빅데이터 하둡 프로그래밍 교육과정] HDFS 설계 목표
행복한짱짱이
2018. 1. 21. 09:29
빅데이터 하둡 프로그래밍 교육과정] HDFS 설계 목표
빅데이터 하둡 프로그래밍 교육과정] HDFS 설계 목표
실무개발자를위한 실무교육 전문교육센터학원
www.oraclejava.co.kr에 오시면 보다 다양한 강좌를 보실 수 있습니다.
HDFS 설계 목표
1. 장애 복구
- 디스크 오류로 인한 데이터 저장 실패 및 유실과 같은 장애를 빠른 시간에 감지하고 대처
- 데이터를 저장하면, 복제 데이터도 함께 저장해서 데이터 유실을 방지함
- 분산 서버 간 주기적인 상태 체크
2. 스트리밍 방식의 데이터 접근
- HDFS에 파일 저자 및 조회를 위해 스트리밍 방식으로 데이터에 접근해야 함
- 배치 작업과 높은 데이터 처리량을 위해 스트리밍 방식을 사용
3. 대용량 데이터 저장
- 하나의 파일이 기가바이트에서 테라바이트 이상의 사이즈로 저장될 수 있게 설계
- 높은 데이터 전송 대역폭, 하나의 클러스터에서 수백 대의 노드를 지원
- 하나의 인스턴스에서 수백만 개 이상의 파일을 지원
4. 데이터 무결성
- 한번 저장한 데이터를 수정할 수 없음(읽기만 가능)
- 파일 이동, 삭제, 복사할 수 있는 인터페이스 제공