빅데이터공부하기 23. HDFS 개요
이번 23번째 빅데이터공부하기의 글은 HDFS의 개요입니다. ^^
빅데이터공부는 " ORACLEJAVA IT공부하자 " 티스토리 많이 애용해주세요
HDFS 개요
- 2003년 구글랩에서 발표된 The Google Filesystem이란 논문을 바탕으로 작성된 파일시스템.
- 이 시스템의 특징
* 파일을 여러개의 블록으로 나눠 저장 (기본 64MB)
* 하드웨어 고장에 견고
- 한 데이터블록을 보통 3군데 (Replication factor)에 저장하며 저장시 같은 rack에 있는 서버들에 두 개에 저장하고 다른 하나는 다른 rack에 있는 서버에 저장
* Write Once ReadMany
- Append작업은 가능하지만 내용을 바꾸기 위해서는 파일 전체를 새로 써야한다.
* 스트리밍 데이터 액세스
- 배치잡에 최적화
* MapReduce나 HBase와 같은 시스템의 기본구성블록으로 사용
* 계층구조의 파일시스템을 제공
빅데이터공부하기 23. HDFS 개요
'빅데이터 > 빅데이터Hadoop' 카테고리의 다른 글
빅데이터 공부하기 24-1 NameNode (0) | 2014.07.15 |
---|---|
빅데이터공부하기 24. NameNode (0) | 2014.07.15 |
빅데이터공부하기 22. 하둡공부 (0) | 2014.07.14 |
빅데이터공부하기 21. 작업모델 (0) | 2014.07.14 |
빅데이터공부하기 21. 하둡공부 (0) | 2014.07.14 |