빅데이터 하둡 프로그래밍 교육과정] 빅데이터의 3대 요소

 

 

빅데이터 하둡 프로그래밍 교육과정] 빅데이터의 3대 요소

 

 

 

 

실무개발자를위한 실무교육 전문교육센터학원
www.oraclejava.co.kr에 오시면 보다 다양한 강좌를 보실 수 있습니다.

 

 

빅데이터의 3대 요소

 

 

 

* 크기
 - 수십terabyte ~ 수십petabyte
 - 분산 컴퓨팅 기법으로 데이터를 저장, 분석해야 함
     : 솔루션: 구글의 GFS, 아파치의 하둡

 

* 속도
 - 빠른 속도로 생성되는 디지털 데이터를 처리 하기 위  해 실시간으로 데이터를 생산, 저장, 유통, 수집, 분석  처리해야 함
 - 수집된 대량의 데이터를 장기적이고 전략적인 차원에서 접근하여 분석해야 함
      : 데이터 마이닝, 기게 학습, 자연어 처리, 패턴  인식 등을 활용

 

* 다양성
 - 정형(Structured) 데이터: 고정된 필드에 저장되는 데이터
 - 반정형(Semi-structured) 데이터: XML, HTML 같이 메타데이  터나 스키마 등을 포함하는 데이터
 - 비정형(Unstructed) 데이터: 인터넷 상에서 발생하는 SNS 데이터, 동영상, 위치정보, 통화 내용 등

+ Recent posts