빅데이터/빅데이터Hadoop
빅데이터 하둡 프로그래밍 교육과정] 빅데이터의 3대 요소
행복한짱짱이
2017. 12. 31. 09:24
빅데이터 하둡 프로그래밍 교육과정] 빅데이터의 3대 요소
빅데이터 하둡 프로그래밍 교육과정] 빅데이터의 3대 요소
실무개발자를위한 실무교육 전문교육센터학원
www.oraclejava.co.kr에 오시면 보다 다양한 강좌를 보실 수 있습니다.
빅데이터의 3대 요소
* 크기
- 수십terabyte ~ 수십petabyte
- 분산 컴퓨팅 기법으로 데이터를 저장, 분석해야 함
: 솔루션: 구글의 GFS, 아파치의 하둡
* 속도
- 빠른 속도로 생성되는 디지털 데이터를 처리 하기 위 해 실시간으로 데이터를 생산, 저장, 유통, 수집, 분석 처리해야 함
- 수집된 대량의 데이터를 장기적이고 전략적인 차원에서 접근하여 분석해야 함
: 데이터 마이닝, 기게 학습, 자연어 처리, 패턴 인식 등을 활용
* 다양성
- 정형(Structured) 데이터: 고정된 필드에 저장되는 데이터
- 반정형(Semi-structured) 데이터: XML, HTML 같이 메타데이 터나 스키마 등을 포함하는 데이터
- 비정형(Unstructed) 데이터: 인터넷 상에서 발생하는 SNS 데이터, 동영상, 위치정보, 통화 내용 등