빅데이터 하둡 프로그래밍 교육과정 ] 빅데이터의 정의





빅데이터 하둡 프로그래밍 교육과정 ] 빅데이터의 정의


실무개발자를위한 실무교육 전문교육센터학원

www.oraclejava.co.kr에 오시면 보다 다양한 강좌를 보실 수 있습니다.


빅데이터의 정의


정의 1

■ “서버 한대로 처리할 수 없는 규모의 데이터”

■ 2012년 4월 아마존 클라우드 컨퍼런스에서 아마존의 data scientist인 존 라우저가 내린 정의

  분산 환경이 필요하느냐에 포커스



정의2

■ “기존의 소프트웨어로는 처리할 수 없는 규모의 데이터”

■ 대표적인 기존 소프트웨어

  오라클/MySQL과 같은 관계형 데이터베이스

  많은 경우 분산환경을 염두에 두지 않음. Scale-up 접근방식 (vs. Scale-out)



정의3

■ 4V (Volume,Velocity,Variety,Variability)

  Volume: 데이터의 크기가 대용량

  Velocity: 데이터의 생성속도

  Variety: 구조화/비구조화 데이터

  Variability: 데이터의 포맷 변화

■ IDC와 같은 컨설팅업체가 가장 많이 사용하는 정의

+ Recent posts