본문 바로가기
IT

빅데이터란? 빅데이터의 정의

2021. 5. 16.
반응형


오늘날 정보통신 분야의 Hot키워드는 단연 빅데이터다. 빅데이터란 기존 데이터보다 규모가 크고 기존 방법과 도구를 이용해 수집·저장하기 어려운 고정·비표준 데이터를 말한다. 세계적인 컨설팅업체 맥킨지(Mckinsey)는 빅데이터의 정의가 기존 데이터베이스 관리 툴의 데이터 수집·저장·관리·분석 기능을 넘어 주관적이어서 앞으로도 계속 변화할 것이라고 말했다. 일부 그룹에서는 빅 데이터를 테라바이트 이상의 데이터 또는 대량의 데이터를 처리하는 아키텍처로 정의한다.

  • 빅데이터의 특징
    빅 데이터 기능에는 크기, 속도 및 다양성이 포함된다. 크기는 일반적으로 수십 테라바이트 또는 수십 페타바이트 이상의 데이터 속성을 나타낸다. 속도는 대량의 데이터를 신속하게 처리하고 분석할 수 있는 속성입니다. 융합·복합 환경에서 디지털 데이터가 매우 빠른 속도로 생성되기 때문에 디지털 데이터를 실시간으로 저장·유통·수집·분석할 수 있다는 의미다. 다양성은 다양한 유형의 데이터를 의미하며 포맷 유형에 따라 고정, 준표준, 비정형 데이터로 분류할 수 있다.
  • 빅데이터 플랫폼
    빅데이터 플랫폼은 빅데이터 기술의 집합체이자 기술이 성공적으로 사용될 수 있도록 준비된 환경이다. 기업은 빅데이터 플랫폼을 사용하여 빅데이터를 수집, 저장, 처리 및 관리할 수 있습니다. 빅데이터 플랫폼은 빅데이터를 분석하고 활용하는 데 필요한 인프라다. 빅 데이터 플랫폼은 일련의 프로세스를 원활하고 통합적으로 제공하여 빅 데이터의 근본 원인을 파악, 저장 및 처리해야 합니다. 이처럼 사전 처리된 데이터를 안정적으로 분석하고 다양한 작업에 대해 처리하면 사용자가 원하는 가치를 정확하게 얻을 수 있다.
  • 빅데이터 핵심 기술
    빅데이터를 다루는 프로세스로서의 병렬 처리의 핵심은 분열과 정복이다. 즉, 데이터는 독립적인 형태로 분할되어 병렬로 처리된다. 빅데이터의 데이터 처리는 문제가 여러 소규모 작업으로 나뉘어 하나의 결과로 결합되는 것을 의미한다. 대용량 데이터를 처리하는 가장 널리 알려진 기술은 Apache Hadoop과 같은 Map-Reduce 분산 데이터 처리 프레임워크이다.
  • 빅데이터 활용 사례 연구
    2014년 월드컵과 2016년 올림픽을 준비하고 있는 리우데자네이루는 지능형 운영센터(IOC)를 통해 도시 관리와 비상대응 시스템을 갖추고 있다. IBM의 분석 솔루션이 적용된 지능형 관리센터에는 교통, 전기, 홍수, 산사태, 수자원 등 자연재해를 관리할 수 있는 시스템이 갖춰져 있다. IBM의 고해상도 기상 예측 시스템은 엄청난 양의 기상 데이터를 분석하고 48시간 전에 폭우를 예보한다. 싱가포르는 차량의 기하급수적인 증가로 인한 교통혼잡을 줄이기 위해 교통예측시스템을 도입했다. 싱가포르는 이 시스템을 통해 85% 이상의 정확도로 트래픽을 측정한다.

 

 

 

 

반응형

댓글