【 청년일보 】 데이터(Data)는 우리가 정보로 순화하기 위한 유무형의 자료이다. 이러한 데이터를 이용하여 보다 질 좋고 정형화된 정보 처리를 위한 데이터 분석 기술에 빅데이터 분석이 속한다.
특히, 자료와 정보가 많아진 현 시대에 대용량 및 다양한 형태의 데이터를 수집, 저장, 처리 과정을 거쳐 유용한 정보 도출 및 시각화를 수행하는 빅데이터 분석은 정말 중요하게 이용되는 분석기술이다.
◆ 데이터 분석의 발전 양상
현 시대의 삶의 질이 과거에 비해 현저하게 향상됨에는 자료에 대한 분석 및 적용의 발전 또한 동반한다고 할 수 있다.
과거에는 주어진 데이터에 대해 '발생한 사건'을 파악하고 데이터를 요약하고 설명하는데 중점을 두었던 서술적 분석 방식을 사용하였다면 현재는 주어진 데이터를 심층적으로 분석하고 “발생한 이유”를 파악하여 관찰된 근본 패턴과 추세를 식별하는 진단적 분석 방식으로 진화했다.
뒤이어 진행될 미래에는 과거의 데이터와 통계 모델링 및 머신 러닝을 사용하여 추세를 예측하고, 수행할 작업을 제시하여 예측을 넘어 이전에 파생된 인사이트를 기반으로 향후 작업을 최적화하기 위한 내용을 제공하는 분석 방식으로 진화할 것이다.
◆ 무궁무진한 데이터 분석의 앞면, 그 뒷면을 극복하라
빅데이터 분석 기법의 적용으로 확실하게 인류의 삶에는 다양하고 유용한 정보들이 사용되고 있다. 다만, 이러한 분석 기법의 사용에도 확실한 한계점이 존재한다. 광범위한 데이터를 활용하기에 데이터의 품질과 무결성이 보장되는 측면에서 부족할 수 있고 서로 다른 데이터 소스를 통합하고 개인정보 및 보안을 보호하는 것에 있어 일말의 문제라도 발생하지 않도록 안전상태를 유지하는 것이 빅데이터 분석의 최우선 중점 과제일 것이다.
이러한 과제를 성공적으로 수행해낸다면 비용절감은 물론 더 나은 정보에 기반한 의사 결정이 가능하고 최적화된 위험관리전략을 수립할 수 있게 된다. 그렇기에 장점의 무궁한 성장만을 볼 것이 아닌 단점을 보완해 나가는 것 또한 중요한 과업이다.
◆ 한국 야구의 발전에도 기여한 빅데이터 분석
야구라는 스포츠에 빅데이터 분석이 가미되면서 좀 더 정형화되고 지표로 확인할 수 있는 내용이 많아지며 각 선수의 기여도를 평가하는 것이 수월해졌다.
현재 야구에서 적용하고 있는 빅데이터 분석기법의 대표 중 하나인 '세이버매트릭스'는 출루율(OBP), 장타율(SLG), WAR 등을 분석 정리하여 전통 지표의 한계를 보완하여 선수의 진정한 기여도를 평가하는데 큰 도움을 준다. 또한 'tatcast/Hawk-Eye'를 이용하여 선수의 움직임, 공의 속도, 발사각, 스핀 레이트 등을 정밀 측정하여 타격 및 투구 전략 수립에도 활용하는 모습을 보여주고 있다.
데이터가 넘쳐나며 세상이 복잡해질수록 데이터를 풀어내고 분석하여 정리하는 기술의 가치는 더욱 중요해질 것이다. 빅데이터 분석은 하나의 분석 도구로의 존재 가치를 넘어 데이터 분석의 새로운 방향성을 제시하는 네비게이션이 되고 있다.
【 청년서포터즈 9기 문선웅 】












