맨위로가기
닫기
※수집한 개인정보는 모바일 뉴스레터
발송에만 사용됩니다.
개인정보 수집 동의
닫기
닫기
반도체 콘첸츠 보고 궁금한 점을 질문하세요!
이름
E-MAIL
제목
내용
완료하기
  • 페이스북
  • 유튜브
  • 네이버
  • 뉴스레터
  • 소셜네트워크
  • 소셜네트워크

데이터 과학자, 그들이 필요하다

TECH/IT 트렌드

 

 

스마트폰의 보급과 인터넷, SNS 등의 확산으로 전세계 데이터양이 폭발적으로 급증하고 있습니다. 이렇게 쌓인 빅데이터(Big Data)는 4차 산업혁명 시대의 큰 자산으로 인정받고 있는데요. 하지만 데이터를 쌓아만 놓고 활용하지 못한다면 아무 쓸모가 없겠죠? 데이터가 큰 힘을 갖고 있는 지금, 빅데이터의 잠재력을 활용하기 위한 인재가 꼭 필요할 텐데요. 그래서 현재 가장 주목 받고 있는 직업이 바로 데이터 과학자입니다. 2012년 하버드 비즈니스 리뷰(Harvard Business Review)에서 “21세기 최고의 섹시한 직업”이라고 말한 데이터 과학자! 그들은 과연 무엇을 하는 사람들일까요?

 
 
 

데이터 안에서 미래를 보는 '데이터 과학'

 

 

 

 

빅데이터란 문자, 이미지, 음성, 영상, 위치정보 등 다양한 형태의 방대한 디지털 데이터를 의미합니다. 과거 단순한 텍스트 기반의 데이터베이스와는 달래 생성속도가 매우 빠르고 종류도 무수히 많습니다. 또한, 시간이 경과함에 따라 실시간으로 바뀌는 데이터까지 포함됩니다.


IBM에 따르면 전 세계 데이터의 대부분은 지난 3년동안 생성되었다고 하는데요. 데이터의 생성속도가 어마어마하게 빨라진 지금, 인류는 매일 250경 바이트의 데이터를 만들어내고 있다고 합니다. 이 데이터 안에는 불필요한 자료들과 핵심적인 자료들이 중구난방으로 섞여 있는데요. 만약 이를 분류하고 조사할 방법이 없다면 우리는 아무리 많은 데이터를 갖고 있더라도 현명한 의사결정을 내리지 못한 채 데이터에 파묻힐 것입니다.


빅데이터로 사람들의 행동은 물론, 생각과 의견까지 알 수 있게 된 지금, 다양하고 방대한 규모의 데이터는 미래 경쟁력을 좌우하는 중요한 자원으로 활용될 수 있는데요. 이러한 이유로 현재 세계 각국은 빅데이터를 4차 산업혁명의 동력으로 보고, 이를 지키고 활용하기 위해 노력을 기울이고 있습니다.


 

 

과거에도 우리는 데이터를 활용해왔습니다. 기업들은 고객의 수는 얼마나 되는지, 매출이 얼마나 올랐는지 등의 데이터를 끊임없이 업데이트하고, 이를 기반으로 의사 결정을 해왔죠. 하지만 현재의 빅데이터는 반드시 더 많은 정보를 구하기 위한 것만은 아닙니다. 잘못하면 수많은 정보에 파묻혀 갈피를 잡지 못할 수도 있기 때문입니다. 어떤 정보가 조직에게 중요한지 알아낸 후, 그 정보를 완벽하게 분석하여 비용과 성장에 관련된 진정한 요인들을 찾아내는 것이 빅데이터의 핵심 쟁점입니다.


최근 주목 받는 ‘데이터 과학(Data Science)’은 과거에 데이터를 바라보던 방식과 조금 다른 개념입니다. 이전에는 데이터를 참고 지표로만 삼았다면, 지금은 구체적인 경영 방향을 제시해주는 존재로 활용하고 있습니다. 데이터 활용 방식이 과거가 아닌 미래에 초점을 맞추어 진화한 것입니다.


그렇기 때문에 데이터 과학은 엑셀 파일 속 단순한 숫자 나열로 생각하면 안 됩니다. 데이터를 다각도로 해석해 미래의 문제점을 초기에 찾아 어떤 의사결정을 할지 파악하는 것이죠. 또한, 머신러닝(Machine Learning)에 기반을 두어 반복 가능한 알고리즘을 통해 예측하는 방식을 취합니다. 기존의 단순한 데이터 처리 방법과는 다른 차원이라 볼 수 있습니다.

 
 
  

새로운 가치를 만드는 데이터 과학자

 

 

데이터 과학자는 데이터의 수집, 가공, 분석 등을 통해 통찰력을 추출하여 더 나은 의사결정을 하도록 도와주는 전문가입니다. 그렇기 때문에 데이터 엔지니어의 영역과 데이터 분석가의 영역을 모두 필요로 합니다. 기존에도 데이터 관리자, 데이터 분석자 등 데이터를 다루는 직종은 있었습니다. 하지만 데이터 과학자는 단순히 데이터를 분석하고 추론하는 것이 아닌, 철저한 분석을 통한 객관적인 결과를 활용해 기업에게 비전을 제시합니다. 동시에 기업은 데이터 과학자의 알고리즘으로 비용과 제조과정을 통제할 수 있죠. 이러한 이유로 많은 기업들이 수많은 데이터 속에서 유용한 가치를 찾길 원하고 있으며, 이에 따라 데이터 과학자에 대한 수요도 점차 늘고 있습니다.

  

 

 

IBM은 2020년까지 미국 내 모든 데이터 전문가 채용 건수가 272만건으로 2015년 대비 37만건이 늘어날 것으로 예상했습니다. 한국정보화진흥원(NIA)에 따르면 2019년 국내에서도 역시 빅데이터 전문인력 수요는 현재 인력(9321명)대비 69.2% 늘어난 1만 577명이 필요할 것으로 조사했습니다. 빅데이터 활용과 기술이 고도화되면서 데이터과학자와 엔지니어 수요는 앞으로 크게 증가할 전망입니다. 

 

 

  

데이터 과학자가 말하는 '데이터 과학자'

 

 

# 우버의 데이터 과학자 팀 매니저, 앤서니 로즈

 

 

 

앤서니 로즈(Anthony Rose)는 스마트폰 기반 교통서비스 회사 우버(Uber)의 데이터 과학자 팀 매니저입니다. 이 팀은 공항이나 대형행사장, 교외 등 택시를 잡기 어려운 장소에서 택시를 잡기 쉽게 만드는 방법을 연구하고 있는데요. 엔지니어 팀 또는 제품 팀과 데이터를 공유하며 통계분석부터 데이터 가시화, 실험, 머신러닝, 모델링 등 다양한 업무를 수행합니다. 앤서니 로즈는 데이터 과학에 대해 “우리는 방대한 양의 데이터를 보유하고 있다. 시간이 충분하다면 이것을 통해 흥미로운 분석 결과를 많이 만들어 낼 수 있다”고 말합니다.


입자 물리학 박사 학위를 받은 앤서니 로즈는 박사 과정에서 복잡하고 다양한, 막대한 양의 데이터를 연구했다고 합니다. 그런 그는 입자 물리학의 데이터 작업과 택시를 잡기 위해 필요한 데이터 작업이 큰 차이가 없다고 말합니다. 앤서니 로즈는 “박사 과정에서 연구했던 것과 현재 업계에서 하고 있는 일이 잘 부합한다. 신호가 숨어있는 큰 데이터 덩어리, 실험적인 설계, 많은 통계 작업과 코딩 등 공통점이 매우 많기 때문이다”라고 말했습니다.

 

  

# 마이크로소프트 데이터 과학자, 대니얼 딘

 

 

 

대니얼 딘(Danielle Dean)은 현재 마이크로소프트(Microsoft) 인공지능 및 연구 그룹을 이끌고 있습니다. 이 팀은 물리학, 해양학, 컴퓨터과학, 통계학, 신경 과학 등 다양한 분야의 데이터 과학자와 공학자로 구성되었으며 예측 분석 및 머신러닝 솔루션을 구축하는 일을 하고 있습니다. 대니얼 딘은 자신의 일에 대해 “데이터 과학을 통해 고객 맞춤형 분석 솔루션을 구축할 수 있고 제품의 문제점들을 개선해나갈 수 있다”며 “나에겐 매우 즐거운 일이다”라고 말합니다.


대니얼은 심리학을 공부하면서 데이터 과학 분야에 관심을 갖게 되었다고 하는데요. 그는 “계량 심리학 박사 과정을 밟으며 수학과 통계를 활용해 개별 행동을 대규모로 연구할 수 있다는 점에 매료됐다”라고 밝혔습니다. 대니얼 딘은 당시의 연구를 통해 데이터 측정, 분석, 가시화에 대해 고민하는 것과 이를 가능케 하는 프로그래밍을 배울 수 있었다고 합니다.

 

 

# 하트랩 이사, 리사 버튼


 

 

하트랩(HeartLab)의 이사 리사 버튼(Lisa Burton)은 SNS 데이터를 이용해 브랜드의 고객 이해를 돕는 일을 하고 있습니다. 기계공학 박사과정을 밟은 그는 당시 데이터 주도적 수학 모델링을 주로 연구했다고 하는데요. 리사 버튼은 “졸업할 때쯤 되자 데이터 과학 분야가 뜨기 시작했다. 기업에서 데이터 과학자에게 원하는 것이 알고 보니 내가 좋아하는 연구와 직결돼 있었다”며 일을 시작하게 된 계기를 밝혔습니다.


리사 버튼은 대학원을 졸업하자마자 오스틴(Austin)에 있는 애드테크(adtech) 스타트업에서 최초의 데이터 과학자가 되었습니다. 그는 데이터를 이용해 유료 검색 광고 경매 입찰과정을 최적화함으로써 자동화하고 개선하는 일을 담당했습니다. 그 다음에는 모바일 결제 스타트업으로 이직했다가, 신생기업을 대상으로 한 독자적인 데이터 과학 컨설팅 업체를 창업했습니다. 그곳에서 만난 고객과 의기 투합해 공동 설립한 것이 바로 현재의 하트랩이라고 하는데요.


리사 버튼은 이 모든 경험들을 현직에 활용하고 있습니다. 그리고 그는 “우리는 훌륭한 창업주와 기업을 만난다. 그리고 그들에게 데이터 과학을 알림으로써 좀더 일을 재밌고 효율적으로 할 수 있게끔 만드는 게 중요하다는 것을 알았다. 이 교훈은 내가 해온 모든 일에 적용되고 있다”고 말했습니다.

 

 

데이터의 중요성이 나날이 커지고 있는 요즘, 그 데이터를 가지고 요리하는 데이터 과학자들의 필요성이 높아지고 있습니다. 그들이 데이터를 어떻게 해석하는지에 따라 우리의 생활도 기술의 발전도 색다른 방향으로 흘러 갈지도 모릅니다. 그들의 통찰력이 우리의 삶에 어떤 변화를 가져올지 주목해볼 필요가 있습니다.

영하이라이터 정명지

< 공유하기
목록보기
첫 댓글을 남겨보세요


티스토리 툴바