똑소리 나는 DB이야기/- 디비랑 친해져요

디비디비 2013. 3. 29. 11:16

전희원의 R 이야기

 

개발자 혹은 데이터베이스 관리자에서 데이터 분석가로...

 

<뷰온꾸욱~>

 

제목은 상당히 거창하다. 하지만 위 주제는 내가 최근에 가장 많이 받는 질문중에 하나이다. 질문하는 질문자의 경우 개발 업무를 하거나 데이터베이스 관리자로 일하는 분들이 많았으며 데이터와 관련된 일을 하다보니 자연스럽게 데이터 분석에 대한 관심이 시작된 분들이고 데이터 분석가로의 경력 변신을 꾀하시는 분들이었다.

 

이분들의 공통점은 프로그래밍에 두려움이 없다는 것과 실제 업무에서 데이터를 만져볼 기회가 많다는 것이다. 하지만 많은 데이터에 비해 자신이 어떻게 데이터에서 가치를 도출할지 그 방법을 모른다는 것과 그 때문에 분석에 관심을 가지는 것이다.

 

 

 

 

일단 이분들이 데이터 분석가가 되기 위해서 단순히 특정 학위 과정을 수강하기 위해 현업을 포기하는건 정말 좋지 않은 선택이라 말씀드리고 싶다. 데이터 분석 업무는 특정 학위 과정을 수강했다고 가능한 직무가 절대 아니다. 그렇다고 하더라도 학위 과정을 무시하는 건 절대 아니다. 학위 과정을 진행하기 위해 현업을 포기하는걸 경계하는 것일 뿐이다. 결국 데이터 분석도 현실 문제를 해결 할 수 있을 때 가장 큰 가치를 발휘하며 그 경험은 어느 책이나 학위과정에서도 얻을 수 없는 소중한 경험이기 때문이다. 따라서 현업에서 분석 업무를 적용해 보면서 그 업무에 대한 능력을 키울 기회를 최대한 많이 가질 것을 추천하는 바이다.

 

 

물론 분석을 위해서는 학위 과정에 준하는 지식이 필요한게 사실이다.

그렇다면 업무를 하면서 관련 지식을 얻을 수 있는 방법은 어떤 것이 있을까?

 

 

일단 국내 유일의 직장인을 위한 통계학 학부 과정인 방송대 정보 통계학과를 통한 학습을 본인을 가장 많이 추천 드린다. 직장을 다니면서 통계학 및 분석에 대한 체계적인 기초를 배울 수 있는 거의 유일한 방법이다. 필자도 이 과정을 통해서 정말 탄탄한 기반 지식을 배울 수 있었으며 그 기회가 있었음에 매우 감사하고 있다.

 

 이 이외에 외국에서는 오픈된 데이터 분석 과정이 많이 있다. 예를 들어 https://www.coursera.org/ 에 가보면 Data Analysis에 대한 다양한 오픈 강의가 있으며 심지어 Machine Learning에 대한 강의도 찾아볼 수 있다. 물론 대부분 R을 기반으로 강의가 진행된다. 틈틈이 짧은 강의를 통해 학습하고 레포트를 수행해 보면서 분석의 감에 대해서 익히는 것도 좋은 방법이다. 하지만 몇주 되는 강의를 통해 모든 분석 방법을 아우를 수는 없기 때문에 한계도 분명 존재한다.

R에 대한 이야기를 좀 하자!

 

 

 

 

 

R은 사실 개발자에게 친숙할 수밖에 없는 언어이다. 개발자이여서 알 수 있는 여러 분석 환경에 대한 지식들이 R을 사용하면서 상당히 많은 부분 활용될 수 있기 때문이다. 예를 들어 한글 환경에서 R을 사용하기 위해서 문자 인코딩에 대한 지식이 필요할 때가 분명히 존재하는데 이런 인코딩에 대한 내용과 친숙한 사람은 개발자이기 때문이다. 이는 단편적인 예일 뿐이지만 R을 사용하다 보면 R을 사용할 수 있을까 말까를 결정짓는 환경적인 문제를 해결 할 수 있을 때와 없을 때 상황은 극명하게 갈릴 수 있다.

 

상용 분석 툴의 경우 이런 문제가 해결되었거나 외부에 표출되지 않으나 유연하게 위와 같은 문제를 해결할 수 있는 환경을 갖춘 R과 비교해 보면 편의를 위해 폐쇠적인 성격을 유지하는게 아닐까 하는 생각도 해본다. 물론 필자가 아는 모든 R 사용 환경적인 이슈는 해결 가능했다. 심지어 변방의 윈도우인 한글 윈도우에서도 말이다. 이런 문제를 해결 할 수 있는데 좀더 유리한 직무가 바로 개발자들인 것이다.

 

 

필자가 왜 이런 이야기를 하느냐 하면 개발자나 데이터베이스 관리자가 얼마나 데이터 분석 업무를 수행하는데 유리한 위치에 있는지 설명하기 위해서이다. 데이터도 직접 다루고 관리하면서 이를 기반으로 서비스를 개발하면서 동시에 해당 데이터 도메인의 이미 전문가이고 요즘 뜨고 있는 오픈소스 분석 언어인 R에 가장 유리하게 접근할 수 있는 직무분야이기 때문이다.

 

 

따라서 개발자나 데이터베이스 관리 업무에서 데이터 분석으로 영역을 넓히고자 하는 분들에게 본인이 가진 경력이나 경험 업무가 얼마나 데이터 분석 업무를 하기 위해 도움이 되는지 알았으면 하는 바이다. 단지 분석을 직접 해볼 업무적인 도전정신과 어느정도 분석을 위해 필요한 학부 수준의 통계나 데이터 마이닝에 대한 지식이 부족할 뿐이었던 것이다.

 

 

 

마지막으로 이런 공부를 위해 한가지 방법을 제안하자면...

 

 “본인의 업무와에서 자그마한 업무 하나하나를 분석 업무와 연결시키는 시도를 해보라”는 것이다. .

 

이런 작은 시도가 분석에 필요한 지식을 배우는데 큰 동기가 될 것이다.

 

<R분석 최고의 전문가, 전희원이 말하는 R이야기 원문보기>

 

<작성 : 넥스알 데이터 사이언티스트 전희원>