Books

앵버박사 2017. 5. 14. 02:40




서론

  사실 데이터 분석이 뭔지 감도 없었고, 당장 필요한 공부라고 확신한 것도 아니었다. 머신러닝과 같은 인공지능 기술을 공부할 때 사전지식으로써 도움이 될 것이라는 막연한 생각으로 책을 보았다. 하지만 보길 참 잘했다는 생각이 든다. 작지만 내게 꼭 필요한 성찰을 할 수 있었는데, 체계적이며 철학적으로 세상을 바라보는 감각 그리고 인간의 생각의 흐름을 포함한 여러 자연현상들을 수학으로 모델링할 수 있다는 것을 조금더 체감하게 됐다는 것 이다. 책을 보면 주관적 확률, 멘탈 모델, 휴리스틱 등 인간의 생각과 사상에 기초한 여러 데이터 분석 기법이 소개된다. 데이터 분석은 참으로 철학적이다.


난이도

  책을 보기전에 Head First Statistics 과 뭘 먼저 봐야하는지 고민한 적이 있었다. 둘다 보고 난 후의 결론은 Head First Data Analysis 를 먼저 보는 것이 좋다는 생각이다. 이 책은 데이터 분석 전반에 대해 간단한 입문수준으로 다루고있다. 데이터 분석은 통계를 많이 활용하는데 이 통계적 기법들을 맛보기로 다루기 때문에 좀 더 깊은 내용은 Head First Statistics 를 보면 좋다. 또한 데이터 분석 입문자는 물론 통계를 잘 모르더라도 이 책을 보는데 큰 무리는 없다고 생각한다. 


구성

  헤드퍼스트 답게 회사 사장님들이 출연하셔서 자신들의 경영 이슈에 대해 나에게 데이터 분석을 의뢰하고, 나는 그 분들에게 데이터를 얻어 데이터 분석을 하고 그 결과를 전달하는 이야기 방식으로 진행된다. 현실적인 문제에서 언제 데이터 분석을 어떻게 사용하게 되는지 구체적인 예를 통해 이해하기 수월하다.

  데이터 분석의 절차부터 시작하여 데이터를 쪼개고 비교하는 방법, 보기 쉽도록 시각화 하는 방법, 실험을 통해 문제의 원인을 찾아내는 방법, 최적화/가설검정/베이즈 정리/주과적 확률/휴리스틱 등의 데이터 분석 기법, 회귀를 통해 결과를 예측하는 방법, 적절하게 오차를 활용하는 방법, RDBMS/Excel/R 등의 도구를 활용하는 방법 등을 배운다.


결론

  데이터 분석가를 꿈꾸는 사람, 머신러닝을 공부하고 싶은 사람, 수학과 친해지고 싶은 사람, 모두에게 일독을 권한다. 매우 훌륭한 책이다.


별점 ★