이숭간 공부기록

데이터분석_R로시작할까? 파이썬으로 시작할까? 본문

끄적끄적

데이터분석_R로시작할까? 파이썬으로 시작할까?

이숭간 2020. 8. 31. 23:49
728x90

데이터분석을 시작할때 먼저 마주하는 문제가있다. 어떤 툴을 사용해서 공부해야하는가? 

 

대표적으로 2가지 툴이있다. R과 Python

 

  • R - 통계학적요소가 잘 스며들어있는 툴
  • Python - 이해하기쉽고 유연한 문법, 좋은 접근성

그렇다면 언제 R을 사용하는가?

- 연구목적의 업무에 최적화, but웬만한 종류의 데이터분석도 가능

- 방대한양의 패키지와 즉시사용가능한 테스트 set 제공 -- 최대강점

- 활발한 스택오버플로우^^ 물을곳이 많다는점

- R로 개발할시 RStudio IDE를 사용하는것이 좋다. R의 통합개발환경으로 프로그램소스 편집, 실행, 출력을 하나의 프로그램으로 수행가능

- 단, 속도가 느리고 ( 속도개선을위한 패키지들이 많이 개발되긴함) 파이썬에비해 배우기 어렵다.

 

그렇다면 언제 Python을 사용하는가?

- 데이터분석 결과를 다른 웹 애플리케이션에 접목하거나, 통계적인 코드를 디비에 포함시킬때

- 필요한 패키지, 라이브러리를 불러서 조합, 분석목적에 맞는 작업 수행

- 직관적인 문법 ( 초보자도 쉽게 배울수있다. )

- 다양한 패키지 ( NumPy/SchiPy, pandas) , 그래픽을만들고싶다면 matplotlib, 머신러닝은 scikit-learn

 

결론?

- 무엇을 풀고자하는가

- 언어를 배우기위한 시간과, 비용이 있는가

- 엑셀이나 spss같은 도구가 당신의 데이터분석에있어서 더 적합하진 않은가?

 

 

 

 

 

#출처 - 데이터분석, R로 시작할까 파이썬으로 시작할까?