※ 이 포스팅은 저자 'Kirthi Raman'의 도서 <Mastering Python Data Visualization> 을 공부하며 정리한 글입니다.
Chapter 03. Getting Started with the Python IDE (파이썬 IDE로 시작하기)
이 책에 따르면, 이미 파이썬 2.7 버전대에서 작성된 여러 라이브러리들이 3.x 버전대와 호환이 잘 되지 않는다고 하니 2.7 버전대를 사용하기로 합니다.
또한, 이 책으로 공부를 하시는 분들이라면 아나콘다(Anaconda)를 설치하시는 것이 편리할 것입니다.
나중에 설치 과정을 정리해보겠습니다.
파이썬의 강점
방대하고, 유용한 라이브러리들을 쉽게 설치하여 적용할 수 있다는 것이 파이썬의 가장 큰 강점이다.
GUI를 만들 수 있고, DB와 연결할 수 있으며, 랜덤 수를 생성하여 시뮬레이션을 시행할 수 있고, 수학적 연산에서의 높은 정밀도를 가진다.
2D, 3D 그래픽 시각화, 머신 러닝과 통계적 알고리즘 등을 수행할 수 있는 고성능의 패키지들도 배포되고 있다.
아나콘다 (Anaconda)
Continuum Analytics가 개발한 아나콘다는 데이터 분석과 시각화를 위해 가장 많이 사용되는 IDE 중 하나로 잘 알려져 있다.
* IDE란, 통합개발환경(Integrated Development Environment)으로서 편리하게 어플리케이션을 개발할 수 있도록 여러 기능들을 모아둔 것입니다.
추천하는 파이썬 시각화 패키지들
#. matplotlib
- 가장 많이 사용되는 파이썬 시각화 라이브러리
- NumPy, SciPy와 연결되어 있음
- 과학 분야 파이썬 커뮤니티에서 주로 사용되고 있다
#. Plotly
- 시각화와 분석을 함께 할 수 있도록 브라우저에서 작동하는 플랫폼
- 반응적으로 그래프 작업을 할 수 있고, 스타일을 입힐 수 있다.
- matplotlib 기반으로 작성된 시각화 코드를 Plotly 버전으로 쉽게 고칠 수 있다
#. Veusz
- 파이썬과 PyQt로 만어졌으며 GPL-scientific 시각화 라이브러리
#. Mayavi
- 3차원 시각화 패키지
#. NetworkX
- 복잡한 네트워크를 생성하며 가공하고 그 구조와 역학, 기능 연구에 사용
#. pygooglechart
- 구글 시각화 API와 연동할 수 있게 돕는 라이브러리
반응형(interactive) 시각화 패키지들
#. Bokeh
- 아웃 포커스된 이미지의 일부분 혹은 블러링을 묘사하는 일본어에서 유래
- 예시 : http://nbviewer.jupyter.org/gist/fonnesbeck/ad091b81bffda28fd657
#. VisPy
- OpenGL 활용, 고성능 반응형 시각화 라이브러리
- 예시 : http://vispy.org/gallery.html
'데이터 과학 > Mastering Python Data Visualization' 카테고리의 다른 글
Chapter 04-2. Interactive Plotting (반응형 시각화) (0) | 2017.06.18 |
---|---|
Chapter 04-1. Numerical Computing (수치 연산) (0) | 2017.06.16 |
Chapter 02. Data Analysis and Visualization (데이터 분석과 시각화) (0) | 2017.06.12 |
Chapter 01. A Conceptual Framework for Data Visualization (데이터 시각화의 개념) (0) | 2017.06.11 |
Chapter 00. Mastering Python Data Visualization 공부 + 정리 시작 (0) | 2017.06.11 |