※ 이 포스팅은 저자 'Kirthi Raman'의 도서 <Mastering Python Data Visualization> 을 공부하며 정리한 글입니다. 



Chapter 04-2. Interactive Plotting (반응형 시각화)


( 이전 포스팅에 이어서 .. )

이 책에서는 주로 matplotlib 이라는 파이썬 패키지로 시각화를 진행하고 있습니다.

워드 클라우드(Word Cloud) 예제

주어진 문장에서 자주 나타나는 단어에 대한 중요성을 보여주는 시각화이다.
다른 말로, 태그 클라우드(Tag Cloud)나 단어 비중의 시각화라 불린다.

워드 클라우드는 소셜 미디어와 마케팅 분야에 유용하게 사용되고 있다.
- 소비자들의 브랜드에 대한 인식 분석
- 어떤 단어들과 테마가 Target 시장에서 경쟁력을 가지는지 확인


#. wordcloud 라이브러리 설치


Mac 기준으로 작성된 책이여서, Windows OS 환경에서의 설치는 다음과 같이 제가 했던 방식으로 진행하시면 될 것 같습니다.


(1). 아나콘다 프롬포트 실행



(2). conda install -c conda-forge wordcloud 입력

중간에 Proceed ([y]/n)? 나오면 y 입력




#. 워드 클라우드 생성


원본 데이터(wordcloudInput_fromFeeds.txt)와 폰트 파일(RemachineScript.ttf) 파일은 책의 예제 다운로드를 통해서 얻으실 수 있습니다.


from wordcloud import WordCloud, STOPWORDS

import matplotlib.pyplot as plt

from os import path


d = path.dirname("__file__")

text = open(path.join(d, 'wordcloudInput_fromFeeds.txt')).read()


wordcloud = WordCloud(

        font_path='remachine_script/RemachineScript.ttf',

        stopwords=STOPWORDS,

        background_color='#222222',

        width=1000,

        height=800).generate(text)


plt.figure(figsize=(13,13))

plt.imshow(wordcloud)

plt.axis('off')

plt.show()



#. 텍스트 감성 분석

고전적인 방법은 아래의 수식을 활용하는 것이다. 또는 TextBlob 패키지를 이용하는 방법이 있다. 추후에 더 자세하게 다루도록 한다.




주식 차트 시각화 예제

blockspring 라이브러리를 통해 반응형 시각화가 가능하다.

자동으로 생성된 결과물은 HTML 코드와 자바스크립트(D3.js) 포맷으로 되어 있다.


* 위에서 실행한 아나콘다 프롬포트에서 " pip install blockspring " 명령을 입력하시면 블락스프링 패키지를 이용할 수 있습니다.


import blockspring 

import json  


print blockspring.runParsed("stock-price-comparison", 

   { "tickers": "FB, LNKD, TWTR", 

   "start_date": "2014-01-01", "end_date": "2015-01-01" }).params




스포츠 데이터 시각화 예제

이 외에도 다음과 같은 결과물을 파이썬을 통해 얻을 수 있다.





이번 장에서는 간단한 동작 예제만 살폈으며, 추후 좀 더 많은 예제들을 살펴보게 될 것이다.



+ Recent posts