[회고] 신입 iOS 개발자가 되기까지 feat. 카카오 자세히보기

🛠 기타/Data & AI

로그 스케일로 분포 그리기

inu 2020. 8. 7. 12:14
반응형

로그 스케일

  • 데이터 작업을 하다보면 그 변화가 미세하거나, 다른 변화에 비해 수치가 작아 탐지하기 어려운 경우가 있다.
import numpy as np
import pandas as pd
import os
import mglearn
import matplotlib.pyplot as plt
%matplotlib inline

ram_prices = pd.read_csv(os.path.join(mglearn.datasets.DATA_PATH, "ram_price.csv"))

# 그냥 그린 램 가격 동향
plt.plot(ram_prices.date, ram_prices.price)
plt.xlabel("year")             # 년
plt.ylabel("price ($/Mbyte)")  # 가격

  • 램 가격 동향 데이터가 대표적인 예이다.
  • 1960년부터의 변화를 관찰하기 어렵다.
import numpy as np
import pandas as pd
import os
import mglearn
import matplotlib.pyplot as plt
%matplotlib inline

ram_prices = pd.read_csv(os.path.join(mglearn.datasets.DATA_PATH, "ram_price.csv"))

# 로그 스케일로 그린 램 가격 동향
plt.semilogy(ram_prices.date, ram_prices.price)
plt.xlabel("year")             # 년
plt.ylabel("price ($/Mbyte)")  # 가격

  • plt.semilogy 함수를 사용하면 로그스케일로 그래프를 그릴 수 있다.
  • 훨씬 변화를 파악하기 용이하다.
  • 물론 데이터 자체를 로그화할수도 있겠지만, 시각화만을 위한 로그화라면 plt.semilogy 방법이 더 용이하다.
반응형

'🛠 기타 > Data & AI' 카테고리의 다른 글

Pandas 데이터프레임 apply, replace  (0) 2020.08.09
과적합방지 - Drop out, 배치정규화  (0) 2020.08.07
TensorFlow 레이어  (0) 2020.08.07
문자열 형태소 제거하기  (0) 2020.08.06
문자열 특수문자 제거  (0) 2020.08.06