로그 스케일
- 데이터 작업을 하다보면 그 변화가 미세하거나, 다른 변화에 비해 수치가 작아 탐지하기 어려운 경우가 있다.
import numpy as np
import pandas as pd
import os
import mglearn
import matplotlib.pyplot as plt
%matplotlib inline
ram_prices = pd.read_csv(os.path.join(mglearn.datasets.DATA_PATH, "ram_price.csv"))
# 그냥 그린 램 가격 동향
plt.plot(ram_prices.date, ram_prices.price)
plt.xlabel("year") # 년
plt.ylabel("price ($/Mbyte)") # 가격
- 램 가격 동향 데이터가 대표적인 예이다.
- 1960년부터의 변화를 관찰하기 어렵다.
import numpy as np
import pandas as pd
import os
import mglearn
import matplotlib.pyplot as plt
%matplotlib inline
ram_prices = pd.read_csv(os.path.join(mglearn.datasets.DATA_PATH, "ram_price.csv"))
# 로그 스케일로 그린 램 가격 동향
plt.semilogy(ram_prices.date, ram_prices.price)
plt.xlabel("year") # 년
plt.ylabel("price ($/Mbyte)") # 가격
- plt.semilogy 함수를 사용하면 로그스케일로 그래프를 그릴 수 있다.
- 훨씬 변화를 파악하기 용이하다.
- 물론 데이터 자체를 로그화할수도 있겠지만, 시각화만을 위한 로그화라면 plt.semilogy 방법이 더 용이하다.
'🛠 기타 > Data & AI' 카테고리의 다른 글
Pandas 데이터프레임 apply, replace (0) | 2020.08.09 |
---|---|
과적합방지 - Drop out, 배치정규화 (0) | 2020.08.07 |
TensorFlow 레이어 (0) | 2020.08.07 |
문자열 형태소 제거하기 (0) | 2020.08.06 |
문자열 특수문자 제거 (0) | 2020.08.06 |