로그 스케일로 분포 그리기

🛠 기타/Data & AI

로그 스케일로 분포 그리기

inu 2020. 8. 7. 12:14

로그 스케일

데이터 작업을 하다보면 그 변화가 미세하거나, 다른 변화에 비해 수치가 작아 탐지하기 어려운 경우가 있다.

import numpy as np
import pandas as pd
import os
import mglearn
import matplotlib.pyplot as plt
%matplotlib inline

ram_prices = pd.read_csv(os.path.join(mglearn.datasets.DATA_PATH, "ram_price.csv"))

# 그냥 그린 램 가격 동향
plt.plot(ram_prices.date, ram_prices.price)
plt.xlabel("year")             # 년
plt.ylabel("price ($/Mbyte)")  # 가격

램 가격 동향 데이터가 대표적인 예이다.
1960년부터의 변화를 관찰하기 어렵다.

import numpy as np
import pandas as pd
import os
import mglearn
import matplotlib.pyplot as plt
%matplotlib inline

ram_prices = pd.read_csv(os.path.join(mglearn.datasets.DATA_PATH, "ram_price.csv"))

# 로그 스케일로 그린 램 가격 동향
plt.semilogy(ram_prices.date, ram_prices.price)
plt.xlabel("year")             # 년
plt.ylabel("price ($/Mbyte)")  # 가격

plt.semilogy 함수를 사용하면 로그스케일로 그래프를 그릴 수 있다.
훨씬 변화를 파악하기 용이하다.
물론 데이터 자체를 로그화할수도 있겠지만, 시각화만을 위한 로그화라면 plt.semilogy 방법이 더 용이하다.

'🛠 기타 > Data & AI' 카테고리의 다른 글

Pandas 데이터프레임 apply, replace (0)	2020.08.09
과적합방지 - Drop out, 배치정규화 (0)	2020.08.07
TensorFlow 레이어 (0)	2020.08.07
문자열 형태소 제거하기 (0)	2020.08.06
문자열 특수문자 제거 (0)	2020.08.06

현재글로그 스케일로 분포 그리기

이누의 개발성장기

로그 스케일로 분포 그리기

'🛠 기타 > Data & AI' 카테고리의 다른 글

'🛠 기타/Data & AI'의 다른글

티스토리툴바

로그 스케일로 분포 그리기

'🛠 기타 > Data & AI' 카테고리의 다른 글

'🛠 기타/Data & AI'의 다른글

관련글

티스토리툴바