[회고] 신입 iOS 개발자가 되기까지 feat. 카카오 자세히보기

🛠 기타/Data & AI

Pandas 데이터 시각화 카테고리

inu 2020. 7. 14. 23:11

카테고리

# 교통사고 시간대
# 0-2, 3-5, 6-8, 9-11, 12-14, 15-17, 18-20, 21-23시 8개의 구간

time_df = data['발생년월일시'] % 100
bins = [-1, 2, 5, 8, 11,14,17, 20, 24]
labels = ['0-2', '3-5', '6-8', '9-11', '12-14', '15-17', '18-20','21-23']

time_cats = pd.cut(list(time_df.values), bins, labels = labels)
rs = time_cats.value_counts()
==결과==
0-2      421
3-5      444
6-8      466
9-11     526
12-14    472
15-17    550
18-20    692
21-23    494
dtype: int64
plt.pie(rs, labels=labels, autopct='%1.1f%%')
plt.show()

  • 분류대상, 분류 기준(bins), 분류 기준별 이름(labels)를 결정 후 pandas의 cut함수를 활용해 카테고리를 분류한다.
  • 분류 기준은 인덱스 대비 초과~이하를 각각 범위로 가지게된다.
  • [-1, 2, 5, 8, 11,14,17, 20, 24]이면 labels에 나와있듯, '0-2', '3-5', '6-8', '9-11', '12-14', '15-17', '18-20','21-23'의 범위를 기준으로 각각 가지게 되는 것이다.
  • plt 기능을 활용해 간단하게 시각화가 가능하다.
  • autopct는 pie위에 표기될 글자의 형태를 정의해준다.