카테고리
# 교통사고 시간대
# 0-2, 3-5, 6-8, 9-11, 12-14, 15-17, 18-20, 21-23시 8개의 구간
time_df = data['발생년월일시'] % 100
bins = [-1, 2, 5, 8, 11,14,17, 20, 24]
labels = ['0-2', '3-5', '6-8', '9-11', '12-14', '15-17', '18-20','21-23']
time_cats = pd.cut(list(time_df.values), bins, labels = labels)
rs = time_cats.value_counts()
==결과==
0-2 421
3-5 444
6-8 466
9-11 526
12-14 472
15-17 550
18-20 692
21-23 494
dtype: int64
plt.pie(rs, labels=labels, autopct='%1.1f%%')
plt.show()
- 분류대상, 분류 기준(bins), 분류 기준별 이름(labels)를 결정 후 pandas의 cut함수를 활용해 카테고리를 분류한다.
- 분류 기준은 인덱스 대비 초과~이하를 각각 범위로 가지게된다.
- [-1, 2, 5, 8, 11,14,17, 20, 24]이면 labels에 나와있듯, '0-2', '3-5', '6-8', '9-11', '12-14', '15-17', '18-20','21-23'의 범위를 기준으로 각각 가지게 되는 것이다.
- plt 기능을 활용해 간단하게 시각화가 가능하다.
- autopct는 pie위에 표기될 글자의 형태를 정의해준다.
'🛠 기타 > Data & AI' 카테고리의 다른 글
단층 퍼셉트론 - 회귀분석 구현 (0) | 2020.07.15 |
---|---|
Pandas 데이터프레임 정렬 (0) | 2020.07.15 |
Pandas 데이터 시각화 한글깨짐 (0) | 2020.07.14 |
파이썬 정규표현식 - 그룹 만들기 (0) | 2020.07.14 |
파이썬 정규표현식 - 기초활용 (0) | 2020.07.14 |