[회고] 신입 iOS 개발자가 되기까지 feat. 카카오 자세히보기

🛠 기타/Data & AI

Pandas 데이터프레임 정렬

inu 2020. 7. 15. 10:17

sort_values

  • sort_values(by='정렬기준컬럼', ascending=True or False) 를 사용하여 데이터프레임을 정렬할 수 있다.
  • by 옵션에 정렬기준이 될 컬럼을 넣고, ascending에 내림차순 여부를 체크하면 된다.
my_labels = list(df.City) my_GenderRatio = list(df.GenderRatio) df0 = pd.DataFrame( {'GenderRatio':my_GenderRatio}, index = my_labels) df0
==결과== GenderRatio 옹진군 1.29 화천군 1.27 고성군 1.15 괴산군 1.03 신안군 1.11 울릉군 1.15
  • 위와 같은 데이터가 있다고 하자. (위 데이터는 전국의 인구 통계 자료에서 뽑아낸 자료로, genderRation 즉 남녀비율을 나타낸 수치이다. 1이 넘어갈 경우 남성의 비율이 더 많은 것이고, 1보다 작을 경우 여성의 비율이 더 많은 것이다.)
df0.plot.bar(color='orange', alpha=0.7) plt.show()

  • 정렬되지 않은 데이터는 위와 같이 출력된다.
df1 = df0.sort_values(by='GenderRatio', ascending=False) df1.plot.bar(color='green', alpha=0.8) plt.show()

  • 하지만 sort_values를 사용하면 위와 같이 정렬됨을 알 수 있다.