[회고] 신입 iOS 개발자가 되기까지 feat. 카카오 자세히보기

🛠 기타/Data & AI

Pandas 데이터프레임 정렬

inu 2020. 7. 15. 10:17
반응형

sort_values

  • sort_values(by='정렬기준컬럼', ascending=True or False) 를 사용하여 데이터프레임을 정렬할 수 있다.
  • by 옵션에 정렬기준이 될 컬럼을 넣고, ascending에 내림차순 여부를 체크하면 된다.
my_labels = list(df.City)
my_GenderRatio = list(df.GenderRatio)
df0 = pd.DataFrame( {'GenderRatio':my_GenderRatio}, index = my_labels)
df0
==결과==
GenderRatio
옹진군          1.29
화천군          1.27
고성군          1.15
괴산군          1.03
신안군          1.11
울릉군          1.15
  • 위와 같은 데이터가 있다고 하자. (위 데이터는 전국의 인구 통계 자료에서 뽑아낸 자료로, genderRation 즉 남녀비율을 나타낸 수치이다. 1이 넘어갈 경우 남성의 비율이 더 많은 것이고, 1보다 작을 경우 여성의 비율이 더 많은 것이다.)
df0.plot.bar(color='orange', alpha=0.7)
plt.show()

  • 정렬되지 않은 데이터는 위와 같이 출력된다.
df1 = df0.sort_values(by='GenderRatio', ascending=False)
df1.plot.bar(color='green', alpha=0.8)
plt.show()

  • 하지만 sort_values를 사용하면 위와 같이 정렬됨을 알 수 있다.
반응형