[회고] 신입 iOS 개발자가 되기까지 feat. 카카오 자세히보기

🛠 기타/Data & AI

Pandas 데이터프레임 그룹 나누기

inu 2020. 7. 14. 19:37
반응형

DataFrameGroupBy object

import pandas as pd
import numpy as np

# csv 파일에서 df정보 불러오기
df = pd.read_csv('data/data_iris.csv', header='infer',encoding = 'latin1') 
df.groupby('Species')
<pandas.core.groupby.generic.DataFrameGroupBy object at 0x000001943EADCBC8>
  • groupby(구분기준이 될 칼럼)을 통해 데이터 프레임을 그룹별로 나눌 수있다.
  • 해당 함수의 결과는 위와 같이 DataFrameGroupBy object가 된다.

DataFrameGroupBy object 활용

print(df.groupby('Species').mean())
print(df.groupby('Species').std())
==결과==
            Sepal.Length  Sepal.Width  Petal.Length  Petal.Width
Species                                                         
setosa             5.006        3.428         1.462        0.246
versicolor         5.936        2.770         4.260        1.326
virginica          6.588        2.974         5.552        2.026

            Sepal.Length  Sepal.Width  Petal.Length  Petal.Width
Species                                                         
setosa          0.352490     0.379064      0.173664     0.105386
versicolor      0.516171     0.313798      0.469911     0.197753
virginica       0.635880     0.322497      0.551895     0.274650
  • 해당 오브젝트에 mean이나 std같은 통계함수를 활용하여 값을 확인할 수 있다.
  • 각 그룹에 해당하는 행들 모두의 통계값을 구할 수 있는 것이다.
반응형