반응형
DataFrameGroupBy object
import pandas as pd
import numpy as np
# csv 파일에서 df정보 불러오기
df = pd.read_csv('data/data_iris.csv', header='infer',encoding = 'latin1')
df.groupby('Species')
<pandas.core.groupby.generic.DataFrameGroupBy object at 0x000001943EADCBC8>
- groupby(구분기준이 될 칼럼)을 통해 데이터 프레임을 그룹별로 나눌 수있다.
- 해당 함수의 결과는 위와 같이 DataFrameGroupBy object가 된다.
DataFrameGroupBy object 활용
print(df.groupby('Species').mean())
print(df.groupby('Species').std())
==결과==
Sepal.Length Sepal.Width Petal.Length Petal.Width
Species
setosa 5.006 3.428 1.462 0.246
versicolor 5.936 2.770 4.260 1.326
virginica 6.588 2.974 5.552 2.026
Sepal.Length Sepal.Width Petal.Length Petal.Width
Species
setosa 0.352490 0.379064 0.173664 0.105386
versicolor 0.516171 0.313798 0.469911 0.197753
virginica 0.635880 0.322497 0.551895 0.274650
- 해당 오브젝트에 mean이나 std같은 통계함수를 활용하여 값을 확인할 수 있다.
- 각 그룹에 해당하는 행들 모두의 통계값을 구할 수 있는 것이다.
반응형
'🛠 기타 > Data & AI' 카테고리의 다른 글
파이썬 정규표현식 - 기초활용 (0) | 2020.07.14 |
---|---|
Pandas 데이터 시각화 (0) | 2020.07.14 |
Pandas 데이터프레임 결측치(null값) 제어 (0) | 2020.07.14 |
Pandas 데이터프레임 활용 통계값 계산 (0) | 2020.07.14 |
[파이썬] Pandas 데이터프레임 전치행렬 만들기 (0) | 2020.07.13 |