[회고] 신입 iOS 개발자가 되기까지 feat. 카카오 자세히보기

🛠 기타/Data & AI 99

Pandas 데이터프레임 그룹 나누기

DataFrameGroupBy object import pandas as pd import numpy as np # csv 파일에서 df정보 불러오기 df = pd.read_csv('data/data_iris.csv', header='infer',encoding = 'latin1') df.groupby('Species') groupby(구분기준이 될 칼럼)을 통해 데이터 프레임을 그룹별로 나눌 수있다. 해당 함수의 결과는 위와 같이 DataFrameGroupBy object가 된다. DataFrameGroupBy object 활용 print(df.groupby('Species').mean()) print(df.groupby('Species').std()) ==결과== Sepal.Length Sepal.W..

Pandas 데이터프레임 결측치(null값) 제어

결측치 생성 import pandas as pd import numpy as np df = pd.read_csv('data/data_iris.csv', header='infer',encoding = 'latin1') # csv 파일에서 df정보 불러오기 df.count(axis=0) ==결과== Sepal.Length 150 Sepal.Width 150 Petal.Length 150 Petal.Width 150 Species 150 dtype: int64 # 결측치 생성 df.iloc[10,0] = np.nan df.iloc[32,2] = np.nan df.iloc[17,2] = np.nan df.iloc[129,2] = np.nan df.count(axis=0) ==결과== Sepal.Length 14..

Pandas 데이터프레임 활용 통계값 계산

통계값 한번에 계산(describe) import pandas as pd import numpy as np df = pd.read_csv('data_iris.csv', header='infer',encoding = 'latin1') # csv 파일에서 df정보 불러오기 df.describe() ==결과== Sepal.Length Sepal.Width Petal.Length Petal.Width count 150.000000 150.000000 150.000000 150.000000 mean 5.843333 3.057333 3.758000 1.199333 std 0.828066 0.435866 1.765298 0.762238 min 4.300000 2.000000 1.000000 0.100000 25% 5..

단층 퍼셉트론- 회귀분석 이론

단층 퍼셉트론(SLP, Single Layer Perceptron)의 정의 단층 퍼셉트론은 일련의 퍼셉트론을 한 줄로 배치하고, 입력 벡터 하나로부터 출력 벡터 하나를 얻을 수 있는 구조를 가지고 있다. 입력 벡터만을 공유할 뿐이고, 각자의 파라미터에 따라 독립적으로 수행된다. 비록 간단한 구조지만, 여러 고급 신경망 구조의 기본 요소라고 할 수 있다. 퍼셉트론 신경망 구조 x1, x2, ... 를 입력계층이라고 한다. y1, y2, ... 를 출력계층이라고 한다. 단층 퍼셉트론은 단순히 입력계층과 출력계층으로 구성되어 있다. 각 '퍼셉트론'이 입력계층에서 얻은 입력값에 가중치를 곱해 수식을 계산하고 값을 출력한다. 파라미터 : 학습 과정 중 변경되어 가면서 퍼셉트론의 동작 특성을 결정하는 값 (가중치,..

[파이썬] Pandas 기초 - DataFrame 생성 (컬럼 수정,추가, 삭제)

DataFrame? Pandas의 행렬과도 유사한 2D 데이터 객체, 하지만 개개 열의 자료형이 서로 일치하지 않을수도 있다. CSV 파일, 엑셀 파일, SQL 테이블 등의 형식의 데이터를 담기에 적합하여 해당 데이터를 불러올 수 있다. columns (열)과 index (행)의 속성이 있다. 각 열은 Series 데이터타입이다. 즉, Series 타입을 모아 하나의 객체로 만든 것이라고 할 수 있다. 데이터 프레임 생성 : csv import pandas as pd import numpy as np import os os.chdir(r"..\data") df = pd.read_csv('data_studentlist_en.csv', header='infer',encoding = 'latin1') prin..

[파이썬] Pandas 기초 - Series

파이썬에서 사용하는 데이터분석 라이브러리로, 행과 열로 이루어진 데이터 객체를 만들어 다룰 수 있게 되며 보다 안정적으로 대용량의 데이터들을 처리할 수 있다. Numpy 패키지를 바탕으로 만들어졌다. (따라서 Numpy 함수와 호환성이 좋다.) Series와 DataFrame 객체를 다루는 목적에 특화되어 있다. 통계, 결측치 처리, 시각화 등 다양한 기능이 있다. Series 1차원 Numpy 배열과 유사한 pandas의 기본 데이터 객체 index라는 속성이 있어 인덱싱 목적으로 사용된다. Numpy 배열과 마찬가지로 벡터 연산을 지원한다. Pandas의 또다른 데이터 객체인 DataFrame의 기본 단위가 된다. Series 생성 import pandas as pd import numpy as np..

[파이썬] Matplotlib 패키지

Matplotlib 패키지는 데이터를 차트 혹은 플롯의 형태로 시각화하는 패키지이다. import matplotlib.pyplot as plt import numpy as np %matplotlib inline 여기서 %matplotlib inline은 Cell Magic 명령어라고 불리우는 것으로 이는 파이썬 코드가 아니라 Jupyter에게 특정 기능을 수행하도록 하는 명령이다. Run 버튼을 눌러 실행하여 출력 영역에 그래프를 표시하도록 한다. Bar chart x = np.array(['Q1', 'Q2', 'Q3','Q4']) y = np.array([ 234.0, 254.7, 144.6, 317.6]) plt.bar(x,y,color = 'purple') plt.title('BAR CHART') ..