주성분 분석 : PCA (Principal component analysis) 고차원의 데이터를 저차원으로 줄이기 위해 사용된다. 예를 들어 시각화를 진행하려고 할 때 우리는 13차원의 데이터를 시각화할 수 없다. 따라서 해당 데이터의 차원을 줄여서 확인해야만 한다. 필연적으로 데이터 손실이 일어나지만 이를 최소화한다. 혹은 고차원에 존재하면서 생긴 노이즈를 없애면서 데이터를 정제하는 일도 가능하다. 정규화와 사이킷런 라이브러리 활용 def normalize(X): for i in range(X.shape[1]): X[:, i] = X[:,i] - np.min(X[:,i]) X[:, i] = X[:,i] - np.max(X[:,i]) return X 데이터 행렬 X를 받고 그를 정규화하여 리턴하는 함수이..