반응형
머신러닝 개요
- 인간이 직접 데이터를 분석해 규칙을 유도, 모델을 구축하는 '기호주의 방식'
- 머신러닝은 데이터를 이해하는 알고리즘의 과학이자 하나의 어플리케이션이다.
- 머신러닝은 데이터를 지식으로 바꿀 수 있다.
- 머신러닝을 활용해 더 효율적으로 지식을 추출할 수 있다.
머신러닝 분류 : 지도학습
- 지도학습 : 레이블 된 훈련 데이터를 활용해 모델을 학습시켜, 본 적 없는 가까운 미래 데이터에 대한 예측값을 출력하는 것.
- 분류 : 지도학습의 하위 카테고리. 과거의 관측을 기반으로 새로운 샘플의 범주형 클래스 레이블 예측이 목적. 클래스 레이블은 이 때 클래스를 구분하는 규칙을 점선으로 표현하기도 하는데, 이는 '결정경계'라고 불리기도 한다. (클래스 레이블, 불연속적인 일종의 데이터가 속한 그룹) 대표적인 예로 손글씨 인식이 있다.
- 회귀 : 데이터가 주어졌을 때 연속적인 출력값을 예측하는 기법. 머신러닝 알고리즘은 입력 데이터와 출력값이 주어졌을 때 두 변수 사이의 관계를 탐색. 대표적으로 선형회귀가 있는데, 각 입력과 출력의 데이터들에서 평균거리가 제일 짧은 직선을 구해 예측에 활용한다.
머신러닝 분류 : 강화학습
- 강화학습 : 환경과 상호작용하면서 에이전트의 성능을 향상시키는 것이다. 환경이 상태를 넘겨주고, 이에 따라 에이전트가 행동하면, 이에 따른 보상함수 값을 다시 에어전트로 보내 이러한 정보를 바탕으로 성능이 향상된다. 물론 보상이 최대가 되는 방향으로 성능이 향상될 것이다.
- Deep-Q-Network같은 프로젝트가 대표적인 예이다. 아타리게임에서 일반적인 사람보다 좋은 스코어를 기록했다. 특히, 벽돌깨기에서 한쪽 부분만 제거 후 윗부분을 연속적으로 제거하는 것을 스스로 학습하기도 했다.
- Agent57 : Outperforming the Atari Human Benchmark
머신러닝 분류 : 비지도학습
- 비지도학습 : 레이블되지 않은 데이터, 구조를 알 수 없는 데이터를 활용한다. 출력값이나 보상 함수의 도움 없이 의미있는 정보를 추출하고, 데이터 구조를 탐색할 수 있는 것이다.
- 군집 : 사전 정보없이 쌓여있는 그룹 정보를 의미있는 서브그룹, 클러스터로 조직하는 탐색적 데이터 분석 기법이다. 각 서브그룹 혹은 클러스터는 어느정도의 유사성을 공유하고, 다른 클러스터들과는 구분되는 그룹을 형성한다.
- 차원축소 : 고차원의 데이터를 저차원으로 축소하는 기법이다. 세상엔 의외로 고차원의 데이터들이 상당히 많이 존재한다. 따라서 머신러닝 알고리즘은 종종 계산 성능과 저장 공간의 한계를 종종 맞닥뜨리곤 한다. 대부분의 정보를 최대한 유지하면서 더 작은 차원의 부분 공간으로 데이터를 압축시킨다.
반응형
'🛠 기타 > Data & AI' 카테고리의 다른 글
[파이썬] Numpy Fancy Indexing (0) | 2020.07.09 |
---|---|
[파이썬] Numpy 기초 (0) | 2020.07.08 |
딥러닝 기초 (0) | 2020.06.13 |
머신러닝 기초수학2 - 미분 (0) | 2020.06.09 |
머신러닝 기초수학1 - 통계학 (0) | 2020.06.03 |