1. 기계학습 모델 (Model)
ㅇ 데이터로부터 학습하여, 규칙을 발견하고, 이를통해 예측,분류 등의 작업을 수행하는,
알고리즘 또는 수학적 구조
- 데이터 학습을 통해 도출된 규칙 또는 패턴의 체계
- 수학적으로는, 입력을 받아 특정 처리를 수행해 출력(주로, 확률)을 생성하는 함수로 볼 수 있음
2. 기계학습의 모델화 과정
ㅇ ① 모델 선택 → ② 모델 학습 목표의 수식화 → ③ 모델 학습 (최적화) → ④ 모델 평가
- 모델 선택 (Model Selection)
. 데이터에 대한 관점과 기대되는 바에 대한 수학적 모델링
.. 데이터의 특성과 목표에 따라 적절한 수학적 모델링을 수행
.. 모델 유형을 고르고 구조를 정의하며, 사용 알고리즘과 주요 하이퍼파라미터를 결정
- 모델 수식화 (Model Specification)
. 모델이 데이터를 얼마나 잘 설명하는지를 수학적으로 정의
.. 例) 손실 함수, 목적 함수 등을 통해 모델의 학습 목표를 명확히 표현
- 모델 훈련, 모델 학습 (Training a Model)
. 모델이 표현할 수 있는 함수 공간 중, 데이터에 가장 적합한 함수를 찾는 과정
.. 손실(오차)을 줄이기 위해, 파라미터를 반복적으로 조정하며, 모델을 정교화
- 모델 평가 (Model Evaluation)
. 학습된 모델의 성능을 다양한 지표로 측정
.. 이를통해 모델이 얼마나 좋은 성능을 보이는지를 평가
. 과적합 여부 확인 : 일반화 성능 검증 (새로운 데이터에 대한 성능 평가 포함)
.. 학습 데이터가 아닌 새로운 데이터에도 잘 동작하는지 평가 (일반화)
. [참고] ☞ 이진분류 (TP,TN,FP,FN 및 모델성능평가기준) 참조
3. 기계학습의 주요 학습 모델
ㅇ 선형 모델 (Linear Model)
- 특징들의 선형조합을 통해 예측하는 함수를 학습함
. {#f(\mathbf{x}) = \mathbf{w}^T\mathbf{x} + b #}
.. 가중치 w와 편향 b를 학습하여 모델을 구성
- 특징
. 각 속성[ai](특징(AI])에 대한 중요도(w)를 잘 보여주며 해석이 용이함 (comprehensibility)
. 많은 비선형 모델들이, 선형 모델을 기반으로 층을 쌓거나 고 차원 공간으로 확장하여 구성됨
ㅇ SVM (Support Vector Machine, 서포트 벡터 머신)
- 결정 경계를 최대 마진으로 설정하여 데이터를 분류하는 모델
. 커널 기법을 통해 비선형 분리도 가능
ㅇ HMM (Hidden Markov Model, 은닉 마르코프 모델)
- 관측되지 않는 숨겨진 상태들 간의 전이 확률을 모델링하여 시계열 데이터를 분석
. 음성 인식, 자연어 처리 등 순차적 데이터에 강점
ㅇ 신경망 (Artificial Neural Network, ANN)
- 인간의 신경 구조를 모방한 구조로, 다층 퍼셉트론 등의 형태로 구성
. 비선형 문제를 처리할 수 있으며, 딥러닝의 기반이 되는 모델
ㅇ 혼합 모델 (Mixture Model)
- 여러 개의 확률 분포를 조합하여 복잡한 데이터 구조를 표현
. 例) 가우시안 혼합 모델 (GMM, Gaussian Mixture Model)