1. 기계학습의 과정
ㅇ ① 모델 선택
- 데이터에 대한 관점과 이에 기대되는 바를,
- 수학적으로 가정해 보는 수학적 모델링 중에,
- 어떤 모델을 쓸 것인지를 정하는 것
ㅇ ② 모델 학습 목표의 수식화
- 모델이 데이터를 얼마나 잘 표현하는지를 수학적으로 나타내는 것
- 例) 손실함수 or 비용함수/목적함수 (벗어나는 정도), 우도 (들어맞는 정도) 등
ㅇ ③ 모델 학습 (최적화)
- 손실함수의 결과값을 최소화하려고 하는 등
- 例) 경사하강법 등
ㅇ ④ 모델 평가
2. 기계학습의 학습 모델
ㅇ SVM (Support Vector Machine, 서포트 벡터 머신)
- 데이터 분포를 분류하는/나누는 기준을 결정하는 것
- 분류와 회귀 문제 모두에서 사용 가능
- 지도 학습 모델 중 하나
- 분류 오류율의 최소화가 아닌, 집단 간 여백의 최대화를 목적으로 설계됨
ㅇ HMM (Hidden Markov Model, 은닉 마르코프 모델)
ㅇ 신경망 (Artificial Neutral Network, ANN)
ㅇ 혼합모델 등
3. 기계학습의 수행 방식 (문제 유형, 적용 대상)
ㅇ 회귀 (Regression)
- 입력 값을 바탕으로 연속적인 출력 값을 추정/예측
ㅇ 분류 (Classification)
- 입력 값을 바탕으로 특정 범주를 추정/예측
ㅇ 군집화 (Clustering)
- 입력 값들을 비슷한 특성별로 여러 그룹으로 분할하며 큰 단위로 만들어 감
. 유사도 산출 방법을 적절히 선택하는 것이 중요 함
4. 기계학습의 용어
ㅇ 패턴 인식 (Pattern Recognition)
- 핵심이 되는 특징 추출과 이를 분류하는 것
ㅇ 과적합 (Ovefitting)
- 학습 데이터와 유사한 데이터에 만 잘 작동하고, 다른 데이터에는 일반화하기 어려운 현상
ㅇ 학습 (Learning)
- 지속적인 경험이나 훈련의 결과로 생기는 행동 변화
ㅇ 특징 (Feature)
- 데이터의 특징을 나타내는 정보 (두드러지고, 풍부한 정보를 주는 것)
. 例) 키와 체중으로 성별을 예측할 때, 키,체중을 특징이라고 함