기계학습 용어

(2023-09-21)

기계학습 과정, 과적합


1. 기계학습의 용어기계학습
     - 데이터들로부터, 특징,패턴을 감지하여, 규칙,알고리즘,지식 등을 자동으로 학습,확장시킴

  ㅇ 특징 (Feature)
     - 데이터의 특징을 나타내는 정보 (두드러지고, 풍부한 정보를 주는 것)
        . 例) 키와 체중으로 성별을 예측할 때, 키,체중을 특징이라고 함
     - 특징 벡터  :  데이터에서 특징으로 간주되는, 1 이상의 변수들로 구성된 벡터
     - 특징량  :  데이터에서 나타나는 변화를, 1 이상의 변수들(특징 벡터)로 나타낸 계산식

  ㅇ 패턴 (Pattern)
     - 데이터들에서 나타나는 좋은 특징들을 모아놓은 집합패턴 인식 (Pattern Recognition)
     - 핵심이 되는 특징 추출과 이를 분류하는 것

  ㅇ 학습 (Learning)
     - 지속적인 경험이나 훈련의 결과로 생기는 행동 변화

  ㅇ 트레이닝 세트 (Training Set)
     - 학습에 사용되는 샘플 데이터

  ㅇ 과적합 (Overfitting)
     - 학습 데이터와 유사한 데이터에 만 잘 작동하고, 다른 데이터에는 일반화하기 어려운 현상

  ㅇ 이미지 인식
     - 필요 : 상품 인식, 얼굴 인식, 도로 상황 파악 등
     - 분류 : 물체 분류, 물체 인식2. 기계학습의 과정

  ㅇ ① 모델 선택 → ② 모델 학습 목표의 수식화 → ③ 모델 학습 (최적화) → ④ 모델 평가
     - 모델 선택 : 데이터에 대한 관점과 기대되는 바에 대한 수학적 모델링 
     - 모델 수식화 : 모델데이터를 얼마나 잘 표현하는지를 수학적으로 나타내는 것 
     - 모델 학습 : 정해진 모델이 표현하는 함수 집합 중 가장 데이터에 적합한 함수를 고르는 과정
     - 모델 평가 : 과적합 방지 등 


3. 기계학습학습 모델SVM (Support Vector Machine, 서포트 벡터 머신)
  ㅇ HMM (Hidden Markov Model, 은닉 마르코프 모델)
  ㅇ 신경망 (Artificial Neutral Network, ANN)
  ㅇ 혼합모델 등


4. 기계학습의 수행 방식 (문제 유형, 적용 대상)회귀 (Regression) : 입력 값을 바탕으로 연속적인 출력 값을 추정/예측분류 (Classification) : 입력 값을 바탕으로 특정 범주를 추정/예측군집화 (Clustering) : 입력 값들을 비슷한 특성별로 여러 그룹으로 분할하며 큰 단위로 만들어 감



Copyrightⓒ written by 차재복 (Cha Jae Bok)
"본 웹사이트 내 모든 저작물은 원출처를 밝히는 한 자유롭게 사용(상업화포함) 가능합니다"