1. 특징 (Feauture)
ㅇ 관측값(데이터)들에서 보이는 특성/양상/성질들로써, 좋은 특징들이 패턴을 이루게 됨
* 두드러지고, 풍부한 정보를 주는 것
- 例) 지역 : 월평균 온도 등
- 例) 자동차 : 주행거리, 연식, 브랜드 등
- 例) 사람 : 나이, 성별, 몸무게, 시력 등
- 例) 문서 : 문서 내용, 글쓴이, 문서 구조, 문서의 길이,
단어 빈도(word frequency,term frequency), 단어의 평균 길이 등
ㅇ 특징의 정량화
- 특징 벡터 : 데이터에서 특징으로 간주된 1 이상의 변수들로 구성된 벡터
- 특징량 : 데이터에서 나타나는 변화를 1 이상의 변수들(특징 벡터)로 나타낸 계산식
ㅇ 특징의 생성
- 특징 추출 (feature extraction)
- 특징 선택 (feature selection)
ㅇ 특징의 용도 : 주로, `분류`를 하기 위한 수단
ㅇ 특징의 척도 : 분별력
- 특징에 따라, 서로달리 구별할 수 있느냐에 대한 척도
- 척도 例) 유사도, 거리 등
2. 패턴 (Pattern)
ㅇ 예측 가능한 방식으로 되풀이되는 형태 (규칙성)
- 例) 글자 패턴, 얼굴 패턴, 안테나 패턴, 511 시험패턴,
문자열 패턴(정규 표현식), 아이패턴 등
ㅇ 데이터들에서 나타나는 좋은 특징들을 모아놓은 집합
- 특히, 데이터 값들 간에 어느 정도 비슷해야 `패턴`이라고 할 수 있음
3. 패턴의 표현 및 구분
ㅇ 패턴의 표현
- 도형 : 직관적 시각화에 유리
- 벡터 형식 : 1 이상의 수치값 또는 문자값
- 트리 형식 : 계층적인 구조화에 적절
ㅇ 패턴의 구분
- 정적 패턴 : 시간에 따라 패턴에 변화가 없음
. 例) 지문, 홍채, 정맥 등
- 동적 패턴 : 시간에 따라 패턴에 변화가 있음
. 例) 시계열 패턴, 음성 신호 등
4. 패턴의 분할 (Segmentation)
ㅇ 인식 대상이 되는 패턴을 의미적으로 분리해내는 것
※ [참고] ☞ 패턴인식 패턴분석 기계학습 비교 참조