Jaccard Similarity 자카드 유사도 | (2025-07-21) |
1. [기계학습] 자카드 유사도 (Jaccard Similarity)
ㅇ 벡터의 교집합과 합집합 비율을 이용한 유사도
- 공통된 것들이 많을수록 유사하다고 판단
ㅇ 자카드 거리 : 두 문자열 간에 공통으로 포함된 글자가 많을수록 유사도 높음
- 완전 일치 : 1, 공통 글자 없음 : 0
. 단, 같은 글자들은 1글자로 계산됨
[# J(A,B) = \frac{|A \cap B|}{|A \cup B|} = \frac{|A \cap B|}{|A|+|B|-|A \cap B|} #]
ㅇ 활용
- 단어 사이의 유사도 : 통상, 공통 글자의 수와 단어의 길이로 판단
"본 웹사이트 내 모든 저작물은 원출처를 밝히는 한 자유롭게 사용(상업화포함) 가능합니다"
     
[정보통신기술용어해설]          
최근 편집          
후원          
Copyrightⓒ 차재복