본문 바로가기

단어 유사도2

[Python] 단어 집합(리스트, 튜플)에서 특정 단어와 가장 유사한 단어 찾기 difflib.get_close_matches 이번 포스팅에서는 여러 단어 집합(리스트, 튜플)에서 특정 단어와 가장 유사한 단어를 파이썬(Python)을 이용해서 찾는 방법을 소개한다. 이전 포스팅에서는 단어와 단어의 유사도를 계산하는 방법을 알아보았는데 이번에는 단어 집합 속에서 특정 단어와 가장 유사한 단어를 찾는다는 점에서 차이가 있다. 파이썬 내장 모듈 difflib의 get_close_matches를 이용하면 특정 단어와 가장 유사한 단어를 집합에서 빼내올 수 있다. difflib.get_close_matches 사용법 get_close_matches는 word, possibilities, n, cutoff 총 4개의 인자를 가지며 의미는 다음과 같다. word = 비교 기준이 되는 단어 possibilities = 비교하려는 단어 집합 .. 2022. 5. 1.
[Python] difflib.SequenceMatcher 두 문자열(단어)의 유사도(Similarity) 계산하기 코딩을 하다가 파이썬(Python)으로 두 문자열(단어)의 유사도(Similarity)를 계산해야할 일이 있어서 이를 어찌할까 검색해보다가 Stackoverflow 에서 고수분이 알려주신 테크닉을 여기에 적어보려고 한다. 두 문자열(단어) 유사도 계산 difflib은 파이썬 내장 모듈이다. 여기에 SequenceMatcher를 이용하면 두 단어의 유사도를 알 수 있다. 이때 두 단어의 유사도는 ratio라는 메서드를 이용하면 되는데 이를 이용하여 두 문자열(단어)의 유사도(Similarity)를 계산하는 함수를 만들었다. from difflib import SequenceMatcher def similar(a, b): return SequenceMatcher(None, a, b).ratio() 이제 ma.. 2022. 5. 1.

맨 위로