tf-idf

· 딥러닝
# TF-IDF(Term Frequency-Inverse Document Frequency) 정보 검색과 텍스트 마이닝에서 이용하는 가중치 여러 문서로 이루어진 문서군이 있을 때 어떤 단어가 특정 문서 내에서 얼마나 중요한 것인지를 나타내는 통계적 수치 문서의 핵심어 추출, 검색 엔진에서 검색 결과의 순위 결정, 문서들 사이의 비슷한 정도를 구하는 등의 용도로 사용 가능 TF(Term Frequency) 특정한 단어가 문서 내에 얼마나 자주 등장하는지를 나타내는 값 값이 높을수록 문서에서 중요하다고 생각할 수 있음 But! 단어 자체가 문서군 내에서 자주 사용되는 경우, 그 단어가 흔하게 등장한다는 것을 의미 = DF(문서 빈도, document frequency) = 특정 단어 t가 등장한 문서의 수 ..
하얀 돌덩이
'tf-idf' 태그의 글 목록