[Mecab] 사용자 사전 단어 추가 방법
mecab을 사용해서 형태소분석하고 나면, 중요 token들이 인식되지 않을 때가 있다. 기본적으로 mecab은 제공하는 사전 외에, 사용자가 직접 입력해서 단어를 인식할 수 있도록 하는 ‘사용자 사전’ 제공한다. 기존 사전에 다양한 단어들이 있지만, 원하는 대로 검색이 되지않는 합성어나, 신조어, 외래어(붙어서 나와야 하는데 띄어서 나오는 단어)등 필요한 단어를 사용자 사전에 추가하여 하나의 토큰으로 분석될 수 있도록 한다. 1. user-dic 폴더의 csv 파일에 단어 추가 C:\mecab\user-dic 예) LG전자라는 단어를 추가 하고싶다. 적용 전 : LG, 전자 분리됨 ✅ 단어 추가 양식 : 추가할 단어, 0, 0, 우선순위(가중치), 품사태그, 의미분류, 종성유무(단어의 끝 글자 받침 유..
2022. 8. 27.