개발노트

못믿을 기억력을 위하여

mecab 사용자 사전 추가

댓글 1

Linux

2018. 5. 31.

1. mecab-ko-dic 이 설치된 폴더로 이동

[root@up ~]# cd /home/downloads/mecab-ko-dic-2.0.3-20170922

[root@up mecab-ko-dic-2.0.3-20170922]# 


2. 사용자 사전 수정

/home/downloads/mecab-ko-dic-2.0.3-20170922/user-dic 폴더의 사용자 사전을 수정한다.


3. 사용자 사전 추가 ( add-userdic.sh 실행하면 user-nnp.csv 등 사용자 사전이 바뀐다)

[root@up mecab-ko-dic-2.0.3-20170922]# ./tools/add-userdic.sh


4. 컴파일
[root@up mecab-ko-dic-2.0.3-20170922]# make clean
[root@up mecab-ko-dic-2.0.3-20170922]# make install

만약 복합명사가 제대로 표현이 되지 않는 경우에는 user-nnp.csv 의 세번째 수치를 낮추고 다시 컴파일 한다.

(예)
프로야구,1783,3539,1000,NNP,*,T,프로야구,*,*,*,*,*
햇빛가리개,1783,3539,3534,NNP,*,T,햇빛가리개,*,*,*,*,*
햇볕가리개,1783,3539,3534,NNP,*,T,햇볕가리개,*,*,*,*,*
소녀시대,1781,3535,1000,NNG,*,T,소녀시대,*,*,*,*,*