2. 사전 만들어 내장시키기
사전은 대화의 출발점이다. 사전에 등재되지 않은 단어를 토픽의 키워드로 사용하면 토픽이 활성화 되지 않기 때문이다. 사전에 등재되지 않는다고 에러가 되지는 않지만 CS내부적으로는 그 단어를 제외하고 처리하기 때문에 그 단어가 입력되었을 때 토픽이 활성화 되지 못하게 된다. 당연히 룰 매칭도 일어나지 않는다. 따라서 :build를 할 때 토픽 키워드에 등재한 단어가 not known word 라는 경고를 받게 되면 반드시 단어 등재를 해야 한다. 단어를 사전에 등재하는 방법은 두 가지가 있는데 하나는 내장되어 있는 기본사전이나 보조사전에 등재하는 방법, 또 하나는 사용자가 만드는 사용자사전에 등재하는 방법이다. 기본 사전은 텍스트로 만들어진 사전을 이진화일로 만든 것이기 때문에 탐색속도가 매우 빠르다는 장..
5장. 한국어 특징을 반영하기
2016. 6. 23. 07:10