공지
혼자 힘으로 한국어 챗봇 개발하기
이 블로그는 Chatscript 라는 인공지능 챗봇 개발 툴로 한국어 챗봇을 개발하려는 분들과 경험을 공유하기 위해 개설한 것이다.
머신러닝, 딥러닝, 강화학습 등을 방법론으로 하는 인공신경망(Artificial Neural Network)이 큰 화제이지만, 인공신경망은 아직 두 가지 큰 장벽이 존재한다. 첫째는 수학, 수리논리학, 확률, 통계, 데이타공학, 프로그래밍 등 여러 분야의 지식과 경험을 필요로 하기 때문에 분야별 전문가들로 구성된 팀을 짜서 개발해야 한다는 점이고 둘째는 인공신경망에게 학습시킬 정제된 데이타가 대규모로 필요하다는 점이다. 특히 한국어로 대화를 하는 챗봇을 개발하려면 한글로 만들어진 대규모 대화자료가 있어야 하는데 현재는 이 부분이 큰 장애가 되고 있다.
이에 반해, Chatscript는 규칙기반의 인공지능 개발툴로 2012년, 2014년, 2015년 뢰브너 경연 대회에서 연속 우승을 했을 정도로 성능이 대단히 뛰어나면서도 프로그래밍 경험이 없는 일반인들도 누구나 개발할 수 있고, 특히 혼자 개발할 수 있을 정도로 무척 쉽다는 장점이 있다. 규칙기반의 인공지능이기 때문에 학습시킬 별도의 데이타도 필요없다.
이제 Chatscript을 잘 활용하여 한국어로 채팅하는 챗봇을 수 만 ~ 수 십만 개 개발함으로써 한국어로 된 정보에 목말라하는 전세계 한류팬들에게 정확하고 충분한 지식을 제공하기로 하자.
(아래는 앞으로 다룰 내용의 순서를 정리한 것이다.)
1. 대화형 AI 시스템
(3) 인공지능 ChatScript의 특장점
2. 대화의 구조와 룰의 기초
(1) 제 이름은 해리에요
(5) AI에 가르칠 대화 예제 : K-POP
3. 기초 대화 가르치기
(3) 어순에 관계없이 알아듣기
4. 응용 대화 가르치기
(8) 질문에 되묻기(Tag Question)하는 경우
5. 한국어 특징을 반영하기
(3) 토픽에 한글 키워드 등록하기
(4) 패턴에서 “명사+조사”의 매칭
(5) 용언의 활용형 매칭
(6) 담화 표지자의 등록
(7) 축약어 등의 등록
(8) 문자 숫자의 등록
(9) 라벨은 영어로 작성
(10) 철자 검사 중지, 구문 분석 중지
6. 예제 챗봇의 개발 따라하기
(5) 클라우드에 올려 서비스하기
7. 나의 첫 챗봇 개발하기
8. 테스트 및 보완
(6) 대화내용 분석하고 보완하기
9. 부록
(1) CS의 주요 개념 및 예약어
(2) 패턴 연산자 총정리
(3) 꼭 알아 두어야 할 함수