챗봇 만들기

“단언컨대”는 “단언컨데”로 자주 쓰이는, 맞춤법이 빈번하게 틀리는 단어이다. 이런 경우 자주 틀리는 부분에 와일드카드를 사용함으로써 사용자 입력을 놓치지 않을 수 있다. 즉 u: (단언* 한류 그룹) 예. 정말 독창적인 그룹이지요. 이런 미봉책이 아니라 보다 근본적인 방법으로는 replace 명령어로 보조 사전을 만들어 매칭을 시도하기 전에 먼저 사용자가 틀리게 입력한 문장을 교정하는 것이다. replace: 단언컨데 단언컨대replace: 단언건데 단언컨대 이렇게 replace를 이용해서 만들어진 보조사전은 TOPIC폴더 내에 private1.txt로 저장되고 반영된다.[1] 맞춤법이 흔히 틀리는 단어로는 역할, 오랜만이다, 설거지, 하마터면 등 많은 단어가 있는데 특히 채팅 상황에서는 오타가 흔히 ..

3장. 기초 대화 가르치기 2016. 5. 13. 07:31

10. 문자 이모티콘 알아듣기

메신저로 문자 대화를 하는 경우 문자 이모티콘을 사용하는 경우가 있다. 예를 들면 :-(, :-), OTL 등 키보드 자판을 이용하여 말로 하기 곤란한 답을 간단히 대신하는 경우이다. 챗봇이 이런 이모티콘을 알아듣도록 하기 위해서는 LiveData 폴더에 있는 texting.txt 파일에 이 내용을 등록해 주면 된다. 이 파일을 열어보면 널리 쓰이는 문자 이모티콘 7개가 이미 등록되어 있는 것을 볼 수 있을 것이다. 이곳에 추가해 주면 되는데 등록할 때 그 이모티콘이 슬픔을 뜻하는 것인지, 기쁨을 뜻하는 것인지 등에 따라 옆에 적합한 컨셉을 함께 적어 주면 된다. 맨 마지막 줄의 신규등록은 사용자가 추가한 것이라 가정을 한 것이다. LiveData폴더 아래의 texting.txt 파일에 위의 내용을 입력..

3장. 기초 대화 가르치기 2016. 5. 13. 07:25

9. 띄어쓰기 한 복합명사 구별하기

대화의 문맥상 상대방이 투애니원의 "내가 제일 잘 나가"를 언급할 것이 예상된다고 가정해 보자. 그럼 이때 어떻게 하면 "내가 제일 잘 나가"를 4개 어절의 보통명사가 아니라 한 단어의 고유명사로 취급하게 할 수 있을까? 패턴에 겹 따옴표를 사용하면 된다. u: (“내가 제일 잘 나가” 들어 봤*) 그럼요, 저도 그 곡을 즐겨 들어요. 사용자가 겹따옴표 안에 들어있는 내용과 동일한 단어와 순서로 입력을 하면 CS는 그 일련의 단어들을 한 단어의 고유명사로 취급한다. 만약 겹 따옴표를 하지 않으면, CS는 저 4개의 어절을 각각 별도의 단어로 취급하여 아주 다른 결과를 내 놓을 수 있게 된다. 따라서 사람 이름, 회사 이름, 브랜드, 특히 영화 제목, 책 제목, 노래 제목 등 두 어절 이상으로 이뤄진 고유..

3장. 기초 대화 가르치기 2016. 5. 13. 07:21

이전 1 ··· 11 12 13 14 15 16 17 ··· 19 다음

이전 다음

공지사항

혼자 힘으로 한국어 챗봇 개발하기

최근에 올라온 글

최근에 달린 댓글

Total

Today

Yesterday

링크

TAG more

« 2025/04 »
일	월	화	수	목	금	토
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30

글 보관함

내 블로그 - 관리자 홈 전환	`Q` `Q`
새 글 쓰기	`W` `W`

글 수정 (권한 있는 경우)	`E` `E`
댓글 영역으로 이동	`C` `C`

이 페이지의 URL 복사	`S` `S`
맨 위로 이동	`T` `T`
티스토리 홈 이동	`H` `H`
단축키 안내	`Shift` + `/` `⇧` + `/`

챗봇 만들기

티스토리툴바

단축키

내 블로그

블로그 게시글

모든 영역