티스토리 뷰

전통적으로 컴퓨터의 조작은 사용자가 명령어를 입력하거나 메뉴를 선택해서 수행해 왔는데 이는 컴퓨터의 언어로 컴퓨터 중심의 대화를 하는 것이다. 만약 컴퓨터가 사람의 언어를 알아듣고 사람과 비슷한 수준으로 대화를 할 수 있다면 사람은 인간의 언어로 일을 시키고 조작하고 원하는 목적을 달성할 수 있을 것이다.

이렇게 대화를 통해 기계에게 지시를 내리고 도움을 받는다는 생각은 오래 전부터 있어 왔던 것이다. 영화나 소설에서 상상만 한 것이 아니라, 실제 학계에서도 최초의 대화형 에이전트를 무려 1966년에 발표했을 정도이다.[1] 이후 인터넷의 보급과 함께 검색 서비스가 일반화되면서 자연어 처리 기술이 발전되자 2000년 대 초부터 많은 대화형 에이전트들이 등장하게 되었다. 그러나 대화를 한다는 것은 사람의 언어를 이해하는 능력뿐만 아니라 대화 상대방만큼의 배경지식을 가지고 있어야 하고 또한 대화를 전개할 수 있는 대화 관리 능력이 있어야 하기 때문에 컴퓨터가 대화다운 대화를 하기 시작한 것은 최근에 이르러서 이다. 예를 들어 사람과 연속적으로 대화가 가능한 애플사의 Siri2011, 삼성전자의 S-Voice2012년에 첫 선을 보였다.

그 동안 발표된 대화형 시스템을 살펴보면, 사용자와의 정보 교환 방식에 따라, 그리고 지능의 획득 방법에 따라 크게 4 종류로 나눌 수 있다. (1 대화형 AI 시스템의 분류 참조)

 

< 1> 대화형 AI 시스템의 분류

 

구분

 

정보 교환 방식

1회성 질의응답

(결과 진열형)

연속 대화형

지능의

획득

방법

지도 교육

QA시스템

(:Web4Health)

말동무

(: 파로, 안젤라)

자율 학습

지능형 검색

(: 네이버, 구글)

개인 비서

(: 시리, S-Voice)


사용자의 명령이나 질의에 대한 결과를 어떻게 제시하느냐 하는 사용자와의 정보 교환 방식은 크게 1회성 질의응답 방식이냐 연속적 대화 방식이냐로 나눌 수 있다. 그 동안 개발된 대부분의 시스템은 사용자가 검색을 하면 (=질문을 하면) 결과를 진열해 주고 끝을 맺는 1회성 응답 시스템인데 예를 들면 네이버나 구글 등이 그러하다. 1회성 응답시스템의 단점은 사용자 의도를 파악하기가 어렵다는 점이다. 예를 들어 사용자가 네이버 검색 창에 인공지능이라고 입력하면 1회성 질의응답 시스템인 네이버는 인공지능에 대한 문서를 찾아 나름대로의 점수를 매겨 우선순위에 따라 진열해 준다. 그리고 끝이다. 만약 1회성이 아니라면 인공지능이라고 입력했을 때 이 단어를 통해 찾고자 하는 목적이 무엇인지를 아래와 같이 두 세 차례 확인한 후에 범위를 좁힌 결과물을 제공할 수 있을 것이다.

 

사용자 : 인공지능

네이버 : (검색 결과물을 찾기 전에 사용자에게 추가 질문을 한다.) 인공지능과 관련된 자료가 2백만건이 넘습니다. 인공지능의 연구분야를 알고 싶으신가요? 응용분야를 알고 싶으신가요? 아니면 연구 단체를 알고 싶으신가요?

사용자 : 응용분야

네이버 : 응용분야에는 자연어 처리, 지능형 로봇, 실시간 번역, 전문가 시스템 등이 있는데요 어느 분야를 원하십니까?

사용자 : 자연어 처리

네이버 : 34,200 개의 문서를 찾았습니다. 우선 박사학위 논문부터 보여드릴까요?

 

현재의 지능형 검색 서비스들은 이런 단점을 보완하기 위해 키워드 자동완성이라는 기능을 제공하고 그 외에도 큐레이션, 데이터 리덕션(reduction), 의미망(semantic network) 등을 통해 사용자가 원하는 의도에 맞춘 결과물을 제공하려 하고 있다

이에 반해 연속적인 대화가 가능한 시스템은 사용자가 원하는 것을 좀 더 구체적으로 파악할 수 있다. 애매한 질문이나 중의적 질문, 광범위한 영역을 아우르는 추상 개념 등에 대해서는 재차 확인 질문을 해서 사용자의 의도를 세밀하게 알아 낼 수 있다. 그런데 이렇게 연속적으로 대화를 하기 위해서는 컴퓨터가 사람의 언어를 이해하는 것만으로는 부족하고 일정 수준 이상의 지능이 있어야 한다. 예를 들면

 

철수가 어항을 떨어뜨렸다. 철수는 울고 말았다.[2]

 

에서, 이 간단한 진술문을 이해하려면 어항은 유리로 만들어 진다”, “유리는 떨어뜨리면 깨진다등의 지능을 가지고 있어야 가능하다. 그리고 그래야 다음 대화를 이어나갈 수 있다.

그 동안 컴퓨터에 지능을 불어 넣기 위해 여러 방법들이 연구되고 시도되었는데 필요한 지능을 어떻게 획득 하느냐에 따라 대화형 시스템을 지도 교육 방식과 자율 학습하는 방식으로 나눌 수 있다. (표2 지능획득 방법에 따른 AI 시스템의 분류)


<표 2> 지능 획득 방법에 따른 AI 시스템의 분류

지능 획득 방법

지도 교육

자율 학습

내용

정형화된 구조로 지식을 만들어 컴퓨터에 입력

대규모의 자료로부터 스스로 공통 성질을 추출

모델/가정

인간의 사고는 기호의 조작이며 컴퓨터도 동일한 방식으로 지식을 저장하고 표현할 수 있다. (기호주의)

인간의 지식은 수 많은 뉴런들의 연결구조와 연결강도로 표현된다. (연결주의)

대표 방법론

규칙기반 인공지능

(Rule-based AI)

인공 신경망

(Artificial Neural Network)

장점

신뢰성

의사결정의 과정을 설명할 수 있음

스스로 학습 가능

넓은 범위에 적용 가능

단점

규칙을 작성한 사람의 능력에 의존

한 분야에 유용한 지능이라도 다른 분야에는 적용되기 어려움

확률, 통계, 벡터 등의 수학 뿐만 아니라 컴퓨터 프로그램에 대한 전문지식 필요

매우 방대한 데이터 필요

적합한 분야

순차적이며 절차적인 분야

신뢰성이 중요한 분야

기호로 표현하기 어려운 분야 (사진인식, 음성인식 등)

학습과정을 사람이 이해할 필요 없는 분야

장벽

표현할 전문지식이 있는가?

자율학습 알고리듬을 개발할 수 있는가?

양질의 대규모 데이터가 있는가?


지도 교육 방식은 인간의 사고과정이 기호의 조작에 의한 것이며 기호를 통해 지식을 표현할 수 있다는 가정에서 출발한 것이다. 이를 동일하게 컴퓨터에 적용한 방법이 규칙기반의 인공지능이다. 이는 규칙이나 사례를 정형화되고 구조화된 형식으로 표현하고 이를 컴퓨터에 입력해 놓음으로써 의사결정을 지원받는 방식으로 그동안 의약, 화학, 암석, 우주선 발사 등과 같은 전문 분야에서 널리 쓰여 왔다. 이 방법은 전문가의 지식과 경험을 입력한다는 신뢰성 있는 답변이 가능하지만, 단점은 한 분야의 지능을 다른 분야에 재사용할 수 없기 때문에 분야별로 다시 개발해야 한다는 점, 그래서 시간과 비용이 추가로 든다는 점을 들 수 있다.

두 번째인 자율학습 방식은 인간의 뇌가 뉴런들의 연결 상태와 강도에 따라 지식이 표현된다는 가정 하에 컴퓨터도 동일하게 데이터간의 연결 상태와 강도로 지식을 보유하도록 하는 방식이다. 이 방식의 대표적인 예가 인공 신경망(ANN, Artificial Neural Network)으로 스스로 학습할 수 있다(unsupervised learning)는 점이 가장 큰 장점이다. 대량의 데이터에서 스스로 특징을 추출하여 연관관계나 분류기준을 만들어 패턴을 인식할 수 있기 때문에 수식이나 기호, 규칙으로 표현하기 어려운 복잡한 패턴을 인식할 수 있다. 특히 최근에는 딥러닝이라는 방법을 이용하여 자연어 인식, 사물 인식, 음성 인식, 사진 인식 등 대단히 복잡한 패턴까지 인식 가능하게 되었다.

인공신경망의 장점을 살리기 위해서는 두 가지 큰 장벽을 넘어야 하는데 첫째는 자율학습 알고리듬을 개발하는 것이고 둘째는 필요한 양질의 데이터를 대규모로 확보하는 것이다. 자율학습 알고리듬을 만들기 위해서는 통계, 확률, 벡터와 같은 수학과 수리논리학 등의 전문지식이 필요하고 전문적인 프로그래밍 실력도 필요하기 때문에 인공신경망으로 대화형 시스템을 개발하려면 먼저 뜻이 맞는 해당 분야의 전문가를 찾아야 한다. 인공신경망 개발툴은 구글이나 마이크로소프트 등이 무료로 공개하고 있으므로 데이터 공학자, 프로그래밍 전문가, 수학, 수리 논리학, 기획자 등과 함께 팀을 구성하면 개발을 시작할 수 있다. 그러나 실제에 있어서 가장 큰 난관은 두 번째로 지적한 대규모 데이터의 확보에 있다. 데이터를 가진 자가 승자라는 말이 있을 정도로 데이터가 중요해 지고 있어서 이를 확보하기가 쉽지 않다. 학습 알고리듬이 잘 개발되었다 하더라도 데이터의 질이 떨어지거나 데이터의 수량이 적다면 자율학습이 제대로 될 수 없기 때문에 반드시 개발에 앞서 데이터 확보 방법을 계획해 두어야 한다.

이에 반해 규칙기반의 인공지능은 전문지식을 가지고 있는가가 장벽이 된다. 그 동안은 규칙을 만드는 것이 어렵고 시간이 많이 걸렸기 때문에 의료 분야나 화학, 우주선 발사 등 특수한 영역에서만 사용되어 왔으나, 이제는 개발툴이 발달되어 지식을 구조화하고 정형화하는 것은 문제가 되지 않는 시대가 되었다. 그 보다는 표현하고 저장할 전문지식이 있는가가 관건이 되었는데, 이때 전문지식이라는 것이 꼭 학술적으로 의미 있어야 하는 것을 뜻하는 것은 아니다. 애니메이션 캐릭터, 한국의 섬, 자동차, , K-POP 등 좁은 영역이지만 자신이 관심있는 영역을 깊이 있게 다룰 수 있으면 무엇이든 상관없다.

자신의 취미나 관심분야, 전문지식을 인공지능에게 가르치고 또 이를 통해 다른 사람에게 도움을 줄 수 있도록 설계하다 보면 자신이 가진 지식과 경험을 체계화할 수 있을 뿐만 아니라 부족한 점, 보완해야 할 점을 알게 되고 나아가 문제를 바라보는 시각과 관점도 체계화할 수 있는 추가적인 이득도 얻게 된다.



[1]  미국 MIT대학 인공지능 연구실의 와이젠바움 교수는(Joseph Weizenbaum) 1964년부터 1966년까지의 기간 동안 엘리자(ELIZA)”라고 부른 최초의 대화형 챗봇을 개발함

[2] 서정연 교수, "자연어처리 소개" 강의자료에서 인용



댓글
댓글쓰기 폼