연구요약
|
본 연구에서는 CA의 방법을 이용하여 사람간의 대화, 그리고 사람과 기계의 대화과정을 분석하여 나타난 문제점을 파악하고 이를 통하여 공학적 개선방법이 모색될 수 있는 연구결과를 도출하고자 한다.
가) 1년차: 공학적 자연어처리와 국내외 대화 인터페이스 분석
1년차의 연구에서는 현재까지 발전해온 공학적 대화연구의 내용과 방법을 조사하고 CA의 연구방법과 비교하는데 다음의 네 가지 주요과제를 수행한다.
1) 공학적 대화 자료 선행연구와 대화분석 내의 기계어 선행연구
공학 분야의 자연어 대화분석에 대한 선행연구를 실시하는데 특히 목적지향성 대화와 채팅대화등 두 분야의 주요 연구 내용과 방법 그리고 산출된 결과의 장단점을 파악한다. 또한 CA내의 대화 인터페이스에 대한 연구를 파악하여 참고 할 수 있는 분석의 틀과 방법을 찾는다.
2) 공학실험실의 대화자료 처리방법의 학습 및 연구
선행연구조사를 바탕으로 본 연구에 참여하고 있는 두 공학실험실에 대한 관찰연구와 데이터 분석을 실시한다. 이를 통해 실험의 내용과 방법, 특히 대화정보 처리기능과 내용 그리고 시뮬레이션 및 모델과 프로그램밍 과정 등을 조사한다. 이러한 방법을 통해 공학적 접근방법을 통해 도출한 대화 인터페이스가 어떤 방식으로 개선 발전해 왔는지 조사한다.
3) 국내외 대화 시스템 사례연구
대화 인터페이스를 구축하기 위해서는 개발된 모듈을 구현하는 시스템이 개발되어야 한다. 본 연구에서는 주요한 챌린지대회에서 나온 데이터를 CA방법론을 이용해 분석한다. 이를 통하여 현재 개발 중인 시스템이 사람간의 대화와 어떤 유사성이 있고 어떤 문제에 봉착해 있는지를 파악할 수 있다.
4) 대화자료 전사와 분석 후 논문작성
수집된 데이터를 CA 방법으로 전사하고 분석한다.
나) 2년차: 휴먼대화 및 휴먼-기계대화 데이터베이스 구축과 분석
2년차에는 휴면 대화 데이터를 구축하여 이를 분석한 후 이를 공학실험실에서 도출한 대화 인터페이스와 비교분석한다. 이를 통해 나타난 유사점과 차이점을 도출하고 데이터를 분류하여 프로그래밍화하도록 하는데 목적이 있다.
1) 사람간의 대화연구: 목적성대화 및 채팅 데이터 수집
기계와 사람간의 원활한 대화를 위해서는 사람간의 데이터에 기반한 연구가 중요한 기초자료가 된다. 본 연구에서는 목적 지향성 대화의 예를 정하고 이를 실시간으로 수행하는 과정을 녹화 수집한다.
2) 사람과 기계와의 대화연구: 목적성대화 및 채팅 데이터 수집
현재 시중에 나와 있는 여러 인공지능 스피커(카카오미니, 엘지엑스붐, 아마존 에코 혹은 구글홈)과 피실험자들과의 상호작용을 촬영하고 이를 대화분석의 기법을 이용하여 분석한다. 또한 사람과 대화가 가능한 여러 기계나 인터넷, 상용화된 휴머노이드등을 구입하여 피실험자와 함께 상호작용하는 장면들을 녹취하여 분석한다.
3) 국제 대화 분류 방법의 한국어 적용 방법 연구
현재 선진외국의 대화분류의 기법을 한국어로 적용하는 방법에 대한 고찰이 필요하다. 국제어인 영어에 비해 한국어가 가지고 있는 특징에 따라 코퍼스를 분류하는 방법이 다를 수 있기 때문에 본 연구에서 수집된 데이터에 적합한 분류방법을 찾기 위한 기준을 마련하여 적용한다.
다) 3년차: 대화분석에 근거한 데이터 형식화 및 대화모델개발
1-2년차에서 수집된 정보와 전사된 자료를 통해 공학적 연구로 도출된 자료와 대화분석에서 나온 자료를 비교 분석하여 대화분석의 기법이 공학적 대화 모델 개발에 활용될 데이터를 분류하고 형식화 하여 주석한다.
1) 데이터비교분석 (공학실험실, 사람간 데이터및 사람과 기계 대화 데이터)
공학실험실에서의 데이터와 실제 상황에서 수집한 사람간의 대화 그리고 사람과 기계와의 데이터를 비교분석한다. 이를 통해 상향식 위주의 CA의 분석틀이 기존의 공학적 연구방법의 문제점을 해결하는데 도움이 되는지를 조사하고 이를 프로그래밍화 할 수 있는 방법을 강구한다.
2) 공학자연어 대화 처리를 위한 대화분석의 분류틀 개발
CA연구에서 찾아낸 분석의 틀(예: 말차례, 호의, 수정, Pre-sequence)등이 대화 인터페이스의 모듈설정에 기준이 되는지를 조사한다. 예를 들어 부탁하기의 경우 대화에 문제가 생겼을 때를 대비 수정(Repair)의 기준을 제시할 수 있다.
3) 대화분석의 분류틀에 대한 시험 및 평가
CA의 적용하여 대화 인터페이스인 목적성 대화나 채팅에 적용가능성을 모색한다. 두 실험실에서 CA의 분류 틀을 적용했을 때 어떤 문제가 생기는지를 파악하고 이를 극복할 수 있는 방법을 찾는다.
4) 대화자료 전사와 분석후 논문작성
수집된 데이터의 전사와 분석이 계속될 예정이다. 3년차에 모아진 데이터를 분석하여 논문 저서등을 작성하고 교육 자료를 만들어 배포한다.
|