Some content of this application is unavailable at the moment.
If this situation persist, please contact us atFeedback&Contact
1. (WO2016175354) ARTIFICIAL INTELLIGENCE CONVERSATION DEVICE AND METHOD
Document

명세서

발명의 명칭

기술분야

1  

배경기술

2   3   4   5   6  

발명의 상세한 설명

기술적 과제

7  

과제 해결 수단

8  

발명의 효과

9   10   11  

도면의 간단한 설명

12   13  

발명의 실시를 위한 최선의 형태

14   15   16   17   18   19   20   21   22   23   24   25   26   27   28   29   30   31   32   33   34   35   36   37   38   39   40   41   42   43   44   45   46   47   48   49   50   51   52   53  

청구범위

1   2   3   4   5   6   7   8   9   10   11   12  

도면

1   2  

명세서

발명의 명칭 : 인공지능 대화 장치 및 방법

기술분야

[1]
본 발명은 사람 대 로봇 간의 대화를 지원하는 인공지능 대화 장치 및 방법에 관한 것이다.

배경기술

[2]
채팅은 컴퓨터 또는 휴대용 단말기 등을 이용하여 네트워크를 통해 상대방과 대화를 할 수 있도록 지원하는 것으로, 대화창 메신저의 형태로 널리 이용되고 있다.
[3]
그러나, 사람과 사람 사이의 채팅에서는 상대방이 없는 경우에는 채팅을 행할 수 없어, 채팅 로봇이 탄생하게 되었다.
[4]
이는 지능형 에이전트에서 사람 대 컴퓨터(로봇)간의 자연어를 이용한 의사소통 수단으로서 그 필요성이 증대됨에 따라, 다양한 채팅 로봇 기술이 제안되었다.
[5]
종래 기술에 따른 대화 엔진의 경우, 사용자가 입력한 텍스트에 따라 기설정된 해당 답변이 제공되는 바, 사용자의 입력에 따라 대화의 주제가 급변한다.
[6]
사람 대 로봇 간의 자연어를 이용한 대화 엔진은 사용자에게 로봇과 대화하는 이질감을 최소화시키고, 자연스러운 대화가 이루어지도록 지원하는 것이 가장 핵심적 요소라 할 수 있음에도 불구하고, 종래 기술에 따르면 사용자의 입력에 따라 단순히 답변만을 제공하는 수동형 대화 엔진이 제공됨에 따라 사용자는 이질감을 많이 느낄 뿐 아니라, 사용자가 대화를 유도하여야 하여 대화의 흐름 및 사용자의 대화에 대한 흥미도가 급격히 떨어지는 문제점이 있다.

발명의 상세한 설명

기술적 과제

[7]
본 발명은 전술한 문제점을 해결하기 위하여 제안된 것으로, 질문 송신, 답변 수신, 답변에 대한 반응 및 다음 질문 송신의 순서로 대화를 진행하여, 사용자의 답변에 맞춰 다음 대화로 이어지도록 유도함으로써, 주제에서 벗어나지 않고 사용자와의 자연스러운 대화가 이루어질 수 있도록 지원하는 인공지능 대화 장치 및 방법을 제공하는 데 목적이 있다.

과제 해결 수단

[8]
본 발명의 일면에 따른 인공지능 대화 장치는 입력된 사용자 답변을 분석하는 입력답변 분석부와, 분석 결과에 따라 기설정된 시나리오 중 적어도 어느 하나의 반응시나리오를 선택하여, 사용자 답변에 대한 반응 및 질문에 대한 출력 명령을 전송하는 반응 제어부 및 무음 또는 대화 시작 음성을 출력하고, 반응 제어부의 출력 명령에 따라 반응 음성 및 질문 음성을 출력하는 출력부를 포함하는 것을 특징으로 한다.

발명의 효과

[9]
본 발명에 따른 인공지능 대화 장치 및 방법은 기설정된 시나리오 기반으로 질문 송신, 사용자 답변 수신, 사용자 답변에 대한 반응 송신의 순서로 대화를 능동적으로 진행시킴으로써, 사용자의 입력에 따른 기설정된 답변만을 제공하는 것이 아니라 능동형으로 대화를 이끌어 감으로써 대화 엔진과 대화를 수행함에 따른 사용자의 이질감을 최소화시키고, 대화의 흥미도를 높이는 효과가 있다.
[10]
사용자로부터 수신한 답변을 유형별로 분류하고, 답변에 속하는 컴포넌트를 집합으로 구성하여 사용자 답변에 대한 분석의 신뢰성을 높이고, 그에 따라 사용자 답변에 따른 반응을 적절히 제공하여 대화의 다음 순서로 유연히 진행시키는 것이 가능한 효과가 있다.
[11]
본 발명의 효과는 이상에서 언급한 것들에 한정되지 않으며, 언급되지 아니한 다른 효과들은 아래의 기재로부터 당업자에게 명확하게 이해될 수 있을 것이다.

도면의 간단한 설명

[12]
도 1은 본 발명의 실시예에 따른 인공지능 대화 장치를 나타내는 블록도이다.
[13]
도 2는 본 발명의 실시예에 따른 인공지능 대화 방법을 나타내는 순서도이다.

발명의 실시를 위한 최선의 형태

[14]
본 발명의 전술한 목적 및 그 이외의 목적과 이점 및 특징, 그리고 그것들을 달성하는 방법은 첨부되는 도면과 함께 상세하게 후술되어 있는 실시예들을 참조하면 명확해질 것이다.
[15]
그러나 본 발명은 이하에서 개시되는 실시예들에 한정되는 것이 아니라 서로 다른 다양한 형태로 구현될 수 있으며, 단지 이하의 실시예들은 본 발명이 속하는 기술분야에서 통상의 지식을 가진 자에게 발명의 목적, 구성 및 효과를 용이하게 알려주기 위해 제공되는 것일 뿐으로서, 본 발명의 권리범위는 청구항의 기재에 의해 정의된다.
[16]
한편, 본 명세서에서 사용된 용어는 실시예들을 설명하기 위한 것이며 본 발명을 제한하고자 하는 것은 아니다. 본 명세서에서, 단수형은 문구에서 특별히 언급하지 않는 한 복수형도 포함한다. 명세서에서 사용되는 "포함한다(comprises)" 및/또는 "포함하는(comprising)"은 언급된 구성소자, 단계, 동작 및/또는 소자가 하나 이상의 다른 구성소자, 단계, 동작 및/또는 소자의 존재 또는 추가됨을 배제하지 않는다.
[17]
도 1은 본 발명의 실시예에 따른 인공지능 대화 장치를 나타내는 블록도이다.
[18]
본 발명의 실시예에 따른 인공지능 대화 장치는 사용자 발화로부터 음성을 수신하는 입력부(100)와, 입력부(100)가 수신한 음성을 텍스트로 변환하는 STT(Speech To Text)부(200)와, STT 변환 결과를 수신하여 사용자 답변을 분석하는 입력답변 분석부(300)와, 분석 결과에 따라 기설정된 시나리오 중 적어도 어느 하나의 반응시나리오를 선택하여, 사용자 답변에 대한 반응 및 질문에 대한 출력 명령을 전송하는 반응 제어부(400) 및 무음 또는 대화 시작 음성을 출력하고, 반응 제어부(400)의 출력 명령에 따라 반응 음성 및 질문 음성을 출력하는 출력부(500)를 포함한다.
[19]
본 발명의 실시예에 따른 입력부(100)는 인공지능 대화 장치의 마이크를 통해 사용자의 음성을 수신한다.
[20]
본 발명의 실시예에 따른 인공지능 대화 장치는 사용자에게 질문 출력, 사용자로부터 답변 입력, 사용자에게 답변에 대한 반응 출력 및 사용자에게 반응 출력에 따른 다음 질문 출력을 순서대로 수행한다.
[21]
본 발명의 실시예에 따른 질문은 사용자와 대화를 시작하는 단계에서 제공되며, 대화 시작 음성으로 표현된다.
[22]
이 때, 대화 시작 음성은 출력부를 통하여 제공되는 최초 질문이거나, 무음이 출력되는 경우에는 사용자의 최초 음성 입력으로부터 이에 대한 반응 음성 및 질문 음성 출력의 순서로 대화가 진행되도록 지원한다.
[23]
즉, 사용자로부터 입력된 질의어에 대하여 기설정된 매칭 답변만을 제공하는 것이 아니라, 기설정된 시나리오 기반으로 사용자에게 질문을 하고, 이에 대한 사용자 답변을 분석하여 그에 대한 반응 및 다음 질문을 출력함으로써, 하나의 대화 주제 안에서 사용자와 인공지능 대화 장치 간의 자연스러운 대화가 이루어질 수 있도록 지원한다.
[24]
본 발명의 실시예에 따른 출력부(500)는 대화를 시작하기에 앞서 어플리케이션 실행 환경 정보에 기초하여 대화를 시작하는 질문음성인 대화 시작 음성을 출력한다.
[25]
이 때, 제1 실시예는 질문음성인 대화 시작 음성을 출력하는 것이고, 이에 대한 사용자의 답변, 반응 음성 및 질문 음성 출력의 순서로 대화가 진행되고, 제2 실시예는 무음이 출력되어, 사용자의 음성 입력이 대화의 시작 포인트가 되어 이에 대한 반응 음성 및 질문 음성 출력의 순서로 대화가 진행된다.
[26]
이 때, 어플리케이션 실행 환경 정보는 기구축된 시나리오 데이터베이스, 사용자의 개인 정보, 사용자의 행동 패턴, 이전의 대화에 대한 기록 정보, 주변 환경 정보 중 적어도 어느 하나로써, 일례로 사용자가 어플리케이션 가입에 있어 회사원임을 입력하고, 이전의 대화에 대한 기록 정보가 회사의 프로젝트에 관한 것이라면, 어플리케이션을 실행함에 따라 “오늘 그 프로젝트는 잘 진행되었나요?”라는 식으로 질문 음성을 출력하게 된다.
[27]
또한, 어플리케이션 실행 환경 정보가 “주말”이고 날씨 정보가 “맑음”이라면, 출력부(500)는 대화를 시작하는 질문으로서 회사와 관련된 질문이 아닌, “좋은 주말이에요. 날씨가 좋죠?”라는 식으로 질문 음성을 출력하게 된다.
[28]
즉, 본 발명의 실시예에 따른 출력부(500)는 사용자의 입력에 따라 기설정된 답변만을 단편적으로 제공하는 것에 그치지 아니하고, 어플리케이션이 실행됨에 따라 사용자에게 적절한 주제의 질문을 먼저 제공함으로써, 대화를 자연스럽게 시작하고 사용자 맞춤형 대화를 제공하는 효과가 있다.
[29]
또한, 본 발명의 실시예에 따른 반응 제어부(400)는 사용자 답변에 대한 반응 및 질문을 기저장된 목록 중 하나를 선택하여 출력하도록 명령하는 것 뿐 아니라, 사용자 답변에 대하여 새로운 반응 및 질문을 생성하여 출력하는 것 역시 가능하다.
[30]
본 발명의 실시예에 따른 입력부(100)는 대화 시작 음성 출력에 반응하여 또는 무음 출력 후에 입력된 사용자의 음성을 입력받고, STT부(200)는 이러한 사용자의 음성을 문자열로 전환한 결과를 입력답변 분석부(300)로 제공한다.
[31]
입력답변 분석부(300)는 문자열로 전환된 사용자 답변이 기설정된 답변 유형 중 어느 유형에 해당되는지 여부를 판별하여 분석을 수행한다.
[32]
본 발명의 실시예에 따른 기구축된 시나리오 데이터베이스는 답변의 유형으로 선택형 답변, 일반 답변, 반복을 원하는 답변, 관련없는 답변을 그 유형별로 분류하여 저장 관리한다.
[33]
선택형 답변은 질문에 대한 사용자의 답변에 있어서, 답변 선택에 따른 분류가 명확히 정해진 유형으로, 긍/부정, 봄/여름/가을/겨울 등을 그 예시로 들 수 있다.
[34]
일반 답변은 선택형 답변과 달리, 질문에 대해 선택할 수 있는 분류가 불명확하고 다수인 경우의 유형으로, “너는 무슨 운동을 좋아해?”라는 질문에 대한 답변을 그 예시로 들 수 있다.
[35]
반복은 원하는 답변은 출력부가 출력한 직전에 나온 질문을 다시 해주길 바라는 답변에 해당하는 유형이다. 이 때, 출력부(500)는 직전에 출력한 질문을 재출력한다.
[36]
관련없는 답변은 질문에 대해 연관성이 없는 답변으로, “너는 무슨 운동을 좋아해?”라는 질문에 대하여 “오늘은 날씨가 좋아”라는 답변이 수신되는 유형이다. 이 때, 본 발명의 실시예에 따른 인공 지능 대화 장치는 사용자의 답변에 기반하여 시나리오를 수정하여 답변 및 질문을 추출하여 순차적으로 제공하거나, 최초 질문이 해당하는 카테고리의 질문을 다시 사용자에게 질의하는 것 역시 가능하다.
[37]
입력답변 분석부(300)는 입력된 사용자의 답변이 미리 정해둔 분류 중 어느 분류에 속하는지 판단하고, 그 결과를 표시한다. 일례로, 선택형 답변 유형에 해당하는 경우, 문장 분석을 통해 입력된 사용자 답변이 질문에 대한 긍정문인지 부정문인지 판단한다.
[38]
본 발명의 실시예에 따른 반응 제어부(400)는 분석 결과에 따라 기구축된 시나리오 데이터베이스에 저장된 시나리오 중 적어도 어느 하나의 반응시나리오를 선택하고, 사용자 답변이 해당되는 주제에 따른 반응시나리오에 기초하여 반응 및 질문에 대한 출력 명령을 생성한다.
[39]
사용자의 답변에 맞춰 다음 대화로 이어지도록, 시나리오 기반으로 반응 및 질문을 추출하여 제공함으로써, 사용자는 이질감 없이 자신의 답변에 대응하는 인공지능 대화 장치와 자연스러운 대화를 수행하는 것이 가능하다.
[40]
반응 제어부(400)는 출력부(500)의 반응 음성 및 질문 음성 출력 중, 사용자로부터 새로운 음성 데이터가 수신된 경우, 출력부(500)로 일시 정지 명령 신호를 전송하고, 입력답변 분석부(300)의 새로운 음성 데이터에 따른 분석 결과에 따라 반응 및 질문을 재추출한다.
[41]
즉, 본 발명의 실시예에 따른 반응 제어부(400)에서 선택한 반응시나리오는 사용자의 답변 또는 사용자의 코멘트에 따라서 실시간으로 그 신뢰성이 판단되어 변형되고, 기구축된 시나리오 데이터베이스에 기초하여 반응시나리오가 적절히 수정된다.
[42]
예를 들어, 최초의 질문이 “회사 잘 다녀왔어요?”이고, 회사에서 있었던 일들에 대해서 사용자와 대화가 이루어지던 도중, 사용자의 답변이 “근데 이번 주말에 결혼식장에 가야 해”인 경우, 즉 주제를 변환하는 것에 해당되는 것으로 판단되면, 반응 제어부(400)는 시나리오를 변경(예: “친구분이 결혼하세요? 결혼 식장은 어디에요?”라는 해당 주제에 관한 최초 질문을 제공하며 결혼식 참석이라는 특정 이벤트에 대한 대화를 속행함)하여 대화를 진행한다.
[43]
본 발명의 실시예에 따른 출력부(500)는 반응 음성 및 질문 음성에 대응되는 텍스트를 화면을 통하여 출력한다. 이에 따라, 사용자는 출력부(500)로부터 음성을 제대로 수신하지 못하는 노이즈가 심한 환경에서도, 화면을 통하여 출력되는 텍스트로부터 반응 및 질문을 인지하고, 이에 대한 답변을 발화함으로써 대화를 지속하는 것이 가능하다.
[44]
도 2는 본 발명의 실시예에 따른 인공지능 대화 방법을 나타내는 순서도이다.
[45]
본 발명의 실시예에 따른 인공지능 대화 방법은 대화 시작 음성(무음을 포함함)을 출력하는 단계(S100)와, 사용자 답변을 입력 받는 단계(S200)와, 사용자 답변을 분석하고, 그 결과에 따라 기설정된 시나리오 중 적어도 어느 하나의 반응시나리오를 선택하고, 이에 기초하여 반응 및 질문을 추출하는 단계(S300) 및 추출된 반응 및 질문에 따라 반응 음성 및 질문 음성을 출력하는 단계(S400)를 포함한다.
[46]
본 발명의 실시예에 따른 S100 단계는 대화를 시작하는 대화 시작 질문에 해당하는 질문 음성 또는 무음을 출력하는 단계로서, 기구축된 시나리오 데이터베이스, 사용자의 개인정보, 사용자의 행동 패턴, 이전의 대화에 대한 기록 정보 중 적어도 어느 하나인 어플리케이션 실행 환경 정보에 따라 대화 시작 질문을 추출하고, 이를 출력한다.
[47]
즉, 사용자의 인적 사항, 날짜, 시간 등 환경 정보, 이전의 대화에 대한 기록 정보에 기초하여 사용자가 관심을 가질 만한 대화 주제에 해당하는 최초 질문을 추출하고, 이를 사용자에게 출력함으로써 대화의 시작을 능동적으로 수행한다.
[48]
또는, S100 단계에서 무음이 출력되는 경우에는, S200 단계에서 음성으로 입력된 사용자 답변에 대한 반응 및 질문 순서로 대화가 진행되도록 지원된다.
[49]
본 발명의 실시예에 따른 S200 단계는 음성으로 입력된 사용자 답변을 텍스트로 전환하여, 사용자 답변 분석을 위한 문장을 제공한다.
[50]
본 발명의 실시예에 따른 S300 단계는 사용자 답변이 기설정된 답변 유형 중 어느 유형에 해당되는지 판별하여 분석을 수행한다. 본 발명에 따르면 최초 질문, 사용자의 답변, 사용자의 답변에 대한 반응, 반응에 따른 질문 순(무음이 출력되는 경우에는 사용자의 음성 입력, 사용자 음성에 대한 반응, 반응에 따른 질문 순)으로 대화가 진행되므로, 사용자 답변이 기설정된 답변 유형(예: 선택형, 일반형, 반복을 원하는 답변, 관련 없는 답변)으로 구분된 유형 중 어느 유형에 해당하는지를 판별하여, 사용자 답변에 대한 반응 및 질문을 선택하기 위한 근거 자료로 활용한다.
[51]
본 발명의 실시예에 따른 S400 단계는 반응 음성 및 질문 음성에 대응되는 텍스트를 화면을 통해 출력함으로써, 청각 뿐 아니라 시각적으로 반응 텍스트 및 질문 텍스트를 사용자에게 제공함으로써, 사용자의 보다 정확한 인지를 지원한다.
[52]
본 발명의 실시예에 따른 S600 단계는 대화 종료 기준에 해당하는지 여부를 판별하는 단계로서, 사용자가 기설정된 작별 인사를 하는 것으로 확인된 경우, 일정 시간 이상 사용자의 답변이 없는 경우, 일정 시간 이상 사용자의 답변이 없고, 사용자를 호출하는 출력부의 음성에 대하여 사용자의 회신이 없는 경우 등 종료 기준에 해당하는 경우 대화는 종결되고, 대화 종료 기준에 해당하지 않는 경우에는 S200 단계로 돌아가 사용자 답변을 입력 받는 단계로부터 S200 내지 S500 단계가 반복 수행된다.
[53]
이제까지 본 발명의 실시예들을 중심으로 살펴보았다. 본 발명이 속하는 기술 분야에서 통상의 지식을 가진 자는 본 발명이 본 발명의 본질적인 특성에서 벗어나지 않는 범위에서 변형된 형태로 구현될 수 있음을 이해할 수 있을 것이다. 그러므로 개시된 실시예들은 한정적인 관점이 아니라 설명적인 관점에서 고려되어야 한다. 본 발명의 범위는 전술한 설명이 아니라 특허청구범위에 나타나 있으며, 그와 동등한 범위 내에 있는 모든 차이점은 본 발명에 포함된 것으로 해석되어야 할 것이다.

청구범위

[청구항 1]
입력된 사용자 답변을 분석하는 입력답변 분석부; 분석 결과에 따라 기설정된 시나리오 중 적어도 어느 하나의 반응시나리오를 선택하여, 상기 사용자 답변에 대한 반응 및 질문에 대한 출력 명령을 전송하는 반응 제어부; 및 무음 또는 대화 시작 음성을 출력하고, 상기 반응 제어부의 출력 명령에 따라 반응 음성 및 질문 음성을 출력하는 출력부 를 포함하는 인공지능 대화 장치.
[청구항 2]
제1항에 있어서, 상기 출력부는 어플리케이션 실행 환경정보에 기초하여 추출되며, 대화를 시작하는 질문음성인 대화 시작 음성을 출력하는 것 인 인공지능 대화 장치.
[청구항 3]
제2항에 있어서, 상기 출력부는 기구축된 시나리오 데이터베이스, 사용자의 개인 정보, 사용자의 행동 패턴, 이전의 대화에 대한 기록 정보 중 적어도 어느 하나인 상기 어플리케이션 실행 환경정보에 따라 상기 대화 시작 음성을 추출하는 것 인 인공지능 대화 장치.
[청구항 4]
제1항에 있어서, 상기 입력답변 분석부는 상기 대화 시작 음성 출력에 반응하여 입력된 상기 사용자의 음성 또는 상기 무음 출력 후 입력된 상기 사용자의 음성을 문자열로 전환한 결과를 입력 받고, 상기 사용자 답변이 기설정된 답변 유형 중 어느 유형에 해당되는지 여부를 판별하여 분석을 수행하는 것 인 인공지능 대화 장치.
[청구항 5]
제4항에 있어서, 상기 반응 제어부는 상기 분석 결과에 따라 기구축된 시나리오 데이터베이스에 저장된 시나리오 중 적어도 어느 하나의 반응시나리오를 선택하고, 상기 사용자 답변이 해당되는 주제에 따른 반응시나리오에 기초하여 반응 및 질문에 대한 출력 명령을 전송하는 것 인 인공지능 대화 장치.
[청구항 6]
제1항에 있어서, 상기 반응 제어부는 상기 출력부의 반응 음성 및 질문 음성 출력 중, 상기 사용자로부터 새로운 음성 데이터가 수신된 경우, 상기 출력부로 일시 정지 명령 신호를 전송하고, 상기 입력답변 분석부의 상기 새로운 음성 데이터에 따른 분석 결과에 따라 반응 및 질문을 재추출하는 것 인 인공지능 대화 장치.
[청구항 7]
제1항에 있어서, 상기 출력부는 반응 음성 및 질문 음성에 대응되는 텍스트를 화면을 통하여 출력하는 것 인 인공지능 대화 장치.
[청구항 8]
(a) 무음 또는 대화 시작 음성을 출력하는 단계; (b) 상기 무음 또는 대화 시작 음성 출력에 따른 사용자 답변을 입력받는 단계; (c) 상기 사용자 답변을 분석하고, 그 결과에 따라 기설정된 시나리오 중 적어도 어느 하나의 반응시나리오를 선택하고, 이에 기초하여 반응 및 질문을 추출하는 단계; 및 (d) 상기 추출된 반응 및 질문에 따라 반응 음성 및 질문 음성을 출력하는 단계 를 포함하는 인공지능 대화 방법.
[청구항 9]
제8항에 있어서, 상기 (a) 단계는 기구축된 시나리오 데이터베이스, 사용자의 개인정보, 사용자의 행동 패턴, 이전의 대화에 대한 기록 정보 중 적어도 어느 하나인 어플리케이션 실행 환경 정보에 따라 대화 시작 음성을 출력하는 것 인 인공지능 대화 방법.
[청구항 10]
제8항에 있어서, 상기 (b) 단계는 음성으로 입력된 상기 사용자 답변을 텍스트로 전환하는 것 인 인공지능 대화 방법.
[청구항 11]
제8항에 있어서, 상기 (c) 단계는 상기 사용자 답변이 기설정된 답변 유형 중 어느 유형에 해당되는지 판별하여 분석을 수행하는 것 인 인공지능 대화 방법.
[청구항 12]
제8항에 있어서, 상기 (d) 단계는 상기 반응 음성 및 질문 음성에 대응되는 텍스트를 화면을 통해 출력하는 것 인 인공지능 대화 방법.

도면

[도1]

[도2]