Processing

Please wait...

Settings

Settings

Goto Application

1. WO2021042584 - FULL DUPLEX VOICE CHATTING METHOD

Publication Number WO/2021/042584
Publication Date 11.03.2021
International Application No. PCT/CN2019/120609
International Filing Date 25.11.2019
IPC
G10L 15/30 2013.01
GPHYSICS
10MUSICAL INSTRUMENTS; ACOUSTICS
LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
15Speech recognition
28Constructional details of speech recognition systems
30Distributed recognition, e.g. in client-server systems, for mobile phones or network applications
G10L 15/22 2006.01
GPHYSICS
10MUSICAL INSTRUMENTS; ACOUSTICS
LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
15Speech recognition
22Procedures used during a speech recognition process, e.g. man-machine dialog
CPC
G10L 15/22
GPHYSICS
10MUSICAL INSTRUMENTS; ACOUSTICS
LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
15Speech recognition
22Procedures used during a speech recognition process, e.g. man-machine dialogue
G10L 15/30
GPHYSICS
10MUSICAL INSTRUMENTS; ACOUSTICS
LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
15Speech recognition
28Constructional details of speech recognition systems
30Distributed recognition, e.g. in client-server systems, for mobile phones or network applications
G10L 25/87
GPHYSICS
10MUSICAL INSTRUMENTS; ACOUSTICS
LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
25Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
78Detection of presence or absence of voice signals
87Detection of discrete points within a voice signal
Applicants
  • 苏州思必驰信息科技有限公司 AI SPEECH CO., LTD. [CN]/[CN]
Inventors
  • 邓建凯 DENG, Jiankai
  • 甘津瑞 GAN, Jinrui
Agents
  • 北京商专永信知识产权代理事务所(普通合伙) INTELIGHT IP LAW FIRM
Priority Data
201910831253.604.09.2019CN
Publication Language Chinese (ZH)
Filing Language Chinese (ZH)
Designated States
Title
(EN) FULL DUPLEX VOICE CHATTING METHOD
(FR) PROCÉDÉ DE CONVERSATION VOCALE EN LIGNE EN DUPLEX INTÉGRAL
(ZH) 全双工语音对话方法
Abstract
(EN)
A full duplex voice chatting method, which is used for a voice chatting terminal; the method comprises: after a voice chatting terminal is awakened, starting recording and uploading audio to a cloud server for the cloud server to determine response content as well as a first duration of audio analyzed in order to determine the response content (S11); the voice chatting terminal receiving the response content and the first duration sent by the cloud server (S12); the voice chatting terminal determining whether the first duration and a second duration are the same, the second duration being the duration of audio uploaded by the voice chatting terminal from the moment the voice chatting terminal is awakened until a current moment (S13); and when the first duration and the second duration are the same, the voice chatting terminal presenting the response content to a user (S14). In the described method, not only is response content determined by a cloud server acquired, but the duration of audio analyzed in order to determine the response content is also acquired, and the response content is only presented to a user in the situation in which the first duration and the second duration are determined to be the same, thus ensuring that the correct response content is provided.
(FR)
La présente invention concerne un procédé de conversation vocale en ligne en duplex intégral qui est utilisé pour un terminal de conversation vocale en ligne ; le procédé comprend les étapes suivantes consistant : à commencer, une fois qu'un terminal de conversation vocale en ligne est réveillé, l'enregistrement et le téléchargement de contenus audio vers un serveur en nuage pour que le serveur en nuage détermine un contenu de réponse ainsi qu'une première durée de contenus audio analysés afin de déterminer le contenu de la réponse (S11) ; à recevoir, par le terminal de conversation vocale en ligne, le contenu de la réponse et la première durée envoyée par le serveur en nuage (S12) ; à déterminer, par le terminal de conversation vocale en ligne, si la première durée et une seconde durée sont les mêmes, la seconde durée correspondant à la durée de contenus audio téléchargés par le terminal de conversation vocale en ligne à partir du moment où le terminal de conversation vocale en ligne est réveillé jusqu'à un moment actuel (S13) ; et à présenter, par le terminal de conversation vocale en ligne, le contenu de la réponse à un utilisateur lorsque la première durée et la seconde durée sont les mêmes (S14). Dans le procédé décrit, non seulement le contenu de la réponse est déterminé par un serveur en nuage acquis, mais la durée des contenus analysés pour déterminer le contenu de la réponse est acquise. En outre, le contenu de la réponse n'est présenté à un utilisateur que lorsqu'il est déterminé que la première durée et la seconde durée sont identiques, ce qui garantit que le contenu de la réponse correct est fourni.
(ZH)
一种全双工语音对话方法,用于语音对话终端,该方法包括:当语音对话终端被唤醒之后,开始录制并上传音频至云端服务器,用于云端服务器确定答复内容以及为确定答复内容所分析的音频的第一时长(S11);语音对话终端接收云端服务器发送的答复内容和第一时长(S12);语音对话终端判断第一时长与第二时长是否一致,第二时长为语音对话终端从被唤醒时刻起至当前时刻所上传音频的时长(S13);当第一时长与第二时长一致时,语音对话终端将答复内容呈现给用户(S14)。不仅获取了云端服务器所确定的答复内容,而且还获取了为确定答复内容所分析的音频的时长,并且在确定第一时长和第二时长一致的情况下才将答复内容呈现给用户,确保了提供正确的答复内容。
Also published as
Latest bibliographic data on file with the International Bureau