Processing

Please wait...

Settings

Settings

Goto Application

1. WO2021029642 - SYSTEM AND METHOD FOR RECOGNIZING USER'S SPEECH

Publication Number WO/2021/029642
Publication Date 18.02.2021
International Application No. PCT/KR2020/010565
International Filing Date 10.08.2020
IPC
G10L 15/26 2006.01
GPHYSICS
10MUSICAL INSTRUMENTS; ACOUSTICS
LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
15Speech recognition
26Speech to text systems
G10L 15/30 2013.01
GPHYSICS
10MUSICAL INSTRUMENTS; ACOUSTICS
LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
15Speech recognition
28Constructional details of speech recognition systems
30Distributed recognition, e.g. in client-server systems, for mobile phones or network applications
G10L 19/008 2013.01
GPHYSICS
10MUSICAL INSTRUMENTS; ACOUSTICS
LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
19Speech or audio signal analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
008Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
G10L 15/183 2013.01
GPHYSICS
10MUSICAL INSTRUMENTS; ACOUSTICS
LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
15Speech recognition
08Speech classification or search
18using natural language modelling
183using context dependencies, e.g. language models
Applicants
  • SAMSUNG ELECTRONICS CO., LTD. [KR]/[KR]
Inventors
  • KIM, Chanwoo
  • GOWDA, Dhananjaya N.
  • KIM, Kwangyoun
  • LEE, Kyungmin
Agents
  • Y.P.LEE, MOCK & PARTNERS
Priority Data
10-2019-014617714.11.2019KR
62/886,02713.08.2019US
Publication Language English (EN)
Filing Language English (EN)
Designated States
Title
(EN) SYSTEM AND METHOD FOR RECOGNIZING USER'S SPEECH
(FR) SYSTÈME ET PROCÉDÉ POUR RECONNAÎTRE LA VOIX D'UN UTILISATEUR
Abstract
(EN)
Provided is a system and method for recognizing a user's speech. A method, performed by a server, of providing a text string for a speech signal input to a device includes: receiving, from the device, an encoder output value derived from an encoder of an end-to-end automatic speech recognition (ASR) model included in the device; identifying a domain corresponding to the received encoder output value; selecting a decoder corresponding to the identified domain from among a plurality of decoders of an end-to-end ASR model included in the server; obtaining a text string from the received encoder output value using the selected decoder; and providing the obtained text string to the device.
(FR)
L'invention concerne un système et un procédé permettant de reconnaître la voix d'un utilisateur. L'invention concerne un procédé exécuté par un serveur permettant de fournir une chaîne de texte pour une entrée de signal vocal à un dispositif, ledit procédé consistant à : recevoir, du dispositif, une valeur de sortie de codeur dérivée d'un codeur d'un modèle de reconnaissance vocale automatique de bout en bout (ASR) inclus dans le dispositif ; identifier un domaine correspondant à la valeur de sortie de codeur reçue ; sélectionner un décodeur correspondant au domaine identifié parmi une pluralité de décodeurs d'un modèle ASR de bout en bout inclus dans le serveur ; obtenir une chaîne de texte à partir de la valeur de sortie de codeur reçue en utilisant le décodeur sélectionné ; et fournir la chaîne de texte obtenue au dispositif.
Latest bibliographic data on file with the International Bureau