Traitement en cours

Veuillez attendre...

Paramétrages

Paramétrages

Aller à Demande

1. WO2019184942 - PROCÉDÉ ET SYSTÈME D'ÉCHANGE AUDIO UTILISANT LA SÉMANTIQUE LINGUISTIQUE, ET GRAPHIQUE DE CODAGE

Numéro de publication WO/2019/184942
Date de publication 03.10.2019
N° de la demande internationale PCT/CN2019/079834
Date du dépôt international 27.03.2019
CIB
G10L 15/00 2013.01
GPHYSIQUE
10INSTRUMENTS DE MUSIQUE; ACOUSTIQUE
LANALYSE OU SYNTHÈSE DE LA PAROLE; RECONNAISSANCE DE LA PAROLE; TRAITEMENT DE LA PAROLE OU DE LA VOIX; CODAGE OU DÉCODAGE DE LA PAROLE OU DE SIGNAUX AUDIO
15Reconnaissance de la parole
G10L 15/02 2006.01
GPHYSIQUE
10INSTRUMENTS DE MUSIQUE; ACOUSTIQUE
LANALYSE OU SYNTHÈSE DE LA PAROLE; RECONNAISSANCE DE LA PAROLE; TRAITEMENT DE LA PAROLE OU DE LA VOIX; CODAGE OU DÉCODAGE DE LA PAROLE OU DE SIGNAUX AUDIO
15Reconnaissance de la parole
02Extraction de caractéristiques pour la reconnaissance de la parole; Sélection d'unités de reconnaissance 
G10L 15/04 2013.01
GPHYSIQUE
10INSTRUMENTS DE MUSIQUE; ACOUSTIQUE
LANALYSE OU SYNTHÈSE DE LA PAROLE; RECONNAISSANCE DE LA PAROLE; TRAITEMENT DE LA PAROLE OU DE LA VOIX; CODAGE OU DÉCODAGE DE LA PAROLE OU DE SIGNAUX AUDIO
15Reconnaissance de la parole
04Segmentation; Détection des limites de mots
G10L 15/18 2013.01
GPHYSIQUE
10INSTRUMENTS DE MUSIQUE; ACOUSTIQUE
LANALYSE OU SYNTHÈSE DE LA PAROLE; RECONNAISSANCE DE LA PAROLE; TRAITEMENT DE LA PAROLE OU DE LA VOIX; CODAGE OU DÉCODAGE DE LA PAROLE OU DE SIGNAUX AUDIO
15Reconnaissance de la parole
08Classement ou recherche de la parole
18utilisant une modélisation du langage naturel
G06F 17/27 2006.01
GPHYSIQUE
06CALCUL; COMPTAGE
FTRAITEMENT ÉLECTRIQUE DE DONNÉES NUMÉRIQUES
17Équipement ou méthodes de traitement de données ou de calcul numérique, spécialement adaptés à des fonctions spécifiques
20Manipulation de données en langage naturel
27Analyse automatique, p.ex. analyse grammaticale, correction orthographique
CPC
G06F 40/30
GPHYSICS
06COMPUTING; CALCULATING; COUNTING
FELECTRIC DIGITAL DATA PROCESSING
40Handling natural language data
30Semantic analysis
G06F 40/40
GPHYSICS
06COMPUTING; CALCULATING; COUNTING
FELECTRIC DIGITAL DATA PROCESSING
40Handling natural language data
40Processing or translation of natural language
G10L 15/005
GPHYSICS
10MUSICAL INSTRUMENTS; ACOUSTICS
LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
15Speech recognition
005Language recognition
G10L 15/02
GPHYSICS
10MUSICAL INSTRUMENTS; ACOUSTICS
LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
15Speech recognition
02Feature extraction for speech recognition; Selection of recognition unit
G10L 15/04
GPHYSICS
10MUSICAL INSTRUMENTS; ACOUSTICS
LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
15Speech recognition
04Segmentation; Word boundary detection
G10L 15/1822
GPHYSICS
10MUSICAL INSTRUMENTS; ACOUSTICS
LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
15Speech recognition
08Speech classification or search
18using natural language modelling
1822Parsing for meaning understanding
Déposants
  • 孔繁泽 KONG, Fanze [CN]/[CN]
Inventeurs
  • 孔繁泽 KONG, Fanze
Mandataires
  • 北京布瑞知识产权代理有限公司 BEIJING BRIGHT IP AGENCY CO., LTD.
Données relatives à la priorité
201810264460.328.03.2018CN
Langue de publication chinois (ZH)
Langue de dépôt chinois (ZH)
États désignés
Titre
(EN) AUDIO EXCHANGING METHOD AND SYSTEM EMPLOYING LINGUISTIC SEMANTICS, AND CODING GRAPH
(FR) PROCÉDÉ ET SYSTÈME D'ÉCHANGE AUDIO UTILISANT LA SÉMANTIQUE LINGUISTIQUE, ET GRAPHIQUE DE CODAGE
(ZH) 语言语义的音频交换方法和音频交换系统、编码图形
Abrégé
(EN)
An audio exchanging method and system employing linguistic semantics, and an audio coding graph, used to resolve the technical issue of the prior art in which complex semantics causes data response errors and poor real-time performance when translating different languages. The method comprises: using a minimum phoneme sequence to form a voice mapping structure for each language; and performing, on the basis of the voice mapping structures, semantic conversion between languages. A minimum phoneme that forms a minimum short segment of audio in a linguistic utterance is used as a basic data exchange unit for semantic conversion between languages, and the minimum phoneme is used as a coding basis for data exchange, thereby changing the basic structure of voice recognition, reducing complexity and improving accuracy when coding audio content of a language, and eliminating, in a language audio coding process, a complex audio feature formed by coupling with composite information such as a tone, a scale, and a sound domain in a language segment, and maintaining a voice recognition rate. A mapping structure of voice coding and text coding formed on the basis of a minimum phoneme improves the efficiency of data exchange during language translation.
(FR)
La présente invention concerne un procédé et un système d'échange audio utilisant la sémantique linguistique, et un graphique de codage audio, utilisés pour résoudre le problème technique de l'état antérieur de la technique selon lequel la sémantique complexe entraîne des erreurs de réponse de données et des performances en temps réel médiocres lors de la traduction de différentes langues. Le procédé consiste à : utiliser une séquence de phonèmes minimaux pour former une structure de mappage de voix pour chaque langue ; et effectuer, sur la base des structures de mappage de voix, une conversion sémantique entre des langues. Un phonème minimal qui forme un segment court minimal d'audio dans un énoncé linguistique est utilisé comme unité d'échange de données de base pour une conversion sémantique entre des langues, et le phonème minimal est utilisé comme base de codage pour un échange de données, permettant ainsi de changer la structure de base de la reconnaissance vocale, de réduire la complexité et d'améliorer la précision lors du codage d'un contenu audio d'une langue, et d'éliminer, dans un processus de codage audio de langue, une caractéristique audio complexe formée par couplage avec des informations composites, telles qu'une tonalité, une échelle et un domaine sonore dans un segment de langue, et de maintenir un taux de reconnaissance vocale. Une structure de mappage de codage de voix et de codage de texte formée sur la base d'un phonème minimal améliore l'efficacité d'échange de données pendant la traduction de langue.
(ZH)
一种语言语义的音频交换方法、系统和音频编码图形,以解决现有技术中语言互译时因语义复杂导致数据响应出现差错和实时性差的技术问题。方法包括利用最小音素序列形成各语言的语音映射结构,通过各语音映射结构完成语义的语言间转换。利用语言构成中形成音频最小短段的最小音素作为各语言间语义转换的基本数据交换单元,利用最小音素作为数据交换的编码基础,改变了语音识别的基础结构,优化了语言中音频内容的编码复杂性和准确率,使得语言音频的编码过程中避免被耦合了语言片段中音调、音阶、音域等复合信息形成的复杂音频特征,保证了语音识别率。利用最小音素形成的语音编码与文字编码的映射结构使得语言翻译时的数据交换效率得到提高。
Également publié en tant que
Dernières données bibliographiques dont dispose le Bureau international