Traitement en cours

Veuillez attendre...

Paramétrages

Paramétrages

Goto Application

1. WO2020068401 - CODAGE/DÉCODAGE DE TATOUAGE AUDIO

Numéro de publication WO/2020/068401
Date de publication 02.04.2020
N° de la demande internationale PCT/US2019/050161
Date du dépôt international 09.09.2019
CIB
G10L 19/018 2013.01
GPHYSIQUE
10INSTRUMENTS DE MUSIQUE; ACOUSTIQUE
LANALYSE OU SYNTHÈSE DE LA PAROLE; RECONNAISSANCE DE LA PAROLE; TRAITEMENT DE LA PAROLE OU DE LA VOIX; CODAGE OU DÉCODAGE DE LA PAROLE OU DE SIGNAUX AUDIO
19Techniques d'analyse ou de synthèse de la parole ou des signaux audio pour la réduction de la redondance, p.ex. dans les vocodeurs; Codage ou décodage de la parole ou des signaux audio utilisant les modèles source-filtre ou l’analyse psychoacoustique
018Mise en place d’un filigrane audio, c. à d. insertion de données inaudibles dans le signal audio
G06F 3/16 2006.01
GPHYSIQUE
06CALCUL; COMPTAGE
FTRAITEMENT ÉLECTRIQUE DE DONNÉES NUMÉRIQUES
3Dispositions d'entrée pour le transfert de données à traiter pour leur donner une forme utilisable par le calculateur; Dispositions de sortie pour le transfert de données de l'unité de traitement à l'unité de sortie, p.ex. dispositions d'interface
16Entrée acoustique; Sortie acoustique
G10L 15/22 2006.01
GPHYSIQUE
10INSTRUMENTS DE MUSIQUE; ACOUSTIQUE
LANALYSE OU SYNTHÈSE DE LA PAROLE; RECONNAISSANCE DE LA PAROLE; TRAITEMENT DE LA PAROLE OU DE LA VOIX; CODAGE OU DÉCODAGE DE LA PAROLE OU DE SIGNAUX AUDIO
15Reconnaissance de la parole
22Procédures utilisées pendant le processus de reconnaissance de la parole, p.ex. dialogue homme-machine 
CPC
G06F 3/167
GPHYSICS
06COMPUTING; CALCULATING; COUNTING
FELECTRIC DIGITAL DATA PROCESSING
3Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
16Sound input; Sound output
167Audio in a user interface, e.g. using voice commands for navigating, audio feedback
G10L 19/018
GPHYSICS
10MUSICAL INSTRUMENTS; ACOUSTICS
LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
19Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
018Audio watermarking, i.e. embedding inaudible data in the audio signal
G10L 2015/223
GPHYSICS
10MUSICAL INSTRUMENTS; ACOUSTICS
LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
15Speech recognition
22Procedures used during a speech recognition process, e.g. man-machine dialogue
223Execution procedure of a spoken command
Déposants
  • AMAZON TECHNOLOGIES, INC. [US]/[US]
Inventeurs
  • TAI, Yuan-Yen
  • MANSOUR, Mohamed
  • SHAH, Parind
Mandataires
  • BARZILAY, Ilan N.
Données relatives à la priorité
16/141,48925.09.2018US
16/141,57825.09.2018US
Langue de publication anglais (EN)
Langue de dépôt anglais (EN)
États désignés
Titre
(EN) AUDIO WATERMARK ENCODING/DECODING
(FR) CODAGE/DÉCODAGE DE TATOUAGE AUDIO
Abrégé
(EN)
A system may embed audio watermarks in audio data using an Eigenvector matrix. The system may detect audio watermarks in audio data despite the effects of reverberation. For example, the system may embed multiple repetitions of an audio watermark before generating output audio using loudspeaker(s). To detect the audio watermark in audio data generated by a microphone, the system may perform a self-correlation that indicates where the audio watermark is repeated. In some examples, the system may encode the audio watermark using multiple repetitions of a multi-segment Eigenvector. Additionally or alternatively, the system may encode the audio watermark using a binary sequence of positive and negative values, which may be used as a shared key for encoding/decoding the audio watermark. The audio watermark can be embedded in output audio data to enable wakeword suppression (e.g., avoid cross-talk between devices) and/or local signal transmission between devices in proximity to each other.
(FR)
L'invention concerne un système qui peut incorporer des tatouages audio dans des données audio à l'aide d'une matrice de vecteur propre. Le système peut détecter des tatouages audio dans des données audio malgré les effets de réverbération. Par exemple, le système peut incorporer de multiples répétitions d'un tatouage audio avant de générer un contenu audio de sortie à l'aide d'un ou plusieurs haut-parleurs. Pour détecter le tatouage audio dans des données audio générées par un microphone, le système peut effectuer une auto-corrélation qui indique où le tatouage audio est répété. Selon certains exemples, le système peut coder le tatouage audio à l'aide de multiples répétitions d'un vecteur propre à segments multiples. En outre ou en variante, le système peut coder le tatouage audio à l'aide d'une séquence binaire de valeurs positives et négatives, qui peut être utilisée en tant que clé partagée pour coder/décoder le tatouage audio. Le tatouage audio peut être intégré dans des données audio de sortie pour permettre une suppression de mot de veille (par exemple, éviter une diaphonie entre des dispositifs) et/ou une transmission de signal local entre des dispositifs à proximité l'un de l'autre.
Dernières données bibliographiques dont dispose le Bureau international