Traitement en cours

Veuillez attendre...

Paramétrages

Paramétrages

1. WO2012012074 - PROCÉDÉ ET APPAREIL POUR IDENTIFIER UN MATÉRIEL OU UN CONTENU DE PROGRAMME VIDÉO PAR LE BIAIS DE TRANSFORMATIONS NON LINÉAIRES

Numéro de publication WO/2012/012074
Date de publication 26.01.2012
N° de la demande internationale PCT/US2011/041478
Date du dépôt international 22.06.2011
CIB
G10L 15/20 2006.01
GPHYSIQUE
10INSTRUMENTS DE MUSIQUE; ACOUSTIQUE
LANALYSE OU SYNTHÈSE DE LA PAROLE; RECONNAISSANCE DE LA PAROLE; TRAITEMENT DE LA PAROLE OU DE LA VOIX; CODAGE OU DÉCODAGE DE LA PAROLE OU DE SIGNAUX AUDIO
15Reconnaissance de la parole
20Techniques de reconnaissance de la parole spécialement adaptées de par leur robustesse contre les perturbations environnantes, p.ex. en milieu bruyant ou reconnaissance de la parole émise dans une situation de stress
G10L 15/26 2006.01
GPHYSIQUE
10INSTRUMENTS DE MUSIQUE; ACOUSTIQUE
LANALYSE OU SYNTHÈSE DE LA PAROLE; RECONNAISSANCE DE LA PAROLE; TRAITEMENT DE LA PAROLE OU DE LA VOIX; CODAGE OU DÉCODAGE DE LA PAROLE OU DE SIGNAUX AUDIO
15Reconnaissance de la parole
26Systèmes de synthèse de texte à partir de la parole
G06F 17/30 2006.01
GPHYSIQUE
06CALCUL; COMPTAGE
FTRAITEMENT ÉLECTRIQUE DE DONNÉES NUMÉRIQUES
17Équipement ou méthodes de traitement de données ou de calcul numérique, spécialement adaptés à des fonctions spécifiques
30Recherche documentaire; Structures de bases de données à cet effet
CPC
G06F 16/70
GPHYSICS
06COMPUTING; CALCULATING; COUNTING
FELECTRIC DIGITAL DATA PROCESSING
16Information retrieval; Database structures therefor; File system structures therefor
70of video data
G10L 15/20
GPHYSICS
10MUSICAL INSTRUMENTS; ACOUSTICS
LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
15Speech recognition
20Speech recognition techniques specially adapted for robustness in adverse environments, e.g. in noise, of stress induced speech
G10L 15/26
GPHYSICS
10MUSICAL INSTRUMENTS; ACOUSTICS
LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
15Speech recognition
26Speech to text systems
Déposants
  • ROVI TECHNOLOGIES CORPORATION [US/US]; 2830 De La Cruz Boulevard Santa Clara, CA 95050, US (AllExceptUS)
  • QUAN, Ronald [US/US]; US (UsOnly)
Inventeurs
  • QUAN, Ronald; US
Mandataires
  • ALMEIDA, George, B.; Rovi Corporation Patent Department 2830 De La Cruz Boulevard Santa Clara, CA 95050, US
Données relatives à la priorité
12/827,98830.06.2010US
Langue de publication anglais (EN)
Langue de dépôt anglais (EN)
États désignés
Titre
(EN) METHOD AND APPARATUS FOR IDENTIFYING VIDEO PROGRAM MATERIAL OR CONTENT VIA NONLINEAR TRANSFORMATIONS
(FR) PROCÉDÉ ET APPAREIL POUR IDENTIFIER UN MATÉRIEL OU UN CONTENU DE PROGRAMME VIDÉO PAR LE BIAIS DE TRANSFORMATIONS NON LINÉAIRES
Abrégé
(EN)
A system for identification of video content in a video signal is provided via a sound track audio signal. The audio signal is processed with filtering and non linear transformations to extract voice signals from the sound track channel. The extracted voice signals are coupled to a speech recognition system to provide in text form, the words of the video content, which is later compared with a reference library of words or dialog from known video programs or movies. Other attributes of the video signal or transport stream may be combined with closed caption data or closed caption text for identification purposes. Example attributes include DVS/SAP information, time code information, histograms, and or rendered video or pictures.
(FR)
L'invention concerne un système d'identification de contenu vidéo dans un signal vidéo par le biais d'un signal audio de piste sonore. Le signal audio est traité par filtrage et transformations non linéaires pour extraire des signaux vocaux du canal de piste sonore. Les signaux vocaux extraits sont acheminés à un système de reconnaissance vocal afin de délivrer, sous forme de texte, les mots du contenu vidéo qui sont ensuite comparés à une bibliothèque de mots de référence ou le dialogue de programmes vidéo ou de films connus. D'autres attributs du signal vidéo ou du flux de transport peuvent être combinés avec des données de sous-titre fermé ou un texte de sous-titre fermé à des fins d'identification. Des exemples d'attributs sont des informations DVS/SAP, des informations de code de temps, des histogrammes et/ou des vidéos ou images restituées.
Dernières données bibliographiques dont dispose le Bureau international