Traitement en cours

Veuillez attendre...

Paramétrages

Paramétrages

1. WO2012003125 - PROCÉDÉ ET APPAREIL D'IDENTIFICATION DE MATÉRIAU OU DE CONTENU DE PROGRAMME VIDÉO PAR TECHNIQUES DE TRANSPOSITION OU DE MODULATION EN FRÉQUENCE

Numéro de publication WO/2012/003125
Date de publication 05.01.2012
N° de la demande internationale PCT/US2011/041438
Date du dépôt international 22.06.2011
CIB
G10L 15/20 2006.01
GPHYSIQUE
10INSTRUMENTS DE MUSIQUE; ACOUSTIQUE
LANALYSE OU SYNTHÈSE DE LA PAROLE; RECONNAISSANCE DE LA PAROLE; TRAITEMENT DE LA PAROLE OU DE LA VOIX; CODAGE OU DÉCODAGE DE LA PAROLE OU DE SIGNAUX AUDIO
15Reconnaissance de la parole
20Techniques de reconnaissance de la parole spécialement adaptées de par leur robustesse contre les perturbations environnantes, p.ex. en milieu bruyant ou reconnaissance de la parole émise dans une situation de stress
G10L 15/26 2006.01
GPHYSIQUE
10INSTRUMENTS DE MUSIQUE; ACOUSTIQUE
LANALYSE OU SYNTHÈSE DE LA PAROLE; RECONNAISSANCE DE LA PAROLE; TRAITEMENT DE LA PAROLE OU DE LA VOIX; CODAGE OU DÉCODAGE DE LA PAROLE OU DE SIGNAUX AUDIO
15Reconnaissance de la parole
26Systèmes de synthèse de texte à partir de la parole
H04H 60/58 2008.01
HÉLECTRICITÉ
04TECHNIQUE DE LA COMMUNICATION ÉLECTRIQUE
HRADIODIFFUSION
60Dispositions pour des applications de radiodiffusion en liaison directe avec les informations radiodiffusées ou le créneau spatio-temporel de radiodiffusion; Systèmes relatifs à la radiodiffusion
56Dispositions caractérisées par des composants spécialement adaptés à la surveillance, l'identification ou la reconnaissance, couverts par les groupes H04H60/29 ou H04H60/35210
58audio
G06F 17/30 2006.01
GPHYSIQUE
06CALCUL; COMPTAGE
FTRAITEMENT ÉLECTRIQUE DE DONNÉES NUMÉRIQUES
17Équipement ou méthodes de traitement de données ou de calcul numérique, spécialement adaptés à des fonctions spécifiques
30Recherche documentaire; Structures de bases de données à cet effet
CPC
G06F 16/7834
GPHYSICS
06COMPUTING; CALCULATING; COUNTING
FELECTRIC DIGITAL DATA PROCESSING
16Information retrieval; Database structures therefor; File system structures therefor
70of video data
78Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
783using metadata automatically derived from the content
7834using audio features
G06F 16/7844
GPHYSICS
06COMPUTING; CALCULATING; COUNTING
FELECTRIC DIGITAL DATA PROCESSING
16Information retrieval; Database structures therefor; File system structures therefor
70of video data
78Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
783using metadata automatically derived from the content
7844using original textual content or text extracted from visual content or transcript of audio data
G10L 15/20
GPHYSICS
10MUSICAL INSTRUMENTS; ACOUSTICS
LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
15Speech recognition
20Speech recognition techniques specially adapted for robustness in adverse environments, e.g. in noise, of stress induced speech
G10L 15/26
GPHYSICS
10MUSICAL INSTRUMENTS; ACOUSTICS
LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
15Speech recognition
26Speech to text systems
H04H 60/37
HELECTRICITY
04ELECTRIC COMMUNICATION TECHNIQUE
HBROADCAST COMMUNICATION
60Arrangements for broadcast applications with a direct linking to broadcast information or broadcast space-time; Broadcast-related systems
35Arrangements for identifying or recognising characteristics with a direct linkage to broadcast information or to broadcast space-time, e.g. for identifying broadcast stations or for identifying users
37for identifying segments of broadcast information, e.g. scenes or extracting programme ID
H04H 60/58
HELECTRICITY
04ELECTRIC COMMUNICATION TECHNIQUE
HBROADCAST COMMUNICATION
60Arrangements for broadcast applications with a direct linking to broadcast information or broadcast space-time; Broadcast-related systems
56Arrangements characterised by components specially adapted for monitoring, identification or recognition covered by groups H04H60/29-H04H60/54
58of audio
Déposants
  • ROVI TECHNOLOGIES CORPORATION [US/US]; 2830 De La Cruz Boulevard Santa Clara, CA 95050, US (AllExceptUS)
  • QUAN, Ronald [US/US]; US (UsOnly)
Inventeurs
  • QUAN, Ronald; US
Mandataires
  • ALMEIDA, George, B.; Patent Department Rovi Corporation 2830 De La Cruz Boulevard Santa Clara, CA 95050, US
Données relatives à la priorité
12/827,86330.06.2010US
Langue de publication anglais (EN)
Langue de dépôt anglais (EN)
États désignés
Titre
(EN) METHOD AND APPARATUS FOR IDENTIFYING VIDEO PROGRAM MATERIAL OR CONTENT VIA FREQUENCY TRANSLATION OR MODULATION SCHEMES
(FR) PROCÉDÉ ET APPAREIL D'IDENTIFICATION DE MATÉRIAU OU DE CONTENU DE PROGRAMME VIDÉO PAR TECHNIQUES DE TRANSPOSITION OU DE MODULATION EN FRÉQUENCE
Abrégé
(EN)
A system for identification of video content in a video signal is provided via a sound track audio signal. The audio signal is processed with filtering, frequency translation, and or non linear transformations to extract voice signals from the sound track channel. The extracted voice signals are coupled to a speech recognition system to provide in text form, the words of the video content, which is later compared with a reference library of words or dialog from known video programs or movies. Other attributes of the video signal or transport stream may be combined with closed caption data or closed caption text for identification purposes. Example attributes include DVS/SAP information, time code information, histograms, and or rendered video or pictures.
(FR)
L'invention porte sur un système d'identification de contenu vidéo dans un signal vidéo par l'intermédiaire d'un signal audio de bande son. Le signal audio est traité par filtrage, transposition en fréquence et/ou transformations non linéaires afin d'extraire des signaux vocaux du canal de bande son. Les signaux vocaux extraits sont couplés à un système de reconnaissance vocale afin de fournir, sous forme de texte, les mots du contenu vidéo qui sont ensuite comparés à une bibliothèque de référence de mots ou de dialogues issus de programmes vidéo ou de films connus. D'autres attributs du signal vidéo ou d'un flux de transport peuvent être combinés à des données de sous-titres ou du texte de sous-titres dans un but d'identification. Des exemples d'attributs comprennent des informations DVS/SAP, des informations de code temporel, des histogrammes et/ou des images vidéo ou fixes rendues.
Dernières données bibliographiques dont dispose le Bureau international