Certains contenus de cette application ne sont pas disponibles pour le moment.
Si cette situation persiste, veuillez nous contacter àObservations et contact
1. (WO2019008580) PROCÉDÉ ET SYSTÈME POUR AMÉLIORER UN SIGNAL VOCAL D'UN LOCUTEUR HUMAIN DANS UNE VIDÉO À L'AIDE D'INFORMATIONS VISUELLES
Dernières données bibliographiques dont dispose le Bureau international    Formuler une observation

N° de publication : WO/2019/008580 N° de la demande internationale : PCT/IL2018/050722
Date de publication : 10.01.2019 Date de dépôt international : 03.07.2018
CIB :
G10L 21/0216 (2013.01) ,G10L 21/0272 (2013.01) ,G06K 9/00 (2006.01) ,G06K 9/62 (2006.01) ,G10L 25/57 (2013.01) ,G10L 21/0232 (2013.01)
G PHYSIQUE
10
INSTRUMENTS DE MUSIQUE; ACOUSTIQUE
L
ANALYSE OU SYNTHÈSE DE LA PAROLE; RECONNAISSANCE DE LA PAROLE; TRAITEMENT DE LA PAROLE OU DE LA VOIX; CODAGE OU DÉCODAGE DE LA PAROLE OU DE SIGNAUX AUDIO
21
Traitement du signal de parole ou de voix pour produire un autre signal audible ou non audible, p.ex. visuel ou tactile, afin de modifier sa qualité ou son intelligibilité
02
Amélioration de l'intelligibilité de la parole, p.ex. réduction de bruit ou annulation d'écho
0208
Filtration du bruit
0216
caractérisée par le procédé d’estimation du bruit
G PHYSIQUE
10
INSTRUMENTS DE MUSIQUE; ACOUSTIQUE
L
ANALYSE OU SYNTHÈSE DE LA PAROLE; RECONNAISSANCE DE LA PAROLE; TRAITEMENT DE LA PAROLE OU DE LA VOIX; CODAGE OU DÉCODAGE DE LA PAROLE OU DE SIGNAUX AUDIO
21
Traitement du signal de parole ou de voix pour produire un autre signal audible ou non audible, p.ex. visuel ou tactile, afin de modifier sa qualité ou son intelligibilité
02
Amélioration de l'intelligibilité de la parole, p.ex. réduction de bruit ou annulation d'écho
0272
Séparation du signal de voix
G PHYSIQUE
06
CALCUL; COMPTAGE
K
RECONNAISSANCE DES DONNÉES; PRÉSENTATION DES DONNÉES; SUPPORTS D'ENREGISTREMENT; MANIPULATION DES SUPPORTS D'ENREGISTREMENT
9
Méthodes ou dispositions pour la lecture ou la reconnaissance de caractères imprimés ou écrits ou pour la reconnaissance de formes, p.ex. d'empreintes digitales
G PHYSIQUE
06
CALCUL; COMPTAGE
K
RECONNAISSANCE DES DONNÉES; PRÉSENTATION DES DONNÉES; SUPPORTS D'ENREGISTREMENT; MANIPULATION DES SUPPORTS D'ENREGISTREMENT
9
Méthodes ou dispositions pour la lecture ou la reconnaissance de caractères imprimés ou écrits ou pour la reconnaissance de formes, p.ex. d'empreintes digitales
62
Méthodes ou dispositions pour la reconnaissance utilisant des moyens électroniques
G PHYSIQUE
10
INSTRUMENTS DE MUSIQUE; ACOUSTIQUE
L
ANALYSE OU SYNTHÈSE DE LA PAROLE; RECONNAISSANCE DE LA PAROLE; TRAITEMENT DE LA PAROLE OU DE LA VOIX; CODAGE OU DÉCODAGE DE LA PAROLE OU DE SIGNAUX AUDIO
25
Techniques d'analyses de la voix ou de la parole qui ne se limitent pas à un seul des groupes G10L15/-G10L21/151
48
spécialement adaptées pour un usage particulier
51
pour comparaison ou différentiation
57
pour le traitement des signaux vidéo
G PHYSIQUE
10
INSTRUMENTS DE MUSIQUE; ACOUSTIQUE
L
ANALYSE OU SYNTHÈSE DE LA PAROLE; RECONNAISSANCE DE LA PAROLE; TRAITEMENT DE LA PAROLE OU DE LA VOIX; CODAGE OU DÉCODAGE DE LA PAROLE OU DE SIGNAUX AUDIO
21
Traitement du signal de parole ou de voix pour produire un autre signal audible ou non audible, p.ex. visuel ou tactile, afin de modifier sa qualité ou son intelligibilité
02
Amélioration de l'intelligibilité de la parole, p.ex. réduction de bruit ou annulation d'écho
0208
Filtration du bruit
0216
caractérisée par le procédé d’estimation du bruit
0232
Traitement dans le domaine fréquentiel
Déposants :
YISSUM RESEARCH DEVELOPMENT COMPANY OF THE HEBREW UNIVERSITY OF JERUSALEM LTD. [IL/IL]; P.O. Box 39135 9139002 Jerusalem, IL
Inventeurs :
PELEG, Shmuel; IL
SHAMIR, Asaph; IL
HALPERIN, Tavi; IL
GABBAY, Aviv; IL
EPHRAT, Ariel; IL
Mandataire :
WEILER, Assaf; IL
Données relatives à la priorité :
62/528,22503.07.2017US
62/586,47215.11.2017US
62/590,77427.11.2017US
Titre (EN) METHOD AND SYSTEM FOR ENHANCING A SPEECH SIGNAL OF A HUMAN SPEAKER IN A VIDEO USING VISUAL INFORMATION
(FR) PROCÉDÉ ET SYSTÈME POUR AMÉLIORER UN SIGNAL VOCAL D'UN LOCUTEUR HUMAIN DANS UNE VIDÉO À L'AIDE D'INFORMATIONS VISUELLES
Abrégé :
(EN) A method and system for enhancing a speech signal is provided herein. The method may include the following steps: obtaining an original video, wherein the original video includes a sequence of original input images showing a face of at least one human speaker, and an original soundtrack synchronized with said sequence of images; and processing, using a computer processor, the original video, to yield an enhanced speech signal of said at least one human speaker, by detecting sounds that are acoustically unrelated to the speech of the at least one human speaker, based on visual data derived from the sequence of original input images.
(FR) L'invention concerne un procédé et un système pour améliorer un signal vocal. Le procédé peut comprendre les étapes suivantes consistant à : obtenir une vidéo originale, la vidéo originale comprenant une séquence d'images d'entrée d'origine montrant un visage d'au moins un locuteur humain, et une piste sonore d'origine synchronisée avec ladite séquence d'images; et traiter, à l'aide d'un processeur d'ordinateur, la vidéo originale, pour produire un signal vocal amélioré dudit au moins un locuteur humain, par détection de sons qui n'ont acoustiquement aucun lien avec la parole du ou des locuteurs humains, sur la base de données visuelles dérivées de la séquence d'images d'entrée originales.
front page image
États désignés : AE, AG, AL, AM, AO, AT, AU, AZ, BA, BB, BG, BH, BN, BR, BW, BY, BZ, CA, CH, CL, CN, CO, CR, CU, CZ, DE, DJ, DK, DM, DO, DZ, EC, EE, EG, ES, FI, GB, GD, GE, GH, GM, GT, HN, HR, HU, ID, IL, IN, IR, IS, JO, JP, KE, KG, KH, KN, KP, KR, KW, KZ, LA, LC, LK, LR, LS, LU, LY, MA, MD, ME, MG, MK, MN, MW, MX, MY, MZ, NA, NG, NI, NO, NZ, OM, PA, PE, PG, PH, PL, PT, QA, RO, RS, RU, RW, SA, SC, SD, SE, SG, SK, SL, SM, ST, SV, SY, TH, TJ, TM, TN, TR, TT, TZ, UA, UG, US, UZ, VC, VN, ZA, ZM, ZW
Organisation régionale africaine de la propriété intellectuelle (ARIPO) (BW, GH, GM, KE, LR, LS, MW, MZ, NA, RW, SD, SL, ST, SZ, TZ, UG, ZM, ZW)
Office eurasien des brevets (OEAB) (AM, AZ, BY, KG, KZ, RU, TJ, TM)
Office européen des brevets (OEB (AL, AT, BE, BG, CH, CY, CZ, DE, DK, EE, ES, FI, FR, GB, GR, HR, HU, IE, IS, IT, LT, LU, LV, MC, MK, MT, NL, NO, PL, PT, RO, RS, SE, SI, SK, SM, TR)
Organisation africaine de la propriété intellectuelle (OAPI) (BF, BJ, CF, CG, CI, CM, GA, GN, GQ, GW, KM, ML, MR, NE, SN, TD, TG)
Langue de publication : anglais (EN)
Langue de dépôt : anglais (EN)