WIPO logo
Mobile | Deutsch | English | Español | 日本語 | 한국어 | Português | Русский | 中文 | العربية |
PATENTSCOPE

Recherche dans les collections de brevets nationales et internationales
World Intellectual Property Organization
Recherche
 
Options de navigation
 
Traduction
 
Options
 
Quoi de neuf
 
Connexion
 
Aide
 
Traduction automatique
1. (WO2016139670) SYSTÈME ET PROCÉDÉ DE PRODUCTION DE TRANSCRIPTION PRÉCISE DE PAROLE À PARTIR DE SIGNAUX AUDIO DE PAROLE NATURELLE
Dernières données bibliographiques dont dispose le Bureau international   

N° de publication :    WO/2016/139670    N° de la demande internationale :    PCT/IL2016/050246
Date de publication : 09.09.2016 Date de dépôt international : 03.03.2016
CIB :
G10L 15/00 (2013.01), G10L 15/04 (2013.01), G10L 15/06 (2013.01), G10L 15/07 (2013.01), G10L 15/02 (2006.01), G10L 15/26 (2006.01), G10L 15/32 (2013.01)
Déposants : VOCASEE TECHNOLOGIES LTD [IL/IL]; 77 HaEnergia Street Gav Yam Park 8470912 Beer Sheva (IL)
Inventeurs : NIR, Igal; (IL)
Mandataire : CHECHIK, Haim; (IL)
Données relatives à la priorité :
62/128,548 05.03.2015 US
Titre (EN) SYSTEM AND METHOD FOR GENERATING ACCURATE SPEECH TRANSCRIPTION FROM NATURAL SPEECH AUDIO SIGNALS
(FR) SYSTÈME ET PROCÉDÉ DE PRODUCTION DE TRANSCRIPTION PRÉCISE DE PAROLE À PARTIR DE SIGNAUX AUDIO DE PAROLE NATURELLE
Abrégé : front page image
(EN)Apparatus for generating accurate speech transcription from natural speech, comprising a data storage for storing a plurality of audio data items, each of which being recitation of text by a specific speaker! a plurality of ASR modules, each of which being trained to optimally create a unique acoustic/linguistic model according to the spectral components contained in said audio data item and analyzing each audio data item and representing said audio data item by an ASR module! a memory for storing all unique acoustic/linguistic models! a controller, adapted to receive natural speech audio signals and divide each natural speech audio signal to equal segments of a predetermined time! adjust the length of each segment, such that each segment will contain one or more complete words! distribute said segments to all ASR module and activate each ASR module to generate a transcription of the words in each segment according to the level of matching to its unique acoustic/linguistic model! calculate, for each given word in a segment, a confidence measure being the probability that said given word is correct; for each segment and for each ASR module, calculate the average confidence of the transcription; obtain the confidence for each word in the segment and calculating mean confidence value of said word! for each segment, decide which transcription is the most accurate by choose only the ASR module with the highest average confidence, from all chosen ASR modules for said segment and creating the transcription of said audio signal by combining all transcriptions resulting from the decisions made for each segment.
(FR)L'invention concerne un appareil de production de transcription précise de parole à partir de parole naturelle, comprenant une mémoire de données destinée à mémoriser une pluralité d'éléments de données audio, chacun étant la récitation d'un texte par un locuteur spécifique; une pluralité de modules ASR, chacun étant formé pour créer, de façon optimale, un modèle acoustique/linguistique unique selon les composants de spectre contenus dans ledit élément de données audio et analysant chaque élément de données audio et représentant ledit élément de données audio par un module ASR; une mémoire destinée à mémoriser tous les modèles acoustiques/linguistiques uniques; un organe de commande, apte à recevoir des signaux audio de parole naturelle et à diviser chaque signal audio de parole naturelle en segments égaux d'une durée prédéfinie; ajuster la longueur de chaque segment, de sorte que chaque segment contienne un ou plusieurs mots complets; distribuer lesdits segments à tous les module ASR et activer chaque module ASR pour produire une transcription des mots dans chaque segment selon le niveau de correspondance par rapport à son modèle acoustique/linguistique unique; calculer, pour chaque mot donné dans un segment, une mesure de confiance, en guise de probabilité que ledit mot donné soit correct; pour chaque segment et pour chaque module ASR, calculer la confiance moyenne de la transcription; obtenir la confiance pour chaque mot dans le segment et calculer la valeur de confiance moyenne dudit mot; pour chaque segment, décider quelle transcription est la plus précise en choisissant uniquement le module ASR avec la confiance moyenne la plus élevée, parmi tous les modules ASR choisis pour ledit segment, puis créer la transcription dudit signal audio en combinant toutes les transcriptions résultant des décisions prises pour chaque segment.
États désignés : AE, AG, AL, AM, AO, AT, AU, AZ, BA, BB, BG, BH, BN, BR, BW, BY, BZ, CA, CH, CL, CN, CO, CR, CU, CZ, DE, DK, DM, DO, DZ, EC, EE, EG, ES, FI, GB, GD, GE, GH, GM, GT, HN, HR, HU, ID, IL, IN, IR, IS, JP, KE, KG, KN, KP, KR, KZ, LA, LC, LK, LR, LS, LU, LY, MA, MD, ME, MG, MK, MN, MW, MX, MY, MZ, NA, NG, NI, NO, NZ, OM, PA, PE, PG, PH, PL, PT, QA, RO, RS, RU, RW, SA, SC, SD, SE, SG, SK, SL, SM, ST, SV, SY, TH, TJ, TM, TN, TR, TT, TZ, UA, UG, US, UZ, VC, VN, ZA, ZM, ZW.
Organisation régionale africaine de la propriété intellectuelle (ARIPO) (BW, GH, GM, KE, LR, LS, MW, MZ, NA, RW, SD, SL, ST, SZ, TZ, UG, ZM, ZW)
Office eurasien des brevets (OEAB) (AM, AZ, BY, KG, KZ, RU, TJ, TM)
Office européen des brevets (OEB) (AL, AT, BE, BG, CH, CY, CZ, DE, DK, EE, ES, FI, FR, GB, GR, HR, HU, IE, IS, IT, LT, LU, LV, MC, MK, MT, NL, NO, PL, PT, RO, RS, SE, SI, SK, SM, TR)
Organisation africaine de la propriété intellectuelle (OAPI) (BF, BJ, CF, CG, CI, CM, GA, GN, GQ, GW, KM, ML, MR, NE, SN, TD, TG).
Langue de publication : anglais (EN)
Langue de dépôt : anglais (EN)