Traitement en cours

Veuillez attendre...

PATENTSCOPE sera indisponible durant quelques heures pour des raisons de maintenance le dimanche 05.04.2020 à 10:00 AM CEST
Paramétrages

Paramétrages

1. WO2003005347 - GRAMMAIRES DESTINEES A LA RECONNAISSANCE DE LA PAROLE

Numéro de publication WO/2003/005347
Date de publication 16.01.2003
N° de la demande internationale PCT/US2002/021479
Date du dépôt international 03.07.2002
Demande présentée en vertu du Chapitre 2 04.02.2003
CIB
G10L 15/187 2013.01
GPHYSIQUE
10INSTRUMENTS DE MUSIQUE; ACOUSTIQUE
LANALYSE OU SYNTHÈSE DE LA PAROLE; RECONNAISSANCE DE LA PAROLE; TRAITEMENT DE LA PAROLE OU DE LA VOIX; CODAGE OU DÉCODAGE DE LA PAROLE OU DE SIGNAUX AUDIO
15Reconnaissance de la parole
08Classement ou recherche de la parole
18utilisant une modélisation du langage naturel
183selon les contextes, p.ex. modèles de langage
187Contexte phonémique, p.ex. règles de prononciation, contraintes phonotactiques ou n-grammes de phonèmes
G10L 15/193 2013.01
GPHYSIQUE
10INSTRUMENTS DE MUSIQUE; ACOUSTIQUE
LANALYSE OU SYNTHÈSE DE LA PAROLE; RECONNAISSANCE DE LA PAROLE; TRAITEMENT DE LA PAROLE OU DE LA VOIX; CODAGE OU DÉCODAGE DE LA PAROLE OU DE SIGNAUX AUDIO
15Reconnaissance de la parole
08Classement ou recherche de la parole
18utilisant une modélisation du langage naturel
183selon les contextes, p.ex. modèles de langage
19Contexte grammatical, p.ex. désambiguïsation des hypothèses de reconnaissance par application des règles de séquence de mots
193Grammaires formelles, p.ex. automates à états finis, grammaires hors contexte ou réseaux de mots
G10L 15/28 2013.01
GPHYSIQUE
10INSTRUMENTS DE MUSIQUE; ACOUSTIQUE
LANALYSE OU SYNTHÈSE DE LA PAROLE; RECONNAISSANCE DE LA PAROLE; TRAITEMENT DE LA PAROLE OU DE LA VOIX; CODAGE OU DÉCODAGE DE LA PAROLE OU DE SIGNAUX AUDIO
15Reconnaissance de la parole
28Détails de structure des systèmes de reconnaissance de la parole
CPC
G10L 15/187
GPHYSICS
10MUSICAL INSTRUMENTS; ACOUSTICS
LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
15Speech recognition
08Speech classification or search
18using natural language modelling
183using context dependencies, e.g. language models
187Phonemic context, e.g. pronunciation rules, phonotactical constraints or phoneme n-grams
G10L 15/193
GPHYSICS
10MUSICAL INSTRUMENTS; ACOUSTICS
LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
15Speech recognition
08Speech classification or search
18using natural language modelling
183using context dependencies, e.g. language models
19Grammatical context, e.g. disambiguation of the recognition hypotheses based on word sequence rules
193Formal grammars, e.g. finite state automata, context free grammars or word networks
G10L 15/285
GPHYSICS
10MUSICAL INSTRUMENTS; ACOUSTICS
LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
15Speech recognition
28Constructional details of speech recognition systems
285Memory allocation or algorithm optimisation to reduce hardware requirements
Déposants
  • SPEECHWORKS INTERNATIONAL, INC. [US/US]; 695 Atlantic Avenue Boston, MA 02111, US (AE, AG, AL, AM, AT, AU, AZ, BA, BB, BE, BF, BG, BJ, BR, BY, BZ, CA, CF, CG, CH, CI, CM, CN, CO, CR, CU, CY, CZ, DE, DK, DM, DZ, EC, EE, ES, FI, FR, GA, GB, GD, GE, GH, GM, GN, GR, GW, HR, HU, ID, IE, IL, IN, IS, IT, JP, KE, KG, KP, KR, KZ, LC, LK, LR, LS, LT, LU, LV, MA, MC, MD, MG, MK, ML, MN, MR, MW, MX, MZ, NE, NL, NO, NZ, PL, PT, RO, RU, SD, SE, SG, SI, SK, SL, SN, SZ, TD, TG, TJ, TM, TR, TT, TZ, UA, UG, UZ, VN, YU, ZA, ZW)
  • SCHALKWYK, Johan [ZA/US]; US (UsOnly)
  • PHILLIPS, Michael, S. [US/US]; US (UsOnly)
Inventeurs
  • SCHALKWYK, Johan; US
  • PHILLIPS, Michael, S.; US
Mandataires
  • ROHLICEK, J., Robin; Fish & Richardson P.C. 225 Franklin Street Boston, MA 02110, US
Données relatives à la priorité
09/906,57516.07.2001US
60/303,16605.07.2001US
Langue de publication anglais (EN)
Langue de dépôt anglais (EN)
États désignés
Titre
(EN) GRAMMARS FOR SPEECH RECOGNITION
(FR) GRAMMAIRES DESTINEES A LA RECONNAISSANCE DE LA PAROLE
Abrégé
(EN)
Pre-computed context-dependent phoneme representations of a number of constituents of a grammar are processed dynamically by a speech recognizer. The approach provides a configurable tradeoff between data size and recognition-time computation. This tradeoff can be obtained without sacrificing recognition accuracy, and in particular, allows full modeling of all cross-word phoneme contexts. In one aspect of the invention, a specification of a grammar is processed. This specification includes specifications of a number of constituents of the grammar. A first subset of the constituents of the grammar are selected, and the remaining of the constituents form a second subset. For each of the constituents in the first subset the method first includes processing the specification of the constituent to form a first processed representation that defines sequences of elements that are associated with that constituent and that includes words and references to constituents in the first subset. Forming the first processed representation of each constituent includes expanding references to constituents, in the second subset according to the specifications of those constituents, and retaining references to constituents in the first subset without expanding said references.
(FR)
Selon l'invention, des représentations de phonèmes dépendantes du contexte précalculées d'un grand nombre de constituants d'une grammaire sont traitées de façon dynamique par un reconnaisseur de parole. Cette approche fournit un compromis configurable entre la taille des données et le calcul du temps de reconnaissance. Ce compromis peut être obtenu sans sacrifier la précision de la reconnaissance et, en particulier, permet de modéliser tous les contextes des phonèmes de mots croisés. Dans un aspect de l'invention, une spécification d'une grammaire est traitée. Cette spécification comprend des spécifications d'un grand nombre de constituants de la grammaire. Un premier sous-ensemble de constituants de la grammaire est choisi, le reste des constituants formant un second sous-ensemble. Pour chaque constituant du premier sous-ensemble, le procédé consiste à traiter la spécification du constituant pour former une première représentation traitée définissant des suites d'éléments associés à ce constituant et incluant des mots et des références à des constituants du premier sous-ensemble. La création de la première représentation traitée de chaque constituant consiste à élargir les références aux constituants dans le second sous-ensemble selon les spécifications desdits constituants, et à retenir les références aux constituants du premier sous-ensemble sans élargir lesdites références.
Également publié en tant que
Dernières données bibliographiques dont dispose le Bureau international