Traitement en cours

Veuillez attendre...

Paramétrages

Paramétrages

Aller à Demande

1. WO2007101192 - SYSTÈME ET PROCÉDÉ DE FILTRAGE DE DOCUMENTS

Numéro de publication WO/2007/101192
Date de publication 07.09.2007
N° de la demande internationale PCT/US2007/062872
Date du dépôt international 27.02.2007
CIB
G10L 15/00 2006.01
GPHYSIQUE
10INSTRUMENTS DE MUSIQUE; ACOUSTIQUE
LANALYSE OU SYNTHÈSE DE LA PAROLE; RECONNAISSANCE DE LA PAROLE; TRAITEMENT DE LA PAROLE OU DE LA VOIX; CODAGE OU DÉCODAGE DE LA PAROLE OU DE SIGNAUX AUDIO
15Reconnaissance de la parole
CPC
G06F 40/103
GPHYSICS
06COMPUTING; CALCULATING; COUNTING
FELECTRIC DIGITAL DATA PROCESSING
40Handling natural language data
10Text processing
103Formatting, i.e. changing of presentation of documents
G10L 15/18
GPHYSICS
10MUSICAL INSTRUMENTS; ACOUSTICS
LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
15Speech recognition
08Speech classification or search
18using natural language modelling
G10L 15/22
GPHYSICS
10MUSICAL INSTRUMENTS; ACOUSTICS
LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
15Speech recognition
22Procedures used during a speech recognition process, e.g. man-machine dialogue
Déposants
  • NUANCE COMMUNICATIONS, INC. [US]/[US] (AllExceptUS)
  • CARUS, Alwin, B. [US]/[US] (UsOnly)
  • LAPSHINA, Larissa [RU]/[US] (UsOnly)
  • RECHEA, Bernardo [US]/[US] (UsOnly)
Inventeurs
  • CARUS, Alwin, B.
  • LAPSHINA, Larissa
  • RECHEA, Bernardo
Mandataires
  • MOORE, Steven, J.
Données relatives à la priorité
11/362,64627.02.2006US
Langue de publication anglais (EN)
Langue de dépôt anglais (EN)
États désignés
Titre
(EN) SYSTEM AND METHOD FOR DOCUMENT FILTERING
(FR) SYSTÈME ET PROCÉDÉ DE FILTRAGE DE DOCUMENTS
Abrégé
(EN)
A system and method for filtering documents to determine section boundaries between dictated and non-dictated text The system and method identifies portions of a text report that correspond to an original dictation and, correspondingly, those portions that are not part of the original dictation. The system and method include comparing tokenized and normalized forms of the original dictation and the final report, determining mismatches between the two forms, and applying machine-learning techniques to identify document headers, footers, page turns, macros, and lists automatically and accurately.
(FR)
Cette invention concerne un système et un procédé de filtrage de documents permettant de déterminer des limites de sections entre du texte dicté et du texte non dicté. Le système et le procédé de cette invention identifient les parties d'un rapport textuel qui correspondent à une dictée d'origine et, en conséquence, les parties qui n'appartiennent pas à la dictée d'origine. Le procédé de cette invention consiste à comparer des formes segmentées en unités à des formes normalisées de la dictée d'origine et du rapport final, à déterminer des défauts d'alignement entre les deux formes, puis à appliquer des techniques d'apprentissage automatique pour identifier, automatiquement et avec précision, des entêtes, titres de bas de page, sauts de page, macro-instructions et listes de documents.
Également publié en tant que
Dernières données bibliographiques dont dispose le Bureau international