WIPO logo
Mobile | Deutsch | English | Español | 日本語 | 한국어 | Português | Русский | 中文 | العربية |
PATENTSCOPE

Recherche dans les collections de brevets nationales et internationales
World Intellectual Property Organization
Recherche
 
Options de navigation
 
Traduction
 
Options
 
Quoi de neuf
 
Connexion
 
Aide
 
Traduction automatique
1. (WO2010018453) SYSTÈME ET PROCÉDÉ DE TRAITEMENT D'UN TEXTE GÉNÉRÉ ÉLECTRONIQUEMENT
Dernières données bibliographiques dont dispose le Bureau international   

N° de publication :    WO/2010/018453    N° de la demande internationale :    PCT/IB2009/006552
Date de publication : 18.02.2010 Date de dépôt international : 14.08.2009
CIB :
G10L 15/18 (2006.01), G06F 17/27 (2006.01)
Déposants : UNIVERSITY OF CAPE TOWN [ZA/ZA]; Lovers Walk, Rondebosch Cape Town 7700 (ZA) (Tous Sauf US).
LOPES, Luis Ramos dos Santos [AO/GB]; (GB) (US Seulement)
Inventeurs : LOPES, Luis Ramos dos Santos; (GB)
Mandataire : VON SEIDELS INTELLECTUAL PROPERTY ATTORNEYS; PO Box 440 Century City (Cape Town) 7441 (ZA)
Données relatives à la priorité :
2008/0744 15.08.2008 ZA
Titre (EN) SYSTEM AND METHOD FOR PROCESSING ELECTRONICALLY GENERATED TEXT
(FR) SYSTÈME ET PROCÉDÉ DE TRAITEMENT D'UN TEXTE GÉNÉRÉ ÉLECTRONIQUEMENT
Abrégé : front page image
(EN)A method and system are disclosed for processing electronically generated text emanating from electronic text generating means such as a speech recognition engine (1 ) or optical character reader that output an initial text string (3). First processing means produce an intermediate text string and second processing means check the intermediate text string optionally as a sequence with one or more other successive intermediate text strings against a knowledge base (28, 32) in order to compare the meaning thereof to items in the knowledge base in an attempt to correct errors in semantics and produce an optionally final processed text string. The first processing means is adapted to apply the steps of categorising each word as belonging to one of a predetermined plurality of categories of parts of speech including nouns, verbs, and at least one other category (4), creating a category sequence corresponding to the text string and comparing the category sequence to a plurality of predetermined permissible sequences to thereby check the syntax of the initial text string (5). An initial text string having a category sequence not corresponding to a predetermined permissible sequence is treated in an effort to remedy the cause of non-correspondence (7).
(FR)L'invention porte sur un procédé et sur un système de traitement d’un texte généré électroniquement par moyens de génération de texte électronique (1, 2), moteur de reconnaissance vocale ou lecteur optique de caractères, par exemple, qui délivrent une chaîne de texte initiale (3). Des premiers moyens de traitement produisent une chaîne de texte intermédiaire et des seconds moyens de traitement vérifient la chaîne de texte intermédiaire, facultativement sous forme de séquence comprenant une ou plusieurs autres chaînes de texte intermédiaires successives, au moyen d’une banque de connaissances (28, 32) pour comparer sa signification à des éléments contenus dans la banque de connaissances dans le but de corriger des erreurs de sémantique et de produire facultativement une chaîne de texte traitée finale. Le premier moyen de traitement est apte à réaliser une catégorisation de chaque mot comme appartenant à une catégorie parmi la pluralité prédéterminée de catégories de parties du discours y compris les noms, les verbes et au moins une autre catégorie (4); la création d'une séquence de catégories correspondant à la chaîne de texte; et la comparaison de la séquence de catégories à une pluralité de séquences permises prédéterminées, vérifiant ainsi la syntaxe de la chaîne de texte initiale (5). Une chaîne de texte initiale dont la séquence de catégories ne correspond pas à une séquence permise prédéterminée est traitée pour remédier à la cause de la non-correspondance (7).
États désignés : AE, AG, AL, AM, AO, AT, AU, AZ, BA, BB, BG, BH, BR, BW, BY, BZ, CA, CH, CL, CN, CO, CR, CU, CZ, DE, DK, DM, DO, DZ, EC, EE, EG, ES, FI, GB, GD, GE, GH, GM, GT, HN, HR, HU, ID, IL, IN, IS, JP, KE, KG, KM, KN, KP, KR, KZ, LA, LC, LK, LR, LS, LT, LU, LY, MA, MD, ME, MG, MK, MN, MW, MX, MY, MZ, NA, NG, NI, NO, NZ, OM, PE, PG, PH, PL, PT, RO, RS, RU, SC, SD, SE, SG, SK, SL, SM, ST, SV, SY, TJ, TM, TN, TR, TT, TZ, UA, UG, US, UZ, VC, VN, ZA, ZM, ZW.
Organisation régionale africaine de la propriété intellectuelle (ARIPO) (BW, GH, GM, KE, LS, MW, MZ, NA, SD, SL, SZ, TZ, UG, ZM, ZW)
Office eurasien des brevets (OEAB) (AM, AZ, BY, KG, KZ, MD, RU, TJ, TM)
Office européen des brevets (OEB) (AT, BE, BG, CH, CY, CZ, DE, DK, EE, ES, FI, FR, GB, GR, HR, HU, IE, IS, IT, LT, LU, LV, MC, MK, MT, NL, NO, PL, PT, RO, SE, SI, SK, SM, TR)
Organisation africaine de la propriété intellectuelle (OAPI) (BF, BJ, CF, CG, CI, CM, GA, GN, GQ, GW, ML, MR, NE, SN, TD, TG).
Langue de publication : anglais (EN)
Langue de dépôt : anglais (EN)