Certains contenus de cette application ne sont pas disponibles pour le moment.
Si cette situation persiste, veuillez nous contacter àObservations et contact
1. (WO2019064137) EXTRACTION D'EXPRESSION POUR TRAITEMENT DE LANGAGE NATUREL
Dernières données bibliographiques dont dispose le Bureau international    Formuler une observation

N° de publication : WO/2019/064137 N° de la demande internationale : PCT/IB2018/057287
Date de publication : 04.04.2019 Date de dépôt international : 21.09.2018
CIB :
G06F 17/30 (2006.01)
G PHYSIQUE
06
CALCUL; COMPTAGE
F
TRAITEMENT ÉLECTRIQUE DE DONNÉES NUMÉRIQUES
17
Equipement ou méthodes de traitement de données ou de calcul numérique, spécialement adaptés à des fonctions spécifiques
30
Recherche documentaire; Structures de bases de données à cet effet
Déposants :
INTERNATIONAL BUSINESS MACHINES CORPORATION [US/US]; New Orchard Road Armonk, New York 10504, US
IBM UNITED KINGDOM LIMITED [GB/GB]; PO Box 41, North Harbour Portsmouth Hampshire PO6 3AU, GB (MG)
IBM (CHINA) INVESTMENT COMPANY LIMITED [CN/CN]; 25/F, Pangu Plaza No.27, Central North 4th Ring Road Chaoyang District Beijing 100101, CN (MG)
Inventeurs :
MURAOKA, Masayasu; JP
NASUKAWA, Tetsuya; JP
Mandataire :
FOURNIER, Kevin; GB
Données relatives à la priorité :
15/717,04427.09.2017US
Titre (EN) EXTRACTION OF EXPRESSION FOR NATURAL LANGUAGE PROCESSING
(FR) EXTRACTION D'EXPRESSION POUR TRAITEMENT DE LANGAGE NATUREL
Abrégé :
(EN) A computer-implemented method, a computer program product, and a computer system for extracting an expression in a text for natural language processing. The computer system reads a text to generate a plurality of substrings in which each substring includes one or more units appearing in the text. The computer system obtains an image set for the each substring, using the one or more units as a query for an image search system; wherein the image set includes one or more images. The computer system calculates a deviation in the image set for the each substring. The computer system selects a respective one of the plurality of the substrings as an expression to be extracted, based on the deviation and a length of each substring.
(FR) L'invention concerne un procédé mis en œuvre par ordinateur, un produit de programme d'ordinateur et un système informatique permettant d'extraire une expression dans un texte pour le traitement du langage naturel. Le système informatique lit un texte afin de produire une pluralité de sous-chaînes dans laquelle chaque sous-chaîne comprend une ou plusieurs unités apparaissant dans le texte. Le système informatique obtient un ensemble d'images pour chaque sous-chaîne, en utilisant lesdites unités en tant qu'interrogation pour un système de recherche d'image ; l'ensemble d'images comprenant une ou plusieurs images. Le système informatique calcule un écart dans l'ensemble d'images pour chaque sous-chaîne. Le système informatique sélectionne une sous-chaîne respective parmi la pluralité de sous-chaînes en tant qu'expression à extraire, sur la base de l'écart et d'une longueur de chaque sous-chaîne.
front page image
États désignés : AE, AG, AL, AM, AO, AT, AU, AZ, BA, BB, BG, BH, BN, BR, BW, BY, BZ, CA, CH, CL, CN, CO, CR, CU, CZ, DE, DJ, DK, DM, DO, DZ, EC, EE, EG, ES, FI, GB, GD, GE, GH, GM, GT, HN, HR, HU, ID, IL, IN, IR, IS, JO, JP, KE, KG, KH, KN, KP, KR, KW, KZ, LA, LC, LK, LR, LS, LU, LY, MA, MD, ME, MG, MK, MN, MW, MX, MY, MZ, NA, NG, NI, NO, NZ, OM, PA, PE, PG, PH, PL, PT, QA, RO, RS, RU, RW, SA, SC, SD, SE, SG, SK, SL, SM, ST, SV, SY, TH, TJ, TM, TN, TR, TT, TZ, UA, UG, US, UZ, VC, VN, ZA, ZM, ZW
Organisation régionale africaine de la propriété intellectuelle (ARIPO) (BW, GH, GM, KE, LR, LS, MW, MZ, NA, RW, SD, SL, ST, SZ, TZ, UG, ZM, ZW)
Office eurasien des brevets (OEAB) (AM, AZ, BY, KG, KZ, RU, TJ, TM)
Office européen des brevets (OEB) (AL, AT, BE, BG, CH, CY, CZ, DE, DK, EE, ES, FI, FR, GB, GR, HR, HU, IE, IS, IT, LT, LU, LV, MC, MK, MT, NL, NO, PL, PT, RO, RS, SE, SI, SK, SM, TR)
Organisation africaine de la propriété intellectuelle (OAPI) (BF, BJ, CF, CG, CI, CM, GA, GN, GQ, GW, KM, ML, MR, NE, SN, TD, TG)
Langue de publication : anglais (EN)
Langue de dépôt : anglais (EN)