Some content of this application is unavailable at the moment.
If this situation persist, please contact us atFeedback&Contact
1. (WO2019064137) EXTRACTION OF EXPRESSION FOR NATURAL LANGUAGE PROCESSING
Latest bibliographic data on file with the International Bureau    Submit observation

Pub. No.: WO/2019/064137 International Application No.: PCT/IB2018/057287
Publication Date: 04.04.2019 International Filing Date: 21.09.2018
IPC:
G06F 17/30 (2006.01)
G PHYSICS
06
COMPUTING; CALCULATING; COUNTING
F
ELECTRIC DIGITAL DATA PROCESSING
17
Digital computing or data processing equipment or methods, specially adapted for specific functions
30
Information retrieval; Database structures therefor
Applicants:
INTERNATIONAL BUSINESS MACHINES CORPORATION [US/US]; New Orchard Road Armonk, New York 10504, US
IBM UNITED KINGDOM LIMITED [GB/GB]; PO Box 41, North Harbour Portsmouth Hampshire PO6 3AU, GB (MG)
IBM (CHINA) INVESTMENT COMPANY LIMITED [CN/CN]; 25/F, Pangu Plaza No.27, Central North 4th Ring Road Chaoyang District Beijing 100101, CN (MG)
Inventors:
MURAOKA, Masayasu; JP
NASUKAWA, Tetsuya; JP
Agent:
FOURNIER, Kevin; GB
Priority Data:
15/717,04427.09.2017US
Title (EN) EXTRACTION OF EXPRESSION FOR NATURAL LANGUAGE PROCESSING
(FR) EXTRACTION D'EXPRESSION POUR TRAITEMENT DE LANGAGE NATUREL
Abstract:
(EN) A computer-implemented method, a computer program product, and a computer system for extracting an expression in a text for natural language processing. The computer system reads a text to generate a plurality of substrings in which each substring includes one or more units appearing in the text. The computer system obtains an image set for the each substring, using the one or more units as a query for an image search system; wherein the image set includes one or more images. The computer system calculates a deviation in the image set for the each substring. The computer system selects a respective one of the plurality of the substrings as an expression to be extracted, based on the deviation and a length of each substring.
(FR) L'invention concerne un procédé mis en œuvre par ordinateur, un produit de programme d'ordinateur et un système informatique permettant d'extraire une expression dans un texte pour le traitement du langage naturel. Le système informatique lit un texte afin de produire une pluralité de sous-chaînes dans laquelle chaque sous-chaîne comprend une ou plusieurs unités apparaissant dans le texte. Le système informatique obtient un ensemble d'images pour chaque sous-chaîne, en utilisant lesdites unités en tant qu'interrogation pour un système de recherche d'image ; l'ensemble d'images comprenant une ou plusieurs images. Le système informatique calcule un écart dans l'ensemble d'images pour chaque sous-chaîne. Le système informatique sélectionne une sous-chaîne respective parmi la pluralité de sous-chaînes en tant qu'expression à extraire, sur la base de l'écart et d'une longueur de chaque sous-chaîne.
front page image
Designated States: AE, AG, AL, AM, AO, AT, AU, AZ, BA, BB, BG, BH, BN, BR, BW, BY, BZ, CA, CH, CL, CN, CO, CR, CU, CZ, DE, DJ, DK, DM, DO, DZ, EC, EE, EG, ES, FI, GB, GD, GE, GH, GM, GT, HN, HR, HU, ID, IL, IN, IR, IS, JO, JP, KE, KG, KH, KN, KP, KR, KW, KZ, LA, LC, LK, LR, LS, LU, LY, MA, MD, ME, MG, MK, MN, MW, MX, MY, MZ, NA, NG, NI, NO, NZ, OM, PA, PE, PG, PH, PL, PT, QA, RO, RS, RU, RW, SA, SC, SD, SE, SG, SK, SL, SM, ST, SV, SY, TH, TJ, TM, TN, TR, TT, TZ, UA, UG, US, UZ, VC, VN, ZA, ZM, ZW
African Regional Intellectual Property Organization (ARIPO) (BW, GH, GM, KE, LR, LS, MW, MZ, NA, RW, SD, SL, ST, SZ, TZ, UG, ZM, ZW)
Eurasian Patent Office (AM, AZ, BY, KG, KZ, RU, TJ, TM)
European Patent Office (EPO) (AL, AT, BE, BG, CH, CY, CZ, DE, DK, EE, ES, FI, FR, GB, GR, HR, HU, IE, IS, IT, LT, LU, LV, MC, MK, MT, NL, NO, PL, PT, RO, RS, SE, SI, SK, SM, TR)
African Intellectual Property Organization (BF, BJ, CF, CG, CI, CM, GA, GN, GQ, GW, KM, ML, MR, NE, SN, TD, TG)
Publication Language: English (EN)
Filing Language: English (EN)