WIPO logo
Mobile | Deutsch | Español | Français | 日本語 | 한국어 | Português | Русский | 中文 | العربية |
PATENTSCOPE

Search International and National Patent Collections
World Intellectual Property Organization
Search
 
Browse
 
Translate
 
Options
 
News
 
Login
 
Help
 
Machine translation
1. (WO2015027867) AUTHORSHIP ENHANCED CORPUS INGESTION FOR NATURAL LANGUAGE PROCESSING
Latest bibliographic data on file with the International Bureau   

Pub. No.:    WO/2015/027867    International Application No.:    PCT/CN2014/085002
Publication Date: 05.03.2015 International Filing Date: 22.08.2014
IPC:
G06F 17/30 (2006.01)
Applicants: INTERNATIONAL BUSINESS MACHINES CORPORATION [US/US]; New Orchard Road Armonk, New York 10504 (US).
IBM (CHINA) CO., LIMITED [CN/CN]; 7F., Bldg. 10 ZhangJiang Innovation Park, 399 Keyuan Road ZhangJiang High-Tech Campus, Pudong New Area Shanghai 201203 (CN) (MG only)
Inventors: BASTIDE, Paul R.; (US).
BROOMHALL, Matthew E.; (US).
LOREDO, Robert E.; (US).
LU, Fang; (US)
Agent: LIU, SHEN & ASSOCIATES; 10th Floor, Building 1, 10 Caihefang Road, Haidian District Beijing 100080 (CN)
Priority Data:
14/012,337 28.08.2013 US
Title (EN) AUTHORSHIP ENHANCED CORPUS INGESTION FOR NATURAL LANGUAGE PROCESSING
(FR) INGESTION DE CORPUS AMÉLIORÉE PAR PATERNITÉ POUR UN TRAITEMENT DU LANGAGE NATUREL
Abstract: front page image
(EN)Mechanisms for processing a corpus of information in a natural language processing system are provided. A corpus of information to process is identified and a set of author profiles associated with the corpus of information is retrieved. A content profile is generated for a portion of content of the corpus of information and the content profile is compared to the set of author profiles to generate an association of the content profile with at least one author profile in the set of author profiles. In addition, a processing operation of the natural language processing (NLP) system is controlled based on the association of the content profile with the at least one author profile.
(FR)L'invention concerne des mécanismes pour traiter un corpus d'informations dans un système de traitement du langage naturel. Un corpus d'informations à traiter est identifié et un ensemble de profils d'auteur associés au corpus d'informations est extrait. Un profil de contenu est généré pour une partie d'un contenu du corpus d'informations et le profil de contenu est comparé à l'ensemble de profils d'auteur pour générer une association du profil de contenu avec au moins un profil d'auteur dans l'ensemble de profils d'auteur. En outre, une opération de traitement du système de traitement du langage naturel (NLP) est commandée sur la base de l'association du profil de contenu avec le ou les profils d'auteur.
Designated States: AE, AG, AL, AM, AO, AT, AU, AZ, BA, BB, BG, BH, BN, BR, BW, BY, BZ, CA, CH, CL, CN, CO, CR, CU, CZ, DE, DK, DM, DO, DZ, EC, EE, EG, ES, FI, GB, GD, GE, GH, GM, GT, HN, HR, HU, ID, IL, IN, IR, IS, JP, KE, KG, KN, KP, KR, KZ, LA, LC, LK, LR, LS, LT, LU, LY, MA, MD, ME, MG, MK, MN, MW, MX, MY, MZ, NA, NG, NI, NO, NZ, OM, PA, PE, PG, PH, PL, PT, QA, RO, RS, RU, RW, SA, SC, SD, SE, SG, SK, SL, SM, ST, SV, SY, TH, TJ, TM, TN, TR, TT, TZ, UA, UG, US, UZ, VC, VN, ZA, ZM, ZW.
African Regional Intellectual Property Organization (BW, GH, GM, KE, LR, LS, MW, MZ, NA, RW, SD, SL, ST, SZ, TZ, UG, ZM, ZW)
Eurasian Patent Organization (AM, AZ, BY, KG, KZ, RU, TJ, TM)
European Patent Office (AL, AT, BE, BG, CH, CY, CZ, DE, DK, EE, ES, FI, FR, GB, GR, HR, HU, IE, IS, IT, LT, LU, LV, MC, MK, MT, NL, NO, PL, PT, RO, RS, SE, SI, SK, SM, TR)
African Intellectual Property Organization (BF, BJ, CF, CG, CI, CM, GA, GN, GQ, GW, KM, ML, MR, NE, SN, TD, TG).
Publication Language: English (EN)
Filing Language: English (EN)