WIPO logo
Mobile | Deutsch | English | Español | 日本語 | 한국어 | Português | Русский | 中文 | العربية |
PATENTSCOPE

Recherche dans les collections de brevets nationales et internationales
World Intellectual Property Organization
Recherche
 
Options de navigation
 
Traduction
 
Options
 
Quoi de neuf
 
Connexion
 
Aide
 
Traduction automatique
1. (WO2015135452) PROCÉDÉ ET APPAREIL DE TRAITEMENT D'INFORMATIONS TEXTUELLES
Dernières données bibliographiques dont dispose le Bureau international   

N° de publication :    WO/2015/135452    N° de la demande internationale :    PCT/CN2015/073864
Date de publication : 17.09.2015 Date de dépôt international : 09.03.2015
CIB :
G06F 17/27 (2006.01)
Déposants : TENCENT TECHNOLOGY (SHENZHEN) COMPANY LIMITED [CN/CN]; Room 403, East Block 2, SEG Park Zhenxing Road, Futian District Shenzhen, Guangdong 518044 (CN)
Inventeurs : LIU, Jie; (CN).
LI, Yinghui; (CN)
Mandataire : ADVANCE CHINA IP LAW OFFICE; Room 3901, No. 85 Huacheng Avenue, Tianhe District Guangzhou, Guangdong 510623 (CN)
Données relatives à la priorité :
201410097479.5 14.03.2014 CN
Titre (EN) TEXT INFORMATION PROCESSING METHOD AND APPARATUS
(FR) PROCÉDÉ ET APPAREIL DE TRAITEMENT D'INFORMATIONS TEXTUELLES
Abrégé : front page image
(EN)A text information processing method and apparatus are disclosed. The method includes: performing word segmentation on a target text according to a preset fixed word segmentation policy, and comparing a word segmentation result with a preset word segmentation list, to obtain a new word; adding the new word to the preset word segmentation list, to obtain a test word segmentation list; classifying a test text according to the preset word segmentation list, to obtain a first text, and classifying the test text according to the test word segmentation list, to obtain a second text; comparing classification accuracy of the first text with classification accuracy of the second text, and determining a target new word from the new word according to a comparison result; and adding the target new word to the preset word segmentation list, and classifying the target text.
(FR)L'invention concerne un procédé et appareil de traitement d'informations textuelles. Le procédé comprend les étapes consistant à: effectuer une segmentation par mots sur un texte cible selon une politique prédéfinie fixée de segmentation par mots, et comparer un résultat de segmentation par mots à une liste prédéfinie de segmentation par mots, pour obtenir un nouveau mot; ajouter le nouveau mot à la liste prédéfinie de segmentation par mots, pour obtenir une liste de segmentation par mots d'essai; classifier un texte d'essai selon la liste prédéfinie de segmentation par mots, pour obtenir un premier texte, et classifier le texte d'essai selon la liste de segmentation par mots d'essai, pour obtenir un deuxième texte; comparer la précision de classification du premier texte à la précision de classification du deuxième texte, et déterminer un nouveau mot cible à partir du nouveau mot d'après un résultat de comparaison; et ajouter le nouveau mot cible à la liste prédéfinie de segmentation par mots, et classifier le texte cible.
États désignés : AE, AG, AL, AM, AO, AT, AU, AZ, BA, BB, BG, BH, BN, BR, BW, BY, BZ, CA, CH, CL, CN, CO, CR, CU, CZ, DE, DK, DM, DO, DZ, EC, EE, EG, ES, FI, GB, GD, GE, GH, GM, GT, HN, HR, HU, ID, IL, IN, IR, IS, JP, KE, KG, KN, KP, KR, KZ, LA, LC, LK, LR, LS, LU, LY, MA, MD, ME, MG, MK, MN, MW, MX, MY, MZ, NA, NG, NI, NO, NZ, OM, PA, PE, PG, PH, PL, PT, QA, RO, RS, RU, RW, SA, SC, SD, SE, SG, SK, SL, SM, ST, SV, SY, TH, TJ, TM, TN, TR, TT, TZ, UA, UG, US, UZ, VC, VN, ZA, ZM, ZW.
Organisation régionale africaine de la propriété intellectuelle (ARIPO) (BW, GH, GM, KE, LR, LS, MW, MZ, NA, RW, SD, SL, ST, SZ, TZ, UG, ZM, ZW)
Office eurasien des brevets (OEAB) (AM, AZ, BY, KG, KZ, RU, TJ, TM)
Office européen des brevets (OEB) (AL, AT, BE, BG, CH, CY, CZ, DE, DK, EE, ES, FI, FR, GB, GR, HR, HU, IE, IS, IT, LT, LU, LV, MC, MK, MT, NL, NO, PL, PT, RO, RS, SE, SI, SK, SM, TR)
Organisation africaine de la propriété intellectuelle (OAPI) (BF, BJ, CF, CG, CI, CM, GA, GN, GQ, GW, KM, ML, MR, NE, SN, TD, TG).
Langue de publication : anglais (EN)
Langue de dépôt : anglais (EN)