Recherche dans les collections de brevets nationales et internationales

1. (WO2017140221) PROCÉDÉ ET DISPOSITIF DE TRAITEMENT D'INFORMATIONS DE TEXTE

Pub. No.:    WO/2017/140221    International Application No.:    PCT/CN2017/073020
Publication Date: Fri Aug 25 01:59:59 CEST 2017 International Filing Date: Wed Feb 08 00:59:59 CET 2017
IPC: G06F 17/27
Applicants: TENCENT TECHNOLOGY (SHENZHEN) COMPANY LIMITED
腾讯科技(深圳)有限公司
Inventors: LIN, Quanchen
林全郴
LIU, Lichun
刘黎春
ZHAO, Jianchun
赵建春
Title: PROCÉDÉ ET DISPOSITIF DE TRAITEMENT D'INFORMATIONS DE TEXTE
Abstract:
L'invention concerne un procédé et un dispositif de traitement d'informations de texte. Le procédé consiste : à diviser un ensemble d'apprentissage en mots et en chaînes (102) ; à calculer respectivement les probabilités des mots et des chaînes de l'ensemble d'apprentissage pour obtenir la probabilité indépendante des mots et la probabilité conjointe des chaînes (103) ; à sélectionner l'une des chaînes sur la base de la probabilité indépendante et de la probabilité conjointe, et à utiliser la chaîne sélectionnée comme nouveau mot candidat (104) ; et, si le nouveau mot candidat n'est pas dans un dictionnaire prédéfini et que la probabilité conjointe correspondant au nouveau mot candidat est supérieure à un seuil prédéfini, à déterminer que le nouveau mot candidat est un nouveau mot (105). Non seulement cette solution simplifie un processus et réduit les ressources de calcul, mais elle accroît également le taux de découverte de nouveaux mots pour améliorer les résultats de traitement.