Traitement en cours

Veuillez attendre...

Paramétrages

Paramétrages

Goto Application

1. WO2020063512 - PROCÉDÉ DE DÉTERMINATION DE TEXTES SIMILAIRES, PROCÉDÉ D'OBTENTION D'UN MODÈLE DE RÉSEAU NEURONAL ET APPAREIL ASSOCIÉ

Numéro de publication WO/2020/063512
Date de publication 02.04.2020
N° de la demande internationale PCT/CN2019/107213
Date du dépôt international 23.09.2019
CIB
G06F 17/22 2006.01
GPHYSIQUE
06CALCUL; COMPTAGE
FTRAITEMENT ÉLECTRIQUE DE DONNÉES NUMÉRIQUES
17Équipement ou méthodes de traitement de données ou de calcul numérique, spécialement adaptés à des fonctions spécifiques
20Manipulation de données en langage naturel
21Traitement de texte
22Manipulation ou enregistrement au moyen de codes, p.ex. dans une séquence de caractères de texte
CPC
G06F 40/194
GPHYSICS
06COMPUTING; CALCULATING; COUNTING
FELECTRIC DIGITAL DATA PROCESSING
40Handling natural language data
10Text processing
194Calculation of difference between files
G06F 40/279
GPHYSICS
06COMPUTING; CALCULATING; COUNTING
FELECTRIC DIGITAL DATA PROCESSING
40Handling natural language data
20Natural language analysis
279Recognition of textual entities
G06N 3/04
GPHYSICS
06COMPUTING; CALCULATING; COUNTING
NCOMPUTER SYSTEMS BASED ON SPECIFIC COMPUTATIONAL MODELS
3Computer systems based on biological models
02using neural network models
04Architectures, e.g. interconnection topology
G06N 3/08
GPHYSICS
06COMPUTING; CALCULATING; COUNTING
NCOMPUTER SYSTEMS BASED ON SPECIFIC COMPUTATIONAL MODELS
3Computer systems based on biological models
02using neural network models
08Learning methods
Déposants
  • 北京国双科技有限公司 BEIJING GRIDSUM TECHNOLOGY CO., LTD. [CN]/[CN]
Inventeurs
  • 戴泽辉 DAI, Zehui
Mandataires
  • 北京集佳知识产权代理有限公司 UNITALEN ATTORNEYS AT LAW
Données relatives à la priorité
201811161121.930.09.2018CN
Langue de publication chinois (ZH)
Langue de dépôt chinois (ZH)
États désignés
Titre
(EN) METHOD FOR DETERMINING SIMILAR TEXTS, METHOD FOR OBTAINING NEURAL NETWORK MODEL, AND RELATED APPARATUS
(FR) PROCÉDÉ DE DÉTERMINATION DE TEXTES SIMILAIRES, PROCÉDÉ D'OBTENTION D'UN MODÈLE DE RÉSEAU NEURONAL ET APPAREIL ASSOCIÉ
(ZH) 相似文本确定方法、神经网络模型获得方法及相关装置
Abrégé
(EN)
A method for determining similar texts, a method for obtaining a neural network model, and a related apparatus. The method comprises: obtaining a judicial text to be processed (S100); carrying out word segmentation on the judicial text to be processed to obtain a vocabulary sequence (S200); obtaining a matrix composed of vocabulary vectors of various vocabularies in the vocabulary sequence (S300); inputting the matrix into a pre-set neural network model to obtain a feature vector output by some or all of the network layers of the pre-set neural network model (S400); stitching various obtained feature vectors into a feature vector corresponding to the judicial text to be processed (S500); and determining, from a pre-set judicial text library, a judicial text similar to the judicial text to be processed according to the similarity between the feature vector corresponding to the judicial text to be processed and a feature vector corresponding to each judicial text in the pre-set judicial text library (S600). By means of the method, similar judicial texts can be automatically determined without a user's manual search, which is convenient and fast.
(FR)
L'invention concerne un procédé de détermination de textes similaires, un procédé d'obtention d'un modèle de réseau neuronal et un appareil associé. Le procédé consiste à : obtenir un texte judiciaire à traiter (S100) ; effectuer une segmentation de mots sur le texte judiciaire à traiter pour obtenir une séquence de vocabulaire (S200) ; obtenir une matrice composée de vecteurs de vocabulaire de divers vocabulaire dans la séquence de vocabulaire (S300) ; entrer la matrice dans un modèle de réseau neuronal prédéfini pour obtenir un vecteur de caractéristique émis par une partie ou la totalité des couches de réseau du modèle de réseau neuronal prédéfini (S400) ; regrouper divers vecteurs de caractéristiques obtenus en un vecteur de caractéristique correspondant au texte judiciaire à traiter (S500) ; et déterminer, à partir d'une bibliothèque de textes judiciaires préétablie, un texte préjudiciable similaire au texte judiciaire à traiter en fonction de la similarité entre le vecteur de caractéristique correspondant au texte judiciaire à traiter et un vecteur de caractéristique correspondant à chaque texte judiciaire dans la bibliothèque de textes judiciaires préétablie (S600). Au moyen du procédé, des textes judiciaires similaires peuvent être automatiquement déterminés sans recherche manuelle de l'utilisateur, ce qui est pratique et rapide.
(ZH)
一种相似文本确定方法、神经网络模型获得方法及相关装置,所述方法包括:获得待处理的司法文本(S100);对待处理的司法文本进行分词,获得词汇序列(S200);获得词汇序列中各词汇的词汇向量构成的矩阵(S300);将矩阵输入预设的神经网络模型中,获得预设的神经网络模型的部分或全部网络层输出的特征向量(S400);将获得的各特征向量拼接为一个与待处理的司法文本对应的特征向量(S500);根据待处理的司法文本对应的特征向量分别与预设司法文本库中各司法文本对应的特征向量的相似度,从预设司法文本库中确定与待处理的司法文本相似的司法文本(S600)。所述方法可以自动确定相似的司法文本,无需用户手动查找,方便快捷。
Dernières données bibliographiques dont dispose le Bureau international