Traitement en cours

Veuillez attendre...

Paramétrages

Paramétrages

Aller à Demande

1. WO2020114429 - PROCÉDÉ D'APPRENTISSAGE DE MODÈLE D'EXTRACTION DE MOT-CLÉ, PROCÉDÉ D'EXTRACTION DE MOT-CLÉ ET DISPOSITIF INFORMATIQUE

Numéro de publication WO/2020/114429
Date de publication 11.06.2020
N° de la demande internationale PCT/CN2019/123057
Date du dépôt international 04.12.2019
CIB
G06F 17/00 2019.01
GPHYSIQUE
06CALCUL; COMPTAGE
FTRAITEMENT ÉLECTRIQUE DE DONNÉES NUMÉRIQUES
17Équipement ou méthodes de traitement de données ou de calcul numérique, spécialement adaptés à des fonctions spécifiques
CPC
G06F 17/2775
G06F 17/2785
Déposants
  • 腾讯科技(深圳)有限公司 TENCENT TECHNOLOGY (SHENZHEN) COMPANY LIMITED [CN]/[CN]
Inventeurs
  • 郑文豪 ZHENG, Wenhao
  • 康烈 KANG, Lie
  • 颜强 YAN, Qiang
Mandataires
  • 北京三高永信知识产权代理有限责任公司 BEIJING SAN GAO YONG XIN INTELLECTUAL PROPERTY AGENCY CO., LTD.
Données relatives à la priorité
201811494250.X07.12.2018CN
Langue de publication chinois (ZH)
Langue de dépôt chinois (ZH)
États désignés
Titre
(EN) KEYWORD EXTRACTION MODEL TRAINING METHOD, KEYWORD EXTRACTION METHOD, AND COMPUTER DEVICE
(FR) PROCÉDÉ D'APPRENTISSAGE DE MODÈLE D'EXTRACTION DE MOT-CLÉ, PROCÉDÉ D'EXTRACTION DE MOT-CLÉ ET DISPOSITIF INFORMATIQUE
(ZH) 关键词提取模型训练方法、关键词提取方法及计算机设备
Abrégé
(EN)
A keyword extraction method, a keyword extraction model training method, a computer device, and a storage medium. The keyword extraction method comprises: performing word segmentation processing on text to obtain a plurality of candidate words; cutting a title corresponding to semantic meaning of the text in units of characters to obtain a plurality of characters (301); sequentially inputting the plurality of candidate words into a keyword extraction model to obtain attention weights of the candidate words with respect to the characters (302), the attention weights being used for representing the degree of semantic association of the candidate words with the characters; selecting the candidate words appearing in the title from the candidate words (303); determining an extraction threshold according to the attention weights of the selected candidate words with respect to the characters (304); and determining keywords of the text from the candidate words according to the extraction threshold (305).
(FR)
Procédé d'extraction de mot-clé, procédé d'apprentissage de modèle d'extraction de mot-clé, dispositif informatique et support d'informations. Le procédé d'extraction de mots-clé consiste à réaliser un traitement de segmentation de mot sur du texte pour obtenir une pluralité de mots candidats; couper un titre correspondant à la signification sémantique du texte en unités de caractères pour obtenir une pluralité de caractères (301); entrer séquentiellement la pluralité de mots candidats dans un modèle d'extraction de mot-clé pour obtenir des poids d'attention des mots candidats par rapport aux caractères (302), les poids d'attention étant utilisés pour représenter le degré d'association sémantique des mots candidats avec les caractères; sélectionner les mots candidats apparaissant dans le titre à partir des mots candidats (303); déterminer un seuil d'extraction en fonction des poids d'attention des mots candidats sélectionnés par rapport aux caractères (304); et déterminer des mots-clés du texte à partir des mots candidats selon le seuil d'extraction (305).
(ZH)
一种关键词提取方法,以及一种关键词提取模型的训练方法、计算机设备及存储介质。所述关键词提取方法包括:对文本进行分词处理,得到多个候选词;对与所述文本语义相对应的标题以字符为单位进行切分,得到多个字符(301);将所述多个候选词依次输入关键词提取模型,得到各个候选词相对于各个字符的注意力权重(302),所述注意力权重用于表征每个候选词分别与各个字符的语义关联程度;从各个候选词中选择在所述标题中出现的候选词(303);根据所述选择出的候选词相对于各个字符的注意力权重,确定提取阈值(304);根据所述提取阈值,从所述各个候选词中确定出所述文本的关键词(305)。
Également publié en tant que
Dernières données bibliographiques dont dispose le Bureau international