Traitement en cours

Veuillez attendre...

Paramétrages

Paramétrages

Aller à Demande

1. WO2022093474 - DÉTERMINATION DE DIFFICULTÉ LEXICALE DANS UN CONTENU TEXTUEL

Numéro de publication WO/2022/093474
Date de publication 05.05.2022
N° de la demande internationale PCT/US2021/053054
Date du dépôt international 01.10.2021
CIB
G06F 40/237 2020.1
GPHYSIQUE
06CALCUL; COMPTAGE
FTRAITEMENT ÉLECTRIQUE DE DONNÉES NUMÉRIQUES
40Manipulation de données en langage naturel
20Analyse du langage naturel
237Outils lexicaux
G06F 40/253 2020.1
GPHYSIQUE
06CALCUL; COMPTAGE
FTRAITEMENT ÉLECTRIQUE DE DONNÉES NUMÉRIQUES
40Manipulation de données en langage naturel
20Analyse du langage naturel
253Analyse grammaticale; Corrigé du style
G06F 40/284 2020.1
GPHYSIQUE
06CALCUL; COMPTAGE
FTRAITEMENT ÉLECTRIQUE DE DONNÉES NUMÉRIQUES
40Manipulation de données en langage naturel
20Analyse du langage naturel
279Reconnaissance d’entités textuelles
284Analyse lexicale, p.ex. segmentation en unités ou cooccurrence
G06N 20/00 2019.1
GPHYSIQUE
06CALCUL; COMPTAGE
NSYSTÈMES DE CALCULATEURS BASÉS SUR DES MODÈLES DE CALCUL SPÉCIFIQUES
20Apprentissage automatique
CPC
G06F 16/334
GPHYSICS
06COMPUTING; CALCULATING; COUNTING
FELECTRIC DIGITAL DATA PROCESSING
16Information retrieval; Database structures therefor; File system structures therefor
30of unstructured textual data
33Querying
3331Query processing
334Query execution
G06F 40/237
GPHYSICS
06COMPUTING; CALCULATING; COUNTING
FELECTRIC DIGITAL DATA PROCESSING
40Handling natural language data
20Natural language analysis
237Lexical tools
G06F 40/253
GPHYSICS
06COMPUTING; CALCULATING; COUNTING
FELECTRIC DIGITAL DATA PROCESSING
40Handling natural language data
20Natural language analysis
253Grammatical analysis; Style critique
G06F 40/284
GPHYSICS
06COMPUTING; CALCULATING; COUNTING
FELECTRIC DIGITAL DATA PROCESSING
40Handling natural language data
20Natural language analysis
279Recognition of textual entities
284Lexical analysis, e.g. tokenisation or collocates
G06N 20/00
GPHYSICS
06COMPUTING; CALCULATING; COUNTING
NCOMPUTER SYSTEMS BASED ON SPECIFIC COMPUTATIONAL MODELS
20Machine learning
Déposants
  • MICROSOFT TECHNOLOGY LICENSING, LLC [US]/[US]
Inventeurs
  • KULKARNI, Priyanka, Subhash
  • ROUNTHWAITE, Robert
Mandataires
  • CHATTERJEE, Aaron, C.
  • BARKER, Doug
  • CHEN, Wei-Chen, Nicholas
  • CHOI, Daniel
  • CHURNA, Timothy
  • DINH, Phong
  • EVANS, Patrick
  • GABRYJELSKI, Henry
  • GUPTA, Anand
  • HWANG, William, C.
  • JARDINE, John, S.
  • LEE, Sunah
  • LEMMON, Marcus
  • MARQUIS, Thomas
  • MEYERS, Jessica
  • SPELLMAN, Steven
  • SULLIVAN, Kevin
  • WALKER, Matt
  • WIGHT, Stephen, A.
  • WISDOM, Gregg
  • WONG, Thomas, S.
  • ZHANG, Hannah
  • AKHTER, Julia
  • KADOURA, Judy, M.
  • NIU, Bo
  • BROWN, Renee
  • TRAN, Kimberly
Données relatives à la priorité
17/085,97530.10.2020US
Langue de publication Anglais (en)
Langue de dépôt anglais (EN)
États désignés
Titre
(EN) DETERMINING LEXICAL DIFFICULTY IN TEXTUAL CONTENT
(FR) DÉTERMINATION DE DIFFICULTÉ LEXICALE DANS UN CONTENU TEXTUEL
Abrégé
(EN) Techniques performed by a data processing system for analyzing the lexical difficulty of words of textual content include analyzing plurality of textual content sources to determine a first frequency at which each of a plurality of first words appears, analyzing search data to determine a second frequency at which each of the plurality of first words appear in searches for a definition, generating a lexical difficulty model based on the first frequency and the second frequency, the model is configured to receive a word as an input and to output a prediction for how difficult the word is likely to be for a user, receiving a request to analyze first textual content from a client device, analyzing the first textual content using the lexical difficulty model to generate lexical difficulty information, and sending a response to the client device that includes requested information.
(FR) Des techniques mises en œuvre par un système de traitement de données pour analyser la difficulté lexicale de mots de contenu textuel comprennent l'analyse d'une pluralité de sources de contenu textuel pour déterminer une première fréquence à laquelle chaque mot d'une pluralité de premiers mots apparaît, l'analyse de données de recherche pour déterminer une seconde fréquence à laquelle chacun de la pluralité de premiers mots apparaissent dans des recherches pour une définition, la génération d'un modèle de difficulté lexicale sur la base de la première fréquence et de la seconde fréquence. Le modèle est configuré pour recevoir un mot en tant qu'entrée et pour délivrer en sortie une prédiction du niveau de difficulté probable du mot pour un utilisateur, recevoir une demande d'analyse d'un premier contenu textuel en provenance d'un dispositif client, analyser le premier contenu textuel à l'aide du modèle de difficulté lexicale pour générer des informations de difficulté lexicale, et envoyer une réponse au dispositif client qui comprend des informations demandées.
Documents de brevet associés
Dernières données bibliographiques dont dispose le Bureau international