Traitement en cours

Veuillez attendre...

Paramétrages

Paramétrages

Aller à Demande

1. WO2020197985 - DÉTERMINATION DE SIMILARITÉ SÉMANTIQUE DE TEXTES SUR LA BASE DE SOUS-SECTIONS DE CEUX-CI

Numéro de publication WO/2020/197985
Date de publication 01.10.2020
N° de la demande internationale PCT/US2020/023804
Date du dépôt international 20.03.2020
CIB
G06F 16/33 2019.01
GPHYSIQUE
06CALCUL; COMPTAGE
FTRAITEMENT ÉLECTRIQUE DE DONNÉES NUMÉRIQUES
16Recherche d’informations; Structures de bases de données à cet effet; Structures de systèmes de fichiers à cet effet
30de données textuelles non structurées
33Requêtes
CPC
G06F 16/3347
GPHYSICS
06COMPUTING; CALCULATING; COUNTING
FELECTRIC DIGITAL DATA PROCESSING
16Information retrieval; Database structures therefor; File system structures therefor
30of unstructured textual data
33Querying
3331Query processing
334Query execution
3347using vector based model
G06F 40/205
GPHYSICS
06COMPUTING; CALCULATING; COUNTING
FELECTRIC DIGITAL DATA PROCESSING
40Handling natural language data
20Natural language analysis
205Parsing
G06F 40/284
GPHYSICS
06COMPUTING; CALCULATING; COUNTING
FELECTRIC DIGITAL DATA PROCESSING
40Handling natural language data
20Natural language analysis
279Recognition of textual entities
284Lexical analysis, e.g. tokenisation or collocates
G06F 40/30
GPHYSICS
06COMPUTING; CALCULATING; COUNTING
FELECTRIC DIGITAL DATA PROCESSING
40Handling natural language data
30Semantic analysis
Déposants
  • SERVICENOW, INC. [US]/[US]
Inventeurs
  • TURKKAN, Omer, Anil
  • KARAKUSOGLU, Firat
  • PALAPUDI, Sriram
Mandataires
  • FLETCHER, Michael, G.
  • RARIDEN, John M.
  • POWELL, W. Allen
  • MANWARE, Robert A.
  • DOOLEY, Matthew C.
  • HENWOOD, Matthew C.
  • KANTOR, Andrew L.
  • OSTERHAUS, Matthew G.
  • SINCLAIR, JR., Steven J.
  • CROWE, Laura C.
  • SWANSON, Tait R.
  • THOMAS, Jim
  • WIMMER, Lance G.
  • YODER, Patrick S.
Données relatives à la priorité
16/362,18722.03.2019US
Langue de publication anglais (EN)
Langue de dépôt anglais (EN)
États désignés
Titre
(EN) DETERMINING SEMANTIC SIMILARITY OF TEXTS BASED ON SUB-SECTIONS THEREOF
(FR) DÉTERMINATION DE SIMILARITÉ SÉMANTIQUE DE TEXTES SUR LA BASE DE SOUS-SECTIONS DE CEUX-CI
Abrégé
(EN)
Systems and methods are provided to compare a target sample of text 1102 to a set of textual records 1100, each textual record 1100 including a sample of text 1102 and an indication of one or more segments of text within the sample of text 1102. Semantic similarity values between the target sample of text and each of the textual records are determined. Determining a particular semantic similarity value between the target sample of text 1102 and a particular textual record 1100 of the corpus includes: (i) determining individual semantic similarity values between the target sample of text 1102 and each of the segments of text indicated by the particular textual record 1100, and (ii) generating the particular semantic similarity value between the target sample of text 1102 and the particular textual record 1100 based on the individual semantic similarity values. A textual record 1100 is then selected based on the semantic similarities.
(FR)
L’invention concerne des systèmes et des procédés étant prévus pour comparer un échantillon cible de texte 1102 avec un ensemble d'enregistrements textuels 1100, chaque enregistrement textuel 1100 comprenant un échantillon de texte 1102 et une indication d'un ou plusieurs segments de texte dans l'échantillon de texte 1102. Des valeurs de similarité sémantiques entre l'échantillon de texte cible et chacun des enregistrements textuels sont déterminées. La détermination d'une valeur de similarité sémantique particulière entre l'échantillon de texte cible 1102 et un enregistrement textuel particulier 1100 du corpus comprend : (i) la détermination des valeurs de similarité sémantiques individuelles entre l'échantillon de texte cible 1102 et chacun des segments de texte indiqués par l'enregistrement textuel particulier 1100, et (ii) la génération de la valeur de similarité sémantique particulière entre l'échantillon de texte cible 1102 et l'enregistrement textuel particulier 1100 sur la base des valeurs de similarité sémantiques individuelles. Un enregistrement textuel 1100 est ensuite sélectionné sur la base des similarités sémantiques.
Également publié en tant que
Dernières données bibliographiques dont dispose le Bureau international