Traitement en cours

Veuillez attendre...

Paramétrages

Paramétrages

Goto Application

1. WO2020069387 - NAVIGATION AUTOMATIQUE DE DOCUMENTS WEB INTERACTIFS

Numéro de publication WO/2020/069387
Date de publication 02.04.2020
N° de la demande internationale PCT/US2019/053569
Date du dépôt international 27.09.2019
CIB
G06F 17/24 2006.01
GPHYSIQUE
06CALCUL; COMPTAGE
FTRAITEMENT ÉLECTRIQUE DE DONNÉES NUMÉRIQUES
17Équipement ou méthodes de traitement de données ou de calcul numérique, spécialement adaptés à des fonctions spécifiques
20Manipulation de données en langage naturel
21Traitement de texte
24Edition, p.ex. insertion/suppression
CPC
G06F 40/174
GPHYSICS
06COMPUTING; CALCULATING; COUNTING
FELECTRIC DIGITAL DATA PROCESSING
40Handling natural language data
10Text processing
166Editing, e.g. inserting or deleting
174Form filling; Merging
Déposants
  • GOOGLE LLC [US]/[US]
Inventeurs
  • FAUST, Aleksandra
  • HAKKANI-TUR, Dilek
  • GUR, Izzeddin
  • RUECKERT, Ulrich
Mandataires
  • SHUMAKER, Brantley
  • MIDDLETON REUTLINGER
  • HIGDON, Scott
  • SALAZAR, John
  • CUMMINS, Patrick
Données relatives à la priorité
62/737,84327.09.2018US
Langue de publication anglais (EN)
Langue de dépôt anglais (EN)
États désignés
Titre
(EN) AUTOMATIC NAVIGATION OF INTERACTIVE WEB DOCUMENTS
(FR) NAVIGATION AUTOMATIQUE DE DOCUMENTS WEB INTERACTIFS
Abrégé
(EN)
The present disclosure is generally directed to methods, apparatus, and computer-readable media (transitory and non-transitory) for learning to automatically navigate interactive web documents and/or websites. More particularly, various approaches are presented for training various deep Q network (DQN) agents to perform various tasks associated with reinforcement learning, including hierarchical reinforcement learning, in challenging web navigation environments with sparse rewards and large state and action spaces. These agents include a web navigation agent that can use learned value function(s) to automatically navigate through interactive web documents, as well as a training agent, referred to herein as a "meta-trainer," that can be trained to generate synthetic training examples. Some approaches described herein may be implemented when expert demonstrations are available. Other approaches described herein may be implemented when expert demonstrations are not available. In either case, dense, potential-based rewards may be used to augment the training.
(FR)
La présente invention concerne de manière générale des procédés, un appareil et des supports lisibles par ordinateur (transitoires et non transitoires) d'apprentissage pour naviguer automatiquement sur des documents Web et/ou des sites Web interactifs. Plus particulièrement, diverses approches sont présentées pour entraîner divers agents de réseau Q profond (DQN) à effectuer diverses tâches associées à un apprentissage par renforcement, comprenant un apprentissage par renforcement hiérarchique, dans des environnements de navigation Web difficiles avec des récompenses éparses et des espaces d'action et d'état importants. Ces agents comprennent un agent de navigation Web qui peut utiliser une ou plusieurs fonctions de valeur apprises pour naviguer automatiquement à travers des documents Web interactifs, ainsi qu'un agent d'apprentissage, désigné ici par "dispositif de méta-apprentissage", qui peut être entraîné pour générer des exemples d'apprentissage synthétique. Certaines approches décrites dans la présente invention peuvent être mises en œuvre lorsque des démonstrations d'expert sont disponibles. D'autres approches décrites dans la présente invention peuvent être mises en œuvre lorsque des démonstrations d'expert ne sont pas disponibles. Dans les deux cas, des récompenses éparses basées sur le potentiel peuvent être utilisées pour augmenter l'apprentissage.
Dernières données bibliographiques dont dispose le Bureau international