Traitement en cours

Veuillez attendre...

Paramétrages

Paramétrages

Aller à Demande

1. WO2021061370 - RÉSOLUTION D'AMBIGUÏTÉS EN LANGAGE NATUREL PAR RAPPORT À UN RÉGLAGE DE RÉALITÉ SIMULÉE

Numéro de publication WO/2021/061370
Date de publication 01.04.2021
N° de la demande internationale PCT/US2020/049284
Date du dépôt international 03.09.2020
CIB
G06F 3/16 2006.01
GPHYSIQUE
06CALCUL; COMPTAGE
FTRAITEMENT ÉLECTRIQUE DE DONNÉES NUMÉRIQUES
3Dispositions d'entrée pour le transfert de données à traiter pour leur donner une forme utilisable par le calculateur; Dispositions de sortie pour le transfert de données de l'unité de traitement à l'unité de sortie, p.ex. dispositions d'interface
16Entrée acoustique; Sortie acoustique
CPC
G06F 3/013
GPHYSICS
06COMPUTING; CALCULATING; COUNTING
FELECTRIC DIGITAL DATA PROCESSING
3Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
01Input arrangements or combined input and output arrangements for interaction between user and computer
011Arrangements for interaction with the human body, e.g. for user immersion in virtual reality
013Eye tracking input arrangements
G06F 3/017
GPHYSICS
06COMPUTING; CALCULATING; COUNTING
FELECTRIC DIGITAL DATA PROCESSING
3Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
01Input arrangements or combined input and output arrangements for interaction between user and computer
017Gesture based interaction, e.g. based on a set of recognized hand gestures
G06F 3/167
GPHYSICS
06COMPUTING; CALCULATING; COUNTING
FELECTRIC DIGITAL DATA PROCESSING
3Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
16Sound input; Sound output
167Audio in a user interface, e.g. using voice commands for navigating, audio feedback
G10L 15/22
GPHYSICS
10MUSICAL INSTRUMENTS; ACOUSTICS
LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
15Speech recognition
22Procedures used during a speech recognition process, e.g. man-machine dialogue
G10L 15/26
GPHYSICS
10MUSICAL INSTRUMENTS; ACOUSTICS
LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
15Speech recognition
26Speech to text systems
G10L 2015/228
GPHYSICS
10MUSICAL INSTRUMENTS; ACOUSTICS
LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
15Speech recognition
22Procedures used during a speech recognition process, e.g. man-machine dialogue
226using non-speech characteristics
228of application context
Déposants
  • APPLE INC. [US]/[US]
Inventeurs
  • MANJUNATH, Niranjan
  • ANDRUS, Scott M.
  • HUANG, Xinyuan
  • LUCIW, William W.
  • RUSSELL, Jonathan H.
Mandataires
  • EIDE, Christopher B.
Données relatives à la priorité
62/905,11424.09.2019US
Langue de publication anglais (EN)
Langue de dépôt anglais (EN)
États désignés
Titre
(EN) RESOLVING NATURAL LANGUAGE AMBIGUITIES WITH RESPECT TO A SIMULATED REALITY SETTING
(FR) RÉSOLUTION D'AMBIGUÏTÉS EN LANGAGE NATUREL PAR RAPPORT À UN RÉGLAGE DE RÉALITÉ SIMULÉE
Abrégé
(EN)
The present disclosure relates to resolving natural language ambiguities with respect to a simulated reality setting. In an exemplary embodiment, a simulated reality setting having one or more virtual objects is displayed. A stream of gaze events is generated from the simulated reality setting and a stream of gaze data. A speech input is received within a time period and a domain is determined based on a text representation of the speech input. Based on the time period and a plurality of event times for the stream of gaze events, one or more gaze events are identified from the stream of gaze events. The identified one or more gaze events is used to determine a parameter value for an unresolved parameter of the domain. A set of tasks representing a user intent for the speech input is determined based on the parameter value and the set of tasks is performed.
(FR)
La présente invention concerne la résolution d'ambiguïtés en langage naturel par rapport à un réglage de réalité simulée. Dans un mode de réalisation donné à titre d'exemple, un réglage de réalité simulée comportant un ou plusieurs objets virtuels est affiché. Un flux d'événements de regard est généré à partir du réglage de réalité simulée et d'un flux de données de regard. Une entrée vocale est reçue au cours d'une période de temps et un domaine est déterminé sur la base d'une représentation textuelle de l'entrée vocale. Sur la base de la période de temps et d'une pluralité de moments d'événement pour le flux d'événements de regard, un ou plusieurs événements de regard sont identifiés à partir du flux d'événements de regard. Le ou les événements de regard identifiés sont utilisés pour déterminer une valeur de paramètre pour un paramètre non résolu du domaine. Un ensemble de tâches représentant une intention d'utilisateur pour l'entrée vocale est déterminé sur la base de la valeur de paramètre et l'ensemble de tâches est effectué.
Également publié en tant que
Dernières données bibliographiques dont dispose le Bureau international