WIPO logo
Mobile | Deutsch | Español | Français | 日本語 | 한국어 | Português | Русский | 中文 | العربية |
PATENTSCOPE

Search International and National Patent Collections
World Intellectual Property Organization
Search
 
Browse
 
Translate
 
Options
 
News
 
Login
 
Help
 
Machine translation
1. (WO2002031813) VOICE-DRIVEN DEVICE CONTROL WITH AN OPTIMISATION FOR A USER
Latest bibliographic data on file with the International Bureau   

Pub. No.:    WO/2002/031813    International Application No.:    PCT/DE2001/003925
Publication Date: 18.04.2002 International Filing Date: 12.10.2001
IPC:
G10L 15/07 (2013.01), G10L 17/04 (2013.01), G10L 17/22 (2013.01)
Applicants: VOICECOM AG [DE/DE]; Südwestpark 48 90449 Nürnberg (DE) (For All Designated States Except US).
SCHIMMER, Klaus [DE/DE]; (DE) (For US Only).
PLANKENSTEINER, Peter [DE/DE]; (DE) (For US Only).
HARBECK, Stefan [DE/DE]; (DE) (For US Only)
Inventors: SCHIMMER, Klaus; (DE).
PLANKENSTEINER, Peter; (DE).
HARBECK, Stefan; (DE)
Agent: LEONHARD OLGEMOELLER FRICKE; Postfach 10 09 57 80083 München (DE)
Priority Data:
100 50 808.1 13.10.2000 DE
Title (DE) SPRACHGEFÜHRTE GERÄTESTEUERUNG MIT EINER OPTIMIERUNG FÜR EINEN BENUTZER
(EN) VOICE-DRIVEN DEVICE CONTROL WITH AN OPTIMISATION FOR A USER
(FR) COMMANDE VOCALE D"APPAREIL PRESENTANT UNE OPTIMISATION POUR UN UTILISATEUR
Abstract: front page image
(DE)Die Erfindung bezieht sich auf ein Verfahren zum Vorbereiten, Betreiben oder Anpassen einer sprachgesteuerten Steuerungseinrichtung zur Bedienung eines technisches Gerätes (52), wobei ein Audiosignal (sa) aus zumindest einem von einem Sprecher abgegebenen Wort einem ersten Signaleingang (10) einer Authentifizierungseinrichtung (2) zugeführt wird. Eine Sprechererkennung erfolgt aufgrund eines Authentifizierungsversuchs (2), um einen Sprecher als Individuum oder eine objektivierte Gruppe von Sprechern festzulegen, der der Sprecher durch objektivierte Kriterien des auf ihn zurückzuführenden Audiosignals zuzuordnen ist, und ein entsprechendes Ausgangssignal (a, a*) abzugeben. Es wird ein zum festgelegten Sprecher oder der objektivierten Gruppe korrespondierendes Profil (33) aus einer Vielzahl gespeicherter Profile (32,Pi) ausgewählt (2,31), gestützt auf das Ausgangssignal (a, a*) der Authentifizierung und das ausgewählte Profil (33) in eine Erkennungsumgebung (4) eingebunden oder geladen, um die Erkennungsumgebung auf den festgelegten Sprecher bzw. die objektivierte Gruppe hin anzupassen. Jedes der gespeicherten Profile (Pi) und das eingebundene oder geladene Profil (33) enthält Parameter, zur Beeinflussung zumindest einer in der Erkennungsumgebung (4) vorgesehenen Wortfolgeerkennung (42).
(EN)The invention relates to a method for preparing, operating or adapting a voice-driven control device for operating a technical device (52). An audio signal (sa) consisting of at least one word uttered by a speaker is fed to a first signal input (10) of an authentication device (2). A speaker recognition operation is carried out on the basis of an authentication attempt (2) in order to establish a speaker as an individual or as an objectivated group of speakers to which the speaker is to be assigned through objectivated criteria of the audio signal to be traced back to the speaker, and in order to deliver a corresponding output signal (a, a*). A profile (33) corresponding to the established speaker or the objectivated group is selected (2,31) from a number of stored profiles (32,Pi) with the aid of the output signal (a, a*) from the authentication, and the selected profile (33) is integrated or loaded into a recognition environment (4) in order to adapt the recognition environment to the established speaker or the objectivated group. Each of the stored profiles (Pi) and the integrated or loaded profile (33) contain parameters for influencing at least one recognition of a word sequence (42) provided in the recognition environment (4).
(FR)L"invention concerne un procédé pour préparer, faire fonctionner ou adapter un système de commande vocale servant à l"utilisation d"un appareil technique (52). Ce procédé consiste à acheminer un signal audio (sa), constitué d"au moins un mot prononcé par un locuteur, à une première entrée de signal (10) d"une unité d"authentification (2). Il consiste également à effectuer une reconnaissance vocale sur la base d"une tentative d"identification de l"unité (2), pour spécifier un locuteur en tant qu"individu ou groupe objectivé de locuteurs auquel le locuteur doit être affecté par l"intermédiaire de critères objectivés du signal audio dont il est à l"origine, et pour émettre un signal de sortie correspondant (a, a*). Ce procédé consiste également à sélectionner (2,31), parmi une pluralité de profils mémorisés (32,P¿i?), un profil (33) correspondant au locuteur spécifié ou au groupe objectivé, sur la base du signal de sortie (a, a*) de l"authentification. Il consiste également à intégrer ou charger le profil sélectionné (33) dans un environnement de reconnaissance (4) pour adapter ce dernier au locuteur spécifié ou au groupe objectivé. Chacun des profils mémorisés (P¿i?) et le profil intégré ou chargé (33) contiennent des paramètres qui servent à influer au moins sur une reconnaissance d"une séquence de mots (42) prévue dans l"environnement de reconnaissance (4).
Designated States: AE, AG, AL, AM, AT, AU, AZ, BA, BB, BG, BR, BY, BZ, CA, CH, CN, CO, CR, CU, CZ, DE, DK, DM, DZ, EC, EE, ES, FI, GB, GD, GE, GH, GM, HR, HU, ID, IL, IN, IS, JP, KE, KG, KP, KR, KZ, LC, LK, LR, LS, LT, LU, LV, MA, MD, MG, MK, MN, MW, MX, MZ, NO, NZ, PH, PL, PT, RO, RU, SD, SE, SG, SI, SK, SL, TJ, TM, TR, TT, TZ, UA, UG, US, UZ, VN, YU, ZA, ZW.
African Regional Intellectual Property Organization (GH, GM, KE, LS, MW, MZ, SD, SL, SZ, TZ, UG, ZW)
Eurasian Patent Organization (AM, AZ, BY, KG, KZ, MD, RU, TJ, TM)
European Patent Office (AT, BE, CH, CY, DE, DK, ES, FI, FR, GB, GR, IE, IT, LU, MC, NL, PT, SE, TR)
African Intellectual Property Organization (BF, BJ, CF, CG, CI, CM, GA, GN, GQ, GW, ML, MR, NE, SN, TD, TG).
Publication Language: German (DE)
Filing Language: German (DE)