WIPO logo
Mobile | Deutsch | Español | Français | 日本語 | 한국어 | Português | Русский | 中文 | العربية |
PATENTSCOPE

Search International and National Patent Collections
World Intellectual Property Organization
Search
 
Browse
 
Translate
 
Options
 
News
 
Login
 
Help
 
Machine translation
1. (WO2002003378) SPEECH RECOGNITION DEVICE, AND METHOD, AND RECORDING MEDIUM
Latest bibliographic data on file with the International Bureau   

Pub. No.:    WO/2002/003378    International Application No.:    PCT/JP2001/005762
Publication Date: 10.01.2002 International Filing Date: 03.07.2001
Chapter 2 Demand Filed:    03.07.2001    
IPC:
G10L 15/06 (2006.01)
Applicants: NEC CORPORATION [JP/JP]; 7-1, Shiba 5-chome Minato-ku, Tokyo 108-8001 (JP) (For All Designated States Except US).
ISO, Ken-ichi [JP/JP]; (JP) (For US Only)
Inventors: ISO, Ken-ichi; (JP)
Agent: MARUYAMA, Takao; c/o MARUYAMA PATENT OFFICE SAM Build. 3floor, 38-23, Higashi-Ikebukuro 2-chome Toshima-ku, Tokyo 170-0013 (JP)
Priority Data:
2000-204111 05.07.2000 JP
Title (EN) SPEECH RECOGNITION DEVICE, AND METHOD, AND RECORDING MEDIUM
(FR) DISPOSITIF ET PROCEDE DE RECONNAISSANCE VOCALE, ET SUPPORT D'ENREGISTREMENT
Abstract: front page image
(EN)A device and method for creating a standard pattern resisting against speech fluctuations or for adapting the speaker, by extracting the feature vector time series of not one kind but a plurality of kinds of feature extracting intervals / starting positions, from a speech for creating a standard pattern or for learning the speaker, to increase the amount of learning data equivalently. By extracting a plurality of feature vector time series of a plurality of feature extracting interval and starting positions from one speech and by using the extracted time series for creating the standard pattern and for learning the speaker, thereby is obtaining an effect nearly equivalent to that obtained by collecting many speeches.
(FR)La présente invention concerne un dispositif et un procédé servant à produire un motif standard résistant aux fluctuations de la voix, ou à permettre l'adaptation à la personne qui parle, par extraction de séries temporelles de vecteurs de caractéristiques non d'un seul type, mais d'une pluralité de types d'intervalles d'extraction de caractéristiques / de positions d'origine, à partir d'une voix, afin de produire un motif standard ou d'apprendre à connaître la personne qui parle dans le but d'augmenter la quantité de données d'apprentissage en conséquence. L'extraction d'une pluralité de séries temporelles de vecteurs de caractéristiques d'une pluralité d'intervalles d'extraction de caractéristiques et de positions d'origine à partir d'une voix, et l'utilisation des séries temporelles extraites pour produire le motif standard et pour permettre d'apprendre à reconnaître la personne qui parle, permet d'obtenir un effet approximativement équivalent à celui obtenu par le recueil de plusieurs voix.
Designated States: CA, US.
European Patent Office (AT, BE, CH, CY, DE, DK, ES, FI, FR, GB, GR, IE, IT, LU, MC, NL, PT, SE, TR).
Publication Language: Japanese (JA)
Filing Language: Japanese (JA)