WIPO logo
Mobile | Deutsch | Español | Français | 日本語 | 한국어 | Português | Русский | 中文 | العربية |
PATENTSCOPE

Search International and National Patent Collections
World Intellectual Property Organization
Search
 
Browse
 
Translate
 
Options
 
News
 
Login
 
Help
 
Machine translation
1. (WO2017204843) UNIT-SELECTION TEXT-TO-SPEECH SYNTHESIS BASED ON PREDICTED CONCATENATION PARAMETERS
Latest bibliographic data on file with the International Bureau    Submit observation

Pub. No.:    WO/2017/204843    International Application No.:    PCT/US2016/053313
Publication Date: 30.11.2017 International Filing Date: 23.09.2016
IPC:
G06F 17/20 (2006.01), G10L 13/00 (2006.01), G10L 13/08 (2013.01), G10L 15/04 (2013.01)
Applicants: APPLE INC. [US/US]; 1 Infinite Loop Cupertino, CA 95014 (US)
Inventors: RAITIO, Tuomo, J.; (US).
PRAHALLAD, Kishore, Sunkeswari; (US).
CONKIE, Alistair, D.; (US).
GOLIPOUR, Ladan; (US).
WINARSKY, David; (US)
Agent: EIDE, Christopher, B.; (US).
ARJOMAND, Mehran; (US).
BELUSKO, Vincent, J.; (US).
BANKO, Max; (US).
BASOL, Erol, C.; (US)
Priority Data:
62/341,948 26.05.2016 US
Title (EN) UNIT-SELECTION TEXT-TO-SPEECH SYNTHESIS BASED ON PREDICTED CONCATENATION PARAMETERS
(FR) SYNTHÈSE TEXTE-PAROLE À SÉLECTION D'UNITÉS BASÉE SUR DES PARAMÈTRES DE CONCATÉNATION PRÉDITS
Abstract: front page image
(EN)Systems and processes for performing unit- selection text-to- speech synthesis are provided. In an example process, text to be converted to speech is received. The text is represented as a sequence of target units. A plurality of candidate speech segments corresponding to the sequence of target units are selected. Predicted statistical parameters of acoustic features associated with the sequence of target units are determined. The predicted statistical parameters of acoustic features are used to determine target costs and concatenation costs associated with the plurality of candidate speech segments. Based on a combined cost determined from the target costs and concatenation costs, a subset of candidate speech segments is selected from the plurality of candidate speech segments. Speech corresponding to the received text is generated using the subset of candidate speech segments.
(FR)L'invention concerne des systèmes et des procédés permettant d'effectuer une synthèse texte-parole à sélection d'unités. Dans un exemple de processus, le texte devant être converti en parole est reçu. Le texte est représenté sous la forme d'une séquence d'unités cibles. Une pluralité de segments de parole candidats correspondant à la séquence d'unités cibles est sélectionnée. Des paramètres statistiques prédits de caractéristiques acoustiques associées à la séquence d'unités cibles sont déterminés. Les paramètres statistiques prédits des caractéristiques acoustiques sont utilisés pour déterminer des coûts cibles et des coûts de concaténation associés à la pluralité de segments de parole candidats. Sur la base d'un coût combiné déterminé à partir des coûts cibles et des coûts de concaténation, un sous-ensemble de segments de parole candidats est sélectionné parmi la pluralité de segments de parole candidats. La parole correspondant au texte reçu est générée à l'aide du sous-ensemble de segments de parole candidats.
Designated States: AE, AG, AL, AM, AO, AT, AU, AZ, BA, BB, BG, BH, BN, BR, BW, BY, BZ, CA, CH, CL, CN, CO, CR, CU, CZ, DE, DJ, DK, DM, DO, DZ, EC, EE, EG, ES, FI, GB, GD, GE, GH, GM, GT, HN, HR, HU, ID, IL, IN, IR, IS, JP, KE, KG, KN, KP, KR, KW, KZ, LA, LC, LK, LR, LS, LU, LY, MA, MD, ME, MG, MK, MN, MW, MX, MY, MZ, NA, NG, NI, NO, NZ, OM, PA, PE, PG, PH, PL, PT, QA, RO, RS, RU, RW, SA, SC, SD, SE, SG, SK, SL, SM, ST, SV, SY, TH, TJ, TM, TN, TR, TT, TZ, UA, UG, US, UZ, VC, VN, ZA, ZM, ZW.
African Regional Intellectual Property Organization (BW, GH, GM, KE, LR, LS, MW, MZ, NA, RW, SD, SL, ST, SZ, TZ, UG, ZM, ZW)
Eurasian Patent Organization (AM, AZ, BY, KG, KZ, RU, TJ, TM)
European Patent Office (AL, AT, BE, BG, CH, CY, CZ, DE, DK, EE, ES, FI, FR, GB, GR, HR, HU, IE, IS, IT, LT, LU, LV, MC, MK, MT, NL, NO, PL, PT, RO, RS, SE, SI, SK, SM, TR)
African Intellectual Property Organization (BF, BJ, CF, CG, CI, CM, GA, GN, GQ, GW, KM, ML, MR, NE, SN, TD, TG).
Publication Language: English (EN)
Filing Language: English (EN)