Traitement en cours

Veuillez attendre...

Paramétrages

Paramétrages

Aller à Demande

1. WO2023276539 - DISPOSITIF ET PROCÉDÉ DE CONVERSION DE VOIX, PROGRAMME ET SUPPORT D'ENREGISTREMENT

Numéro de publication WO/2023/276539
Date de publication 05.01.2023
N° de la demande internationale PCT/JP2022/022364
Date du dépôt international 01.06.2022
CIB
G10L 21/013 2013.1
GPHYSIQUE
10INSTRUMENTS DE MUSIQUE; ACOUSTIQUE
LANALYSE OU SYNTHÈSE DE LA PAROLE; RECONNAISSANCE DE LA PAROLE; TRAITEMENT DE LA PAROLE OU DE LA VOIX; CODAGE OU DÉCODAGE DE LA PAROLE OU DE SIGNAUX AUDIO
21Traitement du signal de parole ou de voix pour produire un autre signal audible ou non audible, p.ex. visuel ou tactile, afin de modifier sa qualité ou son intelligibilité
003Changement de la qualité de la voix, p.ex. de la hauteur tonale ou des formants
007caractérisé par le procédé utilisé
013Adaptation à la hauteur tonale ciblée
G10L 25/30 2013.1
GPHYSIQUE
10INSTRUMENTS DE MUSIQUE; ACOUSTIQUE
LANALYSE OU SYNTHÈSE DE LA PAROLE; RECONNAISSANCE DE LA PAROLE; TRAITEMENT DE LA PAROLE OU DE LA VOIX; CODAGE OU DÉCODAGE DE LA PAROLE OU DE SIGNAUX AUDIO
25Techniques d'analyses de la parole ou de la voix qui ne se limitent pas à un seul des groupes G10L15/-G10L21/146
27caractérisées par la technique d’analyse
30utilisant des réseaux neuronaux
Déposants
  • 株式会社ドワンゴ DWANGO CO., LTD. [JP]/[JP]
Inventeurs
  • 廣芝 和之 HIROSHIBA Kazuyuki
  • 小田桐 優理 ODAGIRI Yuri
  • 北岡 伸也 KITAOKA Shinya
Mandataires
  • 三好 秀和 MIYOSHI Hidekazu
  • 高橋 俊一 TAKAHASHI Shunichi
  • 伊藤 正和 ITO Masakazu
  • 高松 俊雄 TAKAMATSU Toshio
Données relatives à la priorité
2021-10870730.06.2021JP
Langue de publication Japonais (ja)
Langue de dépôt japonais (JA)
États désignés
Titre
(EN) VOICE CONVERSION DEVICE, VOICE CONVERSION METHOD, PROGRAM, AND RECORDING MEDIUM
(FR) DISPOSITIF ET PROCÉDÉ DE CONVERSION DE VOIX, PROGRAMME ET SUPPORT D'ENREGISTREMENT
(JA) 音声変換装置、音声変換方法、プログラム、および記録媒体
Abrégé
(EN) A voice conversion device 1 comprises an input unit 11 for inputting a designation of a conversion destination voice, an extraction unit 12 for analyzing a voice signal of a conversion origin voice and extracting time series data including a phoneme and a pitch, an adjustment unit 13 for matching the height of a pitch to the pitch of the designated conversion destination voice, and a generating unit 14 for generating a voice signal obtained by inputting the phoneme and the pitch in time series order to a deep learning model whereby voice data of a large number of people can be learned to synthesize the voice of a designated person, and synthesizing the designated conversion destination voice.
(FR) L'invention concerne un dispositif de conversion de voix (1) comprenant : une unité d'entrée (11) destinée à entrer une désignation de voix de destination de conversion; une unité d'extraction (12) destinée à analyser un signal vocal d'une voix d'origine de conversion et à extraire des données de séries temporelles contenant un phonème et une hauteur; une unité de réglage (13) destinée à adapter la hauteur à la hauteur de la voix de destination de conversion désignée; et une unité de génération (14) destinée à générer un signal vocal obtenu par entrée du phonème et de la hauteur dans l'ordre des séries temporelles dans un modèle d'apprentissage profond, des données vocales d'un grand nombre de personnes pouvant être apprises pour synthétiser la voix d'une personne désignée, et à synthétiser la voix de destination de conversion désignée.
(JA) 音声変換装置1は、変換先の声の指定を入力する入力部11と、変換元の声の音声信号を解析して音素と音高を含む時系列データを抽出する抽出部12と、音高の高さを指定された変換先の声の高さに合わせる調整部13と、多人数の音声データを学習して指定の人の音声を合成できる深層学習モデルに、音素と音高を時系列順に入力して指定された変換先の声を合成した音声信号を生成する生成部14を備える。
Documents de brevet associés
Dernières données bibliographiques dont dispose le Bureau international