Processing

Please wait...

Settings

Settings

Goto Application

1. WO2020108400 - TEXT TRANSLATION METHOD AND DEVICE, AND STORAGE MEDIUM

Publication Number WO/2020/108400
Publication Date 04.06.2020
International Application No. PCT/CN2019/120264
International Filing Date 22.11.2019
IPC
G06F 17/00 2019.01
GPHYSICS
06COMPUTING; CALCULATING OR COUNTING
FELECTRIC DIGITAL DATA PROCESSING
17Digital computing or data processing equipment or methods, specially adapted for specific functions
CPC
G06F 40/58
GPHYSICS
06COMPUTING; CALCULATING; COUNTING
FELECTRIC DIGITAL DATA PROCESSING
40Handling natural language data
40Processing or translation of natural language
58Use of machine translation, e.g. for multi-lingual retrieval, for server-side translation for client devices or for real-time translation
Applicants
  • 腾讯科技(深圳)有限公司 TENCENT TECHNOLOGY (SHENZHEN) COMPANY LIMITED [CN]/[CN]
Inventors
  • 涂兆鹏 TU, Zhaopeng
  • 耿昕伟 GENG, Xinwei
  • 王龙跃 WANG, Longyue
  • 王星 WANG, Xing
Agents
  • 北京三高永信知识产权代理有限责任公司 BEIJING SAN GAO YONG XIN INTELLECTUAL PROPERTY AGENCY CO., LTD.
Priority Data
201811448899.828.11.2018CN
Publication Language Chinese (ZH)
Filing Language Chinese (ZH)
Designated States
Title
(EN) TEXT TRANSLATION METHOD AND DEVICE, AND STORAGE MEDIUM
(FR) PROCÉDÉ ET DISPOSITIF DE TRADUCTION DE TEXTE, ET SUPPORT DE STOCKAGE
(ZH) 一种文本翻译的方法、装置及存储介质
Abstract
(EN)
Disclosed is a text translation method. The method comprises: acquiring a text sequence to be translated; performing encoding processing on said text sequence to obtain a first hidden state sequence; acquiring a first state vector; generating a second hidden state sequence according to the first state vector and the first hidden state sequence; generating a context vector corresponding to a current word according to the second hidden state sequence and the first state vector; and determining a second target word according to the context vector, the first state vector and a first target word, wherein the first target word is a translation result corresponding to the previous word, and the second target word is a translation result corresponding to the current word. Further disclosed is a text translation device. In the embodiments of the present invention, in the process of encoding a text sequence to be translated which corresponds to a piece of source language text, a context vector obtained by means of decoding is introduced, such that the representation of said text sequence is enhanced, and the translation quality is thus improved.
(FR)
L'invention concerne un procédé de traduction de texte. Le procédé comprend les étapes consistant à : acquérir une séquence de texte à traduire ; réaliser un traitement de codage sur ladite séquence de texte pour obtenir une première séquence d'état caché ; acquérir un premier vecteur d'état ; générer une seconde séquence d'état caché en fonction du premier vecteur d'état et de la première séquence d'état caché ; générer un vecteur de contexte correspondant à un mot courant selon la seconde séquence d'état caché et le premier vecteur d'état ; et déterminer un second mot cible selon le vecteur de contexte, le premier vecteur d'état et un premier mot cible, le premier mot cible étant un résultat de traduction correspondant au mot précédent, et le second mot cible étant un résultat de traduction correspondant au mot courant. L'invention concerne en outre un dispositif de traduction de texte. Dans les modes de réalisation de la présente invention, dans le processus de codage d'une séquence de texte à traduire qui correspond à un morceau de texte en langue source, un vecteur de contexte obtenu par décodage est introduit, de telle sorte que la représentation de ladite séquence de texte est améliorée, et la qualité de traduction est ainsi améliorée.
(ZH)
本发明公开了一种文本翻译的方法,包括:获取待翻译文本序列;对待翻译文本序列进行编码处理,得到第一隐含状态序列;获取第一状态向量;根据第一状态向量以及第一隐含状态序列,生成第二隐含状态序列;根据第二隐含状态序列以及第一状态向量,生成当前词语所对应的上下文向量;根据上下文向量、第一状态向量以及第一目标词,确定第二目标词,其中,第一目标词为上一个词语所对应的翻译结果,第二目标词为当前词语所对应的翻译结果。本发明还公开了一种文本翻译装置。本发明实施例在对源语言文本所对应的待翻译文本序列进行编码的过程中,引入了解码得到的上下文向量,由此增强对待翻译文本序列的表示,从而提升翻译质量。
Also published as
Latest bibliographic data on file with the International Bureau