Processing

Please wait...

Settings

Settings

Goto Application

1. WO2017033063 - STATISTICS-BASED MACHINE TRANSLATION METHOD, APPARATUS AND ELECTRONIC DEVICE

Publication Number WO/2017/033063
Publication Date 02.03.2017
International Application No. PCT/IB2016/001563
International Filing Date 25.08.2016
IPC
G06F 17/28 2006.01
GPHYSICS
06COMPUTING; CALCULATING OR COUNTING
FELECTRIC DIGITAL DATA PROCESSING
17Digital computing or data processing equipment or methods, specially adapted for specific functions
20Handling natural language data
28Processing or translating of natural language
CPC
G06F 40/205
GPHYSICS
06COMPUTING; CALCULATING; COUNTING
FELECTRIC DIGITAL DATA PROCESSING
40Handling natural language data
20Natural language analysis
205Parsing
G06F 40/30
GPHYSICS
06COMPUTING; CALCULATING; COUNTING
FELECTRIC DIGITAL DATA PROCESSING
40Handling natural language data
30Semantic analysis
G06F 40/44
GPHYSICS
06COMPUTING; CALCULATING; COUNTING
FELECTRIC DIGITAL DATA PROCESSING
40Handling natural language data
40Processing or translation of natural language
42Data-driven translation
44Statistical methods, e.g. probability models
G06F 40/55
GPHYSICS
06COMPUTING; CALCULATING; COUNTING
FELECTRIC DIGITAL DATA PROCESSING
40Handling natural language data
40Processing or translation of natural language
55Rule-based translation
Applicants
  • ALIBABA GROUP HOLDING LIMITED
Inventors
  • ZENG, Xiaodong
  • LUO, Weihua
  • LIN, Feng
Agents
  • NELSON, Brett, L.
  • LEE, Lewis, C.
Priority Data
201510527745.825.08.2015CN
Publication Language English (EN)
Filing Language English (EN)
Designated States
Title
(EN) STATISTICS-BASED MACHINE TRANSLATION METHOD, APPARATUS AND ELECTRONIC DEVICE
(FR) PROCÉDÉ DE TRADUCTION MACHINE BASÉ SUR LES STATISTIQUES, APPAREIL ET DISPOSITIF ÉLECTRONIQUE
Abstract
(EN)
A statistics-based machine translation method is disclosed. The method generates probabilities of translation from a sentence to be translated to candidate translated texts based on features of the candidate translated texts that affect the probabilities of translation and a pre-generated translation probability prediction model. The features that affect probabilities of translation include at least degrees of semantic similarity between the sentence to be translated and the candidate translated texts. A preset number of candidate translated texts with highly ranked probabilities of translation are selected to serve as translated texts of the sentence to be translated. The method is able to go deep into a semantic level of a natural language when a machine translation model is constructed to avoid a semantic deviation of a translated text from an original text, thereby achieving the effect of improving the quality of translation.
(FR)
Procédé de traduction machine basée sur des statistiques. Le procédé génère des probabilités de traduction à partir d'une phrase à traduire vers des textes traduits candidats sur la base de caractéristiques des textes traduits candidats qui affectent les probabilités de traduction et d'un modèle de prédiction de probabilité de traduction pré-généré. Les caractéristiques qui affectent les probabilités de traduction comprennent au moins des degrés de similarité sémantique entre la phrase à traduire et les textes traduits candidats. Un nombre prédéfini de textes traduits candidats ayant des probabilités de traduction de rang élevé sont sélectionnés pour servir de textes traduits de la phrase à traduire. Le procédé peut à aller en profondeur dans un niveau sémantique d'un langage naturel lorsqu'un modèle de traduction machine est construit de manière à éviter un écart sémantique d'un texte traduit par rapport à un texte original, ce qui a pour effet d'améliorer la qualité de traduction.
Latest bibliographic data on file with the International Bureau