Some content of this application is unavailable at the moment.
If this situation persist, please contact us atFeedback&Contact
1. (WO2017033063) STATISTICS-BASED MACHINE TRANSLATION METHOD, APPARATUS AND ELECTRONIC DEVICE
Latest bibliographic data on file with the International Bureau    Submit observation

Pub. No.: WO/2017/033063 International Application No.: PCT/IB2016/001563
Publication Date: 02.03.2017 International Filing Date: 25.08.2016
IPC:
G06F 17/28 (2006.01)
G PHYSICS
06
COMPUTING; CALCULATING; COUNTING
F
ELECTRIC DIGITAL DATA PROCESSING
17
Digital computing or data processing equipment or methods, specially adapted for specific functions
20
Handling natural language data
28
Processing or translating of natural language
Applicants:
ALIBABA GROUP HOLDING LIMITED; Fourth Floor, One Capital Place P. O. Box 847 Grand Cayman, KY
Inventors:
ZENG, Xiaodong; CN
LUO, Weihua; CN
LIN, Feng; CN
Agent:
NELSON, Brett, L.; US
LEE, Lewis, C.; US
Priority Data:
201510527745.825.08.2015CN
Title (EN) STATISTICS-BASED MACHINE TRANSLATION METHOD, APPARATUS AND ELECTRONIC DEVICE
(FR) PROCÉDÉ DE TRADUCTION MACHINE BASÉ SUR LES STATISTIQUES, APPAREIL ET DISPOSITIF ÉLECTRONIQUE
Abstract:
(EN) A statistics-based machine translation method is disclosed. The method generates probabilities of translation from a sentence to be translated to candidate translated texts based on features of the candidate translated texts that affect the probabilities of translation and a pre-generated translation probability prediction model. The features that affect probabilities of translation include at least degrees of semantic similarity between the sentence to be translated and the candidate translated texts. A preset number of candidate translated texts with highly ranked probabilities of translation are selected to serve as translated texts of the sentence to be translated. The method is able to go deep into a semantic level of a natural language when a machine translation model is constructed to avoid a semantic deviation of a translated text from an original text, thereby achieving the effect of improving the quality of translation.
(FR) Procédé de traduction machine basée sur des statistiques. Le procédé génère des probabilités de traduction à partir d'une phrase à traduire vers des textes traduits candidats sur la base de caractéristiques des textes traduits candidats qui affectent les probabilités de traduction et d'un modèle de prédiction de probabilité de traduction pré-généré. Les caractéristiques qui affectent les probabilités de traduction comprennent au moins des degrés de similarité sémantique entre la phrase à traduire et les textes traduits candidats. Un nombre prédéfini de textes traduits candidats ayant des probabilités de traduction de rang élevé sont sélectionnés pour servir de textes traduits de la phrase à traduire. Le procédé peut à aller en profondeur dans un niveau sémantique d'un langage naturel lorsqu'un modèle de traduction machine est construit de manière à éviter un écart sémantique d'un texte traduit par rapport à un texte original, ce qui a pour effet d'améliorer la qualité de traduction.
front page image
Designated States: AE, AG, AL, AM, AO, AT, AU, AZ, BA, BB, BG, BH, BN, BR, BW, BY, BZ, CA, CH, CL, CN, CO, CR, CU, CZ, DE, DK, DM, DO, DZ, EC, EE, EG, ES, FI, GB, GD, GE, GH, GM, GT, HN, HR, HU, ID, IL, IN, IR, IS, JP, KE, KG, KN, KP, KR, KZ, LA, LC, LK, LR, LS, LU, LY, MA, MD, ME, MG, MK, MN, MW, MX, MY, MZ, NA, NG, NI, NO, NZ, OM, PA, PE, PG, PH, PL, PT, QA, RO, RS, RU, RW, SA, SC, SD, SE, SG, SK, SL, SM, ST, SV, SY, TH, TJ, TM, TN, TR, TT, TZ, UA, UG, US, UZ, VC, VN, ZA, ZM, ZW
African Regional Intellectual Property Organization (ARIPO) (BW, GH, GM, KE, LR, LS, MW, MZ, NA, RW, SD, SL, ST, SZ, TZ, UG, ZM, ZW)
Eurasian Patent Office (AM, AZ, BY, KG, KZ, RU, TJ, TM)
European Patent Office (EPO) (AL, AT, BE, BG, CH, CY, CZ, DE, DK, EE, ES, FI, FR, GB, GR, HR, HU, IE, IS, IT, LT, LU, LV, MC, MK, MT, NL, NO, PL, PT, RO, RS, SE, SI, SK, SM, TR)
African Intellectual Property Organization (BF, BJ, CF, CG, CI, CM, GA, GN, GQ, GW, KM, ML, MR, NE, SN, TD, TG)
Publication Language: English (EN)
Filing Language: English (EN)