WIPO logo
Mobile | Deutsch | Español | Français | 日本語 | 한국어 | Português | Русский | 中文 | العربية |
PATENTSCOPE

Search International and National Patent Collections
World Intellectual Property Organization
Search
 
Browse
 
Translate
 
Options
 
News
 
Login
 
Help
 
Machine translation
1. (WO2016060687) SYSTEM AND METHOD FOR LANGUAGE DETECTION
Latest bibliographic data on file with the International Bureau   

Pub. No.: WO/2016/060687 International Application No.: PCT/US2014/061141
Publication Date: 21.04.2016 International Filing Date: 17.10.2014
IPC:
G06F 17/27 (2006.01) ,G06F 17/30 (2006.01)
Applicants: MACHINE ZONE, INC.[US/US]; 555 Hamilton Avenue Palo Alto, CA 94301, US
Inventors: BOJJA, Nikhil; US
WANG, Pidong; SG
LINDER, Fredrik; US
PUZON, Bartlomiej; US
Agent: RUMMLER, Jeffrey, R.; US
Priority Data:
Title (EN) SYSTEM AND METHOD FOR LANGUAGE DETECTION
(FR) SYSTÈME ET PROCÉDÉ POUR UNE DÉTECTION DE LANGUE
Abstract: front page image
(EN) Implementations of the present disclosure are directed to a method, a system, and a computer program storage device for detecting a language in a text message. A plurality of different language detection tests are performed on a message associated with a user. Each language detection test determines a set of scores representing a likelihood that the message in one of a plurality of different languages. One or more combinations of the score sets are provided as input to one or more distinct classifiers. Output from each of the classifiers includes a respective indication that the message is in one of the different languages. The language in the message may be identified as being the indicated language from one of the classifiers, based on a confidence score and/or an identified linguistic domain.
(FR) Selon des modes de réalisation, la présente invention concerne un procédé, un système et un dispositif de stockage de programme informatique pour détecter une langue dans un message texte. Une pluralité de différents essais de détection de langue sont effectués sur un message associé à un utilisateur. Chaque essai de détection de langue détermine un ensemble de scores représentant une probabilité que le message est dans l'une des langues d'une pluralité de différentes langues. Une ou plusieurs combinaisons des ensembles de scores sont fournies sous la forme d'une entrée dans un ou plusieurs classificateurs distincts. Une sortie provenant de chacun des classificateurs comprend une indication respective selon laquelle le message est dans l'une des différentes langues. La langue dans le message peut être identifiée comme étant la langue indiquée par l'un des classificateurs, sur la base d'un score de confiance et/ou d'un domaine linguistique identifié.
Designated States: AE, AG, AL, AM, AO, AT, AU, AZ, BA, BB, BG, BH, BN, BR, BW, BY, BZ, CA, CH, CL, CN, CO, CR, CU, CZ, DE, DK, DM, DO, DZ, EC, EE, EG, ES, FI, GB, GD, GE, GH, GM, GT, HN, HR, HU, ID, IL, IN, IR, IS, JP, KE, KG, KN, KP, KR, KZ, LA, LC, LK, LR, LS, LU, LY, MA, MD, ME, MG, MK, MN, MW, MX, MY, MZ, NA, NG, NI, NO, NZ, OM, PA, PE, PG, PH, PL, PT, QA, RO, RS, RU, RW, SA, SC, SD, SE, SG, SK, SL, SM, ST, SV, SY, TH, TJ, TM, TN, TR, TT, TZ, UA, UG, US, UZ, VC, VN, ZA, ZM, ZW
African Regional Intellectual Property Organization (ARIPO) (BW, GH, GM, KE, LR, LS, MW, MZ, NA, RW, SD, SL, ST, SZ, TZ, UG, ZM, ZW)
Eurasian Patent Office (AM, AZ, BY, KG, KZ, RU, TJ, TM)
European Patent Office (EPO) (AL, AT, BE, BG, CH, CY, CZ, DE, DK, EE, ES, FI, FR, GB, GR, HR, HU, IE, IS, IT, LT, LU, LV, MC, MK, MT, NL, NO, PL, PT, RO, RS, SE, SI, SK, SM, TR)
African Intellectual Property Organization (BF, BJ, CF, CG, CI, CM, GA, GN, GQ, GW, KM, ML, MR, NE, SN, TD, TG)
Publication Language: English (EN)
Filing Language: English (EN)