WIPO logo
Mobile | Deutsch | Español | Français | 日本語 | 한국어 | Português | Русский | 中文 | العربية |

Search International and National Patent Collections
World Intellectual Property Organization
Machine translation
Latest bibliographic data on file with the International Bureau   

Pub. No.:    WO/2014/182748    International Application No.:    PCT/US2014/037038
Publication Date: 13.11.2014 International Filing Date: 07.05.2014
G06F 17/30 (2006.01)
Applicants: MICROSOFT CORPORATION [US/US]; One Microsoft Way Redmond, Washington 98052-6399 (US)
Inventors: ABDEL-HADY, Mohamed Farouk; (US).
IBRAHIM, Rania Mohamed Mohamed; (US).
ASHOUR, Ahmed Adel Mohamed Abdel-Kader; (US)
Priority Data:
13/889,384 08.05.2013 US
Abstract: front page image
(EN)Cross-lingual automatic query annotation technique is described, for example, to classify online search queries in Arabic as being of commercial intent, without the need to use human-judged Arabic queries. In examples, a query classifier available for a source language (such as English) is used to produce a query classifier for a target language (such as Arabic, German, French). In various examples, a target language query log and target language documents may be used to enable target language and target culture dependent queries to be classified. In various examples a click graph with edges weighted by click frequency is used to infer class membership of unlabeled target language queries from target language documents. In examples the target language documents may be classified using a supervised or semi-supervised classifier. In various examples the automatically labeled target language queries are used to train a target language query classifier for information retrieval and/or advertising.
(FR)La présente invention porte sur une technique d'annotation de requête automatique interlinguistique, par exemple, pour classifier des requêtes de recherche en ligne en arabe comme étant d'intention commerciale, sans le besoin d'utiliser des requêtes en arabe jugées par humain. Selon des exemples, un classificateur de requête disponible pour une langue de source (telle que l'anglais) est utilisé pour produire un classificateur de requête pour une langue cible (telle que l'arabe, l'allemand, le français). Selon différents exemples, un journal de requête de langue cible et des documents de langue cible peuvent être utilisés pour permettre à une langue cible et des requêtes dépendantes de culture cible d'être classifiées. Selon différents exemples, un graphique à clic ayant des bords pondérés par une fréquence de clic est utilisé pour deviner une appartenance de classe de requêtes de langue cible non étiquetées partir de documents de langue cible. Selon des exemples, les documents de langue cible peuvent être classifiés à l'aide d'un classificateur supervisé ou semi supervisé. Selon différents exemples, les requêtes de langue cible étiquetées automatiquement sont utilisées pour entraîner un classificateur de requête de langue cible pour récupération d'informations et/ou publicité.
Designated States: AE, AG, AL, AM, AO, AT, AU, AZ, BA, BB, BG, BH, BN, BR, BW, BY, BZ, CA, CH, CL, CN, CO, CR, CU, CZ, DE, DK, DM, DO, DZ, EC, EE, EG, ES, FI, GB, GD, GE, GH, GM, GT, HN, HR, HU, ID, IL, IN, IR, IS, JP, KE, KG, KN, KP, KR, KZ, LA, LC, LK, LR, LS, LT, LU, LY, MA, MD, ME, MG, MK, MN, MW, MX, MY, MZ, NA, NG, NI, NO, NZ, OM, PA, PE, PG, PH, PL, PT, QA, RO, RS, RU, RW, SA, SC, SD, SE, SG, SK, SL, SM, ST, SV, SY, TH, TJ, TM, TN, TR, TT, TZ, UA, UG, US, UZ, VC, VN, ZA, ZM, ZW.
African Regional Intellectual Property Organization (BW, GH, GM, KE, LR, LS, MW, MZ, NA, RW, SD, SL, SZ, TZ, UG, ZM, ZW)
Eurasian Patent Organization (AM, AZ, BY, KG, KZ, RU, TJ, TM)
European Patent Office (AL, AT, BE, BG, CH, CY, CZ, DE, DK, EE, ES, FI, FR, GB, GR, HR, HU, IE, IS, IT, LT, LU, LV, MC, MK, MT, NL, NO, PL, PT, RO, RS, SE, SI, SK, SM, TR)
African Intellectual Property Organization (BF, BJ, CF, CG, CI, CM, GA, GN, GQ, GW, KM, ML, MR, NE, SN, TD, TG).
Publication Language: English (EN)
Filing Language: English (EN)