WIPO logo
Mobile | Deutsch | English | Español | 日本語 | 한국어 | Português | Русский | 中文 | العربية |
PATENTSCOPE

Recherche dans les collections de brevets nationales et internationales
World Intellectual Property Organization
Recherche
 
Options de navigation
 
Traduction
 
Options
 
Quoi de neuf
 
Connexion
 
Aide
 
Traduction automatique
1. (WO2014158834) IDENTIFICATION D'ÉLÉMENTS SAILLANTS DANS DES DOCUMENTS
Dernières données bibliographiques dont dispose le Bureau international   

N° de publication :    WO/2014/158834    N° de la demande internationale :    PCT/US2014/020455
Date de publication : 02.10.2014 Date de dépôt international : 05.03.2014
Demande présentée en vertu du Chapitre 2 :    08.10.2014    
CIB :
G06F 17/30 (2006.01)
Déposants : MICROSOFT TECHNOLOGY LICENSING, LLC [US/US]; One Microsoft Way Redmond, WA 98052 (US)
Inventeurs : GAMON, Michael; (US).
PANTEL, Patrick; (US).
SONG, Xinying; (US).
YANO, Tae; (US).
APACIBLE, Johnson Tan; (US)
Mandataire : Olswang Germany LLP; FISCHER, Michael Rosental 4 80331 Munich (DE)
Données relatives à la priorité :
13/798,198 13.03.2013 US
Titre (EN) IDENTIFYING SALIENT ITEMS IN DOCUMENTS
(FR) IDENTIFICATION D'ÉLÉMENTS SAILLANTS DANS DES DOCUMENTS
Abrégé : front page image
(EN)A set of representations of item-page pairs of items and respective web pages that include the respective items is obtained, each representation including feature function values indicating weights associated with features of associated web pages, the features including page classification features. An annotated set of labeled training data that is annotated with salience annotation values of items for respective web pages that include the items is obtained. The salience annotation values are determined based on a soft function, by determining a first count of a total number of user queries associated with corresponding visits to the respective web pages, and determining a ratio of a second count to the first count, the second count determined as a cardinality of a subset of the corresponding visits that are associated with user queries that include the item, the subset included in the corresponding visits. Models are trained using the annotated set.
(FR)L'invention concerne un procédé au cours duquel est obtenu un ensemble de représentations de paires élément-page constituées d'éléments et de pages web respectives comprenant les éléments considérés, chaque représentation comprenant des valeurs de fonctions caractéristiques indiquant des pondérations associées à des caractéristiques de pages web associées, les caractéristiques comprenant des caractéristiques de classification de pages. Un ensemble annoté de données d'apprentissage étiquetées, qui est annoté avec des valeurs d'annotation de caractère saillant d'éléments pour des pages web respectives comprenant les éléments, est obtenu. Les valeurs d'annotation de caractère saillant sont déterminées sur la base d'une fonction non stricte, en déterminant un premier comptage d'un nombre total de requêtes d'utilisateurs associées à des visites correspondantes aux pages web respectives, et en déterminant un rapport d'un deuxième comptage au premier comptage, le deuxième comptage étant déterminé comme le cardinal d'un sous-ensemble des visites correspondantes qui sont associées à des requêtes d'utilisateurs comprenant l'élément considéré, le sous-ensemble étant inclus dans les visites correspondantes. Des modèles font l'objet d'un apprentissage utilisant l'ensemble annoté.
États désignés : AE, AG, AL, AM, AO, AT, AU, AZ, BA, BB, BG, BH, BN, BR, BW, BY, BZ, CA, CH, CL, CN, CO, CR, CU, CZ, DE, DK, DM, DO, DZ, EC, EE, EG, ES, FI, GB, GD, GE, GH, GM, GT, HN, HR, HU, ID, IL, IN, IR, IS, JP, KE, KG, KN, KP, KR, KZ, LA, LC, LK, LR, LS, LT, LU, LY, MA, MD, ME, MG, MK, MN, MW, MX, MY, MZ, NA, NG, NI, NO, NZ, OM, PA, PE, PG, PH, PL, PT, QA, RO, RS, RU, RW, SA, SC, SD, SE, SG, SK, SL, SM, ST, SV, SY, TH, TJ, TM, TN, TR, TT, TZ, UA, UG, US, UZ, VC, VN, ZA, ZM, ZW.
Organisation régionale africaine de la propriété intellectuelle (ARIPO) (BW, GH, GM, KE, LR, LS, MW, MZ, NA, RW, SD, SL, SZ, TZ, UG, ZM, ZW)
Office eurasien des brevets (OEAB) (AM, AZ, BY, KG, KZ, RU, TJ, TM)
Office européen des brevets (OEB) (AL, AT, BE, BG, CH, CY, CZ, DE, DK, EE, ES, FI, FR, GB, GR, HR, HU, IE, IS, IT, LT, LU, LV, MC, MK, MT, NL, NO, PL, PT, RO, RS, SE, SI, SK, SM, TR)
Organisation africaine de la propriété intellectuelle (OAPI) (BF, BJ, CF, CG, CI, CM, GA, GN, GQ, GW, KM, ML, MR, NE, SN, TD, TG).
Langue de publication : anglais (EN)
Langue de dépôt : anglais (EN)