Certains contenus de cette application ne sont pas disponibles pour le moment.
Si cette situation persiste, veuillez nous contacter àObservations et contact
1. (WO2016203501) PROCÉDÉ POUR CLASSER LES DOCUMENTS PAR UN ORDINATEUR, EN UTILISANT DES ENSEMBLES ADDITIFS D'ARBRES DE RÉGRESSION ET UNE OPTIMISATION DE MÉMOIRE CACHE, ET MOTEUR DE RECHERCHE UTILISANT UN TEL PROCÉDÉ
Dernières données bibliographiques dont dispose le Bureau international   

N° de publication : WO/2016/203501 N° de la demande internationale : PCT/IT2015/000155
Date de publication : 22.12.2016 Date de dépôt international : 17.06.2015
CIB :
G06F 17/30 (2006.01)
G PHYSIQUE
06
CALCUL; COMPTAGE
F
TRAITEMENT ÉLECTRIQUE DE DONNÉES NUMÉRIQUES
17
Equipement ou méthodes de traitement de données ou de calcul numérique, spécialement adaptés à des fonctions spécifiques
30
Recherche documentaire; Structures de bases de données à cet effet
Déposants :
TISCALI S.p.A. [IT/IT]; Loc. SA Illetta SS 195, km 2.300 09122 Cagliari, IT
Inventeurs :
DATO, Domenico; IT
LUCCHESE, Claudio; IT
NARDINI, Franco Maria; IT
ORLANDO, Salvatore; IT
PEREGO, Raffaele; IT
TONELLOTTO, Nicola; IT
VENTURINI, Rossano; IT
Mandataire :
PERRONACE, Andrea; Barzano' & Zanardo Roma S.p.A. Via Piemonte, 26 00187 Roma, IT
Données relatives à la priorité :
Titre (EN) A METHOD TO RANK DOCUMENTS BY A COMPUTER, USING ADDITIVE ENSEMBLES OF REGRESSION TREES AND CACHE OPTIMISATION, AND SEARCH ENGINE USING SUCH A METHOD
(FR) PROCÉDÉ POUR CLASSER LES DOCUMENTS PAR UN ORDINATEUR, EN UTILISANT DES ENSEMBLES ADDITIFS D'ARBRES DE RÉGRESSION ET UNE OPTIMISATION DE MÉMOIRE CACHE, ET MOTEUR DE RECHERCHE UTILISANT UN TEL PROCÉDÉ
Abrégé :
(EN) The present invention concerns a novel method to efficiently score documents (texts, images, audios, videos, and any other information file) by using a machine- learned ranking function modeled by an additive ensemble of regression trees. A main contribution is a new representation of the tree ensemble based on bitvectors, where the tree traversal, aimed to detect the leaves that contribute to the final scoring of a document, is performed through efficient logical bitwise operations. In addition, the traversal is not performed one tree after another, as one would expect, but it is interleaved, feature by feature, over the whole tree ensemble. Tests conducted on publicly available LtR datasets confirm unprecedented speedups (up to 6.5x) over the best state-of-the-art methods.
(FR) La présente invention concerne un nouveau procédé pour marquer efficacement des documents (textes, images, audios, vidéos, et tout autre fichier d'information) en utilisant une fonction de classement apprise par machine modélisée par un ensemble additif d'arbres de régression. Une contribution principale est une nouvelle représentation de l'ensemble d'arbres basée sur des vecteurs de bits, où la traversée de l'arbre, qui vise à détecter les feuilles qui contribuent à la notation finale d'un document, est effectuée par des opérations binaires logiques efficaces. En outre, la traversée n'est pas effectuée un arbre après l'autre, comme on pourrait s'y attendre, mais elle est entrelacée, attribut par attribut, sur tout l'ensemble d'arbres. Des essais effectués sur des ensembles de données LtR mis à la disposition du public confirment des accélérations sans précédent (jusqu'à 6,5x) par rapport aux meilleurs procédés de l'état actuel de la technique.
front page image
États désignés : AE, AG, AL, AM, AO, AT, AU, AZ, BA, BB, BG, BH, BN, BR, BW, BY, BZ, CA, CH, CL, CN, CO, CR, CU, CZ, DE, DK, DM, DO, DZ, EC, EE, EG, ES, FI, GB, GD, GE, GH, GM, GT, HN, HR, HU, ID, IL, IN, IR, IS, JP, KE, KG, KN, KP, KR, KZ, LA, LC, LK, LR, LS, LU, LY, MA, MD, ME, MG, MK, MN, MW, MX, MY, MZ, NA, NG, NI, NO, NZ, OM, PA, PE, PG, PH, PL, PT, QA, RO, RS, RU, RW, SA, SC, SD, SE, SG, SK, SL, SM, ST, SV, SY, TH, TJ, TM, TN, TR, TT, TZ, UA, UG, US, UZ, VC, VN, ZA, ZM, ZW
Organisation régionale africaine de la propriété intellectuelle (ARIPO) (BW, GH, GM, KE, LR, LS, MW, MZ, NA, RW, SD, SL, ST, SZ, TZ, UG, ZM, ZW)
Office eurasien des brevets (OEAB) (AM, AZ, BY, KG, KZ, RU, TJ, TM)
Office européen des brevets (OEB (AL, AT, BE, BG, CH, CY, CZ, DE, DK, EE, ES, FI, FR, GB, GR, HR, HU, IE, IS, IT, LT, LU, LV, MC, MK, MT, NL, NO, PL, PT, RO, RS, SE, SI, SK, SM, TR)
Organisation africaine de la propriété intellectuelle (OAPI) (BF, BJ, CF, CG, CI, CM, GA, GN, GQ, GW, KM, ML, MR, NE, SN, TD, TG)
Langue de publication : anglais (EN)
Langue de dépôt : anglais (EN)