WIPO logo
Mobile | Deutsch | English | Español | 日本語 | 한국어 | Português | Русский | 中文 | العربية |
PATENTSCOPE

Recherche dans les collections de brevets nationales et internationales
World Intellectual Property Organization
Recherche
 
Options de navigation
 
Traduction
 
Options
 
Quoi de neuf
 
Connexion
 
Aide
 
Traduction automatique
1. (WO2006122086) MOTEUR DE MISE EN CORRESPONDANCE A GENERATION DE SIGNATURES ET DETECTION DE PERTINENCE
Dernières données bibliographiques dont dispose le Bureau international   

N° de publication :    WO/2006/122086    N° de la demande internationale :    PCT/US2006/017846
Date de publication : 16.11.2006 Date de dépôt international : 08.05.2006
CIB :
G06F 17/30 (2006.01), G06F 17/00 (2006.01)
Déposants : PROVILLA, INC. [US/US]; 1064 Yosemite Drive, Milpitas, CA 95035 (US) (Tous Sauf US).
REN, Liwei [CN/US]; (US) (US Seulement).
TAN, Dehua [CA/US]; (US) (US Seulement).
HUANG, Fei [CN/US]; (US) (US Seulement).
HUANG, Shu [CN/US]; (US) (US Seulement).
DONG, Aiguo [CN/US]; (US) (US Seulement)
Inventeurs : REN, Liwei; (US).
TAN, Dehua; (US).
HUANG, Fei; (US).
HUANG, Shu; (US).
DONG, Aiguo; (US)
Mandataire : PATEL, Rajiv, P.; FENWICK & WEST LLP, SILICON VALLEY CENTER, 801 California Street, Mountain View, CA 94041 (US)
Données relatives à la priorité :
60/679,314 09.05.2005 US
11/361,340 24.02.2006 US
11/361,447 24.02.2006 US
Titre (EN) MATCHING ENGINE WITH SIGNATURE GENERATION AND RELEVANCE DETECTION
(FR) MOTEUR DE MISE EN CORRESPONDANCE A GENERATION DE SIGNATURES ET DETECTION DE PERTINENCE
Abrégé : front page image
(EN)A system and a method generates at least one signature associated with document. In one embodiment, a document comprised of text is received and parsed to generate a token set. The token set includes a plurality of tokens. Each token corresponds to the text in the document that is separated by a predefined character characteristic. A score is calculated for each token in the token set based on a frequency and distribution of the text in the document. Each token is then ranked based on the calculated score. A subset of the ranked tokes is selected and a signature is generated for each occurrence of the selected tokens. The selected list of signatures is then output.
(FR)L'invention concerne un système et un procédé de génération d'au moins une signature associée à un document. Dans un mode de réalisation, un document constitué de texte est reçu et analysé afin de générer un ensemble de jetons d'authentification. L'ensemble de jetons d'authentification comprend une pluralité de jetons d'authentification. Chaque jeton d'authentification correspond au texte du document qui est séparé par une caractéristique de caractère prédéfinie. Un score est calculé pour chaque jeton d'authentification de l'ensemble de jetons d'authentification en fonction d'une fréquence et d'une distribution du texte dans le document. Chaque jeton d'authentification est ensuite classé en fonction du score calculé. Un sous-ensemble de jetons d'authentification classés est sélectionné et une signature est générée pour chaque occurrence des jetons d'authentification sélectionnés. La liste sélectionnée de signatures est alors sortie.
États désignés : AE, AG, AL, AM, AT, AU, AZ, BA, BB, BG, BR, BW, BY, BZ, CA, CH, CN, CO, CR, CU, CZ, DE, DK, DM, DZ, EC, EE, EG, ES, FI, GB, GD, GE, GH, GM, HR, HU, ID, IL, IN, IS, JP, KE, KG, KM, KN, KP, KR, KZ, LC, LK, LR, LS, LT, LU, LV, LY, MA, MD, MG, MK, MN, MW, MX, MZ, NA, NG, NI, NO, NZ, OM, PG, PH, PL, PT, RO, RU, SC, SD, SE, SG, SK, SL, SM, SY, TJ, TM, TN, TR, TT, TZ, UA, UG, US, UZ, VC, VN, YU, ZA, ZM, ZW.
Organisation régionale africaine de la propriété intellectuelle (ARIPO) (BW, GH, GM, KE, LS, MW, MZ, NA, SD, SL, SZ, TZ, UG, ZM, ZW)
Office eurasien des brevets (OEAB) (AM, AZ, BY, KG, KZ, MD, RU, TJ, TM)
Office européen des brevets (OEB) (AT, BE, BG, CH, CY, CZ, DE, DK, EE, ES, FI, FR, GB, GR, HU, IE, IS, IT, LT, LU, LV, MC, NL, PL, PT, RO, SE, SI, SK, TR)
Organisation africaine de la propriété intellectuelle (OAPI) (BF, BJ, CF, CG, CI, CM, GA, GN, GQ, GW, ML, MR, NE, SN, TD, TG).
Langue de publication : anglais (EN)
Langue de dépôt : anglais (EN)