Some content of this application is unavailable at the moment.
If this situation persist, please contact us atFeedback&Contact
1. (WO2017058447) MANAGING A DATABASE OF PATTERNS USED TO IDENTIFY SUBSEQUENCES IN LOGS
Latest bibliographic data on file with the International Bureau    Submit observation

Pub. No.: WO/2017/058447 International Application No.: PCT/US2016/049514
Publication Date: 06.04.2017 International Filing Date: 30.08.2016
IPC:
G06F 17/27 (2006.01) ,G06F 17/30 (2006.01) ,G06F 11/34 (2006.01) ,G06F 17/22 (2006.01) ,G06F 17/40 (2006.01)
G PHYSICS
06
COMPUTING; CALCULATING; COUNTING
F
ELECTRIC DIGITAL DATA PROCESSING
17
Digital computing or data processing equipment or methods, specially adapted for specific functions
20
Handling natural language data
27
Automatic analysis, e.g. parsing, orthograph correction
G PHYSICS
06
COMPUTING; CALCULATING; COUNTING
F
ELECTRIC DIGITAL DATA PROCESSING
17
Digital computing or data processing equipment or methods, specially adapted for specific functions
30
Information retrieval; Database structures therefor
G PHYSICS
06
COMPUTING; CALCULATING; COUNTING
F
ELECTRIC DIGITAL DATA PROCESSING
11
Error detection; Error correction; Monitoring
30
Monitoring
34
Recording or statistical evaluation of computer activity, e.g. of down time, of input/output operation
G PHYSICS
06
COMPUTING; CALCULATING; COUNTING
F
ELECTRIC DIGITAL DATA PROCESSING
17
Digital computing or data processing equipment or methods, specially adapted for specific functions
20
Handling natural language data
21
Text processing
22
Manipulating or registering by use of codes, e.g. in sequence of text characters
G PHYSICS
06
COMPUTING; CALCULATING; COUNTING
F
ELECTRIC DIGITAL DATA PROCESSING
17
Digital computing or data processing equipment or methods, specially adapted for specific functions
40
Data acquisition and logging
Applicants:
CISCO TECHNOLOGY, INC. [US/US]; 170 W. Tasman Drive, US
Inventors:
ATTIAS, Roberto; US
PRIETO, Alberto Gonzalez; US
Agent:
PARKER, Daniel W.; US
STONE, Adam C.; US
HICKMAN, Brian D.; US
MILLER, Brian M.; US
OH, C. James; US
PALERMO, Christopher J.; US
LEDESMA, Daniel D.; US
MILLER, Daniel E.; US
TSANG, Dominic; US
BECKER, Edward A.; US
WEI, Ellen Y.; US
KARLIN, Elliot H.; US
HALE, Fred T.; US
BARATZ, Justin R.; US
KAUFMAN, Karen L.; US
PAPANYAN, Khachatur V.; US
KULCZYCKA, Malgorzata A.; US
BINGHAM, Marcel K.; US
PATHIYAL, Sanjay; US
BAJWA, Sanjeev S.; US
MEIKLE, Tammy L.; US
Priority Data:
14/869,85929.09.2015US
Title (EN) MANAGING A DATABASE OF PATTERNS USED TO IDENTIFY SUBSEQUENCES IN LOGS
(FR) GESTION D’UNE BASE DE DONNÉES DE MOTIFS SERVANT À IDENTIFIER DES SOUS-SÉQUENCES DANS DES JOURNAUX
Abstract:
(EN) A data processing method includes receiving a stream of digital data with a plurality of objects and, in response to receiving an object, tokenizing the object to create a tokenized object, and storing the tokenized object in a token database. The method further includes comparing the tokenized object to a plurality of other tokenized objects stored in the token database, computing a pattern associated with the tokenized object, storing the pattern in a pattern database, and managing a size of the pattern database by identifying, a subset of patterns that are eligible for deletion from the pattern database based on an age of each pattern, ranking each pattern of the subset based on a quality and a popularity metric, identifying, based on the ranking and from the subset, a second pattern and deleting the second pattern from the pattern database to produce an updated database. Alternatively deleting a more specific pattern in a set of hierarchical patterns based on a relative hit count of the specific pattern compared to a more general pattern of the hierarchy.
(FR) Un procédé de traitement de données comprend les étapes consistant à recevoir un flux de données numériques avec une pluralité d’objets et, en réponse à la réception d’un objet, tokenizer l’objet pour créer un objet tokenizé, et stocker l’objet tokenizé dans une base de données de jetons. Le procédé comprend également les étapes consistant à comparer l’objet tokenizé à une pluralité d’autres objets tokenizés stockés dans la base de données de jetons, calculer un motif associé à l’objet tokenizé, stocker le motif dans une base de données de motifs et gérer une taille de la base de données de motifs en identifiant un sous-ensemble de motifs qui sont éligibles pour être supprimés de la base de données de motifs d’après un âge de chaque motif, classer chaque motif du sous-ensemble d’après une métrique de qualité et de popularité, identifier, d’après le classement et à partir du sous-ensemble, un deuxième motif et supprimer le deuxième motif de la base de données de motifs pour produire une base de données mise à jour. En variante, supprimer un motif plus spécifique dans un ensemble de motifs hiérarchiques en fonction d’un nombre d’occurrences du motif spécifique, plutôt qu’un motif plus général de la hiérarchie.
front page image
Designated States: AE, AG, AL, AM, AO, AT, AU, AZ, BA, BB, BG, BH, BN, BR, BW, BY, BZ, CA, CH, CL, CN, CO, CR, CU, CZ, DE, DK, DM, DO, DZ, EC, EE, EG, ES, FI, GB, GD, GE, GH, GM, GT, HN, HR, HU, ID, IL, IN, IR, IS, JP, KE, KG, KN, KP, KR, KZ, LA, LC, LK, LR, LS, LU, LY, MA, MD, ME, MG, MK, MN, MW, MX, MY, MZ, NA, NG, NI, NO, NZ, OM, PA, PE, PG, PH, PL, PT, QA, RO, RS, RU, RW, SA, SC, SD, SE, SG, SK, SL, SM, ST, SV, SY, TH, TJ, TM, TN, TR, TT, TZ, UA, UG, US, UZ, VC, VN, ZA, ZM, ZW
African Regional Intellectual Property Organization (ARIPO) (BW, GH, GM, KE, LR, LS, MW, MZ, NA, RW, SD, SL, ST, SZ, TZ, UG, ZM, ZW)
Eurasian Patent Office (AM, AZ, BY, KG, KZ, RU, TJ, TM)
European Patent Office (EPO) (AL, AT, BE, BG, CH, CY, CZ, DE, DK, EE, ES, FI, FR, GB, GR, HR, HU, IE, IS, IT, LT, LU, LV, MC, MK, MT, NL, NO, PL, PT, RO, RS, SE, SI, SK, SM, TR)
African Intellectual Property Organization (BF, BJ, CF, CG, CI, CM, GA, GN, GQ, GW, KM, ML, MR, NE, SN, TD, TG)
Publication Language: English (EN)
Filing Language: English (EN)