WIPO logo
Mobile | Deutsch | Español | Français | 日本語 | 한국어 | Português | Русский | 中文 | العربية |
PATENTSCOPE

Search International and National Patent Collections
World Intellectual Property Organization
Search
 
Browse
 
Translate
 
Options
 
News
 
Login
 
Help
 
Machine translation
1. (WO2014176754) HISTOGRAM CONSTRUCTION FOR STRING DATA
Latest bibliographic data on file with the International Bureau   

Pub. No.:    WO/2014/176754    International Application No.:    PCT/CN2013/075033
Publication Date: 06.11.2014 International Filing Date: 30.04.2013
IPC:
G06F 17/21 (2006.01), G06F 9/45 (2006.01)
Applicants: HEWLETT-PACKARD DEVELOPMENT COMPANY, L.P. [US/US]; 11445 Compaq Center Drive West Houston, Texas 77070 (US).
LUO, Ge [CN/CN]; (CN) (US only).
JIAO, Li-Mei [CN/CN]; (CN) (US only).
CAO, Zhao [CN/CN]; (CN) (US only).
CHEN, Shimin [CN/CN]; (CN) (US only).
GUO, Meng [CN/CN]; (CN) (US only)
Inventors: LUO, Ge; (CN).
JIAO, Li-Mei; (CN).
CAO, Zhao; (CN).
CHEN, Shimin; (CN).
GUO, Meng; (CN)
Agent: CHINA PATENT AGENT (H.K.) LTD.; 22/F., Great Eagle Center 23 Harbour Road Wanchai Hong Kong (CN)
Priority Data:
Title (EN) HISTOGRAM CONSTRUCTION FOR STRING DATA
(FR) CONSTRUCTION D'HISTOGRAMME POUR DONNÉES DE CHAÎNE
Abstract: front page image
(EN)Methods and systems of generation of histograms for strings are described. In one implementation, a prefix tree having nodes representing prefixes of the strings is generated. For the prefix tree, deploy weights are assigned to the nodes based on lengths of the prefixes represented by sub-tree nodes rooted at the nodes and frequencies of the strings whose prefixes are represented by the sub-tree nodes. Each of the deploy weights of one node is indicative of a maximum weight preserved upon filling the buckets with at least one prefix represented by the sub-tree nodes rooted at that one node. A predefined number of Top-prefixes are determined for filling up the predefined number of buckets. The Top-prefixes are determined based on maximizing a total weight preserved by the prefixes in the buckets and over a maximum number of strings. A histogram is generated based on the deploy weights associated with the Top-prefixes.
(FR)L'invention concerne des procédés et systèmes de génération d'histogrammes pour des chaînes. Dans un mode de réalisation, un arbre de préfixe, ayant des nœuds représentant des préfixes des chaînes, est généré. Pour l'arbre de préfixes, des poids de déploiement sont attribués aux nœuds sur la base des longueurs des préfixes représentés par des nœuds d'arbre secondaire prenant racine au niveau des nœuds et des fréquences des chaînes dont les préfixes sont représentés par les nœuds d'arbre secondaire. Chacun des poids de déploiement d'un nœud est indicatif d'un poids maximum préservé lors du remplissage des compartiments avec au moins un préfixe représenté par les nœuds d'arbre secondaire prenant racine au niveau de ce nœud. Un nombre prédéfini de préfixes supérieurs est déterminé pour remplir le nombre prédéfini de compartiments. Les préfixes supérieurs sont déterminés sur la base de la maximisation d'un poids total préservé par les préfixes dans les compartiments et sur un nombre maximum de chaînes. Un histogramme est généré sur la base des poids de déploiement associés aux préfixes supérieurs.
Designated States: AE, AG, AL, AM, AO, AT, AU, AZ, BA, BB, BG, BH, BN, BR, BW, BY, BZ, CA, CH, CL, CN, CO, CR, CU, CZ, DE, DK, DM, DO, DZ, EC, EE, EG, ES, FI, GB, GD, GE, GH, GM, GT, HN, HR, HU, ID, IL, IN, IS, JP, KE, KG, KM, KN, KP, KR, KZ, LA, LC, LK, LR, LS, LT, LU, LY, MA, MD, ME, MG, MK, MN, MW, MX, MY, MZ, NA, NG, NI, NO, NZ, OM, PA, PE, PG, PH, PL, PT, QA, RO, RS, RU, RW, SC, SD, SE, SG, SK, SL, SM, ST, SV, SY, TH, TJ, TM, TN, TR, TT, TZ, UA, UG, US, UZ, VC, VN, ZA, ZM, ZW.
African Regional Intellectual Property Organization (BW, GH, GM, KE, LR, LS, MW, MZ, NA, RW, SD, SL, SZ, TZ, UG, ZM, ZW)
Eurasian Patent Organization (AM, AZ, BY, KG, KZ, RU, TJ, TM)
European Patent Office (AL, AT, BE, BG, CH, CY, CZ, DE, DK, EE, ES, FI, FR, GB, GR, HR, HU, IE, IS, IT, LT, LU, LV, MC, MK, MT, NL, NO, PL, PT, RO, RS, SE, SI, SK, SM, TR)
African Intellectual Property Organization (BF, BJ, CF, CG, CI, CM, GA, GN, GQ, GW, ML, MR, NE, SN, TD, TG).
Publication Language: English (EN)
Filing Language: English (EN)