Processing

Please wait...

Settings

Settings

Goto Application

1. WO2020112509 - SCALABLE IMPLEMENTATIONS OF MULTI-DIMENSIONAL AGGREGATIONS WITH INPUT BLENDING IN DISTRIBUTED QUERY PROCESSING SYSTEMS

Publication Number WO/2020/112509
Publication Date 04.06.2020
International Application No. PCT/US2019/062711
International Filing Date 22.11.2019
IPC
G06F 16/28 2019.01
GPHYSICS
06COMPUTING; CALCULATING OR COUNTING
FELECTRIC DIGITAL DATA PROCESSING
16Information retrieval; Database structures therefor; File system structures therefor
20of structured data, e.g. relational data
28Databases characterised by their database models, e.g. relational or object models
CPC
G06F 16/2282
GPHYSICS
06COMPUTING; CALCULATING; COUNTING
FELECTRIC DIGITAL DATA PROCESSING
16Information retrieval; Database structures therefor; File system structures therefor
20of structured data, e.g. relational data
22Indexing; Data structures therefor; Storage structures
2282Tablespace storage structures; Management thereof
G06F 16/244
GPHYSICS
06COMPUTING; CALCULATING; COUNTING
FELECTRIC DIGITAL DATA PROCESSING
16Information retrieval; Database structures therefor; File system structures therefor
20of structured data, e.g. relational data
24Querying
242Query formulation
2433Query languages
244Grouping and aggregation
G06F 16/2471
GPHYSICS
06COMPUTING; CALCULATING; COUNTING
FELECTRIC DIGITAL DATA PROCESSING
16Information retrieval; Database structures therefor; File system structures therefor
20of structured data, e.g. relational data
24Querying
245Query processing
2458Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
2471Distributed queries
G06F 16/278
GPHYSICS
06COMPUTING; CALCULATING; COUNTING
FELECTRIC DIGITAL DATA PROCESSING
16Information retrieval; Database structures therefor; File system structures therefor
20of structured data, e.g. relational data
27Replication, distribution or synchronisation of data between databases or within a distributed database system; Distributed database system architectures therefor
278Data partitioning, e.g. horizontal or vertical partitioning
G06F 16/283
GPHYSICS
06COMPUTING; CALCULATING; COUNTING
FELECTRIC DIGITAL DATA PROCESSING
16Information retrieval; Database structures therefor; File system structures therefor
20of structured data, e.g. relational data
28Databases characterised by their database models, e.g. relational or object models
283Multi-dimensional databases or data warehouses, e.g. MOLAP or ROLAP
Applicants
  • MICROSOFT TECHNOLOGY LICENSING, LLC [US]/[US]
Inventors
  • VISWANADHA, Sreenivasa
Agents
  • MINHAS, Sandip S.
  • ADJEMIAN, Monica
  • BARKER, Doug
  • CHATTERJEE, Aaron C.
  • CHEN, Wei-Chen Nicholas
  • CHOI, Daniel
  • CHURNA, Timothy
  • DINH, Phong
  • EVANS, Patrick
  • GABRYJELSKI, Henry
  • GOLDSMITH, Micah P.
  • GUPTA, Anand
  • HINOJOSA-SMITH, Brianna L.
  • HWANG, William C.
  • JARDINE, John S.
  • LEE, Sunah
  • LEMMON, Marcus
  • MARQUIS, Thomas
  • MEYERS, Jessica
  • ROPER, Brandon
  • SPELLMAN, Steven
  • SULLIVAN, Kevin
  • SWAIN, Cassandra T.
  • TABOR, Ben
  • WALKER, Matt
  • WIGHT, Stephen A.
  • WISDOM, Gregg
  • WONG, Ellen
  • WONG, Thomas S.
  • ZHANG, Hannah
  • TRAN, Kimberly
Priority Data
16/206,93430.11.2018US
Publication Language English (EN)
Filing Language English (EN)
Designated States
Title
(EN) SCALABLE IMPLEMENTATIONS OF MULTI-DIMENSIONAL AGGREGATIONS WITH INPUT BLENDING IN DISTRIBUTED QUERY PROCESSING SYSTEMS
(FR) IMPLÉMENTATIONS ÉVOLUTIVES D'AGRÉGATIONS MULTIDIMENSIONNELLES AVEC MIXAGE D'ENTRÉES DANS DES SYSTÈMES DE TRAITEMENT DE REQUÊTES RÉPARTIES
Abstract
(EN)
Systems and devices implement scalable implementations of multi-dimensional aggregations with input blending in distributed query processing systems. Multi-dimensional aggregations for identifiers/values designated fields in datasets are performed based on keys. Datasets are sorted by identifier/value and divided into first partitions. Each row of data with a specific sorted-by-identifier/value is only present in one of the first partitions. Keys are generated from each combination of two or more dataset fields, and a blended table of data is generated over the partitions based on each different key combination. Designated data field characteristics are determined for the blended table based on the different key combinations. The characteristics are divided into second partitions based on the keys, where each key is present in only one of the second partitions. A final designated data field characteristic is determined for each row of data in each of the second partitions as the multi-dimensional aggregation.
(FR)
La présente invention concerne des systèmes et des dispositifs qui implémentent des implémentations évolutives d'agrégations multidimensionnelles avec mixage d'entrées dans des systèmes de traitement de requêtes réparties. Des agrégations multidimensionnelles sont effectuées pour des champs à identifiants/valeurs désignées dans des ensembles de données sur la base de clés. Les ensembles de données sont triés par identifiant/valeur et divisés en premières partitions. Chaque rangée de données ayant été triée selon un identifiant/valeur spécifique est uniquement présente dans l'une des premières partitions. Les clés sont générées à partir de chaque combinaison d'au moins deux champs d'ensembles de données, et une table de données mixée est générée sur les partitions sur la base de chaque combinaison de clés différente. Des caractéristiques de champs de données désignées sont déterminées pour la table mixée sur la base des différentes combinaisons de clés. Les caractéristiques sont divisées en secondes partitions sur la base des clés, chaque clé étant présente dans une seule des secondes partitions. Une caractéristique de champ de données désignée finale est déterminée pour chaque rangée de données dans chacune des secondes partitions en tant qu'agrégation multidimensionnelle.
Also published as
Latest bibliographic data on file with the International Bureau