Processing

Please wait...

Settings

Settings

Goto Application

1. WO2022005613 - EFFICIENTLY CONSTRUCTING REGRESSION MODELS FOR SELECTIVITY ESTIMATION

Publication Number WO/2022/005613
Publication Date 06.01.2022
International Application No. PCT/US2021/031469
International Filing Date 10.05.2021
IPC
G06F 16/2453 2019.1
GPHYSICS
06COMPUTING; CALCULATING OR COUNTING
FELECTRIC DIGITAL DATA PROCESSING
16Information retrieval; Database structures therefor; File system structures therefor
20of structured data, e.g. relational data
24Querying
245Query processing
2453Query optimisation
G06N 20/00 2019.1
GPHYSICS
06COMPUTING; CALCULATING OR COUNTING
NCOMPUTER SYSTEMS BASED ON SPECIFIC COMPUTATIONAL MODELS
20Machine learning
CPC
G06F 16/24545
GPHYSICS
06COMPUTING; CALCULATING; COUNTING
FELECTRIC DIGITAL DATA PROCESSING
16Information retrieval; Database structures therefor; File system structures therefor
20of structured data, e.g. relational data
24Querying
245Query processing
2453Query optimisation
24534Query rewriting; Transformation
24542Plan optimisation
24545Selectivity estimation or determination
G06K 9/6256
GPHYSICS
06COMPUTING; CALCULATING; COUNTING
KRECOGNITION OF DATA; PRESENTATION OF DATA; RECORD CARRIERS; HANDLING RECORD CARRIERS
9Methods or arrangements for reading or recognising printed or written characters or for recognising patterns, e.g. fingerprints
62Methods or arrangements for recognition using electronic means
6217Design or setup of recognition systems and techniques; Extraction of features in feature space; Clustering techniques; Blind source separation
6256Obtaining sets of training patterns; Bootstrap methods, e.g. bagging, boosting
G06K 9/6262
GPHYSICS
06COMPUTING; CALCULATING; COUNTING
KRECOGNITION OF DATA; PRESENTATION OF DATA; RECORD CARRIERS; HANDLING RECORD CARRIERS
9Methods or arrangements for reading or recognising printed or written characters or for recognising patterns, e.g. fingerprints
62Methods or arrangements for recognition using electronic means
6217Design or setup of recognition systems and techniques; Extraction of features in feature space; Clustering techniques; Blind source separation
6262Validation, performance evaluation or active pattern learning techniques
G06N 20/00
GPHYSICS
06COMPUTING; CALCULATING; COUNTING
NCOMPUTER SYSTEMS BASED ON SPECIFIC COMPUTATIONAL MODELS
20Machine learning
G06N 7/005
GPHYSICS
06COMPUTING; CALCULATING; COUNTING
NCOMPUTER SYSTEMS BASED ON SPECIFIC COMPUTATIONAL MODELS
7Computer systems based on specific mathematical models
005Probabilistic networks
Applicants
  • MICROSOFT TECHNOLOGY LICENSING, LLC [US]/[US]
Inventors
  • DUTT, Anshuman
  • WANG, Chi
  • NARASAYYA, Vivek Ravindranath
  • CHAUDHURI, Surajit
Agents
  • SWAIN, Cassandra T.
  • BARKER, Doug
  • CHATTERJEE, Aaron C.
  • CHEN, Wei-Chen Nicholas
  • CHOI, Daniel
  • CHURNA, Timothy
  • DINH, Phong
  • EVANS, Patrick
  • GABRYJELSKI, Henry
  • GUPTA, Anand
  • HWANG, William C.
  • JARDINE, John S.
  • LEE, Sunah
  • LEMMON, Marcus
  • MARQUIS, Thomas
  • MEYERS, Jessica
  • ROPER, Brandon
  • SPELLMAN, Steven
  • SULLIVAN, Kevin
  • WALKER, Matt
  • WIGHT, Stephen A.
  • WISDOM, Gregg
  • WONG, Ellen
  • WONG, Thomas S.
  • ZHANG, Hannah
  • AKHTER, Julia
  • KADOURA, Judy M.
  • NIU, Bo
  • OLANIRAN, Qudus
  • BROWN, Renee
  • TRAN, Kimberly
Priority Data
16/917,85730.06.2020US
Publication Language English (en)
Filing Language English (EN)
Designated States
Title
(EN) EFFICIENTLY CONSTRUCTING REGRESSION MODELS FOR SELECTIVITY ESTIMATION
(FR) CONSTRUCTION EFFICACE DE MODÈLES DE RÉGRESSION POUR UNE ESTIMATION DE SÉLECTIVITÉ
Abstract
(EN) A model generator constructs a model for estimating selectivity of database operations by determining a number of training examples necessary for the model to achieve a target accuracy and by generating approximate selectivity labels for the training examples. The model generator may train the model on an initial number of training examples using cross-validation. The model generator may determine whether the model satisfies the target accuracy and iteratively and geometrically increase the number of training examples based on an optimized geometric step size (which may minimize model construction time) until the model achieves the target accuracy based on a defined confidence level. The model generator may generate labels using a subset of tuples from an intermediate query expression. The model generator may iteratively increase a size of the subset of tuples used until a relative error of the generated labels is below a target threshold.
(FR) Un générateur de modèle construit un modèle permettant d'estimer la sélectivité d'opérations de base de données par détermination d'un nombre d'exemples de formation nécessaires pour que le modèle obtienne une précision cible et par génération d'étiquettes de sélectivité approximatives correspondant aux exemples de formation. Le générateur de modèle peut former le modèle sur un nombre initial d'exemples de formation à l'aide d'une validation croisée. Le générateur de modèle peut déterminer si le modèle satisfait la précision cible et augmenter de manière itérative et géométrique le nombre d'exemples de formation sur la base d'une taille de pas géométrique optimisée (qui peut réduire au minimum le temps de construction de modèle) jusqu'à ce que le modèle atteigne la précision cible sur la base d'un niveau de confiance défini. Le générateur de modèle peut générer des étiquettes à l'aide d'un sous-ensemble de tuples à partir d'une expression de requête intermédiaire. Le générateur de modèle peut augmenter de manière itérative une taille du sous-ensemble de tuples utilisé jusqu'à ce qu'une erreur relative des étiquettes générées soit inférieure à un seuil cible.
Related patent documents
Latest bibliographic data on file with the International Bureau