Processing

Please wait...

Settings

Settings

Goto Application

1. WO2022005613 - EFFICIENTLY CONSTRUCTING REGRESSION MODELS FOR SELECTIVITY ESTIMATION

Publication Number WO/2022/005613
Publication Date 06.01.2022
International Application No. PCT/US2021/031469
International Filing Date 10.05.2021
IPC
G06F 16/2453 2019.1
GPHYSICS
06COMPUTING; CALCULATING OR COUNTING
FELECTRIC DIGITAL DATA PROCESSING
16Information retrieval; Database structures therefor; File system structures therefor
20of structured data, e.g. relational data
24Querying
245Query processing
2453Query optimisation
G06N 20/00 2019.1
GPHYSICS
06COMPUTING; CALCULATING OR COUNTING
NCOMPUTER SYSTEMS BASED ON SPECIFIC COMPUTATIONAL MODELS
20Machine learning
Applicants
  • MICROSOFT TECHNOLOGY LICENSING, LLC [US]/[US]
Inventors
  • DUTT, Anshuman
  • WANG, Chi
  • NARASAYYA, Vivek Ravindranath
  • CHAUDHURI, Surajit
Agents
  • SWAIN, Cassandra T.
  • BARKER, Doug
  • CHATTERJEE, Aaron C.
  • CHEN, Wei-Chen Nicholas
  • CHOI, Daniel
  • CHURNA, Timothy
  • DINH, Phong
  • EVANS, Patrick
  • GABRYJELSKI, Henry
  • GUPTA, Anand
  • HWANG, William C.
  • JARDINE, John S.
  • LEE, Sunah
  • LEMMON, Marcus
  • MARQUIS, Thomas
  • MEYERS, Jessica
  • ROPER, Brandon
  • SPELLMAN, Steven
  • SULLIVAN, Kevin
  • WALKER, Matt
  • WIGHT, Stephen A.
  • WISDOM, Gregg
  • WONG, Ellen
  • WONG, Thomas S.
  • ZHANG, Hannah
  • AKHTER, Julia
  • KADOURA, Judy M.
  • NIU, Bo
  • OLANIRAN, Qudus
  • BROWN, Renee
  • TRAN, Kimberly
Priority Data
16/917,85730.06.2020US
Publication Language English (en)
Filing Language English (EN)
Designated States
Title
(EN) EFFICIENTLY CONSTRUCTING REGRESSION MODELS FOR SELECTIVITY ESTIMATION
(FR) CONSTRUCTION EFFICACE DE MODÈLES DE RÉGRESSION POUR UNE ESTIMATION DE SÉLECTIVITÉ
Abstract
(EN) A model generator constructs a model for estimating selectivity of database operations by determining a number of training examples necessary for the model to achieve a target accuracy and by generating approximate selectivity labels for the training examples. The model generator may train the model on an initial number of training examples using cross-validation. The model generator may determine whether the model satisfies the target accuracy and iteratively and geometrically increase the number of training examples based on an optimized geometric step size (which may minimize model construction time) until the model achieves the target accuracy based on a defined confidence level. The model generator may generate labels using a subset of tuples from an intermediate query expression. The model generator may iteratively increase a size of the subset of tuples used until a relative error of the generated labels is below a target threshold.
(FR) Un générateur de modèle construit un modèle permettant d'estimer la sélectivité d'opérations de base de données par détermination d'un nombre d'exemples de formation nécessaires pour que le modèle obtienne une précision cible et par génération d'étiquettes de sélectivité approximatives correspondant aux exemples de formation. Le générateur de modèle peut former le modèle sur un nombre initial d'exemples de formation à l'aide d'une validation croisée. Le générateur de modèle peut déterminer si le modèle satisfait la précision cible et augmenter de manière itérative et géométrique le nombre d'exemples de formation sur la base d'une taille de pas géométrique optimisée (qui peut réduire au minimum le temps de construction de modèle) jusqu'à ce que le modèle atteigne la précision cible sur la base d'un niveau de confiance défini. Le générateur de modèle peut générer des étiquettes à l'aide d'un sous-ensemble de tuples à partir d'une expression de requête intermédiaire. Le générateur de modèle peut augmenter de manière itérative une taille du sous-ensemble de tuples utilisé jusqu'à ce qu'une erreur relative des étiquettes générées soit inférieure à un seuil cible.
Related patent documents
Latest bibliographic data on file with the International Bureau