Processing

Please wait...

Settings

Settings

Goto Application

1. WO2020112153 - OPTIMIZING LARGE SCALE DATA ANALYSIS

Publication Number WO/2020/112153
Publication Date 04.06.2020
International Application No. PCT/US2019/015657
International Filing Date 29.01.2019
IPC
G06F 16/31 2019.01
GPHYSICS
06COMPUTING; CALCULATING OR COUNTING
FELECTRIC DIGITAL DATA PROCESSING
16Information retrieval; Database structures therefor; File system structures therefor
30of unstructured textual data
31Indexing; Data structures therefor; Storage structures
CPC
G06F 16/325
GPHYSICS
06COMPUTING; CALCULATING; COUNTING
FELECTRIC DIGITAL DATA PROCESSING
16Information retrieval; Database structures therefor; File system structures therefor
30of unstructured textual data
31Indexing; Data structures therefor; Storage structures
316Indexing structures
325Hash tables
Applicants
  • GOOGLE LLC [US]/[US]
Inventors
  • BAO, Zhaosheng
  • ULBRICH, Andreas
  • WILHELM, Jeffrey
  • SKVORTSOV, Evgeny
  • TSANG, Yip Man
Agents
  • HENRY, Joel
  • HITT, Tracy M.
Priority Data
62/773,04629.11.2018US
Publication Language English (EN)
Filing Language English (EN)
Designated States
Title
(EN) OPTIMIZING LARGE SCALE DATA ANALYSIS
(FR) OPTIMISATION D'ANALYSE DE DONNÉES À GRANDE ÉCHELLE
Abstract
(EN)
Methods, systems, and apparatus, including computer programs encoded on a computer storage medium, for an object grouping system that obtains data for multiple sketches that are each stored using a set of registers and are a sampling of objects in a dataset. Each object in the dataset is a member of a digital audience. For each sketch, the system uses an identifier for a first object to generate a hashed parameter. The system determines whether the hashed parameter contributes to describing demographic attributes of the sampling of objects. The system stores demographic attributes of the first object at a register in the set when it determines that the hashed parameter contributes to describing the demographic attributes. The system generates an output that indicates a number of objects in the digital audience that were reached by content directed at the digital audience and demographic attributes for the number of objects.
(FR)
La présente invention concerne des procédés, des systèmes et un appareil, comprenant des programmes informatiques codés sur un support de stockage informatique, destinés à un système de regroupement d'objets qui obtient des données destinées à de multiples esquisses qui sont chacune stockées à l'aide d'un ensemble de registres et sont un échantillonnage d'objets dans un ensemble de données. Chaque objet dans l'ensemble de données est un membre d'un public numérique. Pour chaque esquisse, le système utilise un identifiant destiné à un premier objet afin de générer un paramètre de hachage. Le système détermine si le paramètre de hachage contribue à décrire des attributs démographiques de l'échantillonnage d'objets. Le système stocke des attributs démographiques du premier objet au niveau d'un registre dans l'ensemble lorsqu'il détermine que le paramètre de hachage contribue à décrire les attributs démographiques. Le système génère une sortie qui indique un certain nombre d'objets dans le public numérique qui ont été atteints par un contenu dirigé au public numérique et des attributs démographiques destinés au nombre d'objets.
Also published as
EP2019705852
Latest bibliographic data on file with the International Bureau