Processing

Please wait...

Settings

Settings

Goto Application

1. WO2020033805 - WEBSITE REPRESENTATION VECTOR TO GENERATE SEARCH RESULTS AND CLASSIFY WEBSITE

Publication Number WO/2020/033805
Publication Date 13.02.2020
International Application No. PCT/US2019/045861
International Filing Date 09.08.2019
IPC
G06F 16/951 2019.01
GPHYSICS
06COMPUTING; CALCULATING OR COUNTING
FELECTRIC DIGITAL DATA PROCESSING
16Information retrieval; Database structures therefor; File system structures therefor
90Details of database functions independent of the retrieved data types
95Retrieval from the web
951Indexing; Web crawling techniques
G06F 16/953 2019.01
GPHYSICS
06COMPUTING; CALCULATING OR COUNTING
FELECTRIC DIGITAL DATA PROCESSING
16Information retrieval; Database structures therefor; File system structures therefor
90Details of database functions independent of the retrieved data types
95Retrieval from the web
953Querying, e.g. by the use of web search engines
CPC
G06F 16/3334
GPHYSICS
06COMPUTING; CALCULATING; COUNTING
FELECTRIC DIGITAL DATA PROCESSING
16Information retrieval; Database structures therefor; File system structures therefor
30of unstructured textual data
33Querying
3331Query processing
3332Query translation
3334Selection or weighting of terms from queries, including natural language queries
G06F 16/3347
GPHYSICS
06COMPUTING; CALCULATING; COUNTING
FELECTRIC DIGITAL DATA PROCESSING
16Information retrieval; Database structures therefor; File system structures therefor
30of unstructured textual data
33Querying
3331Query processing
334Query execution
3347using vector based model
G06F 16/3349
GPHYSICS
06COMPUTING; CALCULATING; COUNTING
FELECTRIC DIGITAL DATA PROCESSING
16Information retrieval; Database structures therefor; File system structures therefor
30of unstructured textual data
33Querying
3331Query processing
3349Reuse of stored results of previous queries
G06F 16/86
GPHYSICS
06COMPUTING; CALCULATING; COUNTING
FELECTRIC DIGITAL DATA PROCESSING
16Information retrieval; Database structures therefor; File system structures therefor
80of semi-structured data, e.g. markup language structured data such as SGML, XML or HTML
84Mapping; Conversion
86Mapping to a database
G06F 16/951
GPHYSICS
06COMPUTING; CALCULATING; COUNTING
FELECTRIC DIGITAL DATA PROCESSING
16Information retrieval; Database structures therefor; File system structures therefor
90Details of database functions independent of the retrieved data types
95Retrieval from the web
951Indexing; Web crawling techniques
G06F 16/953
GPHYSICS
06COMPUTING; CALCULATING; COUNTING
FELECTRIC DIGITAL DATA PROCESSING
16Information retrieval; Database structures therefor; File system structures therefor
90Details of database functions independent of the retrieved data types
95Retrieval from the web
953Querying, e.g. by the use of web search engines
Applicants
  • GOOGLE LLC [US]/[US]
Inventors
  • TSYKYNOVSKYY, Yevgen
Agents
  • FRANZ, Paul E.
Priority Data
16/100,71310.08.2018US
Publication Language English (EN)
Filing Language English (EN)
Designated States
Title
(EN) WEBSITE REPRESENTATION VECTOR TO GENERATE SEARCH RESULTS AND CLASSIFY WEBSITE
(FR) VECTEUR DE REPRÉSENTATION DE SITE WEB PERMETTANT LA GÉNÉRATION DE RÉSULTATS DE RECHERCHE ET LA CLASSIFICATION D'UN SITE WEB
Abstract
(EN)
Methods, systems, and apparatus, including computer programs encoded on computer storage media, for using website representations to generate, store, or both, search results. One of the methods includes receiving data representing each website in a first plurality of websites associated with a first knowledge domain of a plurality of knowledge domains and having a first classification; receiving data representing each website in a second plurality of websites associated with the first knowledge domain and having a second classification; generating a first composite-representation of the first plurality of websites; generating a second composite-representation of the second plurality of websites; receiving a representation of a third website; determining a first difference measure between the first composite-representation and the representation; determining a second difference measure between the second composite-representation and the representation; and based on the first difference measure and the second difference measure, classifying the third website.
(FR)
L'invention concerne des procédés, des systèmes et un appareil, comprenant des programmes informatiques codés sur des supports d'informations informatiques, permettant d'utiliser des représentations de sites Web pour générer et/ou mémoriser des résultats de recherche. Un des procédés consiste à recevoir des données représentant chaque site Web dans une première pluralité de sites Web associés à un premier domaine de connaissances d'une pluralité de domaines de connaissances et présentant une première classification ; à recevoir des données représentant chaque site Web dans une deuxième pluralité de sites Web associés au premier domaine de connaissances et présentant une deuxième classification ; à générer une première représentation composite de la première pluralité de sites Web ; à générer une deuxième représentation composite de la deuxième pluralité de sites Web ; à recevoir une représentation d'un troisième site Web ; à déterminer une première mesure de différence entre la première représentation composite et la représentation ; à déterminer une deuxième mesure de différence entre la deuxième représentation composite et la représentation ; et en fonction de la première mesure de différence et de la deuxième mesure de différence, à classer le troisième site Web.
Also published as
Latest bibliographic data on file with the International Bureau