WIPO logo
Mobile | Deutsch | Español | Français | 日本語 | 한국어 | Português | Русский | 中文 | العربية |
PATENTSCOPE

Search International and National Patent Collections
World Intellectual Property Organization
Search
 
Browse
 
Translate
 
Options
 
News
 
Login
 
Help
 
Machine translation
1. (WO2017062678) AUTOMATED EXTRACTION OF DATA FROM WEB PAGES
Latest bibliographic data on file with the International Bureau    Submit observation

Pub. No.: WO/2017/062678 International Application No.: PCT/US2016/055835
Publication Date: 13.04.2017 International Filing Date: 06.10.2016
IPC:
G06F 17/30 (2006.01)
Applicants: IMPOSSIBLE VENTURES, LLC[US/US]; 3711 S. MoPac Expy Building 1, Suite 150 Austin, Texas 78735, US
Inventors: ALISON, Samuel; US
ENGLE, Ryan; US
RIESTERER, Jacob; US
COON, Jonathan; US
Agent: RAUBVOGEL, Amir H.; US
Priority Data:
62/238,56507.10.2015US
62/238,57407.10.2015US
62/376,24317.08.2016US
Title (EN) AUTOMATED EXTRACTION OF DATA FROM WEB PAGES
(FR) EXTRACTION AUTOMATISÉE DE DONNÉES DE PAGES WEB
Abstract: front page image
(EN) Various embodiments provide techniques for automatically extracting data from web pages. Such extraction can take place without the use of a browser, and without necessarily rendering the entire web page. Thus, data extraction can be performed more efficiently and more quickly, while reducing the computing resources needed to perform such operations. In at least one embodiment, data extraction and translation are performed by automatically parsing structured data from visible and hidden elements of a web page.
(FR) Divers modes de réalisation ont trait à des techniques permettant une extraction automatique de données de pages Web. Une telle extraction peut avoir lieu sans utiliser un logiciel de navigation et sans reproduire nécessairement l'ensemble de la page Web. Ainsi, une extraction de données peut être réalisée de manière plus efficace et plus rapide tout en réduisant les ressources de calcul nécessaires pour réaliser de telles opérations. Dans au moins un mode de réalisation, une extraction et une traduction de données sont réalisées par une analyse syntaxique automatique de données structurées à partir d'éléments visibles et cachés d'une page Web.
Designated States: AE, AG, AL, AM, AO, AT, AU, AZ, BA, BB, BG, BH, BN, BR, BW, BY, BZ, CA, CH, CL, CN, CO, CR, CU, CZ, DE, DJ, DK, DM, DO, DZ, EC, EE, EG, ES, FI, GB, GD, GE, GH, GM, GT, HN, HR, HU, ID, IL, IN, IR, IS, JP, KE, KG, KN, KP, KR, KW, KZ, LA, LC, LK, LR, LS, LU, LY, MA, MD, ME, MG, MK, MN, MW, MX, MY, MZ, NA, NG, NI, NO, NZ, OM, PA, PE, PG, PH, PL, PT, QA, RO, RS, RU, RW, SA, SC, SD, SE, SG, SK, SL, SM, ST, SV, SY, TH, TJ, TM, TN, TR, TT, TZ, UA, UG, US, UZ, VC, VN, ZA, ZM, ZW
African Regional Intellectual Property Organization (ARIPO) (BW, GH, GM, KE, LR, LS, MW, MZ, NA, RW, SD, SL, ST, SZ, TZ, UG, ZM, ZW)
Eurasian Patent Office (AM, AZ, BY, KG, KZ, RU, TJ, TM)
European Patent Office (EPO) (AL, AT, BE, BG, CH, CY, CZ, DE, DK, EE, ES, FI, FR, GB, GR, HR, HU, IE, IS, IT, LT, LU, LV, MC, MK, MT, NL, NO, PL, PT, RO, RS, SE, SI, SK, SM, TR)
African Intellectual Property Organization (BF, BJ, CF, CG, CI, CM, GA, GN, GQ, GW, KM, ML, MR, NE, SN, TD, TG)
Publication Language: English (EN)
Filing Language: English (EN)