Recherche dans les collections de brevets nationales et internationales

1. (WO2018125669) IDENTIFICATION D'UNE STRUCTURE PRÉSENTÉE DANS UN FORMAT DE DOCUMENT PORTABLE (PDF)

Pub. No.:    WO/2018/125669    International Application No.:    PCT/US2017/067275
Publication Date: Fri Jul 06 01:59:59 CEST 2018 International Filing Date: Wed Dec 20 00:59:59 CET 2017
IPC: G06F 17/27
Applicants: FACTSET RESEARCH SYSTEMS INC.
Inventors: CHEN, Yan
Title: IDENTIFICATION D'UNE STRUCTURE PRÉSENTÉE DANS UN FORMAT DE DOCUMENT PORTABLE (PDF)
Abstract:
L'invention concerne un procédé d'identification d'une structure d'un document PDF natif. Le procédé consiste à : obtenir un document PDF natif comportant une première ligne pour commencer une table et une seconde ligne pour terminer la table ; détecter la valeur d'une caractéristique physique du document PDF natif, la caractéristique physique comportant un facteur de pondération correspondant ; appliquer une valeur au facteur de pondération ; attribuer un premier état à la première ligne et un second état à la seconde ligne sur la base de (a) de la caractéristique physique et (b) du facteur de pondération ; et identifier un emplacement de la table sur le document PDF natif à partir du premier état et du second état afin d'obtenir un emplacement identifié de la table.