Traitement en cours

Veuillez attendre...

Paramétrages

Paramétrages

Aller à Demande

1. WO2020117649 - PROCÉDÉS ET SYSTÈMES DE DÉTECTION AUTOMATIQUE DE TABLE DANS DES DOCUMENTS

Numéro de publication WO/2020/117649
Date de publication 11.06.2020
N° de la demande internationale PCT/US2019/063954
Date du dépôt international 02.12.2019
CIB
G06K 9/00 2006.01
GPHYSIQUE
06CALCUL; COMPTAGE
KRECONNAISSANCE DES DONNÉES; PRÉSENTATION DES DONNÉES; SUPPORTS D'ENREGISTREMENT; MANIPULATION DES SUPPORTS D'ENREGISTREMENT
9Méthodes ou dispositions pour la lecture ou la reconnaissance de caractères imprimés ou écrits ou pour la reconnaissance de formes, p.ex. d'empreintes digitales
G06K 9/36 2006.01
GPHYSIQUE
06CALCUL; COMPTAGE
KRECONNAISSANCE DES DONNÉES; PRÉSENTATION DES DONNÉES; SUPPORTS D'ENREGISTREMENT; MANIPULATION DES SUPPORTS D'ENREGISTREMENT
9Méthodes ou dispositions pour la lecture ou la reconnaissance de caractères imprimés ou écrits ou pour la reconnaissance de formes, p.ex. d'empreintes digitales
36Prétraitement de l'image, c. à d. traitement de l'information image sans se préoccuper de l'identité de l'image
G06K 9/46 2006.01
GPHYSIQUE
06CALCUL; COMPTAGE
KRECONNAISSANCE DES DONNÉES; PRÉSENTATION DES DONNÉES; SUPPORTS D'ENREGISTREMENT; MANIPULATION DES SUPPORTS D'ENREGISTREMENT
9Méthodes ou dispositions pour la lecture ou la reconnaissance de caractères imprimés ou écrits ou pour la reconnaissance de formes, p.ex. d'empreintes digitales
36Prétraitement de l'image, c. à d. traitement de l'information image sans se préoccuper de l'identité de l'image
46Extraction d'éléments ou de caractéristiques de l'image
G06N 3/02 2006.01
GPHYSIQUE
06CALCUL; COMPTAGE
NSYSTÈMES DE CALCULATEURS BASÉS SUR DES MODÈLES DE CALCUL SPÉCIFIQUES
3Systèmes de calculateurs basés sur des modèles biologiques
02utilisant des modèles de réseaux neuronaux
CPC
G06K 2209/01
GPHYSICS
06COMPUTING; CALCULATING; COUNTING
KRECOGNITION OF DATA; PRESENTATION OF DATA; RECORD CARRIERS; HANDLING RECORD CARRIERS
2209Indexing scheme relating to methods or arrangements for reading or recognising printed or written characters or for recognising patterns, e.g. fingerprints
01Character recognition
G06K 9/00449
GPHYSICS
06COMPUTING; CALCULATING; COUNTING
KRECOGNITION OF DATA; PRESENTATION OF DATA; RECORD CARRIERS; HANDLING RECORD CARRIERS
9Methods or arrangements for reading or recognising printed or written characters or for recognising patterns, e.g. fingerprints
00442Document analysis and understanding; Document recognition
00449Layout structured with printed lines or input boxes, e.g. business forms, tables
G06K 9/00456
GPHYSICS
06COMPUTING; CALCULATING; COUNTING
KRECOGNITION OF DATA; PRESENTATION OF DATA; RECORD CARRIERS; HANDLING RECORD CARRIERS
9Methods or arrangements for reading or recognising printed or written characters or for recognising patterns, e.g. fingerprints
00442Document analysis and understanding; Document recognition
00456Classification of image contents, e.g. text, photographs, tables
G06K 9/00463
GPHYSICS
06COMPUTING; CALCULATING; COUNTING
KRECOGNITION OF DATA; PRESENTATION OF DATA; RECORD CARRIERS; HANDLING RECORD CARRIERS
9Methods or arrangements for reading or recognising printed or written characters or for recognising patterns, e.g. fingerprints
00442Document analysis and understanding; Document recognition
00463Document analysis by extracting the geometrical structure, e.g. layout tree; Block segmentation, e.g. bounding boxes for graphics, paragraphs, words or letters
G06K 9/4628
GPHYSICS
06COMPUTING; CALCULATING; COUNTING
KRECOGNITION OF DATA; PRESENTATION OF DATA; RECORD CARRIERS; HANDLING RECORD CARRIERS
9Methods or arrangements for reading or recognising printed or written characters or for recognising patterns, e.g. fingerprints
36Image preprocessing, i.e. processing the image information without deciding about the identity of the image
46Extraction of features or characteristics of the image
4604Detecting partial patterns, e.g. edges or contours, or configurations, e.g. loops, corners, strokes, intersections
4609by matching or filtering
4619Biologically-inspired filters, e.g. receptive fields
4623with interaction between the responses of different filters
4628Integrating the filters into a hierarchical structure
G06K 9/6218
GPHYSICS
06COMPUTING; CALCULATING; COUNTING
KRECOGNITION OF DATA; PRESENTATION OF DATA; RECORD CARRIERS; HANDLING RECORD CARRIERS
9Methods or arrangements for reading or recognising printed or written characters or for recognising patterns, e.g. fingerprints
62Methods or arrangements for recognition using electronic means
6217Design or setup of recognition systems and techniques; Extraction of features in feature space; Clustering techniques; Blind source separation
6218Clustering techniques
Déposants
  • LEVERTON HOLDING LLC [US]/[US]
Inventeurs
  • SCHÄFER, Christian
  • KIEWEG, Michael
Mandataires
  • REIBMAN, Andrew, L.
  • PLUMMER, Kelly, A.
  • WEBER, Brett, J.
  • HUBBARD, Nolan
  • MAJEWSKI, Dennis
Données relatives à la priorité
62/775,06204.12.2018US
Langue de publication anglais (EN)
Langue de dépôt anglais (EN)
États désignés
Titre
(EN) METHODS AND SYSTEMS FOR AUTOMATED TABLE DETECTION WITHIN DOCUMENTS
(FR) PROCÉDÉS ET SYSTÈMES DE DÉTECTION AUTOMATIQUE DE TABLE DANS DES DOCUMENTS
Abrégé
(EN)
Methods and systems for detecting tables within documents are provided. The methods and systems may include receiving a text of the document that includes a plurality of words depicted in the document image. Feature sets may be calculated for the words and may contain one or more features of a corresponding word of the text. Candidate table words may then be identified based on the features vectors, and may then be used to identify a table location within the document image. In some cases, the candidate table words may be identified using a machine learning model.
(FR)
L'invention concerne des procédés et des systèmes de détection de tables dans des documents. Les procédés et les systèmes peuvent consister à recevoir un texte du document qui contient une pluralité de mots représentés dans l'image de document. Des ensembles de caractéristiques peuvent être calculés pour les mots et peuvent contenir une ou plusieurs caractéristiques d'un mot correspondant du texte. Des mots de table candidats peuvent alors être identifiés en fonction des vecteurs caractéristiques, et peuvent ensuite être utilisés pour identifier un emplacement de table dans l'image de document. Dans certains cas, les mots de table candidats peuvent être identifiés en utilisant un modèle d'apprentissage automatique.
Dernières données bibliographiques dont dispose le Bureau international