Traitement en cours

Veuillez attendre...

Paramétrages

Paramétrages

Aller à Demande

1. EP2545495 - RECONNAISSANCE DE PARAGRAPHE DANS UN PROCESSUS DE RECONNAISSANCE OPTIQUE DE CARACTÈRES (OCR)

Office
Office européen des brevets (OEB)
Numéro de la demande 11753918
Date de la demande 08.03.2011
Numéro de publication 2545495
Date de publication 16.01.2013
Type de publication B1
CIB
G06V 30/224
G06K 19/06
GPHYSIQUE
06CALCUL; COMPTAGE
KRECONNAISSANCE DES DONNÉES; PRÉSENTATION DES DONNÉES; SUPPORTS D'ENREGISTREMENT; MANIPULATION DES SUPPORTS D'ENREGISTREMENT
19Supports d'enregistrement pour utilisation avec des machines et avec au moins une partie prévue pour supporter des marques numériques
06caractérisés par le genre de marque numérique, p.ex. forme, nature, code
CPC
G06V 30/416
G06V 30/414
Déposants MICROSOFT TECHNOLOGY LICENSING LLC
Inventeurs RADAKOVIC BOGDAN
GALIC SASA
UZELAC ALEKSANDAR
États désignés
Données relatives à la priorité 12720992 10.03.2010 US
Titre
(DE) ABSATZERKENNUNG IN EINEM OCR-VERFAHREN
(EN) PARAGRAPH RECOGNITION IN AN OPTICAL CHARACTER RECOGNITION (OCR) PROCESS
(FR) RECONNAISSANCE DE PARAGRAPHE DANS UN PROCESSUS DE RECONNAISSANCE OPTIQUE DE CARACTÈRES (OCR)
Abrégé
(EN) An image processing apparatus for detecting paragraphs in a textual image includes an input component for receiving an input image in which textual lines and words have been identified and a page classification component for classifying the input image as a first or second page type. The apparatus also includes a paragraph detection component for classifying all textual lines on the input image as a beginning paragraph line or a continuation paragraph line. The apparatus is also provided with a paragraph creation component for creating paragraphs that include textual lines between two successive beginning paragraph lines, including a first of the two successive beginning paragraph lines. The paragraphs that have been identified may be classified by the type of alignment they exhibit. For instance, paragraphs may be classified according to whether they are left aligned, right aligned, center aligned or justified.
(FR) Un appareil de traitement d'image permettant de détecter des paragraphes dans une image textuelle comporte un composant d'entrée servant à recevoir une image d'entrée dans laquelle des lignes de texte et des mots ont été identifiés, et un composant de classification de page servant à classifier l'image d'entrée en tant que premier ou second type de page. L'appareil comprend également un composant de détection de paragraphe servant à classifier toutes les lignes de texte sur l'image d'entrée en tant que ligne de début de paragraphe ou en tant que ligne de continuation de paragraphe. L'appareil comprend également un composant de création de paragraphe servant à créer des paragraphes qui comportent des lignes de texte entre deux lignes successives de début de paragraphe, comprenant une première ligne des deux lignes successives de début de paragraphe. Les paragraphes qui ont été identifiés peuvent être classifiés en fonction du type d'alignement qu'ils présentent. Par exemple, des paragraphes peuvent être classifiés selon le fait qu'ils sont alignés à gauche, alignés à droite, centrés ou justifiés.
Documents de brevet associés