Traitement en cours

Veuillez attendre...

Paramétrages

Paramétrages

Aller à Demande

1. CN102782702 - Paragraph recognition in an optical character recognition (OCR) process

Office
Chine
Numéro de la demande 201180013187.3
Date de la demande 08.03.2011
Numéro de publication 102782702
Date de publication 14.11.2012
Numéro de délivrance 102782702
Date de délivrance 11.06.2014
Type de publication B
CIB
G06K 9/03
GPHYSIQUE
06CALCUL; COMPTAGE
KRECONNAISSANCE DES DONNÉES; PRÉSENTATION DES DONNÉES; SUPPORTS D'ENREGISTREMENT; MANIPULATION DES SUPPORTS D'ENREGISTREMENT
9Méthodes ou dispositions pour la lecture ou la reconnaissance de caractères imprimés ou écrits ou pour la reconnaissance de formes, p.ex. d'empreintes digitales
03Détection ou correction d'erreurs, p.ex. par une seconde exploration
G06K 9/20
GPHYSIQUE
06CALCUL; COMPTAGE
KRECONNAISSANCE DES DONNÉES; PRÉSENTATION DES DONNÉES; SUPPORTS D'ENREGISTREMENT; MANIPULATION DES SUPPORTS D'ENREGISTREMENT
9Méthodes ou dispositions pour la lecture ou la reconnaissance de caractères imprimés ou écrits ou pour la reconnaissance de formes, p.ex. d'empreintes digitales
20Obtention de l'image
G06K 19/06
GPHYSIQUE
06CALCUL; COMPTAGE
KRECONNAISSANCE DES DONNÉES; PRÉSENTATION DES DONNÉES; SUPPORTS D'ENREGISTREMENT; MANIPULATION DES SUPPORTS D'ENREGISTREMENT
19Supports d'enregistrement pour utilisation avec des machines et avec au moins une partie prévue pour supporter des marques numériques
06caractérisés par le genre de marque numérique, p.ex. forme, nature, code
CPC
G06V 30/416
G06V 30/414
Déposants Microsoft Corporation
Inventeurs Radakovic Bogdan
Galic Sasa
Uzelac Aleksandar
Mandataires li shu wang yang
Données relatives à la priorité 12720992 10.03.2010 US
Titre
(EN) Paragraph recognition in an optical character recognition (OCR) process
(ZH) 在光学字符识别(OCR)过程中的段落识别
Abrégé
(EN) An image processing apparatus for detecting paragraphs in a textual image includes an input component for receiving an input image in which textual lines and words have been identified and a page classification component for classifying the input image as a first or second page type. The apparatus also includes a paragraph detection component for classifying all textual lines on the input image as a beginning paragraph line or a continuation paragraph line. The apparatus is also provided with a paragraph creation component for creating paragraphs that include textual lines between two successive beginning paragraph lines, including a first of the two successive beginning paragraph lines. The paragraphs that have been identified may be classified by the type of alignment they exhibit.; For instance, paragraphs may be classified according to whether they are left aligned, right aligned, center aligned or justified.
(ZH)

用于检测在文本图像中的段落的图像处理设备包括:输入部件,用于接收其中文本行和单词已被标识的输入图像;和页分类部件,用于把输入图像分类为第一或第二页类型。该设备还包括段落检测部件,用于把在输入图像上的所有文本行分类为开始段落行或继续段落行。设备还被提供有段落创建部件,用于创建包括两个连续的开始段落行之间的文本行,包括所述两个连续的开始段落行的第一个开始段落行的段落。已被识别的段落可以通过它们呈现的对齐的类型而被分类。例如,段落可以按照它们是左对齐、右对齐、居中对齐还是两端对齐而进行分类。


Documents de brevet associés