PATENTSCOPE will be unavailable a few hours for maintenance reason on Tuesday 19.11.2019 at 4:00 PM CET
Search International and National Patent Collections
Some content of this application is unavailable at the moment.
If this situation persists, please contact us atFeedback&Contact
1. (RU0002421810) PARSING OF DOCUMENT VISUAL STRUCTURES

Office : Russian Federation
Application Number: 2007149074/08 Application Date: 30.06.2006
Publication Number: 0002421810 Publication Date: 20.06.2011
Grant Number: Grant Date: 20.06.2011
Publication Kind : C2
Prior PCT appl.: Application Number:US2006026140 ; Publication Number:WO2007005937 Click to see the data
IPC:
G06K 9/72
G PHYSICS
06
COMPUTING; CALCULATING; COUNTING
K
RECOGNITION OF DATA; PRESENTATION OF DATA; RECORD CARRIERS; HANDLING RECORD CARRIERS
9
Methods or arrangements for reading or recognising printed or written characters or for recognising patterns, e.g. fingerprints
62
Methods or arrangements for recognition using electronic means
72
using context analysis based on the provisionally recognised identity of a number of successive patterns, e.g. a word
CPC:
G06K 9/726
G06F 17/271
G06K2209/01
Applicants:
Inventors: ВАЙОЛА Пол А. (US)
ШИЛЬМАН Майкл (US)
VAJOLA Pol A. (US)
ShIL'MAN Majkl (US)
Priority Data: 11/173,280 01.07.2005 US
Title: (EN) PARSING OF DOCUMENT VISUAL STRUCTURES
(RU) ГРАММАТИЧЕСКИЙ РАЗБОР ВИЗУАЛЬНЫХ СТРУКТУР ДОКУМЕНТА
Abstract: front page image
(EN) FIELD: information technologies. SUBSTANCE: 2D representation of a document is used to identify a visual structure, which helps to recognise a document. The visual structure is exposed to grammatical analysis by association of multiple grammatical rules with multiple types of symbols identifier in the visual structure of the document. This makes it possible to recognise components of the document (for instance, columns, names of authors, headings, references, etc.), as a result of which structural components of the document may be accurately interpreted. At the same time the grammatical analysis is based on a function of grammatical value, which is produced by means of a machine training procedure. At the same time the grammatical analysis comprises representation of analysis in the form of an image and estimation of an image for execution of the grammatical value function with definition of optimal analysis. To simplify document recognition, it is possible to use procedures of grammatical analysis, where procedures of amplification and/or "quick recognition criteria", etc. are used. EFFECT: improved accuracy of document detection. 19 cl, 10 dwg, 5 tbl
(RU) Изобретение относится к методам распознавания и может быть использовано для распознавания текстовых документов. Техническим результатом является улучшение точности распознавания документа. Двумерное представление документа используется для выделения визуальной структуры, которая способствует распознаванию документа. Визуальную структуру подвергают грамматическому анализу посредством ассоциирования множества грамматических правил с множеством типов символов, идентифицированных в визуальной структуре документа. Это позволяет распознавать компоненты документа (например, колонки, фамилии авторов, заголовки, сноски и т.д.), в результате чего структурные компоненты документа можно точно интерпретировать. При этом грамматический анализ основан на функции грамматической стоимости, которую выводят посредством методики обучения машины. Причем грамматический анализ содержит представление анализа в виде изображения и оценку изображения для реализации функции грамматической стоимости при определении оптимального анализа. Для упрощения распознавания документа можно использовать методики грамматического анализа, в которых используются методики усиления и/или "признаки быстрого распознавания" и т.п. 6 н. и 13 з.п. ф-лы, 10 ил., 5 табл.
Also published as:
NO20080090NZ565147MXMX/a/2008/000180KR1020080026128EP1894144ZA2008/00041
JP2009500755CN101253514CA2614177IN40/DELNP/2008WO/2007/005937