Processing

Please wait...

PATENTSCOPE will be unavailable a few hours for maintenance reason on Tuesday 25.01.2022 at 9:00 AM CET
Settings

Settings

Goto Application

1. WO2021212658 - OCR IMAGE SAMPLE GENERATION METHOD AND APPARATUS, PRINT FONT VERIFICATION METHOD AND APPARATUS, AND DEVICE AND MEDIUM

Publication Number WO/2021/212658
Publication Date 28.10.2021
International Application No. PCT/CN2020/099064
International Filing Date 30.06.2020
IPC
G06K 9/00 2006.1
GPHYSICS
06COMPUTING; CALCULATING OR COUNTING
KRECOGNITION OF DATA; PRESENTATION OF DATA; RECORD CARRIERS; HANDLING RECORD CARRIERS
9Methods or arrangements for reading or recognising printed or written characters or for recognising patterns, e.g. fingerprints
CPC
G06K 9/6256
GPHYSICS
06COMPUTING; CALCULATING; COUNTING
KRECOGNITION OF DATA; PRESENTATION OF DATA; RECORD CARRIERS; HANDLING RECORD CARRIERS
9Methods or arrangements for reading or recognising printed or written characters or for recognising patterns, e.g. fingerprints
62Methods or arrangements for recognition using electronic means
6217Design or setup of recognition systems and techniques; Extraction of features in feature space; Clustering techniques; Blind source separation
6256Obtaining sets of training patterns; Bootstrap methods, e.g. bagging, boosting
G06K 9/6267
GPHYSICS
06COMPUTING; CALCULATING; COUNTING
KRECOGNITION OF DATA; PRESENTATION OF DATA; RECORD CARRIERS; HANDLING RECORD CARRIERS
9Methods or arrangements for reading or recognising printed or written characters or for recognising patterns, e.g. fingerprints
62Methods or arrangements for recognition using electronic means
6267Classification techniques
G06V 10/22
G06V 30/10
G06V 30/412
Applicants
  • 平安国际智慧城市科技股份有限公司 PINGAN INTERNATIONAL SMART CITY TECHNOLOGY CO., LTD. [CN]/[CN]
Inventors
  • 陈伟杰 CHEN, WeiJie
Agents
  • 深圳市沃德知识产权代理事务所(普通合伙) SHENZHEN WORLD INTELLECTUAL PROPERTY AGENCY (GENERAL PARTNERSHIP )
Priority Data
202010333257.424.04.2020CN
Publication Language Chinese (zh)
Filing Language Chinese (ZH)
Designated States
Title
(EN) OCR IMAGE SAMPLE GENERATION METHOD AND APPARATUS, PRINT FONT VERIFICATION METHOD AND APPARATUS, AND DEVICE AND MEDIUM
(FR) PROCÉDÉ ET APPAREIL DE GÉNÉRATION D'ÉCHANTILLON D'IMAGE OCR, PROCÉDÉ ET APPAREIL DE VÉRIFICATION DE POLICE DE CARACTÈRES D'IMPRESSION ET DISPOSITIF ET SUPPORT
(ZH) OCR图像样本生成、印刷体验证方法、装置、设备及介质
Abstract
(EN) Disclosed are an OCR image sample generation method and apparatus, a print font verification method and apparatus, a device and a medium, which relate to artificial intelligence. The method comprises: receiving an image generation instruction, and acquiring an image sample; inputting the image sample into a preset font typesetting generation model; acquiring first annotation information by means of performing text detection and character recognition on the image sample, and obtaining a simulation result generated by means of the reconstruction of the font typesetting generation model; inputting the image sample and a simulated image into a preset style compositing model, such that the style compositing model extracts style features and content features, and generates a composite result; and acquiring an OCR image sample label and also recording a composite image as an OCR image sample corresponding to the image sample, and associating the OCR image sample with the OCR image sample label. By means of the method, an OCR image sample with the same texture style as an image sample is automatically generated, and automatic annotation with a sample label is realized.
(FR) L'invention concerne un procédé et un appareil de génération d'échantillon d'image OCR, un procédé et un appareil de vérification de police de caractères d'impression, un dispositif et un support, qui se rapportent à l'intelligence artificielle. Le procédé consiste : à recevoir une instruction de génération d'image et à acquérir un échantillon d'image ; à entrer l'échantillon d'image dans un modèle prédéfini de génération de composition de police de caractères ; à acquérir des premières informations d'annotation au moyen de la réalisation d'une détection de texte et d'une reconnaissance de caractères sur l'échantillon d'image et à obtenir un résultat de simulation généré au moyen de la reconstruction du modèle de génération de composition de police de caractères ; à entrer l'échantillon d'image et une image simulée dans un modèle de composition de style prédéfini de telle sorte que le modèle de composition de style extraie des caractéristiques de style et des caractéristiques de contenu, et génère un résultat composite ; et à acquérir une étiquette d'échantillon d'image OCR et à enregistrer également une image composite sous la forme d'un échantillon d'image OCR correspondant à l'échantillon d'image et à associer l'échantillon d'image OCR à l'étiquette d'échantillon d'image OCR. Au moyen du procédé, un échantillon d'image OCR ayant le même style de texture qu'un échantillon d'image est automatiquement généré et une annotation automatique avec une étiquette d'échantillon est réalisée.
(ZH) 一种OCR图像样本生成、印刷体验证方法、装置、设备及介质,涉及人工智能。该方法包括:接收图像生成指令,获取图像样本;将图像样本输入预设的字体排版生成模型,通过对图像样本进行文本检测和文字识别,获取第一标注信息,并且获取字体排版生成模型重构生成的模拟结果;将图像样本和模拟图像输入预设的风格合成模型,风格合成模型提取出风格特征和内容特征,风格合成模型生成合成结果;获取OCR图像样本标签,同时将合成图像记录为与图像样本对应的OCR图像样本,并将OCR图像样本与OCR图像样本标签关联。上述方法实现自动生成与图像样本一样纹理风格的OCR图像样本,自动标注样本标签。
Related patent documents
Latest bibliographic data on file with the International Bureau