Some content of this application is unavailable at the moment.
If this situation persist, please contact us atFeedback&Contact
1. (WO2017148265) WORD SEGMENTATION METHOD AND APPARATUS
Latest bibliographic data on file with the International Bureau    Submit observation

Pub. No.: WO/2017/148265 International Application No.: PCT/CN2017/073718
Publication Date: 08.09.2017 International Filing Date: 16.02.2017
IPC:
G06K 9/34 (2006.01)
G PHYSICS
06
COMPUTING; CALCULATING; COUNTING
K
RECOGNITION OF DATA; PRESENTATION OF DATA; RECORD CARRIERS; HANDLING RECORD CARRIERS
9
Methods or arrangements for reading or recognising printed or written characters or for recognising patterns, e.g. fingerprints
20
Image acquisition
34
Segmentation of touching or overlapping patterns in the image field
Applicants:
阿里巴巴集团控股有限公司 ALIBABA GROUP HOLDING LIMITED; 英属开曼群岛大开曼资本大厦一座四层847号邮箱 Fourth Floor, One Capital Place, P.O. Box 847, George Town, Grand Cayman, KY
Inventors:
周文猛 ZHOU, Wenmeng; CN
程孟力 CHENG, Mengli; CN
毛旭东 MAO, Xudong; CN
施兴 SHI, Xing; CN
褚崴 CHU, Wei; CN
Agent:
北京三友知识产权代理有限公司 BEIJING SANYOU INTELLECTUAL PROPERTY AGENCY LTD.; 中国北京市 金融街35号国际企业大厦A座16层 16th Fl., Block A, Corporate Square, No.35 Jinrong Street Beijing 100033, CN
Priority Data:
201610112463.629.02.2016CN
Title (EN) WORD SEGMENTATION METHOD AND APPARATUS
(FR) PROCÉDÉ ET APPAREIL DE SEGMENTATION DE MOTS
(ZH) 一种单词的分割方法和装置
Abstract:
(EN) A word segmentation method and apparatus. The method comprises: obtaining a sample image comprising a word spacing marker or a non-word spacing marker; processing the sample image by using a convolutional neural network to obtain a first feature vector corresponding to the sample image, and a word spacing probability value and/or non-word spacing probability value corresponding to the first feature vector (301); obtaining an image to be tested and processing the image to be tested by using the convolutional neural network to obtain a second feature vector corresponding to the image to be tested, and a word spacing probability value or a non-word spacing probability value corresponding to the second feature vector; and performing word segmentation on the image to be tested by using the currently obtained word spacing probability values or non-word spacing probability values (302). The technical solution implements precise word segmentation so that word segmentation efficiency is improved, and increases the speed of word segmentation, thereby improving user experience.
(FR) L'invention concerne un procédé et un appareil de segmentation de mots. Le procédé comprend les étapes suivantes : obtenir une image échantillon comprenant un marqueur d'espacement de mots ou un marqueur de non-espacement de mots ; traiter l'image échantillon en utilisant un réseau neuronal convolutif pour obtenir un premier vecteur caractéristique correspondant à l'image échantillon, et une valeur de probabilité d'espacement de mots et/ou une valeur de probabilité de non-espacement de mots correspondant au premier vecteur caractéristique (301) ; obtenir une image à tester et traiter l'image à tester en utilisant le réseau neuronal convolutif pour obtenir un deuxième vecteur caractéristique correspondant à l'image à tester, et une valeur de probabilité d'espacement de mots ou une valeur de probabilité de non-espacement de mots correspondant au deuxième vecteur caractéristique ; et effectuer une segmentation de mots sur l'image à tester en utilisant les valeurs de probabilité d'espacement de mots ou les valeurs de probabilité de non-espacement de mots obtenues actuellement (302). La solution technique met en œuvre une segmentation de mots précise de sorte que l'efficacité de segmentation de mots soit améliorée, et augmente la vitesse de segmentation de mots, améliorant ainsi l'expérience de l'utilisateur.
(ZH) 一种单词的分割方法和装置,该方法包括:获取样本图像,所述样本图像包括单词间隔标记或者非单词间隔标记;利用卷积神经网络对所述样本图像进行处理,得到所述样本图像对应的第一特征向量、所述第一特征向量对应的单词间隔概率值和/或非单词间隔概率值(301);获取待测试图像,并利用所述卷积神经网络对所述待测试图像进行处理,得到所述待测试图像对应的第二特征向量、所述第二特征向量对应的单词间隔概率值或者非单词间隔概率值;利用当前得到的单词间隔概率值或者非单词间隔概率值,对所述待测试图像进行单词分割(302)。通过该技术方案,精准的进行单词分割,使得单词分割的准确率得到提高,提高单词分割的速度,提高用户使用体验。
front page image
Designated States: AE, AG, AL, AM, AO, AT, AU, AZ, BA, BB, BG, BH, BN, BR, BW, BY, BZ, CA, CH, CL, CN, CO, CR, CU, CZ, DE, DJ, DK, DM, DO, DZ, EC, EE, EG, ES, FI, GB, GD, GE, GH, GM, GT, HN, HR, HU, ID, IL, IN, IR, IS, JP, KE, KG, KH, KN, KP, KR, KW, KZ, LA, LC, LK, LR, LS, LU, LY, MA, MD, ME, MG, MK, MN, MW, MX, MY, MZ, NA, NG, NI, NO, NZ, OM, PA, PE, PG, PH, PL, PT, QA, RO, RS, RU, RW, SA, SC, SD, SE, SG, SK, SL, SM, ST, SV, SY, TH, TJ, TM, TN, TR, TT, TZ, UA, UG, US, UZ, VC, VN, ZA, ZM, ZW
African Regional Intellectual Property Organization (ARIPO) (BW, GH, GM, KE, LR, LS, MW, MZ, NA, RW, SD, SL, ST, SZ, TZ, UG, ZM, ZW)
Eurasian Patent Office (AM, AZ, BY, KG, KZ, RU, TJ, TM)
European Patent Office (EPO) (AL, AT, BE, BG, CH, CY, CZ, DE, DK, EE, ES, FI, FR, GB, GR, HR, HU, IE, IS, IT, LT, LU, LV, MC, MK, MT, NL, NO, PL, PT, RO, RS, SE, SI, SK, SM, TR)
African Intellectual Property Organization (BF, BJ, CF, CG, CI, CM, GA, GN, GQ, GW, KM, ML, MR, NE, SN, TD, TG)
Publication Language: Chinese (ZH)
Filing Language: Chinese (ZH)