WIPO logo
Mobile | Deutsch | Español | Français | 日本語 | 한국어 | Português | Русский | 中文 | العربية |
PATENTSCOPE

Search International and National Patent Collections
World Intellectual Property Organization
Search
 
Browse
 
Translate
 
Options
 
News
 
Login
 
Help
 
Machine translation
1. (WO2017054150) METHOD AND SYSTEM FOR IDEOGRAM CHARACTER ANALYSIS
Latest bibliographic data on file with the International Bureau   

Pub. No.: WO/2017/054150 International Application No.: PCT/CN2015/091163
Publication Date: 06.04.2017 International Filing Date: 30.09.2015
IPC:
G06F 17/30 (2006.01)
Applicants: CHEN, Chao[CN/CN]; CN (SC)
EMC CORPORATION[US/US]; 176 South Street Hopkinton, MA Massachusetts 01748, US
Inventors: CHEN, Chao; CN
HUANG, Kunwu; CN
DAI, Hongtao; CN
LIU, Jingjing; CN
Agent: SHANGHAI PATENT & TRADEMARK LAW OFFICE, LLC; 435 Guiping Road Shanghai 200233, CN
Priority Data:
Title (EN) METHOD AND SYSTEM FOR IDEOGRAM CHARACTER ANALYSIS
(FR) PROCÉDÉ ET SYSTÈME D'ANALYSE D'IDÉOGRAMMES
Abstract: front page image
(EN) Ideogram character analysis includes partitioning an original ideogram character into strokes, and mapping each stroke to a corresponding stroke identifier (id) to create an original stroke id sequence that includes stroke identifiers. A candidate ideogram character that has a candidate stroke id sequence within a threshold distance to the original stroke id sequence is selected. One or more embodiments may create new phrase by replacing the original ideogram character with the candidate ideogram character in a search phrase. One or more embodiments perform a search using the search phrase and the new phrase to obtain a result, and present the result. One or more embodiments may replace an original ideogram character in a character recognized document with the candidate ideogram character and store the character recognized document.
(FR) L'invention concerne une analyse d'idéogrammes consistant à partitionner un idéogramme d'origine en segments, et à mettre en correspondance chaque segment avec un identificateur (id) de segment correspondant pour créer une séquence d'id de segment d'origine qui comprend des identificateurs de segment. Un idéogramme candidat qui possède une séquence d'id de segment candidat sur une distance seuil par rapport à la séquence d'id de segment d'origine est sélectionné. Selon un ou plusieurs modes de réalisation, une nouvelle phrase peut être créée en remplaçant l'idéogramme d'origine par l'idéogramme candidat dans une phrase de recherche. Selon un ou plusieurs modes de réalisation, une recherche à l'aide de la phrase de recherche et de la nouvelle phrase est effectuée pour obtenir un résultat, et le résultat est présenté. Selon un ou plusieurs modes de réalisation, un idéogramme d'origine peut être remplacé dans un document ayant fait l'objet d'une reconnaissance de caractères par l'idéogramme candidat et le document ayant fait l'objet d'une reconnaissance de caractères peut être mémorisé.
Designated States: AE, AG, AL, AM, AO, AT, AU, AZ, BA, BB, BG, BH, BN, BR, BW, BY, BZ, CA, CH, CL, CN, CO, CR, CU, CZ, DE, DK, DM, DO, DZ, EC, EE, EG, ES, FI, GB, GD, GE, GH, GM, GT, HN, HR, HU, ID, IL, IN, IR, IS, JP, KE, KG, KN, KP, KR, KZ, LA, LC, LK, LR, LS, LU, LY, MA, MD, ME, MG, MK, MN, MW, MX, MY, MZ, NA, NG, NI, NO, NZ, OM, PA, PE, PG, PH, PL, PT, QA, RO, RS, RU, RW, SA, SC, SD, SE, SG, SK, SL, SM, ST, SV, SY, TH, TJ, TM, TN, TR, TT, TZ, UA, UG, US, UZ, VC, VN, ZA, ZM, ZW
African Regional Intellectual Property Organization (ARIPO) (BW, GH, GM, KE, LR, LS, MW, MZ, NA, RW, SD, SL, ST, SZ, TZ, UG, ZM, ZW)
Eurasian Patent Office (AM, AZ, BY, KG, KZ, RU, TJ, TM)
European Patent Office (EPO) (AL, AT, BE, BG, CH, CY, CZ, DE, DK, EE, ES, FI, FR, GB, GR, HR, HU, IE, IS, IT, LT, LU, LV, MC, MK, MT, NL, NO, PL, PT, RO, RS, SE, SI, SK, SM, TR)
African Intellectual Property Organization (BF, BJ, CF, CG, CI, CM, GA, GN, GQ, GW, KM, ML, MR, NE, SN, TD, TG)
Publication Language: English (EN)
Filing Language: English (EN)