16:00 CETの火曜日 19.11.2019のメンテナンス理由で数時間使用できません
国際・国内特許データベース検索
このアプリケーションの一部のコンテンツは現時点では利用できません。
このような状況が続く場合は、にお問い合わせくださいフィードバック & お問い合わせ
1. (WO2015136692) 電子イメージ文書編集システム
国際事務局に記録されている最新の書誌情報

国際公開番号: WO/2015/136692 国際出願番号: PCT/JP2014/056927
国際公開日: 17.09.2015 国際出願日: 14.03.2014
IPC:
G06F 17/28 (2006.01) ,G06K 9/72 (2006.01)
G 物理学
06
計算;計数
F
電気的デジタルデータ処理
17
特定の機能に特に適合したデジタル計算またはデータ処理の装置または方法
20
自然言語データの取扱い
28
自然言語の処理または翻訳
G 物理学
06
計算;計数
K
データの認識;データの表示;記録担体;記録担体の取扱い
9
印刷文字,手書き文字または幾何学図形の読取りまたは認識のための方法または装置,例.指紋のためのもの
62
電子的手段を用いる認識のための方法または装置
72
一連のパターン,例.単語,の仮認識された部分に基づき文脈処理を行うもの
出願人:
株式会社日立製作所 HITACHI, LTD. [JP/JP]; 東京都千代田区丸の内一丁目6番6号 6-6, Marunouchi 1-chome, Chiyoda-ku, Tokyo 1008280, JP
発明者:
間瀬 久雄 MASE, Hisao; JP
小林 義行 KOBAYASHI, Yoshiyuki; JP
新庄 広 SHINJO, Hiroshi; JP
嶺 竜治 MINE, Ryuji; JP
高橋 寿一 TAKAHASHI, Toshikazu; JP
代理人:
特許業務法人藤央特許事務所 TOU-OU PATENT FIRM; 東京都港区虎ノ門一丁目16番4号アーバン虎ノ門ビル Urban Toranomon Bldg., 16-4, Toranomon 1-chome, Minato-ku, Tokyo 1050001, JP
優先権情報:
発明の名称: (EN) DIGITAL IMAGE DOCUMENT EDITING SYSTEM
(FR) SYSTÈME D'ÉDITION DE DOCUMENT IMAGE NUMÉRIQUE
(JA) 電子イメージ文書編集システム
要約:
(EN) Provided is a digital image document editing system, which: accepts an input of a digital image document; recognizes, within the inputted digital image document, a text character string formed from one or more text characters of a plurality of categories of text characters; and, if the recognized text character string satisfies a text character string determination rule, determines that the recognized text character string is a text character string to be edited. The text character string determination rules include at least one determination rule among: a first determination rule wherein the recognized text character string is formed from a number of text characters equal to or greater than a first threshold (which is an integer greater than one); a second determination rule wherein the recognized text character string includes a partial text character string having a number of text characters belonging to a first group of categories, which are a portion of the abovementioned plurality of categories, equal to or greater than a second threshold (which is an integer greater than one); a third determination rule wherein the recognized text character string includes a text character that belongs to a second group of categories, which are a portion of the plurality of categories; and a fourth determination rule wherein the recognized text character string includes a content word.
(FR) La présente invention se rapporte à un système d'édition de document image numérique, qui : accepte une entrée d'un document image numérique ; reconnaît, dans le document d'image numérique d'entrée, une chaîne de caractères de texte formée à partir d'un ou plusieurs caractères de texte d'une pluralité de catégories de caractères de texte ; et si la chaîne de caractères de texte reconnue satisfait à une règle de détermination de chaîne de caractères de texte, détermine que la chaîne de caractères de texte reconnue est une chaîne de caractères de texte à éditer. Les règles de détermination de chaîne de caractères de texte comprennent au moins une règle de détermination parmi : une première règle de détermination dans laquelle la chaîne de caractères de texte reconnue est formée à partir d'un nombre de caractères de texte supérieur ou égal à un premier seuil (qui est un nombre entier supérieur à un) ; une deuxième règle de détermination dans laquelle la chaîne de caractères de texte reconnue comprend une chaîne de caractères de texte partielle comportant un nombre de caractères de texte appartenant à un premier groupe de catégories, qui sont une partie de ladite pluralité de catégories, supérieur ou égal à un deuxième seuil (qui est un nombre entier supérieur à un) ; une troisième règle de détermination dans laquelle la chaîne de caractères de texte reconnue comprend un caractère de texte qui appartient à un deuxième groupe de catégories, qui sont une partie de la pluralité de catégories ; et une quatrième règle de détermination dans laquelle la chaîne de caractères de texte reconnue comprend un mot de contenu.
(JA)  電子イメージ文書編集システムは、電子イメージ文書の入力を受け付け、入力された電子イメージ文書中の、複数種別の文字における1以上の文字からなる前記文字列を認識し、認識した文字列が文字列判定基準を満たす場合、認識した文字列が編集対象文字列であると判定する。文字列判定基準は、認識した文字列が、第1閾値(第1閾値は2以上の整数)以上の文字からなる第1判定基準と、認識した文字列が、複数種別の一部である第1種別群の文字における第2閾値(第2閾値は2以上の整数)以上の文字からなる部分文字列を含む第2判定基準と、認識した文字列が複数種別の一部である第2種別群における文字を含む第3判定基準と、認識した文字列が内容語を含む第4判定基準のうち、少なくとも1つの判定基準を含む。
front page image
指定国: AE, AG, AL, AM, AO, AT, AU, AZ, BA, BB, BG, BH, BN, BR, BW, BY, BZ, CA, CH, CL, CN, CO, CR, CU, CZ, DE, DK, DM, DO, DZ, EC, EE, EG, ES, FI, GB, GD, GE, GH, GM, GT, HN, HR, HU, ID, IL, IN, IR, IS, JP, KE, KG, KN, KP, KR, KZ, LA, LC, LK, LR, LS, LT, LU, LY, MA, MD, ME, MG, MK, MN, MW, MX, MY, MZ, NA, NG, NI, NO, NZ, OM, PA, PE, PG, PH, PL, PT, QA, RO, RS, RU, RW, SA, SC, SD, SE, SG, SK, SL, SM, ST, SV, SY, TH, TJ, TM, TN, TR, TT, TZ, UA, UG, US, UZ, VC, VN, ZA, ZM, ZW
アフリカ広域知的所有権機関(ARIPO) (BW, GH, GM, KE, LR, LS, MW, MZ, NA, RW, SD, SL, SZ, TZ, UG, ZM, ZW)
ユーラシア特許庁(EAPO) (AM, AZ, BY, KG, KZ, RU, TJ, TM)
欧州特許庁(EPO) (AL, AT, BE, BG, CH, CY, CZ, DE, DK, EE, ES, FI, FR, GB, GR, HR, HU, IE, IS, IT, LT, LU, LV, MC, MK, MT, NL, NO, PL, PT, RO, RS, SE, SI, SK, SM, TR)
アフリカ知的所有権機関(OAPI) (BF, BJ, CF, CG, CI, CM, GA, GN, GQ, GW, KM, ML, MR, NE, SN, TD, TG)
国際公開言語: 日本語 (JA)
国際出願言語: 日本語 (JA)
また、:
JPWO2015136692