Recherche dans les collections de brevets nationales et internationales
Certains contenus de cette application ne sont pas disponibles pour le moment.
Si cette situation persiste, veuillez nous contacter àObservations et contact
1. (WO2005064494) PROGRAMME D'EXECUTION DE TRAITEMENT DE CARACTERES ET SUPPORT D'ENREGISTREMENT
Note: Texte fondé sur des processus automatiques de reconnaissance optique de caractères. Seule la version PDF a une valeur juridique
明細書

文字処理方法、

文字処理実行プログラム及び記録媒体

技術分野

本発明は、コンピュータ等の情報処理装置による文字検索処理及ぴソート処理 に適用して好適な文字処理方法、その方法をコンピュータに実行させるためのプ ログラム及びそのプログラムを記録したコンピュータ読取可能な記録媒体に関す る。

背景技術

従来、コンピュータ等の情報処理装置における文字処理は、字形(グリフ: glyph) に付番されたコード番号に基づいて実行され、このコード番号としては、 JIS漢字コード .(情報交換用符号化漢字集合: JIS X 0208 : 1997) のような公的規 格により標準化された文字コード(符号化文字集合)が用いられる。

公的規格により標準化された文字コードでは、特に、人名及び地名等を正確に 記載するために必要な文字が欠けてしまう。このような文字として、 J I S漢字 コードに含まれる所謂常用漢字と同音同義であるが、字形が一般的ではなく異体 字関係にある漢字(以下、異体字と呼ぶ)は多数存在しており、標準化された文 字コードでは使用されないユーザー定義領域(空き領域)に、外字として追加さ れる。

このような多数の異体字の間の相違点の検出を容易にできると共に、複数の異

体字からの外字の選択時間を短縮できるようにすることによって、コンピュータ 等の文字処理効率を向上させることができる情報処理方法が開発されている(特 願 2003— 1 55787号参照)。

上述した公報に記載された情報処理方法により複数の異体字をインストールさ れたコンピュータにおいて、 -従来の表作成用ソフトウェア及ぴデータベース構築 用ソフトウェア等により、第 8 (a) 図に示すような会員名、この会員名の読み 仮名及ぴ会員番号を一覧表としたスプレツド 'シート P 1 1等のデータ区切りを 有する文字情報に対してソート処理を実行する場合、第 8 (b) 図に示すように、 ソート範囲 I Pを選択し、ソート方法を指定していた。

ソート方法として、例えば、ソート順位'(配列順位)を決定するための最優先 キーに 「音読み」を指定し、第 2キーに「会員番号」を指定した場合、第 9 (a) 図に示すように、音読みが「オタハシ」となる会員名を会員番号順にソー トした結果 L 1 1が表示される。このソート方法では、会員名の漢字表記に規則 性がなく、統一されない一覧表示 P 12となってしまう。

また例えば、最優先キーに「音読み」を指定し、第 2キーに「文字コード」を 指定した場合、第 9 (b) 図に示すように、音読みが「ォクハシ」となる会員名 を文字コードに基づきソートした結果 L 1 2が表示される。このソート方法にお いても、やはり会員名の漢字表記が不規則で統一されない一覧表示 P 1 3となつ てしまう。

一般に、文字コードに基づくソート処理においては、公的規格により標準化さ れた文字コードである J I S第 1水準漢字コード又は J I S第 2水準漢字コード が参照される。 J I S第 1水準漢字コードは、常用漢字に音読み順に文字コード を付与して構成した符号化漢字集合であり、 J I S第 2水準漢字コードは、常用 漢字に部首に応じて画数順に文字コードを付与して構成した符号化漢字集合であ る。

J I S規格に対しては、 5年に 1度の変更機会(見直し)があるが、 J I S第 1及び第 2水準漢字コードでの文字数の増加はほとんどない。このため、 J I S 第 1及び第 2水準漢字コードの空き領域に外字として追加された異体字(関連 字)は、ソート順位を決定するための規則性を保持していない。従って、ソート 処理のためのキーとして文字コードを指定した場合、第 9 ( b ) 図に示したよう に、異体字関係にある漢字を含む複数の会員名が、不規則にソートされて表示さ れることになるため、有意性の高い文字配列で並べ替えて表示することができな いという問題があった。

発明の開示

本発明は、この問題を解決し、文字コードに依存することなく決定された有意 性の高い配列順位で複数の文字を並べ替えることができる文字処理方法、その方 法をコンピュータに実行させるためのプログラム及びそのプログラムを記録した コンピュータ読取可能な記録媒体を提供することを目的とする。

上記問題を解決するため、本発明に係る第 1の文字処理方法は、任意の文字コ 一ドを付与されて符号化文字集合を構成する文字を処理する方法であって、複数 の文字が夫々備える属性を判別するための属性情報と文字コードとを対応させて 保存し、ここに属性情報が保存された符号化文字集合から複数の文字を選択する 文字コードの入力を待ち、この文字コードの入力により選択された複数の文字に 関して属性情報を読み込み、ここに読み込まれた属性情報に基づきこれら複数の 文字が夫々備える属性を判別し、この判別結果に従いこれら複数の文字に対して 配列順位を決定する。

本発明に係る第 2の文字処理方法は、任意の文字コードを付与されて符号化文 字集合を構成する文字を処理する方法であって、複数の文字が夫々備える属性を 判別するための属性情報と文字コードとを対応させて保存し、ここに属性情報が 保存された符号化文字集合から文字を選択する文字コードの入力を待ち、この文 字コードの入力により選択された文字に関して属性情報を読み込み、ここに読み 込まれた属性情報に基づきこの文字が備える属性を判別し、ここに判別された属 性と属性共通の文字を検索し、ここに検索された属性共通の文字に付与された文 字コードを出力することを特徴とする。

本発明に係る第 1の文字処理方法をコンピュータに実行させるためのプロダラ ムは、任意の文字コードを付与されて符号化文字集合を構成する文字を処理する ために、複数の文字が夫々備える属性を判別するための属性情報と文字コードと を予め対応させて保存したデータベースを備え、このデータベースに属性情報が 保存された符号化文字集合から複数の文字を選択する文字コードの入力を待ち、 この文字コードの入力により選択された複数の文字に関して属性情報をデータべ ースから読み込み、ここに読み込まれた属性情報に基づきこれら複数の文字が 夫々備える属性を判別し、この判別結果に従いこれら複数の文字に対して配列順 位を決定することを特徴とする。

本発明に係る第 2の文字処理方法をコンピュータに実行させるためのプログラ ムは、任意の文字コードを付与されて符号化文字集合を構成する文字を処理する ために、複数の文字が夫々備える属性を判別するための属性情報と文字コードと を予め対応させて保存したデータベースを備え、このデータベースに属性情報が 保存された符号化文字集合から文字を選択する文字コードの入力を待ち、この文 字コードの入力により選択された文字に関して属性情報をデータベースから読み 込み、ここに読み込まれた属性情報に基づきこの文字が備える属性を判別し、こ こに判別された属性と属性共通の文字をデータベースで検索し、検索された属性 共通の文字に付与された文字コードを出力することを特徴とする。

本発明に係る第 1の文字処理方法をコンピュータに実行させるためのプロダラ ムを記録したコンピュータ読取可能な記録媒体によれば、本発明に係る第 1の文 字処理方法をコンピュータに実行させるためのプログラムがコンピュータ読取可 能な記録媒体に記録される。従って、任意の文字コードを付与されて符号化文字 集合を構成する文字をコンピュータにより処理する場合に、文字コードに依存す ることなく属性情報に基づいて決定された配列順位で複数の文字を並べ替えるこ とができるので、符号ィヒ文字集合への新規文字追加に起因する配列順位の未必的 変更を回避することが可能となる。

図面の簡単な説明

第 1図は、本発明に係るプログラムが備えるデータベースの構成例を示す図で ある。

第 2図は、ソート前の文字配列例を示す図である。

第 3図は、本発明に係る第 1のプログラムによる属性情報に基づく文字配列例 を示す図である。

第 4図は、本発明に係る第 1のプログラムによる異体字情報に基づくソート例 を示す図である。

第 5図は、本発明に係る第 1の文字処理例を示すフローチャートである。

第 6図は、本発明に係る第 2のプログラムによる属性共通文字一覧の表示例を 示す図である。

-第 7図は、本発明に係る第 2の文字処理例を示すフローチャートである。

第 8 ( a ) 図は、従来のソート例を説明する図であって、データ区切りを有す る文字情報例を示す図である。

第 8 ( b ) 図は、従来のソート例を説明する図であって、ソート範囲選択例を 示す図である。

第 9 ( a ) 図は、従来のソート例を説明する図であって、会員番号によるソー ト例を示す図である。

第 9 ( b ) 図は、従来のソート例を説明する図であって、文字コードによるソ 一ト例を示す図である。

発明を実施するための最良の形態

以下、添付の図面を参照しながら、本発明に係る文字処理方法、その方法をコ ンピュータに実行させるためのプログラム及びそのプログラムを記録したコンビ ユータ読取可能な記録媒体の実施に最良の形態について説明する。

[ 1 ] 第 1の実施形態

この第丄の実施形態としての第 1の文字処理方法をコンピュータに実行させる ためのプログラムは、任意の文字コードを付与されて符号化文字集合を構成する 文字をコンピュータにより処理するために、複数の文字が夫々備える属性を判別 するための属性情報と文字コードとを予め対応させて保存したデータベースを備 え、このデータベースに保存された属性情報に基づきこれら複数の文字が夫々備 える属性を判別した結果に従いこれら複数の文字に対して配列順序を決定する。 これによつて、文字コードに依存することなく属性情報に基づき決定された配列 順位で複数の文字を並べ替えることができるようにしたものである。 .

本実施形態においては、この第 1の文字処理方法をコンピュータに実行させる ために、上述のプログラムをコンピュータ読取可能な記録媒体に予め記録する。 このコンピュータ読取可能な記録媒体は、ハードディスク (H D) のような磁気 記録媒体、コンパクトディスク(C D ) のような光記録媒体及ぴ半導体メモリの ような電子記録媒体等から構成され、例えば、コンピュータに上述のプログラム をインストールすることによって、このコンピュータに内蔵されたハードデイス クドライブ(H D D ) 等に、このプログラムを保存(格納)する。これによつて. このコンピュータに、本発明にかかる第 1の文字処理方法を実行させることがで きる。

第 1図は、本発明に係る第 1の文字処理方法をコンピュータに実行させるため のプログラムが備えるデータベース D Bの構成例を示す図である。このデータべ ース D Bは、任意の符号化文字集合を構成する複数の文字 Cに付与された文字コ 一ド C Dと、これら複数の文字が夫々備える属性を判別するための属性情報 Dと を予め対応させて保存したものであって、このデータベース D Bを参照するァプ リケーションに依存することなく、要求に応じて属性情報 Dを出力する。

ここで、属性情報 Dとは、例えば、漢字(文字)「蓮」 C 1が備える属性とし て、この漢字 C 1の部首 C 1 1を判別するための部首情報 D 1、この漢字 C 1の エレメント C 1 2, C 1 3を判別するためのエレメント情報 D 2、この漢字 C 1 の部首 C 1 1以外の部分、即ち、エレメント C 1 2, C 1 3の総画数を判別する ための部首内画数情報 D 3、この漢字 C 1と異体字関係にある漢字 C 2を判別す るための異体字情報 D 4、この漢字 C 1の総画数を判別するための総画数情報 D 5、この漢字 C 1の人名での使用実績を判別するための人名実績情報 D 6、この 漢字 C 1の地名での使用実績を判別するための地名実績情報 D 7及びこの漢字 C 1の地域別での使用実績を判別するための地域実績情報 D 8等から構成される。 . このようにデータベース DBは、属性情報 Dとして、この漢字 C 1の構成要素 (エレメント)を判別するための文字構成要素情報(エレメント情報) D2と、 異体字情報 D 4と、人名実績情報 D 6と、 ±也名実績情報 D 7と、地域実績情報 D 8とを、この漢字 C 1に予め付与された文字コード「4 F 7B」と対応させて保 存 (格納)する。エレメント情報 D 2は、単にエレメントを判別するだけでなく. エレメントの異体情報及ぴ関連情報を含む。

人名実績情報 D 6及び地名実績情報 D 7において、例えば、人名又は地名での 使用実績有りは「1」、使用実績無しは「0」を各文字の使用実績として保存す る。即ち、データベース DBは、漢字 C 1が人名字に使われている場合、この漢 字 C 1の文字コード「4 F 7 B」と人名実績情報「1」とを対応させて保存し、 この漢字 C 1が地名字に使われている場合、この漢字 C 1の文字コード「4 F 7 B」 と地名実績情報「1」とを対応させて保存するように構成する。もちろん、 この漢字 C 1が、人名字及ぴ地名字に使われていない場合は、この漢字 C 1の文 字コード「4 F 7B」と人名実績情報「0」及び地名実績情報「0」とを対応さ せて保存する。

また、地域実績情報 D 8においては、地域単位として都道府県を採用し、使用 実績が有った都道府県数を地域実績情報 D 8として保存する。漢字 C 1には、例 えば、人名字又は地名字として 47都道府県で戸籍使用実績がある場合、データ ベース DBは、この漢字 C 1の文字コード「4 F 7B」と地域実績情報「47」 とを対応させて保存する。

従って、かな漢字変換システム及び表作成用ソフトウェア等のアプリケーショ

ンが備えるソート処理エンジン等を介して、漠字「蓮」 C 1を選択する文字コー ド 「4 F 7B」の入力が有ったとき、この文字コード「4F 7B」に対応する属 性情報 Dをデータベース D Bからソート処理ェンジンに出力することができる。 よって、ソート処理エンジン等は、このデータベース DBから出力された属性情 報 Dを読み込み、この属性情報 Dに基づいて、漢字「蓮」 C 1が備える属性を判 別することができる。

ソート処理エンジン等は、具体的には、漢字「蓮」 C 1の備える属性として、. 部首 C 1 1力 S 「草冠」であり、エレメント C 1 2 , C 1 3力 S 「之繞」及び「車」 であり、部首内画数が「9」であり、文字コード「5G6A」を付与された漢字 C 2と異体字関係にあり、総画数が「1 2」であり、人名実績及び地名実績があ り、地域実績が「47」都道府県であることを、属性情報 Dから判別できる。 このように構成されたデータベース DBに、複数の異体字が存在する多数の漢 字 (文字)を予め保存し、これらの漢字を配列する方法として、最優先キーに部 首情報 D 1を指定し、第 2のキーに部首内画数情報 D 3を指定し、第 3のキーに 総画数情報 D 5を指定すると、例えば部首が「草冠」である複数の漢字は、第 2 図に示すように配列される。

この文字配列例において、漢字 E 1の異体字 E 2〜E 8、漢字 F 1の異体字 F 2、漢字 G 1の異体字 G 2及び漢字「若」の異体字 HI〜H 3は、隣接して配列 されないため、これらの漢字の間に異体字関係を見出すことは困難である。

一方、これらの漢字を配列する方法として、最優先キーに部首情報 D 1を指定 し、第 2のキーに部首内画数情報 D 3を指定し、第 3のキーに異体字情報 D 4の 指定を挿入し、第 4のキーに総画数情報 D 5を指定すると、部首が「草冠」であ る複数の漢字は、第 3図に示すようにソートされる。

この属性情報 Dに基づく文字配列例においては、異体字情報 D 4に基づき複数 の漢字の異体字関係が判別され、この判別結果に従って、これら複数の漢字に対 して配列順位が決定される。従って、漢字 E 1の異体字 E 2〜E 8、漢字 F 1の 異体字 F 2、漢字 G 1の異体字 G 2及ぴ漢字「若」の異体字 H I〜H 3が各々隣 接して配列されるため、これらの漢字の間に容易に異体字関係を見出すことがで さる。

この文字配列例では、配列順位(ソートオーダー)として、最優先キーに部首 情報 D 1を指定し、第 2のキーに部首内画数情報 D 3を指定し、第 3のキーに異 体字情報 D 4を指定し、第 4のキーに総画数情報 D 5を指定した例について説明 したが、ソートオーダーとして、例えば、最優先キーに部首情報 D 1を指定し、 第 2のキーにエレメント情報 D 2を指定し、第 3のキーに部首内画数情報 D 3を 指定し、第 4のキーに異体字情報 D 4を指定し、第 5のキーに総画数情報 D 5を 指定することによって、複数の漢字を夫々構成するエレメント間での異体関係を ソートオーダーに反映することができるので、より有意性の高い配列で多数の漢 字を異体字順(関連字順)に並べ替えることができる。これによつて、例えば、 多数の漢字の中から異体関係及び関連関係にある複数の漠字を抽出して新たに辞 書を作成する機能等を漢字データベースに付与することができるので、漢字デー タベースの管理等に極めて有効である。

このような属性情報 Dに基づく文字配列方法を、上述したデータ区切りを有す る文字情報 P 1 1に適用する場合、コンピュータに接続されたキーボード等の入 力装置によって、ソート方法として、最優先キーに「音読み」を指定し、第 2キ 一に異体字情報 D 4を指定すると、第 4図に示すように、音読みが「ォクハシ」 である会員名が、異体字関係にある漢字を含む会員名と夫々 P舞接する配列 Lのよ うに並べ替えられ、統一された会員名簿一覧 P 1を表示することができる。

従って、会員名の漢字表記に規則性を付与することができ、有意性の高い文字 並び順(ソートオーダー)を得ることができる。この文字配列方法は、名簿等の 並び替え及び漢字データベース管理等に便利で有益である。

次に、本発明に係る第 1の文字処理方法の実施形態として、このデータベース D Bを備えたプログラムによる文字処理例について、第 5図に示すフローチヤ一 トを参照して説明する。

この文字処理例では、任意の文字コードを付与されて符号化文字集合を構成す る文字を処理する場合に、複数の文字が夫々備える属性を判別するための属性情 報 Dと文字コード C Dとを予め対応させてデータベース D Bに保存し、このデー タベース D Bを備えたプログラムをコンピュータにインストールすることを前提 とする。このプログラムは、表作成用ソフトウェア等での文字処理をコンビユー タに実行させるためのかな漢字変換システム等の一部プログラムとして起動され、 第 5図に示すフローチャートに沿って、コンピュータに文字処理を実行させるも のとする。

この前提において、コンピュータにより表作成用ソフトウェア等を起動すると、 このコンピュータによる文字処理が開始され、第 5図に示すフローチャートのス テツプ S 1で、このコンピュータは、データベース D Bに属性情報 Dが保存され た符号化文字集合から複数の文字を選択する文字コード C Dの入力を待ち、会員 名簿一覧 P 1 1でソート範囲 I Pが選択されると、文字コード C D入力と判断し てステップ S 2に進む。

ステップ S 2で、選択されたソート範囲 I Pの文字コード C Dをワークフアイ ルへ転写して入力し、ステップ S 3でソート方法指定か否かを判断する。ここで、 ソート方法として、例えば、最優先キーに「音読み」が指定され、第 2のキーに 「異体字」が指定されると、ステップ S 4に進んでデータベース D Bを参照する。 次のステップ S 5で、ワークファイルに転写された文字コード C Dにより選択 された複数の文字に関して、指定されたキー「異体字」に対応する属性情報 D、 即ち、異体字情報 D 4をデータベース D Bから読み込む。

ステップ S 6で、読み込まれた異体字情報 D 4に基づいて、複数の文字が夫々 備える属性として異体字関係を判別し、この判別結果に従って、ステップ S 7で、 配列順位を決定する。そして、ステップ S 8で、この配列順位に応じて異体字を 隣接させるように文字を並べ替えて(ソートして)配列し、ステップ S 9で、こ の配列結果 L 1を反映させて会員名簿一覧 P 1を表示する。

このように、'本発明に係る第 1の文字処理方法によれば、文字コード C Dと配 列順位を決定する基準となるソートオーダー値とを独立した別情報として格納し たデータベース D Bを参照し、このデータベース D Bにより文字コード C Dの入 出力、更新及び検索等を実行し、属性情報 Dを集中管理するので、このデータべ ース D Bに新字を追加した場合であっても、ソートオーダーの規則性を保持する ことができる。 .

上述した文字処理例では、属性情報 Dとして異体字情報 D 4を使用したが、例 えば、属性情報 Dとして地域実績情報 D 8を指定することによって、都道府県別 等の地域別に必要となる文字(漢字)を容易に抽出することができる。このため、 このような地域別に必要となる漢字で構成された符号化文字集合を作成し、コー ドボイントを節約可能に文字数を限定したコンパクトな辞書として提供すること が可能となる。

このように本発明に係る第 1の文字処理方法、この第 1の文字処理方法をコン ピュータに実行させるためのプログラム及びこのプログラムを記録したコンビュ 一タ読取可能な記録媒体によれば、文字コードに依存することなく属性情報に基 づき決定された配列順位で複数の文字を並べ替えることができるので、符号化文 字集合への新規文字追加に起因する配列順位の未必的変更を回避することが可能 となる。

よって、この属性情報に基づく配列順位の規則性を維持することができるので、 この配列順位の有意性を損なうことなく複数の文字を並べ替えるように文字処理 することができるため、並べ替えられた複数の文字から所望の文字を迅速に抽出 して新たな符号化文字集合を容易に生成することができる。

なお、ソートオーダーとして指定する属性情報の種類及び指定順序は、特に限 定されるものではなく、複数の文字を並べ替える目的に応じて、任意に選択変更 することができるので、複数のソートオーダーのパターンを実現することができ る。 '

ソートオーダーとして、例えば、最優先キーに部首情報 D 1を指定し、第 2の キーにエレメント情報 D 2を指定し、第 3のキーに部首内画数情報 D 3を指定し、 第 4のキーに異体字情報 D 4を指定し、第 5のキーに総画数情報 D 5を指定する ことによって、文字構成要素間での異体関係(関連関係)を反映させて複数の漢 字を並べ替えることができるので、より高い有意性で異体字順(関連字順)に複 数の漢字を配列することができるため、所望の異体字をより効率良く抽出するこ ともできる。

[ 2 ] 第 2の実施形態

この第 2の実施形態としての第 2の文字処理方法をコンピュータに実行させる ためのプログラムは、任意の文字コードを付与されて符号化文字集合を構成する 文字をコンピュータにより処理するために、複数の文字が夫々備える属性を判別 するための属性情報と文字コードとを予め対応させて保存したデータベースを備 え、このデータベースに保存された属性情報に基づき判別された文字の属性と属 性共通の文字に付与された文字コードを出力する。これによつて、入力された文 字と属性共通の文字とを配列させることができるようにしたものである。

本実施形態においては、この第 2の文字処理方法をコンピュータに実行させる ために、上述のプログラムをコンピュータ読取可能な記録媒体に予め記録し、コ ンピュータにィンストールすることによって、このコンピュータに内蔵された H D D等に、このプログラムを保存する。これによつて、上述した第 1の実施形態 と同様に、本発明にかかる第 2の文字処理方法をコンピュータに実行させること ができる。

この第 2の実施形態としてのプログラムが備えるデータベースは、上述した第 1の実施形態としてのプログラムが備えるデータベース D Bと同様に構成するこ とができるので、このデータベース D Bについての詳細説明を省略する。

この第 2の実施形態としてのプログラムを文字処理用のかな漢字変換システム 等の一部プログラムとして起動し、例えば、漢字「蓮」 C 1の文字コード「4 F 7 B」 I かな漢字変換システム等のアプリケーションを介して入力された場合、 このプログラムにより漢字 C 1の異体字 C 2を属性共通の文字と判別し、この異 体字 C 2の文字コード「5 G 6 A」をデータベース D Bから出力することができ る。

従って、入力されだ漢字 C 1と属性共通で選択確率の高い異体字 C 2を、変換 候補文字として漢字 C 1と並べて優先的に表示することができるので、相違点が 僅かなために変換候補文字の選択が困難な複数の異体字の中から、所望の漢字を 容易に見出して漢字変換することができるようになる。

この第 2の文字処理方法をコンピュータに実行させるためのプログラムをコン ピュータにィンストールし、このコンピュータに接続されたキーボード等から文 字入力を実行し、例えば、変換確定前の漠字「辺」に対して再変換を要求すると、 かな漢字変換システムは、 H D Dに保存されたデータベース D Bを参照し、この 漢字 「辺」に予め付与された文字コード C Dと対応する属性情報 Dを読み込む。 ここで読み込まれた属性情報 Dに基づいて、この漢字「辺」が備える属性を判別 し、この属性と属' I"生共通の文字を検索して一覧表示する。

このようにデータベース D Bを参照して変換候補文字を表示するかな漢字変換 システムにおいて、異体字優先で変換候補文字を表示するように予め指定するこ とによって、属性情報 Dとして異体字情報 D 4を読み込むように設定し、例えば、 漢字 「辺」に対して再変換を要求すると、第 6図に示すような属性共通文字一覧 表示画面 P 2に表示が切り換えられる。

この属性共通文字一覧表示画面 P 2は、キーボードからの文字コード C Dの入 力により選択された代表文字「辺」 M lと、この代表文字「辺」 M lと属性共通 の文字 M 2と、この属性共通の文字 M 2の配列方法を選択するための釦 B 1〜B 5と、属性共通の文字 M 2に変換するための「変換」釦 B 6と、より画数の少な い属性共通の文字を表示するための釦 B 7と、より画数の多い属性共通の文字を 表示するための釦 B 8と、この属性共通の文字 M 2から所望の文字を選択するた めのチェックボックス B 9とを表示する。

この属性共通文字一覧表示画面 P 2において、属性共通の文字 M 2の配列方法 として、「エレメント」釦 B 1により'エレメント情報 D 2を選択すると、属性共 通の文字 M 2の配列が、これらの文字でのエレメントの異体情報(関連情報)を 反映させるようにソートされる。「異体字」釦 B 2により異体字情報 D 4を選択 すると、同様に、属性共通の文字 M 2の配列が、これらの文字での異体字関係を 反映させるようにソートされる。

また、この属性共通文字一覧表示画面 P 2において、「人名実績」釦 B 3によ り人名実績情報 D 6を選択すると、属性共通の文字 M 2の中から人名使用実績の ある文字が優先表示される。「地名実績」釦 B 4又は「地域実績」釦 B 5による 地名実績情報 D 7又は地域実績情報 D 8の選択によっても、同様に、属性共通の 文字 M 2の中から地名使用実績又は地域使用実績のある文字が優先表示されるよ うになる。

従って、文字入力時に、入力される文字の属性に応じて変換候補文字を呼び出 して一覧表示することができるので、入力文字に対して複数の類似する異体字が 存在する場合であっても、選択確率の高い変換候補文字を優先的に表示すること ができる。よって、文字入力効率を向上させることができる。

次に、本発明に係る第 2の文字処理方法の実施形態として、このプログラムに よる第 2の文字処理例について、第 7図に示すフローチャートを参照して説明す る。

この第 2の文字処理例では、任意の文字コードを付与されて符号化文字集合を 構成する文字を処理する場合に、複数の文字が夫々備える属性を判別するための 属性情報 Dと文字コード C Dとを予め対応させてデータベース D Bに保存し、こ のデータベース D Bを備えたプログラムをコンピュータにインストールすること を前提とする。このプログラムは、かな漢字変換システム等での文字処理をコン ピュータに実行させるために起動され、第 7図に示すフローチャートに沿ってコ ンピュータに文字処理を実行させるものとする。

この前提において、かな漢字変換システムを文字処理に使用するアプリケーシ ヨンを起動すると、コンピュータによる文字処理が開始され、第 7図に示すフロ 一チャートのステップ S 1 0で、このコンピュータは、データベース D Bに属性 情報 Dが保存された符号化文字集合から文字を選択する文字コード C Dの入力を 待ち、キーボードから文字コード C Dが入力されるとステップ S 1 1に進み、デ ータベース D Bを参照する。

次のステップ S 1 2で、この文字コード C Dの入力により選択された文字 「辺」 M lに関して属性情報 Dをデータベース D Bから読み込み、ここに読み込 まれた属性情報 Dに基づいて、ステップ S 1 3で、この文字「辺」 M lが備える 属性を判別する。

ここで判別された属性と属性共通の文字 M 2を、ステップ S 1 4で、データべ ース D Bで検索し、ステップ S 1 5で、検索された属性共通の文字 M 2に付与さ れた文字コード C Dをデータベース D Bから出力する。

かな漢字変換システムは、データベース D Bから出力された文字コード C Dに 基づいて、ステップ S 1 6で、この属性共通の文字 M 2を、属性共通文字一覧表 示画面 P 2のように表示する。このとき、第 5図に示したフローチャートをコー ルし、データベース D Bから出力された文字コードを入力してステップ S 1乃至 ステップ S 9の処理を実行することによって、属性共通の文字 M 2を規則正しく 配列表示して終了する。

このように本実施形態としての第 2の文字処理方法をコンピュータに実行ざせ るためのプログラムによれば、入力された文字と属性共通の文字とを配列させる ことができるので、有意性の高い配列順位で複数の文字を並べることができる。 従って、この文字と属性共通で選択確率の高い文字を選択候補文字として優先的 に表示することができるため、所望の文字を短時間で容易に見出すことができる ようになる。また、この符号化文字集合に新たな文字が追加された場合であって も、選択候補文字表示の規則性を維持しで文字を処理することができる。従って、 所望の文字を迅速に抽出して新たな符号化文字集合を容易に生成することができ る。

なお、本実施形態においては、かな漢字変換システムを使用した文字入力を例 示したが、本発明 ίこ係る第 2の文字処理方法は、画像を文字列(テキスト)に変 換可能な O C R (Optical' Character Reader:光学式文字読取装置)ソフトゥェ ァ等にも適用することが可能である。この O C Rにより、例えば、名刺等の人名 情報を読み取る場合に、 O C Rで判別できなかった文字に対する変換候補文字と して人名実績を有する異体字一覧を優先的に表示させること等が可能となるので、 O C Rでの文字列変換効率を向上させることが可能となる。

以上、本発明の実施形態及びその効果について詳細に説明してきたが、本発明 は、これら第 1及び第 2の実施形態の構成に限定されるものではなく、本願明細 書に添付した特許請求の範囲により規定された本発明の適用範囲から逸脱せずに、 上述した実施形態の構成が有する機能を達成可能な構成であれば、どのようなも のであっても適用することができる。

産業上の利用可能性

本発明は、コンピュータ等の情報処理装置による文字検索処理及びソート処理 に適用して極めて好適である。

本発明によれば、文字コードに依存することなく属性情報に基づき決定された 配列順位で複数の文字を並べ替えることができるので、符号化文字集合への新規

文字追加に起因する配列順位の未必的変更を回避することが可能となる。

従って、この属性情報に基づく配列順位の規則性を維持することができるので、 この配列順位の有意性を損なうことなく複数の文字を並べ替えるように文字処理 することができる。このため、並べ替えられた複数の文字から所望の文字を迅速 に抽出して新たな符号ィ匕文字集合を容易に生成することができる。

また、入力された文字と属性共通の文字とを配列させることができるので、有 意性の高い配列順位で複数の文字を並べることができる。従って、この文字と属 性共通で選択確率の高い文字を選択候補文字として優先的に表示することができ るので、所望の文字を短時間で容易に見出すことができるようになる。また、こ の符号化文字集合に新たな文字が追加された場合であっても、選択候補文字表示 の規則性を維持して文字を処理することができる。従って、所望の文字を迅速に 抽出して新たな符号化文字集合を容易に生成することができる。