国際・国内特許データベース検索
このアプリケーションの一部のコンテンツは現在ご利用になれません。
この状況が続く場合は、次のお問い合わせ先までご連絡ください。フィードバック & お問い合わせ
1. (WO2015145997) 属性変換装置、属性変換方法、学習装置、及び、記録媒体
Document

明 細 書

発明の名称 属性変換装置、属性変換方法、学習装置、及び、記録媒体

技術分野

0001  

背景技術

0002   0003   0004  

先行技術文献

特許文献

0005  

発明の概要

発明が解決しようとする課題

0006   0007   0008   0009   0010  

課題を解決するための手段

0011   0012   0013  

発明の効果

0014  

図面の簡単な説明

0015  

発明を実施するための形態

0016   0017   0018   0019   0020   0021   0022   0023   0024   0025   0026   0027   0028   0029   0030   0031   0032   0033   0034   0035   0036   0037   0038   0039   0040   0041   0042   0043   0044   0045   0046   0047   0048   0049   0050   0051   0052   0053   0054   0055   0056   0057   0058   0059   0060   0061   0062   0063   0064   0065   0066   0067   0068   0069   0070   0071   0072   0073   0074   0075   0076   0077   0078   0079   0080   0081   0082   0083   0084   0085   0086   0087   0088   0089   0090   0091   0092   0093   0094   0095   0096   0097   0098   0099   0100   0101   0102   0103   0104   0105   0106   0107   0108   0109   0110   0111   0112   0113   0114   0115   0116   0117   0118   0119   0120   0121   0122   0123   0124   0125   0126   0127   0128   0129   0130   0131   0132  

符号の説明

0133  

請求の範囲

1   2   3   4   5   6   7   8   9   10  

図面

1   2   3   4   5   6   7   8   9   10   11   12   13   14   15  

明 細 書

発明の名称 : 属性変換装置、属性変換方法、学習装置、及び、記録媒体

技術分野

[0001]
 本発明は、属性を変換する属性変換装置等に関する。

背景技術

[0002]
 学習アルゴリズムは、たとえば、特許文献1が開示する行動判定装置に見られるように、様々な装置において基本となる方法である。
[0003]
 特許文献1が開示する行動判定装置は、移動体に関する軌跡に対して誤差の少ない状態を割り当てることにより、該移動体を所有するユーザに関する行動を推定する。該行動判定装置は、軌跡に関する軌跡情報と、行動に関する行動情報とが関連付けされた情報に基づき、該軌跡情報と、該行動情報との間における関係を推定する。この場合に、該行動判定装置は、該軌跡情報を構成する属性のうち特定の属性を選択し、該特定の属性と、該行動情報との間における関係を推定(予測)する。
[0004]
 すなわち、学習アルゴリズムは、説明変数(たとえば、上述した軌跡情報)と、目的変数(たとえば、上述した行動情報)とが関連付けされた学習情報に基づき、該説明変数と、目的変数との間における関係を算出する。学習アルゴリズムは、算出した関係を予測情報に適用することにより、該予測情報に関する目的変数の値を推定する。学習アルゴリズムが予測情報に関する値を推定する場合、予測情報を表す説明変数は、学習情報における説明変数と同一である。

先行技術文献

特許文献

[0005]
特許文献1 : 特開2009-157770号公報

発明の概要

発明が解決しようとする課題

[0006]
 一般に、予測分析においては、分析者が用意する説明変数だけでは、分類精度が高い予測モデル(説明変数と目的変数の間の関係)を生成することができない。
[0007]
 分類精度が高い予測モデルを抽出するためには、用意された説明変数をそのまま用いるのでなく、与えられた説明変数を加工する属性生成処理を行いつつ、属性選択を行うことが有効である。
[0008]
 しかし、一般的に、これらの処理は、非常に計算量が多い処理になる。たとえば、与えられた属性を対数化する処理や、複数の属性を組み合わせる演算処理を行うと、膨大な数の属性を生成されるので、それらの属性を全て評価する必要がある。
[0009]
 たとえば、入力属性数をNとし、各属性に対して、2乗化、対数化という処理を加えると、(2×N)個の属性が生成される。さらに、これらと元の入力属性を合わせた属性集合から、任意の3つ組を取り出し、積算することにより新たな属性を生成すると、(3×N)の3乗個オーダーの属性生成が必要である。
[0010]
 そこで、本発明の主たる目的は、高速に良質な属性を提供可能な属性変換装置等を提供することである。

課題を解決するための手段

[0011]
 本発明の1つの見地として、属性変換装置は、
 数字または符号からなる要素を1または複数含む属性を表す第1属性を、1または複数受け付け、少なくとも1つの前記属性に基づき少なくとも1つの前記属性を算出する単項演算関数を1または複数種類、受け付けた前記第1属性に適用することにより、前記第1属性に対して前記単項演算関数を適用した結果を表す第2属性を1または複数生成する第1属性生成手段と、
 前記1または複数の第2属性及び前記1または複数の第1属性と、前記第1属性に含まれる1または複数の前記要素に関連付けされた数字または符号からなる要素を1または複数含む目的変数との相関を算出し、前記1または複数の第2属性と、前記1または複数の第1属性との中から、相関性が高い前記属性を表す第3属性を、1または複数選択する第1属性選択手段と、
 前記1または複数の第3属性を受け付け、1または複数の前記属性に基づき少なくとも1つの前記属性を算出する多項演算関数を、受け付けた前記第3属性に1または複数種類適用することにより、前記第3属性に対して前記多項演算関数を適用した結果を表す第4属性を1または複数生成する第2属性生成手段と、
 前記1または複数の前記第4属性及び前記1または複数の第3属性と、前記目的変数との相関を算出し、前記1または複数の前記第4属性と、前記1または複数の第3属性との中から、相関性が高い前記属性を表す第5属性を少なくとも1つ選択する第2属性選択手段と
 を備える。
[0012]
 また、本発明の他の見地として、属性変換方法は、
 情報処理装置が、
  数字または符号からなる要素を1または複数含む属性を表す第1属性を、1または複数受け付け、少なくとも1つの前記属性に基づき少なくとも1つの前記属性を算出する単項演算関数を1または複数種類、受け付けた前記第1属性に適用することにより、前記第1属性に対して前記単項演算関数を適用した結果を表す第2属性を1または複数生成し、
  前記1または複数の第2属性及び前記1または複数の第1属性と、前記第1属性に含まれる1または複数の前記要素に関連付けされた数字または符号を1または複数含む目的変数との相関を算出し、前記1または複数の第2属性と、前記1または複数の第1属性との中から、相関性が高い前記属性を表す第3属性を、1または複数選択し、
  前記1または複数の第3属性を受け付け、1または複数の前記属性に基づき少なくとも1つの前記属性を算出する多項演算関数を、受け付けた前記第3属性に1または複数種類適用することにより、前記第3属性に対して前記多項演算関数を適用した結果を表す第4属性を1または複数生成し、
  前記1または複数の前記第4属性及び前記1または複数の第3属性と、前記目的変数との相関を算出し、前記1または複数の前記第4属性と、前記1または複数の第3属性との中から、相関性が高い前記属性を表す第5属性を少なくとも1つ選択する。
[0013]
 さらに、同目的は、係る属性変換プログラム、及び、そのプログラムを記録するコンピュータ読み取り可能な記録媒体によっても実現される。

発明の効果

[0014]
 本発明に係る属性変換装置等によれば、高速に良質な属性を提供することができる。

図面の簡単な説明

[0015]
[図1] 本発明の第1の実施形態に係る属性変換装置が有する構成を示すブロック図である。
[図2] 第1の実施形態に係る属性変換装置における処理の流れを示すフローチャートである。
[図3] 学習情報の一例を概念的に表す図である。
[図4] 第2属性の一例を概念的に表す図である。
[図5] 目的変数の値の一例を概念的に表す図である。
[図6] 目的変数と、第1属性及び第2属性との相関係数の一例を表す図である。
[図7] 第4属性の一例を概念的に表す図である。
[図8] 目的変数と、第4属性との相関係数の一例を表す図である。
[図9] 第1の実施形態に係る属性変換装置が有する構成の一例を表すブロック図である。
[図10] 第1の実施形態に係る学習装置が有する構成を表すブロック図である。
[図11] 一般的な属性変換装置が処理する過程において算出する値の一例を表す図である。
[図12] 一般的な属性変換装置が処理する過程において算出する値の一例を表す図である。
[図13] 本発明の第2の実施形態に係る属性変換装置が有する構成を示すブロック図である。
[図14] 本発明の第3の実施形態に係る属性変換装置が有する構成を示すブロック図である。
[図15] 本発明の各実施形態に係る属性変換装置を実現可能な計算処理装置のハードウェア構成を、概略的に示すブロック図である。

発明を実施するための形態

[0016]
 ここで、本発明を実施する実施形態を説明するに前に、本発明に関する理解を助ける用語等について説明する。
[0017]
 学習アルゴリズムにおいて、学習情報に含まれる説明変数が多いほど、算出される関係は、該学習情報に適合する一方で、予測する対象に関する情報を表す予測情報に適合しなくなる。学習アルゴリズムにおける上述した問題は、過学習問題として知られている。この結果、たとえば、特許文献1に開示される行動判定装置において、過学習問題が生じる場合に、予測精度は低下する。
[0018]
 情報量規準に従えば、説明変数を適量にすることにより、学習アルゴリズムにおける過学習問題を軽減することができる。学習アルゴリズムにおいて、過学習問題を軽減することにより、予測情報に関する予測精度は向上する。
[0019]
 説明の便宜上、属性は、数字または符号等からなる要素を、複数個含むとする。
[0020]
 属性の中から、適量の属性を選択する手段として、属性選択手段がある。属性選択手段は、たとえば、各属性に対するスコア関数に基づき、適量の属性を選び出す。このスコア関数としては、目的変数に対する相関、情報利得、カイ二乗値、ヒルベルトシュミット独立判定基準等、様々な方法が知られている。
[0021]
 また、高い予測精度を達成する手法として、与えられた属性を、適切な属性に変換する属性生成(属性変換)手段がある。
[0022]
 属性生成手段の例としては、対数化(log(X))、2次化(X×X)、2値化(Xの値に基づいて0、1の値に変換する)、積(X ×X )、商(X ÷X )等の関数がある。尚、Xは、1つの属性を表す。また、X 及びX は、属性の集合を表す属性セットに含まれる1つの属性を表す。ただし、属性セットに含まれる属性の個数をNとする場合に、1≦i≦N、1≦j≦Nである。尚、本願において、「log」は、対数関数を表す。尚、対数関数の底は、たとえば、ネイピア数である。しかし、対数関数の底は、ネイピア数に限定されない。
[0023]
 次に、本発明が解決する課題をより詳細に説明する。まず、理解を容易にするため、本発明の関連技術の概要を説明する。
[0024]
 本出願人は、本願の出願に先立って、米国特許出願(仮出願)61883660号(2013年9月27日出願)と、この米国特許出願を優先権主張の基礎とする国際出願PCT/JP2014/004520とを出願している。この特許出願に記載された発明について簡単に説明する。
[0025]
 この特許出願に開示された情報処理装置は、複数の関数を合成することにより新たな関数を作成し、作成した新たな関数を属性に適用することにより、新たな属性を作成する。次に、該情報処理装置は、作成した新たな属性が所定の条件を満たすか否かを判定する。たとえば、該情報処理装置は、N(ただし、N≧1)種類の関数を2回合成することにより、(N×N)種類の関数を生成する。したがって、該情報処理装置は、M(ただし、M≧1)個の属性が入力される場合に、(M×N×N)個の属性を生成する。すなわち、該情報処理装置は、多くの属性を生成することができるので、該属性に基づいて学習処理が実行される際に、場合によっては上述した過学習問題を生じる虞がある。
[0026]
 更に、本出願人は、本願の出願に先立って、米国特許出願(仮出願)61883672号(2013年9月27日出願)と、この米国特許出願を優先権主張の基礎とする国際出願PCT/JP2014/004706とを出願している。この特許出願に記載された発明について簡単に説明する。
[0027]
 この特許出願に開示された情報処理装置は、複数の値を被演算子とする関数に関して、複数の属性の中から被演算子となる属性の組み合わせを選択し、選択した属性の組み合わせに対して該関数を適用することにより、新たな属性を作成する。次に、該情報処理装置は、作成した新たな属性が所定の条件を満たすか否かを判定する。たとえば、該情報処理装置は、2種類の値を被演算子とする関数をM(ただし、M≧1)種類の属性に適用することにより、(M×M)個の属性を生成する。したがって、2種類の値を被演算子とする関数がN(ただし、N≧1)種類ある場合に、該情報処理装置は、(N×M×M)個の属性を生成する。すなわち、該情報処理装置においても、上記本願出願人による出願と同様に、多くの属性を生成することができるので、該属性に基づいて学習処理が実行される際に、場合によっては上述した過学習問題を生じる虞がある。
[0028]
 従って、これらの過学習問題を解決するためには、属性選択を実行する必要がある。しかし、属性が増えるにつれて、属性選択を実行する計算負荷が大きいという課題がある。
[0029]
 以降、このような課題を解決可能な、本発明の実施形態について図面を参照しながら詳細に説明する。
[0030]
 <第1の実施形態>
 本発明の第1の実施形態に係る属性変換装置105が有する構成と、属性変換装置105が行う処理とについて、図1と図2とを参照しながら詳細に説明する。図1は、本発明の第1の実施形態に係る属性変換装置105が有する構成を示すブロック図である。図2は、第1の実施形態に係る属性変換装置105における処理の流れを示すフローチャートである。
[0031]
 第1の実施形態に係る属性変換装置105は、第1属性生成部101と、第1属性選択部102と、第2属性生成部103と、第2属性選択部104とを有する。
[0032]
 まず、第1属性生成部101は、第1属性501を受け取るのに応じて、少なくとも1つ以上の属性に基づいて1つ以上の属性を算出する演算処理を、第1属性501に適用することにより、第2属性502を算出する(ステップS101)。たとえば、演算処理は、1つの属性に基づいて1つの属性を算出する単項演算関数(単項関数)であってもよい。単項関数の具体例は、後述の第2の実施形態に示す。
[0033]
 尚、説明の便宜上、第1属性生成部101において、適用される演算処理を第1演算処理と表す。
[0034]
 たとえば、第1属性501は、図3に例示する学習情報に含まれる属性(X n、ただし、nは、1から4までの整数である)である。図3は、学習情報の一例を概念的に表す図である。属性変換装置105が受信する情報は、上述した予測情報であってもよい。すなわち、第1属性501は、たとえば、属性X1乃至属性X4である。
[0035]
 図3に例示される学習情報には、属性(X )(ただし、nは、正の整数を表す)と情報(D )とが関連付けされている。図3を参照すると、学習情報は、情報D1乃至情報D8を含む。たとえば、情報D1は、1.1、3、2.7、及び、30.2という4つの数値(要素)を用いて表される。また、情報D2は、1.2、2.1、4.5、及び、3.1という4つの数値を用いて表される。また、属性X1を用いることにより、情報D1は1.1と表され、情報D3は2.9と表される。同様に、属性X3を用いることにより、情報D2は4.5と表され、情報D5は、2.0と表される。
[0036]
 図3に示す例において、属性X1は、たとえば、情報D1乃至情報D8に関して、1.1、1.2、2.9、3.2、4.8、1.5、1、0.8という数値列を表す。また、属性X2は、3、2.1、2.2、1、1、2.2、2、1という数値列を表す。すなわち、この例において、属性X1は、情報D1乃至情報D8に関して、1.1、1.2、2.9、3.2、4.8、1.5、1、0.8という8つの要素からなる。また、この例において、属性X2は、情報D1乃至情報D8に関して、3、2.1、2.2、1、1、2.2、2、1という8つの要素からなる。
[0037]
 また、図3を参照しながら、気温に基づいて、特定の日の売り上げを予測する例を用いて説明する。この場合、情報D1乃至情報D8は、それぞれ、特定の日を表す情報(たとえば、日付)である。この場合、情報D1は、たとえば、ある1日の特徴を表す情報である。また、属性X1は、たとえば、該特定の日の1か月前の気温であり、属性X2は、該特定の日の1週間前の気温を表す。この場合、該特定の日の1か月前の気温を参照することにより、属性X1に関して、各特定の日を表す値を決めることができる。同様に、各特定の日に関して、該特定の日の1週間前の気温を参照することにより、属性X2に関して、各特定の日を表す値を決めることができる。たとえば、属性X3及び属性X4も、それぞれ、特定の日の3日前の気温、特定の日の1日前の気温等を表す。
[0038]
 上述した例において、たとえば、情報D1乃至情報D8が、それぞれ、特定の日における売り上げと関連付けされる場合に、該特定の日以前の気温に基づいて、特定の日の売り上げを予測することができる。
[0039]
 尚、学習情報は、情報D1乃至情報D8を含むとしたが、さらに、多くの情報を含んでもよい。また、情報D1乃至情報D8は、それぞれ、属性X1乃至属性X4を用いて表されるとしたが、さらに多くの属性を用いて表してもよい。また、図3に示された例において、情報D1乃至情報D8は、属性X1乃至属性X4に従い数値を用いて表されたが、符号、記号、文字列等であってもよい。
[0040]
 たとえば、第1属性生成部101は、上述した属性X1乃至属性X4に対して、sin(属性X1)、属性2×log(属性X3)等、所定の関数を適用することにより、新たな属性に変換する(ステップS101)。尚、sinは、三角関数の正弦を表す。たとえば、所定の関数は、主成分分析において寄与率が高い成分を選択する手法のように、N(ただし、Nは正の整数である)個の属性を、M(ただし、Mは、1≦M≦Nを満たす整数である)個の異なる属性に変換する関数であってもよい。所定の関数は、上述した例に限定されない。
[0041]
 図4を参照しながら、第1属性生成部101が算出する第2属性502について説明する。図4は、第2属性502の一例を概念的に表す図である。図4に示す例において、第1属性生成部101は、属性X1乃至属性X4に、log関数(ただし、logは、対数関数を表す)を適用することにより、第2属性502を算出する。すなわち、第1属性生成部101は、属性X1に関して、属性log(X1)を第2属性502として算出する。同様に、第1属性生成部101は、属性X2に関して、属性log(X2)を第2属性502として算出する。以降、同様である。
[0042]
 次に、第1属性選択部102は、属性選択手順に従い、第1属性501、及び、第1属性生成部101が算出する第2属性502から、第3属性503を選択する(ステップS102)。尚、説明の便宜上、第1属性選択部102における属性選択手順を第1属性選択手順と表す。
[0043]
 たとえば、属性選択手順が、属性と目的変数との相関性(関連性)が高い属性を選択する手段である場合に、第1属性選択部102は、属性と目的変数との相関性を算出することにより、第3属性503を選択する。
[0044]
 相関性は、たとえば、ピアソン相関係数、コサイン類似度、ヒルベルトシュミット独立性判定基準(Hilbert_Schmidt_Independence_Criterion、HSIC)等に基づき算出することができる。また、相関性は、Maximal_Information_Coefficient(MIC)等に基づき算出してもよい。
[0045]
 属性選択手順は、上述した例に限定されず、たとえば、複数個(複数)の属性間における相関性と、属性と目的変数との相関性とに基づいて、特定の属性を選択する手法であってもよい。または、属性選択手順は、複数の属性間における相関性に基づいて、特定の属性を選択する手法であってもよい。この場合に、属性選択手順は、たとえば、複数の属性間における相関性が低い属性を選ぶ。属性選択手順は、既に様々な方法が知られているので、ここでは、説明を省略する。
[0046]
 相関性を算出する方法は、上述した例以外にも、様々な方法が既に知られている。このため、本実施形態においては、相関性を算出する方法に関する詳細な説明を省略する。
[0047]
 目的変数が、図5に示す値である場合の例を参照しながら、第1属性選択部102における処理について説明する。図5は、目的変数の値の一例を概念的に表す図である。
[0048]
 図5を参照すると、目的変数Yは、上述した情報D1乃至情報D8に、それぞれ、関連付けされている。これは、情報D1に関する目的変数Yの値が3であり、情報D2に関する目的変数Yの値が4であること等を表す。
[0049]
 たとえば、目的変数Yの値は、特定の日における売り上げを表す。すなわち、この例において、情報D1は、ある特定の日における売り上げと、特定の日以前の気温とが関連付けされた情報である。また、情報D2は、該特定の日とは異なる第2特定日と、第2特定日以前の気温とが関連付された情報である。学習情報は、たとえば、情報D1乃至情報D8が表す特定の日に関して、図3に示す例、及び、図5に示す例が関連付けされた情報である。すなわち、目的変数は、属性に含まれる個々の要素に関連付けされた数字または符号等からなる要素を複数含む。
[0050]
 たとえば、第1属性選択部102は、目的変数Yと、属性X1乃至属性X4、及び、属性log(X1)乃至属性log(X4)との相関係数(図6)を算出することにより、属性と目的変数との相関性を算出する。図6は、目的変数と、第1属性501及び第2属性502との相関係数の一例を表す図である。たとえば、属性X1と目的変数との相関係数は、-0.08393である。また、属性log(X2)と目的変数との相関係数は、0.528142である。相関係数の絶対値が大きな値であるほど、相関性は高い。逆に、相関係数の絶対値が0に近いほど、相関性は低い。
[0051]
 次に、第1属性選択部102は、目的変数Yに相関性が高い属性を選択する。図6を参照すると、属性X2、属性X3、属性log(X2)、属性log(X3)は、第1属性501及び第2属性502のうち、目的変数Yに高い相関性を有する属性である。この場合、相関性の高低は、相関性を相互に比較することにより判定しても、または、ある特定の値と相関性とを比較することにより判定してもよい。この場合、第1属性選択部102は、たとえば、第3属性503として、属性X2、属性X3、属性log(X2)、属性log(X3)を選択する。
[0052]
 尚、第3属性503の個数は、第1属性501及び第2属性502の合計よりも小さな値であればよい。このため、第3属性503の個数は、上述した例に限定されない。
[0053]
 また、上述した例において、属性選択手順は、属性と目的変数との相関性が高い属性を選択する手段であるとしたが、複数の属性間における相関性を表す指標を、さらに、組み込んだ手段であってもよい。この場合、属性選択手順は、目的変数との相関性が高い属性であり、かつ、属性間の相関性が低い属性を第3属性503として選択する手順である。また、相関性を表す指標としては、相関係数や、情報利得等の指標が既に知られている。このため、本実施形態においては、該指標及び属性選択手順に関する詳細な説明を省略する。
[0054]
 次に、第2属性生成部103は、第1属性選択部102が選択する第3属性503に少なくとも1つ以上の属性に基づいて1つ以上の属性を算出する演算処理を適用することにより、第4属性504を算出する(ステップS103)。たとえば、第2属性生成部103は、複数の属性に基づき少なくとも1つの属性を算出する多項演算関数(多項関数)を、第3属性503に適用することにより、第4属性504を算出する。尚、多項関数の例は、第2の実施形態に示される。
[0055]
 説明の便宜上、第2属性生成部103において、適用される演算処理を第2演算処理と表す。
[0056]
 尚、第2属性生成部103は、第1属性501及び第3属性503に基づき、第4属性504を算出してもよい。この場合、第1属性501が受信する属性であるので、第2属性生成部103は、ユーザが入力する属性に基づき、第4属性504を算出する。ユーザが入力する属性が、あらかじめ、良質な属性であることがわかっている場合に、第2属性生成部103は、該属性に基づき、より良質な属性を算出する可能性が高くなる。
[0057]
 図7に示す例を参照しながら、第2属性生成部103に関する処理について説明する。図7は、第4属性504の一例を概念的に表す図である。
[0058]
 図7に示す例において、第2属性生成部103は、2つの第3属性503に関して、要素ごとの積を算出することにより、第4属性504を算出する。この場合、第4属性504は、属性Z1乃至属性Z6である。たとえば、第2属性生成部103は、要素ごとに、属性X2と属性X3との積を算出することにより、属性Z1を算出する。同様に、第2属性生成部103は、要素ごとに、属性X3と属性log(X2)との積を算出することにより、属性Z4を算出する。
[0059]
 尚、図7に示す例においては、要素ごとに、2つの第3属性503の積を算出することにより、第4属性504を算出したが、必ずしも、第4属性504を算出する基となる属性数は、2つである必要はない。第2属性生成部103は、積を用いて第4属性504を算出したが、積である必要はなく、和、差、商等の演算であってもよいし、主成分分析等の演算であってもよい。第4属性504を算出する基となる属性数は3以上である場合に、該属性間における演算は、1種類の演算である必要はなく、複数種類の演算であってもよい。
[0060]
 次に、第2属性選択部104は、属性選択手順に従い、第1属性501乃至第4属性504から、第5属性505を選択する(ステップS104)。尚、説明の便宜上、第2属性選択部104における属性選択手順を第2属性選択手順と表す。
[0061]
 尚、第2属性選択部104における属性選択手順は、第1属性選択部102における属性選択手順と同じ手順であってもよいし、異なる手順であってもよい。
[0062]
 たとえば、属性選択手順が、属性と目的変数との相関性が大きな属性を選択する手段である場合に、第2属性選択部104は、属性と目的変数との相関性を算出することにより、第5属性505を選択する。
[0063]
 たとえば、第2属性選択部104は、目的変数Yと、属性Z1乃至属性Z6との相関係数(図8)を算出することにより、相関性を算出する。図8は、目的変数と、第4属性504(この例では、属性Z1乃至属性Z6)との相関係数の一例を表す図である。
[0064]
 たとえば、図8を参照すると、属性Z1と目的変数との相関係数は、0.652916である。また、属性Z3と目的変数との相関係数は、0.958157である。相関係数の絶対値が大きな値であるほど、相関性は高い。逆に、相関係数の絶対値が0に近いほど、相関性は低い。
[0065]
 次に、第2属性選択部104は、目的変数Yに相関性が高い属性を選択する。図8を参照すると、属性Z3及び属性Z4は、第1属性501乃至第4属性504のうち、目的変数Yに高い相関性を有する属性である。この場合、第2属性選択部104は、第5属性505として、属性Z3及び属性Z4を選択する。
[0066]
 尚、第5属性505の個数は、第1属性501乃至第4属性504の合計よりも小さな値であればよい。このため、第5属性505の個数は、上述した例に限定されない。
[0067]
 また、上述した例において、属性選択手順は、属性と目的変数との相関性が高い属性を選択する手段であるとしたが、複数の属性間における相関性を表す指標を、さらに、組み込んだ手段であってもよい。この場合、属性選択手順は、目的変数との相関性が高い属性であり、かつ、属性間の相関性が低い属性を第5属性505として選択する手順である。また、相関性を表す指標としては、相関係数や、情報利得等の指標が既に知られている。このため、本実施形態においては、該指標及び属性選択手順に関する詳細な説明を省略する。
[0068]
 また、図9に示すように、属性変換装置113は、さらに、第3属性生成部111と、第3属性選択部112とを有してもよい。図9は、第1の実施形態に係る属性変換装置113が有する構成を表すブロック図である。この場合、第1属性生成部101と第2属性生成部103と同様に、第3属性生成部111は、第5属性505に基づき、第6属性を算出する。次に、第3属性選択部112は、属性選択手順に従い、第1属性501乃至第6属性から第7属性を選択する。
[0069]
 さらに、属性変換装置105は、属性生成部が属性を生成し、生成した属性等の属性から属性選択部が選択する態様を有してもよい。この場合、属性変換装置105は、属性を生成する処理と、属性を選択する処理とを繰り返し実施する。
[0070]
 たとえば、図10に示す学習装置122が、本発明の各実施形態に係る属性変換装置(たとえば、属性変換装置105)を有してもよい。図10は、第1の実施形態に係る学習装置122が有する構成を表すブロック図である。
[0071]
 学習装置122は、属性変換装置105と、学習部121とを有する。
[0072]
 属性変換装置105は、上述した処理に従い、第1属性501に基づき第5属性505を作成する。次に、学習部121は、第5属性505を含む属性を説明変数とする学習情報に基づき、説明変数と目的変数との間における関係を算出する。または、学習部121は、第5属性505を含む属性を説明変数とする予測情報に該関係を適用することにより、予測情報に関する値を推定する。
[0073]
 次に、本実施形態に係る属性変換装置105に関する効果について説明する。
[0074]
 本実施形態に係る属性変換装置105によれば、高速に良質な属性を提供することができる。この理由は、属性変換装置105が、一般的な属性変換装置に比べ、属性の質を保ちつつ演算する回数を減らすからである。
[0075]
 この理由について、図11及び図12を参照しながら詳細に説明する。図11及び図12は、一般的な属性変換装置が処理する過程において算出する値の一例を表す図である。本実施形態に係る属性変換装置105との比較を容易にするために、図11及び図12は、一般的な属性変換装置が、図3に例示する属性を受信する場合において算出する値を例示する。
[0076]
 一般的な属性変換装置は、特許文献1に例示されるように、1つの属性生成部と、1つの属性選択部とを有する。属性生成部は、受信した属性に基づき、新たな属性を算出する。属性選択部は、新たな属性から、一部の属性を選択する。
[0077]
 たとえば、一般的な属性変換装置は、受信した属性にある関数を適用することにより、新たな属性を算出する。図11及び図12に示す例において、属性変換装置は、受信した属性を構成する個々の値にlogを適用することにより、該logが適用された属性を算出する。次に、該属性変換装置は、受信した属性と、該logが適用された属性との積を算出することにより、新たな属性(すなわち、図11及び図12における属性1及び属性2に関して、要素ごとに積を算出した結果)を算出する。
[0078]
 次に、一般的な属性変換装置における属性選択部は、目的変数(図5)と、新たな属性との相関性を算出する。たとえば、相関性が相関係数である場合、属性選択部は、図11及び図12において、関数を示す列の各欄に記載された値を算出する。
[0079]
 すなわち、この例において、一般的な属性変換装置において、属性選択部は、36(=4(受信した属性)+4(logが適用された属性)+8×7÷2(2つの属性の積である属性))個の属性を入力とする。
[0080]
 一方、本実施形態に係る属性変換装置105は、属性を生成する処理と、生成した属性等から属性を選択する処理とを、複数回、実施する。第1属性選択部102は、8(=4(受信した属性)+4(logが適用された属性))個の属性を入力とする。第2属性選択部104は、16(=4(受信した属性)+4(logが適用された属性)+6(第2属性生成部103が算出する属性))個の属性を入力とする。
[0081]
 上述したように、一般的な属性選択手段は、入力される属性数に応じて急激に計算量が増大する。この場合において、一般的な属性選択手段における計算量を少なく見積もり、当該属性選択手段が、入力される属性数に対して線形オーダーで計算可能なアルゴリズムであると仮定する。この場合であっても、一般的な属性変換装置においては、36個の属性を処理する必要があるのに対し、本実施形態に係る属性変換装置105は、24個(=8個+16個)の属性を処理する。したがって、処理する属性数が大きく減少するので、本実施形態に係る属性変換装置105によれば、係る一般的な属性変換装置と比較して、高速に属性を提供することができる。
[0082]
 次に、本実施形態に係る属性変換装置105が属性の質を保つことについて説明する。
[0083]
 図8を参照すると、最も相関していることを表す相関係数は、0.958157であり、本実施形態に係る属性変換装置105が算出する属性Z3と、目的変数との間における相関係数である。また、次に相関していることを表す相関係数は、0.694406であり、本実施形態に係る属性変換装置105が算出する属性Z4と、目的変数との間における相関係数である。一方、図11及び図12を参照すると、最も相関していることを表す相関係数は、0.958157であり、次に相関していることを表す相関係数は、0.694406である。したがって、たとえば、相関係数を尺度として属性の質を評価する場合に、一般的な属性変換装置が算出する属性の質と、本実施形態に係る属性変換装置105が算出する属性の質とは同程度であることがわかる。また、属性の質を評価する尺度として、上述したような相関性(HSIC等)を用いたとしても同様である。
[0084]
 属性変換装置105は、一般的な属性変換装置に比べて、少ない個数の属性のみを処理する。それにも関わらず、属性変換装置105が算出する属性と、一般的な属性変換装置が算出する属性とに関して比較すると、属性と目的変数との相関係数が等しいことがわかる。
[0085]
 また、目的変数との相関性が高い属性は、該属性を構成する一部の属性であっても、目的変数との相関性が高い場合が多い。逆に、該一部の属性と目的変数との相関性が低い場合には、該一部の属性を組み合わせることにより属性を作成したとしても、該属性と目的変数との相関性は低い場合が多い。本実施形態に係る属性変換装置105は、目的変数との相関性が高い属性を段階的に作成するので、目的変数との相関性が低い属性を作成する可能性は低い。
[0086]
 さらに、属性選択手段が相関性に基づく手段である場合には、目的変数に高い相関性を有する属性ほど、良質な属性である。したがって、本実施形態に係る属性変換装置105によれば、属性の質を保つことができる。
[0087]
 また、属性変換装置105が、属性を生成する処理と、属性を選択する処理とを繰り返すことにより、さらに、属性選択部が処理する属性数は低減する。このため、属性変換装置105が3つ以上の属性生成部と、3つ以上の属性選択部とを有する態様であっても、本実施形態に係る属性変換装置105によれば、さらに、高速に良質な属性を提供することができる。
[0088]
 本実施形態に係る属性変換装置105を有する学習装置は、属性変換装置105が提供する良質な属性に基づき推定する。したがって、本実施形態に係る学習装置122によれば、高い予測精度を達成することできる。
[0089]
 <第2の実施形態>
 次に、上述した第1の実施形態を基本とする本発明の第2の実施形態について説明する。
[0090]
 以下の説明においては、本実施形態に係る特徴的な部分を中心に説明すると共に、上述した第1の実施形態と同様な構成については、同一の参照番号を付すことにより、重複する詳細な説明を省略する。
[0091]
 図13を参照しながら、第2の実施形態に係る属性変換装置202が有する構成と、属性変換装置202が行う処理とについて説明する。図13は、本発明の第2の実施形態に係る属性変換装置202が有する構成を示すブロック図である。
[0092]
 第2の実施形態に係る属性変換装置202は、第1属性生成部201と、第1属性選択部102と、第2属性生成部103と、第2属性選択部104とを有する。
[0093]
 まず、第1属性生成部201は、第1属性501における要素に、1つの値に基づき1つの値を算出する単項関数を適用することにより、第2属性502を算出する。
[0094]
 たとえば、単項関数には、sin関数(正弦関数)、cos関数(余弦関数)、指数関数、対数関数、多項式関数、ヒストグラムに分類する場合に頻度を与える関数、偏差等、様々な関数が存在する。また、実数において小数以下を四捨五入する関数等であってもよい。また、単項関数は、地域名に対して、該地域における天気を与える関数等であってもよい。また、当該1つの値は、たとえば、複数の値の集合を表す属性であってもよい。当該単項関数は、入力値が属性である場合に、該属性に基づき演算を実行し、結果として得られる属性を出力する。たとえば、入力値が属性であり、単項関数が対数関数である場合に、単項関数は、属性の各要素に対数関数を適用し、算出された値を出力する関数を表す。
[0095]
 係る単項関数は、属性を構成する1つ以上の要素のうち、ある1つの要素の値が特定の閾値以上である場合に1を算出し、該1つの要素の値が特定の閾値未満である場合に0を算出する関数であってもよい。
[0096]
 また、単項関数は、属性に含まれる各要素に対して、移動平均を算出する関数であってもよい。この場合、たとえば、単項関数は、属性における第i要素に対して、1つ以上の、第i要素に隣接する要素の平均を算出する。隣接する要素は、たとえば、属性に含まれる要素数の割合(1%から10%程度)に基づき定義されてもよい。
[0097]
 また、単項関数は、属性における第i要素に対して、第(i+k)要素(または、第(i-k)要素)の値を算出する関数であってもよい。kは、たとえば、属性に含まれる要素数の割合(1%から10%程度)に基づき定義されてもよい。
[0098]
 単項関数は、上述した例に限定されない。
[0099]
 第1属性生成部201は、第1演算処理として、1つの第1属性501に基づいて1つの属性を算出する単項関数を第1属性501に適用することにより、第2属性502を算出する。
[0100]
 次に、第1属性選択部102は、属性選択手順に従い、第2属性502から第3属性503を選択する。
[0101]
 また、第2属性選択部104は、第3属性503に、2つ以上の値に基づき1つの値を算出する多項関数を適用することにより、第4属性504を算出してもよい。
[0102]
 本実施形態に係る属性変換装置202に関する効果について説明する。
[0103]
 本実施形態に係る属性変換装置202によれば、第1の実施形態に係る属性変換装置105に加え、さらに、高速に良質な属性を提供することができる。
[0104]
 この理由は、理由1及び理由2なる2つの理由である。すなわち、
 (理由1)第2の実施形態に係る属性変換装置202が有する構成が、第1の実施形態に係る属性変換装置105が有する構成を含むからである、
 (理由2)第1属性生成部201が生成する属性を絞り込むことにより、第1属性選択部102における処理が、第1の実施形態における第1属性選択部102よりも少なくなるからである。
[0105]
 図11及び図12に示す例を再び参照しながら、理由2について詳細に説明する。図11及び図12は、上述したように、一般的な属性変換装置が処理する属性の一例である。該一例は、単項関数が恒等関数及びlog関数であり、第2属性生成部103において、属性における要素に、2つの値に基づき1つの値を算出する積を算出する多項関数を適用する例として考えることができる。すなわち、該例は、上述した単項関数、及び、多項関数に基づき算出可能な組み合わせをすべて列挙する例と捉えることができる。
[0106]
 尚、多項関数の入力は、たとえば、複数の要素の集合を表す属性であってもよい。この場合、多項関数は、入力された属性に基づき演算を実行し、結果として得られる属性を出力する。たとえば、入力値が2つの属性であり、多項関数が掛け算である場合に、多項関数は、2つの属性における対応する要素同士を掛け算し、算出された値を出力する関数を表す。たとえば、多項関数の例として、論理和演算、論理積演算、排他的論理和演算、掛け算(積)、割り算(商)等を挙げることができる。
[0107]
 図11及び図12を参照すると、一般的な属性変換装置が出力する属性のうち、目的変数との相関係数が高い属性は、属性X2×log(X3)、属性X3×log(X2)、属性log(X2)×log(X3)であることを読み取ることができる。これらの属性は、属性X2、属性X3、属性log(X2)、属性log(X3)を組み合わせることにより算出される属性である。
[0108]
 さらに、属性X2、属性X3、属性log(X2)、属性log(X3)は、属性X1、属性X4、属性log(X1)、属性log(X4)と比較して、それぞれ、目的変数との相関係数が高いことがわかる。
[0109]
 一方、属性変換装置202は、第1属性501に単項関数を適用し、その結果に基づいて属性選択することにより、第1属性から、上述した相関係数の高い属性(すなわち、第3属性)を選択することができる。属性変換装置202は、第3属性に基づき、第4属性を生成するので、相関係数が高く、かつ、少ない属性に関して属性を生成する処理を実行する。
[0110]
 したがって、本実施形態に係る属性変換装置202は、まず、単項関数を適用するので、複数の属性を組み合わせる処理を少なくすることができる。第1の実施形態に係る属性変換装置105よりも、さらに、高速に良質な属性を提供することができる。
[0111]
 また、第2属性生成部103が多項関数を適用する処理を行うことにより、第1属性生成部201と、第2属性生成部103とが重複した処理を実施することを防ぐことができる。この結果、本実施形態に係る属性変換装置202によれば、一層、高速に良質な属性を提供することができる。
[0112]
 <第3の実施形態>
 次に、上述した第1の実施形態を基本とする本発明の第3の実施形態について説明する。
[0113]
 以下の説明においては、本実施形態に係る特徴的な部分を中心に説明すると共に、上述した第1の実施形態と同様な構成については、同一の参照番号を付すことにより、重複する説明を省略する。
[0114]
 図14を参照しながら、第3の実施形態に係る属性変換装置303が有する構成と、属性変換装置303が行う処理とについて説明する。図14は、本発明の第3の実施形態に係る属性変換装置303が有する構成を示すブロック図である。
[0115]
 第3の実施形態に係る属性変換装置303は、第1属性生成部101と、第1属性選択部102と、第2属性生成部301と、第2属性選択部302とを有する。
[0116]
 第2属性生成部301は、第3属性503に線形な関数を適用することにより、第4属性504を生成する。
[0117]
 次に、第2属性選択部302は、該線形な関数に基づく指標に応じて属性を選択する属性選択手順に従い、第1属性501乃至第4属性504から第5属性505を選択する。
[0118]
 たとえば、線形な関数は、積、和等の演算である。
[0119]
 次に、本実施形態に係る属性変換装置303に関する効果について説明する。
[0120]
 本実施形態に係る属性変換装置303によれば、高速に良質な属性を提供することができることに加え、さらに、ユーザが理解しやすい属性を提供することができる。
[0121]
 この理由は、理由1及び理由2なる2つの理由である。すなわち、
 (理由1)第3の実施形態に係る属性変換装置303が有する構成は、第1の実施形態に係る属性変換装置が有する構成を含むからである、
 (理由2)非線形な関数に基づき算出される属性に、さらに、非線形な関数を適用することを防ぐことができるからである。
[0122]
 理由2について、さらに、説明する。
[0123]
 第1属性生成部101及び第1属性選択部102が、非線形な関数に基づき処理する場合、第3属性503は、第1属性501に非線形な関数を適用することにより算出される属性となる。したがって、第2属性生成部301及び第2属性選択部302が、非線形な関数に基づき処理する場合に、第5属性505は、第1属性501に、非線形な関数を2回適用することにより算出される属性となる。一般に、非線形な関数を2回適用することにより算出される値に関して、ユーザは、理解することが難しい。
[0124]
 したがって、第2属性生成部301及び第2属性選択部302が、線形な関数に基づき処理することにより、非線形な関数を2回適用することを防ぐことができる。この結果、本実施形態に係る属性変換装置303によれば、ユーザが理解しやすい属性を提供することができる。
[0125]
 尚、属性選択手段は、非線形な関数に基づき処理する場合に比べ、線形な関数に基づき処理する場合の方が、計算時間が短い。すなわち、第2属性生成部301及び第2属性選択部302が線形な関数に基づき処理することにより、第2属性生成部301及び第2属性選択部302における処理時間は短くなる。したがって、本実施形態に係る属性変換装置303によれば、一層、高速に良質な属性を提供することができる。
[0126]
 (ハードウェア構成例)
 上述した本発明の各実施形態における属性変換装置を、1つの計算処理装置(情報処理装置、コンピュータ)を用いて実現するハードウェア資源の構成例について説明する。但し、係る属性変換装置は、物理的または機能的に少なくとも2つの計算処理装置を用いて実現してもよい。また、係る属性変換装置は、専用の装置として実現してもよい。
[0127]
 図15は、第1の実施形態乃至第3の実施形態に係る属性変換装置を実現可能な計算処理装置のハードウェア構成を概略的に示す図である。計算処理装置20は、中央処理演算装置(Central Processing Unit、以降「CPU」と表す)21、メモリ22、ディスク23、不揮発性記録媒体24、入力装置25、出力装置26、及び、通信インターフェース(以降、「通信IF」と表す)27を有する。計算処理装置20は、通信IF27を介して、他の計算処理装置、及び、通信装置と情報を送受信することができる。
[0128]
 不揮発性記録媒体24は、コンピュータが読み取り可能な、たとえば、コンパクトディスク(Compact Disc)、デジタルバーサタイルディスク(Digital_Versatile_Disc)である。また、不揮発性記録媒体24は、ユニバーサルシリアルバスメモリ(USBメモリ)、ソリッドステートドライブ(Solid State Drive)等であってもよく、電源を供給しなくても係るプログラムを保持し、持ち運びを可能にする。不揮発性記録媒体24は、上述した媒体に限定されない。また、不揮発性記録媒体24の代わりに、通信IF27を介して、通信ネットワークを介して係るプログラムを持ち運びしてもよい。
[0129]
 すなわち、CPU21は、ディスク23が記憶するソフトウェア・プログラム(コンピュータ・プログラム:以下、単に「プログラム」と称する)を、実行する際にメモリ22にコピーし、演算処理を実行する。CPU21は、プログラム実行に必要なデータをメモリ22から読み取る。表示が必要な場合には、CPU21は、出力装置26に出力結果を表示する。外部からプログラムを入力する場合、CPU21は、入力装置25からプログラムを読み取る。CPU21は、上述した図1、図9、図10、図13、あるいは、図14に示した各部が表す機能(処理)に対応するところのメモリ22にある属性変換プログラム(図2)を解釈し実行する。CPU21は、上述した本発明の各実施形態において説明した処理を順次行う。
[0130]
 すなわち、このような場合、本発明は、係る属性変換プログラムによっても成し得ると捉えることができる。更に、係る属性変換プログラムが記録されたコンピュータ読み取り可能な不揮発性の記録媒体によっても、本発明は成し得ると捉えることができる。
[0131]
 以上、上述した実施形態を模範的な例として本発明を説明した。しかし、本発明は、上述した実施形態には限定されない。すなわち、本発明は、本発明のスコープ内において、当業者が理解し得る様々な態様を適用することができる。
[0132]
 この出願は、2014年3月28日に出願された米国出願61971585を基礎とする優先権を主張し、その開示の全てをここに取り込む。

符号の説明

[0133]
 101  第1属性生成部
 102  第1属性選択部
 103  第2属性生成部
 104  第2属性選択部
 105  属性変換装置
 501  第1属性
 502  第2属性
 503  第3属性
 504  第4属性
 505  第5属性
 111  第3属性生成部
 112  第3属性選択部
 113  属性変換装置
 121  学習部
 122  学習装置
 201  第1属性生成部
 202  属性変換装置
 301  第2属性生成部
 302  第2属性選択部
 303  属性変換装置
 20  計算処理装置
 21  CPU
 22  メモリ
 23  ディスク
 24  不揮発性記録媒体
 25  入力装置
 26  出力装置
 27  通信IF

請求の範囲

[請求項1]
 数字または符号からなる要素を1または複数含む属性を表す第1属性を、1または複数受け付け、少なくとも1つの前記属性に基づき少なくとも1つの前記属性を算出する単項演算関数を1または複数種類、受け付けた前記第1属性に適用することにより、前記第1属性に対して前記単項演算関数を適用した結果を表す第2属性を1または複数生成する第1属性生成手段と、
 前記1または複数の第2属性及び前記1または複数の第1属性と、前記第1属性に含まれる1または複数の前記要素に関連付けされた数字または符号からなる要素を1または複数含む目的変数との相関を算出し、前記1または複数の第2属性と、前記1または複数の第1属性との中から、相関性が高い前記属性を表す第3属性を1または複数選択する第1属性選択手段と、
 前記1または複数の第3属性を受け付け、1または複数の前記属性に基づき少なくとも1つの前記属性を算出する多項演算関数を、受け付けた前記第3属性に1または複数種類適用することにより、前記第3属性に対して前記多項演算関数を適用した結果を表す第4属性を1または複数生成する第2属性生成手段と、
 前記1または複数の前記第4属性及び前記1または複数の第3属性と、前記目的変数との相関を算出し、前記1または複数の前記第4属性と、前記1または複数の第3属性との中から、相関性が高い前記属性を表す第5属性を少なくとも1つ選択する第2属性選択手段と
 を備える属性変換装置。
[請求項2]
 前記第2属性生成手段は、前記多項演算関数のうち、2つの前記属性に基づき少なくとも1つの前記属性を算出する多項演算関数を、前記第3属性に対して適用する
 請求項1に記載の属性変換装置。
[請求項3]
 前記第2属性生成手段は、1または複数の前記属性に対して1つの前記属性を算出し、さらに、前記属性を構成する前記要素ごとに演算処理が適用可能である第2演算処理を、前記第3属性に適用する
 請求項2に記載の属性変換装置。
[請求項4]
 少なくとも1つ以上の前記属性に基づいて1つ以上の前記属性を算出する第3演算処理を、前記第1属性、前記第3属性または前記第5属性に適用することにより、1または複数の第6属性を算出する第3属性生成手段と、
 前記1または複数の第6属性、前記1または複数の前記第4属性、及び、前記1または複数の第2属性と、前記目的変数との相関を算出し、前記1または複数の第6属性と、前記1または複数の前記第4属性と、前記1または複数の第2属性との中から、相関性が高い前記属性を表す第7属性を少なくとも1つ選択する第3属性選択手段と
 を備える
 請求項1乃至請求項3のいずれかに記載の属性変換装置。
[請求項5]
 請求項1乃至請求項4のいずれかに記載の属性変換装置と、
 1または複数の前記属性と、前記目的変数とが関連付けされた学習情報を入力とし、前記属性変換装置が算出する前記属性に基づき、学習演算または予測演算を実行する学習手段と
 を備え、
 前記第1属性生成手段は、前記学習情報に含まれる前記属性を、前記第1属性として受け付ける
 学習装置。
[請求項6]
 情報処理装置が、
  数字または符号からなる要素を1または複数含む属性を表す第1属性を、1または複数受け付け、少なくとも1つの前記属性に基づき少なくとも1つの前記属性を算出する単項演算関数を1または複数種類、受け付けた前記第1属性に適用することにより、前記第1属性に対して前記単項演算関数を適用した結果を表す第2属性を1または複数生成し、
  前記1または複数の第2属性及び前記1または複数の第1属性と、前記第1属性に含まれる1または複数の前記要素に関連付けされた数字または符号を1または複数含む目的変数との相関を算出し、前記1または複数の第2属性と、前記1または複数の第1属性との中から、相関性が高い前記属性を表す第3属性を、1または複数選択し、
  前記1または複数の第3属性を受け付け、1または複数の前記属性に基づき少なくとも1つの前記属性を算出する多項演算関数を、受け付けた前記第3属性に1または複数種類適用することにより、前記第3属性に対して前記多項演算関数を適用した結果を表す第4属性を1または複数生成し、
  前記1または複数の前記第4属性及び前記1または複数の第3属性と、前記目的変数との相関を算出し、前記1または複数の前記第4属性と、前記1または複数の第3属性との中から、相関性が高い前記属性を表す第5属性を少なくとも1つ選択する属性変換方法。
[請求項7]
 数字または符号からなる要素を1または複数含む属性を表す第1属性を、1または複数受け付け、少なくとも1つの前記属性に基づき少なくとも1つの前記属性を算出する単項演算関数を1または複数種類、受け付け前記第1属性に適用することにより、前記第1属性に対して前記単項演算関数を適用した結果を表す第2属性を1または複数生成する第1属性生成機能と、
 前記1または複数の第2属性及び前記1または複数の第1属性と、前記第1属性に含まれる1または複数の前記要素に関連付けされた数字または符号を1または複数含む目的変数との相関を算出し、前記1または複数の第2属性と、前記1または複数の第1属性との中から、相関性が高い前記属性を表す第3属性を、1または複数選択する第1属性選択機能と、
 前記1または複数の第3属性を受け付け、1または複数の前記属性に基づき少なくとも1つの前記属性を算出する多項演算関数を、受け付けた前記第3属性に1または複数種類適用することにより、前記第3属性に対して前記多項演算関数を適用した結果を表す第4属性を1または複数生成する第2属性生成機能と、
 前記1または複数の前記第4属性及び前記1または複数の第3属性と、前記目的変数との相関を算出し、前記1または複数の前記第4属性と、前記1または複数の第3属性との中から、相関性が高い前記属性を表す第5属性を少なくとも1つ選択する第2属性選択機能と
 をコンピュータに実現させる属性変換プログラムを記憶する記録媒体。
[請求項8]
 前記第2属性生成機能にて、前記多項演算関数のうち、2つの前記属性に基づき少なくとも1つの前記属性を算出する多項演算関数を、前記第3属性に対して適用する
 請求項7に記載の属性変換プログラムを記憶する記録媒体。
[請求項9]
 前記第2属性生成機能にて、1または複数の前記属性に対して1つの前記属性を算出し、さらに、前記属性を構成する前記要素ごとに演算処理が適用可能である第2演算処理を、前記第3属性に適用する
 請求項7または請求項8に記載の属性変換プログラムを記憶する記録媒体。
[請求項10]
 1または複数の前記属性と、前記目的変数とが関連付けされた学習情報を入力とし、請求項7乃至請求項9のいずれかに記載の属性変換プログラムに従い算出される前記属性に基づき、学習演算または予測演算を実行する学習機能
 をコンピュータに実現させる学習プログラムであって、
 前記第1属性生成機能において、前記学習情報に含まれる前記属性を、前記第1属性として受け付ける
 前記学習プログラムを記憶する記録媒体。

図面

[ 図 1]

[ 図 2]

[ 図 3]

[ 図 4]

[ 図 5]

[ 図 6]

[ 図 7]

[ 図 8]

[ 図 9]

[ 図 10]

[ 図 11]

[ 図 12]

[ 図 13]

[ 図 14]

[ 図 15]