Processing

Please wait...

Settings

Settings

Goto Application

1. WO2011001806 - GRAPH SIMILARITY CALCULATION SYSTEM, METHOD, AND PROGRAM

Publication Number WO/2011/001806
Publication Date 06.01.2011
International Application No. PCT/JP2010/059795
International Filing Date 09.06.2010
IPC
G06F 17/30 2006.01
GPHYSICS
06COMPUTING; CALCULATING OR COUNTING
FELECTRIC DIGITAL DATA PROCESSING
17Digital computing or data processing equipment or methods, specially adapted for specific functions
30Information retrieval; Database structures therefor
CPC
G06F 16/9024
GPHYSICS
06COMPUTING; CALCULATING; COUNTING
FELECTRIC DIGITAL DATA PROCESSING
16Information retrieval; Database structures therefor; File system structures therefor
90Details of database functions independent of the retrieved data types
901Indexing; Data structures therefor; Storage structures
9024Graphs; Linked lists
G06F 17/10
GPHYSICS
06COMPUTING; CALCULATING; COUNTING
FELECTRIC DIGITAL DATA PROCESSING
17Digital computing or data processing equipment or methods, specially adapted for specific functions
10Complex mathematical operations
G06K 9/6892
GPHYSICS
06COMPUTING; CALCULATING; COUNTING
KRECOGNITION OF DATA; PRESENTATION OF DATA; RECORD CARRIERS; HANDLING RECORD CARRIERS
9Methods or arrangements for reading or recognising printed or written characters or for recognising patterns, e.g. fingerprints
62Methods or arrangements for recognition using electronic means
68using sequential comparisons of the image signals with a plurality of references ; in which the sequence of the image signals or the references is relevant; , e.g. addressable memory
6878Syntactic or structural pattern recognition, e.g. symbolic string recognition
6892Graph matching
Applicants
  • インターナショナル・ビジネス・マシーンズ・コーポレーション INTERNATIONAL BUSINESS MACHINES CORPORATION [US]/[US] (AllExceptUS)
  • 比戸 将平 HIDO Shohei [JP]/[JP] (UsOnly)
  • 鹿島 久嗣 KASHIMA Hisashi [JP]/[JP] (UsOnly)
Inventors
  • 比戸 将平 HIDO Shohei
  • 鹿島 久嗣 KASHIMA Hisashi
Agents
  • 上野 剛史 UENO Takeshi
Priority Data
2009-15506030.06.2009JP
Publication Language Japanese (JA)
Filing Language Japanese (JA)
Designated States
Title
(EN) GRAPH SIMILARITY CALCULATION SYSTEM, METHOD, AND PROGRAM
(FR) SYSTÈME, PROCÉDÉ ET PROGRAMME DE CALCUL DE SIMILARITÉ DE GRAPHES
(JA) グラフの類似度計算システム、方法及びプログラム
Abstract
(EN)
The similarity between graphs having an extremely large number of nodes, such as an SNS, a link of WWW, etc., can be obtained within a reasonable time. A unique value is provided to a label of a node in a graph. Preferably, the value is a fixed-length bit string. In this case, the length of the bit string is selected to be sufficiently larger than the number of digits by which types of labels can be expressed. With respect to one graph, nodes of the graph are sequentially visited by an existing graph search method, such as a depth-first search, a breadth-first search, and the like. At this time, in the system, when one specific node is visited, a calculation is performed for bit string label values of all nodes adjacent to the specific node and the bit string label value of the specific node, to obtain a bit string value. The hash calculation is performed for the calculated bit string value and the original bit string label value of the node to obtain another bit string label value, and this value becomes the label value of the node. After finishing the visit to all nodes in one graph, the label values of all nodes are rewritten. When the same treatment is performed for another graph which becomes a target of the graph similarity comparison, label values of all nodes in this graph are rewritten. Therefore, with respect to one graph, a ratio of label values which are identical to the label values in another graph, per all nodes is calculated to obtain the similarity.
(FR)
Il est possible de déterminer dans un délai raisonnable la similarité entre des graphes comptant un nombre extrêmement élevé de nœuds tels qu'un site de réseau social (SNS), un lien Internet, etc. On fournit une valeur unique à une étiquette de nœud dans un graphe. La valeur est de préférence une chaîne d'éléments binaires de longueur fixe. Dans ce cas, la longueur de la chaîne d'éléments binaires est fixée à une valeur suffisamment supérieure au nombre de chiffres permettant d'exprimer les types d'étiquettes. Sur un graphe, les nœuds du graphe sont visités successivement par un procédé existant de recherche de graphe, tel qu'un algorithme de parcours en profondeur, en largeur, etc. à cet instant, lorsqu'un nœud spécifique est visité dans le système, on exécute un calcul sur les valeurs d'étiquette de chaîne d'éléments binaires de tous les nœuds adjacents au nœud spécifique et sur la valeur d'étiquette de chaîne de bits du nœud spécifique, afin de donner une valeur de chaîne d'éléments binaires. On exécute un calcul de hachage sur la valeur calculée de la chaîne d'éléments binaires et sur la valeur d'origine de chaîne d'éléments binaires du nœud, afin de donner une autre valeur d'étiquette de chaîne d'éléments binaires et cette valeur devient la valeur d'étiquette pour le nœud. Après achèvement de la visite de tous les nœuds du graphe, on réécrit les valeurs d'étiquette de tous les nœuds. Lorsqu'on exécute le même traitement sur un autre graphe constituant la cible de la comparaison de similarité des graphes, on réécrit les valeurs d'étiquettes de tous les nœuds du graphe. Il en résulte que pour un graphe, on calcule un rapport des valeurs d'étiquettes identiques aux valeurs d'étiquettes dans un autre graphe, afin d'obtenir la similarité sur tous les nœuds.
(JA)
 SNSやWWWのリンクなどの極めて多数のノードをもつグラフ間の類似度を、妥当な計算時間で求めること。 グラフのノードに、そのノードのラベルに一意的な値が付与される。好適には、この値は、固定長ビット列である。このときのビット列の長さは、ラベルの種類を表現するに足りる桁数よりも十分大きい数に選ばれる。1つのグラフにつき、深さ優先探索、幅優先探索などの既存のグラフ探索技法により、そのグラフのノードを順次訪問する。その際、この発明のシステムは、1つのノードにあるとき、そのノードに隣接する全てのノードのビット列ラベル値と、そのノードのノードのビット列ラベル値とに計算を施して、ビット列値を計算する。この発明のシステムは、その計算されたビット列値と、もともとそのノードがもっているビット列ラベル値からハッシュ計算を施して、別のビット列ラベル値を計算し、それを、そのノードのラベル値とする。こうして、1つのグラフの全てのノードを訪問し終わったとき、全てのノードのラベル値は、書き換えられていることになる。グラフの類似度を比較したい別のグラフについても同様の処理を行なうと、別のグラフでも、全てのノードのラベル値が、書き換えられていることになる。すると、1つのグラフにおいて、全ノード数に対する、別のグラフと一致するラベル値の割合を計算することにより、類似度を求めることができる。
Other related publications
Latest bibliographic data on file with the International Bureau