(EN) The present invention discloses a multi-center medical diagnosis knowledge graph representation learning method and system. In the present invention, on the basis of an existing medical diagnosis ontology, a hierarchical structure of a medical diagnosis concept is represented in the form of a directed acyclic graph, and a global medical diagnosis knowledge graph is constructed; a co-occurrence matrix of all disease classification codes is constructed by means of the global medical diagnosis knowledge graph, and co-occurrence information of each pair of codes is calculated, wherein the more and closer code pairs that appear at the same time, the greater the co-occurrence information; on the basis of federated learning, and on the premise of protecting data privacy and security of medical institution participants, the co-occurrence information is summed up by means of multi-center data, so that data density is improved, and the problem of data sparsity is solved. In a process of learning a large-scale knowledge graph and original data, hierarchical information and complex associations conforming to human cognition in a knowledge source are integrated, correlations between data is mined, semantic information is enriched, and a high-quality representation form of knowledge is learned, thereby facilitating knowledge calculation and reasoning.
(FR) La présente invention concerne un procédé et un système d'apprentissage de représentation de graphe de connaissances de diagnostic médical multicentrique. Dans la présente invention, sur la base d'une ontologie de diagnostic médical existante, une structure hiérarchique d'un concept de diagnostic médical est représentée sous la forme d'un graphe acyclique orienté, et un graphe de connaissances de diagnostic médical global est construit ; une matrice de co-occurrence de tous les codes de classification de maladie est construite au moyen du graphe de connaissances de diagnostic médical global, et des informations de co-occurrence de chaque paire de codes sont calculées, plus les paires de codes qui apparaissent en même temps sont nombreuses et proches, plus les informations de co-occurrence sont importantes ; sur la base d'un apprentissage fédéré, et dans l'hypothèse d'une protection de la confidentialité et de la sécurité des données des participants d'une institution médicale, les informations de cooccurrence sont additionnées au moyen de données multicentriques, de telle sorte que la densité des données est améliorée, et le problème de la rareté des données est résolu. Dans un processus d'apprentissage d'un graphe de connaissances à grande échelle et de données d'origine, des informations hiérarchiques et des associations complexes conformes à la cognition humaine dans une source de connaissances sont intégrées, les corrélations entre les données sont extraites, des informations sémantiques sont enrichies, et une forme de représentation de haute qualité des connaissances est apprise, permettant ainsi de faciliter le calcul de connaissances et le raisonnement.
(ZH) 本发明公开了一种多中心医学诊断知识图谱表示学习方法及系统,本发明基于已有的医学诊断本体,以有向无环图的形式表示医学诊断概念的层级结构,构建全局医学诊断知识图谱;利用全局医学诊断知识图谱,构建所有疾病分类编码的共现矩阵,计算每对编码的共现信息,同时出现越多且距离越近的编码对,具有更大的共现信息;基于联邦学习,在保护各医疗机构参与方数据隐私和安全的前提下,利用多中心数据,加和共现信息,提高数据密度,解决数据稀疏问题;在对大规模知识图谱及原始数据进行学习的过程中,融入了知识源中符合人类认知的层级信息和复杂关联关系,挖掘数据之间的相关关系,丰富语义信息,学习知识的高质量表示形式,便于知识的计算与推理。