Processing

Please wait...

Settings

Settings

Goto Application

1. WO2020135048 - DATA MERGING METHOD AND APPARATUS FOR KNOWLEDGE GRAPH

Publication Number WO/2020/135048
Publication Date 02.07.2020
International Application No. PCT/CN2019/124552
International Filing Date 11.12.2019
IPC
G06F 16/28 2019.01
GPHYSICS
06COMPUTING; CALCULATING OR COUNTING
FELECTRIC DIGITAL DATA PROCESSING
16Information retrieval; Database structures therefor; File system structures therefor
20of structured data, e.g. relational data
28Databases characterised by their database models, e.g. relational or object models
CPC
G06F 16/28
GPHYSICS
06COMPUTING; CALCULATING; COUNTING
FELECTRIC DIGITAL DATA PROCESSING
16Information retrieval; Database structures therefor; File system structures therefor
20of structured data, e.g. relational data
28Databases characterised by their database models, e.g. relational or object models
Applicants
  • 颖投信息科技(上海)有限公司 YINGTOU INFORMATION & TECHNOLOGY (SHANGHAI) CO., LTD [CN]/[CN]
Inventors
  • 刘涛 LIU, Tao
  • 朱宏明 ZHU, Hongming
  • 顾江 GU, Jiang
  • 姜逸之 JIANG, Yizhi
  • 王晓文 WANG, Xiaowen
  • 周游 ZHOU, You
Agents
  • 北京恒都律师事务所 BEIJING HENGDU LAW FIRM
Priority Data
201811635696.X29.12.2018CN
Publication Language Chinese (ZH)
Filing Language Chinese (ZH)
Designated States
Title
(EN) DATA MERGING METHOD AND APPARATUS FOR KNOWLEDGE GRAPH
(FR) PROCÉDÉ ET APPAREIL DE FUSION DE DONNÉES POUR GRAPHE DE CONNAISSANCES
(ZH) 知识图谱的数据融合方法和装置
Abstract
(EN)
A data merging method and apparatus for a knowledge graph. A system for implementing the method comprises a data platform configured with a unified access interface. The method comprises: processing data from different data sources and then converting same to a subject-property-object format, storing same in the data platform by means of the unified access interface, and receiving graph data index information returned by the data platform; according to the graph data index information, dividing subjects stored in the data platform into one or more sub-blocks according to the attribute; performing similarity calculation on candidate subjects classified into the same sub-block, and screening matching subject pairs that meet a preset similarity condition; and supplementing and/or replacing subject attribute values of the matching subject pairs to generate unified subject representation. By the abovementioned method, the data merging problem that existing data merging techniques cannot flexibly adapt to different knowledge graphs can be effectively solved.
(FR)
L'invention concerne un procédé et un appareil de fusion de données pour un graphe de connaissances. Un système pour mettre en œuvre le procédé comprend une plateforme de données conçue avec une interface d'accès unifiée. Le procédé consiste à : traiter des données provenant de différentes sources de données, puis à les convertir en un format sujet-propriété-objet, les stocker dans la plateforme de données au moyen de l'interface d'accès unifiée, et recevoir des informations d'index de données de graphique renvoyées par la plateforme de données; selon les informations d'index de données de graphique, diviser des sujets stockés dans la plate-forme de données en un ou plusieurs sous-blocs selon l'attribut; effectuer un calcul de similarité sur des sujets candidats classés dans le même sous-bloc, et cribler des paires de sujets concordants qui satisfont une condition de similarité prédéfinie; et compléter et/ou remplacer des valeurs d'attribut sujet des paires de sujets concordants pour générer une représentation de sujet unifiée. Par le procédé susmentionné, le problème de fusion de données selon lequel des techniques de fusion de données existantes ne peuvent pas s'adapter de manière flexible à différents graphes de connaissances peut être efficacement résolu.
(ZH)
一种知识图谱的数据融合方法和装置,执行所述方法的系统包括配置有统一访问接口的数据平台,所述方法包括:将来自不同数据源的数据进行处理后转换为三元组格式,通过所述统一访问接口存储到数据平台,并接收所述数据平台返回的图数据索引信息;根据所述图数据索引信息,将所述数据平台中存储的实体按属性划分为一个或多个子分区;对划分到相同子分区中的候选实体对进行相似度计算,筛选出满足预设相似度条件的匹配实体对;对所述匹配实体对的实体属性值进行补充和/或替换,生成统一的实体表示。通过上述方法,可有效解决现有数据融合技术不能灵活适应不同知识库的数据融合问题。
Also published as
Latest bibliographic data on file with the International Bureau