WIPO logo
Mobile | Deutsch | Español | Français | 日本語 | 한국어 | Português | Русский | 中文 | العربية |
PATENTSCOPE

Search International and National Patent Collections
World Intellectual Property Organization
Search
 
Browse
 
Translate
 
Options
 
News
 
Login
 
Help
 
Machine translation
1. (WO2018067388) REPAIRING DATA THROUGH DOMAIN KNOWLEDGE
Latest bibliographic data on file with the International Bureau    Submit observation

Pub. No.:    WO/2018/067388    International Application No.:    PCT/US2017/054206
Publication Date: 12.04.2018 International Filing Date: 29.09.2017
IPC:
G06F 17/30 (2006.01)
Applicants: MICROSOFT TECHNOLOGY LICENSING, LLC [US/US]; One Microsoft Way Redmond, Washington 98052-6399 (US)
Inventors: GANJAM, Kris Kuppuswamy; (US).
HE, Yeye; (US).
GRUENHEID, Anja; (US)
Agent: MINHAS, Sandip S.; (US).
CHEN, Wei-Chen Nicholas; (US).
DRAKOS, Katherine J.; (US).
HINOJOSA, Brianna L.; (US).
HOLMES, Danielle J.; (US).
SWAIN, Cassandra T.; (US).
WONG, Thomas S.; (US).
CHOI, Daniel; (US).
HWANG, William C.; (US).
WIGHT, Stephen A.; (US).
CHATTERJEE, Aaron C.; (US)
Priority Data:
15/288,899 07.10.2016 US
Title (EN) REPAIRING DATA THROUGH DOMAIN KNOWLEDGE
(FR) RÉPARATION DE DONNÉES PAR CONNAISSANCE DE DOMAINE
Abstract: front page image
(EN)Correcting data in a dataset. A set of data tokens from a tabular data store are grouped into a plurality of different clusters based on similarity of tokens. A reference cluster is selected from among the plurality of different clusters such that the plurality of clusters includes a reference cluster and one or more other clusters one or more tokens in the one or more other clusters are transformed. Transforming tokens is performed based on a cost of transforming tokens. The effect on the reference cluster of adding the transformed tokens to the reference cluster is determined. Using this information, a correction for a token in the dataset is identified. The data store is updated to correct the token.
(FR)Correction de données dans un ensemble de données. Un ensemble de jetons de données provenant d'un magasin de données tabulaires est groupé en une pluralité de grappes différentes sur la base d'une similarité de jetons. Une grappe de référence est sélectionnée parmi la pluralité de grappes différentes de telle sorte que la pluralité de grappes comprend une grappe de référence et une ou plusieurs autres grappes, un ou plusieurs jetons dans la ou les autres grappes sont transformés. Des jetons de transformation sont réalisés sur la base d'un coût de transformation de jetons. L'effet sur la grappe de référence consistant à ajouter les jetons transformés à la grappe de référence est déterminé. À l'aide de ces informations, une correction pour un jeton dans l'ensemble de données est identifiée. La mémoire de données est mise à jour pour corriger le jeton.
Designated States: AE, AG, AL, AM, AO, AT, AU, AZ, BA, BB, BG, BH, BN, BR, BW, BY, BZ, CA, CH, CL, CN, CO, CR, CU, CZ, DE, DJ, DK, DM, DO, DZ, EC, EE, EG, ES, FI, GB, GD, GE, GH, GM, GT, HN, HR, HU, ID, IL, IN, IR, IS, JO, JP, KE, KG, KH, KN, KP, KR, KW, KZ, LA, LC, LK, LR, LS, LU, LY, MA, MD, ME, MG, MK, MN, MW, MX, MY, MZ, NA, NG, NI, NO, NZ, OM, PA, PE, PG, PH, PL, PT, QA, RO, RS, RU, RW, SA, SC, SD, SE, SG, SK, SL, SM, ST, SV, SY, TH, TJ, TM, TN, TR, TT, TZ, UA, UG, US, UZ, VC, VN, ZA, ZM, ZW.
African Regional Intellectual Property Organization (BW, GH, GM, KE, LR, LS, MW, MZ, NA, RW, SD, SL, ST, SZ, TZ, UG, ZM, ZW)
Eurasian Patent Organization (AM, AZ, BY, KG, KZ, RU, TJ, TM)
European Patent Office (AL, AT, BE, BG, CH, CY, CZ, DE, DK, EE, ES, FI, FR, GB, GR, HR, HU, IE, IS, IT, LT, LU, LV, MC, MK, MT, NL, NO, PL, PT, RO, RS, SE, SI, SK, SM, TR)
African Intellectual Property Organization (BF, BJ, CF, CG, CI, CM, GA, GN, GQ, GW, KM, ML, MR, NE, SN, TD, TG).
Publication Language: English (EN)
Filing Language: English (EN)