Processing

Please wait...

Settings

Settings

1. WO2020004867 - MACHINE LEARNING METHOD AND DEVICE ENABLING AUTOMATIC LABELING

Publication Number WO/2020/004867
Publication Date 02.01.2020
International Application No. PCT/KR2019/007435
International Filing Date 20.06.2019
IPC
[IPC code unknown for G06N 20]
G06N 20/00 (2019.01)
CPC
G06N 20/00
G06N 99/00
Applicants
  • 주식회사 디플리 DEEPLY INC. [KR/KR]; 서울시 마포구 백범로31길 21, 6층 13호 13, 6F, 21, Baekbeom-ro 31-gil, Mapo-gu, Seoul 04147, KR
Inventors
  • 류명훈 RYU, Myeonghoon; KR
  • 박한 PARK, Han; KR
Agents
  • 정성준 CHUNG, Sungjoon; KR
Priority Data
10-2018-007533329.06.2018KR
Publication Language Korean (KO)
Filing Language Korean (KO)
Designated States
Title
(EN) MACHINE LEARNING METHOD AND DEVICE ENABLING AUTOMATIC LABELING
(FR) PROCÉDÉ ET DISPOSITIF D'APPRENTISSAGE MACHINE PERMETTANT UN ÉTIQUETAGE AUTOMATIQUE
(KO) 자동 레이블링이 가능한 머신 러닝 방법 및 장치
Abstract
(EN)
An automatic labeling method for data to which a label is not assigned, according to one embodiment of the present invention, comprises: a step (S31) of collecting data to which a label is not assigned; a step (S34) of classifying the data to which a label is not assigned into a plurality of groups by means of a clustering technique; a step (S35) of selecting partial data from each of the plurality of groups; a step (S36) of assigning a label to the selected partial data; and a step (S37) of assigning, to all of the data belonging to a corresponding group, the label assigned to the partial data. According to one embodiment of the present invention, a label is assigned only to partial training data and then a label is automatically assigned to all of the remaining training data, and thus function learning trained by machine learning can be performed within a faster time period and the labor for assigning a label can be significantly reduced.
(FR)
Selon un mode de réalisation de la présente invention, un procédé d'étiquetage automatique pour des données auxquelles une étiquette n'est pas attribuée comprend : une étape (S31) de collecte de données auxquelles une étiquette n'est pas attribuée ; une étape (S34) de classification des données auxquelles une étiquette n'est pas attribuée en une pluralité de groupes au moyen d'une technique de groupement ; une étape (S35) de sélection de données partielles à partir de chaque groupe de la pluralité de groupes ; une étape (S36) d'attribution d'une étiquette aux données partielles sélectionnées ; et une étape (S37) d'attribution, à toutes les données appartenant à un groupe correspondant, de l'étiquette attribuée aux données partielles. Selon un mode de réalisation de la présente invention, une étiquette est attribuée uniquement à des données d'entraînement partielles, puis une étiquette est automatiquement attribuée à toutes les données d'entraînement restantes, et ainsi un apprentissage de fonction entraîné par apprentissage machine peut être effectué dans une période de temps plus courte et le travail d'attribution d'une étiquette peut être considérablement réduit.
(KO)
본 발명의 일 실시예에 따른 레이블이 부여되지 않은 데이터의 자동 레이블링 방법은 레이블이 부여되지 않은 데이터를 수집하는 단계(S31), 상기 레이블이 부여되지 않은 데이터를 클러스터링 기법에 의해 복수의 그룹으로 분류하는 단계(S34), 상기 복수의 그룹 각각에서 일부 데이터를 선택하는 단계(S35), 선택된 일부 데이터의 레이블을 부여하는 단계(S36), 및 상기 일부 데이터에 부여된 레이블을 대응하는 그룹에 속하는 전체 데이터에 부여하는 단계(S37)를 포함하는 것을 특징으로 한다. 본 발명의 일 실시예에 따르면, 일부 트레이닝 데이터에만 레이블을 부여한 후 나머지 모든 트레이닝 데이터에는 레이블을 자동으로 부여하게 되므로, 머신 러닝으로 훈련되는 함수의 학습이 더 빠른 시간 안에 수행될 수 있고, 레이블을 부여하는 노동력을 획기적으로 줄일 수 있다.
Latest bibliographic data on file with the International Bureau