Processing

Please wait...

Settings

Settings

Goto Application

1. WO2020115943 - DATA PROCESSING DEVICE, METHOD, AND SEMICONDUCTOR MANUFACTURING METHOD

Publication Number WO/2020/115943
Publication Date 11.06.2020
International Application No. PCT/JP2019/029408
International Filing Date 26.07.2019
IPC
G06F 17/18 2006.01
GPHYSICS
06COMPUTING; CALCULATING OR COUNTING
FELECTRIC DIGITAL DATA PROCESSING
17Digital computing or data processing equipment or methods, specially adapted for specific functions
10Complex mathematical operations
18for evaluating statistical data
G06N 99/00 2019.01
GPHYSICS
06COMPUTING; CALCULATING OR COUNTING
NCOMPUTER SYSTEMS BASED ON SPECIFIC COMPUTATIONAL MODELS
99Subject matter not provided for in other groups of this subclass
CPC
G06F 17/18
GPHYSICS
06COMPUTING; CALCULATING; COUNTING
FELECTRIC DIGITAL DATA PROCESSING
17Digital computing or data processing equipment or methods, specially adapted for specific functions
10Complex mathematical operations
18for evaluating statistical data ; , e.g. average values, frequency distributions, probability functions, regression analysis
G06N 99/00
GPHYSICS
06COMPUTING; CALCULATING; COUNTING
NCOMPUTER SYSTEMS BASED ON SPECIFIC COMPUTATIONAL MODELS
99Subject matter not provided for in other groups of this subclass
Applicants
  • 株式会社日立ハイテク HITACHI HIGH-TECH CORPORATION [JP]/[JP]
Inventors
  • 石黒 正貴 ISHIGURO Masaki
Agents
  • ポレール特許業務法人 POLAIRE I.P.C.
Priority Data
Publication Language Japanese (JA)
Filing Language Japanese (JA)
Designated States
Title
(EN) DATA PROCESSING DEVICE, METHOD, AND SEMICONDUCTOR MANUFACTURING METHOD
(FR) DISPOSITIF DE TRAITEMENT DE DONNÉES, PROCÉDÉ DE FABRICATION DE SEMI-CONDUCTEURS
(JA) データ処理装置、方法、及び半導体製造装置
Abstract
(EN)
Provided is a data processing device that eliminates the trade-off between the suppression of calculation load and the suppression of overtraining during model formula generation. The data processing device comprises a recording unit that records electronic data, and a calculation unit that uses the electronic data and performs calculations. The calculation unit comprises a feature value selection unit that is used for the calculation. The feature value selection unit comprises the following steps for performing feature value selection: a first step (S101) in which the feature values are ranked and sorted from the highest rank; a second step (S103) in which a plurality of data groups using only some of the feature values are created in accordance with the ranking; a third step (S104) in which the plurality of data groups using only some of the feature values is used to calculate values that serve as an index for evaluating the predictive performance for a regression or classification problem; a fourth step (S105) in which feature values are removed on the basis of the calculated predictive performance index; and a fifth step (S106) in which the predictive performance index is used to update the ranking of the feature values excluding those that have been removed. The second step to the fifth step are repeated until the best value in the predictive performance index calculated in the third step cannot be updated (S102).
(FR)
L'invention concerne un dispositif de traitement de données qui élimine le compromis entre la suppression de la charge de calcul et la suppression de surapprentissage pendant la génération de formules de modèle. Le dispositif de traitement de données comprend une unité d'enregistrement qui enregistre des données électroniques, et une unité de calcul qui utilise les données électroniques et effectue des calculs. L'unité de calcul comprend une unité de sélection de valeur de caractéristique qui est utilisée pour le calcul. L'unité de sélection de valeurs de caractéristiques comprend les étapes suivantes pour mettre en oeuvre une sélection de valeurs de caractéristiques : une première étape (S101) dans laquelle les valeurs de caractéristiques sont classées et triées à partir du rang le plus élevé; une seconde étape (S103) dans laquelle une pluralité de groupes de données utilisant uniquement certaines des valeurs de caractéristiques sont créées conformément au classement; une troisième étape (S104) dans laquelle la pluralité de groupes de données utilisant uniquement certaines des valeurs de caractéristiques est utilisée pour calculer des valeurs qui servent d'indice pour évaluer les performances prédictives pour un problème de régression ou de classification; une quatrième étape (S105) dans laquelle des valeurs de caractéristiques sont supprimées sur la base de l'indice de performance prédictif calculé; et une cinquième étape (S106) dans laquelle l'indice de performance prédictif est utilisé pour mettre à jour le classement des valeurs de caractéristiques à l'exclusion de celles qui ont été éliminées. La deuxième étape à la cinquième étape sont répétées jusqu'à ce que la meilleure valeur de l'indice de performance prédictif calculé dans la troisième étape ne puisse pas être mise à jour (S102).
(JA)
モデル式作成時の過学習抑制と計算負荷抑制のトレードオフを解消するデータ処理装置を提供する。データ処理装置は、電子データを記録する記録部と、電子データを用い演算を行う演算部とを備え、演算部は、演算に用いる特徴量選択部を備え、特徴量選択部は、特徴量選択において、特徴量に順位付けを行い、上位のものから並び替える第一の工程(S101)と、順位に応じて一部の特徴量のみを用いたデータ群を複数個作成する第二の工程(S103)と、一部の特徴量のみを用いたデータ群のそれぞれを使用して、回帰もしくは分類問題の予測性能を評価する指標となる値を計算する第三の工程(S104)と、計算された予測性能指標を元に特徴量を削除する第四の工程(S105)と、前記削除された以外の特徴量に関して、予測性能指標を用いて特徴量の順位を更新する第五の工程(S106)とを備え、第二の工程から第五の工程を、第三の工程で計算される予測性能指標の最も良い値が更新されなくなるまで繰り返す(S102)。
Also published as
KR1020207009883
KRKR1020207009883
Latest bibliographic data on file with the International Bureau