処理中

しばらくお待ちください...

設定

設定

出願の表示

1. WO2020115943 - データ処理装置、方法、及び半導体製造装置

公開番号 WO/2020/115943
公開日 11.06.2020
国際出願番号 PCT/JP2019/029408
国際出願日 26.07.2019
IPC
G06F 17/18 2006.01
G物理学
06計算;計数
F電気的デジタルデータ処理
17特定の機能に特に適合したデジタル計算またはデータ処理の装置または方法
10複合した数学演算
18統計データの算出のためのもの
G06N 99/00 2019.01
G物理学
06計算;計数
N特定の計算モデルに基づくコンピュータ・システム
99このサブクラスの他のグループに分類されない主題事項
CPC
G06F 17/18
GPHYSICS
06COMPUTING; CALCULATING; COUNTING
FELECTRIC DIGITAL DATA PROCESSING
17Digital computing or data processing equipment or methods, specially adapted for specific functions
10Complex mathematical operations
18for evaluating statistical data ; , e.g. average values, frequency distributions, probability functions, regression analysis
G06N 99/00
GPHYSICS
06COMPUTING; CALCULATING; COUNTING
NCOMPUTER SYSTEMS BASED ON SPECIFIC COMPUTATIONAL MODELS
99Subject matter not provided for in other groups of this subclass
出願人
  • 株式会社日立ハイテク HITACHI HIGH-TECH CORPORATION [JP]/[JP]
発明者
  • 石黒 正貴 ISHIGURO Masaki
代理人
  • ポレール特許業務法人 POLAIRE I.P.C.
優先権情報
公開言語 (言語コード) 日本語 (JA)
出願言語 (言語コード) 日本語 (JA)
指定国 (国コード)
発明の名称
(EN) DATA PROCESSING DEVICE, METHOD, AND SEMICONDUCTOR MANUFACTURING METHOD
(FR) DISPOSITIF DE TRAITEMENT DE DONNÉES, PROCÉDÉ DE FABRICATION DE SEMI-CONDUCTEURS
(JA) データ処理装置、方法、及び半導体製造装置
要約
(EN)
Provided is a data processing device that eliminates the trade-off between the suppression of calculation load and the suppression of overtraining during model formula generation. The data processing device comprises a recording unit that records electronic data, and a calculation unit that uses the electronic data and performs calculations. The calculation unit comprises a feature value selection unit that is used for the calculation. The feature value selection unit comprises the following steps for performing feature value selection: a first step (S101) in which the feature values are ranked and sorted from the highest rank; a second step (S103) in which a plurality of data groups using only some of the feature values are created in accordance with the ranking; a third step (S104) in which the plurality of data groups using only some of the feature values is used to calculate values that serve as an index for evaluating the predictive performance for a regression or classification problem; a fourth step (S105) in which feature values are removed on the basis of the calculated predictive performance index; and a fifth step (S106) in which the predictive performance index is used to update the ranking of the feature values excluding those that have been removed. The second step to the fifth step are repeated until the best value in the predictive performance index calculated in the third step cannot be updated (S102).
(FR)
L'invention concerne un dispositif de traitement de données qui élimine le compromis entre la suppression de la charge de calcul et la suppression de surapprentissage pendant la génération de formules de modèle. Le dispositif de traitement de données comprend une unité d'enregistrement qui enregistre des données électroniques, et une unité de calcul qui utilise les données électroniques et effectue des calculs. L'unité de calcul comprend une unité de sélection de valeur de caractéristique qui est utilisée pour le calcul. L'unité de sélection de valeurs de caractéristiques comprend les étapes suivantes pour mettre en oeuvre une sélection de valeurs de caractéristiques : une première étape (S101) dans laquelle les valeurs de caractéristiques sont classées et triées à partir du rang le plus élevé; une seconde étape (S103) dans laquelle une pluralité de groupes de données utilisant uniquement certaines des valeurs de caractéristiques sont créées conformément au classement; une troisième étape (S104) dans laquelle la pluralité de groupes de données utilisant uniquement certaines des valeurs de caractéristiques est utilisée pour calculer des valeurs qui servent d'indice pour évaluer les performances prédictives pour un problème de régression ou de classification; une quatrième étape (S105) dans laquelle des valeurs de caractéristiques sont supprimées sur la base de l'indice de performance prédictif calculé; et une cinquième étape (S106) dans laquelle l'indice de performance prédictif est utilisé pour mettre à jour le classement des valeurs de caractéristiques à l'exclusion de celles qui ont été éliminées. La deuxième étape à la cinquième étape sont répétées jusqu'à ce que la meilleure valeur de l'indice de performance prédictif calculé dans la troisième étape ne puisse pas être mise à jour (S102).
(JA)
モデル式作成時の過学習抑制と計算負荷抑制のトレードオフを解消するデータ処理装置を提供する。データ処理装置は、電子データを記録する記録部と、電子データを用い演算を行う演算部とを備え、演算部は、演算に用いる特徴量選択部を備え、特徴量選択部は、特徴量選択において、特徴量に順位付けを行い、上位のものから並び替える第一の工程(S101)と、順位に応じて一部の特徴量のみを用いたデータ群を複数個作成する第二の工程(S103)と、一部の特徴量のみを用いたデータ群のそれぞれを使用して、回帰もしくは分類問題の予測性能を評価する指標となる値を計算する第三の工程(S104)と、計算された予測性能指標を元に特徴量を削除する第四の工程(S105)と、前記削除された以外の特徴量に関して、予測性能指標を用いて特徴量の順位を更新する第五の工程(S106)とを備え、第二の工程から第五の工程を、第三の工程で計算される予測性能指標の最も良い値が更新されなくなるまで繰り返す(S102)。
他の公開
KR1020207009883
KRKR1020207009883
国際事務局に記録されている最新の書誌情報