此应用程序的某些内容目前无法使用。
如果这种情况持续存在,请联系我们反馈与联系
1. (WO2018159241) DATA GENERATING METHOD, DATA GENERATING DEVICE, AND DATA GENERATING PROGRAM
Document

明 細 書

発明の名称 データ生成方法、データ生成装置及びデータ生成プログラム

技術分野

0001  

背景技術

0002   0003  

先行技術文献

非特許文献

0004  

発明の概要

発明が解決しようとする課題

0005   0006  

課題を解決するための手段

0007  

発明の効果

0008  

図面の簡単な説明

0009  

発明を実施するための形態

0010   0011   0012   0013   0014   0015   0016   0017   0018   0019   0020   0021   0022   0023   0024   0025   0026   0027   0028   0029   0030   0031   0032   0033   0034   0035   0036   0037   0038   0039   0040   0041   0042   0043   0044   0045   0046   0047   0048   0049   0050   0051   0052   0053   0054   0055   0056   0057   0058   0059   0060   0061   0062   0063   0064   0065   0066   0067   0068   0069   0070   0071   0072   0073   0074   0075   0076   0077   0078   0079   0080   0081   0082   0083   0084   0085   0086   0087   0088   0089   0090   0091   0092   0093   0094   0095   0096   0097   0098   0099  

符号の説明

0100  

請求の範囲

1   2   3   4   5   6   7  

図面

1   2   3   4   5   6   7   8   9   10   11   12   13   14   15   16   17   18   19   20   21   22   23   24   25   26   27   28   29   30  

明 細 書

発明の名称 : データ生成方法、データ生成装置及びデータ生成プログラム

技術分野

[0001]
 本発明は、ウエハにおける欠陥の情報の処理技術に関する。

背景技術

[0002]
 ウエハ上に発生する欠陥の分布の形状が複数のウエハ間で類似している場合、それらのウエハの加工における同一の工程が欠陥の原因であることがある。そのため、欠陥を有するICチップ(以下、欠陥チップと呼ぶ)のウエハ上の位置の情報に基づいて、問題が有る工程を特定することが行われている。
[0003]
 例えば、或る文献は、欠陥チップのマップデータに対するラドン変換により生成されたデータから特徴量を抽出し、抽出した特徴量に基づいて欠陥の原因を特定する技術を開示する。

先行技術文献

非特許文献

[0004]
非特許文献1 : Ming-Ju Wu、Jyh-Shing R. Jang、Jui-Long Chen、"Wafer Map Failure Pattern Recognition and Similarity Ranking for Large-Scale Data Sets"、IEEE Transactions on Semiconductor Manufacturing、平成27年2月、第28巻、第1号、pp.1-12

発明の概要

発明が解決しようとする課題

[0005]
 しかし、上記文献の技術を利用することが適切ではないケースが存在する。例えば図1(a)に示したウエハと図1(b)に示したウエハとを比較すると、欠陥チップのウエハ上での分布位置はおおよそ同じであるものの、分布の形状は異なっている。このようなケースにおいては、図1(a)に示した欠陥チップの原因と図1(b)に示した欠陥チップの原因とが異なる可能性があるが、上記文献の技術を利用した場合、原因は同じであると判定されることがある。
[0006]
 本発明の目的は、1つの側面では、ウエハ上の欠陥チップの位置情報を、分類に適した特徴情報に変換することである。

課題を解決するための手段

[0007]
 一態様に係るデータ生成方法は、複数のウエハそれぞれについて、当該ウエハの欠陥位置の情報を用いて、当該ウエハ上の欠陥ごとに、当該ウエハ上の位置、および、当該ウエハの中心からの距離と寄与パラメータとから算出される値を含む拡張座標を生成し、複数のウエハそれぞれについて、生成された複数の拡張座標に対するパーシステントホモロジ処理によりベッチ数系列を生成し、複数のウエハそれぞれについて、寄与パラメータの複数の値に対し生成した複数のベッチ数系列から、欠陥パターン画像を生成し、複数のウエハについて生成された複数の欠陥パターン画像と、複数のウエハに対応付けられた判別情報とを対応付けた機械学習データを生成する処理を含む。

発明の効果

[0008]
 1つの側面では、ウエハ上の欠陥チップの位置情報を、分類に適した特徴情報に変換できる。

図面の簡単な説明

[0009]
[図1] 図1は、欠陥チップの分布の一例を示す図である。
[図2] 図2は、欠陥チップの分布パターンの一例を示す図である。
[図3] 図3は、欠陥チップの分布の一例を示す図である。
[図4] 図4は、欠陥チップの分布の一例を示す図である。
[図5] 図5は、欠陥チップの分布の一例を示す図である。
[図6] 図6は、二次元空間上の欠陥チップの位置を示す図である。
[図7] 図7は、三次元空間上の欠陥チップの位置を示す図である。
[図8] 図8は、二次元空間上の欠陥チップの位置を示す図である。
[図9] 図9は、三次元空間上の欠陥チップの位置を示す図である。
[図10] 図10は、情報処理装置の機能ブロック図である。
[図11] 図11は、メインの処理フローを示す図である。
[図12] 図12は、画像生成処理の処理フローを示す図である。
[図13] 図13は、αの値の一例を示す図である。
[図14] 図14は、欠陥チップの分布の一例を示す図である。
[図15] 図15は、拡張ベクトル生成処理の処理フローを示す図である。
[図16] 図16は、バーコード図の一例を示す図である。
[図17] 図17は、バーコードデータの一例を示す図である。
[図18] 図18は、バーコードデータとベッチシリーズとの関係について説明するための図である。
[図19] 図19は、パーシステント区間の一例を示す図である。
[図20] 図20は、特徴画像について説明するための図である。
[図21] 図21は、マップデータを分類する処理の処理フローを示す図である。
[図22] 図22は、欠陥チップの分布の一例を示す図である。
[図23] 図23は、欠陥チップの分布の一例を示す図である。
[図24] 図24は、欠陥チップの分布の一例を示す図である。
[図25] 図25は、ラドン変換に基づき抽出された特徴量を示す図である。
[図26] 図26は、パーシステントホモロジを用いる方法で抽出された特徴量を示す図である。
[図27] 図27は、特徴画像の一例を示す図である。
[図28] 図28は、特徴画像の一例を示す図である。
[図29] 図29は、特徴画像の一例を示す図である。
[図30] 図30は、コンピュータの機能ブロック図である。

発明を実施するための形態

[0010]
 図2は、欠陥チップの分布パターンの一例を示す図である。
[0011]
 図2(a)の分布パターンは「クラスタ」と呼ばれ、塊状の欠陥チップが存在する。クラスタであるか否かの判定においては、ウエハの中心からの位置、分布の大きさ、分布の濃さおよびBINが考慮される。一方で、ウエハの回転は基本的には考慮されない(すなわち、或る分布パターンがウエハの回転により別の分布パターンと同じになる場合、両者は同じ分布パターンであると見做される)。
[0012]
 図2(b)の分布パターンは「リング」と呼ばれる分布パターンであり、環状に分布した欠陥チップがウエハの中央に存在する。リングであるか否かの判定においては、ウエハの中心からの位置、分布の形状(例えば、円または半円)、分布の大きさ、分布の濃さ及びBINが考慮される。一方で、ウエハの回転は考慮されない。
[0013]
 図2(c)の分布パターンは「スクラッチ」と呼ばれる分布パターンであり、線状に分布した欠陥チップが存在する。スクラッチであるか否かの判定においては、分布の形状(例えば、直線または円弧)及び線の数等が考慮される。一方、ウエハの中心からの位置、
ウエハの回転及びBINは考慮されない。
[0014]
 欠陥チップが発生した原因毎に分布パターンを予め特定しておけば、新たに製造されたウエハ上の欠陥チップの分布を目視で確認することで、欠陥チップが発生した原因を特定できる可能性がある。但し、欠陥チップが生じる原因は様々であり、そのため分布のバリエーションは非常に多いため、分類は容易ではない。
[0015]
 そこで、以下では、欠陥チップの位置情報そのものではなく、欠陥チップの位置情報から抽出した特徴情報を基にして分類を行うことについて検討する。
[0016]
 図3乃至図5を用いて、特徴情報の要件を検討する。図3に示した分布と図4(a)に示した分布との関係はウエハの回転に該当し、ウエハの中心からの距離が同じであるので、両分布は同じであると見做すことが好ましい。一方で、図3に示した分布と図4(b)に示した分布との関係は欠陥チップの平行移動に該当し、ウエハの中心からの距離が異なるので、両分布は異なると見做すことが好ましい場合が有る。また、図3に示した分布と図4(c)に示した分布との関係は分布自体の回転に該当し、ウエハの中心からの向きが異なるので、両分布は異なるものと見做すことが好ましい場合が有る。
[0017]
 また、分布パターン同士の「近さ」(すなわち距離)を判定できることが好ましい。図5は、欠陥チップの分布の一例を示す図である。図5(a)乃至図5(c)に示した3つの分布の関係は平行移動に該当する。図5(a)の分布と図5(b)の分布との間の平行移動距離は、図5(a)の分布と図5(c)の分布との間の平行移動距離より短い。このようなケースの場合、図5(a)の分布と図5(b)の分布は同じであると見做すことが好ましい場合があるが、図5(a)の分布と図5(c)の分布は異なると見做すことが好ましい場合がある。
[0018]
 以上を踏まえると、特徴情報に以下が反映されることが好ましい。
(1)欠陥チップの位置関係(すなわち分布の形状)
(2)ウエハの中心からの距離
(3)ウエハの中心からの向き
(4)上記(1)乃至(3)の情報の「近さ」
[0019]
 ここで、点の配置情報を類型化することが可能な手法であるパーシステントホモロジ(Persistent Homology)を用いて特徴情報を抽出することについて検討する。但し、パーシステントホモロジ処理を実行すると、ウエハの回転を無視することができるものの、中心からの距離および中心からの向きは特徴情報に反映されない。
[0020]
 そこで、ウエハ上の欠陥チップの位置を表す二次元座標(x,y)に対して、中心からの距離に応じた高さの軸(ここではz軸とする)の値を加えることで、二次元座標(x,y)を三次元座標(x,y,z)に変換することを考える。zは、例えば、z=x 2+y 2として設定される。
[0021]
 このようなz軸の値を設定しない場合、図6(a)に示した3つの欠陥チップの2次元座標に対して実行したパーシステントホモロジ処理の結果と、図6(b)に示した3つの欠陥チップの2次元座標に対して実行したパーシステントホモロジ処理の結果とは同じになる。この理由は、両者を平行移動により重ねることが可能であり、3点の位置関係は全く同じであるからである。
[0022]
 しかし、上記のようにz軸の値が設定された三次元座標を生成すると、図7(a)及び図7(b)に示すように、3点の位置関係が同一ではなくなる。従って、中心からの距離が反映された三次元座標の導入により、平行移動によって両者を重ねることができないようにすることができる。
[0023]
 但し、上記のような方法でz軸の値を設定すると、二次元座標の場合には点の位置関係が異なっていたにもかかわらず、三次元座標の場合には点の位置関係が同一になってしまうことがある。例えば、図8(a)に示した3つの欠陥チップの位置関係と、図8(b)に示した3つの欠陥チップの位置関係とは異なる。しかしながら、z軸の値を設定すると、図9(a)及び図9(b)に示すように、三角形の三辺の距離が0.227、0.227、0.4であり、点の間の距離関係が全く同じになる。つまり、3点の位置関係が全く同じになるので、パーシステントホモロジ処理によって抽出される特徴情報を使用したとしても、適切な分類をすることができない。
[0024]
 そこで本実施の形態においては、以下のような方法によって抽出された特徴情報によって機械学習及び分類を実行する。
[0025]
 図10は、本実施の形態の情報処理装置1の機能ブロック図である。情報処理装置1は、第1マップデータ格納部101と、画像生成部103と、特徴画像格納部105と、ラベルデータ格納部107と、機械学習部109と、機械学習データ格納部111と、第2マップデータ格納部113と、分類部115と、分類結果格納部117とを含む。
[0026]
 画像生成部103、機械学習部109および分類部115は、図30に示したメモリ2501にロードされたプログラムが図30に示したCPU(Central Processing Unit)2503に実行されることで実現される。第1マップデータ格納部101、特徴画像格納部105、ラベルデータ格納部107、機械学習データ格納部111、第2マップデータ格納部113および分類結果格納部117は、メモリ2501又は図30に示したHDD(Hard Disk Drive)2505に設けられる。
[0027]
 画像生成部103は、第1マップデータ格納部101に格納されているデータ及び第2マップデータ格納部113に格納されているデータに基づき処理を実行し、処理結果を特徴画像格納部105に格納する。機械学習部109は、特徴画像格納部105に格納されているデータ及びラベルデータ格納部107に格納されているデータに基づき処理を実行し、処理結果を機械学習データ格納部111に格納する。分類部115は、特徴画像格納部105に格納されているデータ及び機械学習データ格納部111に格納されているデータに基づき処理を実行し、処理結果を分類結果格納部117に格納する。
[0028]
 次に、図11乃至図29を用いて、情報処理装置1が実行する処理について説明する。
[0029]
 まず、画像生成部103は、画像生成処理を実行する(図11:ステップS1)。画像生成処理については、図12乃至図20を用いて説明する。
[0030]
 画像生成部103は、ウエハ上の欠陥チップのマップデータを第1マップデータ格納部101から読み出す(図12:ステップS11)。なお、第1マップデータ格納部101に格納されるマップデータに対応するラベルは予め判明しているものとする。マップデータは、欠陥チップの二次元座標(原点はウエハの中心)を特定可能な情報を含む。
[0031]
 画像生成部103は、寄与パラメータαの各値について、読み出したマップデータから拡張座標で表された点の集合を生成する(ステップS13)。画像生成部103は、寄与パラメータαの各値について生成した点の集合を、メモリ2501に格納する。
[0032]
 ステップS13においては、各欠陥チップについて拡張座標が生成される。拡張座標は三次元座標であり、x座標およびy座標はマップデータから特定される。z座標は、例えば、z=α*(x 2+y 2)により設定される。但し、別の関数によりzを設定してもよい。具体的には、ウエハの中心からの距離が反映された単調増加の関数であって且つ一階微分が一定である関数であってもよい。または、ウエハの中心からの距離が反映された単調増加の関数であってz軸の周りに回転された関数であってもよい。
[0033]
 寄与パラメータα、例えば、0≦α≦1を満たす実数である。但し、αの範囲はこのような範囲でなくてもよい。本実施の形態においては、例えば図13に示すように、一定の間隔で設定された複数の値が使用される。
[0034]
 寄与パラメータαを変化させた時の点の位置変化の大きさは、ウエハの中心からの距離を表す。例えば、ウエハの中心に近い部分においては、αを変化させてもz座標の変化が比較的小さいため、αを変化させた時の点の位置変化が比較的小さい。逆に、ウエハの中心から遠い部分においては、αを変化させた時のz座標の変化が比較的大きいため、αを変化させた時の点の位置変化が比較的大きい。つまり、αを変化させた時の点の位置変化の大きさから、ウエハの中心からの距離を推定することができる。
[0035]
 また、寄与パラメータαを変化させた時の点の位置変化の大きさは、ウエハの中心からの向きを表す。例えば図14(a)に示すように、ウエハの中心側の欠陥チップの密度がウエハの端側の欠陥チップの密度より大きい場合、αを変化させた時の点の位置変化が比較的小さい。一方、図14(b)に示すように、ウエハの中心側の欠陥チップの密度がウエハの端側の欠陥チップの密度より小さい場合、αを変化させた時の点の位置変化が比較的大きい。従って、αを変化させた時の点の位置変化の大きさから、ウエハの中心からの向きを推定することができる。
[0036]
 よって、本実施の形態のような拡張座標を導入することで、欠陥チップの位置関係、ウエハの中心からの距離およびウエハの中心からの向きを反映した特徴情報を生成することができるようになる。また、上記の説明から明らかなように、特徴情報により「近さ」をも推定することができる。
[0037]
 そして、画像生成部103は、メモリ2501に格納された点の集合を用いて、拡張ベクトル生成処理を実行する(ステップS15)。拡張ベクトル生成処理については、図15乃至図20を用いて説明する。
[0038]
 まず、画像生成部103は、寄与パラメータαの値のうち未処理の値を1つ特定する(図15:ステップS21)。
[0039]
 画像生成部103は、ステップS21において特定した値についての点の集合を、メモリ2501から読み出す(ステップS23)。
[0040]
 画像生成部103は、パーシステントホモロジ処理によって、点の集合からバーコードデータを穴の次元(以下、穴次元と呼ぶ)毎に生成する(ステップS25)。
[0041]
 「ホモロジ」とは、対象の特徴をm(m≧0)次元の穴の数によって表現する手法である。ここで言う「穴」とはホモロジ群の元のことであり、0次元の穴は連結成分であり、1次元の穴は穴(トンネル)であり、2次元の穴は空洞である。各次元の穴の数はベッチ数と呼ばれる。
[0042]
 「パーシステントホモロジ」とは、対象(ここでは、点の集合)におけるm次元の穴の遷移を特徴付けるための手法であり、パーシステントホモロジによって点の配置に関する特徴を調べることができる。この手法においては、対象における各点が球状に徐々に膨らまされ、その過程において各穴が発生した時刻(発生時の球の半径で表される)と消滅した時刻(消滅時の球の半径で表される)とが特定される。
[0043]
 穴の発生半径と消滅半径とを使用することで、例えば図16に示すようなバーコード図を生成することができる。図16において、横軸は半径を表し、各線分は1つの穴に対応する。線分の左端に対応する半径は穴の発生半径であり、線分の右端に対応する半径は穴の消滅半径である。線分はパーシステント区間と呼ばれる。このようなバーコード図から、例えば半径が0.18である時には2つの穴が存在するということがわかる。
[0044]
 図17に、バーコード図を生成するためのデータ(以下、バーコードデータと呼ぶ)の一例を示す。図17の例では、穴次元を表す数値と、穴の発生半径と、穴の消滅半径とが含まれる。ステップS25において、バーコードデータは穴次元毎に生成される。
[0045]
 以上のような処理を実行すれば、或る点の集合から生成されるバーコードデータと他の点の集合から生成されるバーコードデータとの類似関係は、点の集合間の類似関係と等価である。よって、点の集合とバーコードデータとの関係は1対1の関係である。
[0046]
 すなわち、点の集合が同じであれば、生成されるバーコードデータは同じである。逆に、バーコードデータが同じであれば、点の集合も同じである。また、点の集合が類似している場合にはバーコードデータも類似するため、機械学習に必要な条件が満たされる。点の集合が異なる場合には、バーコードデータも異なる。
[0047]
 なお、パーシステントホモロジの詳細については、例えば「平岡裕章、『タンパク質構造とトポロジー パーシステントホモロジー群入門』、共立出版」を参照されたい。
[0048]
 図15の説明に戻り、画像生成部103は、長さが所定長未満であるパーシステント区間のデータを、ステップS25において生成されたバーコードデータから削除する(ステップS27)。なお、パーシステント区間の長さは、(消滅半径-発生半径)によって算出される。所定長は、例えば、0次元の穴が発生してから消滅するまでの時間をK等分した時間(以下、ブロックと呼ぶ)の長さである。但し、1ブロックの長さに限られるわけではなく、複数ブロックの長さを所定長としてもよい。
[0049]
 発生から消滅までの時間が短い元は、ノイズによって発生するものがほとんどである。長さが所定長未満であるパーシステント区間のデータを削除すれば、ノイズの影響を緩和することができるので、分類性能を向上させることができるようになる。但し、削除の対象は次元が1以上であるパーシステント区間のデータであるとする。
[0050]
 ノイズが発生した場合においては、僅かな時間だけ1次元以上の穴が発生することがある。ステップS27の処理を実行すれば、両ケースにおいて生成されるデータはほぼ同じになるので、ノイズの影響を取り除くことができるようになる。
[0051]
 なお、長さが所定長未満であるパーシステント区間のデータが削除されるので、削除後のバーコードデータ間の類似関係は、元のバーコードデータ間の類似関係と厳密には等価ではない。削除が行われない場合には、類似関係は等価である。
[0052]
 図15の説明に戻り、画像生成部103は、バーコードデータを統合し、統合されたバーコードデータから拡張ベクトル(拡張ベクトルはベッチ数の系列である)を生成する(ステップS29)。
[0053]
 上で述べたように、バーコードデータは穴次元毎に生成されるので、画像生成部103は、複数の穴次元のバーコードデータを統合することで1塊のバーコードデータを生成する。ベッチ数の系列は、パーシステントホモロジにおける球の半径(すなわち時間)とベッチ数との関係を示すデータである。図18を用いて、バーコードデータと生成されるベッチ数の系列との関係について説明する。上段のグラフはバーコードデータから生成されるグラフであり、横軸が半径を表す。下段のグラフはベッチ数の系列から生成されるグラフであり、縦軸はベッチ数を表し、横軸は時間を表す。上で述べたように、ベッチ数は穴の数を表しており、例えば上段のグラフにおいて破線に対応する半径の時には存在している穴の数が10であるので、下段のグラフにおいては破線に対応するベッチ数も10である。ベッチ数は、ブロック毎に計数される。なお、下段のグラフは疑似的な時系列データのグラフであるので、横軸の値自体が意味を持つわけではない。
[0054]
 基本的には、同じバーコードデータからは同じ系列が得られる。すなわち、元の点の集合が同じであれば同じ系列が得られる。但し、異なるバーコードから同じ系列が得られるケースが極めて稀に発生する。
[0055]
 例えば図19に示すようなバーコードデータを考える。このバーコードデータは1以上の次元の穴に関するデータであるとする。図19(a)のケースにおいては、パーシステント区間p1が時刻t1で開始し且つ時刻t2で終了し、パーシステント区間p2が時刻t2で開始し且つ時刻t3で終了する。一方、図19(b)のケースにおいては、パーシステント区間p4が時刻t1で開始し且つ時刻t3で終了する。両ケースにおけるパーシステント区間p3は全く同じであるとする。
[0056]
 このような場合、両ケースにおけるバーコードデータからは全く同じ系列が得られるので、両ケースを区別することができない。しかし、このような現象が発生する可能性は極めて低い。また、両ケースの点の集合は元々似ており、機械学習による分類に与える影響が極めて小さいので、上記のような現象が発生しても問題は無い。
[0057]
 従って、或るバーコードデータから生成されるベッチ数の系列と、別のバーコードデータから生成されるベッチ数の系列との類似関係は、上で述べた稀なケースが発生しなければ、バーコードデータ間の類似関係と等価である。以上から、データ間の距離の定義は変わるものの、バーコードデータから生成されるベッチ数の系列間の類似関係は、元の点の集合間の類似関係とほぼ等価である。
[0058]
 図15の説明に戻り、画像生成部103は、αの値のうち未処理の値が有るか判定する(ステップS31)。未処理の値が有る場合(ステップS31:Yesルート)、ステップS21の処理に戻る。未処理の値が無い場合(ステップS31:Noルート)、処理は呼び出し元に戻る。
[0059]
 以上のように、パーシステントホモロジ処理を実行すれば、拡張座標で表された点の集合が表す、欠陥チップの分布を、バーコードデータに反映することができる。これにより、欠陥チップの分布に応じた分類を機械学習によって行うことができるようになる。
[0060]
 パーシステントホモロジ処理によって生成されたバーコードデータは、バーコードの本数が一定ではないため、そのままでは機械学習の入力とすることが難しい。そこで本実施の形態においては、バーコードデータをベッチ数の系列に変換することで、機械学習の入力とすることを可能にしている。
[0061]
 また、上で述べたように、本実施の形態によればノイズの影響を取り除くことができる。
[0062]
 図12の説明に戻り、画像生成部103は、ステップS15において生成された複数の拡張ベクトルを、αの値の大きさの順に結合することで特徴画像を生成し(ステップS17)、生成した特徴画像を特徴画像格納部105に格納する。そして処理は呼び出し元に戻る。
[0063]
 図20は、特徴画像の一例を示す図である。正方形の図形はセルを表し、各セルには拡張ベクトルの要素であるベッチ数が格納される。1つの行が1つの拡張ベクトルに対応する。従って、図20の例においては、11個の拡張ベクトルが結合されており、特徴画像は11の行を有する行列に相当する。図20においては拡張ベクトルの要素の数が15であるが、数に限定は無い。
[0064]
 図11の説明に戻り、機械学習部109は、特徴画像格納部105に格納された特徴画像に対応するラベルをラベルデータ格納部107から読み出す。なお、第1マップデータ格納部101に格納されるマップデータに対応するラベルは予め判明しているため、特徴画像格納部105に格納された特徴画像に対応するラベルを特定することができる。ラベルは、例えば、欠陥チップの分布パターン名の情報である。そして、機械学習部109は、特徴画像格納部105に格納された特徴画像に対して、読み出したラベルを対応付ける(ステップS3)。
[0065]
 機械学習部109は、特徴画像格納部105に格納された特徴画像と当該特徴画像に対応付けられたラベルとを用いて機械学習を実行する(ステップS5)。例えば、ニューラルネットワークを用いた機械学習が実行される。機械学習部109は、機械学習データ(例えば、更新後の重み行列等)を機械学習データ格納部111に格納する。そして処理は終了する。
[0066]
 以上のように、ウエハ上の欠陥の分布の特徴が適切に反映された特徴画像に基づき機械学習を実行すれば、後に実行する分類の精度を向上させることができるようになる。
[0067]
 次に、図21を用いて、図11乃至図20を用いて説明した処理の結果を利用してマップデータを分類する処理について説明する。
[0068]
 まず、画像生成部103は、画像生成処理を実行する(図21:ステップS41)。画像生成処理については、図12乃至図20を用いて説明したとおりであるので、説明を省略する。但し、ステップS41における画像生成処理においては、第2マップデータ格納部113に格納されているマップデータが処理される。第2マップデータ格納部113に格納されるマップデータに対応するラベルは不明であるものとする。例えば、稼働中の製造装置の問題を特定するため新規で生成されたマップデータが第2マップデータ格納部113に格納される。
[0069]
 分類部115は、ステップS41において生成された特徴画像を、機械学習データ格納部111に格納された機械学習データに基づき分類する(ステップS43)。例えば、ニューラルネットワークを用いた分類が行われる。
[0070]
 分類部115は、ステップS43において実行した分類の結果を分類結果格納部117に格納する(ステップS45)。例えば、ステップS41において生成された特徴画像に対応付けて、当該特徴画像が属するクラスのラベルが分類結果格納部117に格納される。そして処理は終了する。
[0071]
 以上のような処理を実行すれば、ICチップの製造における工程のうち問題が有る工程を特定することができるようになる。
[0072]
 以下では、本実施の形態の方法の効果を他の方法との比較をもとに説明する。
[0073]
 ここでは、図22乃至図24に示した3つのウエハを対象とする。前提として、図22のウエハw1と図23のウエハw2とは、分布の形状は類似しているものの分布位置が異なるため異なるクラスに分類されるべきであるとする。図22のウエハw1と図24のウエハw3とは、欠陥チップの分布位置はおおよそ同じであるものの欠陥の原因が異なるため異なるクラスに分類されるべきであるとする。
[0074]
 図25は、ラドン変換に基づき抽出された特徴量を示す図である。図25に示したグラフの左半分は平均についてのグラフであり、図25に示したグラフの右半分は分散についてのグラフである。横軸は分割の数を表し、縦軸は平均及び分散の値を表す。図25に示したグラフにおいて、実線の形状と点線の形状とは異なるが、実線と破線とがほぼ重なっている。従って、図25に示した特徴量に基づき分類を実行すると、ウエハw1とウエハw3とが同じクラスに分類される可能性がある。
[0075]
 図26は、図6乃至図9を用いて説明した、パーシステントホモロジを用いる方法で抽出された特徴量(すなわちベッチ数の系列)を示す図である。図26に示したグラフの左半分は0次についてのベッチ数のグラフであり、図26に示したグラフの右半分は1次についてのベッチ数のグラフである。横軸は半径を表し、縦軸はベッチ数を表す。図26に示したグラフにおいて、実線の形状と破線の形状とは異なるが、実線と点線とがほぼ重なっている。従って、図26に示した特徴量に基づき分類を実行すると、ウエハw1とウエハw2とが同じクラスに分類される可能性がある。
[0076]
 図27乃至図29は、本実施の形態の方法により生成された特徴画像を示す図である。図27はウエハw1の特徴画像を示す図であり、図28はウエハw2の特徴画像を示す図であり、図29はウエハw3の特徴画像を示す図である。ウエハw1の特徴画像とウエハw2の特徴画像とを比較すると、白い領域の濃さに相違がある。また、ウエハw1の特徴画像とウエハw3の特徴画像とを比較すると、白い領域の形状に相違がある。従って、本実施の形態の方法により生成された特徴画像に基づき分類を実行すれば、ウエハw1をウエハw2及びウエハw3とは別のクラスに分類できる可能性がある。
[0077]
 以上本発明の一実施の形態を説明したが、本発明はこれに限定されるものではない。例えば、上で説明した情報処理装置1の機能ブロック構成は実際のプログラムモジュール構成に一致しない場合もある。
[0078]
 また、上で説明したデータ構成は一例であって、上記のような構成でなければならないわけではない。さらに、処理フローにおいても、処理結果が変わらなければ処理の順番を入れ替えることも可能である。さらに、並列に実行させるようにしても良い。
[0079]
 なお、各分布パターンには、ICチップの製造工程固有の原因で発生するシステマチック欠陥とは異なるランダム欠陥が存在するが、本実施の形態において対象とされる欠陥はシステマチック欠陥である。
[0080]
 なお、上で述べた情報処理装置1は、コンピュータ装置であって、図30に示すように、メモリ2501とCPU2503とHDD2505と表示装置2509に接続される表示制御部2507とリムーバブル・ディスク2511用のドライブ装置2513と入力装置2515とネットワークに接続するための通信制御部2517とがバス2519で接続されている。オペレーティング・システム(OS:Operating System)及び本実施例における処理を実施するためのアプリケーション・プログラムは、HDD2505に格納されており、CPU2503により実行される際にはHDD2505からメモリ2501に読み出される。CPU2503は、アプリケーション・プログラムの処理内容に応じて表示制御部2507、通信制御部2517、ドライブ装置2513を制御して、所定の動作を行わせる。また、処理途中のデータについては、主としてメモリ2501に格納されるが、HDD2505に格納されるようにしてもよい。本発明の実施例では、上で述べた処理を実施するためのアプリケーション・プログラムはコンピュータ読み取り可能なリムーバブル・ディスク2511に格納されて頒布され、ドライブ装置2513からHDD2505にインストールされる。インターネットなどのネットワーク及び通信制御部2517を経由して、HDD2505にインストールされる場合もある。このようなコンピュータ装置は、上で述べたCPU2503、メモリ2501などのハードウエアとOS及びアプリケーション・プログラムなどのプログラムとが有機的に協働することにより、上で述べたような各種機能を実現する。
[0081]
 以上述べた本発明の実施の形態をまとめると、以下のようになる。
[0082]
 本実施の形態の第1の態様に係るデータ生成方法は、(A)複数のウエハそれぞれについて、当該ウエハの欠陥位置の情報(例えばマップデータ)を用いて、当該ウエハ上の欠陥ごとに、当該ウエハ上の位置(例えばx座標およびy座標)、および、当該ウエハの中心からの距離と寄与パラメータとから算出される値を含む拡張座標を生成し、(B)複数のウエハそれぞれについて、生成された複数の拡張座標に対するパーシステントホモロジ処理によりベッチ数系列(例えば拡張ベクトル)を生成し、(C)複数のウエハそれぞれについて、寄与パラメータの複数の値に対し生成した複数のベッチ数系列から、欠陥パターン画像(例えば特徴画像)を生成し、(D)複数のウエハについて生成された複数の欠陥パターン画像と、複数のウエハに対応付けられた判別情報とを対応付けた機械学習データを生成する処理を含む。
[0083]
 ウエハの欠陥位置の情報が、分類に適した欠陥パターン画像に変換されるようになる。
[0084]
 また、欠陥パターン画像を生成する処理において、(c1)複数のベッチ数系列を寄与パラメータの値の順に結合することで欠陥パターン画像を生成してもよい。
[0085]
 ウエハの中心からの距離およびウエハの中心からの向きが反映された欠陥パターン画像を生成できるようになる。
[0086]
 また、ベッチ数系列を生成する処理において、(b1)生成された複数の拡張座標に対するパーシステントホモロジ処理により生成された各次元のベッチ数の時系列データを連結することで、ベッチ数系列を生成してもよい。
[0087]
 複数の拡張座標の位置関係の情報がベッチ数の系列に適切に反映されるようになる。
[0088]
 また、ウエハ上の位置を表す値は、第1軸の値と当該第1軸と直交する第2軸の値とを含み、中心からの距離および寄与パラメータの値から算出される値は、中心のからの距離を表す値に寄与パラメータの値を乗じた値であって且つ第1軸および第2軸と直交する第3軸上の値であってもよい。
[0089]
 また、判別情報はラベルであってもよい。
[0090]
 本実施の形態の第2の態様に係るデータ生成装置は、(E)複数のウエハそれぞれについて、当該ウエハの欠陥位置の情報を用いて、当該ウエハ上の欠陥ごとに、当該ウエハ上の位置、および、当該ウエハの中心からの距離と寄与パラメータとから算出される値を含む拡張座標を生成し、複数のウエハそれぞれについて、生成された複数の拡張座標に対するパーシステントホモロジ処理によりベッチ数系列を生成し、複数のウエハそれぞれについて、寄与パラメータの複数の値に対し生成した複数のベッチ数系列から、欠陥パターン画像を生成する第1生成部(実施の形態における画像生成部103は、第1生成部の一例である)と、(F)複数のウエハについて生成された複数の欠陥パターン画像と、複数のウエハに対応付けられた判別情報とを対応付けた機械学習データを生成する第2生成部(実施の形態における機械学習部109は、第2生成部の一例である)とを有する。
[0091]
 なお、上記方法による処理をプロセッサに行わせるためのプログラムを作成することができ、当該プログラムは、例えばフレキシブルディスク、CD-ROM、光磁気ディスク、半導体メモリ、ハードディスク等のコンピュータ読み取り可能な記憶媒体又は記憶装置に格納される。尚、中間的な処理結果はメインメモリ等の記憶装置に一時保管される。
[0092]
 以上の実施例を含む実施形態に関し、さらに以下の付記を開示する。
[0093]
(付記1)
 コンピュータに、
 複数のウエハそれぞれについて、当該ウエハの欠陥位置の情報を用いて、当該ウエハ上の欠陥ごとに、当該ウエハ上の位置、および、当該ウエハの中心からの距離と寄与パラメータとから算出される値を含む拡張座標を生成し、
 前記複数のウエハそれぞれについて、生成された複数の拡張座標に対するパーシステントホモロジ処理によりベッチ数系列を生成し、
 前記複数のウエハそれぞれについて、前記寄与パラメータの複数の値に対し生成した複数のベッチ数系列から、欠陥パターン画像を生成し、
 前記複数のウエハについて生成された複数の欠陥パターン画像と、前記複数のウエハに対応付けられた判別情報とを対応付けた機械学習データを生成する、
 処理を実行させるデータ生成プログラム。
[0094]
(付記2)
 前記欠陥パターン画像を生成する処理において、
 前記複数のベッチ数系列を前記寄与パラメータの値の順に結合することで前記欠陥パターン画像を生成する、
 付記1記載のデータ生成プログラム。
[0095]
(付記3)
 前記ベッチ数系列を生成する処理において、
 生成された前記複数の拡張座標に対するパーシステントホモロジ処理により生成された各次元のベッチ数の時系列データを連結することで、前記ベッチ数系列を生成する、
 付記1又は2記載のデータ生成プログラム。
[0096]
(付記4)
 前記ウエハ上の位置を表す値は、第1軸の値と当該第1軸と直交する第2軸の値とを含み、
 前記中心からの距離および前記寄与パラメータの値から算出される値は、前記中心のからの距離を表す値に前記寄与パラメータの値を乗じた値であって且つ前記第1軸および前記第2軸と直交する第3軸上の値である、
 付記1乃至3のいずれか1つ記載のデータ生成プログラム。
[0097]
(付記5)
 前記判別情報はラベルである、
 付記1乃至4のいずれか1つ記載のデータ生成プログラム。
[0098]
(付記6)
 コンピュータが、
 複数のウエハそれぞれについて、当該ウエハの欠陥位置の情報を用いて、当該ウエハ上の欠陥ごとに、当該ウエハ上の位置、および、当該ウエハの中心からの距離と寄与パラメータとから算出される値を含む拡張座標を生成し、
 前記複数のウエハそれぞれについて、生成された複数の拡張座標に対するパーシステントホモロジ処理によりベッチ数系列を生成し、
 前記複数のウエハそれぞれについて、前記寄与パラメータの複数の値に対し生成した複数のベッチ数系列から、欠陥パターン画像を生成し、
 前記複数のウエハについて生成された複数の欠陥パターン画像と、前記複数のウエハに対応付けられた判別情報とを対応付けた機械学習データを生成する、
 処理を実行するデータ生成方法。
[0099]
(付記7)
 複数のウエハそれぞれについて、当該ウエハの欠陥位置の情報を用いて、当該ウエハ上の欠陥ごとに、当該ウエハ上の位置、および、当該ウエハの中心からの距離と寄与パラメータとから算出される値を含む拡張座標を生成し、前記複数のウエハそれぞれについて、生成された複数の拡張座標に対するパーシステントホモロジ処理によりベッチ数系列を生成し、前記複数のウエハそれぞれについて、前記寄与パラメータの複数の値に対し生成した複数のベッチ数系列から、欠陥パターン画像を生成する第1生成部と、
 前記複数のウエハについて生成された複数の欠陥パターン画像と、前記複数のウエハに対応付けられた判別情報とを対応付けた機械学習データを生成する第2生成部と、
 を有するデータ生成装置。

符号の説明

[0100]
1 情報処理装置
101 第1マップデータ格納部  103 画像生成部
105 特徴画像格納部  107 ラベルデータ格納部
109 機械学習部  111 機械学習データ格納部
113 第2マップデータ格納部  115 分類部
117 分類結果格納部

請求の範囲

[請求項1]
 コンピュータに、
 複数のウエハそれぞれについて、当該ウエハの欠陥位置の情報を用いて、当該ウエハ上の欠陥ごとに、当該ウエハ上の位置、および、当該ウエハの中心からの距離と寄与パラメータとから算出される値を含む拡張座標を生成し、
 前記複数のウエハそれぞれについて、生成された複数の拡張座標に対するパーシステントホモロジ処理によりベッチ数系列を生成し、
 前記複数のウエハそれぞれについて、前記寄与パラメータの複数の値に対し生成した複数のベッチ数系列から、欠陥パターン画像を生成し、
 前記複数のウエハについて生成された複数の欠陥パターン画像と、前記複数のウエハに対応付けられた判別情報とを対応付けた機械学習データを生成する、
 処理を実行させるデータ生成プログラム。
[請求項2]
 前記欠陥パターン画像を生成する処理において、
 前記複数のベッチ数系列を前記寄与パラメータの値の順に結合することで前記欠陥パターン画像を生成する、
 請求項1記載のデータ生成プログラム。
[請求項3]
 前記ベッチ数系列を生成する処理において、
 生成された前記複数の拡張座標に対するパーシステントホモロジ処理により生成された各次元のベッチ数の時系列データを連結することで、前記ベッチ数系列を生成する、
 請求項1又は2記載のデータ生成プログラム。
[請求項4]
 前記ウエハ上の位置を表す値は、第1軸の値と当該第1軸と直交する第2軸の値とを含み、
 前記中心からの距離および前記寄与パラメータの値から算出される値は、前記中心のからの距離を表す値に前記寄与パラメータの値を乗じた値であって且つ前記第1軸および前記第2軸と直交する第3軸上の値である、
 請求項1乃至3のいずれか1つ記載のデータ生成プログラム。
[請求項5]
 前記判別情報はラベルである、
 請求項1乃至4のいずれか1つ記載のデータ生成プログラム。
[請求項6]
 コンピュータが、
 複数のウエハそれぞれについて、当該ウエハの欠陥位置の情報を用いて、当該ウエハ上の欠陥ごとに、当該ウエハ上の位置、および、当該ウエハの中心からの距離と寄与パラメータとから算出される値を含む拡張座標を生成し、
 前記複数のウエハそれぞれについて、生成された複数の拡張座標に対するパーシステントホモロジ処理によりベッチ数系列を生成し、
 前記複数のウエハそれぞれについて、前記寄与パラメータの複数の値に対し生成した複数のベッチ数系列から、欠陥パターン画像を生成し、
 前記複数のウエハについて生成された複数の欠陥パターン画像と、前記複数のウエハに対応付けられた判別情報とを対応付けた機械学習データを生成する、
 処理を実行するデータ生成方法。
[請求項7]
 複数のウエハそれぞれについて、当該ウエハの欠陥位置の情報を用いて、当該ウエハ上の欠陥ごとに、当該ウエハ上の位置、および、当該ウエハの中心からの距離と寄与パラメータとから算出される値を含む拡張座標を生成し、前記複数のウエハそれぞれについて、生成された複数の拡張座標に対するパーシステントホモロジ処理によりベッチ数系列を生成し、前記複数のウエハそれぞれについて、前記寄与パラメータの複数の値に対し生成した複数のベッチ数系列から、欠陥パターン画像を生成する第1生成部と、
 前記複数のウエハについて生成された複数の欠陥パターン画像と、前記複数のウエハに対応付けられた判別情報とを対応付けた機械学習データを生成する第2生成部と、
 を有するデータ生成装置。

図面

[ 図 1]

[ 図 2]

[ 図 3]

[ 図 4]

[ 図 5]

[ 図 6]

[ 図 7]

[ 図 8]

[ 図 9]

[ 図 10]

[ 図 11]

[ 図 12]

[ 図 13]

[ 図 14]

[ 図 15]

[ 図 16]

[ 図 17]

[ 図 18]

[ 図 19]

[ 図 20]

[ 図 21]

[ 図 22]

[ 図 23]

[ 図 24]

[ 図 25]

[ 図 26]

[ 図 27]

[ 図 28]

[ 図 29]

[ 図 30]