処理中

しばらくお待ちください...

設定

設定

出願の表示

1. WO2020194751 - 数値制御装置、放電加工装置および放電加工方法

Document

明 細 書

発明の名称 数値制御装置、放電加工装置および放電加工方法

技術分野

0001  

背景技術

0002  

先行技術文献

特許文献

0003  

発明の概要

発明が解決しようとする課題

0004   0005  

課題を解決するための手段

0006  

発明の効果

0007  

図面の簡単な説明

0008  

発明を実施するための形態

0009   0010   0011   0012   0013   0014   0015   0016   0017   0018   0019   0020   0021   0022   0023   0024   0025   0026   0027   0028   0029   0030   0031   0032   0033   0034   0035   0036   0037   0038   0039   0040   0041   0042   0043   0044   0045   0046   0047   0048   0049   0050   0051   0052   0053   0054  

符号の説明

0055  

請求の範囲

1   2   3   4   5   6   7  

図面

1   2   3   4   5   6   7   8   9  

明 細 書

発明の名称 : 数値制御装置、放電加工装置および放電加工方法

技術分野

[0001]
 本発明は、放電加工装置を制御する数値制御装置、放電加工装置および放電加工方法に関する。

背景技術

[0002]
 放電加工装置は、被加工物と加工電極との間隙において放電を発生させることによって被加工物を加工する。放電加工装置を制御する数値制御装置は、安定した加工を行うために、被加工物と加工電極との距離である極間距離を一定に保つように、被加工物と加工電極との相対速度を制御する。特許文献1には、加工中の放電状態の検出結果をフィードバック信号とすることによって被加工物と加工電極との相対移動のための駆動軸を制御する放電加工装置が開示されている。特許文献1にかかる放電加工装置は、被加工物と加工電極との間に印加される極間電圧を測定した結果に基づいて放電状態を検出する。

先行技術文献

特許文献

[0003]
特許文献1 : 特開平9-11043号公報

発明の概要

発明が解決しようとする課題

[0004]
 放電加工において、被加工物のうち加工電極と対向する面である加工面は、加工の進行によって加工電極から離れる方向へ移動していく。極間電圧と極間距離とは互いに相関するため、高い周波数の放電を発生させるための最良の極間距離よりも実際の極間距離が長くなると、最良の極間距離であるときの極間電圧を表す指令値と、極間電圧の測定結果とに差が生じる。上記特許文献1に記載される従来技術のようにフィードバックのみによって被加工物と加工電極との相対速度を制御する場合、数値制御装置は、指令値と極間電圧の測定結果との差分が検出されることによって、被加工物と加工電極との相対速度を変化させる指令を発生させる。この場合、数値制御装置は、実際の極間距離が最良の極間距離から変化しない限り、相対速度を変化させる指令を発生させない。実際の極間距離が最良の極間距離と同じであるときには、極間距離の維持のための制御出力がゼロになるため、加工電極からの加工面の後退といった極間距離の変化が生じることになる。放電加工装置は、最良の極間距離が維持されないことにより、高い周波数の放電発生を維持することが困難となる。このように、従来技術によると、数値制御装置は、高い周波数の放電発生の維持によって速い加工速度での放電加工を放電加工装置に行わせることが困難であるという課題があった。
[0005]
 本発明は、上記に鑑みてなされたものであって、高い周波数の放電発生の維持によって速い加工速度での放電加工を放電加工装置に行わせることを可能とする数値制御装置を得ることを目的とする。

課題を解決するための手段

[0006]
 上述した課題を解決し、目的を達成するために、本発明にかかる数値制御装置は、加工電極と被加工物との間隙において放電を発生させることにより被加工物を加工する放電加工装置における加工電極と被加工物との相対速度を制御する。本発明にかかる数値制御装置は、放電の状態を検出して、被加工物のうち加工電極と対向する面である加工面が加工の進行によって加工電極から離れる方向へ移動する移動速度を放電の状態の検出結果に基づいて推定する加工面移動速度推定部と、移動速度の推定値に基づいて、相対速度の指令値であって移動速度を補償する速度指令値を算出する速度指令値補償部と、を備える。

発明の効果

[0007]
 本発明にかかる数値制御装置は、高い周波数の放電発生の維持によって速い加工速度での放電加工を放電加工装置に行わせることができるという効果を奏する。

図面の簡単な説明

[0008]
[図1] 本発明の実施の形態1にかかる数値制御装置を有する放電加工装置の概略構成を示す図
[図2] 図1に示す放電加工装置の機能構成を示すブロック図
[図3] 図2に示す数値制御装置の動作手順を示すフローチャート
[図4] 図2に示す数値制御装置が有する係数設定部における係数の設定例についての説明図
[図5] 実施の形態1にかかる数値制御装置のハードウェア構成の例を示す第1の図
[図6] 実施の形態1にかかる数値制御装置のハードウェア構成の例を示す第2の図
[図7] 本発明の実施の形態2にかかるNC装置が有する加工面移動速度推定部の機能構成を示すブロック図
[図8] 図7に示す加工面移動速度推定部が有する機械学習装置の機能構成を示すブロック図
[図9] 実施の形態2にかかる強化学習を用いた機械学習装置の動作フローを示すフローチャート

発明を実施するための形態

[0009]
 以下に、本発明の実施の形態にかかる数値制御装置、放電加工装置および放電加工方法を図面に基づいて詳細に説明する。なお、この実施の形態によりこの発明が限定されるものではない。以下の説明では、数値制御装置をNC(Numerical Control)装置と称することがある。
[0010]
実施の形態1.
 図1は、本発明の実施の形態1にかかる数値制御装置を有する放電加工装置の概略構成を示す図である。図1に示す放電加工装置100は、形彫放電加工装置である。放電加工装置100は、加工電極4と被加工物5との間隙において放電を発生させることによって被加工物5を加工する。NC装置1は、放電加工装置100を制御する。
[0011]
 加工部2は、放電加工装置100のうち放電加工が行われている部分であって、加工電極4と被加工物5とを相対移動させるための軸駆動部とを有する。実施の形態1では、軸駆動部は、被加工物5に対して加工電極4を移動させる。NC装置1は、サーボアンプ8へ位置指令を出力することによって、サーボアンプ8を制御する。サーボアンプ8は、NC装置1が出力する位置指令にしたがって軸駆動部を動作させる。軸駆動部は、加工電極4を移動させる。図1では、軸駆動部の図示を省略する。なお、加工部2は、被加工物5を移動させる軸駆動部を有しても良い。
[0012]
 加工電源3は、NC装置1が出力する電源指令にしたがって、加工電極4と被加工物5との間にパルス電圧を印加する。極間電圧測定器6は、加工電極4と被加工物5との間に印加される極間電圧を測定する。電流計7は、加工電源3から供給される電流を測定する。
[0013]
 加工面5aは、被加工物5のうち加工電極4の先端と対向する面であって、加工が行われている面である。加工面5aは、加工の進行によって、加工電極4から離れる方向へ移動する。以下の説明では、加工の進行によって加工面5aが加工電極4から離れる方向を、加工方向と称することがある。加工面5aは、加工方向とは逆の方向において加工電極4と対向する。
[0014]
 図2は、図1に示す放電加工装置の機能構成を示すブロック図である。図2には、放電加工装置100のうち加工電極4と被加工物5との相対速度を制御するための構成を示している。サーボアンプ8は、NC装置1から出力される位置指令値23にしたがって上記軸駆動部を動作させる。
[0015]
 実施の形態1にかかるNC装置1は、極間電圧によるフィードバック制御のためのフィードバック速度指令演算部12に加えて、加工面移動速度推定部20を有することを特徴とする。加工面移動速度推定部20は、放電の状態を検出して、加工方向へ加工面5aが移動する移動速度を放電の状態の検出結果24に基づいて推定する。加工面移動速度推定部20の詳細については後述する。
[0016]
 極間電圧測定器6は、極間電圧の測定結果である測定値26をNC装置1へ出力する。電流計7は、電流の測定値30をNC装置1へ出力する。ユーザは、加工条件表を参照することにより、NC装置1へ極間電圧指令値21を入力する。極間電圧指令値21は、加工電極4と被加工物5との間に印加される極間電圧の指令値である。極間電圧と極間距離とは互いに相関する。極間電圧指令値21は、極間電圧が最良の極間距離であるときの極間電圧の値である。測定値26は、実際の極間電圧に対応する。差分器11は、NC装置1へ入力される極間電圧指令値21と測定値26との差分29を算出し、差分29をフィードバック速度指令演算部12へ出力する。フィードバック速度指令演算部12は、差分29に基づいてフィードバック制御量22を生成する。フィードバック速度指令演算部12は、生成されたフィードバック制御量22を加算器13へ出力する。加算器13は、加工面5aの移動速度の推定値27に基づいて、加工電極4と被加工物5との相対速度の指令値であって加工面5aの移動速度を補償する速度指令値28を算出する速度指令値補償部として機能する。
[0017]
 ここで、放電加工によって被加工物5から除去される部分の体積を除去体積とし、単位時間当たりの除去体積を除去体積速度とする。加工面5aの移動速度は、除去体積速度を加工面5aの面積で除算した結果に相当する。除去体積速度は、放電のために投入される加工エネルギーを放電パルス周波数に乗算することによって推定できる。加工面移動速度推定部20は、放電の状態を検出し、放電の状態の検出結果24へ係数25を乗算することによって、除去体積速度の推定および加工面5aの移動速度の推定に相当する処理を行う。これにより、加工面移動速度推定部20は、加工面5aの移動速度を推定する。
[0018]
 加工面移動速度推定部20は、放電の状態を検出する放電状態検出部15と、放電の状態の検出結果24に乗算される係数25を設定する係数設定部16と、放電の状態の検出結果24に係数25を乗算する乗算器17とを有する。
[0019]
 放電状態検出部15は、電流計7から取得された測定値30の推移を基に、放電によって電流が流れた回数をカウントする。放電状態検出部15は、電流が流れた回数をカウントすることによって、放電が発生した回数である放電パルス周波数を検出する。放電状態検出部15は、放電パルス周波数を検出することによって、放電の状態を検出する。放電状態検出部15は、放電パルス周波数の検出結果24を乗算器17へ出力する。
[0020]
 放電パルス周波数は加工面5aの移動速度との相関を有する情報であることから、加工面移動速度推定部20は、放電パルス周波数を基に移動速度を推定することによって、推定精度の向上が可能となる。なお、放電状態検出部15は、極間電圧測定器6によって測定された測定値26の推移を基に、放電パルス周波数を検出しても良い。放電状態検出部15は、放電パルスの印加中に電圧が降下した回数をカウントすることによって放電パルス周波数を検出することができる。
[0021]
 係数設定部16は、あらかじめ設定された係数25を出力する。係数25には、任意の値が設定される。例を挙げると、係数25には、加工条件にて設定される放電1つ当たりの加工エネルギーと加工電極4のうち加工面5aと対向する面の面積とが加味される。加工エネルギーが係数25に加味されていることで、加工面移動速度推定部20は、放電パルス周波数への係数25の乗算によって、除去体積速度の推定に相当する処理を行うことができる。さらに、加工電極4のうち加工面5aと対向する面の面積が係数25に加味されていることで、加工面移動速度推定部20は、除去体積速度の推定結果からの加工面5aの移動速度の推定に相当する処理を行うことができる。係数設定部16は、乗算器17へ係数25を出力する。
[0022]
 乗算器17は、検出結果24へ係数25を乗算することによって、加工面5aの移動速度の推定値27を算出する。乗算器17は、算出された推定値27を加算器13へ出力する。加算器13は、乗算器17から入力された推定値27をフィードバック制御量22に加算することによって、推定値27が補償された速度指令値28を算出する。加算器13は、算出された速度指令値28を積分器14へ出力する。積分器14は、速度指令値28を積分することによって、加工電極4と被加工物5との相対位置を変化させるための位置指令値23を生成する。積分器14は、生成された位置指令値23をサーボアンプ8へ出力する。積分器14は、速度指令値28に基づいて位置指令値23を算出する位置指令値算出部として機能する。
[0023]
 係数設定部16に設定される係数25は、放電1回当たりの加工エネルギーまたは加工電極4のうち加工面5aと対向する面の面積に基づいて設定されるものに限られない。係数25は、放電加工に関する種々の情報であって、加工面5aの移動速度へ影響を及ぼし得る情報に基づいて設定されることができる。係数25は、加工電極4および被加工物5の間に印加される放電パルスの極性、放電パルスの幅といった情報に基づいて設定されても良い。係数25は、NC装置1のユーザによって設定される。係数25は、放電加工装置100による試し加工によって得られた加工モデルに基づいて設定されても良い。
[0024]
 図3は、図2に示す数値制御装置の動作手順を示すフローチャートである。ステップS1において、放電状態検出部15は、放電パルス周波数を検出する。放電状態検出部15は、放電パルス周波数の検出結果24を乗算器17へ出力する。係数設定部16は、設定された係数25を乗算器17へ出力する。ステップS2において、乗算器17は、放電パルス周波数の検出結果24に係数25を乗算することによって推定値27を算出する。乗算器17は、推定値27を加算器13へ出力する。ステップS1およびステップS2により、加工面移動速度推定部20は、加工面5aの移動速度を推定する。
[0025]
 ステップS3において、加算器13は、フィードバック制御量22に推定値27を加算することによって、加工面5aの移動速度を補償する速度指令値28を生成する。加算器13は、速度指令値28を積分器14へ出力する。ステップS4において、積分器14は、速度指令値28を積分することにより、位置指令値23を算出する。積分器14は、サーボアンプ8へ位置指令値23を出力する。これにより、NC装置1は、図3に示す手順による動作を終了する。
[0026]
 係数設定部16は、あらかじめ設定された係数25を保持する以外に、加工時に取得された情報に基づいて係数25を設定しても良い。図4は、図2に示す数値制御装置が有する係数設定部における係数の設定例についての説明図である。図4には、放電が発生したときに加工電極4と被加工物5との間に流れる電流の波形を示している。係数設定部16は、電流計7によって測定された測定値30を取得することができる。
[0027]
 係数設定部16は、測定値30を時間で積分することによって放電1回当たりの加工エネルギーを求める。図4においてハッチングを付した部分の面積は、放電1回当たりの加工エネルギーを表している。放電1回当たりの加工エネルギーに放電パルス周波数を乗算した結果が全加工エネルギーとなる。全加工エネルギーは、除去体積と高い相関を有する。単位時間当たりの加工エネルギーが算出されると、事前に測定された加工エネルギーと除去体積との関係とに基づいて、除去体積速度が推定できる。また、除去体積速度と対向面積とを基に、加工面5aの移動速度が推定できる。放電の状態の検出結果24に乗算される係数25が全加工エネルギーに基づいて設定されることによって、加工面移動速度推定部20は、加工面5aの移動速度を推定することができる。係数25は、全加工エネルギー以外に加工時において取得された情報に基づいて設定されても良い。
[0028]
 放電状態検出部15は、放電パルス周波数を検出することによって放電の状態の検出するものに限られない。放電状態検出部15は、放電によって発生する光、あるいは放電によって発生する音を検出することによって放電の状態を検出しても良い。放電状態検出部15は、放電の大きさにしたがって変化する光量あるいは音量といった状態量を検出することによって、放電の状態を検出することができる。放電加工装置100は、形彫放電加工装置に限られず、ワイヤ放電加工装置であっても良い。
[0029]
 次に、NC装置1が有するハードウェア構成について説明する。NC装置1が有する機能は、処理回路を使用して実現される。処理回路は、NC装置1に搭載される専用のハードウェアである。処理回路は、メモリに格納されるプログラムを実行するプロセッサであっても良い。
[0030]
 図5は、実施の形態1にかかる数値制御装置のハードウェア構成の例を示す第1の図である。図5には、NC装置1の機能が専用のハードウェアを使用して実現される場合におけるハードウェア構成を示している。NC装置1は、各種処理を実行する処理回路51と、NC装置1の外部の機器との接続あるいは情報の入出力のためのインタフェース52とを備える。処理回路51とインタフェース52とは、バスを介して相互に接続されている。
[0031]
 専用のハードウェアである処理回路51は、単一回路、複合回路、プログラム化されたプロセッサ、並列プログラム化したプロセッサ、ASIC(Application Specific Integrated Circuit)、FPGA(Field-Programmable Gate Array)、又はこれらの組み合わせである。図2に示す差分器11、フィードバック速度指令演算部12、加算器13、積分器14および加工面移動速度推定部20の各機能は、処理回路51を用いて実現される。
[0032]
 図6は、実施の形態1にかかる数値制御装置のハードウェア構成の例を示す第2の図である。図6には、NC装置1の機能がプログラムを実行するハードウェアを用いて実現される場合におけるハードウェア構成を示している。インタフェース52とプロセッサ53とメモリ54は、バスを介して相互に接続されている。
[0033]
 プロセッサ53は、CPU(Central Processing Unit)、処理装置、演算装置、マイクロプロセッサ、マイクロコンピュータ、又はDSP(Digital Signal Processor)である。図2に示す差分器11、フィードバック速度指令演算部12、加算器13、積分器14および加工面移動速度推定部20の各機能は、プロセッサ53と、ソフトウェア、ファームウェア、またはソフトウェアとファームウェアとの組み合わせによって実現される。ソフトウェアまたはファームウェアは、プログラムとして記述され、内蔵メモリであるメモリ54に格納される。メモリ54は、不揮発性もしくは揮発性の半導体メモリであって、RAM(Random Access Memory)、ROM(Read Only Memory)、フラッシュメモリ、EPROM(Erasable Programmable Read Only Memory)またはEEPROM(登録商標)(Electrically Erasable Programmable Read Only Memory)である。
[0034]
 実施の形態1によると、NC装置1は、加工方向における加工面5aの移動速度を放電の状態の検出結果24に基づいて推定して、移動速度の推定値27に基づいて、移動速度を補償する速度指令値28を算出する。これにより、NC装置1は、加工方向への加工面5aの移動速度を相殺可能な速度指令値28を得ることができる。加工面5aの移動速度を補償する速度指令値28をNC装置1が算出することによって、放電加工装置100は、最良の極間距離を維持可能とし、高い放電パルス周波数を維持しながら加工を進めることができる。これにより、NC装置1は、高い周波数の放電発生の維持によって速い加工速度での放電加工を放電加工装置100に行わせることができるという効果を奏する。
[0035]
実施の形態2.
 図7は、本発明の実施の形態2にかかるNC装置が有する加工面移動速度推定部の機能構成を示すブロック図である。実施の形態2にかかるNC装置1は、実施の形態1にかかる係数設定部16に代えて、係数25を算出する係数算出部61を有する。係数算出部61は、機械学習装置62と意思決定部63とを有する。実施の形態2では、上記の実施の形態1と同一の構成要素には同一の符号を付し、実施の形態1とは異なる構成について主に説明する。
[0036]
 機械学習装置62は、加工面5aの移動速度を補償可能とする位置指令値23を得るための係数25を学習する。意思決定部63は、機械学習装置62が学習した結果に基づいて係数25を決定する。放電状態検出部15は、放電パルス周波数の検出結果24を乗算器17と機械学習装置62とへ出力する。係数算出部61は、意思決定部63において係数25を決定することによって、係数25を算出する。係数算出部61は、算出された係数25を乗算器17へ出力する。また、図2に示す差分器11は、フィードバック速度指令演算部12と機械学習装置62とへ差分29を出力する。積分器14は、サーボアンプ8と機械学習装置62とへ位置指令値23を出力する。
[0037]
 図8は、図7に示す加工面移動速度推定部が有する機械学習装置の機能構成を示すブロック図である。機械学習装置62は、状態観測部64と学習部65とを有する。状態観測部64は、放電パルス周波数の検出結果24と位置指令値23と差分29とを、状態変数として観測する。学習部65は、状態変数に基づいて作成される訓練データセットに従って、移動速度を補償可能とする位置指令値23を得るための係数25を学習する。
[0038]
 学習部65が用いる学習アルゴリズムはどのようなものを用いてもよい。一例として、強化学習(Reinforcement Learning)を適用した場合について説明する。強化学習は、ある環境内におけるエージェントである行動主体が、現在の状態を観測し、取るべき行動を決定する、というものである。エージェントは行動を選択することで環境から報酬を得て、一連の行動を通じて報酬が最も多く得られるような方策を学習する。強化学習の代表的な手法として、Q学習(Q-learning)およびTD学習(TD-learning)などが知られている。例えば、Q学習の場合、行動価値関数Q(s,a)の一般的な更新式である行動価値テーブルは、次の式(1)で表される。行動価値関数Q(s,a)は、環境「s」のもとで行動「a」を選択する行動の価値である行動価値Qを表す。
[0039]
[数1]


[0040]
 上記の式(1)において、「s t+1」は、時刻「t」における環境を表す。「a 」は、時刻「t」における行動を表す。行動「a 」によって、環境は「s t+1」に変わる。「r t+1」は、その環境の変化によってもらえる報酬を表す。「γ」は、割引率を表す。「α」は、学習係数を表す。Q学習を適用した場合、位置指令値23が行動「a 」となる。
[0041]
 上記の式(1)により表される更新式は、時刻「t+1」における最良の行動「a」の行動価値が、時刻「t」において実行された行動「a」の行動価値Qよりも大きければ、行動価値Qを大きくし、逆の場合は、行動価値Qを小さくする。換言すれば、時刻「t」における行動「a」の行動価値Qを、時刻「t+1」における最良の行動価値に近づけるように、行動価値関数Q(s,a)を更新する。それにより、或る環境における最良の行動価値が、それ以前の環境における行動価値に順次伝播していくようになる。
[0042]
 学習部65は、報酬計算部66と関数更新部67とを有する。報酬計算部66は、状態変数に基づいて報酬を計算する。関数更新部67は、報酬計算部66によって計算される報酬に従って、係数25を決定するための関数を更新する。
[0043]
 報酬計算部66は、差分29の絶対値を検出する。報酬計算部66は、差分29の絶対値の変化に基づいて報酬「r」を計算する。例えば、位置指令値23を変更した結果、差分29の絶対値が小さくなる場合、報酬計算部66は、報酬「r」を増大させる。報酬計算部66は、報酬の値である「1」を与えることによって報酬「r」を増大させる。なお、報酬の値は「1」に限られない。また、位置指令値23を変更した結果、差分29の絶対値が大きくなる場合には、報酬計算部66は、報酬「r」を低減する。報酬計算部66は、報酬の値である「-1」を与えることによって報酬「r」を低減する。なお、報酬の値は「-1」に限られない。
[0044]
 関数更新部67は、報酬計算部66によって計算される報酬に従って、係数25を決定するための関数を更新する。関数の更新は、訓練データセットに従って、例えば行動価値テーブルを更新することによって行うことができる。行動価値テーブルは、任意の行動と、その行動価値とを関連付けてテーブルの形式で記憶したデータセットである。例えばQ学習の場合、上記の式(1)により表される行動価値関数Q(s ,a )を係数25の算出のための関数として用いる。
[0045]
 図9は、実施の形態2にかかる強化学習を用いた機械学習装置の動作フローを示すフローチャートである。図9のフローチャートを参照して、行動価値関数Q(s,a)を更新する強化学習方法について説明する。
[0046]
 ステップS11において、状態観測部64は、状態変数を取得する。状態変数は、検出結果24である放電パルス周波数と、位置指令値23と、差分29とである。ステップS12において、報酬計算部66は、位置指令値23を変更させたことによる差分29の絶対値の変化を検出する。
[0047]
 ステップS13において、報酬計算部66は、差分29の絶対値の変化に基づいて報酬「r」を算出する。ステップS14において、関数更新部67は、ステップS13において算出された報酬「r」に基づいて行動価値関数Q(s,a)を更新する。関数更新部67は、上記の式(1)に従って行動価値関数Q(s,a)を更新する。
[0048]
 ステップS15において、関数更新部67は、行動価値関数Q(s,a)が収束したか否かを判定する。関数更新部67は、ステップS14における行動価値関数Q(s,a)の更新が行われなくなることによって行動価値関数Q(s,a)が収束したと判定する。
[0049]
 行動価値関数Q(s,a)が収束していないと判定された場合(ステップS15,No)、機械学習装置62は、動作手順をステップS11へ戻す。行動価値関数Q(s,a)が収束したと判定された場合(ステップS15,Yes)、学習部65による学習が終了する。これにより、機械学習装置62は、図9に示す手順による動作を終了する。なお、機械学習装置62は、ステップS15による判定を行わず、ステップS14からステップS11へ動作手順を戻すことによって学習を継続させることとしても良い。
[0050]
 意思決定部63は、学習部65による学習の結果、すなわち更新された行動価値関数Q(s,a)に基づいて、報酬が最も多く得られる係数25を選択する。乗算器17は、意思決定部63によって決定された係数25を検出結果24へ乗算することによって、推定値27を算出する。加工面移動速度推定部20は、算出された推定値27を加算器13へ出力する。NC装置1は、機械学習装置62による係数25の学習によって、加工面5aの移動速度を補償可能とする位置指令値23を得ることが可能となる。これにより、NC装置1は、高い周波数の放電発生を維持可能とする位置指令値23を得ることができる。
[0051]
 なお、報酬計算部66は、放電パルス周波数の検出結果24に基づいて報酬「r」を算出しても良い。実際の極間距離が最良の極間距離に近くなると、放電パルス周波数は大きくなる。このことから、報酬計算部66は、放電パルス周波数が大きくなる場合に報酬「r」を増大させ、放電パルス周波数が小さくなる場合には報酬「r」を低減しても良い。
[0052]
 実施の形態2では、学習部65が強化学習を利用して機械学習を実行する場合について説明した。学習部65は、他の公知の方法、例えばニューラルネットワーク、遺伝的プログラミング、機能論理プログラミング、サポートベクターマシンなどに従って機械学習を実行してもよい。
[0053]
 実施の形態2によると、NC装置1は、加工面5aの移動速度を補償可能とする位置指令値23を得るための係数25を学習する機械学習装置62を有することによって、高い周波数の放電発生を維持可能とする位置指令値23を求めることができる。これにより、NC装置1は、高い周波数の放電発生の維持によって速い加工速度での放電加工を放電加工装置100に行わせることができるという効果を奏する。
[0054]
 以上の実施の形態に示した構成は、本発明の内容の一例を示すものであり、別の公知の技術と組み合わせることも可能であるし、本発明の要旨を逸脱しない範囲で、構成の一部を省略、変更することも可能である。

符号の説明

[0055]
 1 NC装置、2 加工部、3 加工電源、4 加工電極、5 被加工物、5a 加工面、6 極間電圧測定器、7 電流計、8 サーボアンプ、11 差分器、12 フィードバック速度指令演算部、13 加算器、14 積分器、15 放電状態検出部、16 係数設定部、17 乗算器、20 加工面移動速度推定部、21 極間電圧指令値、22 フィードバック制御量、23 位置指令値、24 検出結果、25 係数、26,30 測定値、27 推定値、28 速度指令値、29 差分、51 処理回路、52 インタフェース、53 プロセッサ、54 メモリ、61 係数算出部、62 機械学習装置、63 意思決定部、64 状態観測部、65 学習部、66 報酬計算部、67 関数更新部、100 放電加工装置。

請求の範囲

[請求項1]
 加工電極と被加工物との間隙において放電を発生させることにより前記被加工物を加工する放電加工装置における前記加工電極と前記被加工物との相対速度を制御する数値制御装置であって、
 前記放電の状態を検出して、前記被加工物のうち前記加工電極と対向する面である加工面が加工の進行によって前記加工電極から離れる方向へ移動する移動速度を前記放電の状態の検出結果に基づいて推定する加工面移動速度推定部と、
 前記移動速度の推定値に基づいて、前記相対速度の指令値であって前記移動速度を補償する速度指令値を算出する速度指令値補償部と、
 を備えることを特徴とする数値制御装置。
[請求項2]
 前記加工面移動速度推定部は、前記放電の状態の検出結果に係数を乗算することによって前記推定値を求めることを特徴とする請求項1に記載の数値制御装置。
[請求項3]
 前記係数は、加工時に取得された情報に基づいて設定された係数であることを特徴とする請求項2に記載の数値制御装置。
[請求項4]
 前記加工電極と前記被加工物との間に印加される極間電圧の指令値と前記極間電圧の測定値との差分を算出する差分器と、
 前記加工電極と前記被加工物との相対位置を変化させるための位置指令値を前記速度指令値に基づいて算出する位置指令値算出部と、
 前記係数を算出する係数算出部と、を備え、
 前記係数算出部は、
 前記移動速度を補償可能とする前記位置指令値を得るための前記係数を学習する機械学習装置と、
 前記機械学習装置が学習した結果に基づいて前記係数を決定する意思決定部と、
 を有し、
 前記機械学習装置は、
 前記放電の状態の検出結果と前記位置指令値と前記差分とを状態変数として観測する状態観測部と、
 前記状態変数に基づいて作成される訓練データセットに従って前記係数を学習する学習部と、
 を有することを特徴とする請求項2に記載の数値制御装置。
[請求項5]
 前記加工面移動速度推定部は、前記放電が発生した回数を検出することによって前記放電の状態を検出し、前記回数の検出結果に基づいて前記移動速度を推定することを特徴とする請求項1から4のいずれか1つに記載の数値制御装置。
[請求項6]
 加工電極と被加工物との間隙において放電を発生させることによって前記被加工物を加工する放電加工装置であって、
 前記放電の状態を検出して、前記被加工物のうち前記加工電極と対向する面である加工面が加工の進行によって前記加工電極から離れる方向へ移動する移動速度を前記放電の状態の検出結果に基づいて推定する加工面移動速度推定部と、
 前記移動速度の推定値に基づいて、前記加工電極と前記被加工物との相対速度の指令値であって前記移動速度を補償する速度指令値を算出する速度指令値補償部と、
 を備えることを特徴とする放電加工装置。
[請求項7]
 加工電極と被加工物との間隙において放電を発生させることによって前記被加工物を加工する放電加工方法であって、
 前記放電の状態を検出して、前記被加工物のうち前記加工電極と対向する面である加工面が加工の進行によって前記加工電極から離れる方向へ移動する移動速度を前記放電の状態の検出結果に基づいて推定する工程と、
 前記移動速度の推定値に基づいて、前記加工電極と前記被加工物との相対速度の指令値であって前記移動速度を補償する速度指令値を算出する工程と、
 を含むことを特徴とする放電加工方法。

図面

[ 図 1]

[ 図 2]

[ 図 3]

[ 図 4]

[ 図 5]

[ 図 6]

[ 図 7]

[ 図 8]

[ 図 9]