Processing

Please wait...

Settings

Settings

Goto Application

1. WO2020137181 - INFORMATION PROCESSING DEVICE, INFORMATION PROCESSING METHOD, AND PROGRAM

Document

明 細 書

発明の名称 情報処理装置、情報処理方法及びプログラム

技術分野

0001  

背景技術

0002  

先行技術文献

特許文献

0003  

発明の概要

発明が解決しようとする課題

0004   0005  

課題を解決するための手段

0006   0007   0008  

図面の簡単な説明

0009  

発明を実施するための形態

0010   0011   0012   0013   0014   0015   0016   0017   0018   0019   0020   0021   0022   0023   0024   0025   0026   0027   0028   0029   0030   0031   0032   0033   0034   0035   0036   0037   0038   0039   0040   0041   0042   0043   0044   0045   0046   0047   0048   0049   0050   0051   0052   0053   0054   0055   0056   0057   0058   0059   0060   0061   0062  

符号の説明

0063  

請求の範囲

1   2   3   4   5   6   7   8   9   10   11   12   13   14   15  

図面

1   2   3   4   5  

明 細 書

発明の名称 : 情報処理装置、情報処理方法及びプログラム

技術分野

[0001]
 本開示は、情報処理装置、情報処理方法及びプログラムに関する。

背景技術

[0002]
 UAV(Unmanned aerial vehicle)と称される無人飛行体に搭載されたマイクロフォンにより、地表等に存在する物体から生じた音声を収音することが行われている。UAVで収録された音声はUAV自身が発生するモータやプロペラ等のノイズが大きいため、音声を収録する際のSN比(Signal to Noise Ratio)が大幅に悪化し得る。そこで、得られる信号のSN比を向上させる方法として、複数のマイクロフォンを用いて目的音源方向に指向性を形成する方法や、特許文献1に記載されているような、マイクロフォンをUAVのプロペラの上下に等距離で設置することにより、ノイズを推定する方法が提案されている。

先行技術文献

特許文献

[0003]
特許文献1 : 特開2017-213970号公報

発明の概要

発明が解決しようとする課題

[0004]
 しかしながら、特許文献1に記載の技術では、UAVの下方向になだらかな指向性を形成するに留まり、風切音の影響で十分にノイズを抑圧できない可能性が高くなる。また、UAVに搭載できるマイクロフォンアレイの大きさには制約があることが多く、十分な指向性を得られない虞がある。
[0005]
 本開示は、ノイズを抑圧することができる情報処理装置、情報処理方法及びプログラムを提供することを目的の一つとする。

課題を解決するための手段

[0006]
 本開示は、例えば、
 無人飛行体に搭載されたマイクロフォンにより収音された音声信号に含まれる、無人飛行体から発生するノイズを、ノイズ発生源の状況情報に基づいて抑圧するノイズ抑圧部を有する
 情報処理装置である。
[0007]
 本開示は、例えば、
 ノイズ抑圧部が、無人飛行体に搭載されたマイクロフォンにより収音された音声信号に含まれる、無人飛行体から発生するノイズを、ノイズ発生源の状況情報に基づいて抑圧する
 情報処理方法である。
[0008]
 本開示は、例えば、
 ノイズ抑圧部が、無人飛行体に搭載されたマイクロフォンにより収音された音声信号に含まれる、無人飛行体から発生するノイズを、ノイズ発生源の状況情報に基づいて抑圧する
 情報処理方法をコンピュータに実行させるプログラムである。

図面の簡単な説明

[0009]
[図1] 図1は、一実施の形態にかかるUAVの構成例を説明するためのブロック図である。
[図2] 図2は、目的音源から各UAVが有するマイクロフォンまでの伝達関数等を模式的に示す図である。
[図3] 図3は、一実施の形態における第3の処理例を説明する際に参照される図である。
[図4] 図4は、一実施の形態における第4の処理例の変形例を説明する際に参照される図である。
[図5] 図5A及び図5Bは、一実施の形態における第5の処理例の具体例を説明する際に参照される図である。

発明を実施するための形態

[0010]
 以下、本開示の実施の形態等について図面を参照しながら説明する。なお、説明は以下の順序で行う。
<一実施の形態>
<変形例>
 以下に説明する実施の形態等は本開示の好適な具体例であり、本開示の内容がこれらの実施の形態等に限定されるものではない。
[0011]
<一実施の形態>
[UAVの構成例]
 始めに、情報処理装置の一例であるUAVの構成例について説明する。UAVは、自律的若しくはユーザ制御に応じて飛行し、地表等に存在する物体から発生する音声や当該物体の映像を取得する。なお、以下に説明するUAVにより行われる処理は、パーソナルコンピュータ、タブレット型のコンピュータ、スマートフォン、サーバ装置等で行われても良い。即ち、これらの例示した電子機器が本開示における情報処理装置であっても良い。
[0012]
 図1は、一実施の形態にかかるUAV(UAV10)の構成例を説明するためのブロック図である。なお、以下の説明では、UAV10の主に音声処理にかかる構成について説明するが、UAV10が映像等を処理する公知の構成を有していても良い。
[0013]
 UAV10は、例えば、制御部101、音声信号入力部102、情報入力部103、出力部104及び通信部105を有している。
[0014]
 制御部101は、CPU(Central Processing Unit)から構成されており、UAV10全体を統括的に制御する。UAV10は、制御部101によって実行されるプログラムが格納されたROM(Read Only Memory)及びプログラムが実行される際のワークメモリとして使用されるRAM(Random Access Memory)等を有している(これらの図示は省略している。)。
[0015]
 また、制御部101は、その機能として、ノイズ抑圧部101A及び波面収録部101Bを有している。
[0016]
 ノイズ抑圧部101Aは、UAV10に搭載されたマイクロフォンにより収音された音声信号に含まれる、UAV10から発生するノイズを、ノイズ発生源の状況情報に基づいて抑圧(低減)する(ノイズリダクション)。具体的には、ノイズ抑圧部101Aは、UAV10が発生する非定常ノイズ(一定の規則性でもって発生する定常ノイズとは異なり、UAV10の状態に応じて変化するノイズを意味する)を抑圧する。
[0017]
 波面収録部101Bは、複数のUAV10のそれぞれに搭載されたマイクロフォンを使用して、複数のUAV10により囲まれた閉曲面内の波面を収録する。なお、ノイズ抑圧部101A及び波面収録部101Bのそれぞれにより行われる処理の詳細については後述する。
[0018]
 音声信号入力部102は、例えば、地表等に存在する物体(人物を含む)が発する音声を収録するマイクロフォンである。音声信号入力部102に収音された音声信号が制御部101に入力される。
[0019]
 情報入力部103は、UAV10が有するセンサから各種の情報が入力されるインターフェースである。情報入力部103に入力される情報は、例えば、ノイズ発生源の状況情報である。ノイズ発生源の状況情報としては、UAV10を駆動させる駆動機構に対する制御信号の情報や、UAV10の状況及びUAV10の周囲の状況の少なくとも一方を含む機体状況情報が含まれる。図1に示すように、駆動機構に対する制御信号の情報の具体例としては、UAV10が有するモータを駆動するためのモータ制御情報103aやUAV10のプロペラ速度を制御するためのプロペラ制御情報103bが挙げられる。機体状況情報の具体例としては、UAV10の状況を示すUAV10の機体の角度を示す機体角度情報103cや、UAV10の周囲の状況を示す気圧・高度情報104dが挙げられる。情報入力部103を介して得られた各情報が制御部101に入力される。これらの各情報は、波形データでもありスペクトルでもあり得る。
[0020]
 出力部104は、制御部101により処理された音声信号を出力するインターフェースである。出力部104から出力信号sが出力される。なお、出力信号sは、通信部105を介して、パーソナルコンピュータやサーバ装置等に送信されても良く、この場合には、通信部105が出力部104として動作する。
[0021]
 通信部105は、制御部101の制御に応じて、地表やネットワーク上に存在する機器と通信を行う構成である。通信は、有線による通信でも良いが、本実施の形態では、無線による通信を想定している。無線通信としては、LAN(Local Area Network)、Bluetooth(登録商標)、Wi-Fi(登録商標)、またはWUSB(Wireless USB)等が挙げられる。通信部105を介して、制御部101による処理がなされた音声信号が外部機器に対して送信される。また、通信部105を介して入力された信号が制御部101に入力される。
[0022]
 図1では、UAV10をコントロールするリモートコントロール装置20が示されている。リモートコントロール装置20は、例えば、制御部201、通信部202、スピーカ203及びディスプレイ204を有している。リモートコントロール装置20は、例えば、パーソナルコンピュータとして構成される。
[0023]
 リモートコントロール装置20の構成について、概略的に説明する。制御部201は、CPU等から構成されており、リモートコントロール装置20全体を統括的に制御する。通信部202は、UAV10と通信をおこなうための構成である。スピーカ203は、例えば、UAV10による処理がなされ、通信部202により受信された音声を出力する。ディスプレイ204は、各種の情報を表示する。
[0024]
[UAVで行われる処理例]
 次に、UAV10で行われる複数の処理の例について説明する。なお、複数のUAV10が関係する処理では、複数のUAV10のうちの何れか1台が、複数のUAV10のそれぞれにより得られる信号を取得した上で以下に説明する処理を行っても良いし、複数のUAV10以外の装置(例えば、リモートコントロール装置20やサーバ装置)が、複数のUAV10のそれぞれにより得られる信号を取得した上で以下に説明する処理を行っても良い。
[0025]
(第1の処理例)
 第1の処理例は、ノイズ抑圧部101Aがノイズ発生源の状況情報に基づいて、音声信号入力部102により収音された音声信号に含まれるノイズを抑圧する例である。なお、第1の処理例にかかる処理は、各UAV10が単体で行うことが可能である。
[0026]
 第1の処理例では、UAV10に搭載された音声信号入力部102、具体的にはマイクロフォンにより取得された入力音声信号に対し、ニューラルネットワークを用いて機体ノイズを分離、抑圧する。マイクロフォンは1つでも良いし、複数でも良い。入力音声信号のフーリエ変換をX(c,t,f)とすると、X(c,t,f)は、


と表すことができる。
 但し、c,t,fは、それぞれマイクチャンネル、時間フレーム、周波数インデックス、Nは機体ノイズ、S iはi番目の音源、H iはi番目の音源からマイクロフォンまでの伝達関数である。ノイズ抑圧ニューラルネットワークの学習には目的音源が存在しない状況で収録した機体ノイズNと予め測定した伝達関数を用いて人工的に学習データを生成して用いることができる。入力信号Xからターゲットとなる音源を分離するようにノイズ抑圧ニューラルネットワークを学習することができる。学習のための正解データとしては伝達関数が畳み込まれる前の音源データS i(c,t,f)、又は、マイクロフォンにより収音された信号の平均Σ I,cii(c,t,f)等を用いることができる。
[0027]
 以上は一般的な音源分離の手法であるが、UAV10の場合、SN比が非常に低いため、一般的な手法では十分な性能を得られない場合がある。この場合、UAV10に関する様々な情報を用いて性能を向上することが考えられる。ノイズは主にモータ及びプロペラの風切音に起因するところが大きい。これらはモータの回転数に相関が強いため、モータの回転数、またはモータの制御信号を用いることでより正確にノイズを推定することができる。また、制御信号を用いる場合、外力によりモータの回転数は変化する。この外力を決定する(変動する)要因として気圧、風、湿度などが考えられる。気圧を変化させる要因の一つとして高度の変化、風を発生させる要因、または風を検知する要因として本体の速度、傾きなどの情報が使える。即ち、これらのノイズ発生源の状況情報に基づく信号をニューラルネットワークの入力として同時に供給することで、より正確なノイズ除去が可能になる。
[0028]
 ニューラルネットワークの学習は、例えば以下の損失関数L θを最小化することで学習される。


 但し、Fはニューラルネットワークによって学習される関数、θはネットワークパラメータ、Ψ(t)は時間フレームtでの情報入力部103を介して得られる情報であり、ベクトル、マトリクス、スカラー量等で表される。
 学習の結果を使用した入力音声信号に対する演算がノイズ抑圧部101Aにより行われる。
[0029]
 以上説明した第1の処理例によれば、プロペラ音やモータ音の高レベルノイズ状況下(低SN比下)であっても、目的音を収録することができる。ノイズ発生源の状況情報を用いることにより、信号の先読み量を減らし、低遅延でのノイズ抑圧処理が可能となる。
[0030]
(第2の処理例)
 UAV10が複数台ある場合、各UAV10に搭載されたマイクロフォンを用いてビームフォーミングを行い、さらにSN比を改善することができる。即ち、第2の処理例では、ノイズ抑圧部101Aは、複数のUAV10のそれぞれに搭載されたマイクロフォンを使用したビームフォーミングを行うことにより、音声信号に含まれるノイズを抑圧する。
[0031]
 処理の具体的内容について説明する。例えばMVDR(Minimum variance Distortionless Response)ビームフォーマは以下の式で表される。




 上述した式におけるWはビームフォーミングのフィルタ係数であり、Wを以下に示すように適切に設定することにより目的とする方向(例えば、目的音源の方向)にビームフォーミングでき、目的音源からの信号を強調することができる。
[0032]
 ここで、


はビームフォーマの出力、


はビームフォーマの係数、


は入力音声信号、


は、収音を目的とする音源から各マイクまでの伝達関数(又はステアリングベクトル)(図2参照)


はノイズの相関行列、
Nはマイク数である。
[0033]
 マイクロフォンがUAV10自体に搭載されている場合、aは音源とUAV10の位置関係に応じて決まるため、音源やUAV10の位置の移動に応じて逐次的に求める必要がある。音源やUAV10の位置はステレオビジョンや距離センサ、画像情報やGPS(Global Positioning System)システム、超音波等の非可聴音による距離測定などを適用することができる。aは、例えば、目的音源までの距離に応じて近似的に求められる。
[0034]
 しかしながら、UAV10は空中に飛行していることから完全に正確に位置を求めることが困難である。更に、目的音源に追従する場合やユーザ操作、自律移動などによりUAV10が移動する場合、移動速度に応じてUAV10の所定の位置に対する位置推定の精度が悪化する。具体的には、移動速度が速いほど現在時刻から次の時刻での移動距離が大きくなり、位置推定誤差が大きくなる。従って、予め推定されたUAV10の位置に対する位置推定誤差を考慮してビームフォーミング処理における係数を設定することが望ましい。また、例えば音源から等距離にあるUAV10のうち静止しているUAV10は位置推定誤差が小さいため、高速移動をしているUAV10よりもビームフォーミングに寄与する重みを大きくするように、係数が決定されることが望ましい。これは例えばUAV10の位置推定に確率モデルを導入することで実現できる。
[0035]
 例えば、信号モデルを


と仮定する。
各UAV10の各マイクロフォンで収録される目的音信号を


とし、
ノイズ信号である


の確率分布をそれぞれ


とすると、
とすると混合信号の事後分布P(x|s)は、下記の式により表すことができる。


と表せる。但し、


は、UAV10の推定位置での伝達関数、Σは位置推定誤差による分散、


はノイズの空間相関行列である。
[0036]


は、自由空間(反射がない空間)を想定した場合、


と表すことができる。r iは目的音源とi番目のマイクロフォンとの距離、cは音速,Cは定数である。Σは位置推定精度や想定音量によって決まり、あらかじめ実験的に決定することができる。例えば、予備実験として外部カメラなどを用いた正確にUAV10の位置を知ることができる手法を用いて求められた伝達関数と、実際に使用するセンサ、位置情報推定アルゴリズムを用いて求めた位置情報から計算した伝達関数の差から分散を求めることができる。分散は例えば速度の関数として求めておけば、静止している際には小さな分散、高速移動している際は大きな分散値を用いることができる。ノイズに関する統計量はあらかじめ実験的に決定できる。詳しくは後述する。
[0037]
 上述した混合信号の事後分布P(x|s)を示す式に対する最小二乗解は、下記の式により求めることができる。


かかる式によりUAV10の位置の不確定性に応じてビームフォーマの係数が計算されることが分かる。また位置の不確定性がない、換言すれば、Σ=0とすると、上述した式は、MVDRビームフォーマに帰着することが分かる。
[0038]
 ノイズ信号の空間相関行列は、


と表すことができる。
nについては主にUAV10のプロペラ音やモータ音であり、Hは自由空間を想定するとUAV10間の距離のみに依存するため、あらかじめ計測が可能である。また、一般的にUAV10に搭載されたマイクロフォンと自己ノイズとの距離は数cm~数十cmであり、UAV10間の距離は数メートルあることが多い。このため、伝達関数H=[h ij]のうち対角成分h iiは非対角成分に比べて絶対値が大きくなる。また、すべてのUAV10が同じ形状の機体であるとするとh ii=h 0となり近似的にH≒h 0Iとできる。
[0039]
 従って、


と近似することができ、UAV10の位置に依存しない相関行列で近似が可能である。
なお、線形のビームフォーマ以外にも非線形なニューラルビームフォーマなどを本処理例に適用することができる。
[0040]
 上述した第2の処理例は、第1の処理例と共に行われても良い。例えば、第1の処理例でノイズ抑圧処理がなされた信号が第2の処理例における入力とされても良い。
[0041]
 以上説明した第2の処理例によれば、複数台のUAV10を用いることでより雑音レベルを少なく(高SN比で)目的音を収録できるようになる。UAV10の正確な位置がわからず、誤差を持つ場合でも、誤差の予想分散を考慮に入れて高精度にビームフォーミングを行うようにしているので、高SN比で目的音を収録できるようになる。
[0042]
(第3の処理例)
 第3の処理例は、複数台のUAV10に設置されたマイクロフォンを用いて、複数のUAV10に囲まれた閉曲面内の波面を収録する処理である。以下に示す処理例は、例えば、波面収録部101Bにより行われる。図3に示すように、複数のUAV10により囲まれた閉曲面内ARの波面を収録することを考える。但し、閉曲面内ARに収音を目的とする音源は存在しないとする。各UAV10が静止し、各UAV10の位置が正確に分かっている場合、i番目のUAV10の位置を(r i,θ i,φ i)とすると、波面を表す球面調和関数a mn(k)は変換行列M とマイクロフォンで観測される信号p kを用いて






と表すことができる。但し、kは波数、j nは球ベッセル関数、


は球面調和関数、Qはマイクロフォン数、†は疑似逆行列である。
[0043]
 実際には、UAV10の位置推定には第2の処理例で説明した理由で誤差が生じる。位置推定誤差を(Δr i,Δθ i,Δφ i)とすると、変換行列である


は、以下のように表すことができる。


[0044]
 よって、変換行列の誤差δM k


と表すことができる。
 その他のノイズnを含めて、UAV10のマイクロフォンで観測される音圧は理想状態からの誤差δpを用いて、


となる。


より誤差は


と表すことができる。
[0045]


より


となる。
[0046]
 一方、変換行列Mの条件数は、


と表すことができるから、


と表すことができる。
かかる式より、例えば再構築される音圧誤差の比がR以下であってほしい場合、条件数k(M)は、


を満たす必要がある。
例えば、


が0.5であり、


が0.01であり、
音圧誤差の比Rを0.2以下に抑えたい場合は、k(M)が3.8以下である必要がある。これを満たすために変換行列Mの逆行列計算に正則化項を加えることができる。例えば、変換行列Mを特異値分解し、固有値が


以下であるような固有値を全て0に置き換えることで正則化を行う。正則化された行列が球面調和関数を求める演算に適用される。但しσmaxは固有値の最大値である。かかる処理を行うことにより、所望の音圧誤差の変換行列を得ることができる。
[0047]




 但し、Σは固有値を大きいものから順に対角に並べた行列であり、


は、


以下の固有値に対応するΣの逆行列成分を0に置き換えた行列である。
[0048]
 なお、別の手法としてTikhonov正則化と呼ばれる手法を適応できる。これは、


としたときに、


となる最小のλを求めることで正則化を行うこと手法である。
[0049]
 第3の処理例によれば、UAV10に搭載されたマイクロフォンで、UAV10の位置が完全に正確でない場合でも、位置推定誤差を考慮することにより、安定して波面を収録することができる。
[0050]
(第4の処理例)
 第4の処理例は、上述した第2の処理例で得られるビームフォーマの係数や出力、画像情報に応じてより高いSN比が得られるようにUAV10の配置を変更する処理である。この処理は、UAV10(具体的にはUAV10の制御部101)が自律的に行っても良いし、UAV10とは異なるパーソナルコンピュータ等の制御により行われても良い。例えば、MVDRビームフォーマの場合、ビームフォーミングされたノイズ出力のエネルギーPNが下がる方向にUAV10が移動されることで、UAV10の配置が変更される。
[0051]
 ノイズのMVDRビームフォーマ出力は、


と表すことができる。自由空間、点音源を仮定するとaは、


(但し、r srcは目的音源の位置ベクトル、r iはi番目のUAV10の位置ベクトルである。)
と表すことができるので、これを最小化するように位置ベクトルrの勾配方向である


にUAV10が移動される。Rについては、第2の処理例と同様に求めることができる。
[0052]
 但し、実際には、目的音源やUAV10間の距離に制約があるため、これらの制約条件Uの下で最適な


が算出される。また、音源の放射特性をモデル化して、音や画像からモデルパラメータを求めることにより、より精度の高いSN比の最大化を行うことが可能となる。例えば、人の声は背面よりも正面方向に放射特性が強いため、図4に模式的に示すように、人物HUの顔の正面に対し強い放射特性を仮定し、画像から顔の角度θを求めることにより伝達関数への重み関数f(θ)を伝達関数に乗じて計算するようにしても良い。
[0053]
 また、波面収録部101Bの波面収録の結果に応じて、UAV10が再配置されるようにしても良い。
[0054]
 以上説明した第4の処理例によれば、高SN比で音声や波面を収録できる位置にUAV10が自動で移動することで、より高音質・低雑音な収録することができる。
[0055]
(第5の処理例)
 第5の処理例は、UAV10が複数台使用されている場合に、上述した処理により現在の台数のUAV10で十分なビームフォーミング性能を得られない又は波面収録ができない等と判断された場合、UAV10を追加する制御が行われる例である。まだ、第5の処理例は、UAV10が複数台使用されている場合に、十分なビームフォーミング性能が得られている、又は、UAV10が発するノイズが他のUAV10に対して悪影響を及ぼしている等と判断された場合、不要なUAV10を遠ざける等の制御が行われる例である。即ち、第5の処理例は、ビームフォーミングの出力を最適化したり、波面収録部101Bによる波面収録結果に基づいて、所定のエリア内に存在するUAV10の数を増減させる例である。なお、十分ではないとは、例えば、ノイズが閾値以下にならない、ノイズリダクション前後のSNの変化が閾値以下になっていない等を意味する。
[0056]
 第5の処理例の具体例について説明する。例えば、上述した勾配ベースの方法で十分なノイズ抑圧性能が得られないと判断したとき、又は、十分な波面集音性能が得られないと判断したとき、UAV10を追加するようにUAV10群を制御することができる。例えば、広範囲の収録を複数のUAV10で行うとき、無音のエリアには多くのUAV10は必要なく、他のビームフォーミングが困難な状況のエリアにUAV10を集中させることができる。ビームフォーミングが困難な状況としてはノイズが大きい場合や、安全上の理由によるUAV10の飛行禁止エリアなどの理由から遠方より収録しなければならない状況などが考えられる。
[0057]
 他の具体例について説明する。図5Aに示すように、話者HUaと話者Hubが3台のUAV10(UAV10a~UAV10c)に対して同方向にいる場合、ビームフォーミングでは音の到来方向がほぼ同じになるため分離が困難である。そのため、図5Bに示すように、新たに例えば2台のUAV10(UAV10d、10e)を話者HUa、HUbの間に配置することで二人の話者からの音の到来方向が異なる信号を得ることにより話者HUaのみの信号を取り出すことが可能となる。
[0058]
 以上説明した第5の処理例によれば、必要な目的音源周辺に多くのUAV10を配置し、不要な位置からUAV10を遠ざけることができるので、高SN比の収録を可能とすると共に、音源位置、音源数等に合わせて効率的にUAV10を運用することができる。
[0059]
<変形例>
 以上、本開示の実施の形態について説明したが、本開示は、上述した実施の形態に限定されることはなく、本開示の趣旨を逸脱しない範囲で種々の変形が可能である。
[0060]
 上述した各処理例における演算は一例であり、他の演算により各処理例における処理が実現されても良い。また、上述した各処理例における処理は、独立して行われても良いし、他の処理と共に行われても良い。また、UAVの構成も一例であり、実施の形態におけるUAVに公知の構成が追加されても良い。
[0061]
 本開示は、装置、方法、プログラム、システム等により実現することもできる。例えば、上述した実施の形態で説明した機能を行うプログラムをダウンロード可能とし、実施の形態で説明した機能を有しない装置が当該プログラムをダウンロードしてインストールすることにより、当該装置において実施の形態で説明した制御を行うことが可能となる。本開示は、このようなプログラムを配布するサーバにより実現することも可能である。また、各実施の形態、変形例で説明した事項は、適宜組み合わせることが可能である。また、本明細書で例示された効果により本開示の内容が限定して解釈されるものではない。
[0062]
 本開示は、以下の構成も採ることができる。
(1)
 無人飛行体に搭載されたマイクロフォンにより収音された音声信号に含まれる、前記無人飛行体から発生するノイズを、ノイズ発生源の状況情報に基づいて抑圧するノイズ抑圧部を有する
 情報処理装置。
(2)
 前記ノイズ発生源の状況情報には、前記無人飛行体の状況及び前記無人飛行体の周囲の状況の少なくとも一方を含む機体状況情報が含まれる
 (1)に記載の情報処理装置。
(3)
 前記ノイズ抑圧部は、複数の無人飛行体のそれぞれに搭載されたマイクロフォンを使用したビームフォーミングを行うことにより、前記音声信号に含まれるノイズを抑圧する
 (1)又は(2)に記載の情報処理装置。
(4)
 前記ノイズ抑圧部は、前記ビームフォーミング処理における係数を、前記無人飛行体の所定の位置に対する位置推定誤差を考慮して決定する
 (3)に記載の情報処理装置。
(5)
 前記ノイズ抑圧部は、各無人飛行体の移動速度に応じて、前記係数を変更する
 (4)に記載の情報処理装置。
(6)
 複数の無人飛行体のそれぞれに搭載されたマイクロフォンを使用して、前記複数の無人飛行体により囲まれた閉曲面内の波面を収録する波面収録部を有する
 (1)から(5)までの何れかに記載の情報処理装置。
(7)
 前記波面収録部は、前記閉曲面内の波面を収録するための球面調和関数の係数を、前記無人飛行体の所定の位置に対する位置推定誤差を考慮して決定する
 (6)に記載の情報処理装置。
(8)
 前記ビームフォーミングの出力が最適されるように、自身の位置が再配置される
 (3)から(7)までの何れかに記載の情報処理装置。
(9)
 前記ビームフォーミングによるノイズのエネルギーを低減する方向に、自身の位置が再配置される
 (8)に記載の情報処理装置。
(10)
 前記ビームフォーミングの出力を最適化するように、所定のエリア内における無人飛行体の数を増減させる
 (3)から(9)までの何れかに記載の情報処理装置。
(11)
 前記波面収録部による波面の収録結果に基づいて、所定のエリア内における無人飛行体の数を増減させる
 (6)に記載の情報処理装置。
(12)
 前記ノイズ抑圧部は、前記無人飛行体から発生する非定常ノイズを抑圧する
 (1)から(11)までの何れかに記載の情報処理装置。
(13)
 前記無人飛行体として構成される
 (1)から(12)までの何れかに記載の情報処理装置。
(14)
 ノイズ抑圧部が、無人飛行体に搭載されたマイクロフォンにより収音された音声信号に含まれる、前記無人飛行体から発生するノイズを、ノイズ発生源の状況情報に基づいて抑圧する
 情報処理方法。
(15)
 ノイズ抑圧部が、無人飛行体に搭載されたマイクロフォンにより収音された音声信号に含まれる、前記無人飛行体から発生するノイズを、ノイズ発生源の状況情報に基づいて抑圧する
 情報処理方法をコンピュータに実行させるプログラム。

符号の説明

[0063]
10・・・UAV、101・・・制御部、101A・・・ノイズ抑圧部、101B・・・波面収録部、102・・・音声信号入力部、103・・・情報入力部

請求の範囲

[請求項1]
 無人飛行体に搭載されたマイクロフォンにより収音された音声信号に含まれる、前記無人飛行体から発生するノイズを、ノイズ発生源の状況情報に基づいて抑圧するノイズ抑圧部を有する
 情報処理装置。
[請求項2]
 前記ノイズ発生源の状況情報には、前記無人飛行体の状況及び前記無人飛行体の周囲の状況の少なくとも一方を含む機体状況情報が含まれる
 請求項1に記載の情報処理装置。
[請求項3]
 前記ノイズ抑圧部は、複数の無人飛行体のそれぞれに搭載されたマイクロフォンを使用したビームフォーミングを行うことにより、前記音声信号に含まれるノイズを抑圧する
 請求項1に記載の情報処理装置。
[請求項4]
 前記ノイズ抑圧部は、前記ビームフォーミング処理における係数を、前記無人飛行体の所定の位置に対する位置推定誤差を考慮して決定する
 請求項3に記載の情報処理装置。
[請求項5]
 前記ノイズ抑圧部は、各無人飛行体の移動速度に応じて、前記係数を変更する
 請求項4に記載の情報処理装置。
[請求項6]
 複数の無人飛行体のそれぞれに搭載されたマイクロフォンを使用して、前記複数の無人飛行体により囲まれた閉曲面内の波面を収録する波面収録部を有する
 請求項1に記載の情報処理装置。
[請求項7]
 前記波面収録部は、前記閉曲面内の波面を収録するための球面調和関数の係数を、前記無人飛行体の所定の位置に対する位置推定誤差を考慮して決定する
 請求項6に記載の情報処理装置。
[請求項8]
 前記ビームフォーミングの出力が最適されるように、自身の位置が再配置される
 請求項3に記載の情報処理装置。
[請求項9]
 前記ビームフォーミングによるノイズのエネルギーを低減する方向に、自身の位置が再配置される
 請求項8に記載の情報処理装置。
[請求項10]
 前記ビームフォーミングの出力を最適化するように、所定のエリア内における無人飛行体の数を増減させる
 請求項3に記載の情報処理装置。
[請求項11]
 前記波面収録部による波面の収録結果に基づいて、所定のエリア内における無人飛行体の数を増減させる
 請求項6に記載の情報処理装置。
[請求項12]
 前記ノイズ抑圧部は、前記無人飛行体から発生する非定常ノイズを抑圧する
 請求項1に記載の情報処理装置。
[請求項13]
 前記無人飛行体として構成される
 請求項1に記載の情報処理装置。
[請求項14]
 ノイズ抑圧部が、無人飛行体に搭載されたマイクロフォンにより収音された音声信号に含まれる、前記無人飛行体から発生するノイズを、ノイズ発生源の状況情報に基づいて抑圧する
 情報処理方法。
[請求項15]
 ノイズ抑圧部が、無人飛行体に搭載されたマイクロフォンにより収音された音声信号に含まれる、前記無人飛行体から発生するノイズを、ノイズ発生源の状況情報に基づいて抑圧する
 情報処理方法をコンピュータに実行させるプログラム。

図面

[ 図 1]

[ 図 2]

[ 図 3]

[ 図 4]

[ 図 5]