Algum conteúdo deste aplicativo está indisponível no momento.
Se esta situação persistir, por favor entre em contato conoscoFale conosco & Contato
1. (WO2018235697) TRANSMISSION DEVICE, COMMUNICATION SYSTEM, COMMUNICATION METHOD, AND RECORDING MEDIUM
Document

明 細 書

発明の名称 送信装置、通信システム、通信方法、及び記録媒体

技術分野

0001  

背景技術

0002   0003   0004  

先行技術文献

特許文献

0005  

非特許文献

0006  

発明の概要

発明が解決しようとする課題

0007   0008   0009  

課題を解決するための手段

0010   0011   0012  

発明の効果

0013  

図面の簡単な説明

0014  

発明を実施するための形態

0015   0016   0017   0018   0019   0020   0021   0022   0023   0024   0025   0026   0027   0028   0029   0030   0031   0032   0033   0034   0035   0036   0037   0038   0039   0040   0041   0042   0043   0044   0045   0046   0047   0048   0049   0050   0051   0052   0053   0054   0055   0056   0057   0058   0059   0060   0061   0062   0063   0064   0065   0066   0067   0068   0069   0070   0071   0072   0073   0074   0075   0076   0077   0078   0079   0080   0081   0082   0083   0084   0085   0086   0087   0088   0089   0090   0091   0092   0093   0094   0095   0096   0097   0098  

符号の説明

0099  

請求の範囲

1   2   3   4   5   6   7   8   9   10  

図面

1   2   3   4   5   6   7   8   9  

明 細 書

発明の名称 : 送信装置、通信システム、通信方法、及び記録媒体

技術分野

[0001]
 本発明は、送信装置、通信システム、通信方法、及び記録媒体に関し、例えば、ネットワークを介して、圧縮した映像データを送信する送信装置に関する。

背景技術

[0002]
 LTE(Long Term Evolution)やWi-Fi(登録商標)などのベストエフォート型ネットワークを介した通信のスループットは、大きく変動しうる。そのため、通信のスループットの変動に応じて、映像データを圧縮するための符号化パラメータを動的に変更する技術が必要とされている。
[0003]
 符号化パラメータには、例えば、ビットレート、フレームレート、およびGOP(Group of picture)サイズ(あるいはキーフレーム間隔)が含まれる。コーデックをリセットすることによって、符号化パラメータを変更することができる。GOPサイズが小さいほど、ビットレートをより高い粒度で制御することができる。
[0004]
 特許文献1に記載の音声合成装置(送信装置)は、ロス率(パケットの損失率)が小さい場合、すなわちスループットが高い場合、映像データのGOPサイズを大きくすることによって、映像の画質の向上を図る。一方、ロス率が大きい場合、すなわちスループットが低い場合、映像データのGOPサイズを小さくする。これにより、特許文献1に記載の音声合成装置は、ビットレートを高い粒度で制御可能である。

先行技術文献

特許文献

[0005]
特許文献1 : 特開2005-151600号公報

非特許文献

[0006]
非特許文献1 : 「TCPスループットの確率的拡散予測に基づく映像配信制御(Video Streaming Control by Predicting Stochastic Diffusion of TCP Throughput)」 吉田裕志ら インターネットコンファレンス2011(IC2011) (2011年10月27日)
非特許文献2 : Constructing Stochastic Model of TCP Throughput on Basis of Stationarity Analysis, Hiroshi Yoshida et al. Global Communications Conference (GLOBECOM), 2013 IEEE, date of conference: 9-13 Dec. 2013

発明の概要

発明が解決しようとする課題

[0007]
 しかしながら、特許文献1に記載の音声合成装置(送信装置)による通信方法では、GOPサイズとビットレートの組み合わせがQoE(Quality of Experience)に与える影響を考慮していない。そのため、GOPサイズとビットレートとの組み合わせによって、QoEが著しく低下する可能性がある。
[0008]
 例えば、特許文献1に記載の送信装置が、ビットレートを高い粒度で制御するために、GOPサイズを小さくした場合、符号量の制御が破綻して、ブロックに歪み(ブロックノイズ)が生じる可能性がある。ブロックノイズは、QoEに大きく影響する。
[0009]
 本発明の目的は、ネットワークを介して伝送される映像の体感品質を向上させることにある。

課題を解決するための手段

[0010]
 本発明の一様態に係わる送信装置は、上記課題を解決するために、受信装置との間の通信のスループットを計測するスループット計測手段と、前記スループット計測手段が計測した前記スループットに基づいて、未来のスループットを予測するスループット予測手段と、所定時間を分割することによって、複数の分割時間でそれぞれ構成される複数のパターンを生成するパターン生成手段と、前記パターン生成手段が生成した前記パターンに応じた前記分割時間ごとに、前記スループット予測手段が予測した前記未来のスループットの下限値を超えないような最大ビットレートで前記受信端末へ映像データを送信した場合に、該映像データから再生される映像の体感品質を算出する体感品質算出手段と、前記パターン生成手段が生成した前記複数のパターンのうち、前記体感品質算出手段が算出した前記映像の体感品質が最大になる1つのパターンを選択するパターン選択手段と、前記パターン選択手段が選択した前記1つのパターンに応じた前記分割時間ごとに、前記映像データの圧縮処理のための符号化パラメータを決定するパラメータ決定手段と、を有する。
[0011]
 本発明の一様態に係わる通信方法は、上記課題を解決するために、受信装置との間の通信のスループットを計測し、計測した前記スループットに基づいて、未来のスループットを予測し、所定時間を分割することによって、複数の分割時間でそれぞれ構成される複数のパターンを生成し、生成した前記パターンに応じた前記分割時間ごとに、前記未来のスループットの下限値を超えないような最大ビットレートで前記受信装置へ映像データを送信した場合に、該映像データから再生される映像の体感品質を算出し、前記複数のパターンのうち、前記映像の体感品質が最大になる1つのパターンを選択し、 選択した前記1つのパターンに応じた前記分割時間ごとに、前記映像データの圧縮処理のための符号化パラメータを決定する。
[0012]
 本発明の一様態に係わる記録媒体は、上記課題を解決するために、受信装置との間の通信のスループットを計測することと、計測した前記スループットに基づいて、未来のスループットを予測することと、所定時間を分割することによって、複数の分割時間でそれぞれ構成される複数のパターンを生成することと、生成した前記パターンに応じた前記分割時間ごとに、前記未来のスループットの下限値を超えないような最大ビットレートで前記受信装置へ映像データを送信した場合に、該映像データから再生される映像の体感品質を算出することと、前記複数のパターンのうち、前記映像の体感品質が最大になる1つのパターンを選択することと、選択した前記1つのパターンに応じた前記分割時間ごとに、前記映像データの圧縮処理のための符号化パラメータを決定することと、をコンピュータに実行させるためのプログラムを格納している。

発明の効果

[0013]
 本発明の目的は、ネットワークを介して伝送される映像の体感品質を向上させる送信装置を提供することにある。

図面の簡単な説明

[0014]
[図1] 実施形態1に係わる通信システムのブロック図であり、通信システムを構成する送信端末および受信端末の各構成を示す図である。
[図2] 所定時間を構成する複数の分割時間の例を示す図である。
[図3] 実施形態1に係わる送信端末が実行するQoE(Quality of Experience)算出処理の流れを示すフローチャートである。
[図4] 実施形態1に係わる送信端末と受信端末との間の通信のスループットの例、および、予測される未来のスループットの例を示す図である。
[図5] 未来のスループットの予測値に応じて決定される、分割時間ごとの符号化パラメータの例を示す図である。
[図6] 未来のスループットの予測値に応じて決定される、分割時間ごとの符号化パラメータの他の例を示す図である。
[図7] 実施形態1に係わる通信システムの送信端末と受信端末との間の通信の流れを示すシーケンス図である。
[図8] 実施形態2に係わる送信端末のブロック図である。
[図9] 実施形態3に係わる送信端末のハードウェア構成を示す図である。

発明を実施するための形態

[0015]
 本発明の実施の形態について、図面を参照して詳細に説明する。
〔実施形態1〕
 (通信システム)
 図1は、本実施形態1に係わる通信システムのブロック図である。図1に示すように、通信システムは、送信端末1および受信端末2を備えている。送信端末1および受信端末2は、それぞれ、パーソナルコンピュータまたはスマートフォンなどの端末装置である。送信端末1および受信端末2は、ネットワークを介して通信する。本実施形態1に係わる通信システムのネットワークは、インターネットやモバイルネットワークなどであり、ヘテロジニアス(Heterogeneous)な構造を有する。
[0016]
 (送信端末1)
 図1に示すように、送信端末1は、エンコーダ101と、送信部102と、データ受信部103と、スループット計測部104と、分割パターン生成部105と、QoE算出部106と、パラメータ決定部107とを備えている。
[0017]
 エンコーダ101は、映像を圧縮符号化して、映像データを出力する。送信部102は、エンコーダ101によって圧縮符号化された映像データを受信端末2に送信する。データ受信部103は、通信のスループットを計測するためのデータを受信端末2から受信する。スループット計測部104は、データ受信部103が受信したデータに基づいて、スループットを計測する。
[0018]
 分割パターン生成部105は、所定時間を分割することによって、複数の分割時間でそれぞれ構成される複数のパターン(後述)を生成する。
[0019]
 QoE算出部106は、スループット計測部104が計測したスループットに基づいて、未来のスループットを予測する。加えて、QoE算出部106は、分割パターン生成部105が生成したパターンごとに、QoE、すなわち映像を視聴するユーザの体感品質を算出する。
[0020]
 パラメータ決定部107は、分割パターン生成部105が生成した複数のパターンの中から、QoE算出部106が算出したQoEが最大となる1つのパターンを選択し、選択した1つのパターンに基づいて、映像の符号化パラメータを決定する。
[0021]
 分割パターン生成部105、QoE算出部106、およびパラメータ決定部107がそれぞれ実行する処理の詳細を後で順番に説明する。
[0022]
 (受信端末2)
 図1に示すように、受信端末2は、受信部201と、データ送信部202とを備えている。受信部201は、送信端末1の送信部102から送信された映像データを受信する。
[0023]
 データ送信部202は、受信部201から、スループットを算出するために必要なデータを取得あるいは生成して、取得あるいは生成したデータを送信端末1に送信する。
(分割パターン生成部105)
 送信端末1の分割パターン生成部105の動作を説明する。分割パターン生成部105は、時刻0から所定の時刻T(>0)までの所定時間Tを、最大分割数m(mは自然数)以下で分割する。所定時間Tおよび最大分割数mは、任意の値であってよい。あるいは、所定時間Tおよび最大分割数mは、ユーザが予め設定することが可能であってもよい。
[0024]
 図2は、最大分割数m=3である場合に、所定時間T=t3から生成される複数のパターンの例を示す。図2に示すように、この場合、分割パターン生成部105は、4通りのパターン、すなわち、{0,t1,t2,t3}、{0,t2,t3}、{0,t1,t3}、または{0,t3}を生成する。ここで、0<t1<t2<t3=Tである。一般的に、最大分割数がmである場合、パターンの総数は2^(m-1)である。
[0025]
 所定時間Tのパターンを、以下では、集合R_j(ただし0<=j<2^(m-1))と呼ぶ。また、集合R_jの集合を、集合Rと呼ぶ。各集合R_jの要素は、分割時刻T_i(i=0、1、2、・・・)である。集合R_jごとに、要素すなわち分割時刻T_iの数は異なる。
[0026]
 図2に示すように、最大分割数m=3である場合、集合Rは、分割時刻T_i(0<=i<=3)を用いて、R={R_0={T_0,T_1,T_2,T_3},R_1={T_0,T_1,T_2},R_2={T_0,T_1,T_2},R_3={T_0,T_1}}と表わされる。
[0027]
 ここで、集合Rの異なる集合R_jの対応する要素同士は、必ずしも同一ではない。例えば、図2を参照すれば、集合R_1の要素T_1はt2であるが、集合R_2の要素T_1はt1である。また、互いに隣接する要素間の(時間軸上における)“距離”は、必ずしも一定ではない。
[0028]
 例えば、図2を参照すれば、集合R_0では、要素間の“距離”は一定(ただし、t1=t2-t1=t3-t2である場合)である。一方、集合R_2では、要素間の“距離”は一定ではない。以下では、集合R_jの要素T_iと要素T_{i-1}との間の“距離”を、分割時間(T_i-T_{i-1})と呼ぶ。
[0029]
 (QoE算出部106)
 QoE算出部106は、分割時間(T_i-T_{i-1})ごとに、QoEすなわち体感品質を算出する。通常、QoEは、1から5までの実数で表される。QoEが低いほど、体感品質が低い。一方、QoEが高いほど、体感品質が高い。
[0030]
 QoEの算出関数は、オーディオビジュアルメディアのストリーミング品質に関する規格(例えばInternational Telecommunication Union/ITU Telecommunication Sectorが作成したITU-T P.1201)にしたがう。本実施形態1では、QoEの算出関数を、Q(b,g)と表す。ここで、bはビットレートであり、gはGOPサイズである。すなわち、Q(b,g)は、ビットレートおよびGOPサイズに依存する。
[0031]
 本実施形態では、QoE算出部106は、通信スループット予測法を用いて、未来のスループットを表す関数x(t)(tは時刻)を算出する。通信スループット予測法とは、過去のスループットに関する情報を、時系列に沿って解析することによって、未来のスループットを表す確率密度関数の期待値および分散を得る方法である。通信スループット予測法に関する技術は、例えば、非特許文献1または非特許文献2に記載されている。本実施形態では、通信スループット予測法に関する技術の説明を省略する。
[0032]
 また、QoE算出部106は、未来のスループットから、最大ビットレートを決定する。最大ビットレートとは、関数x(t)で表される未来のスループットの下限値を超えないビットレートの最大値である。したがって、最大ビットレートは、未来のスループットの下限値と一致する。
[0033]
 あるいは、QoE算出部106は、通信スループット予測法を用いずに、未来のスループットの下限値を算出してもよい。例えば、QoE算出部106は、スループットの計測値に基づいて、未来のスループットを予測することができる。この場合、QoE算出部106は、分割時間(T_i-T_{i-1})における最大ビットレートb_iを、以下の計算式にしたがって算出してもよい。
b_i=a^i×x_0
 ここで、aは、ユーザが予め設定した感度係数である。また、x_0は、現在時刻T_0=0におけるスループットの計測値である。一般的に、最大ビットレートは、時間が経過するとともに低下する。
[0034]
 送信端末1から受信端末2へ伝送される映像データのビットレートが未来のスループットの下限値を超えない限り、受信端末2側で映像データの再生が途絶する可能性は十分に低い。
(QoEの算出方法)
 図3を参照して、本実施形態1に係わるQoE算出部106が、QoEを算出する方法の流れを説明する。図3は、QoE算出部106の動作を示すフローチャートである。
[0035]
 図3に示すように、QoE算出部106は、まず、分割パターン生成部105から、集合Rを受け取る。そして、QoE算出部106は、集合Rから、一つの集合R_jを取り出す(S1)。最初、j=0である。
[0036]
 j<|R|の場合(S2でNO)、QoE算出部106は、R_jの要素(分割時刻)T_iを取り出し、iを初期化(すなわちi=0)する(S3)。ここで、|R|は、集合Rの要素数を表す。j=|R|の場合(S2でYES)、QoE算出部106の動作は終了する。
[0037]
 i<|R_j|の場合(S4でNO)、QoE算出部106は、予め算出したスループットの予測値を表す関数x(t)(tは時刻)に基づいて、分割時間(T_i-T_{i-1})における最大ビットレートb_iを算出する。ここで、|R_j|は、集合R_jの要素数を表す。
[0038]
 QoE算出部106は、以下の計算式にしたがって、分割時間(T_i-T_{i-1})におけるGOPサイズg_iを算出する(S5)。
g_i=f×(T_i-T_{i-1})
ここで、fはフレームレートである。本実施形態1では、フレームレートは一定であるので、fは定数である。
[0039]
 次に、QoE算出部106は、集合R_jの各分割時間におけるQoEを算出する(S6)。以下では、集合R_jの分割時間(T_i-T_{i-1})におけるQoEを、Q_j_iと表す。Q_j_iは、以下のように表される。
Q_j_i=Q(b_i,g_i)=Q(b_i,f×(T_i-T_{i-1}))
 なお、前述したように、集合R_jによって、T_iが表わす時刻は異なる。したがって、集合R_jによって、Q_j_iは異なる値を取ることを注意する。
[0040]
 S6の後、iに1が加算されて(S7)、S4に戻る。i=|R_j|の場合(S4でYES)、jに1が加算されて(S8)、S2に戻る。
[0041]
 本実施形態1の構成によれば、スループットの予測値に基づいて、最大ビットレートおよびGOPサイズを最適に制御するので、QoEが低下することを抑制することができる。
[0042]
 (パラメータ決定部107)
 パラメータ決定部107は、分割パターン生成部105が生成した集合Rを受け取るとともに、QoE算出部106が算出したQoE、すなわちQ_j_iを受け取る。
[0043]
 パラメータ決定部107は、集合Rの全ての集合R_j(0<=j<|R|)の中から、以下の計算式(1)にしたがって、いずれか1つの集合R_jを選択する。
[0044]


[0045]
 式(1)によれば、パラメータ決定部107は、集合R_jの分割時間(T_i-T_{i-1})ごとのQ_j_iを該分割時間(T_i-T_{i-1})で重みづけした値の総和が最大になる集合R_jを選択する。
[0046]
 パラメータ決定部107は、選択した集合R_jの各分割時間(T_i-T_{i-1})における最大ビットレートb_iおよびGOPサイズg_iを、映像データの圧縮符号化のための符号化パラメータとして決定する。
[0047]
 (エンコーダ101)
 エンコーダ101は、パラメータ決定部107から、最大ビットレートおよびGOPサイズの情報を受け取る。そして、エンコーダ101は、コーデックをリセットして、受け取った最大ビットレートおよびGOPサイズの情報に基づいて、符号化パラメータを更新する。
[0048]
 (符号化パラメータを決定する方法)
 図4および図5を参照して、本実施形態1に係わる送信端末1が符号化パラメータを決定する方法の流れを説明する。図4および図5は、スループットの時間変化の一例を示すグラフである。グラフの横軸tは時刻を表し、グラフの縦軸bはスループットを表す。図4において、実線のグラフは、スループットの計測値を示している。また、3つの破線のグラフは、いずれも、スループットの予測値を示している。
[0049]
 図4において、3つの破線のグラフは、それぞれ、スループットの“期待値”(図4ではy(t))、“期待値+(プラス)分散”(図4ではz(t))、および“期待値-(マイナス)分散”(図4ではx(t))に対応している。これらの破線のグラフのうち、“期待値-分散” x(t)は、予測されるスループットの下限値を表す。
[0050]
 最大ビットレートがスループットの下限値を上回った場合、受信端末2側において、映像の再生が途絶する可能性がある。したがって、最大ビットレートは、スループットの下限値を超えないように制限される。
[0051]
 所定時間T=2[sec]であり、最大分割数m=2であるとする。図5では、T_0=0[sec]~T_2=2[sec]における最大ビットレートb_0~b_2は、それぞれ、b_0=2[Mbps]、b_1=1.7[Mbps]、b_2=1.3[Mbps]である。
[0052]
 この場合、分割パターン生成部105は、2つのパターンR_0={T_0,T_1,T_2}およびR_1={T_0,T_2}}を生成する。図5では、T_0=0、T_1=1、T_2=2である。
[0053]
 QoE算出部106は、集合R_0の各分割時間についてのQoE、すなわちQ_0_0=Q(b_1,f×T_1)およびQ_0_1=Q(b_2,f×(T_2-T_1))を算出する。また、集合R_1についてのQoE、すなわちQ_1_0=Q(b_2,f×T_2)を算出する。ここで、フレームレートfは定数である。
[0054]
 その後、パラメータ決定部107は、下記計算式(2)に基づいて、分割時間(T_i-T_{i-1})で重み付けしたQ_j_i(0<=i<|R_j|,0<=j<|R|)の総和を算出する。
[0055]


[0056]
 R_0の場合、式(2)で表される総和は、Q_0_0+Q_0_1である。また、R_1の場合、総和は、2×Q_1_0である。総和が大きいほど、所定時間TにおけるQoEは大きいと言える。
[0057]
 例えば、Q_0_0=3.5、Q_0_1=3.2、Q_1_0=3.3であるとする。この場合、R_0についての総和は、Q_0_0+Q_0_1=3.5+3.2=6.7である。また、R_1についての総和は、2×Q_1_0=2×3.3=6.6である。
[0058]
 したがって、R_0についての総和のほうが、R_1についての総和よりも大きい。そのため、パラメータ決定部107は、集合R_0を選択する。
[0059]
 また、パラメータ決定部107は、選択した集合R_0の分割時間(T_1-T_0)における最大ビットレートb_1=1.7[Mbps]、および、分割時間(T_2-T_1)における最大ビットレートb_2=1.3[Mbps]を、エンコーダ101に通知する。
[0060]
 また、パラメータ決定部107は、符号化パラメータとして、分割時間(T_1-T_0)におけるGOPサイズg=f×(T_1-T_0)、および、分割時間(T_2-T_1)におけるGOPサイズg=f×(T_2-T_1)も、エンコーダ101に通知する。
[0061]
 他の例では、Q_0_0=3.83、Q_0_1=3.72、Q_1_0=3.81であるとする。この場合、R_0についての総和(式(2)参照)は、Q_0_0+Q_0_1=3.83+3.72=7.55である。一方、R_1についての総和は、2×Q_1_0=7.62である。
[0062]
 したがって、R_1についての総和のほうが、R_0についての総和よりも大きい。そのため、パラメータ決定部107は、集合R_1を選択する。また、パラメータ決定部107は、集合R_1の分割時間(T_2-T_0)における最大ビットレートb_2=1.3[Mbps]を、エンコーダ101に通知する。
[0063]
 また、パラメータ決定部107は、符号化パラメータとして、分割時間(T_2-T_0)におけるGOPサイズg=f×(T_2-T_0)も、エンコーダ101に通知する。
[0064]
 一般的に、スループットの計測値の揺らぎが大きい(小さい)ほど、未来のスループットの予測値の分散も大きく(小さく)なる。図6は、スループットの時間変化の他の一例を示すグラフである。図6に示すグラフは、図5に示すグラフと比較して、スループットの計測値の揺らぎが小さい。その結果、スループットの予測値の分散が小さい。図6に示すグラフx´(t)、すなわち予測されるスループットの下限値は、図5に示すグラフx(t)と比較して、緩やかに減少している。実際、図5に示すグラフx(t)では、x(t=1)=1.7、x(t=2)=1.3である一方、図6に示すグラフx´(t)では、x´(t=1)=1.8、x´(t=2)=1.7である。
[0065]
 本実施形態1の構成によれば、ユーザの体感品質(QoE)を最大化するように、GOPサイズおよびビットレートの最適な組み合わせを選択することができる。なぜならば、所定時間を分割する複数のパターンについて、それぞれQoEを算出して、QoEが最大になるパターンを選択するからである。また、本実施形態1の構成によれば、スループットの変動が大きい場合であっても、QoEが低下することを抑制することができる。なぜならば、最大ビットレートは、予測されるスループットの下限値を超えないので、映像の再生が途絶する可能性が低いからである。
[0066]
 (通信方法)
 図7を参照して、本実施形態1に係わる通信システムによる通信方法を説明する。図7は、通信システムを構成する送信端末1と受信端末2とが通信を行う際の送信端末1および受信端末2の各動作の流れを示すシーケンス図である。
[0067]
 図7に示すように、受信端末2のデータ送信部202が、スループットに関するデータ、言い換えれば、スループットを算出するために必要なデータを、送信端末1へ送信する(S201)。
[0068]
 例えば、データ送信部202は、受信端末2の受信部201が単位時間に受信する映像データの量の情報、および、ロス率の情報を、スループットに関するデータとして、送信端末1へ送信する。
[0069]
 送信端末1のデータ受信部103は、受信端末2から、スループットに関するデータを受信する。スループット計測部104は、データ受信部103が受信したデータを用いて、送信端末1と受信端末2との間の通信のスループットを計測する(S101)。
[0070]
 次に、送信端末1のQoE算出部106は、スループット計測部104が計測したスループットに基づいて、未来のスループットを予測する(S102)。
[0071]
 また、送信端末1の分割パターン生成部105は、所定時間(例えば、図2では0からt3まで)を分割することによって、複数の分割時間で構成されるパターンを生成する(S103)。
[0072]
 次に、QoE算出部106は、分割パターン生成部105が生成したパターンに応じた分割時間ごとに、先に予測した未来のスループットの下限値を超えないような最大ビットレートで受信端末2へ映像データを送信した場合に、該映像データから再生される映像の体感品質を算出する(S104)。なお、S104の詳細については、先に、図3に基づいて説明した。
[0073]
 その後、パラメータ決定部107は、分割パターン生成部105が生成した複数のパターンのうち、QoE算出部106が算出する体感品質が最大になるような1つのパターンを選択する(S105)。
[0074]
 続いて、送信端末1のパラメータ決定部107は、選択した1つのパターンに応じた分割時間ごとに、符号化パラメータを決定する(S106)。
[0075]
 例えば、図4に示す例において、パラメータ決定部107は、前記1つのパターンとして集合R_0={T_0,T_1,T_2}を選択した場合、分割時間(T_1-T_0)における符号化パラメータ(ビットレートb_1およびGOPサイズg=f×T_1)、および、分割時間(T_2-T_1)における符号化パラメータ(ビットレートb_2およびGOPサイズg=f×T_2)をそれぞれ決定する。
[0076]
 送信端末1のエンコーダ101は、パラメータ決定部107が決定した符号化パラメータを用いて、映像データを圧縮符号化する(S107)。
[0077]
 送信端末1の送信部102は、エンコーダ101が圧縮符号化した映像データを、受信端末2へ送信する(S108)。
[0078]
 受信端末2の受信部201は、送信端末1から、圧縮符号化された映像データを受信する(S202)。その後、フローはS201へ戻る。
[0079]
 〔実施形態2〕
 本実施形態2として、本発明の最小構成について説明する。
[0080]
 図8は、本実施形態2に係わる送信端末3の構成を示す概略構成図である。図8に示すように、本実施形態2に係わる送信端末3は、スループット計測部301と、スループット予測部302と、パターン生成部303と、体感品質算出部304と、パターン選択部305と、パラメータ決定部306とを備える。
[0081]
 本実施形態2のスループット計測部301は、例えば、前記実施形態1のスループット計測部104と対応する。本実施形態2のスループット予測部302および体感品質算出部304は、例えば、前記実施形態1のQoE算出部106に対応する。
[0082]
 また、本実施形態2のパターン生成部303は、例えば、前記実施形態1の分割パターン生成部105と対応する。本実施形態2のパターン選択部305およびパラメータ決定部306は、例えば、前記実施形態1のパラメータ決定部107と対応する。
[0083]
 なお、本実施形態2に係わる送信端末3は、前記実施形態1の送信端末1が備えたエンコーダ101および送信部102と対応する構成要素を更に備えていてもよい。
[0084]
 スループット計測部301は、受信端末(図示せず)との間の通信のスループットを計測する。スループット予測部302は、スループット計測部301が計測したスループットに基づいて、未来のスループットを予測する。
[0085]
 パターン生成部303は、所定時間を分割することによって、複数の分割時間でそれぞれ構成される複数のパターンを生成する。
[0086]
 体感品質算出部304は、パターン生成部303が生成したパターンに応じた分割時間ごとに、スループット予測部302が予測した未来のスループットの下限値を超えないような最大ビットレートで受信端末へ映像データを送信した場合に、該映像データから再生される映像の体感品質を算出する。
[0087]
 パターン選択部305は、パターン生成部303が生成した複数のパターンのうち、体感品質算出部304が算出した映像の体感品質が最大になる1つのパターンを選択する。
[0088]
 パラメータ決定部306は、パターン選択部305が選択した1つのパターンに応じた分割時間ごとに、映像データの圧縮処理のための符号化パラメータを決定する。
[0089]
 本実施形態2の構成によれば、所定時間をどのように分割するかを規定する複数のパターンの中から、映像の体感品質が最大になる1つのパターンを特定し、特定したパターンに基づいて、符号化パラメータを決定する。したがって、ネットワークを介した映像伝送において、映像の体感品質を向上させることができる。
[0090]
 〔実施形態3〕
 図9は、本実施形態3に係わる送信端末4のハードウェア構成を示すブロック図である。図9に示すように、本実施形態3に係わる送信端末は、CPU(Central Processing Unit)401、エンコーダ402、およびインターフェース403を備えている。本実施形態に係わる送信端末4は、例えば、前記実施形態1に係わる送信端末1、または、前記実施形態2に係わる送信端末3に対応する。
[0091]
 CPU401は、本実施形態に係わる送信端末4の制御機能を実現する。エンコーダ402は、例えば、前記実施形態1のエンコーダ101に対応する。インターフェース403は、例えば、前記実施形態1の送信部102およびデータ受信部103に対応する。
[0092]
 本実施形態に係わる送信端末4は、前記実施形態1に係わる送信端末1の制御機能(図1に示す、スループット計測部104、分割パターン生成部105、QoE算出部106、パラメータ決定部107、およびエンコーダ101)の全部または一部を実現するためのプログラムをコンピュータ読み取り可能な記録媒体に記録して、この記録媒体に記録されたプログラムをCPU401に読み込ませ、実行することにより各部の処理を行ってもよい。なお、ここでいう「コンピュータシステム」とは、OSや周辺機器等のハードウェアを含むものとする。
[0093]
 あるいは、本実施形態に係わる送信端末4は、前記実施形態2に係わる送信端末3の制御機能(図8に示す、スループット計測部301、スループット予測部302、パターン生成部303、体感品質算出部304、パターン選択部305、およびパラメータ決定部306)の全部または一部を実現するためのプログラムをコンピュータ読み取り可能な記録媒体に記録して、この記録媒体に記録されたプログラムをCPU401に読み込ませ、実行することにより各部の処理を行ってもよい。
[0094]
 ここで、「コンピュータ読み取り可能な記録媒体」とは、フレキシブルディスク、光磁気ディスク、ROM(Read Only Memory)、CD(Compact Disc)-ROM等の可搬媒体、コンピュータシステムに内蔵されるハードディスク等の記憶装置のことをいう。
[0095]
 また、CPU401が読み込んで実行するプログラムは、前述した機能の一部を実現するためのものであっても良く、さらに前述した機能をコンピュータシステムにすでに記録されているプログラムとの組み合わせで実現できるものであっても良い。
[0096]
 本実施形態3の構成によれば、前記実施形態1または前記実施形態2と同様の効果を奏する。
[0097]
 以上、図面を参照して、本発明の実施形態を詳述してきたが、本発明を実施するための具体的な構成はこれらの実施形態に限られるものではなく、本発明の要旨を逸脱しない範囲の設計等も含まれる。
[0098]
 この出願は、2017年6月19日に出願された日本出願特願2017-119257を基礎とする優先権を主張し、その開示の全てをここに取り込む。

符号の説明

[0099]
   1 送信端末(送信装置)
   2 受信端末(受信装置)
   3 送信端末(送信装置)
   4 送信端末(送信装置)
 101 エンコーダ
 102 送信部(送信手段)
 104 スループット計測部(スループット計測手段)
 105 分割パターン生成部(パターン生成手段、パターン選択手段)
 106 QoE算出部(スループット予測手段、体感品質算出手段)
 107 パラメータ決定部(パラメータ決定手段)
 201 受信部(受信手段)
 202 データ送信部
 301 スループット計測部(スループット計測手段)
 302 スループット予測部(スループット予測手段)
 303 パターン生成部(パターン生成手段)
 304 体感品質算出部(体感品質算出手段)
 305 パターン選択部(パターン選択手段)
 306 パターン決定部(パターン決定手段)
 402 エンコーダ

請求の範囲

[請求項1]
 受信装置との間の通信のスループットを計測するスループット計測手段と、
前記スループット計測手段が計測した前記スループットに基づいて、未来のスループットを予測するスループット予測手段と、
 所定時間を分割することによって、複数の分割時間でそれぞれ構成される複数のパターンを生成するパターン生成手段と、
 前記パターン生成手段が生成した前記パターンに応じた前記分割時間ごとに、前記スループット予測手段が予測した前記未来のスループットの下限値を超えないような最大ビットレートで前記受信装置へ映像データを送信した場合に、該映像データから再生される映像の体感品質を算出する体感品質算出手段と、
 前記パターン生成手段が生成した前記複数のパターンのうち、前記体感品質算出手段が算出した前記映像の体感品質が最大になる1つのパターンを選択するパターン選択手段と、
 前記パターン選択手段が選択した前記1つのパターンに応じた前記分割時間ごとに、前記映像データの圧縮処理のための符号化パラメータを決定するパラメータ決定手段と、
を有する送信装置。
[請求項2]
 前記パラメータ決定手段が決定した前記符号化パラメータを用いて、前記映像データの圧縮処理を行うエンコーダと、
 前記エンコーダが圧縮した前記映像データを前記受信装置へ送信する送信手段と、
をさらに有することを特徴とする請求項1に記載の送信装置。
[請求項3]
 前記符号化パラメータは、GOP(Group of picture)サイズおよびビットレートを少なくとも含むことを特徴とする請求項1または2に記載の送信装置。
[請求項4]
 前記パターン生成手段が生成する前記パターンは、複数の分割時刻T_i(i=1、2、・・・)を含み、前記複数の分割時刻T_iは、前記複数の分割時間(T_i-T_{i-1})を規定し、
 前記体感品質算出手段は、前記複数の分割時間(T_i-T_{i-1})の各々における前記最大ビットレートb_iおよびGOPサイズg_iを変数として含む算出関数Q(b_i,g_i)に基づいて、前記体感品質を算出し、
 算出される前記体感品質は以下の数式で表されることを特徴とする請求項1から3のいずれか1項に記載の送信装置。


(ここで、g_i=f*(T_i-T_{i-1})であり、fは前記映像データのフレームレートである)
[請求項5]
 前記パラメータ決定手段は、前記パターン選択手段が選択した前記パターンの分割時間(T_i-T_{i-1})における前記最大ビットレートb_iを、前記分割時間(T_i-T_{i-1})における前記符号化パラメータとして決定することを特徴とする請求項4に記載の送信装置。
[請求項6]
 前記スループット予測手段は、前記スループット計測手段が計測した前記スループットに基づいて、前記未来のスループットの期待値および分散を算出し、
 前記体感品質算出手段は、前記スループット予測手段が算出した前記期待値マイナス前記分散を、前記下限値として設定することを特徴とする請求項1から5のいずれか1項に記載の送信装置。
[請求項7]
 請求項1から6のいずれか1項に記載の送信装置と、
 前記受信装置と、を含む通信システム。
[請求項8]
 前記受信装置は、
 前記送信装置から前記映像データを受信する受信手段と、
 前記スループット計測手段が前記スループットを計測するための情報を前記送信装置へ送信するスループット計測用データ送信手段と、
を有することを特徴とする請求項7に記載の通信システム。
[請求項9]
受信装置との間の通信のスループットを計測し、
計測した前記スループットに基づいて、未来のスループットを予測し、
所定時間を分割することによって、複数の分割時間でそれぞれ構成される複数のパターンを生成し、
生成した前記パターンに応じた前記分割時間ごとに、前記未来のスループットの下限値を超えないような最大ビットレートで前記受信装置へ映像データを送信した場合に、該映像データから再生される映像の体感品質を算出し、
前記複数のパターンのうち、前記映像の体感品質が最大になる1つのパターンを選択し、
 選択した前記1つのパターンに応じた前記分割時間ごとに、前記映像データの圧縮処理のための符号化パラメータを決定する、
 通信方法。
[請求項10]
 受信装置との間の通信のスループットを計測することと、
 計測した前記スループットに基づいて、未来のスループットを予測することと、
 所定時間を分割することによって、複数の分割時間でそれぞれ構成される複数のパターンを生成することと、
 生成した前記パターンに応じた前記分割時間ごとに、前記未来のスループットの下限値を超えないような最大ビットレートで前記受信装置へ映像データを送信した場合に、該映像データから再生される映像の体感品質を算出することと、
 前記複数のパターンのうち、前記映像の体感品質が最大になる1つのパターンを選択することと、
 選択した前記1つのパターンに応じた前記分割時間ごとに、前記映像データの圧縮処理のための符号化パラメータを決定することと、
 をコンピュータに実行させるプログラムを格納した、一時的でない記録媒体。

図面

[ 図 1]

[ 図 2]

[ 図 3]

[ 図 4]

[ 図 5]

[ 図 6]

[ 図 7]

[ 図 8]

[ 図 9]