Processing

Please wait...

Settings

Settings

Goto Application

1. WO2020139037 - VIDEO ENCODING/DECODING METHOD AND APPARATUS

Document

명세서

발명의 명칭

기술분야

1  

배경기술

2   3  

발명의 상세한 설명

기술적 과제

4   5   6   7   8  

과제 해결 수단

9   10   11   12   13   14   15   16   17   18   19   20   21  

발명의 효과

22   23   24   25   26  

도면의 간단한 설명

27   28   29   30   31   32   33   34   35   36   37   38   39  

발명의 실시를 위한 최선의 형태

40   41   42   43   44   45   46   47   48   49   50   51   52  

발명의 실시를 위한 형태

53   54   55   56   57   58   59   60   61   62   63   64   65   66   67   68   69   70   71   72   73   74   75   76   77   78   79   80   81   82   83   84   85   86   87   88   89   90   91   92   93   94   95   96   97   98   99   100   101   102   103   104   105   106   107   108   109   110   111   112   113   114   115   116   117   118   119   120   121   122   123   124   125   126   127   128   129   130   131   132   133   134   135   136   137   138   139   140   141   142   143   144   145   146   147   148   149   150   151   152   153   154   155   156   157   158   159   160   161   162   163   164   165   166   167   168   169   170   171   172   173   174   175   176   177   178   179   180   181   182   183   184   185   186   187   188   189   190   191   192   193   194   195   196   197   198   199   200   201   202   203   204   205   206   207   208   209   210   211   212   213   214   215   216   217   218   219   220   221   222   223   224   225   226   227   228   229   230   231   232   233   234   235   236   237   238   239   240   241   242   243   244   245   246   247   248   249   250   251   252   253   254   255   256   257   258   259   260   261   262   263   264   265   266   267   268   269   270   271   272   273   274   275   276   277   278   279   280   281   282   283   284   285   286   287   288   289   290   291   292   293   294   295   296   297   298   299   300   301   302   303   304   305   306   307   308   309   310   311   312   313   314   315   316   317   318   319   320   321   322   323   324   325   326   327   328   329   330   331   332   333   334   335   336   337   338   339   340   341   342   343   344   345   346   347   348   349   350   351   352   353   354   355   356   357   358   359   360   361   362   363   364   365   366   367   368   369   370   371   372   373   374   375   376   377   378   379   380   381   382   383   384   385   386   387   388   389   390   391   392   393   394   395   396   397   398   399   400   401   402   403   404   405   406   407   408   409   410   411   412   413   414   415   416   417   418   419   420   421   422   423   424   425   426   427   428   429   430   431   432   433   434   435   436   437   438   439   440   441   442   443   444   445   446   447   448   449   450   451   452   453   454   455   456   457   458   459   460   461   462   463   464   465   466   467   468   469   470   471   472   473   474   475   476   477   478   479   480   481   482   483   484   485   486   487   488   489   490   491   492   493   494   495   496   497   498   499   500   501   502   503   504   505   506   507   508   509   510   511   512   513   514   515   516   517   518   519   520   521   522   523   524   525   526   527   528   529   530   531   532   533   534   535   536   537   538   539   540   541   542   543   544   545   546   547   548   549   550   551   552   553   554   555   556   557   558   559   560   561   562   563   564   565   566   567   568   569   570   571   572   573   574   575   576   577   578   579   580   581   582   583   584   585   586   587   588   589   590   591   592   593   594   595   596   597   598   599   600   601   602   603   604   605   606   607   608   609   610   611   612   613   614  

산업상 이용가능성

615  

청구범위

1   2   3   4   5   6   7   8   9   10   11   12  

도면

1   2   3   4   5   6   7   8   9   10   11   12   13   14   15   16   17   18   19   20   21   22   23   24   25   26   27   28   29   30   31   32   33   34   35   36   37   38   39   40   41   42   43   44   45   46   47   48   49   50  

명세서

발명의 명칭 : 비디오 부/복호화 방법 및 장치

기술분야

[1]
본 발명은 비디오 신호 처리 방법 및 장치에 관한 것이다.

배경기술

[2]
고해상도 비디오에 대한 시장의 수요가 증가하고 있으며, 이에 따라 고해상도 영상을 효율적으로 압축할 수 있는 기술이 필요하다. 이러한 시장의 요구에 따라 ISO/IEC의 MPEG (Moving Picture Expert Group)과 ITU-T의 VCEG (Video Coding Expert Group)이 공동으로 JCT-VC (Joint Collaborative Team on Video Coding)를 결성하여, HEVC (High Efficiency Video Coding) 비디오 압축 표준을 2013년 1월에 개발을 완료했으며, 차세대 압축 표준에 대한 연구 및 개발을 활발히 진행해오고 있다.
[3]
동영상 압축은 크게 화면 내 예측 (또는 인트라 예측), 화면 간 예측(또는 인터 예측), 변환, 양자화, 엔트로피(Entropy coding) 부호화, 인루프 필터(In-loop filter)로 구성된다. 한편, 고해상도 영상에 대한 수요가 증가함과 함께, 새로운 영상 서비스로서 입체 영상 컨텐츠에 대한 수요도 함께 증가하고 있다. 고해상도 및 초고해상도의 입체 영상 콘텐츠를 효과적으로 제공하기 위한 비디오 압축 기술에 대하여 논의가 진행되고 있다.

발명의 상세한 설명

기술적 과제

[4]
본 발명은 픽쳐를 적응적으로 분할하는 방법 및 장치를 제공하는데 목적이 있다.
[5]
본 발명은 인트라 예측 방법 및 장치를 제공하는데 목적이 있다.
[6]
본 발명은 인터 예측 방법 및 장치를 제공하는데 목적이 있다.
[7]
본 발명은 삼각 예측 유닛 부호화를 이용한 인터 예측 방법 및 장치를 제공하는데 목적이 있다.
[8]
본 발명은 성분 간 참조 기반의 예측 방법 맟 징치를 제공하는데 목적이 있다.

과제 해결 수단

[9]
본 발명에 따른 비디오 신호 부호화/복호화 방법 및 장치는, 현재 블록을 2개의 예측 유닛으로 분할하고, 상기 현재 블록의 머지 후보 리스트를 구성하며, 상기 현재 블록의 머지 후보 인덱스와 상기 머지 후보 리스트를 이용하여 상기 현재 블록의 움직임 정보를 유도하고, 상기 유도된 움직임 정보를 이용하여, 상기 현재 블록의 인터 예측을 수행할 수 있다.
[10]
본 발명에 따른 비디오 신호 부호화/복호화 방법 및 장치에 있어서, 상기 2개의 예측 유닛 중 적어도 하나의 형태는 삼각형일 수 있다.
[11]
본 발명에 따른 비디오 신호 부호화/복호화 방법 및 장치에 있어서, 상기 분할은, 소정의 분할 라인에 관한 정보에 기초하여 수행되고, 상기 정보는 상기 분할 라인의 시작점, 끝점, 각도 또는 방향 중 적어도 적어도 하나에 관한 정보를 포함할 수 있다.
[12]
본 발명에 따른 비디오 신호 부호화/복호화 방법 및 장치에 있어서, 상기 분할은, 상기 현재 블록의 크기가 소정의 문턱크기보다 크거나 같은 경우에 한하여 수행되고, 상기 현재 블록의 크기는, 상기 현재 블록의 너비, 높이, 너비와 높이의 비율(ratio) 또는 너비와 높이의 곱으로 표현될 수 있다.
[13]
본 발명에 따른 비디오 신호 부호화/복호화 방법 및 장치에 있어서, 상기 머지 후보 리스트는, 복수의 삼각 머지 후보(triangular merge candidates)로 구성되고, 상기 삼각 머지 후보는, 공간적 머지 후보, 시간적 머지 후보 또는 소정의 크기를 가진 버퍼에 저장된 움직임 정보 중 적어도 하나를 포함할 수 있다.
[14]
본 발명에 따른 비디오 신호 부호화/복호화 방법 및 장치에 있어서, 상기 버퍼에 저장된 움직임 정보는, 상기 현재 블록 이전에 복호화가 완료된 블록의 움직임 정보를 의미할 수 있다.
[15]
본 발명에 따른 비디오 신호 부호화/복호화 방법 및 장치는, 상기 삼각 머지 후보의 최대 개수를 지시하는 개수 정보를 부호화/복호화하고, 상기 부호화/복호화된 개수 정보에 기초하여 삼각 머지 후보의 최대 개수를 설정할 수 있다.
[16]
본 발명에 따른 비디오 신호 부호화/복호화 방법 및 장치에 있어서, 상기 현재 블록에 속한 2개의 예측 유닛은 상기 하나의 머지 후보 리스트를 공유할 수 있다.
[17]
본 발명에 따른 비디오 신호 부호화/복호화 방법 및 장치에 있어서, 상기 머지 후보 인덱스는, 상기 현재 블록의 제1 예측 유닛에 대한 제1 머지 후보 인덱스와 상기 현재 블록의 제2 예측 유닛에 대한 제2 머지 후보 인덱스를 포함하고, 상기 제1 머지 후보 인덱스와 상기 제2 머지 후보 인덱스는 각각 부호화/복호화될 수 있다.
[18]
본 발명에 따른 비디오 신호 부호화/복호화 방법 및 장치에 있어서, 상기 제1 예측 유닛의 움직임 정보는, 상기 제1 머지 후보 인덱스에 의해 특정된 삼각 머지 후보를 이용하여 유도되고, 상기 제2 예측 유닛의 움직임 정보는, 상기 제1 머지 후보 인덱스와 상기 제2 머지 후보 인덱스를 기반으로 특정된 삼각 머지 후보를 이용하여 유도될 수 있다.
[19]
본 발명에 따른 비디오 신호 부호화/복호화 방법 및 장치에 있어서, 상기 머지 후보 인덱스의 값에 따라, 상기 특정된 삼각 머지 후보의 L0 방향의 움직임 정보 또는 L1 방향의 움직임 정보 중 어느 하나가 선택적으로 이용될 수 있다.
[20]
본 발명에 따른 비디오 신호 부호화/복호화 방법 및 장치에 있어서, 상기 분할 라인 상에 위치한 경계 화소 또는 상기 경계 화소의 주변 화소 중 적어도 하나는, 상기 현재 블록의 제1 예측 유닛의 화소와 제2 예측 유닛의 화소에 소정의 가중치를 적용하여 예측될 수 있다.
[21]
본 발명에 따른 비디오 비트스트림을 저장하기 위한 디지털 저장 매체는, 현재 블록을 2개의 예측 유닛으로 분할하고, 여기서, 상기 2개의 예측 유닛 중 적어도 하나의 형태는 삼각형임, 상기 현재 블록의 머지 후보 리스트를 구성하며, 상기 현재 블록의 머지 후보 인덱스와 상기 머지 후보 리스트를 이용하여 상기 현재 블록의 움직임 정보를 유도하고, 상기 유도된 움직임 정보를 이용하여 상기 현재 블록의 인터 예측을 수행하는 처리를 실행하는 비디오 복호화 프로그램을 기록/저장할 수 있다.

발명의 효과

[22]
본 발명은 소정의 단위로 픽쳐를 분할하여 부호화/복호화를 수행함으로써, 비디오 신호의 부호화/복호화 효율을 향상시킬 수 있다.
[23]
본 발명은 세분화된 방향성 모드 및/또는 선택적인 화소 라인을 이용함으로써 인트라 예측의 부호화 효율을 향상시킬 수 있다.
[24]
본 발명은 어파인 모드 또는 인터 영역 움직임 정보를 이용함으로써, 인터 예측의 부호화 효율을 향상시킬 수 있다.
[25]
본 발명은 삼각 예측 유닛 부호화를 이용한 인터 예측 방법을 통해 비디오 신호 코딩 효율을 향상 시킬 수 있다.
[26]
본 발명은 휘도 영역에 대한 다운샘플링/서브샘플링을 통해 성분 간 참조 기반의 예측 효율을 향상시킬 수 있다.

도면의 간단한 설명

[27]
도 1은 본 발명에 따른 영상 부호화 장치를 나타낸 블록도이다.
[28]
도 2는 본 발명에 따른 영상 복호화 장치를 나타낸 블록도이다.
[29]
도 3 내지 도 7은 본 발명이 적용되는 일실시예로서, 픽쳐를 복수의 블록으로 분할하는 방법을 도시한 것이다.
[30]
도 8은 본 발명이 적용되는 일실시예로서, 현재 블록을 복원하는 과정을 개략적으로 도시한 것이다.
[31]
도 9는 본 발명이 적용되는 일실시예로서, 인터 예측 방법을 도시한 것이다.
[32]
도 10 내지 도 27은 본 발명이 적용되는 일실시예로서, 머지 모드(merge mode)에 기반하여 삼각 예측 유닛을 예측하는 방법을 도시한 것이다.
[33]
도 28 내지 도 30은 본 발명이 적용되는 일실시예로서, 어파인 인터 예측 방법을 도시한 것이다.
[34]
도 31 내지 도 35는 본 발명이 적용되는 일실시예로서, 인트라 예측 방법을 도시한 것이다.
[35]
도 36 내지 도 39는 본 발명이 적용되는 일실시예로서, 와이드 앵글 기반의 인트라 예측 방법을 도시한 것이다.
[36]
도 40은 본 발명이 적용되는 일실시예로서, 멀티 라인 기반의 인트라 예측 방법을 도시한 것이다.
[37]
도 41은 본 발명이 적용되는 일실시예로서, 성분 간 참조 기반의 예측 방법을 도시한 것이다.
[38]
도 42 내지 도 48은 본 발명이 적용되는 일실시예로서, 휘도 블록의 주변 영역에 대한 다운샘플링 및 성분 간 참조를 위한 파라미터 유도 방법을 도시한 것이다.
[39]
도 49 및 도 50은 본 발명이 적용되는 일실시예로서, 복원 블록에 인루프 필터를 적용하는 방법을 도시한 것이다.

발명의 실시를 위한 최선의 형태

[40]
본 발명에 따른 비디오 신호 부호화/복호화 방법 및 장치는, 현재 블록을 2개의 예측 유닛으로 분할하고, 상기 현재 블록의 머지 후보 리스트를 구성하며, 상기 현재 블록의 머지 후보 인덱스와 상기 머지 후보 리스트를 이용하여 상기 현재 블록의 움직임 정보를 유도하고, 상기 유도된 움직임 정보를 이용하여, 상기 현재 블록의 인터 예측을 수행할 수 있다.
[41]
본 발명에 따른 비디오 신호 부호화/복호화 방법 및 장치에 있어서, 상기 2개의 예측 유닛 중 적어도 하나의 형태는 삼각형일 수 있다.
[42]
본 발명에 따른 비디오 신호 부호화/복호화 방법 및 장치에 있어서, 상기 분할은, 소정의 분할 라인에 관한 정보에 기초하여 수행되고, 상기 정보는 상기 분할 라인의 시작점, 끝점, 각도 또는 방향 중 적어도 적어도 하나에 관한 정보를 포함할 수 있다.
[43]
본 발명에 따른 비디오 신호 부호화/복호화 방법 및 장치에 있어서, 상기 분할은, 상기 현재 블록의 크기가 소정의 문턱크기보다 크거나 같은 경우에 한하여 수행되고, 상기 현재 블록의 크기는, 상기 현재 블록의 너비, 높이, 너비와 높이의 비율(ratio) 또는 너비와 높이의 곱으로 표현될 수 있다.
[44]
본 발명에 따른 비디오 신호 부호화/복호화 방법 및 장치에 있어서, 상기 머지 후보 리스트는, 복수의 삼각 머지 후보(triangular merge candidates)로 구성되고, 상기 삼각 머지 후보는, 공간적 머지 후보, 시간적 머지 후보 또는 소정의 크기를 가진 버퍼에 저장된 움직임 정보 중 적어도 하나를 포함할 수 있다.
[45]
본 발명에 따른 비디오 신호 부호화/복호화 방법 및 장치에 있어서, 상기 버퍼에 저장된 움직임 정보는, 상기 현재 블록 이전에 복호화가 완료된 블록의 움직임 정보를 의미할 수 있다.
[46]
본 발명에 따른 비디오 신호 부호화/복호화 방법 및 장치는, 상기 삼각 머지 후보의 최대 개수를 지시하는 개수 정보를 부호화/복호화하고, 상기 부호화/복호화된 개수 정보에 기초하여 삼각 머지 후보의 최대 개수를 설정할 수 있다.
[47]
본 발명에 따른 비디오 신호 부호화/복호화 방법 및 장치에 있어서, 상기 현재 블록에 속한 2개의 예측 유닛은 상기 하나의 머지 후보 리스트를 공유할 수 있다.
[48]
본 발명에 따른 비디오 신호 부호화/복호화 방법 및 장치에 있어서, 상기 머지 후보 인덱스는, 상기 현재 블록의 제1 예측 유닛에 대한 제1 머지 후보 인덱스와 상기 현재 블록의 제2 예측 유닛에 대한 제2 머지 후보 인덱스를 포함하고, 상기 제1 머지 후보 인덱스와 상기 제2 머지 후보 인덱스는 각각 부호화/복호화될 수 있다.
[49]
본 발명에 따른 비디오 신호 부호화/복호화 방법 및 장치에 있어서, 상기 제1 예측 유닛의 움직임 정보는, 상기 제1 머지 후보 인덱스에 의해 특정된 삼각 머지 후보를 이용하여 유도되고, 상기 제2 예측 유닛의 움직임 정보는, 상기 제1 머지 후보 인덱스와 상기 제2 머지 후보 인덱스를 기반으로 특정된 삼각 머지 후보를 이용하여 유도될 수 있다.
[50]
본 발명에 따른 비디오 신호 부호화/복호화 방법 및 장치에 있어서, 상기 머지 후보 인덱스의 값에 따라, 상기 특정된 삼각 머지 후보의 L0 방향의 움직임 정보 또는 L1 방향의 움직임 정보 중 어느 하나가 선택적으로 이용될 수 있다.
[51]
본 발명에 따른 비디오 신호 부호화/복호화 방법 및 장치에 있어서, 상기 분할 라인 상에 위치한 경계 화소 또는 상기 경계 화소의 주변 화소 중 적어도 하나는, 상기 현재 블록의 제1 예측 유닛의 화소와 제2 예측 유닛의 화소에 소정의 가중치를 적용하여 예측될 수 있다.
[52]
본 발명에 따른 비디오 비트스트림을 저장하기 위한 디지털 저장 매체는, 현재 블록을 2개의 예측 유닛으로 분할하고, 여기서, 상기 2개의 예측 유닛 중 적어도 하나의 형태는 삼각형임, 상기 현재 블록의 머지 후보 리스트를 구성하며, 상기 현재 블록의 머지 후보 인덱스와 상기 머지 후보 리스트를 이용하여 상기 현재 블록의 움직임 정보를 유도하고, 상기 유도된 움직임 정보를 이용하여 상기 현재 블록의 인터 예측을 수행하는 처리를 실행하는 비디오 복호화 프로그램을 기록/저장할 수 있다.

발명의 실시를 위한 형태

[53]
본 명세서에 첨부된 도면을 참조하여 본 발명이 속하는 기술 분야에서 통상의 지식을 가진 자가 용이하게 실시할 수 있도록 본 발명의 실시예를 상세히 설명한다. 그러나 본 발명은 여러 가지 상이한 형태로 구현될 수 있으며 여기에서 설명하는 실시예에 한정되지 않는다. 그리고 도면에서 본 발명을 명확하게 설명하기 위해서 설명과 관계없는 부분은 생략하였으며, 명세서 전체를 통하여 유사한 부분에 대해서는 유사한 도면 부호를 붙였다.
[54]
본 명세서 전체에서, 어떤 부분이 다른 부분과 '연결'되어 있다고 할 때, 이는 직접적으로 연결되어 있는 경우뿐 아니라, 그 중간에 다른 소자를 사이에 두고 전기적으로 연결되어 있는 경우도 포함한다.
[55]
또한, 본 명세서 전체에서 어떤 부분이 어떤 구성요소를 '포함'한다고 할 때, 이는 특별히 반대되는 기재가 없는 한 다른 구성요소를 제외하는 것이 아니라 다른 구성 요소를 더 포함할 수 있는 것을 의미한다.
[56]
또한, 제1, 제2 등의 용어는 다양한 구성요소들을 설명하는데 사용될 수 있지만, 상기 구성요소들은 상기 용어들에 의해 한정되어서는 안 된다. 상기 용어들은 하나의 구성요소를 다른 구성요소로부터 구별하는 목적으로만 사용된다.
[57]
또한, 본 명세서에서 설명되는 장치 및 방법에 관한 실시예에 있어서, 장치의 구성 일부 또는 방법의 단계 일부는 생략될 수 있다. 또한 장치의 구성 일부 또는 방법의 단계 일부의 순서가 변경될 수 있다. 또한 장치의 구성 일부 또는 방법의 단계 일부에 다른 구성 또는 다른 단계가 삽입될 수 있다.
[58]
또한, 본 발명의 제1 실시예의 일부 구성 또는 일부 단계는 본 발명의 제2 실시예에 부가되거나, 제2 실시예의 일부 구성 또는 일부 단계를 대체할 수 있다.
[59]
덧붙여, 본 발명의 실시예에 나타나는 구성부들은 서로 다른 특징적인 기능들을 나타내기 위해 독립적으로 도시되는 것으로, 각 구성부들이 분리된 하드웨어나 하나의 소프트웨어 구성단위로 이루어짐을 의미하지 않는다. 즉, 각 구성부는 설명의 편의상 각각의 구성부로 나열하여 기술되고, 각 구성부 중 적어도 두 개의 구성부가 합쳐져 하나의 구성부로 이루어지거나, 하나의 구성부가 복수 개의 구성부로 나뉘어져 기능을 수행할 수 있다. 이러한 각 구성부의 통합된 실시예 및 분리된 실시예도 본 발명의 본질에서 벗어나지 않는 한 본 발명의 권리 범위에 포함된다.
[60]
본 명세서에서, 블록은 단위, 영역, 유닛, 파티션 등으로 다양하게 표현될 수 있고, 샘플은 화소, 펠(pel), 픽셀 등으로 다양하게 표현될 수 있다.
[61]
이하, 첨부한 도면들을 참조하여, 본 발명의 실시예를 보다 상세하게 설명하고자 한다. 본 발명을 설명함에 있어 동일한 구성요소에 대해서 중복된 설명은 생략한다.
[62]
[63]
도 1은 본 발명에 따른 영상 부호화 장치를 나타낸 블록도이다.
[64]
도 1을 참조하면, 종래 영상 부호화 장치(100)는 픽쳐 분할부(110), 예측부(120, 125), 변환부(130), 양자화부(135), 재정렬부(160), 엔트로피 부호화부(165), 역양자화부(140), 역변환부(145), 필터부(150) 및 메모리(155)를 포함할 수 있다.
[65]
픽쳐 분할부(110)는 입력된 픽쳐를 적어도 하나의 처리 단위로 분할할 수 있다. 이때, 처리 단위는 예측 단위(Prediction Unit: PU)일 수도 있고, 변환 단위(Transform Unit: TU)일 수도 있으며, 부호화 단위(Coding Unit: CU)일 수도 있다. 이하, 본 발명의 실시예에서는 부호화 단위는 부호화를 수행하는 단위의 의미로 사용할 수도 있고, 복호화를 수행하는 단위의 의미로 사용할 수도 있다.
[66]
예측 단위는 하나의 부호화 단위 내에서 동일한 크기의 적어도 하나의 정사각형 또는 직사각형 등의 형태를 가지고 분할된 것일 수도 있고, 하나의 부호화 단위 내에서 분할된 예측 단위 중 어느 하나의 예측 단위가 다른 하나의 예측 단위와 상이한 형태 및/또는 크기를 가지도록 분할된 것일 수도 있다. 부호화 단위를 기초로 인트라 예측을 수행하는 예측 단위를 생성시 최소 부호화 단위가 아닌 경우, 복수의 예측 단위 NxN 으로 분할하지 않고 인트라 예측을 수행할 수 있다.
[67]
예측부(120, 125)는 인터 예측 또는 화면 간 예측을 수행하는 인터 예측부(120)와 인트라 예측 또는 화면 내 예측을 수행하는 인트라 예측부(125)를 포함할 수 있다. 예측 단위에 대해 인터 예측을 사용할 것인지 또는 인트라 예측을 수행할 것인지를 결정하고, 각 예측 방법에 따른 구체적인 정보(예컨대, 인트라 예측 모드, 움직임 벡터, 참조 픽쳐 등)를 결정할 수 있다. 생성된 예측 블록과 원본 블록 사이의 잔차값(잔차 블록)은 변환부(130)로 입력될 수 있다. 또한, 예측을 위해 사용한 예측 모드 정보, 움직임 벡터 정보 등은 잔차값과 함께 엔트로피 부호화부(165)에서 부호화되어 복호화기에 전달될 수 있다.
[68]
인터 예측부(120)는 현재 픽쳐의 이전 픽쳐 또는 이후 픽쳐 중 적어도 하나의 픽쳐의 정보를 기초로 예측 단위를 예측할 수도 있고, 경우에 따라서는 현재 픽쳐 내의 부호화가 완료된 일부 영역의 정보를 기초로 예측 단위를 예측할 수도 있다. 인터 예측부(120)는 참조 픽쳐 보간부, 움직임 예측부, 움직임 보상부를 포함할 수 있다.
[69]
참조 픽쳐 보간부에서는 메모리(155)로부터 참조 픽쳐 정보를 제공받고 참조 픽쳐에서 정수 화소 이하의 화소 정보를 생성할 수 있다. 휘도 화소의 경우, 1/4 화소 단위로 정수 화소 이하의 화소 정보를 생성하기 위해 필터 계수를 달리하는 DCT 기반의 8탭 보간 필터(DCT-based Interpolation Filter)가 사용될 수 있다. 색차 신호의 경우 1/8 화소 단위로 정수 화소 이하의 화소 정보를 생성하기 위해 필터 계수를 달리하는 DCT 기반의 4탭 보간 필터(DCT-based Interpolation Filter)가 사용될 수 있다.
[70]
움직임 예측부는 참조 픽쳐 보간부에 의해 보간된 참조 픽쳐를 기초로 움직임 예측을 수행할 수 있다. 움직임 벡터를 산출하기 위한 방법으로 FBMA(Full search-based Block Matching Algorithm), TSS(Three Step Search), NTS(New Three-Step Search Algorithm) 등 다양한 방법이 사용될 수 있다. 움직임 벡터는 보간된 화소를 기초로 1/2 또는 1/4 화소 단위의 움직임 벡터값을 가질 수 있다. 움직임 예측부에서는 움직임 예측 방법을 다르게 하여 현재 예측 단위를 예측할 수 있다. 움직임 예측 방법으로 스킵 모드(Skip Mode), 병합 모드(Merge 모드), AMVP 모드(AMVP Mode), 인트라 블록 카피(Intra Block Copy) 모드, 어파인 모드(Affine mode) 등 다양한 방법이 사용될 수 있다.
[71]
인트라 예측부(125)는 현재 픽쳐 내의 화소 정보인 현재 블록 주변의 참조 픽셀 정보를 기초로 예측 단위를 생성할 수 있다. 현재 예측 단위의 주변 블록이 인터 예측을 수행한 블록이어서, 참조 픽셀이 인터 예측을 수행한 픽셀일 경우, 인터 예측을 수행한 블록에 포함되는 참조 픽셀을 주변의 인트라 예측을 수행한 블록의 참조 픽셀 정보로 대체하여 사용할 수 있다. 즉, 참조 픽셀이 가용하지 않는 경우, 가용하지 않은 참조 픽셀 정보를 가용한 참조 픽셀 중 적어도 하나의 참조 픽셀로 대체하여 사용할 수 있다.
[72]
또한, 예측부(120, 125)에서 생성된 예측 단위를 기초로 예측을 수행한 예측 단위와 예측 단위의 원본 블록과 차이값인 잔차값(Residual) 정보를 포함하는 잔차 블록이 생성될 수 있다. 생성된 잔차 블록은 변환부(130)로 입력될 수 있다.
[73]
변환부(130)에서는 원본 블록과 예측부(120, 125)를 통해 생성된 예측 단위의 잔차값(residual)정보를 포함한 잔차 블록을 DCT(Discrete Cosine Transform), DST(Discrete Sine Transform), KLT와 같은 변환 방법을 사용하여 변환시킬 수 있다. 잔차 블록을 변환하기 위해 DCT를 적용할지, DST를 적용할지 또는 KLT를 적용할지는 잔차 블록을 생성하기 위해 사용된 예측 단위의 인트라 예측 모드 정보를 기초로 결정할 수 있다.
[74]
양자화부(135)는 변환부(130)에서 주파수 영역으로 변환된 값들을 양자화할 수 있다. 블록에 따라 또는 영상의 중요도에 따라 양자화 계수는 변할 수 있다. 양자화부(135)에서 산출된 값은 역양자화부(140)와 재정렬부(160)에 제공될 수 있다.
[75]
재정렬부(160)는 양자화된 잔차값에 대해 계수값의 재정렬을 수행할 수 있다.
[76]
재정렬부(160)는 계수 스캐닝(Coefficient Scanning) 방법을 통해 2차원의 블록 형태 계수를 1차원의 벡터 형태로 변경할 수 있다. 예를 들어, 재정렬부(160)에서는 지그-재그 스캔(Zig-Zag Scan)방법을 이용하여 DC 계수부터 고주파수 영역의 계수까지 스캔하여 1차원 벡터 형태로 변경시킬 수 있다. 변환 단위의 크기 및 인트라 예측 모드에 따라 지그-재그 스캔 대신 2차원의 블록 형태 계수를 열 방향으로 스캔하는 수직 스캔, 2차원의 블록 형태 계수를 행 방향으로 스캔하는 수평 스캔이 사용될 수도 있다. 즉, 변환 단위의 크기 및 인트라 예측 모드에 따라 지그-재그 스캔, 수직 방향 스캔 및 수평 방향 스캔 중 어떠한 스캔 방법이 사용될지 여부를 결정할 수 있다.
[77]
엔트로피 부호화부(165)는 재정렬부(160)에 의해 산출된 값들을 기초로 엔트로피 부호화를 수행할 수 있다. 엔트로피 부호화는 예를 들어, 지수 골롬(Exponential Golomb), CAVLC(Context-Adaptive Variable Length Coding), CABAC(Context-Adaptive Binary Arithmetic Coding)과 같은 다양한 부호화 방법을 사용할 수 있다. 관련하여, 엔트로피 부호화부(165)는 재정렬부(160) 및 예측부(120, 125)로부터 부호화 단위의 잔차값 계수 정보를 부호화 할 수 있다. 또한, 본 발명에 따라 움직임 정보를 디코더 측면에서 유도하여 사용함을 지시하는 정보 및 움직임 정보 유도에 사용된 기법에 대한 정보를 시그널링(signaling)하여 전송하는 것이 가능하다.
[78]
역양자화부(140) 및 역변환부(145)에서는 양자화부(135)에서 양자화된 값들을 역양자화하고 변환부(130)에서 변환된 값들을 역변환한다. 역양자화부(140) 및 역변환부(145)에서 생성된 잔차값(Residual)은 예측부(120, 125)에 포함된 움직임 추정부, 움직임 보상부 및 인트라 예측부를 통해서 예측된 예측 단위와 합쳐져 복원 블록(Reconstructed Block)을 생성할 수 있다.
[79]
필터부(150)는 디블록킹 필터, 오프셋 보정부, ALF(Adaptive Loop Filter)중 적어도 하나를 포함할 수 있다. 디블록킹 필터는 복원된 픽쳐에서 블록간의 경계로 인해 생긴 블록 왜곡을 제거할 수 있다. 오프셋 보정부는 디블록킹을 수행한 영상에 대해 픽셀 단위로 원본 영상과의 오프셋을 보정할 수 있다. 특정 픽쳐에 대한 오프셋 보정을 수행하기 위해 영상에 포함된 픽셀을 일정한 수의 영역으로 구분한 후 오프셋을 수행할 영역을 결정하고 해당 영역에 오프셋을 적용하는 방법 또는 각 픽셀의 에지 정보를 고려하여 오프셋을 적용하는 방법을 사용할 수 있다. ALF(Adaptive Loop Filtering)는 필터링한 복원 영상과 원래의 영상을 비교한 값을 기초로 수행될 수 있다. 영상에 포함된 픽셀을 소정의 그룹으로 나눈 후 해당 그룹에 적용될 하나의 필터를 결정하여 그룹마다 차별적으로 필터링을 수행할 수 있다.
[80]
메모리(155)는 필터부(150)를 통해 산출된 복원 블록 또는 픽쳐를 저장할 수 있고, 저장된 복원 블록 또는 픽쳐는 인터 예측을 수행 시 예측부(120, 125)에 제공될 수 있다.
[81]
[82]
도 2는 본 발명에 따른 영상 복호화 장치를 나타낸 블록도이다.
[83]
도 2를 참조하면, 영상 복호화기(200)는 엔트로피 복호화부(210), 재정렬부(215), 역양자화부(220), 역변환부(225), 예측부(230, 235), 필터부(240), 메모리(245)가 포함될 수 있다.
[84]
영상 부호화기에서 영상 비트스트림이 입력된 경우, 입력된 비트스트림은 영상 부호화기와 반대의 절차로 복호화될 수 있다.
[85]
엔트로피 복호화부(210)는 영상 부호화기의 엔트로피 부호화부에서 엔트로피 부호화를 수행한 것과 반대의 절차로 엔트로피 복호화를 수행할 수 있다. 예를 들어, 영상 부호화기에서 수행된 방법에 대응하여 지수 골롬(Exponential Golomb), CAVLC(Context-Adaptive Variable Length Coding), CABAC(Context-Adaptive Binary Arithmetic Coding)과 같은 다양한 방법이 적용될 수 있다.
[86]
엔트로피 복호화부(210)에서는 부호화기에서 수행된 인트라 예측 및 인터 예측에 관련된 정보를 복호화할 수 있다.
[87]
재정렬부(215)는 엔트로피 복호화부(210)에서 엔트로피 복호화된 비트스트림을 부호화부에서 재정렬한 방법을 기초로 재정렬을 수행할 수 있다. 1차원 벡터 형태로 표현된 계수들을 다시 2차원의 블록 형태의 계수로 복원하여 재정렬할 수 있다.
[88]
역양자화부(220)는 부호화기에서 제공된 양자화 파라미터와 재정렬된 블록의 계수값을 기초로 역양자화를 수행할 수 있다.
[89]
역변환부(225)는 영상 부호화기에서 수행한 양자화 결과에 대해 변환부에서 수행한 변환 즉, DCT, DST, 및 KLT에 대해 역변환 즉, 역 DCT, 역 DST 및 역 KLT를 수행할 수 있다. 역변환은 영상 부호화기에서 결정된 전송 단위를 기초로 수행될 수 있다. 영상 복호화기의 역변환부(225)에서는 예측 방법, 현재 블록의 크기 및 예측 방향 등 복수의 정보에 따라 변환 기법(예를 들어, DCT, DST, KLT)이 선택적으로 수행될 수 있다.
[90]
예측부(230, 235)는 엔트로피 복호화부(210)에서 제공된 예측 블록 생성 관련 정보와 메모리(245)에서 제공된 이전에 복호화된 블록 또는 픽쳐 정보를 기초로 예측 블록을 생성할 수 있다.
[91]
전술한 바와 같이 영상 부호화기에서의 동작과 동일하게 인트라 예측 또는 화면 내 예측을 수행시 예측 단위의 크기와 변환 단위의 크기가 동일할 경우, 예측 단위의 좌측에 존재하는 픽셀, 좌측 상단에 존재하는 픽셀, 상단에 존재하는 픽셀을 기초로 예측 단위에 대한 인트라 예측을 수행하지만, 인트라 예측을 수행시 예측 단위의 크기와 변환 단위의 크기가 상이할 경우, 변환 단위를 기초로 한 참조 픽셀을 이용하여 인트라 예측을 수행할 수 있다. 또한, 최소 부호화 단위에 대해서만 NxN 분할을 사용하는 인트라 예측을 사용할 수도 있다.
[92]
예측부(230, 235)는 예측 단위 판별부, 인터 예측부 및 인트라 예측부를 포함할 수 있다. 예측 단위 판별부는 엔트로피 복호화부(210)에서 입력되는 예측 단위 정보, 인트라 예측 방법의 예측 모드 정보, 인터 예측 방법의 움직임 예측 관련 정보 등 다양한 정보를 입력 받고 현재 부호화 단위에서 예측 단위를 구분하고, 예측 단위가 인터 예측을 수행하는지 아니면 인트라 예측을 수행하는지 여부를 판별할 수 있다. 반면, 만약 부호화기(100)에서 상기 인터 예측을 위한 움직임 예측 관련 정보를 전송하지 않고, 대신 움직임 정보를 디코더 측면에서 유도하여 사용함을 지시하는 정보 및 움직임 정보 유도에 사용된 기법에 대한 정보를 전송하는 경우에는, 상기 예측 단위 판별부는 부호화기(100)로부터 전송된 정보를 기초로 하여, 인터 예측부(230)의 예측 수행을 판별하게 된다.
[93]
인터 예측부(230)는 영상 부호화기에서 제공된 현재 예측 단위의 인터 예측에 필요한 정보를 이용해 현재 예측 단위가 포함된 현재 픽쳐의 이전 픽쳐 또는 이후 픽쳐 중 적어도 하나의 픽쳐에 포함된 정보를 기초로 현재 예측 단위에 대한 인터 예측을 수행할 수 있다. 인터 예측을 수행하기 위해 부호화 단위를 기준으로 해당 부호화 단위에 포함된 예측 단위의 움직임 예측 방법이 스킵 모드(Skip Mode), 병합 모드(Merge 모드), AMVP 모드(AMVP Mode), 인트라 블록 카피 모드(Intra block copy mode), 어파인 모드(Affine mode) 중 어떠한 방법인지 여부를 판단할 수 있다.
[94]
인트라 예측부(235)는 현재 픽쳐 내의 화소 정보를 기초로 예측 블록을 생성할 수 있다. 예측 단위가 인트라 예측을 수행한 예측 단위인 경우, 영상 부호화기에서 제공된 예측 단위의 인트라 예측 모드 정보를 기초로 인트라 예측을 수행할 수 있다.
[95]
인트라 예측부(235)에는 AIS(Adaptive Intra Smoothing) 필터, 참조 화소 보간부, DC 필터를 포함할 수 있다. AIS 필터는 현재 블록의 참조 화소에 필터링을 수행하는 부분으로써 현재 예측 단위의 예측 모드에 따라 필터의 적용 여부를 결정하여 적용할 수 있다. 영상 부호화기에서 제공된 예측 단위의 예측 모드 및 AIS 필터 정보를 이용하여 현재 블록의 참조 화소에 AIS 필터링을 수행할 수 있다. 현재 블록의 예측 모드가 AIS 필터링을 수행하지 않는 모드일 경우, AIS 필터는 적용되지 않을 수 있다.
[96]
참조 화소 보간부는 예측 단위의 예측 모드가 참조 화소를 보간한 화소값을 기초로 인트라 예측을 수행하는 예측 단위일 경우, 참조 화소를 보간하여 정수값 이하의 화소 단위의 참조 화소를 생성할 수 있다. 현재 예측 단위의 예측 모드가 참조 화소를 보간하지 않고 예측 블록을 생성하는 예측 모드일 경우 참조 화소는 보간되지 않을 수 있다. DC 필터는 현재 블록의 예측 모드가 DC 모드일 경우 필터링을 통해서 예측 블록을 생성할 수 있다.
[97]
복원된 블록 또는 픽쳐는 필터부(240)로 제공될 수 있다. 필터부(240)는 디블록킹 필터, 오프셋 보정부, ALF를 포함할 수 있다.
[98]
영상 부호화기로부터 해당 블록 또는 픽쳐에 디블록킹 필터를 적용하였는지 여부에 대한 정보 및 디블록킹 필터를 적용하였을 경우, 강한 필터를 적용하였는지 또는 약한 필터를 적용하였는지에 대한 정보를 제공받을 수 있다. 영상 복호화기의 디블록킹 필터에서는 영상 부호화기에서 제공된 디블록킹 필터 관련 정보를 제공받고 영상 복호화기에서 해당 블록에 대한 디블록킹 필터링을 수행할 수 있다.
[99]
오프셋 보정부는 부호화시 영상에 적용된 오프셋 보정의 종류 및 오프셋 값 정보 등을 기초로 복원된 영상에 오프셋 보정을 수행할 수 있다. ALF는 부호화기로부터 제공된 ALF 적용 여부 정보, ALF 계수 정보 등을 기초로 부호화 단위에 적용될 수 있다. 이러한 ALF 정보는 특정한 파라메터 셋에 포함되어 제공될 수 있다.
[100]
메모리(245)는 복원된 픽쳐 또는 블록을 저장하여 참조 픽쳐 또는 참조 블록으로 사용할 수 있도록 할 수 있고 또한 복원된 픽쳐를 출력부로 제공할 수 있다.
[101]
[102]
도 3 내지 도 7은 본 발명이 적용되는 일실시예로서, 픽쳐를 복수의 블록으로 분할하는 방법을 도시한 것이다.
[103]
도 3을 참조하면, 픽쳐(300)는복수개의 기본 코딩 유닛(Coding Tree Unit, 이하, CTU)으로 나누어진다.
[104]
픽쳐 또는 비디오 시퀀스 단위로 CTU의 크기를 규정할 수 있으며, 각 CTU는 다른 CTU와 겹치지 않도록 구성되어 있다. 예를 들어, 전체 시퀀스에서 CTU 사이즈를 128x128로 설정할 수 있고, 픽쳐 단위로 128x128 내지 256x256 중 어느 하나를 선택해서 사용할 수도 있다.
[105]
CTU를 계층적으로 분할하여 코딩 블록/코딩 유닛(Coding Unit, 이하 CU)을 생성할 수 있다. 코딩 유닛 단위로 예측 및 변환을 수행할 수 있으며, 예측 부호화 모드를 결정하는 기본 단위가 된다. 예측 부호화 모드는 예측 영상을 생성하는 방법을 나타내며, 화면 내 예측 (intra prediction, 이하, 인트라 예측), 화면 간 예측(inter prediction, 이하, 인터 예측) 또는 복합 예측(combined prediction) 등을 예로 들 수 있다. 구체적으로 예를 들어, 코딩 유닛 단위로 인트라 예측, 인터 예측 또는 복합 예측 중 적어도 어느 하나의 예측 부호화 모드를 이용하여 예측 블록(prediction block)을 생성할 수 있다. 화면 간 예측 모드에서 참조 픽쳐가 현재 픽쳐를 가리키는 경우에는 이미 복호화된 현재 픽쳐 내 영역을 기반으로 예측 블록을 생성할 수 있다. 이는, 참조 픽쳐 인덱스와 움직임 벡터를 이용하여 예측 블록을 생성하기 때문에 화면 간 예측에 포함될 수 있다. 인트라 예측은 현재 픽쳐의 정보를 이용하여 예측 블록을 생성하는 방법이고, 인터 예측은 이미 복호화된 다른 픽쳐의 정보를 이용하여 예측 블록을 생성하는 방법이며, 복합 예측은 인터 예측과 인트라 예측을 혼합하여 사용하는 방법이다. 복합 예측은, 하나의 코딩 블록을 구성하는 복수의 서브 영역 중 일부 영역은 인터 예측으로 부호화/복호화하고, 나머지 영역은 인트라 예측으로 부호화/복호화할 수 있다. 또는, 복합 예측은, 복수의 서브 영역에 대해서 1차적으로 인터 예측을 수행하고, 2차적으로 인트라 예측을 수행할 수 있다. 이 경우, 코딩 블록의 예측값은, 인터 예측에 따른 예측값과 인트라 예측에 따른 예측값을 가중 평균하여 유도될 수 있다. 하나의 코딩 블록을 구성하는 서브 영역의 개수는, 2개, 3개, 4개 또는 그 이상일 수 있고, 서브 영역의 형태는, 사각형, 삼각형, 기타 다각형일 수 있다.
[106]
도 4를 참조하면, CTU는 쿼드 트리, 바이너리 트리 또는 트리플 트리 형태로 분할 (파티셔닝)될 수 있다. 분할된 블록은 다시 쿼드 트리, 바이너리 트리 또는 트리플 트리 형태로 추가 분할될 수 있다. 현재 블록을 4개의 정방 형태 파티션으로 나누는 방법을 쿼드 트리 파티셔닝이라고 부르고, 현재 블록을 2개의 정방 또는 비정방 형태 파티션으로 나누는 방법을 바이너리 트리 파티셔닝이라고 부르며, 현재 블록을 3개의 파티션으로 나누는 방법을 바이너리 트리 파티셔닝이라고 부른다.
[107]
수직 방향으로 바이너리 파티셔닝(도 4의 SPLIT_BT_VER)을 수직 바이너리 트리 파티셔닝이라고 부르며, 수평 방향으로 바이너리 트리 파티셔닝 (도 4의 SPLIT_BT_HOR)을 수평 바이너리 트리 파티셔닝이라고 부른다.
[108]
수직 방향으로 트리플 파티셔닝 (도 4의 SPLIT_TT_VER)을 수직 트리플 트리 파티셔닝이라고 부르며, 수평 방향으로 트리플 트리 파티셔닝 (도 4의 SPLIT_TT_HOR)을 수평 트리플 트리 파티셔닝이라고 부른다.
[109]
분할 횟수를 파티셔닝 뎁스(partitioning depth)라고 부르며, 시퀀스, 픽쳐, 서브 픽쳐, 슬라이스 또는 타일 별로 파티셔닝 뎁스의 최대치를 서로 다르게 설정할 수도 있으며, 파티셔닝 트리 형태(쿼드 트리/바이너리 트리/트리플 트리)에 따라 서로 다른 파티셔닝 뎁스를 가지도록 설정할 수 있으며, 이를 나타내는 신택스를 시그날링할 수도 있다.
[110]
쿼드 트리 파티션닝, 바이너리 트리 파니셔닝 또는 기타 멀티 트리 파티셔닝(예를 들어, 터너리 트리 파티셔닝)과 같은 방법으로, 분할된 코딩 유닛을 추가로 분할하여 리프 노드(leaf node)의 코딩 유닛을 구성하거나, 추가 분할 없이 리프 노드(leaf node)의 코딩 유닛을 구성할 수도 있다.
[111]
도 5를 참조하면, 하나의 CTU를 계층적으로 분할하여 코딩 유닛을 설정할 수 있으며, 바이너리 트리 파티셔닝, 쿼드 트리 파티셔닝/트리플 트리 파티셔닝 중 적어도 어느 하나를 이용하여 코딩 유닛을 분할할 수 있다. 이와 같은 방법을 멀티 트리 파티셔닝(Multi tree partitioning)이라고 부른다.
[112]
파티셔닝 뎁스가 k인 임의의 코딩 유닛을 분할하여 생성된 코딩 유닛을 하위 코딩 유닛이라 하며, 파티셔닝 뎁스는 (k+1)이 된다. 파티셔닝 뎁스 (k+1)인 하위 코딩 유닛을 포함하고 있는 파티셔닝 뎁스 k인 코딩 유닛을 상위 코딩 유닛이라 한다.
[113]
상위 코딩 유닛의 파티셔닝 타입 및/또는 현재 코딩 유닛의 주변에 있는 코딩 유닛의 파티셔닝 타입에 따라 현재 코딩 유닛의 파티셔닝 타입이 제한될 수도 있다.
[114]
여기서, 파티셔닝 타입은 바이너리 트리 파티셔닝, 쿼드 트리 파티셔닝/트리플 트리 파티셔닝 중 어느 파티셔닝을 사용했는지를 알려주는 지시자를 나타낸다.
[115]
하드웨어 구현상 64x64 형태의 데이터 유닛보다 큰 영역의 움직임 형태를 가지는 경우에는 64x64 데이터 유닛을 중복해서 엑세스하고, 데이터를 동시에 처리하기 어려운 단점이 발생한다. 데이터를 처리하는 기본 유닛을 파이프 라인 기반 데이터 기본 유닛(Virtual Processing Data Unit,VPDU)이라한다. 도 6의 왼쪽 그림과 같이 64x64 정방 유닛 또는 가운데 내지 오른쪽 그림과 같이 4096 보다 작거나 같은 샘플을 갖는 직사각형 유닛을 VPDU로 정의할 수도 있다. 도 6에 도시된 예에서와 달리, 비-사각형 형태의 VPDU를 정의할 수도 있다. 예컨대, 삼각형, L-shape 또는 다각형의 VPDU를 정의하여 사용할 수도 있다.
[116]
허용되는 VPDU에 대한 정보(크기/형태)가 비트스트림을 통해 시그널링될 수 있다. 일 예로, 상기 정보에 따라, 정방형 VPDU만이 허용되는 것으로 결정되거나, 정방형 및 비정방향 VPDU가 허용되는 것으로 결정될 수 있다. 또 다른 예로, 타일 세트 단위 또는 시쿼스 단위로 VPDU 크기를 시그날링할 수 있으며, VPDU의 단위는 CTU 단위보다 작거나 같도록 설정될 수도 있다.
[117]
VPDU를 고려하여, CU의 분할 형태를 제한할 수 있다. 일 예로, VPDU보다 큰 비정방형 블록이 생성되는 CU 분할 형태는 허용되지 않도록 제한될 수 있다. 또는, VPDU보다 큰 비정방형 CU는 반드시 바이너리 트리/터너리 트리 분할이 수행되도록 제한될 수 있다. 즉, 바이너리 트리/터너리 트리 분할을 나타내는 플래그가 시그널링되지 않더라도, VPDU보다 큰 비정방형 CU의 플래그는 1로 유도될 수 있다.
[118]
또는, VPDU보다 큰 CU를 허용하는 한편, VPDU보다 큰 CU를 복수의 서브 블록으로 분할할 수도 있다. 여기서, 서브 블록은 예측을 수행하기 위한 예측 유닛 또는 변환/양자화를 수행하기 위한 변환 유닛으로 설정될 수 있다.
[119]
일 예로, 그림 5와 같이 코딩 유닛이 하나의 VPDU으로 정의되지 않는 경우(즉,서로 다른 VPDU를 포함하는 경우), VPDU를 고려하여 CU의 파티셔닝을 수행할 수 있다. 이때, 서브 블록을 변환 유닛(Transform Unit, TU)으로 정의할 수 있다. CU를 복수의 변환 유닛으로 분할하는 것을 VPDU 변환 유닛 파티셔닝 방법이라고 한다. 변환 유닛 단위로 변환을 수행하며, 코딩 유닛 단위로 예측을 수행할 수 있다.
[120]
구체적으로 예를 들어, 정방형의 VPDU 만이 허용되는 경우, 도 7의 CU0 및 CU3는 서로 다른 2개의 VPDU를 포함하고 있고, CU1은 서로 다른 4개의 VPDU를 포함하고 있다. 이에 따라, CU0 및 CU3은 2개의 변환 유닛으로 분할하고, CU1는 4개의 변환 유닛으로 분할 할 수 있다. 즉, CU1 중 VPDU0에 속하는 서브 블록을 TU0, VPDU1에 속하는 서브 블록을 TU1, VPDU2에 속하는 서브 블록을 TU2, VPDU3에 속하는 서브 블록을 TU3로 구성할 수 있다.
[121]
비정방형 VPDU가 허용되는 경우, CU0 및 CU3는 하나의 VPDU로 구성되는 반면, CU1은 2개의 VPDU로 구성된다. 이에 따라, CU1을 2개의 변환 유닛으로 분할할 수 있다. 구체적으로, CU1을 상하 분할하여, 정방형태인 2개의 변환 유닛을 생성하거나, CU1을 좌우 분할하여 비정방형태인 2개의 변환 유닛을 생성할 수 있다. 이때, CU의 분할 형태에 관한 정보가 비트스트림을 통해 시그널링될 수 있다. 또는, 정방형태의 분할이 비정방 형태의 분할보다 높은 우선순위를 갖도록 설정할 수 있다. 또는, 부모 노드의 분할 형태에 따라, CU의 분할 형태를 결정할 수 있다. 일 예로, 부모 노드의 분할 형태가 쿼드 트리인 경우, 정방형 변환 유닛이 생성되도록 CU를 분할하는 한편, 부모 노드의 분할 형태가 바이너리 트리 또는 트리플 트리인 경우, 비정방형 변환 유닛이 생성되도록 CU를 분할할 수 있다.
[122]
VPDU보다 큰 CU를 복수의 예측 유닛으로 분할할 수도 있다. 이 경우, 코딩 유닛 단위로 예측 모드가 결정되고, 예측 유닛 단위로 예측이 수행될 수 있다.
[123]
[124]
도 8은 본 발명이 적용되는 일실시예로서, 현재 블록을 복원하는 과정을 개략적으로 도시한 것이다.
[125]
도 8을 참조하면, 부호화/복호화 장치에 기-정의된 예측 모드를 기반으로 현재 블록의 예측 블록을 생성할 수 있다(S800).
[126]
비디오 부호화/복호화에서 예측 영상은 복수 개의 방법으로 생성할 수 있으며, 예측 영상을 생성하는 방법을 예측 부호화 모드라고 한다.
[127]
예측 부호화 모드는 인트라 예측 부호화 모드, 인터 예측 부호화 모드, 현재 픽쳐 레퍼런스 부호화 모드 또는 결합 부호화 모드(combined prediction)등으로 구성될 수 있다.
[128]
인터 예측 부호화 모드는 이전 픽쳐의 정보를 이용하여 현재 블록의 예측 블록(예측 영상)을 생성하는 예측 부호화 모드라고 하고, 인트라 예측 부호화 모드는 현재 블록과 이웃한 샘플을 이용하여 예측 블록을 생성하는 예측 부호화 모드라 한다. 현재 픽쳐의 이미 복원된 영상을 이용하여 예측 블록을 생성할 수도 있으며, 이를 현재 픽쳐 레퍼런스 모드 또는 인트라 블록 카피 모드라고 부른다.
[129]
인터 예측 부호화 모드, 인트라 예측 부호화 모드 또는 현재 픽쳐 레퍼런스 부호화 모드 중 적어도 2개 이상의 예측 부호화 모드를 사용하여 예측 블록을 생성할 수도 있으며, 이를 결합 부호화 모드(Combined prediction)이라고 부른다.
[130]
인터 예측 부호화 모드에 대해서는 도 9 내지 도 30을 참조하여 자세히 살펴보고, 인트라 예측 부호화 모드에 대해서는 도 31 내지 도 48을 참조하여 자세히 살펴보도록 한다.
[131]
도 8을 참조하면, 소정의 변환을 통해 현재 블록의 변환 블록을 생성할 수 있다(S810).
[132]
원본 영상에서 예측 영상을 차분한 영상을 잔차 영상(residual) 또는 변환 블록이라 한다.
[133]
잔차 영상에 DCT(Discrete cosine transform)와 같은 2차원 변환(Transform)을 통하여 2원 주파수 성분으로 분해할 수 있다. 영상에서 고주파 성분을 제거해도 시각적으로 왜곡이 크게 발생하지 않는 특성이 있다. 고주파에 해당하는 값을 작게 하거나 0으로 설정하면 시각적 왜곡이 크지 않으면서도 압축 효율을 크게 할 수 있다.
[134]
예측 블록의 크기나 예측 모드에 따라 DST (Discrete sine transform)을 사용할 수도 있다. 구체적으로 예를 들어, 인트라 예측 모드이고, 예측 블록/코딩 블록의 크기가 NxN 보다 작은 크기인 경우에는 DST 변환을 사용하도록 설정하고, 그 외의 예측 블록/코딩 블록에서는 DCT를 사용하도록 설정할 수도 있다.
[135]
DCT는 영상을 cos 변환을 이용하여 2차원 주파수 성분으로 분해(변환)하는 처리이고, 그 때의 주파수 성분들은 기저 영상으로 표현된다. 예를 들어, NxN 블록에서 DCT 변환을 수행하면 N 2 개의 기본 패턴 성분을 얻을 수 있다. DCT 변환을 수행한다는 것은 원화소 블록에 포함된 기본 패턴 성분들 각각의 크기를 구하는 것이다. 각 기본 패턴 성분들의 크기는 DCT 계수라고 부른다.
[136]
대체적으로 저주파에 0이 아닌 성분들이 많이 분포하는 영상에서는 이산 여현 변환(Discrete Cosine Transform, DCT)을 주로 사용하고, 고주파 성분이 많이 분포하는 영상에서는 DST (Discrete Sine Transform)을 사용할 수도 있다.
[137]
DST는 영상을 sin 변환을 이용하여 2차원 주파수 성분으로 분해(변환)하는 처리를 나타낸다. DCT 또는 DST 변환 이외의 변환 방법을 사용하여 2차원 영상을 2차원 주파수 성분으로 분해(변환)할 수 있으며, 이를 2차원 영상 변환이라고 부른다.
[138]
잔차 영상 중 특정 블록에서는 2차원 영상 변환을 수행하지 않을 수 있으며, 이를 변환 스킵(transform skip)이라고 부른다. 변환 스킵 이후에 양자화를 적용할 수 있다.
[139]
2차원 영상 내에 있는 임의의 블록을 DCT 또는 DST 또는 2차원 영상 변환을 적용할 수 있으며, 이 때 사용된 변환을 제1 변환이라고 부른다. 제1 변환을 수행 후 변환 블록의 일부 영역에서 변환을 다시 수행할 수 있으며, 이를 제2 변환이라고 부른다.
[140]
제1 변환은 복수개의 변환 코어 중 하나를 사용할 수 있다. 구체적으로 예를 들어, 변환 블록에서 DCT2 , DCT8 또는 DST7 중 어느 하나를 선택하여 사용할 수 있다. 또는 변환 블록의 수평 방향 변환과 수직 방향 변환에서 서로 다른 변환 코어를 사용할 수도 있다.
[141]
제1 변환과 제2 변환을 수행하는 블록 단위가 서로 다르게 설정할 수도 있다. 구체적으로 예를 들어, 잔차 영상의 8x8 블록에서 제1 변환을 수행한 후, 4x4 서브 블록 별로 제2 변환을 각각 수행할 수도 있다. 또 다른 예를 들어, 각 4x4 블록에서 제1 변환을 수행한 후, 8x8 크기의 블록에서 제2 변환을 각각 수행할 수도 있다.
[142]
제1 변환이 적용된 잔차 영상을 제1 변환 잔차 영상이라고 부른다.
[143]
제1 변환 잔차 영상에 DCT 또는 DST 또는 2차원 영상 변환을 적용할 수 있으며, 이 때 사용된 변환을 제2 변환이라고 부른다. 제2 변환이 적용된 2차원 영상을 제2 변환 잔차 영상이라고 부른다.
[144]
제1 변환 및/또는 제2 변환을 수행한 후의 블록 내 샘플 값을 변환 계수라고 부른다. 양자화는 블록의 에너지를 줄이기 위해 변환 계수를 기 정의된 값으로 나누는 과정을 말한다. 변환 계수에 양자화를 적용하기 위해 정의된 값을 양자화 파라미터라고 부른다.
[145]
시퀀스 단위 또는 블록 단위로 기 정의된 양자화 파라미터를 적용할 수 있다. 통상적으로 1에서 51 사이의 값으로 양자화 파라미터를 정의할 수 있다.
[146]
변환 및 양자화를 수행한 후에, 역양자화 및 역변환을 수행하여 잔차 복원 영상을 생성 할 수 있다. 잔차 복원 영상에 예측 영상을 더해서 제1 복원 영상을 생성할 수 있다.
[147]
부호화/복호화 장치에 기-정의된 n개의 변환 타입 중 적어도 하나에 기초하여, 변환 블록이 생성될 수 있다. n은 1, 2, 3, 4, 또는 그 이상의 정수일 수 있다. 상기 변환 타입으로, DCT2, DCT8, DST7, 변환 스킵 모드 등이 이용될 수 있다. 하나의 블록의 수직/수평 방향에 대해서 하나의 동일한 변환 타입만이 적용될 수도 있고, 수직/수평 방향 각각에 대해서 상이한 변환 타입이 적용될 수도 있다. 이를 위해, 하나의 동일한 변환 타입이 적용되는지 여부를 나타내는 플래그가 이용될 수 있다. 상기 플래그는 부호화 장치에서 시그날링될 수 있다.
[148]
또한, 상기 변환 타입은, 부호화 장치에서 시그날링되는 정보에 기초하여 결정되거나, 소정의 부호화 파라미터에 기초하여 결정될 수 있다. 여기서, 부호화 파라미터는, 블록의 크기, 형태, 인트라 예측 모드 또는 성분 타입(e.g., 휘도, 색차) 중 적어도 하나를 의미할 수 있다. 블록의 크기는, 너비, 높이, 너비와 높이의 비, 너비와 높이의 곱, 너비와 높이의 합/차 등으로 표현될 수 있다. 예를 들어, 현재 블록의 크기가 소정의 문턱값보다 큰 경우, 수평 방향의 변환 타입은 제1 변환 타입(e.g., DCT2)으로 결정되고, 수직 방향의 변환 타입은 제2 변환 타입(e.g., DST7)으로 결정될 수 있다. 상기 문턱값은, 0, 4, 8, 16, 32 또는 그 이상의 정수일 수 있다.
[149]
한편, 본 발명에 따른 잔차 계수는, 제1 변환 이후 제2 변환을 수행하여 획득된 것일 수 있다. 제2 변환은 현재 블록 내 일부 영역의 잔차 계수에 대해서 수행될 수 있다. 이 경우, 복호화 장치는, 상기 일부 영역에 대해 제2 역변환을 수행하고, 상기 역변환된 일부 영역을 포함한 현재 블록에 대해서 제1 역변환을 수행함으로써, 현재 블록의 변환 블록을 획득할 수 있다.
[150]
도 8을 참조하면, 예측 블록과 변환 블록을 기반으로, 현재 블록을 복원할 수 있다(S820).
[151]
복원된 현재 블록에 대해서 소정의 인-루프 필터가 적용될 수 있다. 인-루프 필터는, 디블록킹 필터, SAO(sample adaptive offset) 필터 또는 ALF(adaptive loop filter) 중 적어도 하나를 포함할 수 있으며, 도 48 및 도 49를 참조하여 살펴보기로 한다.
[152]
[153]
도 9는 본 발명이 적용되는 일실시예로서, 인터 예측 방법을 도시한 것이다.
[154]
이전 픽쳐의 정보를 이용하여 현재 픽쳐에 있는 블록의 예측 블록(예측 영상)을 생성하는 방법을 인터 예측 부호화 모드라고 부른다.
[155]
예를 들어, 이전 픽쳐의 해당 블록(co-located block/co-located 블록)을 기반으로 예측 영상을 생성하거나, 이전 픽쳐의 특정 블록을 기반으로 예측 블록(예측 영상)을 생성할 수 있다.
[156]
여기서 특정 블록은 motion vector로부터 유도될 수 있다. 동일 위치 블록은 도 9와 같이 현재 블록과 좌상단 샘플의 위치 및 크기가 같은 해당 픽쳐의 블록을 나타낸다. 해당 픽쳐는 참조 픽쳐 레퍼런스와 같은 신택스로 부터 특정될 수 있다.
[157]
인터 예측 부호화 모드에서는 오브젝트의 움직임을 고려하여 예측 블록을 생성할 수 있다.
[158]
예를 들어, 이전 픽쳐에 있는 오브젝트가 현재 픽쳐에서 어느 방향으로 어느 정도 움직였는지 알면 현재 블록에서 움직임을 고려한 블록을 차분하여 예측 블록(예측 영상)을 생성할 수 있으며, 이를 움직임 예측 블록이라고 부른다.
[159]
현재 블록에서 움직임 예측 블록 또는 해당 예측 블록을 차분하여 잔차 블록을 생성할 수 있다.
[160]
오브젝트에 움직임이 발생하면, 해당 예측 블록보다 움직임 예측 블록을 사용하면 잔차 블록의 에너지가 작아져서 압축 성능이 좋아질 수 있다.
[161]
이와 같이 움직임 예측 블록을 이용하는 방법을 움직임 보상 예측이라고 부르며, 대부분의 인터 예측 부호화에서는 움직임 보상 예측을 사용한다.
[162]
이전 픽쳐에 있는 오브젝트가 현재 픽쳐에서 어느 방향으로, 어느 정도 움직였는지를 나타내는 값을 움직임 벡터라고 한다. 움직임 벡터는 시퀀스, 픽쳐, 서브 픽쳐, 슬라이스, 타일, CTU 또는 CU의 단위로 서로 다른 화소 정밀도를 갖는 움직임 벡터를 사용할 수 있다. 예를 들어, 특정 블록에서 움직임 벡터의 화소 정밀도는 1/16, 1/8, 1/4, 1/2, 1, 2, 4 또는 8 중 적어도 어느 하나일 수 있다. 후술하는 인터 예측 부호화 모드 별로, 이용 가능한 화소 정밀도 후보의 종류 및/또는 개수가 상이할 수 있다. 예를 들어, 어파인 인터 예측 방법의 경우, k개의 화소 정밀도가 이용 가능하고, translation 움직임을 이용한 인터 예측 방법의 경우, i개의 화소 정밀도가 이용 가능하다. 현재 픽쳐 레퍼런스 모드의 경우, j개의 화소 정밀도가 이용 가능하다. 여기서, k, i와 j는 1, 2, 3, 4, 5, 또는 그 이상의 자연수일 수 있다. 다만, k는 i보다 작고, i는 j보다 작을 수 있다. 어파인 인터 예측 방법은 1/16, 1/4 또는 1 중 적어도 하나의 화소 정밀도를 이용하고, translation 움직임을 이용한 인터 예측 방법(e.g., 머지 모드, AMVP 모드)은 1/4, 1/2, 1 또는 4 중 적어도 하나의 화소 정밀도를 이용할 수 있다. 현재 픽쳐 레퍼런스 모드는, 1, 4 또는 8 중 적어도 하나의 화소 정밀도를 이용할 수 있다.
[163]
인터 예측 모드는 translation 움직임을 이용한 인터 예측 방법과 affine 움직임을 이용한 affine 인터 예측 방법이 선택적으로 사용될 수도 있다. 이하, 도 10 내지 도 30을 참조하여 살펴보기로 한다.
[164]
[165]
도 10 내지 도 27은 본 발명이 적용되는 일실시예로서, 머지 모드(merge mode)에 기반하여 삼각 예측 유닛을 예측하는 방법을 도시한 것이다.
[166]
현재 코딩 유닛의 움직임 정보(움직임 벡터, 참조 픽쳐 인덱스, 화면간 예측 모드 방향(Uni-prediction 및/또는 Bi-prediction정보 등)를 부호화 하지 않고, 주변 블록의 움직임 정보로부터 유도할 수 있다. 주변 블록 중 적어도 하나 이상의 움직임 정보를 현재 코딩 유닛의 움직임 정보로 설정할 수 있으며, 이를 머지 모드(merge mode)라고 부른다.
[167]
현재 부/복호화되는 코딩 유닛을 정사각형 및/또는 직사각형 형태 (shape)를 가지지 않는 적어도 하나 이상의 예측 유닛으로 분할한 후, 부/복호화를 수행할 수 있다. 예를 들어, 현재 코딩 유닛은 2개의 삼각형으로 분할되거나, 1개의 삼각형과 1개의 오각형으로 분할되거나, 2개의 사각형으로 분할될 수 있다.
[168]
구체적으로, 수직선, 수평선 또는 소정의 각도를 가진 라인(예를 들어, 대각선 등) 중 적어도 하나 이상의 라인을 이용하여, 코딩 유닛을 적어도 2개 이상의 예측 유닛으로 분할할 수 있다. 이때 코딩 유닛을 분할하는 라인의 시작점, 끝점, 라인 개수, 라인 각도, 라인 방향, 분할된 예측 유닛의 개수, 또는 임의의 형태를 가지는 예측 블록의 형태에 대한 정보 중 적어도 하나 이상의 정보가 비트스트림을 통해 시그널링될 수 있다. 또는, 코딩 유닛의 인트라 예측 모드, 인터 예측 모드, 이용 가능한 머지 후보의 위치 등에 따라, 코딩 유닛을 분할하는 라인의 시작점, 끝점, 라인 개수, 라인 각도, 라인 방향, 분할된 예측 유닛의 개수, 또는 임의의 형태를 가지는 예측 블록의 형태에 대한 정보 중 적어도 하나가 복호화 장치에서 묵시적으로 유도될 수 있다. 코딩 유닛을 정사각형 및/또는 직사각형 형태의 예측 유닛과는 다른 형태를 가지는 적어도 2개 이상의 예측 유닛으로 분할하고, 분할된 예측 유닛 단위로, 인트라 예측 및/또는 인터 예측을 수행할 수 있다.
[169]
도 10은 대각선을 이용하여 코딩 유닛을 2개의 예측 유닛으로 분할한 예를 나타낸다. 대각선을 이용하여 코딩 유닛을 2개의 예측 유닛으로 분할하는 것을 대칭 대각 파티셔닝이라 정의할 수 있다. 도 10에서는 코딩 유닛이 크기가 같은 2개의 삼각 형태 예측 유닛으로 분할된 것으로 도시되었다.
[170]
도 10을 참조하면, 좌측 그림을 좌삼각 파티셔닝, 우측 그림을 우삼각 파티셔닝이라고 각각 정의할 수 있다. 즉, 좌삼각 파티셔닝은 현재 블록의 좌상단과 우하단의 코너를 잇는 대각선을 이용하여 분할하는 방법을 의미하고, 우삼각 파티셔닝은 현재 블록의 우상단과 좌하단의 코너를 잇는 대각선을 이용하여 분할하는 방법을 의미할 수 있다. 코딩 유닛의 좌상단 또는 좌하단 샘플이 속한 예측 유닛을 좌삼각 예측 유닛이라고 정의할 수 있고, 코딩 유닛의 우상단 또는 우하단 샘플이 속한 예측 유닛을 우삼각 예측 유닛이라고 정의할 수 있으며, 우삼각 예측 유닛 또는 좌삼각 예측 유닛을 통칭하여 삼각 예측 유닛이라고 정의할 수 있다.
[171]
상기 대각 파티셔닝을 위해, 대각 파티셔닝의 방향을 나타내는 정보가 비트스트림을 통해 시그널링될 수 있다. 예컨대, 좌삼각 파티셔닝을 사용했는지 우삼각 파티셔닝을 사용했는지를 나타내는 신택스인 삼각 파티션 타입 플래그(triangle_partition_type_flag)를 시그날링 할 수 있다.triangle_partion_type_flag 값이 0이면, 좌삼각 파티셔닝을 나타내고, triangle_partition_type_flag 값이 1이면, 우삼각 파티셔닝을 나타낸다. 역으로, triangle_partion_type_flag 값이 0이면, 우삼각 파티셔닝을 나타내고, triangle_partition_type_flag 값이 1이면, 좌삼각 파티셔닝을 나타낼 수도 있다.
[172]
시퀀스, 픽쳐, 슬라이스, 타일, CTU 행, CTU 또는 CU 중 적어도 하나 이상의 단위로, 대각 파티셔닝의 방향을 나타내는 정보가 시그널링될 수 있다. 이 경우, 상기 정보가 시그널링되는 레벨에 포함된 코딩 유닛들 중 대각 파티셔닝이 적용되는 코딩 유닛들은 동일한 파티션 형태를 가질 수 있다.
[173]
다른 예로, 코딩 유닛의 삼각 파티셔닝 타입은, 코딩 유닛에 이웃하는 이웃 코딩 유닛의 삼각 파티셔닝 타입을 기초로 결정될 수 있다. 일 예로, 코딩 유닛의 삼각 파티셔닝 타입은 이웃 코딩 유닛의 삼각 파티셔닝 타입과 동일하게 결정될 수 있다. 여기서, 이웃 코딩 유닛은, 현재 코딩 유닛의 대각 방향에 인접 위치하는 이웃 블록, 현재 코딩 유닛의 상단 또는 좌측에 인접 위치하는 이웃 블록, 또는 co-located 블록 및 co-located 블록 주변 블록 중 적어도 하나 이상의 블록으로 정의될 수 있다.
[174]
CTU 내 첫번째 삼각 파티셔닝이 적용되는 코딩 유닛에 대해서는 대각 파티셔닝의 방향을 나타내는 정보를 시그널링하는 한편, 삼각 파티셔닝이 적용되는 두번째 이후 코딩 유닛에는 첫번째 코딩 유닛과 동일한 대각 파티셔닝 방향을 적용할 수 있다.
[175]
VPDU의 크기가 NxN로 정의된 경우에, 코딩 유닛의 너비 또는 높이 중 적어도 어느 하나가 N보다 큰 코딩 유닛(CU)에서 삼각 예측 유닛을 사용하는 경우에, VPDU를 중복 엑세스하여, 인코딩/디코딩 속도 저하가 발생할 수 있다. 이때 N은 양의 정수이며 2의 배수가 되는 양의 정수로 표현될 수 있으며, 일 예로 N을 64로 설정할 수 있다. 이에, 코딩 유닛의 너비 및/또는 높이 중 적어도 하나 이상이 N보다 큰 경우(예컨대, 너비 또는 높이 중 적어도 어느 하나가 128인 경우)에는 삼각 예측 유닛을 사용하지 않도록 제한할 수 있다. 일 예로, 도 11과 같이 128xM 형태의 코딩 유닛 또는 Mx128 형태의 코딩 유닛에서는 삼각 예측 유닛을 사용하지 않도록 제한할 수 있다. 여기서 M은 N보다 작거나 같은 값을 나타내는 양의 정수로 표현될 수 있다.
[176]
또는, 코딩 블록의 너비 및/또는 높이 중 적어도 하나 이상의 값이 임의로 설정된 문턱값보다 같거나 또는 큰 경우 대각 파티셔닝을 허용하지 않을 수 있다. 여기서, 문턱값은 인코더/디코더에서 기-정의된 값일 수도 있고, 문턱값에 관한 정보가 비트스트림을 통해 시그널링될 수도 있다.
[177]
또는, 병렬 처리 영역(Merge Estimation Region)의 크기와 코딩 블록의 크기에 따라, 대각 파티셔닝의 허용 여부를 결정할 수도 있다. 예컨대, 코딩 블록이 병렬 처리 영역보다 큰 경우, 삼각 예측 유닛을 이용한 부/복호화를 제한 할 수 있다.
[178]
또는, 코딩 유닛에 포함된 샘플 개수에 따라 대각 파티셔닝의 허용 여부를 결정할 수도 있다. 예컨대, 코딩 유닛에 포함된 샘플 개수가 임의로 설정된 개수 이하인 경우 및/또는 이상인 경우, 삼각 예측 유닛을 이용한 부/복호화를 제한할 수 있다.
[179]
코딩 유닛의 형태에 따라, 대각 파티셔닝의 허용 여부를 결정할 수 있다. 구체적으로, 코딩 유닛의 너비 대비 코딩 유닛의 높이 비가 큰 경우에는 또는 코딩 유닛 형태 비율 (whRatio)이 임의로 설정된 범위를 만족할 때만 대각 예측 유닛 부호화 방법을 사용하도록 허용하거나 및/또는 제한할 수 있다. 여기서 코딩 유닛 형태 비율은 다음 식(1)과 같이 (코딩 유닛의 너비(cbWsize) : 코딩 유닛의 높이 비(cbHSize))로 정의할 수 있으며, 수학식 1에서 분모, 분자의 값을 교환하여 정의할 수 있다.
[180]
[수학식 1]
[181]
whRatio = cbWSize/cbHSize
[182]
whRatio 가 임의로 설정된 값 및/또는 범위를 만족하는 경우 대각 예측 유닛 부호화 방법을 허용할 수 있거나 또는 제한 할 수 있다. 구체적으로 예를 들어, whRatio값을 16으로 설정하는 경우에는 64x4 크기 또는 4x64의 코딩 유닛에서는 대각 예측 유닛 부호화를 사용하지 않도록 제한할 수 있다.
[183]
리프 노드인 코딩 유닛의 부모 노드의 분할 방법에 따라 대각 파티셔닝의 허용 여부가 결정될 수 있다. 예컨대, 부모 노드가 QT 분할된 경우, 리프 노드인 코딩 유닛에는 대각 파티셔닝이 허용되는 한편, 부모 노드가 BT/TT 분할된 경우, 하위 리프 노드에서는 삼각 예측 유닛을 사용하지 않도록 제한할 수 있다.
[184]
또는 정방형태 코딩 유닛에서만 삼각 예측 유닛을 사용하고, 비정방 형태 코딩 유닛에서는 삼각 예측 유닛을 사용하지 않도록 제한할 수도 있다.
[185]
또는, 코딩 트리 유닛, 타일, 타일 세트(타일 그룹), 슬라이스, 픽처 , 시퀀스 단위 중 적어도 하나 이상의 단위로 대각 파티셔닝의 허용 여부를 나타내는 정보가 시그널링 될 수 있다.
[186]
또는, 코딩 유닛이 인트라 예측으로 부호화된 경우, 코딩 유닛이 인터 예측으로 부호화된 경우, 또는 코딩 유닛이 특정 인터 예측 모드(예컨대, 머지 모드, AMVP 모드, ATMVP 모드, 또는 어파인 모드 중 어느 하나)로 부호화된 경우에 한하여, 대각 파티셔닝이 허용되거나 또는 제한될 수 있다.
[187]
전술한 대각 파티셔닝을 위해, 현재 블록이 대각 파티셔닝에 기반하여 분할되는지를 나타내는 플래그가 이용될 수 있다. 예를 들어, 상기 플래그가 제1 값인 경우, 현재 블록에 대해 대각 파티셔닝이 적용되고, 그렇지 않은 경우, 대각 파티셔닝이 적용되지 않을 수 있다.
[188]
상기 플래그는 부호화 장치에서 부호화되어 시그날링되거나, 소정의 부호화 파라미터에 기반하여 복호화 장치에서 유도될 수 있다. 여기서, 부호화 파라미터는, 슬라이스 타입, 인터 모드의 타입, 블록 크기/형태, 블록의 너비와 높이의 비(ratio) 등을 포함할 수 있다.
[189]
예를 들어, 현재 블록이 속한 슬라이스 타입이 B 슬라이스인 경우에 한하여 상기 플래그가 제1 값으로 설정될 수 있다. 또는, 현재 블록이 속한 슬라이스 타입이 I 슬라이스가 아닌 경우에 한하여 상기 플래그가 제1 값으로 설정될 수 있다.
[190]
또는, 현재 블록의 인터 예측 부호화 모드가 머지 모드, 스킵 모드, AMVP 모드 또는 어파인 모드 중 적어도 하나인 경우에 한하여 상기 플래그가 제1 값으로 설정될 수 있다.
[191]
또는, 현재 블록의 너비 또는 높이 중 적어도 하나가 소정의 문턱크기보다 크거나 같은 경우에 한하여 상기 플래그가 제1 값으로 설정될 수 있다. 여기서, 문턱크기는, 4, 8, 16 또는 그 이상일 수 있다. 또는, 현재 블록에 속한 샘플의 개수(W*H)가 소정의 문턱개수보다 크거나 같은 경우에 한하여 상기 플래그가 제1 값으로 설정될 수 있다. 여기서, 문턱개수는, 32, 64 또는 그 이상일 수 있다. 또는, 현재 블록의 너비와 높이의 비가 소정의 문턱값보다 작은 경우에 한하여 상기 플래그가 제1 값으로 설정될 수 있다. 여기서, 문턱값은, 4, 8 또는 그 이상일 수 있다.
[192]
현재 코딩 유닛의 주변 블록이 대각 파티셔닝으로 부호화된 경우에는, 공간적 머지 후보의 위치에 따라 좌삼각 예측 유닛 또는 우삼각 예측 유닛 중 어느 하나의 움직임 벡터를 머지 후보로 사용할 수 있다.
[193]
일 예로, 도 12와 같이 코딩 유닛과 인접한 삼각 예측 유닛의 움직임 벡터를 머지 후보로 사용할 수 있다. 도 12의 좌측 그림에서 A1이 머지 후보로 선택된 경우, 현재 코딩 유닛과 인접한 우삼각 예측 유닛 P2의 움직임 벡터를 머지 후보로 사용할 수 있고, 도 12의 좌측 그림에서 B1이 머지 후보로 선택된 경우, 현재 코딩 유닛과 인접한 좌삼각 예측 유닛 P1의 움직임 벡터를 머지 후보로 사용할 수 있다. 또 다른 예를 들어, 도 12의 우측 그림에서 A1이 머지 후보로 선택된 경우, 현재 코딩 유닛과 인접한 우삼각 예측 유닛 P2의 움직임 벡터를 머지 후보 사용할 수 있고, 도 12의 우측 그림에서 B1이 머지 후보로 선택된 경우, 현재 코딩 유닛과 인접한 우삼각 예측 유닛 P2의 움직임 벡터를 머지 후보로 사용할 수 있다.
[194]
현재 코딩 유닛의 주변 블록 또는 co-located 블록이 대각 파티셔닝으로 부호화된 경우에는, 머지 후보가 가용하지 않은 것으로 설정할 수도 있다.
[195]
주변 코딩 유닛이 삼각 예측 유닛(이하, 주변 삼각 예측 유닛)으로 부호화된 경우, 주변 삼각 예측 유닛의 대각 파티셔닝 방향 및 움직임 정보(움직임 벡터 및 참조 픽쳐 인덱스 등)를 현재 코딩 유닛의 대각 파티셔닝 방향 및 움직임 정보로 사용할 수 있으며, 이런 방법을 삼각 머지 부호화 방법이라고 정의한다.
[196]
예를 들어, 도 13과 같이 A1을 포함하는 코딩 유닛(이하, A1 코딩 유닛)이 삼각 예측 유닛으로 구성된 경우에 A1 코딩 유닛에서 삼각 머지 부호화를 수행할 수 있다. A1 코딩 유닛의 대각 파티셔닝 방향(좌삼각 파티셔닝) 및 좌삼각 예측 유닛의 움직임 정보(A1_MVP1 등) 및 우삼각 예측 유닛의 움직임 정보(A1_MVP2 등) 를 각각 현재 코딩 유닛의 대각 파티셔닝 방향, 좌삼각 예측 유닛의 움직임 정보 및 우삼각 예측 유닛의 움직임 정보로 설정할 수 있다.
[197]
또 다른 예를 들어, 도 14와 같이 B1을 포함하는 코딩 유닛(이하, B1 코딩 유닛)이 삼각 예측 유닛으로 구성된 경우에 B1 코딩 유닛에서 삼각 머지 부호화를 수행할 수 있다. B1 코딩 유닛의 대각 파티셔닝 방향(우삼각 파티셔닝) 및 좌삼각 예측 유닛의 움직임 정보(B1_MVP1 등) 및 우삼각 예측 유닛의 움직임 정보(B1_MVP2 등)를 각각 현재 코딩 유닛의 대각 파티셔닝 방향, 좌삼각 예측 유닛의 움직임 정보 및 우삼각 예측 유닛의 움직임 정보로 설정할 수 있다.
[198]
좌삼각 예측 유닛과 우삼각 예측 유닛은 각각 별도의 움직임 정보를 가질 수 있다. 움직임 정보는, 움직임 벡터, 참조 픽쳐 인덱스, 예측 방향 플래그 또는 가중 예측 정보 중 적어도 하나를 포함할 수 있다. 각 예측 유닛의 움직임 정보는, 소정의 머지 후보 리스트로부터 유도될 수 있다. 머지 후보 리스트는, 공간적 머지 후보 또는 시간적 머지 후보 중 적어도 하나를 포함할 수 있다.
[199]
도 15를 참조하면, 공간적 머지 후보는, 현재 코딩 유닛의 좌측 블록(0), 좌하단 블록(3), 상단 블록(1), 우상단 블록(2) 또는 좌상단 블록(4) 중 적어도 하나를 포함할 수 있다.
[200]
또한, 도 16을 참조하면, 머지 모드에 사용되는 주변 블록은 인덱스 0 내지 4와 같이 현재 코딩 유닛과 인접한 블록(현재 코딩 유닛의 경계와 맞닿은 블록)일 수도 있고, 기-부/복호화가 완료된 블록으로서 현재 픽처, 슬라이스, 타일 그룹 또는 타일 중 적어도 하나에 포함된 복원 블록으로 정의될 수 있다. 일 예로, 도 16의 인덱스 5 내지 26과 같이 현재 코딩 유닛에 인접하지 않은 블록일 수도 있다. 머지 후보 리스트는 적어도 하나 이상의 주변 블록으로부터 유도된 움직임움직임 정보를 임의로 정의된 최대 개수 만큼의 움직임움직임 정보를 머지 후보 리스트에 저장할 수 있다.
[201]
시간적 머지 후보는, 콜 픽쳐(co-located picture)에 속한 하나 또는 그 이상의 콜 블록(co-located block)을 포함할 수 있다. 여기서, 콜 픽쳐는, 참조 픽쳐 리스트에 속한 복수의 참조 픽쳐 중 어느 하나이다. 콜 픽쳐는 참조 픽쳐 리스트에서 가장 처음에 위치한 픽쳐이거나 가장 마지막에 위치한 픽쳐일 수 있다. 또는, 콜 픽쳐는 콜 픽쳐를 지시하기 위해 부호화된 인덱스에 기초하여 특정될 수도 있다. 콜 블록은, 현재 블록의 중앙 위치를 포함하는 블록(7) 또는 현재 블록의 우하단 코너 위치를 포함하는 블록(6) 중 적어도 하나를 포함할 수 있다.
[202]
부호화/복호화 장치는, 현재 블록 이전에 부호화/복호화가 완료된 블록의 움직임 정보를 저장하는 버퍼를 포함할 수 있다. 상기 버퍼는 블록의 부호화/복호화 순서에 따라 순차적으로 움직임 정보를 저장하며, 버퍼의 크기를 고려하여 FIFO(first-in first-out) 방식으로 업데이트될 수 있다. 전술한 머지 후보 리스트는, 전술한 버퍼에 저장된 움직임 정보를 머지 후보로 더 포함할 수도 있으며, 이에 대해서는 도 21 내지 도 27을 참조하여 살펴보기로 한다.
[203]
현재 예측 블록에 대해 허용되는 삼각 머지 후보 개수의 최대값은 임의로 설정할 수 있다. 이를 위해, 삼각 머지 후보의 최대 개수를 특정하기 위한 개수 정보가 부호화되어 시그날링될 수 있다. 복호화 장치는, 시그날링된 개수 정보를 삼각 머지 후보의 최대 개수(MaxNumTriangleMergeCand)로 설정할 수 있다. 또는, 복호화 장치는, 머지 후보 리스트에 속한 머지 후보의 최대 개수(MaxNumMergeCand)에서 상기 개수 정보를 뺀 값을 삼각 머지 후보의 최대 개수로 설정할 수도 있다. 상기 개수 정보는, 시퀀스, 픽쳐, 슬라이스, 타일, CTU 행 또는 CTU 중 적어도 하나의 레벨에서 시그날링될 수 있다. 즉, 머지 후보의 최대 개수(MaxNumMergeCand)와 별개로 삼각 머지 후보의 최대 개수(MaxNumTriangleMergeCand)가 정의될 수 있다.
[204]
삼각 예측 유닛들은 상이한 머지 후보 리스트를 이용할 수 있다. 일 예로, 우삼각 예측 유닛의 머지 후보 리스트는, 좌삼각 예측 유닛의 머지 후보들 중 좌삼각 예측 유닛의 머지 후보 인덱스가 가리키는 머지 후보를 제외한 나머지 머지 후보들을 이용하여 구성될 수 있다. 좌삼각 예측 유닛과 우삼각 예측 유닛의 삼각 머지 후보 최대값을 상이하게 설정할 수 있다. 일 예로, 좌삼각 예측 유닛은 M개의 삼각 머지 후보를 갖는 한편, 우삼각 예측 유닛은 좌삼각 예측 유닛의 머지 후보 인덱스가 가리키는 머지 후보를 제외한 M-1개의 삼각 머지 후보를 가질 수 있다.
[205]
다른 예로, 삼각 예측 유닛들은 하나의 머지 후보 리스트를 공유할 수 있다.
[206]
공간적/시간적 머지 후보는 기-정의된 순서로 머지 후보 리스트에 추가될 수 있다. 일 예로 도 15의 머지 후보는 0 --> 1 --> 2 --> 3 --> 7 --> 4 --> 6 의 순서로 머지 후보 리스트에 추가될 수 있다. 또는, 머지 후보는 1 --> 0 --> 2 --> 3 --> 7 --> 4 --> 6 의 순서로 머지 후보 리스트에 추가될 수도 있다. 또는, 머지 후보는 1 --> 0 --> 2 --> 3 --> 4 --> 6 --> 7 의 순서로 머지 후보 리스트에 추가될 수도 있다. 다만, 공간적 머지 후보의 최대 개수는 4개로 제한될 수 있고, 이 경우 좌상단 블록(4)은 나머지 블록(0 내지 3)이 비가용인 경우에 한하여 추가될 수 있다. 시간적 머지 후보의 최대 개수는 1개로 제한될 수 있고, 이 경우 현재 블록의 중앙 위치를 포함하는 블록(7)은 현재 블록의 우하단 코너 위치를 포함하는 블록(6)이 비가용인 경우에 한하여 추가될 수 있다. 역으로, 현재 블록의 중앙 위치를 포함하는 블록(7)이 비가용인 경우에 한하여 현재 블록의 우하단 코너 위치를 포함하는 블록(6)이 추가될 수도 있다.
[207]
머지 후보 인덱스(merge_triangle_idx)에 기초하여, 머지 후보 리스트에 속한 복수의 머지 후보 중 어느 하나가 선택될 수 있다.
[208]
머지 후보 인덱스(merge_triangle_idx)는 표 1과 같이 좌삼각 예측 유닛과 우삼각 예측 유닛의 머지 후보를 쌍으로 나타낼 수도 있다. 예를 들어, merge_triangle_idx가 0이면 좌삼각 예측 유닛은 머지 후보 인덱스가 1인 머지 후보에서 움직임 정보를 유도하고, 우삼각 예측 유닛은 머지 후보 인덱스가 0인 머지 후보에서 움직임 정보를 유도할 수 있다.
[209]
[표1]
merge_triangle_idx[ xCb ][ yCb ] 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19
좌삼각 예측 유닛 1 0 0 0 2 0 0 1 3 4 0 1 1 0 0 1 1 1 1 2
우삼각 예측 유닛 0 1 2 1 0 3 4 0 0 0 2 2 2 4 3 3 4 4 3 1
merge_triangle_idx[ xCb ][ yCb ] 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39
좌삼각 예측 유닛 2 2 4 3 3 3 4 3 2 4 4 2 4 3 4 3 2 2 4 3
우삼각 예측 유닛 0 1 3 0 2 4 0 1 3 1 1 3 2 2 3 1 4 4 2 4

[210]
또 다른 예를 들어, 좌삼각 예측 유닛 또는 우삼각 예측 유닛의 머지 후보 인덱스만 시그날링하고, 나머지 예측 유닛의 머지 후보 인덱스는 시그날링된 머지 후보 인덱스로부터 유도할 수 있다.
[211]
일 예로, 좌삼각 예측 유닛의 머지 후보 인덱스만 시그널링하고, 좌삼각 예측 유닛 머지 후보 인덱스와 이웃한 머지 후보 인덱스를 우삼각 예측 유닛의 머지 후보 인덱스로 유도할 수 있다.
[212]
구체적으로 예를 들어, 좌삼각 예측 유닛 머지 후보 인덱스가 N이면, 우삼각 예측 유닛 머지 후보 인덱스를 (N+1)로 유도할 수 있다. 좌삼각 예측 유닛 머지 후보 인덱스만 부호화할 수 있고, 우삼각 예측 유닛 머지 후보 인덱스는 부호화 하지 않고, 좌삼각 예측 유닛 머지 후보 인덱스를 이용하여 유도될 수 있다.
[213]
좌삼각 예측 유닛의 머지 후보 인덱스 N이 머지 후보 리스트에 할당된 인덱스 중 최대값인 경우에는, 우삼각 예측 유닛의 머지 후보 인덱스는 (N-1)로 유도되거나, 0으로 유도될 수도 있다.
[214]
또는, 좌삼각 예측 유닛의 머지 후보 인덱스가 가리키는 머지 후보와 동일한 참조 픽처를 갖는 머지 후보로부터 우삼각 예측 유닛의 움직임 정보를 유도할 수 있다. 여기서, 동일한 참조 픽처는 L0 참조 픽처 또는 L1 참조 픽처 중 적어도 하나가 동일한 머지 후보를 나타낼 수 있다. 참조 픽처가 동일한 머지 후보가 복수개인 경우, 양방향 예측 여부 또는 좌삼각 예측 유닛의 머지 후보 인덱스가 가리키는 머지 후보와의 인덱스 차분값을 기초로 어느 하나를 선택할 수 있다.
[215]
좌삼각 예측 유닛 및 우삼각 예측 유닛 각각에 대해 머지 후보 인덱스를 시그널링할 수도 있다. 일 예로, 좌삼각 예측 유닛에 대해 제1 머지 후보 인덱스를 시그널링하고, 우삼각 예측 유닛에 대해 제2 머지 후보 인덱스를 시그널링할 수 있다. 좌삼각 예측 유닛의 움직임 정보는 제1 머지 후보 인덱스에 의해 특정된 머지 후보로부터 유도되고, 우삼각 예측 유닛의 움직임 정보는 제2 머지 후보 인덱스에 의해 특정된 머지 후보로부터 유도될 수 있다.
[216]
이때, 좌삼각 예측 유닛의 제1 머지 후보 인덱스가 가리키는 머지 후보는 우삼각 예측 유닛의 머지 후보로 이용 가능하지 않도록 설정될 수 있다. 이에 따라, 제2 머지 후보 인덱스는 제1 머지 후보 인덱스가 가리키는 머지 후보를 제외한 잔여 머지 후보들 중 어느 하나를 가리킬 수 있다. 일 예로, 제2 머지 후보 인덱스의 값이 제1 머지 후보 인덱스의 값보다 작은 경우, 우삼각 예측 유닛의 움직임 정보는 머지 후보 리스트에 포함된 머지 후보들 중 제2 머지 후보 인덱스와 동일한 인덱스를 갖는 머지 후보로부터 유도될 수 있다. 반면, 제2 머지 후보 인덱스의 값이 제1 머지 후보 인덱스의 값과 동일하거나, 제1 머지 후보 인덱스보다 큰 경우, 우삼각 예측 유닛의 움직임 정보는 머지 후보 리스트에 포함된 머지 후보들 중 제2 머지 후보 인덱스보다 1이 큰 인덱스를 갖는 머지 후보로부터 유도될 수 있다. 즉, 제2 머지 후보 인덱스는, 시그날링된 제2 머지 후보 인덱스에 1을 더한 값으로 재설정될 수 있다.
[217]
다만, 머지 후보 인덱스는 전술한 삼각 머지 후보의 최대 개수(MaxNumTriangleMergeCand)를 고려하여 선택적으로 시그날링될 수 있다. 예를 들어, 제1 머지 후보 인덱스는 MaxNumTriangleMergeCand가 1보다 큰 경우에 한하여 시그날링되고, 제2 머지 후보 인덱스는 MaxNumTriangleMergeCand가 2보다 큰 경우에 한하여 시그날링될 수 있다. 만일 MaxNumTriangleMergeCand가 1보다 크지 않은 경우, 제1 머지 후보 인덱스는 0으로 설정될 수 있다. 마찬가지로, MaxNumTriangleMergeCand가 2보다 크지 않은 경우, 제2 머지 후보 인덱스는 0으로 유도될 수 있다.
[218]
대각 파티셔닝의 경우, 메모리 대역폭을 감소시키기 위하여 각 예측 유닛이 단방향 예측만을 수행하도록 제한될 수 있으며, 이하 제한 방법에 대해서 자세히 살펴 보도록 한다.
[219]
각 예측 유닛의 머지 후보 인덱스를 고려하여, 해당 예측 유닛이 단방향 예측만을 수행하도록 제한할 수 있다(실시예 1).
[220]
예를 들어, 제1 예측 유닛의 제1 머지 후보 인덱스(mergeIdx1)가 0 또는 짝수(e.g., 2, 4, 6)인 경우, 제1 예측 유닛의 움직임 정보는, mergeIdx1에 대응하는 머지 후보의 L0 방향의 움직임 정보만을 이용하여 유도될 수 있다. 다만, mergeIdx1에 대응하는 머지 후보가 L0 방향의 움직임 정보를 가지고 있지 않을 수 있다. 이 경우, 제1 예측 유닛의 움직임 정보는 해당 머지 후보의 L1 방향의 움직임 정보를 이용하여 유도될 수 있다.
[221]
반면, 제1 예측 유닛의 제1 머지 후보 인덱스(mergeIdx1)가 홀수(e.g., 1, 3, 5)인 경우, 제1 예측 유닛의 움직임 정보는, mergeIdx1에 대응하는 머지 후보의 L1 방향의 움직임 정보만을 이용하여 유도될 수 있다. 다만, mergeIdx1에 대응하는 머지 후보가 L1 방향의 움직임 정보를 가지고 있지 않을 수 있다. 이 경우, 제1 예측 유닛의 움직임 정보는 해당 머지 후보의 L0 방향의 움직임 정보를 이용하여 유도될 수 있다.
[222]
역으로, 제1 예측 유닛의 제1 머지 후보 인덱스(mergeIdx1)가 0 또는 짝수(e.g., 2, 4, 6)인 경우, 제1 예측 유닛의 움직임 정보는 mergeIdx1에 대응하는 머지 후보의 L1 방향의 움직임 정보만을 이용하여 유도되고, 그렇지 않은 경우, 제1 예측 유닛의 움직임 정보는 mergeIdx1에 대응하는 머지 후보의 L0 방향의 움직임 정보만을 이용하여 유도될 수도 있다.
[223]
전술한 실시예는 제2 예측 유닛에도 동일하게 적용될 수 있고, 이때 제2 예측 유닛의 제2 머지 후보 인덱스는 시그날링된 제2 머지 후보 인덱스를 의미할 수도 있고, 재설정된 제2 머지 후보 인덱스를 의미할 수도 있다.
[224]
또는, 현재 코딩 유닛 내 예측 유닛의 위치에 따라, 해당 예측 유닛이 단방향 예측만을 수행하도록 제한할 수 있다(실시예 2).
[225]
예를 들어, 제1 예측 유닛은 제1 머지 후보 인덱스(mergeIdx1)에 의해 특정된 머지 후보의 L0 방향의 움직임 정보만을 참조하고, 제2 예측 유닛은 제2 머지 후보 인덱스(mergeIdx2)에 의해 특정된 머지 후보의 L1 방향의 움직임 정보만을 참조할 수 있다. 다만, mergeIdx1에 의해 특정된 머지 후보가 L0 방향의 움직임 정보를 가지고 있지 않은 경우(즉, L1 예측인 경우), 해당 머지 후보의 L1 방향의 움직임 정보를 참조할 수 있다. 마찬가지로, mergeIdx2에 의해 특정된 머지 후보가 L1 방향의 움직임 정보를 가지고 있지 않은 경우(즉, L0 예측인 경우), 해당 머지 후보의 L0 방향의 움직임 정보를 참조할 수 있다.
[226]
전술한 실시예 1 또는 2 중 어느 하나에 기초하여, 단방향 예측이 강제될 수 있다. 또는, 전술한 실시예 1과 2의 조합에 기초하여 단방향 예측이 강제될 수도 있다.좌삼각 예측 유닛 및 우삼각 예측 유닛이 이용할 수 있는 머지 후보의 범위를 상이하게 설정할 수 있다. 일 예로, 좌측 예측 유닛의 움직임 정보는 좌측 예측 유닛에 인접하는 머지 후보 중 적어도 하나로부터 유도되는 한편, 우측 예측 유닛의 움직임 정보는 우측 예측 유닛에 인접하는 머지 후보 중 적어도 하나로부터 유도될 수 있다.
[227]
또는, 코딩 유닛의 좌측에 인접한 머지 후보는 우삼각 예측 유닛에 대해 이용 불가능한 것으로 설정될 수 있다. 한편, 코딩 유닛의 상단에 인접한 머지 후보는 좌삼각 예측 유닛에 대해 이용 불가능한 것으로 설정될 수 있다.
[228]
구체적으로 예를 들어, 도 17과 같이 좌삼각 예측 유닛과 인접한 A1,A0,B2를 좌삼각 예측 유닛의 머지 후보로 설정할 수 있고, 우삼각 예측 유닛과 인접한 B0, B1, B2를 우삼각 예측 유닛의 머지 후보로 설정할 수 있다.
[229]
각 예측 유닛이 이용할 수 있는 머지 후보의 범위 또는 머지 후보의 이용 가능성은, 예측 유닛의 위치, 삼각 파티션 타입(즉, 분할 방향)에 기초하여 결정될 수 있다.
[230]
좌삼각 예측 유닛 또는 우삼각 예측 유닛 중 어느 하나의 예측 유닛에서만 머지 모드를 이용하여 움직임 벡터(이하, 제 1 삼각 예측 유닛 움직임 벡터)와 참조 픽쳐 인덱스를 유도(이하, 제 1 삼각 예측 유닛 참조 픽쳐 인덱스)하고, 다른 예측 유닛에서는 제 1 삼각 예측 유닛 움직임 벡터를 리파인(refine)하여 움직임 벡터를 유도할 수 있으며, 참조 픽쳐 인덱스는 제 1 삼각 예측 유닛 참조 픽쳐 인덱스와 동일하게 설정할 수 있다. 일 예로, 좌삼각 예측 유닛은 머지 모드를 이용하여 움직임 벡터와 참조 픽쳐 인덱스를 유도할 수 있고, 우삼각 예측 유닛의 움직임 벡터는 좌삼각 예측 유닛의 움직임 벡터 { (mvD1L0x, mvD1L0Y) , (mvD1L1x, mvD1L1Y) } 를 리파인하여 유도할 수 있고, 우삼각 예측 유닛의 참조 픽쳐 인덱스는 좌삼각 예측 유닛의 참조 픽쳐 인덱스와 동일하게 설정할 수 있다. 우삼각 예측 유닛에서는 리파인 움직임 벡터를 시그날링할 수 있다.
[231]
좌삼각 예측 유닛의 움직임 벡터를 리파인할 때는 좌삼각 예측 유닛의 움직임 벡터로 부터 특정 범위 내에 있는 값을 유도할 수 있다. (-Nx + mvD1LXx) 과 (Nx + mvD1LXx) 사이의 값, (-Ny + mvD1Lxy) 과 (Ny + mvD1Lxy) 값을 가질 수 있도록 설정할 수 있다. 여기서 X는 0 또는 1을 나타낸다.
[232]
삼각 예측 유닛의 위치 또는 삼각 예측 파티션 타입(즉, 대각 분할 방향) 중 적어도 하나를 기초로, 리파인 움직임 벡터(Nx 또는 Ny)의 부호를 유도할 수도 있다.
[233]
좌삼각 예측 유닛 또는 우삼각 예측 유닛 중 어느 하나의 예측 유닛에서만 움직임 정보(움직임 벡터 및 참조 픽쳐 인덱스)를 시그날링하고, 다른 예측 유닛에서는 머지 모드를 이용하여 움직임 정보를 유도할 수도 있다. 일 예로, 좌삼각 예측 유닛의 움직임 벡터 및 참조 픽쳐 인덱스를 시그날링하고, 우삼각 예측 유닛에서는 머지 모드를 이용하여 움직임 정보를 유도할 수도 있다. 이 경우, 디코더에서 우삼각 예측 유닛의 머지 인덱스 또는 삼각 머지 인덱스를 파싱할 수 있으며, 머지 인덱스 또는 삼각 머지 인덱스가 특정하는 주변 블록으로 부터 움직임 벡터 및 참조 픽쳐 인덱스를 유도할 수도 있다.
[234]
좌삼각 예측 유닛 또는 우삼각 예측 유닛 중 어느 하나의 예측 유닛에서만 움직임 벡터(이하, 제2 삼각 예측 유닛 움직임 벡터) 및 참조 픽쳐 인덱스(이하, 제2 삼각 예측 유닛 참조 픽쳐 인덱스)를 시그날링하고, 다른 예측 유닛의 움직임 벡터는 제2 삼각 예측 유닛 움직임 벡터를 리파인하여 유도할 수 있다. 일 예로, 좌삼각 예측 유닛에서는 움직임 벡터 및 참조 픽쳐 인덱스를 시그날링하고, 우삼각 예측 유닛에서는 리파인 움직임 벡터를 시그날링할 수 있다. 좌삼각 예측 유닛의 움직임 벡터에 우삼각 예측 유닛의 리파인 움직임 벡터를 더하여 우삼각 예측 유닛의 움직임 벡터를 유도할 수 있다.
[235]
삼각 파티션 타입 플래그를 시그날링하지 않고, 표 2와 같이 삼각 머지 후보 인덱스에 따라 좌삼각 파티셔닝 또는 우삼각 파티셔닝을 사용할지를 유도할 수도 있다. 일 예로, 삼각 머지 후보 인덱스(merge_triangle_idx) 값이 2면 우삼각 파티셔닝을 사용하고, 삼각 머지 후보 인덱스가 3이면 좌삼각 파티셔닝을 사용하도록 설정할 수 있다.
[236]
[표2]
merge_triangle_idx[ xCb ][ yCb ] 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19
TriangleDir 0 1 1 0 0 1 1 1 0 0 0 0 1 0 0 0 0 1 1 1
merge_triangle_idx[ xCb ][ yCb ] 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39
TriangleDir 1 0 0 1 1 1 1 1 1 1 0 0 1 0 1 0 0 1 0 0

[237]
코딩 유닛을 크기가 상이한 2개 이상의 예측 유닛으로 분할할 수도 있다. 예컨대, 코딩 유닛을 분할하는 라인의 시작점은 코딩 유닛의 좌상단 코너에 위치하거나, 코딩 유닛의 상단, 좌측 또는 하단 경계 중 적어도 하나에 위치할 수 있다. 상기 라인의 끝점은 코딩 유닛의 우하단 코너에 위치하거나, 코딩 유닛의 상단, 우측 또는 하단 경계 중 적어도 하나에 위치할 수 있다.
[238]
예를 들어, 도 18과 같이 분할 라인이 코딩 유닛의 4개의 코너 중 어느 하나(이하, 대각 코너 샘플)와 코딩 유닛 경계의 중앙(이하, 대각 중앙 샘플)을 지나도록 파티셔닝할 수도 있으며, 이를 비대칭 대각 파티셔닝이라 하고, 비대칭 대각 파티셔닝으로 생성된 예측 유닛을 비대칭 삼각 예측 유닛이라 정의할 수 있다. 다만, 도 18은 일예에 불과하며, 분할 라인이 코딩 유닛 경계의 중앙을 지나는 것에 한정되지 아니한다. 예를 들어, 코딩 유닛 경계의 중앙을 1/2 위치라고 정의할 경우, 분할 라인은 코딩 유닛 경계의 1/3 위치, 2/3 위치, 1/4 위치, 3/4 위치 등을 지나갈 수도 있다.
[239]
부호화/복호화 장치는, 기-정의된 복수의 비대칭 대각 파티셔닝 타입에 기초하여 현재 코딩 유닛을 분할할 수 있다(실시예1).
[240]
부호화/복호화 장치는, 대각 파티셔닝과 별개로 비대칭 대각 파티셔닝 타입을 정의할 수 있다. 비대칭 대각 파티셔닝의 종류는 전술한 시작점과 끝점의 다양한 조합을 통해 결정될 수 있다. 이때, 비대칭 대각 파티셔닝에는 대각 파티셔닝이 포함되지 않는다. 부호화 장치는, 현재 코딩 유닛의 비대칭 대각 파티셔닝 타입을 지시하는 인덱스를 부호화할 수 있다. 복호화 장치는, 시그날링된 인덱스에 대응하는 비대칭 대각 파티셔닝 타입을 결정하고, 결정된 파티셔닝 타입에 따라 현재 코딩 유닛을 분할할 수 있다. 다만, 비대칭 대각 파티셔닝은 대각 파티셔닝이 적용되지 않는 경우에 한하여 적용되도록 설정될 수 있다.
[241]
부호화/복호화 장치는, 기-정의된 복수의 파티셔닝 타입에 기초하여 현재 코딩 유닛을 분할할 수 있다(실시예2).
[242]
여기서, 복수의 파티셔닝 타입은 대각 파티셔닝 및 비대칭 대각 파티셔닝을 모두 포함할 수 있다. 비대칭 대각 파티셔닝의 종류는 전술한 시작점과 끝점의 다양한 조합을 통해 결정될 수 있다. 부호화 장치는, 현재 코딩 유닛의 파티셔닝 타입을 지시하는 인덱스를 부호화할 수 있다. 복호화 장치는, 시그날링된 인덱스에 대응하는 파티셔닝 타입을 결정하고, 결정된 파티셔닝 타입에 따라 현재 코딩 유닛을 분할할 수 있다.
[243]
부호화/복호화 장치는, 분할 라인에 관한 정보에 기초하여 현재 코딩 유닛을 분할할 수 있다(실시예3).
[244]
여기서, 분할 라인에 관한 정보는, 분할 라인의 시작점, 끝점, 각도 또는 방향 중 적어도 하나에 관한 정보를 포함할 수 있다. 상기 시작점은 전술한 바와 같으며, 자세한 설명은 생략하기로 한다. 다만, 시작점은 코딩 유닛의 좌상단 코너 또는 좌하단 코너에만 위치하도록 제한될 수 있다. 대신에 끝점은 코딩 유닛의 상단, 우측 또는 하단 경계에 위치하거나, 코딩 유닛의 우상단 코너 또는 우하단 코너에 위치할 수 있다. 반대로, 끝점은 코딩 유닛의 우상단 코너 또는 우하단 코너에만 위치하도록 제한되고, 시작점은 코딩 유닛의 상단, 좌측 또는 하단 경계에 위치하거나, 코딩 유닛의 좌상단 코너 또는 좌하단 코너에 위치할 수 있다.
[245]
분할 라인의 각도 정보는 너비와 높이의 비율로 정의될 수 있다. 예를 들어, 분할 라인을 사변으로 갖는 직각 삼각형을 가정하자. 이 경우, 밑변(너비)과 대변(높이)의 비율은 1:2 k 이거나, 2 k:1일 수 있다. 여기서, k는 0, 1, 2, 3, 4 또는 그 이상일 수 있다. 다만, 부호화 효율을 위해, k는 {0, 2}, {0, 3}, {1, 2}, {1, 3}, {2, 3}, {0, 1, 2}, {0, 1, 3}, {0, 2, 3}, {1, 2, 3} 또는 {1, 2, 4} 등으로 제한될 수도 있다.
[246]
분할 라인의 방향 정보는, 분할 라인이 좌상단 방향에서 우하단 방향으로 위치하는지 아니면 좌하단 방향에서 우상단 방향으로 위치하는지를 지시할 수 있다. 또는, 방향 정보는 상기 각도 정보에 의해 특정된 분할 라인이 반전되는지 여부를 지시할 수도 있다. 여기서, 반전은 상-하 반전 및/또는 좌-우 반전을 의미할 수 있다. 또는, 방향 정보는 상기 각도 정보에 의해 특정된 분할 라인이 회전되는지 여부, 회전 각도 또는 회전 방향 중 적어도 하나에 관한 정보를 포함할 수도 있다. 회전 각도는 기-정의된 각도 중 어느 하나를 지시할 수 있고, 기-정의된 각도는 -180도, -90도, 90도 또는 180도 중 적어도 하나를 포함할 수 있다. 회전 방향은 시계 방향인지 아니면 반시계 방향인지를 지시할 수 있다.
[247]
전술한 실시예 1 내지 3 중 어느 하나가 선택적으로 이용될 수도 있고, 실시예 1 및 2의 조합 또는 실시예 1 및 3의 조합에 기초하여 파티셔닝이 수행될 수도 있다.
[248]
대칭 파티셔닝을 사용하여 삼각 예측 유닛을 생성할지를 나타내는 플래그 isSymTriangle_flag을 시그날링 할 수 있다. isSymTriangle_flag 값이 1이면, 대칭 파티셔닝을 이용하여 삼각 예측 유닛을 생성하고, isSymTriangle_flag 값이 0 이면, 비대칭 파티셔닝을 이용하여 삼각 예측 유닛을 생성할 수 있다.
[249]
Asym_traingle_index은 도 18과 같이 비대칭 삼각 예측 유닛을 특정하기 위한 인덱스를 나타낸다. 다음 표 3과 같은 신택스 테이블을 사용하여, 삼각 예측 유닛을 생성할 수도 있다.
[250]
[표3]
coding_unit( x0, y0, cbWidth, cbHeight, treeType ) { Descriptor
} else { /* MODE_INTER */
if( cu_skip_flag[ x0 ][ y0 ] ) {
if( sps_affine_enabled_flag && cbWidth >= 8 && cbHeight >= 8 &&( MotionModelIdc[ x0 - 1 ][ y0 + cbHeight - 1 ] != 0 | | MotionModelIdc[ x0 - 1 ][ y0 + cbHeight ] != 0 | | MotionModelIdc[ x0 - 1 ][ y0 - 1 ] != 0 | | MotionModelIdc[ x0 + cbWidth - 1 ][ y0 - 1 ] != 0 | | MotionModelIdc[ x0 + cbWidth ][ y0 - 1 ]] != 0 ) )
merge_affine_flag[ x0 ][ y0 ] ae(v)
if(sps_triangle_enabled_flag && merge_affine_flag[ x0 ][ y0 ] = = 0 && cbWidth + cbHeight > 12 )
merge_triangle_flag[ x0 ][ y0 ] ae(v)
if( merge_triangle_flag [ x0 ][ y0 ] = = 1 )
isSymTriangle_flag ae(v)
if( isSymTriangle_flag )
triangle_partition_type_flag ae(v)
else {
Asym_traingle_index ae(v)
}
if( merge_affine_flag[ x0 ][ y0 ] = = 0 && merge_triangle_flag[ x0 ][ y0 ] = = 0 && MaxNumMergeCand > 1 )
merge_idx[ x0 ][ y0 ] ae(v)
} else {
merge_flag[ x0 ][ y0 ] ae(v)
if( merge_flag[ x0 ][ y0 ] ) {
if( sps_affine_enabled_flag && cbWidth >= 8 && cbHeight >= 8 &&( MotionModelIdc[ x0 - 1 ][ y0 + cbHeight - 1 ] != 0 | | MotionModelIdc[ x0 - 1 ][ y0 + cbHeight ] != 0 | | MotionModelIdc[ x0 - 1 ][ y0 - 1 ] != 0 | | MotionModelIdc[ x0 + cbWidth - 1 ][ y0 - 1 ] != 0 | | MotionModelIdc[ x0 + cbWidth ][ y0 - 1 ]] != 0 ) )
merge_affine_flag[ x0 ][ y0 ] ae(v)
if(slice_type = = B && sps_triangle_enabled_flag && merge_affine_flag[ x0 ][ y0 ] = = 0 && cbWidth + cbHeight > 12 )
merge_triangle_flag[ x0 ][ y0 ] ae(v)
if( merge_triangle_flag [ x0 ][ y0 ] = = 1 )
isSymTriangle_flag ae(v)
if( merge_triangle_flag [ x0 ][ y0 ] = = 1 )
isSymTriangle_flag ae(v)
if( isSymTriangle_flag )
triangle_partition_type_flag ae(v)
else {
Asym_traingle_index ae(v)
}
merge_idx[ x0 ][ y0 ] ae(v)
} else {

[251]
도 19와 같이 대각 중앙 샘플이 코딩 유닛의 상단 경계, 하단 경계, 우측 경계 또는 하단 경계중 어느 위치에 있는지를 나타내는 플래그 triangle_partition_type_flag을 사용할 수 있다.
[252]
triangle_partition_type_flag 값이 0 이면, 대각 중앙 샘플이 코딩 유닛 상단 경계에 있음을 나타내고, triangle_partition_type_flag 값이 1 이면, 대각 중앙 샘플이 코딩 유닛 하단 경계에 있음을 나타낸다. triangle_partition_type_flag 값이 2 이면, 대각 중앙 샘플이 코딩 유닛 우측 경계에 있음을 나타내고, triangle_partition_type_flag 값이 3 이면, 대각 중앙 샘플이 코딩 유닛 좌측 경계에 있음을 나타낸다.
[253]
좌삼각 예측 유닛의 너비가 우삼각 예측 유닛의 너비보다 큰 지를 나타내는 플래그 left_diag_flag 을 시그날링할 수 있다. left_diag_flag 값이 0이면, 좌삼각 예측 유닛의 너비가 우삼각 예측 유닛의 너비보다 작다는 것을 나타내고, left_diag_flag 값이 1이면, 좌삼각 예측 유닛의 너비가 우삼각 예측 유닛의 너비보다 크다는 것을 나타낸다. triangle_partition_type_flag과 left_diag_flag을 이용하여 삼각 예측 유닛의 파티셔닝을 유도할 수 있으며, 다음 표 4와 같은 신택스 테이블을 사용하여, 삼각 예측 유닛을 생성할 수도 있다.
[254]
[표4]
coding_unit( x0, y0, cbWidth, cbHeight, treeType ) { Descriptor
} else { /* MODE_INTER */
if( cu_skip_flag[ x0 ][ y0 ] ) {
if( sps_affine_enabled_flag && cbWidth >= 8 && cbHeight >= 8 &&( MotionModelIdc[ x0 - 1 ][ y0 + cbHeight - 1 ] != 0 | | MotionModelIdc[ x0 - 1 ][ y0 + cbHeight ] != 0 | | MotionModelIdc[ x0 - 1 ][ y0 - 1 ] != 0 | | MotionModelIdc[ x0 + cbWidth - 1 ][ y0 - 1 ] != 0 | | MotionModelIdc[ x0 + cbWidth ][ y0 - 1 ]] != 0 ) )
merge_affine_flag[ x0 ][ y0 ] ae(v)
if(slice_type = = B && sps_triangle_enabled_flag && merge_affine_flag[ x0 ][ y0 ] = = 0 && cbWidth + cbHeight > 12 )
merge_triangle_flag[ x0 ][ y0 ] ae(v)
if( merge_triangle_flag [ x0 ][ y0 ] = = 1 )
isSymTriangle_flag ae(v)
if( isSymTriangle_flag )
triangle_partition_type_flag u(1)
else {
Asym_triangle_type_index ae(v)
left_diag_flag u(1)
}
if( merge_affine_flag[ x0 ][ y0 ] = = 0 && merge_triangle_flag[ x0 ][ y0 ] = = 0 && MaxNumMergeCand > 1 )
merge_idx[ x0 ][ y0 ] ae(v)
} else {
merge_flag[ x0 ][ y0 ] ae(v)
if( merge_flag[ x0 ][ y0 ] ) {
if( sps_affine_enabled_flag && cbWidth >= 8 && cbHeight >= 8 &&( MotionModelIdc[ x0 - 1 ][ y0 + cbHeight - 1 ] != 0 | | MotionModelIdc[ x0 - 1 ][ y0 + cbHeight ] != 0 | | MotionModelIdc[ x0 - 1 ][ y0 - 1 ] != 0 | | MotionModelIdc[ x0 + cbWidth - 1 ][ y0 - 1 ] != 0 | | MotionModelIdc[ x0 + cbWidth ][ y0 - 1 ]] != 0 ) )
merge_affine_flag[ x0 ][ y0 ] ae(v)
if(sps_triangle_enabled_flag && merge_affine_flag[ x0 ][ y0 ] = = 0 && cbWidth + cbHeight > 12 )
merge_triangle_flag[ x0 ][ y0 ] ae(v)
if( merge_triangle_flag [ x0 ][ y0 ] = = 1 )
isSymTriangle_flag ae(v)
if( merge_triangle_flag [ x0 ][ y0 ] = = 1 )
isSymTriangle_flag ae(v)
if( isSymTriangle_flag )
triangle_partition_type_flag u(1)
else {
Asym_triangle_type_index ae(v)
left_diag_flag u(1)
}
merge_idx[ x0 ][ y0 ] ae(v)
} else {

[255]
전술한 비대칭 대각 파티셔닝의 경우에도, 대각 파티셔닝과 동일한 방식으로 움직임 정보가 유도될 수 있으며, 자세한 설명은 생략하기로 한다.
[256]
좌삼각 예측 유닛과 우삼각 예측 유닛에서 서로 다른 예측 방법을 사용할 수 도 있으며, 이를 다중 삼각 예측 유닛 부호화 방법이라 한다. 일 예로, 좌삼각 예측 유닛에서는 머지 후보를 이용하고 우삼각 예측 유닛에서는 인트라 예측을 이용하여 예측 영상을 생성할 수 있다. 반대로 좌삼각 예측 유닛에서는 인트라 예측을 이용하고 우삼각 예측 유닛에서는 머지 후보를 이용하여 예측 영상을 생성할 수 도 있다. 다중 삼각 예측 유닛 부호화 방법에서 사용되는 인트라 예측 모드는 MPM 모드로 제한할 수도 있다. 즉, 주변 블록에서 유도한 N개의 MPM 모드만 다중 삼각 예측 유닛 부호화 방법의 인트라 예측 모드로 사용될 수 있도록 제한할 수도 있다.
[257]
또는 첫 번째 MPM 후보만 다중 삼각 예측 유닛 방법의 인트라 예측 모드로 사용될 수 있도록 제한할 수도 있다.
[258]
MPM 후보 유도시 다중 삼각 예측 유닛 방법이면서 인트라 모드가 사용된 코딩 유닛(이하, 인트라 삼각 예측 유닛) 은 주변 인트라 모드가 가용한 것으로 설정하고, 주변 코딩 유닛이 다중 삼각 예측 유닛 방법이 아니면서 인트라 모드가 사용된 코딩 유닛(이하, 표준 인트라 모드)은 주변 인트라 모드가 비가용한 것으로 설정할 수 있다.
[259]
또 다른 예를 이용하여, 좌삼각 예측 유닛과 우삼각 예측 유닛 모두 인트라 예측 모드를 사용할 수 있다. 이 때 좌삼각 예측 유닛(이하,제 1 인트라 삼각 예측 유닛 )과 우삼각 예측 유닛(이하, 제 2 인트라 삼각 예측 유닛)의 인트라 예측 모드는 서로 다르게 설정할 수 있다.
[260]
삼각 예측 유닛에서 서로 다른 예측 방법을 가중 예측하여 사용할 수도 있다. 예를 들어, 인터 예측과 인트라 예측을 가중 예측할 수도 있다.
[261]
수학식 2와 같이, 좌삼각 예측 유닛에서는 가중 예측 파라미터 w0를 이용해 가중 예측을 수행할 수 있고, 우삼각 예측 유닛에서는 가중 예측 파라미터 w1를 이용해 가중 예측을 수행할 수 있다. 이 때 w1은 w0보다 작은 값으로 설정할 수 있다.
[262]
[수학식 2]
[263]
P0 = w0 * P Intra(x,y) + (1-w0)* P Inter (x,y)
[264]
P1 = w1 * P Intra(x,y) + (1-w1)* P Inter (x,y)
[265]
각 예측 유닛은 유도된 움직임 정보를 이용하여 각각 움직임 보상을 수행할 수 있다. 다만, 좌삼각 예측 유닛과 우삼각 예측 유닛의 경계 부분(이하, 대각 경계 영역)에서 화질 열화가 발생하거나, 에지(edge) 주변으로 화질의 연속성이 나빠질 수 있다. 대각 경계 영역에 스무딩 필터 또는 가중 예측과 같은 프로세스를 수행하여 화질 열화를 감소 시킬 수 있다.
[266]
도 20과 같이 좌삼각 예측 유닛과 우삼각 예측 유닛의 경계에서 가중 예측을 수행할 수 있다. 대각 경계 영역 내 샘플 P_Diag(x,y)는 수학식 3과 같이 좌삼각 예측 유닛과 우삼각 예측 유닛을 가중 예측하여 경계 영역 예측 샘플을 생성할 수 있다.
[267]
[수학식 3]
[268]
P_Diag(x,y) = w1 * P1(x,y) + (1-w1)* P2 (x,y)
[269]
수학식 3에서, P1은 좌삼각 예측 유닛의 움직임 보상에 따른 예측값을 ,P2는 우삼각 예측 유닛의 움직임 보상에 따른 예측값을 각각 의미할 수 있다.
[270]
좌삼각 예측 유닛에 속한 대각 경계 영역에서는 좌삼각 예측에 큰 가중치를 설정하고, 우삼각 예측 유닛에 속한 대각 경계 영역에서는 우삼각 예측에 큰 가중치를 설정할 수 있다.
[271]
가중 예측이 적용되는 대각 경계 영역의 크기는 코딩 유닛의 크기, 삼각 예측 유닛들의 움직임 벡터 차분값, 참조 픽처의 POC, 삼각 예측 유닛 경계에서의 예측 샘플들의 차분값에 기초하여 결정할 수 있다.
[272]
[273]
도 21 내지 도 27은 본 발명이 적용되는 일시시예로서, 인터 영역의 움직임 정보를 이용한 머지 모드를 도시한 것이다.
[274]
머지 후보 리스트와 별도로 현재 픽쳐에서 현재 블록 이전에 인터 예측으로 부호화/복호화된 블록의 움직임움직임 정보(움직임움직임 벡터, 참조 픽쳐 인덱스, 예측 방향(Uni-prediction 및/또는 Bi-prediction 정보 등)를 기-정의된 크기의 리스트(버퍼)에 저장할 수 있으며, 이를 인터 영역 움직임 정보 리스트라고 정의 할 수 있다. 상기 리스트의 크기와 관련하여, 상기 리스트는 T개의 움직임 정보를 저장할 수 있으며, 여기서 T는 4, 5, 6 또는 그 이상일 수 있다.
[275]
인터 영역 움직임 정보 리스트에 있는 움직임 정보를 인터 영역 움직임 후보로 정의할 수 있으며, 인터 영역 움직임 후보는 머지 후보 리스트에 포함될 수 있다.
[276]
따라서, 인터 영역 움직임 후보를 현재 코딩 유닛의 머지 후보로 사용할 수 있으며, 이를 위해 인터 영역 움직임 후보 중 적어도 하나는 현재 코딩 유닛의 머지 후보 리스트에 추가될 수 있다. 이런 방법을 인터 영역 머지 방법이라고 정의할 수 있다.
[277]
상기 인터 영역 움직임 정보 리스트는, 픽쳐, 슬라이스, 타일, CTU 행 또는 CTU 중 어느 하나의 단위로 초기화될 수 있다. 초기화는 상기 리스트가 비어있는 상태를 의미할 수 있다. 부호화 및/또는 복호화가 완료된 픽쳐의 일부 영역으로부터의 움직임 정보를 인터 영역 움직임 정보 리스트에 추가할 수 있다. 슬라이스 헤더 및/또는 타일 그룹 헤더를 통해 인터 영역 움직임 정보 리스트의 초기 인터 영역 머지 후보를 시그널링할 수 있다.
[278]
현재 부호화 되는 코딩 유닛이 인터 예측으로 부호화/복호화되면 도 21과 같이 상기 코딩 유닛의 움직임 정보를 인터 영역 움직임 정보 리스트에 업데이트할 수 있다. 인터 영역 움직임 정보 리스트에 있는 인터 영역 머지 후보의 개수가 임의로 설정된 최대 개수와 동일한 경우, 인터 영역 움직임 정보 리스트에서 가장 작은 값의 인덱스를 가진 움직임 정보(가장 먼저 인터 영역 움직임 정보 리스트에 추가된 움직임 정보)를 제거하고, 가장 최근에 부호화/복호화된 인터 영역의 움직임 정보를 인터 영역 움직임 정보 리스트에 추가할 수 있다.
[279]
가장 최근의 움직임 정보가 리스트에 기-추가된 움직임 정보와 동일한 경우, 가장 최근의 움직임 정보는 리스트에 추가되지 않을 수 있다. 또는, 가장 최근의 움직임 정보와 동일한 움직임 정보를 리스트에서 제거하고, 가장 최근의 움직임 정보를 추가할 수도 있다. 이때, 가장 최근의 움직임 정보는, 리스트의 가장 마지막 위치에 추가될 수 있다.
[280]
일 예로, 디코딩된 코딩 유닛의 움직임 벡터 mvCand를 인터 영역 움직임 정보 리스트 HmvpCandList에 업데이트할 수 있다. 이때 디코딩된 코딩 유닛의 움직임 정보가 인터 영역 움직임 정보 리스트에 있는 움직임 정보 중 어느 하나와 같은 경우(움직임 벡터와 레퍼런스 인덱스가 모두 같은 경우)에는 인터 영역 움직임 정보 리스트를 업데이트하지 않거나, 도 23과 같이 디코딩된 코딩 유닛의 움직임 벡터 mvCand을 인터 영역 움직임 정보 리스트의 제일 마지막에 저장할 수 있다. 이 때 mvCand과 같은 움직임 정보를 가지고 있는 HmvpCandList의 인덱스가 hIdx이면, 도 23과 같이 hIdx 보다 큰 모든 i에 대해 HMVPCandList[i]를 HVMPCandList[i-1]로 설정할 수도 있다.
[281]
일 예로, mvCand와 인터 영역 움직임 정보 리스트(HmvpCandList)에 구성된 인터 영역 움직임 후보가 동일 움직임 정보를 가지는 기준은 mvCand의 움직임 벡터, 참조 영상 인덱스, 예측 방향(Uni-prediction 및/또는 Bi-prediction)가 HmvpCandList의 인터 영역 움직임 후보와모두 다른 경우, 새로운 움직임 정보로 간주되어 인터 영역 움직임 정보 리스트를 업데이트할 수 있다.
[282]
일 예로, mvCand와 인터 영역 움직임 정보 리스트(HmvpCandList)에 구성된 인터 영역 움직임 후보가 동일 움직임 정보를 가지는 기준은 mvCand의 움직임 벡터, 참조 영상 인덱스, 예측 방향(Uni-prediction 및/또는 Bi-prediction) 중에서 적어도 하나 이상이 HmvpCandList의 인터 영역 움직임 후보와 다른 경우, 새로운 움직임 정보로 간주되어 인터 영역 움직임 정보 리스트를 업데이트할 수 있다.
[283]
일 예로, mvCand와 인터 영역 움직임 정보 리스트(HmvpCandList)에 구성된 인터 영역 움직임 후보 간 중복성을 체크할 때, 참조 영상 인덱스 및 예측 방향(Uni-prediction 및/또는 Bi-prediction)은 동일하고 움직임 벡터가 다른 경우, mvCand와 해당 인터 영역 움직임 후보 간의 움직임 벡터 차이가 기-정의된 일정 범위 내에 있다면 동일한 움직임 정보를 가진다고 간주하고 인터 영역 움직임 정보 리스트에 대한 업데이트를 수행하지 않을 수 있다. 보다 구체적으로 mvCand와 해당 인터 영역 움직임 후보 간의 움직임 벡터의 차이가 1 (1 Pixel)이내로 들어오는 경우, 리스트를 업데이트하지 않을 수 있다.
[284]
일 예로, mvCand와 동일한 움직임 정보를 가지고 있는 HmvpCandList[hIdx]와 가장 최근에 업데이트된 인터 영역 움직임 후보에 대해서만 교환(Swap)하여 인터 영역 움직임 정보 리스트(HmvpCandList)를 업데이트할 수 있다. 이 때, mvCand와 동일한 움직임 정보를 가지고 있는 HmvpCandList[hIdx]가 가장 최근에 업데이트된 움직임 후보의 인덱스를 n이라 할 때, HmvpCandList[hIdx]가 HmvpCandList[n]으로부터 임의로 정의된 index의 차이(DiffIdx) 내에 위치한 경우만 상기와 같이 교환할 수 있다. 보다 구체적으로 기-정의된 DiffInx가 3인 경우, hIdx가 n-1, n-2, n-3인 경우에 교환을 통해 인터 영역 움직임 정보 리스트를 업데이트할 수 있다.
[285]
일 예로, mvCand와 동일한 움직임 정보를 가지고 있는 HmvpCandList[hIdx]를 가장 최근에 업데이트 된 인터 영역 움직임 후보 HmvpCandList[n]에 저장한 후, 교환(Swap) 방식이 아니라 hIdx 주변의 움직임 정보를 이용하여 HmvpCandList[hIdx]를 유도할 수 있다. 예를 들어, HmvpCandList[hIdx-1] 및 HmvpCandList[hIdx+1]가 양방향 인터 예측 모드인 경우, HmvpCandList[hIdx-1] 및 HmvpCandList[hIdx+1]의 평균으로 움직임 정보를 유도할 수 있다. 이때, 참조 영상 인덱스가 다른 경우, 스케일링을 통해 임의로 정의된 참조 영상 인덱스에 따라 움직임 벡터를 스케일링할 수 있다.
[286]
일 예로, mvCand와 동일한 움직임 정보를 가지고 있는지에 대한 중복성 체크를 인터 영역 움직임 정보 리스트(HmvpCandList) 내의 임의의 몇 개에 대해서만 수행할 수 있다. 예를 들어, 인터 영역 움직임 정보 리스트(HmvpCandList)에 가장 최근에 포함된 K개 전부 또는 일부의 인터 영역 움직임 후보들의 움직임 정보와 mvCand 간의 중복성 여부를 체크할 수 있다.
[287]
일 예로, mvCand와 동일한 움직임 정보를 가지고 있는 지에 대한 중복성 체크를 인터 영역 움직임 정보 리스트(HmvpCandList) 내의 홀수번째 인덱스 및/또는 짝수번째 인덱스를 가지는 인터 영역 움직임 후보들의 움직임 정보와 mvCand간의 중복성 여부를 체크할 수 있다. 예를 들어, 인터 영역 움직임 정보 리스트의 크기가 6이라 할 때, 0, 2, 4번째 인덱스를 가지는 인터 영역 움직임 후보에 대해서만 중복성 검사를 수행하거나 또는 1, 3, 5번째 인덱스를 가지는 인터 영역 움직임 후보에 대해서만 중복성 검사를 수행할 수 있다.
[288]
현재 블록이 삼각 형태 예측 유닛으로 인터 예측에 따라 부호화 된 경우, 해당 코딩 유닛의 움직임 정보는 적어도 하나 이상의 움직임 정보를 가질 수 있다. 이때, 적어도 하나 이상의 움직임 정보는 인터 영역 움직임 정보 리스트(HmvpCandList)에 임의의 하나가 선택되어 들어가거나 및/또는 적어도 하나 이상의 움직임 정보가 임의의 순서에 따라 전부 인터 영역 움직임 정보 리스트의 인터 영역 움직임 후보로 포함될 수 있다. 여기서, 선택은 부호화/복호화 장치에 기-약속된 위치(즉, 좌측 예측 유닛 또는 우측 예측 유닛)에 기초하여 수행될 수 있다. 또는, 제1 예측 유닛의 움직임 정보와 제2 예측 유닛의 움직임 정보를 조합하여 생성되는 움직임 정보(e.g., 평균 움직임 정보, 양방향 움직임 정보 등)가 리스트에 추가될 수도 있다. 또는, 삼각 형태 예측 유닛으로 부호화된 현재 블록의 움직임 정보는, 리스트에 추가되지 않도록 제한될 수도 있다.
[289]
일 예로, 그림 7의 좌삼각 파티셔닝 및/또는 우삼각 파티셔닝에 따른 대칭 대각 파티셔닝으로 화면간 예측 분할 된 경우, 분할된 2개의 파티션 각각이 서로 다른 움직임 정보를 가질 수 있으며, 이때 좌삼각 및/또는 우삼각 파티셔닝에서 유도될 수 있는 PU1과 PU2의 움직임 정보 중 주변 부호화 환경 (주변 블록들의 화면내 및/또는 화면간 분할정보, 현재 블록의 크기/깊이/형태 등)에 따라 하나의 움직임 정보만 인터 영역 움직임 정보 리스트의 인터 복호화 영역 머지 후보로 포함될 수 있다.
[290]
일 예로, 도 10의 좌삼각 파티셔닝 및/또는 우삼각 파티셔닝에 따른 대칭 대각 파티셔닝으로 분할된 경우, 분할된 2개의 파티션 각각이 서로 다른 움직임 정보를 가질 수 있으며, 이때 좌삼각 및/또는 우삼각 파티셔닝에서 유도될 수 있는 PU1과 PU2의 움직임 정보 둘 다 임의의 순서에 따라 인터 영역 움직임 정보 리스트의 인터 영역 움직임 후보로 포함될 수 있다.
[291]
보다 세부적으로, 좌삼각 파티셔닝에 따른 대칭 대각 파티셔닝으로 분할된 경우, PU1 --> PU2 순서로 인터 영역 움직임 정보 리스트의 인터 영역 움직임 후보로 포함시켜 업데이트 할 수 있다.
[292]
보다 세부적으로, 좌삼각 파티셔닝에 따른 대칭 대각 파티셔닝으로 분할된 경우, PU2 --> PU1 순서로 인터 영역 움직임 정보 리스트의 인터 영역 움직임 후보로 포함시켜 업데이트 할 수 있다.
[293]
보다 세부적으로, 우삼각 파티셔닝에 따른 대칭 대각 파티셔닝으로 분할된 경우, PU1 --> PU2 순서로 인터 영역 움직임 정보 리스트의 인터 영역 움직임 후보로 포함시켜 업데이트 할 수 있다.
[294]
보다 세부적으로, 우삼각 파티셔닝에 따른 대칭 대각 파티셔닝으로 분할된 경우, PU2 -->PU1 순서로 인터 영역 움직임 정보 리스트의 인터 영역 머지 후보로 포함시켜 업데이트 할 수 있다.
[295]
현재 디코딩된 코딩 유닛에서 서브 블록 머지 후보 (sub-block merge candidates)가 사용된 경우에는 코딩 유닛 내 대표 서브 블록의 움직임 정보를 인터 영역 움직임 정보 리스트에 저장할 수도 있다.
[296]
일 예로, 코딩 유닛 내 대표 서블 블록은 도 22와 같이 코딩 유닛 내 좌상단 서브 블록으로 설정하거나, 코딩 유닛 내 중간 서브 블록으로 설정할 수도 있다.
[297]
서브 블록 단위 머지 후보는 다음 프로세스와 같이 유도할 수 있다.
[298]
1. 현재 블록의 주변 머지 후보 블록의 움직임 벡터로 부터 초기 쉬프트 벡터 (shVector)를 유도할 수 있다. 여기서, 주변 머지 후보 블록은 현재 블록의 좌측, 상단, 좌하단, 우상단 또는 좌상단 블록 중 어느 하나일 수 있다. 또는, 현재 블록의 좌측 블록 또는 상단 블록만이 고정적으로 이용되도록 설정될 수도 있다.
[299]
2. 수학식 4와 같이 코딩 유닛 내 서브 블록의 좌상단 샘플 (xSb,ySb)에 초기 쉬프트 벡터를 가산하여 좌상단 샘플의 위치가 (xColSb, yColSb)인 쉬프트 서브 블록을 유도할 수 있다.
[300]
[수학식 4]
[301]
(xColSb, yColSb) = (xSb + shVector[0]>> 4,ySb+shVector[1]>> 4)
[302]
3. (xColSb, yColSb)를 포함하고 있는 서브 블록의 센터 포지션과 대응되는 collocated block의 움직임 벡터를 좌상단 샘플 (xSb,ySb)를 포함하고 있는 서브 블록의 움직임 벡터로 유도할 수 있다.
[303]
[304]
인터 영역 움직임 정보 리스트에 총 NumHmvp 개의 움직임 정보(움직임 벡터 및 참조 픽쳐 인덱스)를 저장할 수 있으며, NumHmvp을 인터 영역 움직임 정보 리스트 크기라고 부른다.
[305]
인터 영역 움직임 정보 리스트 크기는 기-정의된 값을 사용할 수 있다. 시퀀스, 픽쳐, 서브 픽쳐, 슬라이스 헤더 및/또는 타일 헤더에 인터 영역 움직임 정보 리스트 크기를 시그날링 할 수도 있다. 일 예로, 인터 영역 움직임 정보 리스트 크기는 16으로 정의할 수도 있고, 6으로 정의할 수도 있다.
[306]
부/복호화가 완료된 코딩 유닛이 인터 예측이면서 어파인 움직임 벡터를 갖는 경우, 이는 인터 영역 움직임 정보 리스트에 포함되지 않을 수 있다.
[307]
또는 부/복호화가 완료된 코딩 유닛이 인터 예측이면서 어파인 움직임 벡터를 갖는 경우에는 어파인 서브 블록 벡터를 인터 영역 움직임 정보 리스트에 추가할 수 있다. 이 때 서브 블록의 위치는 좌상단 및/또는 우상단, 및/또는 중앙 서브 블록 등으로 설정할 수도 있다.
[308]
또는, 각 컨트롤 포인트의 움직임 벡터 평균값을 인터 영역 움직임 후보 리스트에 추가할 수도 있다.
[309]
특정 코딩 유닛을 부호화/복호화하여 유도한 움직임 벡터 MV0가 인터 영역 움직임 후보 중 어느 하나와 동일한 경우에는 MV0를 인터 영역 움직임 정보 리스트에 추가하지 않을 수 있다. 또는, MV0와 동일한 움직임 벡터를 갖는 기존의 인터 영역 움직임 후보를 삭제하고, MV0를 새롭게 인터 영역 움직임 정보 리스트에 포함시켜, MV0에 할당되는 인덱스를 갱신할 수 있다.
[310]
인터 영역 움직임 정보 리스트 이외에 인터 영역 움직임 정보 롱텀 리스트 HmvpLTList를 구성할 수도 있다. 인터 영역 움직임 정보 롱텀 리스트 크기는 인터 영역 움직임 정보 리스트 크기와 같게 설정하거나, 상이한 값으로 설정할 수 있다.
[311]
인터 영역 움직임 정보 롱텀 리스트는 타일 그룹 시작 위치에 처음 추가한 인터 영역 머지 후보로 구성될 수 있다. 인터 영역 움직임 정보 롱텀 리스트가 모두 가용한 값으로 구성된 이후에 인터 영역 움직임 정보 리스트를 구성하거나, 인터 영역 움직임 정보 리스트 내 움직임 정보를 인터 영역 움직임 정보 롱텀 리스트의 움직임 정보로 설정할 수도 있다.
[312]
이 때 한 번 구성된 인터 영역 움직임 정보 롱텀 리스트는 업데이트를 수행하지 않거나, 타일 그룹 중 복호화된 영역이 전체 타일 그룹의 반 이상일 때 다시 업데이트 하거나, m개 CTU 라인마다 업데이트 하도록 설정할 수도 있다. 인터 영역 움직임 정보 리스트는 인터 영역으로 복호화될 때마다 업데이트 하거나, CTU 라인 단위로 업데이트 하도록 설정할 수 있다.
[313]
인터 영역 움직임 정보 리스트에 움직임 정보와 코딩 유닛의 파티션 정보 또는 형태를 저장할 수도 있다. 현재 코딩 유닛과 파티션 정보 및 형태가 유사한 인터 영역 움직임 후보만 사용하여 인터 영역 머지 방법을 수행할 수도 있다.
[314]
또는, 블록 형태에 따라 개별적으로 인터 영역 움직임 정보 리스트를 구성할 수도 있다. 이 경우, 현재 블록의 형태에 따라, 복수의 인터 영역 움직임 정보 리스트 중 하나를 선택하여 사용할 수 있다.
[315]
도 24와 같이 인터 영역 어파인 움직임 정보 리스트와 인터 영역 움직임 정보 리스트로 구성할 수도 있다. 복호화된 코딩 유닛이 어파인 인터 또는 어파인 머지 모드인 경우에는 인터 영역 어파인 움직임 정보 리스트 HmvpAfCandList에 제1 어파인 시드 벡터와 제 2 어파인 시드 벡터를 저장할 수도 있다. 인터 영역 어파인 움직임 정보 리스트에 있는 움직임 정보를 인터 영역 어파인 움직임 후보라고 한다.
[316]
현재 코딩 유닛에서 사용 가능한 머지 후보는 다음과 같이 구성할 수 있으며, 구성 순서와 같은 탐색 순서를 가질 수 있다.
[317]
1. 공간적 머지 후보 (A1, B1, B0 , A0)
[318]
2. 시간적 머지 후보 (이전 참조 픽쳐에서 유도한 머지 후보)
[319]
3. 공간적 머지 후보 (B2)
[320]
4. 인터 영역 머지 후보
[321]
5. 인터 영역 어파인 머지 후보
[322]
6. Zero motion 머지 후보
[323]
먼저 머지 후보 리스트는 mergeCandList는 공간적 머지 후보 및 시간적 머지 후보로 구성할 수 있다. 가용한 공간적 머지 후보 및 시간적 머지 후보의 개수를 가용 머지 후보 개수 (NumMergeCand)라고 부른다. 가용 머지 후보 개수가 최대 머지 허용 개수보다 작은 경우에는 인터 영역 움직임 정보 리스트의 움직임 후보를 인터 영역 머지 후보로 머지 후보 리스트 mergeCandList에 추가할 수 있다.
[324]
인터 영역 움직임 정보 리스트 HmvpCandList를 머지 후보 리스트 mergeCandList에 추가할 때는 인터 영역 움직임 정보 리스트 내 움직임 후보의 움직임 정보가 기존 머지 후보 리스트 mergeCandList의 움직임 정보와 동일한지 여부를 체크할 수 있다. 움직임 정보가 동일한 경우에는 머지 리스트 mergeCandList에 추가하지 않고, 움직임 정보가 동일하지 않은 경우에는 머지 리스트 mergeCandList에 인터 영역 머지 후보를 추가할 수 있다.
[325]
일 예로, HmvpCandList의 가장 최근에 업데이트된 움직임 정보(HmvpCandList [n])를 머지 후보 리스트(mergeCandList)에 추가할 때, 중복성 체크를 mergeCandList 내의 임의의 L개에 대해서만 수행 할 수 있다. 이때 L은 0보다 큰 양의 정수이며, 예를 들어 L이 2인 경우 mergeCandList의 가장 첫 번째 및 두 번째 움직임 정보에 대해서만 중복성 여부를 체크 할 수 있다.
[326]
일 예로, HmvpCandList와 mergeCandList 간의 중복성 체크는, mergeCandList의 머지 후보 일부와 HmvpCandList의 움직임 후보 일부에 대해서 수행될 수 있다. 여기서, mergeCandList의 일부는, 공간적 머지 후보 중 좌측 블록 및 상단 블록을 포함할 수 있다. 다만, 이에 한정되지 아니하며, 공간적 머지 후보 중 어느 하나의 블록으로 제한될 수도 있고, 좌하단 블록, 우상단 블록, 좌상단 블록 또는 시간적 머지 후보 중 적어도 하나를 더 포함할 수도 있다. 한편, HmvpCandList의 일부는, HmvpCandList에 가장 최근에 추가된 K개의 인터 영역 움직임 후보를 의미할 수 있다. 여기서, K는 1, 2, 3 또는 그 이상이고, 부호화/복호화 장치에 기-약속된 고정된 값일 수 있다. HmvpCandList에 5개의 인터 영역 움직임 후보가 저장되어 있고, 각 인터 영역 움직임 후보에 1 내지 5의 인덱스가 할당되어 있다고 가정한다. 인덱스가 클수록 최근에 저장된 인터 영역 움직임 후보를 의미한다. 이때, 인덱스 5, 4 및 3을 가진 인터 영역 움직임 후보와 상기 mergeCandList의 머지 후보 간의 중복성을 체크할 수 있다. 또는, 인덱스 5 및 4를 가진 인터 영역 움직임 후보와 상기 mergeCandList의 머지 후보 간의 중복성을 체크할 수도 있다. 또는, 가장 최근에 추가된 인덱스 5의 인터 영역 움직임 후보는 제외하고, 인덱스 4 및 3을 가진 인터 영역 움직임 후보와 상기 mergeCandList의 머지 후보 간의 중복성을 체크할 수도 있다. 중복성 체크 결과, 동일한 인터 영역 움직임 후보가 하나라도 존재하는 경우, HmvpCandList의 움직임 후보는 mergeCandList에 추가되지 않을 수 있다. 반면 동일한 인터 영역 움직임 후보가 존재하지 않는 경우, HmvpCandList의 움직임 후보는 mergeCandList의 마지막 위치에 추가될 수 있다. 이때, HmvpCandList에서 최근에 저장된 움직임 후보의 순서(즉, 인덱스가 큰 순서부터 작은 순서로)로 mergeCandList에 추가될 수 있다. 다만, HmvpCandList에서 가장 최근에 저장된 움직임 후보(가장 큰 인덱스를 가진 움직임 후보)는 mergeCandList에 추가되지 않도록 제한될 수도 있다.
[327]
인터 영역 움직임 후보 중 가장 최근에 인터 영역 움직임 정보 리스트에 포함된 인터 영역 움직임 후보를 머지 후보 리스트 mergeCandList에 추가할 수 있으며, 다음과 같은 프로세스를 사용할 수 있다.
[328]
For each candidate in HMVPCandList with index HMVPIdx = 1.. numCheckedHMVPCand, the following ordered steps are repeated until combStop is equal to true
[329]
- sameMotion is set to false
[330]
- If HMVPCandList[NumHmvp- HMVPIdx] have the same motion vectors and the same reference indices with any mergeCandList[i] with i being 0… numOrigMergeCand - 1 and HasBeenPruned[i] equal to false, sameMotion is set to true
[331]
- If sameMotion is equal to false, mergeCandList[numCurrMergeCand++] is set to HMVPCandList[NumHmvp - HMVPIdx]
[332]
- If numCurrMergeCand is equal to (MaxNumMergeCand-1), hmvpStop is set to TRUE
[333]
인덱스가 i인 인터 영역 움직임 후보 HmvpCandList[i]가 인덱스가 j인 머지 후보 리스트 mergeCandList[j]의 움직임 정보와 같은 경우에는, 도 25와 같이 HmvpCandList[i-1]의 움직임 정보가 같은지 비교할 때 mergeCandList[j]는 비교하지 않도록 설정할 수 있다.
[334]
또는 HmvpCandList에 있는 인터 영역 움직임 후보의 움직임 정보와 머지 후보 리스트 내의 머지 후보의 움직임 정보가 같은지만 비교할 수 있다. 일 예로, 도 26과 같이 머지 후보 리스트 중 가장 인덱스가 큰 N개의 머지 후보와 인터 영역 움직임 후보의 움직임 정보가 같은지를 비교할 수 있다.
[335]
머지 후보 리스트에 인터 영역 움직임 정보 리스트를 추가해도 타일 그룹에서 허용되는 최대 머지 개수(이하, 최대 머지 허용 개수)보다 작은 경우에는 도 27과 같이 인터 영역 움직임 정보 롱텀 리스트를 사용할 수도 있으며, 다음과 같은 프로세스를 사용할 수 있다.
[336]
For each candidate in HMVPCandList with index HMVPLTIdx = 1.. numHMVPLTCand, the following ordered steps are repeated until combStop is equal to true
[337]
- sameMotion is set to FALSE
[338]
- if hmvpStop is equal to FALSE and numCurrMergecand is less than (MaxNumMergeCand-1), hvmpLT is set to TRUE
[339]
- If HMVPLTCandList[NumLTHmvp - HMVPLTIdx] have the same motion vectors and the same reference indices with any mergeCandList[i] with i being 0… numOrigMergeCand - 1 and HasBeenPruned[i] equal to false, sameMotion is set to true
[340]
- If sameMotion is equal to false, mergeCandList[numCurrMergeCand++] is set to HMVPLTCandList[NumLTHmvp - HMVPLTIdx]
[341]
- If numCurrMergeCand is equal to (MaxNumMergeCand-1), hmvpLTStop is set to TRUE
[342]
[343]
인터 영역 움직임 후보를 현재 코딩 유닛의 움직임 정보 예측자 (Motion vector predictor, MVP) 후보로 사용할 수 있으며, 이런 방법을 인터 영역 움직임 정보 예측 방법이라고 부른다.
[344]
인터 영역 어파인 움직임 후보를 현재 코딩 유닛의 움직임 정보 예측자 (Motion vector predictor, MVP) 후보로 사용할 수 있으며, 이런 방법을 인터 영역 움직임 정보 어파인 예측 방법이라고 부른다.
[345]
현재 코딩 유닛에서 사용 가능한 움직임 정보 예측자 후보는 다음과 같이 구성할 수 있으며, 구성 순서와 같은 탐색 순서를 가질 수 있다.
[346]
1. 공간적 움직임 예측자 후보 (코딩 블록 인접 머지 후보 및 코딩 블록 비인접 머지 후보와 동일)
[347]
2. 시간적 움직임 예측자 후보 (이전 참조 픽쳐에서 유도한 움직임 예측자 후보)
[348]
3. 인터 영역 움직임 예측자 후보
[349]
4. 인터 영역 어파인 움직임 예측자 후보
[350]
5. Zero motion 움직임 예측자 후보
[351]
[352]
도 28 내지 도 30은 본 발명이 적용되는 일실시예로서, 어파인 인터 예측 방법을 도시한 것이다.
[353]
비디오에서 특정 물체(object)의 움직임이 선형적으로 나타나지 않는 경우가 많이 발생한다. 예를 들어, 도 28과 같이 카메라 줌인 (Zoom-in), 줌 아웃(Zoom-out), 회전(roation), 임의 형태로 변환을 가능하게 하는 affine 변환 등의 affine motion이 사용된 영상에서는 오브젝트의 움직임을 translation 움직임 벡터만 사용하는 경우 물체의 움직임을 효과적으로 표현할 수 없으며, 부호화 성능이 낮아질 수 있다.
[354]
어파인 움직임은 다음 수학식 5와 같이 표현될 수 있다.
[355]
[수학식 5]
[356]
v x=ax-by+e
[357]
v y=cx+dy+f
[358]
어파인 움직임을 총 6개의 파라미터를 사용하여 표현하는 것은 복잡한 움직임이 있는 영상에 효과적이지만, 어파인 움직임 파라미터를 부호화하는데 사용하는 비트가 많아서 부호화 효율이 떨어질 수도 있다.
[359]
이에, 4개의 파라미터로 어파인 움직임을 간략화하여 표현할 수 있으며,, 이를 4 파라미터 어파인 움직임 모델이라고 부른다. 수학식 6은 4개의 파라미터로 어파인 움직임을 표현한 것이다.
[360]
[수학식 6]
[361]
v x=ax-by+e
[362]
v y=bx+ay+f
[363]
4-파라미터 어파인 움직임 모델은 현재 블록의 2개 컨트롤 포인트에서의 움직임 벡터를 포함할 수 있다. 컨트롤 포인트는 현재 블록의 좌상단 코너, 우상단 코너 또는 좌하단 코너 중 적어도 하나를 포함할 수 있다. 일 예로, 4-파라미터 어파인 움직임 모델은 도 29의 좌측과 같이 코딩 유닛의 좌상단 샘플 (x0,y0)에서의 움직임 벡터 sv0와 코딩 유닛의 우상단 샘플 (x1,y1)에서의 움직임 벡터 sv1에 의해서 결정 될 수 있으며, sv 0와 sv 1을 어파인 시드 벡터라고 부른다. 이하, 좌상단에 위치한 어파인 시드 벡터 sv 0를 제1 어파인 시드 벡터라 가정하고, 우상단에 위치한 어파인 시드 벡터 sv 1를 제2 어파인 시드 벡터라 가정하기로 한다. 4-파라미터 어파인 움직임 모델에서 제1 및 제2 어파인 시드 벡터 중 하나를 좌하단에 위치한 어파인 시드 벡터로 교체하여 사용하는 것도 가능하다.
[364]
6-파라미터 어파인 움직임 모델은 도 29의 우측과 같이 4-파라미터 어파인 움직임 모델에 잔여 컨트롤 포인트(예컨대, 좌하단에 샘플 (x2,y2))의 움직임 벡터 sv 2가 추가된 어파인 움직임 모델이다. 이하, 좌상단에 위치한 어파인 시드 벡터 sv 0를 제1 어파인 시드 벡터라 가정하고, 우상단에 위치한 어파인 시드 벡터 sv 1를 제2 어파인 시드 벡터라 가정하고, 좌하단에 위치한 어파인 시드 벡터 sv 2를 제3 어파인 시드 벡터라 가정한다.
[365]
어파인 움직임을 표현하기 위한 파라미터의 개수에 관한 정보가 비트스트림에 부호화될 수 있다. 예컨대, 6-파라미터의 사용 여부를 나타내는 플래그, 4-파라미터의 사용 여부를 나타내는 플래그가 픽쳐, 서브 픽쳐, 슬라이스, 타일 그룹, 타일, 코딩 유닛 또는 CTU 중 적어도 하나의 단위로 부호화될 수 있다. 이에 따라, 소정의 단위로 4-파라미터 어파인 움직임 모델 또는 6-파라미터 어파인 움직임 모델 중 어느 하나를 선택적으로 사용할 수도 있다.
[366]
어파인 시드 벡터를 이용하여 도 30과 같이 코딩 유닛의 서브 블록 별로 움직임 벡터를 유도할 수 있으며, 이를 어파인 서브 블록 벡터라고 부른다.
[367]
어파인 서브 블록 벡터는 다음 수학식 7과 같이 유도될 수도 있다. 여기서 서브 블록의 기준 샘플 위치(x,y)는 블록의 코너에 위치한 샘플(예컨대, 좌상단 샘플)일 수도 있고, x축 또는 y축 중 적어도 하나가 중앙인 샘플(예컨대, 중앙 샘플)일 수도 있다.
[368]
[수학식 7]
[369]
[370]
어파인 서브 블록 벡터를 이용하여 코딩 유닛 단위 또는 코딩 유닛 내 서브 블록 단위로 움직임 보상을 수행할 수 있으며, 이를 어파인 인터 예측 모드라고 부른다. 수학식 7에서 (x 1-x 0)는 코딩 유닛의 너비와 같은 값을 가질 수 있다.
[371]
[372]
도 31 내지 도 35는 본 발명이 적용되는 일실시예로서, 인트라 예측 방법을 도시한 것이다.
[373]
인트라 예측은 도 31과 같이 현재 블록 주변에 있는 이미 부호화된 경계 샘플을 인트라 예측을 생성하는데 사용하며, 이를 인트라 레퍼런스 샘플이라고 부른다.
[374]
인트라 레퍼런스 샘플의 평균값을 예측 블록 전체 샘플의 값을 설정하거나 (DC 모드), 수평 방향 레퍼런스 가중 예측을 수행하여 생성한 수평 방향 예측 샘플과 수직 방향 레퍼런스 샘플을 가중 예측하여 생성한 수직 방향 예측 샘플을 생성한 후, 수평 방향 예측 샘플과 수직 방향 예측 샘플을 가중 예측하여 예측 샘플을 생성하거나(Planar 모드), 방향성 인트라 예측 모드 등을 이용하여 인트라 예측을 수행할 수 있다.
[375]
도 32의 왼쪽 그림과 같이 33개의 방향을 사용(총 35개 인트라 예측 모드)하여 인트라 예측을 수행할 수 있고, 오른쪽 그림과 같이 65개의 방향을 사용(총 67개 인트라 예측 모드)할 수도 있다. 방향성 인트라 예측을 사용하는 경우에는 인트라 예측 모드의 방향성을 고려하여 인트라 레퍼런스 샘플(레퍼런스 참조 샘플)을 생성하고, 이로 부터 인트라 예측을 수행할 수 있다.
[376]
코딩 유닛의 좌측에 있는 인트라 레퍼런스 샘플을 좌측 인트라 레퍼런스 샘플이라하고, 코딩 유닛의 상측에 있는 인트라 레퍼런스 샘플을 상측 인트라 레퍼런스 샘플이라 한다.
[377]
방향성 인트라 예측을 수행하는 경우에는 표 5와 같이 인트라 예측 모드에 따라 예측 방향(또는 예측 각도)을 나타내는 파라미터인 인트라 방향 파라미터 (intraPredAng)를 설정할 수 있다. 아래 표 5는 35개 인트라 예측 모드를 사용할 때 2 내지 34의 값을 가지는 방향성 인트라 예측 모드를 기반으로 하는 일예에 불과하다. 방향성 인트라 예측 모드의 예측 방향(또는 예측 각도)은 더 세분화되어 33개보다 많은 개수의 방향성 인트라 예측 모드가 이용될 수 있음은 물론이다.
[378]
[표5]
PredModeIntra 1 2 3 4 5 6 7
IntraPredAng - 32 26 21 17 13 9
PredModeIntra 8 9 10 11 12 13 14
IntraPredAng 5 2 0 -2 -5 -9 -13
PredModeIntra 15 16 17 18 19 20 21
IntraPredAng -17 -21 -26 -32 -26 -21 -17
PredModeIntra 22 23 24 25 26 27 28
IntraPredAng -13 -9 -5 -2 0 2 5
PredModeIntra 29 30 31 32 33 34
IntraPredAng 9 13 17 21 26 32

[379]
intraPredAng이 음수인 경우 (예를 들어, 인트라 예측 모드 인덱스가 11과 25 사이인 경우)에는 도 33과 같이 현재 블록에 좌측 인트라 레퍼런스 샘플과 상측 인트라 레퍼런스 샘플을 인트라 예측 모드의 각도에 따라 1D로 구성된 일차원 레퍼런스 샘플 (Ref_1D)로 재구성할 수 있다.
[380]
인트라 예측 모드 인덱스가 11과 18 사이인 경우에는 도 34와 같이 현재 블록의 상변 우측에 위치한 인트라 레퍼런스 샘플부터 좌변 하단에 위치한 인트라 레퍼런스 샘플까지 반 시계 방향으로 일차원 레퍼런스 샘플을 생성할 수 있다.
[381]
그 외의 모드에서는 상변 인트라 레퍼런스 샘플 또는 좌변 인트라 레퍼런스 샘플만 이용하여 일차원 레퍼런스 샘플을 생성할 수 있다.
[382]
인트라 예측 모드 인덱스가 19 와 25 사이인 경우에는 도 35와 같이 현재 블록의 좌변 하단에 위치한 인트라 레퍼런스 샘플부터 상변 우측에 위치한 인트라 레퍼런스 샘플까지 시계 방향으로 일차원 레퍼런스 샘플을 생성할 수 있다.
[383]
참조 샘플 결정 인덱스 iIdx와 iIdx에 기초하여 결정되는 적어도 하나의 참조 샘플에 적용되는 가중치 관련 파라미터 ifact를 다음 수학식 8과 같이 유도할 수 있다. iIdx와 i fact는 방향성 인트라 예측 모드의 기울기에 따라 가변적으로 결정되며, iIdx에 의해 특정되는 참조 샘플은 정수 펠(integer pel)에 해당할 수 있다.
[384]
[수학식 8]
[385]
i Idx = (y+1) * P ang /32
[386]
i fact = [(y+1) * P ang] & 31
[387]
예측 샘플 별로 적어도 하나 이상의 일차원 레퍼런스 샘플을 특정하여 예측 영상을 유도 할 수도 있다. 예를 들어, 방향성 인트라 예측 모드의 기울기 값을 고려하여 예측 샘플 생성에 사용할 수 있는 일차원 레퍼런스 샘플의 위치를 특정할 수 있다. 예측 샘플 별로 상이한 방향성 인트라 예측 모드를 가질 수도 있다. 하나의 예측 블록에 대해 복수의 인트라 예측 모드가 이용될 수도 있다. 복수의 인트라 예측 모드는 복수의 비방향성 인트라 예측 모드의 조합으로 표현될 수도 있고, 하나의 비방향성 인트라 예측 모드와 적어도 하나의 방향성 인트라 예측 모드의 조합으로 표현될 수도 있고, 또는 복수의 방향성 인트라 예측 모드의 조합으로 표현될 수도 있다. 하나의 예측 블록 내의 소정의 샘플 그룹 별로 상이한 인트라 예측 모드가 적용될 수 있다. 소정의 샘플 그룹은 적어도 하나의 샘플로 구성될 수 있다. 샘플 그룹의 개수는 현재 예측 블록의 크기/샘플 개수에 따라 가변적으로 결정될 수도 있고, 예측 블록의 크기/샘플 개수와는 독립적으로 부호화기/복호화기에 기-설정된 고정된 개수일 수도 있다.
[388]
구체적으로 예를 들어, 참조 샘플 결정 인덱스 iIdx를 이용하여 일차원 레퍼런스 샘플의 위치를 특정할 수 있다.
[389]
인트라 예측 모드의 기울기에 따라 하나의 일차원 레퍼런스 샘플만으로는 인트라 예측 모드의 기울기를 표현할 수 없을 때는 수학식 9와 같이 인접한 일차원 레퍼런스 샘플을 보간하여 제1 예측 영상을 생성할 수 있다. 인트라 예측 모드의 기울기/각도에 따른 angular line이 정수 펠에 위치한 레퍼런스 샘플을 지나가지 않는 경우, 해당 angular line에 좌/우 또는 상/하에 인접한 레퍼런스 샘플을 보간하여 제1 예측 영상을 생성할 수 있다. 이때 이용되는 보간 필터의 필터 계수는 i fact에 기초하여 결정될 수 있다. 예를 들어, 보간 필터의 필터 계수는 angular line 상에 위치한 소수 펠과 상기 정수 펠에 위치한 레퍼런스 샘플 간의 거리에 기초하여 유도될 수 있다.
[390]
[수학식 9]
[391]
P(x,y)=((32-i fact)/32)*Ref_1D(x+i Idx+1)+(i fact/32)*Ref_1D(x+i Idx+2)
[392]
하나의 일차원 레퍼런스 샘플만으로 인트라 예측 모드의 기울기를 표현할 수 있을 때 (i fact 값이 0 일때)는 다음 수학식 10과 같이 제1 예측 영상을 생성할 수 있다.
[393]
[수학식 10]
[394]
P(x,y)=Ref_1D(x+i Idx+1)
[395]
[396]
도 36 내지 도 39는 본 발명이 적용되는 일실시예로서, 와이드 앵글 기반의 인트라 예측 방법을 도시한 것이다.
[397]
방향성 인트라 예측 모드의 예측 각도는 도 36과 같이 45 내지 -135도 사이로 설정될 수 있다.
[398]
비정방 형태 코딩 유닛에서 인트라 예측 모드를 수행하는 경우 기-정의된 예측 각도 때문에 현재 샘플과 가까운 인트라 레퍼런스 샘플 대신 현재 샘플과 거리가 먼 인트라 레퍼런스 샘플에서 현재 샘플을 예측하는 단점이 발생할 수 있다.
[399]
예를 들어, 도 37의 왼쪽 그림과 같이 코딩 유닛의 너비가 코딩 유닛의 높이보다 큰 코딩 유닛(이하, 수평 방향 코딩 유닛)에서는 거리가 가까운 샘플 T 대신에 거리가 먼 L에서 인트라 예측을 수행할 수 있다. 또 다른 예를 들어, 도 37의 오른쪽 그림과 같이 코딩 유닛의 높이가 코딩 유닛의 너비보다 큰 코딩 유닛(이하, 수직 방향 코딩 유닛)에서는 거리가 가까운 샘플 L 대신에 거리가 먼 샘플 T로 부터 인트라 예측을 수행할 수 있다.
[400]
비정방 형태 코딩 유닛에서는 기-정의된 예측 각도보다 더 넓은 예측 각도에서 인트라 예측을 수행할 수도 있으며, 이를 와이드 앵글 인트라 예측 모드라고 부른다.
[401]
와이드 앵글 인트라 예측 모드는 45-α 내지 -135-β의 예측 각도를 가질 수 있으며, 기존 인트라 예측 모드에서 사용된 각도를 벗어나는 예측 각도를 와이드 앵글 각도라고 부른다.
[402]
도 37의 좌측 그림에서 수평 방향 코딩 유닛에 있는 샘플 A는 와이드 앵글 인트라 예측 모드를 사용하여 인트라 레퍼런스 샘플 T로 부터 예측할 수 있다.
[403]
도 37의 우측 그림에서 수직 방향 코딩 유닛에 있는 샘플 A는 와이드 앵글 인트라 예측 모드를 사용하여 인트라 레퍼런스 샘플 L로 부터 예측할 수 있다.
[404]
기존 인트라 예측 모드 N개에 M개의 와이드 앵글 각도를 더해 N+M 개의 인트라 예측 모드가 정의될 수 있다. 구체적으로 예를 들어, 67개 인트라 모드와 표 6와 같이 28개 와이드 앵글 각도를 더해 총 95개 인트라 예측 모드가 정의될 수 있다.
[405]
현재 블록이 이용할 수 있는 인트라 예측 모드는 현재 블록의 형태에 따라 결정될 수 있다. 일 예로, 현재 블록의 크기, 종횡비(예컨대, 너비와 높이의 비율), 레퍼런스 라인 인덱스 중 적어도 하나에 기초하여, 95개의 방향성 인트라 예측 모드 중 65개의 방향성 인트라 예측 모드를 선택할 수 있다.
[406]
[표6]
predModeIntra -14 -13 -12 -11 -10 -9 -8 -7 -6 -5 -4 -3 -2 -1 2 3 4
intraPredAngle 512 341 256 171 128 102 86 73 64 57 51 45 39 35 32 29 26
predModeIntra 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21
intraPredAngle 23 20 18 16 14 12 10 8 6 4 3 2 1 0 -1 -2 -3
predModeIntra 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38
intraPredAngle -4 -6 -8 -10 -12 -14 -16 -18 -20 -23 -26 -29 -32 -29 -26 -23 -20
predModeIntra 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55
intraPredAngle -18 -16 -14 -12 -10 -8 -6 -4 -3 -2 -1 0 1 2 3 4 6
predModeIntra 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72
intraPredAngle 8 10 12 14 16 18 20 23 26 29 32 35 39 45 51 57 64
predModeIntra 73 74 75 76 77 78 79 80
intraPredAngle 73 86 102 128 171 256 341 512

[407]
표 6에 나타난 인트라 예측 모드 각도는, 현재 블록의 형태, 레퍼런스 라인 인덱스 중 적어도 하나에 기초하여 적응적으로 결정될 수 있다. 일 예로, Mode 15의 intraPredAngle은 현재 블록이 비정방형인 경우보다 현재 블록이 정방형인 경우에 더 큰 값을 갖도록 설정될 수 있다. 또는, Mode 75의 intraPredAngle은 인접 레퍼런스 라인이 선택된 경우보다 비인접 레퍼런스 라인이 선택된 경우 더 큰 값을 갖도록 설정될 수 있다.
[408]
와이드 앵글 인트라 예측 모드를 사용하는 경우 도 38과 같이 상측 인트라 레퍼런스 샘플의 길이를 2W+1로 설정하고, 좌측 인트라 레퍼런스 샘플의 길이를 2H+1로 설정할 수 있다.
[409]
와이드 앵글 인트라 예측을 사용하는 경우에 와이드 앵글 인트라 예측 모드의 인트라 예측 모드를 부호화 하는 경우에는 인트라 예측 모드의 개수가 많아져서 부호화 효율이 낮아 질수 있다. 와이드 앵글 인트라 예측 모드는 와이드 앵글 인트라에서 사용되지 않는 기존 인트라 예측 모드로 대체하여 부호화 할 수 있으며, 대체되는 예측 모드를 와이드 앵글 대체 모드라고 한다. 와이드 앵글 대체 모드는 와이드 앵글 인트라 예측 모드와 반대 방향인 인트라 예측 모드일 수 있다.
[410]
구체적으로 예를 들어, 도 39와 같이 35개 인트라 예측을 사용하는 경우 와이드 앵글 인트라 예측 모드 35는 와이드 앵글 대체 모드인 인트라 예측 모드 2로 부호화할 수 있고, 와이드 앵글 인트라 예측 모드 36은 와이드 앵글 대체 모드인 인트라 예측 모드 3으로 부호화 할 수 있다.
[411]
코딩 블록의 형태 또는 코딩 블록 높이대 너비의 비에 따라 대체하는 모드와 개수를 다르게 설정할 수 있다. 구체적으로 예를 들어, 표 7과 같이 코딩 블록의 형태에 따라 대체하는 모드와 개수를 다르게 설정할 수 있다. 표 7은 코딩 블록의 너비 와 높이의 비에 따라 사용되는 인트라 예측 대체 모드를 나타낸다.
[412]
[표7]
Aspect ratio Replaced intra prediction modes
W / H == 16 Modes 12, 13,14,15
W / H == 8 Modes 12, 13
W / H == 4 Modes 2,3,4,5,6,7,8,9,10,11
W / H == 2 Modes 2,3,4,5,6,7,
W / H == 1 None
W / H == 1/2 Modes 61,62,63,64,65,66
W / H == 1/4 Mode 57,58,59,60,61,62,63,64,65,66
W / H == 1/8 Modes 55, 56
W / H == 1/16 Modes 53, 54, 55, 56

[413]
[414]
도 40은 본 발명이 적용되는 일실시예로서, 멀티 라인 기반의 인트라 예측 방법을 도시한 것이다.
[415]
도 40을 참조하면, 복수 개의 인트라 레퍼런스 라인 중 적어도 하나를 이용하여 인트라 예측을 수행할 수도 있다.
[416]
일 예로, 인접한 인트라 페러런스 라인과 비인접 인트라 레퍼런스 라인으로 구성된 복수개의 인트라 레퍼런스 라인 중 어느 하나를 선택해서 인트라 예측을 수행할 수 있으며, 이를 멀티 라인 인트라 예측 방법이라고 부른다. 비인접 인트라 레퍼런스 라인은 제1 비인접 인트라 레퍼런스 라인(비인접 레퍼런스 라인 인덱스 1), 제2 비인접 인트라 레퍼런스 라인(비인접 레퍼런스 라인 인덱스 2) 또는 제3 비인접 인트라 레퍼런스 라인(비인접 레퍼런스 라인 인덱스 3) 중 적어도 하나를 포함할 수 있다. 비인접 인트라 레퍼런스 라인 중 일부만 사용할 수도 있다. 일 예로, 제1 비인접 인트라 레퍼런스 라인 과 제2 비인접 인트라 레퍼런스 라인만 사용할 수도 있고, 제1 비인접 인트라 레퍼런스 라인과 제3 비인접 인트라 레퍼런스 라인만 사용할 수도 있다.
[417]
인트라 예측에 사용된 레퍼런스 라인을 특정하는 신택스인 인트라 레퍼런스 라인 인덱스(intra_luma_ref_idx)를 코딩 유닛 단위로 시그날링 할 수 있다.
[418]
구체적으로 인접 인트라 레퍼런스 라인, 제1 비인접 인트라 레퍼런스 라인, 제3 비인접 인트라 레퍼런스 라인을 사용하는 경우에 다음 표 8과 같이 intra_luma_ref_idx를 정의할 수도 있다.
[419]
[표8]
intra_luma_ref_idx[ x0 ][ y0 ] 인트라 예측에 사용된 레퍼런스 라인
0 인접 인트라 레퍼런스 라인
1 제 1 비인접 레퍼런스 라인
2 제 3 비인접 레퍼런스 라인

[420]
또는, 현재 블록의 크기, 형태 또는 인트라 예측 모드에 따라, 비인접 레퍼런스 라인의 위치가 특정될 수도 있다. 예컨대, 라인 인덱스가 0인 것은 인접 인트라 레퍼런스 라인을 나타내고, 라인 인덱스가 1인 것은 제1 비인접 인트라 레퍼런스 라인을 나타낼 수 있다. 한편, 현재 블록의 크기, 형태 또는 인트라 예측 모드에 따라, 라인 인덱스가 2는 제2 비인접 인트라 레퍼런스 라인 또는 제3 비인접 인트라 레퍼런스 라인을 나타낼 수 있다.
[421]
인트라 모드에 따라서 사용 가능한 비인접 레퍼런스 라인을 결정할 수도 있다. 예를 들어, 대각 모드 인트라 예측을 사용하는 경우에는 인접 레퍼런스 라인과 제1 비인접 레퍼런스 라인 및 제3 비인접 레퍼런스 라인만 사용할 수도 있고, 수직 또는 수평 인트라 예측 모드에서는 인접 레퍼런스 라인, 제1 비인접 레퍼런스 라인 및 제2 비인접 렢런스 라인을 사용하도록 설정할 수도 있다.
[422]
비인접 인트라 레퍼런스 라인을 사용하는 경우에는 비방향성 인트라 예측 모들를 사용하지 않도록 설정할 수도 있다. 즉, 비인접 인트라 레퍼런스 라인을 사용하는 경우에는 DC 모드 내지 플래너 모드 (Planar mode)를 사용하지 않도록 제한 할 수도 있다.
[423]
또 다른 예를 들어, 비인접 인트라 레퍼런스 라인을 사용하는 경우, 비방향성 인트라 예측 모드 또는 특정 방향성 인트라 예측 모드 중 적어도 하나를 사용하지 못하도록 제한할 수 있다. 비방향성 인트라 예측 모드는 DC 모드 및 플래너 모드 (Planar mode) 중 적어도 하나를 포함하고, 특정 방향성 인트라 예측 모드는, 수평 방향 모드 (INTRA_MODE18), 수직 방향 모드(INTRA_MODE50), 대각방향 모드(INTRA_MODE2, 66), 와이드 앵글 모드 중 적어도 하나를 포함할 수 있다.
[424]
비인접 인트라 레퍼런스 라인에 속한 샘플의 개수는 인접 인트라 페러런스 라인의 샘플 개수보다 크게 설정할 수 있다. 또한 제i 비인접 인트라 레퍼런스 라인의 샘플 개수보다 제(i+1) 비인접 인트라 레퍼런스 라인의 샘플 개수가 더 많게 설정할 수도 있다. 제 i 비인접 인트라 레퍼런스 라인의 상측 샘플 개수와 제(i-1) 비인접 인트라 레퍼런스 라인의 상측 샘플 개수 차이는 레퍼런스 샘플 개수 오프셋 offsetX[i]로 나타낼 수 있다. offsetX[1]은 제1 비인접 인트라 레퍼런스 라인의 상측 샘플 개수와 인접 인트라 레퍼런스 라인의 상측 샘플 개수의 차분 값을 나타낸다. 제i 비인접 인트라 레퍼런스 라인의 좌측샘플 개수와 제(i-1) 비인접 인트라 레퍼런스 라인의 좌측 샘플 개수 차이는 레퍼런스 샘플 개수 오프셋 offsetY[i]로 나타낼 수 있다. offsetY[1]은 제1 비인접 인트라 레퍼런스 라인의 좌측 샘플 개수와 인접 인트라 레퍼런스 라인의 좌측 샘플 개수의 차분 값을 나타낸다.
[425]
인트라 레퍼런스 라인 인덱스가 i인 비인접 인트라 레퍼런스 라인은 상측 비인접 레퍼런스 라인 refW + offsetX[i] 와 좌측 비인접 레퍼런스 라인 refH+ offsetY[i] 그리고 좌상단 샘플로 구성될 수 있으며, 비인접 인트라 레퍼런스 라인에 속한 샘플의 개수는 refW + refH + offsetX[i] + offsetY[i] +1 로 구성될 수 있다.
[426]
[수학식 11]
[427]
refW = ( nTbW * 2 )
[428]
refH = ( nTbH * 2 )
[429]
수학식 11에서 nTbW는 코딩 유닛의 너비를 나타내고, nTbH는 코딩 유닛의 높이를 나타내며, whRatio는 다음 수학식 12와 같이 정의할 수 있다.
[430]
[수학식 12]
[431]
whRatio = log2(nTbW/nTbH)
[432]
멀티 라인 인트라 예측 부호화 방법에서는 비인접 인트라 레퍼런스 라인을 사용하는 경우에는 와이드 앵글 인트라 모드는 사용하지 않도록 설정할 수도 있다. 또는 현재 코딩 유닛의 MPM 모드가 와이드 앵글 인트라 모드이면 멀티 라인 인트라 예측 부호화 방법을 사용하지 않도록 설정할 수도 있다. 이 경우 인트라 레퍼런스 라인 인덱스가 i인 비인접 인트라 레퍼런스 라인은 상측 비인접 레퍼런스 라인 W + H + offsetX[i] 와 좌측 비인접 레퍼런스 라인 H + W + offsetY[i] 그리고 좌상단 샘플로 구성될 수 있으며, 비인접 인트라 레퍼런스 라인에 속한 샘플의 개수는 2W + 2H + offsetX[i] + offsetY[i] +1 로 구성될 수 있으며, whRatio 값에 따라서 offsetX[i]와 offsetY[i] 값이 달라질 수 있따. 예를 들어, whRatio 값이 1 보다 큰 경우에는 offsetX[i] 값을 1, offsetY[i] 값을 0 으로 설정할 수 있고, whRatio 값이 1 보다 작은 경우에는 offsetX[i] 값을 0, offsetY[i] 값을 1로 설정할 수도 있다.
[433]
[434]
도 41은 본 발명이 적용되는 일실시예로서, 성분 간 참조 기반의 예측 방법을 도시한 것이다.
[435]
현재 블록은, 성분 타입에 따라 휘도 블록과 색차 블록으로 분류될 수 있다. 색차 블록은 기-복원된 휘도 블록의 화소를 이용하여 예측될 수 있으며, 이를 성분 간 참조라 부르기로 한다. 본 실시예에서는, 색차 블록은 (nTbW x nTbH)의 크기를 가지고, 색차 블록에 대응하는 휘도 블록은 (2*nTbW x 2*nTbH)의 크기를 가지는 것을 가정한다.
[436]
도 41을 참조하면, 색차 블록의 인트라 예측 모드를 결정할 수 있다(S4100).
[437]
색차 블록을 위한 기-정의된 인트라 예측 모드는, 제1 그룹과 제2 그룹으로 구분될 수 있다. 여기서, 제1 그룹은, 성분 간 참조 기반의 예측 모드로 구성되고, 제2 그룹은 도 32에 도시된 인트라 예측 모드의 전부 또는 일부로 구성될 수 있다.
[438]
부호화/복호화 장치는, 성분 간 참조 기반의 예측 모드로서, INTRA_LT_CCLM, INTRA_L_CCLM, 또는 INTRA_T_CCLM 중 적어도 하나를 정의할 수 있다. INTRA_LT_CCLM는 휘도/색차 블록에 인접한 좌측 및 상단 영역을 모두 참조하는 모드이고, INTRA_L_CCLM는 휘도/색차 블록에 인접한 좌측 영역을 참조하는 모드이며, INTRA_T_CCLM는 휘도/색차 블록에 인접한 상단 영역을 참조하는 모드일 수 있다.
[439]
색차 블록의 인트라 예측 모드는, 상기 제1 그룹 또는 제2 그룹 중 어느 하나를 선택적으로 이용하여 유도될 수 있다. 상기 선택은, 소정의 제1 플래그에 기초하여 수행될 수 있다. 상기 제1 플래그는, 색차 블록의 인트라 예측 모드가 제1 그룹에 기초하여 유도되는지 또는 제2 그룹에 기초하여 유도되는지 여부를 나타낼 수 있다.
[440]
예를 들어, 상기 제1 플래그가 제1 값인 경우, 색차 블록의 인트라 예측 모드는 제1 그룹에 속한 성분 간 참조 기반의 예측 모드 중 어느 하나로 결정될 수 있다. 상기 성분 간 참조 기반의 예측 모드 중 어느 하나를 선택하기 위해 소정의 인덱스가 이용될 수 있다. 상기 인덱스는, INTRA_LT_CCLM, INTRA_L_CCLM, 또는 INTRA_T_CCLM 중 어느 하나를 특정하는 정보일 수 있다. 성분 간 참조 기반의 예측 모드와 각 예측 모드에 할당된 인덱스는 다음 표 9와 같다.
[441]
[표9]
Idx 성분 간 참조 기반의 예측 모드
0 INTRA_LT_CCLM
1 INTRA_L_CCLM
2 INTRA_T_CCLM

[442]
표 9는, 각 예측 모드에 할당되는 인덱스의 일예에 불과하며, 이에 한정되지 아니한다. 즉, 표 9와 같이, INTRA_LT_CCLM, INTRA_L_CCLM, INTRA_T_CCLM의 우선순서로 인덱스가 할당될 수도 있고, INTRA_LT_CCLM, INTRA_T_CCLM, INTRA_L_CCLM의 우선순서로 인덱스가 할당될 수도 있다. 또는, INTRA_LT_CCLM가 INTRA_T_CCLM 또는 INTRA_L_CCLM보다 낮은 우선순서를 가질 수도 있다.
[443]
반면, 상기 제1 플래그가 제2 값인 경우, 색차 블록의 인트라 예측 모드는, 제2 그룹에 속한 복수의 인트라 예측 모드 중 어느 하나로 결정될 수 있다. 일예로, 제2 그룹은 표 10과 같이 정의될 수 있으며, 색차 블록의 인트라 예측 모드는, 부호화 장치에서 시그날링되는 정보(intra_chroma_pred_mode)와 휘도 블록의 인트라 예측 모드(IntraPredModeY)에 기초하여 유도될 수 있다.
[444]
[표10]
intra_chroma_pred_mode[ xCb ][ yCb ] IntraPredModeY[ xCb + cbWidth / 2 ][ yCb + cbHeight / 2 ]
0 50 18 1 X ( 0  <=  X  <=  66 )
0 66 0 0 0 0
1 50 66 50 50 50
2 18 18 66 18 18
3 1 1 1 66 1
4 0 50 18 1 X

[445]
상기 제1 플래그는, 성분 간 참조가 허용되는지 여부를 나타내는 정보에 기초하여 선택적으로 시그날링될 수 있다. 예를 들어, 상기 정보의 값이 1인 경우, 상기 제1 플래그가 시그날링되고, 그렇지 않은 경우, 상기 제1 플래그는 시그날링되지 않을 수 있다. 여기서, 정보는 후술하는 소정의 조건에 기초하여 0 또는 1로 결정될 수 있다.
[446]
(조건 1) 성분 간 참조 기반의 예측이 허용되는지 여부를 나타내는 제2 플래그가 0인 경우, 상기 정보는 0으로 설정될 수 있다. 상기 제2 플래그는 비디오 파라미터 세트(VPS), 시퀀스 파라미터 세트(SPS), 픽쳐 파라미터 세트(PPS) 또는 슬라이스 헤더 중 적어도 하나에서 시그날링될 수 있다.
[447]
(조건 2) 다음 서브-조건 중 적어도 하나를 만족하는 경우, 상기 정보는 1로 설정될 수 있다.
[448]
- qtbtt_dual_tree_intra_flag의 값이 0인 경우
[449]
- 슬라이스 타입이 I 슬라이스가 아닌 경우
[450]
- 코딩 트리 블록의 크기가 64x64보다 작은 경우
[451]
상기 조건 2에서, qtbtt_dual_tree_intra_flag는 코딩 트리 블록이 64x64 크기의 코딩 블록으로 묵시적 분할되고, 64x64 크기의 코딩 블록이 듀얼 트리로 분할되는지 여부를 나타낼 수 있다. 상기 듀얼 트리는, 휘도 성분과 색차 성분가 서로 독립적인 분할 구조를 가지고 분할되는 방식을 의미할 수 있다. 상기 코딩 트리 블록의 크기(CtbLog2Size)는, 부호화/복호화 장치에 기-정의된 크기(e.g., 64x64, 128x128, 256x256)일 수도 있고, 부호화 장치에서 부호화되어 시그날링될 수도 있다.
[452]
(조건 3) 다음 서브-조건 중 적어도 하나를 만족하는 경우, 상기 정보는 1로 설정될 수 있다.
[453]
- 제1 상위 블록의 너비와 높이가 64인 경우
[454]
- 제1 상위 블록의 뎁스가 (CtbLog2Size-6)과 동일하고, 제1 상위 블록이 Horizontal BT로 분할되고, 제2 상위 블록이 64x32인 경우
[455]
- 제1 상위 블록의 뎁스가 (CtbLog2Size-6)보다 큰 경우
[456]
- 제1 상위 블록의 뎁스가 (CtbLog2Size-6)과 동일하고, 제1 상위 블록이 Horizontal BT로 분할되고, 제2 상위 블록이 Vertical BT로 분할된 경우
[457]
상기 조건 3에서, 제1 상위 블록은 현재 색차 블록을 하위 블록으로 포함하는 블록일 수 있다. 예를 들어, 현재 색차 블록의 뎁스가 k인 경우, 제1 상위 블록의 뎁스는 (k-n)이고, n은 1, 2, 3, 4 또는 그 이상일 수 있다. 상기 제1 상위 블록의 뎁스는, 쿼드트리 기반의 분할에 따른 뎁스만을 의미하거나, 쿼드트리, 바이너리트리 또는 터너리트리 중 적어도 하나의 분할에 따른 뎁스를 의미할 수도 있다. 상기 제2 상위 블록은 제1 상위 블록에 속한 하위 블록으로서, 현재 색차 블록보다 작은 뎁스를, 제1 상위 블록보다 큰 뎁스를 가질 수 있다. 예를 들어, 현재 색차 블록의 뎁스가 k인 경우, 제2 상위 블록의 뎁스는 (k-m)이고, m은 n보다 작은 자연수일 수 있다.
[458]
전술한 조건 1 내지 3 중 어느 하나도 만족하지 않는 경우, 상기 정보는 0으로 설정될 수 있다.
[459]
다만, 조건 1 내지 3 중 적어도 하나를 만족하는 경우라도, 다음 서브-조건 중 적어도 하나를 만족하는 경우, 상기 정보는 0으로 재설정될 수 있다.
[460]
- 제1 상위 블록이 64x64이고, 전술한 서브 블록 단위의 예측을 수행하는 경우
[461]
- 제1 상위 블록의 너비 또는 높이 적어도 하나가 64보다 작고, 제1 상위 블록의 뎁스가 (CtbLog2Size-6)와 동일한 경우
[462]
도 41을 참조하면, 색차 블록의 성분 간 참조를 위한 휘도 영역을 특정할 수 있다(S4110).
[463]
상기 휘도 영역은, 휘도 블록 또는 휘도 블록에 인접한 이웃 영역 중 적어도 하나를 포함할 수 있다. 여기서, 휘도 블록은 화소 pY[x][y] (x=0..nTbW*2-1, y=0..nTbH*2-1)을 포함하는 영역으로 정의될 수 있다. 상기 화소는, 인-루프 필터가 적용되기 전의 복원값을 의미할 수 있다.
[464]
상기 이웃 영역은, 좌측 이웃 영역, 상단 이웃 영역 또는 좌상단 이웃 영역 중 적어도 하나를 포함할 수 있다. 상기 좌측 이웃 영역은, 화소 pY[x][y] (x=-1..-3, y=0..2*numSampL-1)을 포함하는 영역으로 설정될 수 있다. 상기 설정은, numSampL의 값이 0보다 큰 경우에 한하여 수행될 수 있다. 상기 상단 이웃 영역은, 화소 pY[x][y] (x=0..2*numSampT-1, y=-1..-3)을 포함하는 영역으로 설정될 수 있다. 상기 설정은, numSampT의 값이 0보다 큰 경우에 한하여 수행될 수 있다. 상기 좌상단 이웃 영역은, 화소 pY[x][y] (x=-1, y=-1,-2)을 포함하는 영역으로 설정될 수 있다. 상기 설정은, 휘도 블록의 좌상단 영역이 가용인 경우에 한하여 수행될 수 있다.
[465]
전술한, numSampL 및 numSampT은, 현재 블록의 인트라 예측 모드에 기초하여 결정될 수 있다. 여기서, 현재 블록은 색차 블록을 의미할 수 있다.
[466]
예를 들어, 현재 블록의 인트라 예측 모드가 INTRA_LT_CCLM인 경우, 다음 수학식 13과 같이 유도될 수 있다. 여기서, INTRA_LT_CCLM은 성분 간 참조가 현재 블록의 좌측 및 상단에 인접한 영역에 기반하여 수행되는 모드를 의미할 수 있다.
[467]
[수학식 13]
[468]
numSampT = availT ? nTbW : 0
[469]
numSampL = availL ? nTbH : 0
[470]
수학식 13에 따르면, numSampT는 현재 블록의 상단 이웃 영역이 가용인 경우에는 nTbW으로 유도되고, 그렇지 않은 경우에는 0으로 유도될 수 있다. 마찬가지로, numSampL은 현재 블록의 좌측 이웃 영역이 가용인 경우에는 nTbH으로 유도되고, 그렇지 않은 경우에는 0으로 유도될 수 있다.
[471]
반면, 현재 블록의 인트라 예측 모드가 INTRA_LT_CCLM가 아닌 경우, 다음 수학식 14와 같이 유도될 수 있다.
[472]
[수학식 14]
[473]
numSampT = ( availT && predModeIntra = = INTRA_T_CCLM ) ? ( nTbW + numTopRight ) : 0
[474]
numSampL = ( availL && predModeIntra = = INTRA_L_CCLM ) ? ( nTbH + numLeftBelow ) : 0
[475]
수학식 14에서, INTRA_T_CCLM은 성분 간 참조가 현재 블록의 상단에 인접한 영역에 기반하여 수행되는 모드를 의미하고, INTRA_L_CCLM은 성분 간 참조가 현재 블록의 좌측에 인접한 영역에 기반하여 수행되는 모드를 의미할 수 있다. numTopRight은, 색차 블록의 우상단에 인접한 영역에 속한 전부 또는 일부 화소의 개수를 의미할 수 있다. 일부 화소는, 해당 영역의 최하단 화소 라인(row)에 속한 화소 중 가용 화소를 의미할 수 있다. 가용에 대한 판단은, 좌측에서 우측 방향으로 화소의 가용 여부를 순차적으로 판단하며, 이는 비가용 화소가 발견될 때까지 수행될 수 있다. numLeftBelow은, 색차 블록의 좌하단에 인접한 영역에 속한 전부 또는 일부 화소의 개수를 의미할 수 있다. 일부 화소는, 해당 영역의 최우측 화소 라인(column)에 속한 화소 중 가용 화소를 의미할 수 있다. 가용에 대한 판단은, 위에서 아래 방향으로 화소의 가용 여부를 순차적으로 판단하며, 이는 비가용 화소가 발견될 때까지 수행될 수 있다.
[476]
도 41을 참조하면, S4110에서 특정된 휘도 영역에 대해서 다운샘플링이 수행될 수 있다(S4120).
[477]
상기 다운샘플링은, 1. 휘도 블록에 대한 다운샘플링, 2. 휘도 블록의 좌측 이웃 영역에 대한 다운샘플링, 또는 3. 휘도 블록의 상단 이웃 영역에 대한 다운샘플링 중 적어도 하나를 포함할 수 있으며, 이하 상세히 살펴 보도록 한다.
[478]
1. 휘도 블록에 대한 다운샘플링
[479]
(실시예 1)
[480]
다운샘플링된 휘도 블록의 화소 pDsY[x][y] (x=0..nTbW-1, y=0..nTbH-1)은, 휘도 블록의 대응 화소 pY[2*x][2*y] 및 주변 화소에 기초하여 유도될 수 있다. 주변 화소은, 대응 화소의 좌측, 우측, 상단, 또는 하단 중 적어도 하나의 방향으로 인접한 화소를 의미할 수 있다. 예를 들어, 화소 pDsY[x][y]은 다음 수학식 15와 같이 유도될 수 있다.
[481]
[수학식 15]
[482]
pDsY[ x ][ y ] = ( pY[ 2 * x ][ 2 * y - 1 ] + pY[ 2 * x - 1 ][ 2 * y ] + 4 * pY[ 2 * x ][ 2 * y ] + pY[ 2 * x + 1 ][ 2 * y ] + pY[ 2 * x ][ 2 * y + 1 ] + 4 ) >> 3
[483]
다만, 현재 블록의 좌측/상단 이웃 영역이 비가용인 경우가 존재할 수 있다. 만일 현재 블록의 좌측 이웃 영역이 비가용인 경우, 다운샘플링된 휘도 블록의 화소 pDsY[0][y] (y=1..nTbH-1)은, 휘도 블록의 대응 화소 pY[0][2*y] 및 주변 화소에 기초하여 유도될 수 있다. 주변 화소는, 대응 화소의 상단 또는 하단 중 적어도 하나의 방향으로 인접한 화소를 의미할 수 있다. 예를 들어, 화소 pDsY[0][y] (y=1..nTbH-1)은 다음 수학식 16과 같이 유도될 수 있다.
[484]
[수학식 16]
[485]
pDsY[ 0 ][ y ] = ( pY[ 0 ][ 2 * y - 1 ] + 2 * pY[ 0 ][ 2 * y ] + pY[ 0 ][ 2 * y + 1 ] + 2 ) >> 2
[486]
만일 현재 블록의 상단 이웃 영역이 비가용인 경우, 다운샘플링된 휘도 블록의 화소 pDsY[x][0] (x=1..nTbW-1)은, 휘도 블록의 대응 화소 pY[2*x][0] 및 주변 화소에 기초하여 유도될 수 있다. 주변 화소는, 대응 화소의 좌측 또는 우측 중 적어도 하나의 방향으로 인접한 화소를 의미할 수 있다. 예를 들어, 화소 pDsY[x][0] (x=1..nTbW-1)은 다음 수학식 17과 같이 유도될 수 있다.
[487]
[수학식 17]
[488]
pDsY[ x ][ 0 ] = ( pY[ 2 * x - 1 ][ 0 ] + 2 * pY[ 2 * x ][ 0 ] + pY[ 2 * x + 1 ][ 0 ] + 2 ) >> 2
[489]
한편, 다운샘플링된 휘도 블록의 화소 pDsY[0][0]은, 휘도 블록의 대응 화소 pY[0][0] 및/또는 주변 화소에 기초하여 유도될 수 있다. 주변 화소의 위치는, 현재 블록의 좌측/상단 이웃 영역의 가용 여부에 따라 상이하게 결정될 수 있다.
[490]
예를 들어, 좌측 이웃 영역은 가용하고, 상단 이웃 영역이 가용하지 않은 경우, pDsY[0][0]은 다음 수학식 18과 같이 유도될 수 있다.
[491]
[수학식 18]
[492]
pDsY[ 0 ][ 0 ] = ( pY[ -1 ][ 0 ] + 2 * pY[ 0 ][ 0 ] + pY[ 1 ][ 0 ] + 2 ) >> 2
[493]
반면, 좌측 이웃 영역은 가용하지 않고, 상단 이웃 영역이 가용한 경우, pDsY[0][0]은 다음 수학식 19와 같이 유도될 수 있다.
[494]
[수학식 19]
[495]
pDsY[ 0 ][ 0 ] = ( pY[ 0 ][ -1 ] + 2 * pY[ 0 ][ 0 ] + pY[ 0 ][ 1 ] + 2 ) >> 2
[496]
한편, 좌측 및 상단 이웃 영역 모두 가용하지 않은 경우, pDsY[ 0 ][ 0 ]은 휘도 블록의 대응 화소 pY[0][0]로 설정될 수 있다.
[497]
(실시예 2)
[498]
다운샘플링된 휘도 블록의 화소 pDsY[x][y] (x=0..nTbW-1, y=0..nTbH-1)은, 휘도 블록의 대응 화소 pY[2*x][2*y] 및 주변 화소에 기초하여 유도될 수 있다. 주변 화소는, 대응 화소의 하단, 좌측, 우측, 좌하단 또는 우하단 중 적어도 하나의 방향으로 인접한 화소를 의미할 수 있다. 예를 들어, 화소 pDsY[x][y]은 다음 수학식 20과 같이 유도될 수 있다.
[499]
[수학식 20]
[500]
pDsY[ x ][ y ] = ( pY[ 2 * x - 1 ][ 2 * y ] + pY[ 2 * x - 1 ][ 2 * y + 1 ] + 2* pY[ 2 * x ][ 2 * y ] + 2*pY[ 2 * x ][ 2 * y + 1 ] + pY[ 2 * x + 1 ][ 2 * y ] + pY[ 2 * x + 1 ][ 2 * y + 1 ] + 4 ) >> 3
[501]
다만, 만일 현재 블록의 좌측 이웃 영역이 비가용인 경우, 다운샘플링된 휘도 블록의 화소 pDsY[0][y] (y=0..nTbH-1)은, 휘도 블록의 대응 화소 pY[0][2*y] 및 하단 주변 화소에 기초하여 유도될 수 있다. 예를 들어, 화소 pDsY[0][y] (y=0..nTbH-1)은 다음 수학식 21과 같이 유도될 수 있다.
[502]
[수학식 21]
[503]
pDsY[ 0 ][ y ] = ( pY[ 0 ][ 2 * y ] + pY[ 0 ][ 2 * y + 1 ] + 1 ) >> 1
[504]
휘도 블록의 다운샘플링은, 전술한 실시예 1과 2 중 어느 하나에 기초하여 수행될 수 있다. 이때 소정의 플래그에 기초하여 실시예 1 또는 2 중 어느 하나가 선택될 수 있다. 여기서, 플래그는, 다운샘플링된 휘도 화소가 원 휘도 화소와 동일한 위치를 가지는지 여부를 나타낼 수 있다. 예를 들어, 상기 플래그가 제1 값인 경우, 다운샘플링된 휘도 화소가 원 휘도 화소와 동일한 위치를 가진다. 반면, 상기 플래그가 제2 값인 경우, 다운샘플링된 휘도 화소는 원 휘도 화소와 수평 방향으로는 동일한 위치를 가지나, 수직 방향으로는 하프 펠(half pel)만큼 쉬프트된 위치를 가진다.
[505]
2. 휘도 블록의 좌측 이웃 영역에 대한 다운샘플링
[506]
(실시예 1)
[507]
다운샘플링된 좌측 이웃 영역의 화소 pLeftDsY[y] (y=0..numSampL-1)은, 좌측 이웃 영역의 대응 화소 pY[-2][2*y] 및 주변 화소에 기초하여 유도될 수 있다. 주변 화소는, 대응 화소의 좌측, 우측, 상단, 또는 하단 중 적어도 하나의 방향으로 인접한 화소를 의미할 수 있다. 예를 들어, 화소 pLeftDsY[y]은 다음 수학식 22와 같이 유도될 수 있다.
[508]
[수학식 22]
[509]
pLeftDsY[ y ] = ( pY[ -2 ][ 2 * y - 1 ] + pY[ -3 ][ 2 * y ] + 4 * pY[ -2 ][ 2 * y ] + pY[ -1 ][ 2 * y ] + pY[ -2][ 2 * y + 1 ] + 4 ) >> 3
[510]
다만, 현재 블록의 좌상단 이웃 영역이 비가용인 경우, 다운샘플링된 좌측이웃 영역의 화소 pLeftDsY[ 0 ]은, 좌측 이웃 영역의 대응 화소 pY[-2][0] 및 주변 화소에 기초하여 유도될 수 있다. 주변 화소는, 대응 화소의 좌측 또는 우측 중 적어도 하나의 방향으로 인접한 화소를 의미할 수 있다. 예를 들어, 화소 pLeftDsY[ 0 ]은 다음 수학식 23과 같이 유도될 수 있다.
[511]
[수학식 23]
[512]
pLeftDsY[ 0 ] = ( pY[ -3 ][ 0 ] + 2 * pY[ -2 ][ 0 ] + pY[ -1 ][ 0 ] + 2 ) >> 2
[513]
(실시예 2)
[514]
다운샘플링된 좌측 이웃 영역의 화소 pLeftDsY[y] (y=0..numSampL-1)은, 좌측 이웃 영역의 대응 화소 pY[-2][2*y] 및 주변 화소에 기초하여 유도될 수 있다. 주변 화소는, 대응 화소의 하단, 좌측, 우측, 좌하단 또는 우하단 중 적어도 하나의 방향으로 인접한 화소를 의미할 수 있다. 예를 들어, 화소 pLeftDsY[y]은 다음 수학식 24와 같이 유도될 수 있다.
[515]
[수학식 24]
[516]
pLeftDsY[ y ] = ( pY[ -1 ][ 2 * y ] + pY[ -1 ][ 2 * y + 1 ] + 2*pY[ -2 ][ 2 * y ] + 2*pY[ -2 ][ 2 * y + 1 ] + pY[ -3 ][ 2 * y ] + pY[ -3 ][ 2 * y + 1 ] + 4 ) >> 3
[517]
마찬가지로, 좌측 이웃 영역의 다운샘플링은, 전술한 실시예 1과 2 중 어느 하나에 기초하여 수행될 수 있다. 이때 소정의 플래그에 기초하여 실시예 1 또는 2 중 어느 하나가 선택될 수 있다. 상기 플래그는, 다운샘플링된 휘도 화소가 원 휘도 화소와 동일한 위치를 가지는지 여부를 나타내며, 이는 전술한 바와 같다.
[518]
한편, 좌측 이웃 영역에 대한 다운샘플링은, numSampL 값이 0보다 큰 경우에 한하여 수행될 수 있다. numSampL 값이 0보다 큰 경우라 함은, 현재 블록의 좌측 이웃 영역이 가용이고, 현재 블록의 인트라 예측 모드는 INTRA_LT_CCLM 또는 INTRA_L_CCLM인 경우를 의미할 수 있다.
[519]
3. 휘도 블록의 상단 이웃 영역에 대한 다운샘플링
[520]
(실시예 1)
[521]
다운샘플링된 상단 이웃 영역의 화소 pTopDsY[x] (x=0..numSampT-1)은, 상단 이웃 영역이 휘도 블록과 상이한 CTU에 속하는지 여부를 고려하여 유도될 수 있다.
[522]
상단 이웃 영역이 휘도 블록과 동일한 CTU에 속하는 경우, 다운샘플링된 상단 이웃 영역의 화소 pTopDsY[x]는 상단 이웃 영역의 대응 화소 pY[2*x][-2] 및 주변 화소에 기초하여 유도될 수 있다. 주변 화소는, 대응 화소의 좌측, 우측, 상단, 또는 하단 중 적어도 하나의 방향으로 인접한 화소를 의미할 수 있다. 예를 들어, 화소 pTopDsY[x]은 다음 수학식 25와 같이 유도될 수 있다.
[523]
[수학식 25]
[524]
pTopDsY[ x ] = ( pY[ 2 * x ][ -3 ] + pY[ 2 * x - 1 ][ -2 ] + 4 * pY[ 2 * x ][ -2 ] + pY[ 2 * x + 1 ][ -2 ] + pY[ 2 * x ][ -1 ] + 4 ) >> 3
[525]
반면, 상단 이웃 영역이 휘도 블록과 상이한 CTU에 속하는 경우, 다운샘플링된 상단 이웃 영역의 화소 pTopDsY[x]는 상단 이웃 영역의 대응 화소 pY[2*x][-1] 및 주변 화소에 기초하여 유도될 수 있다. 주변 화소는, 대응 화소의 좌측 또는 우측 중 적어도 하나의 방향으로 인접한 화소를 의미할 수 있다. 예를 들어, 화소 pTopDsY[ x ]은 다음 수학식 26과 같이 유도될 수 있다.
[526]
[수학식 26]
[527]
pTopDsY[ x ] = ( pY[ 2 * x - 1 ][ -1 ] + 2* pY[ 2 * x ][ -1 ] + pY[ 2 * x + 1 ][ -1 ] + 2 ) >> 2
[528]
또는, 현재 블록의 좌상단 이웃 영역이 비가용인 경우, 상기 주변 화소는 대응 화소의 상단 또는 하단 중 적어도 하나의 방향으로 인접한 화소를 의미할 수 있다. 예를 들어, 화소 pTopDsY[ 0 ]은 다음 수학식 27과 같이 유도될 수 있다.
[529]
[수학식 27]
[530]
pTopDsY[ 0 ] = ( pY[ 0 ][ -3 ] + 2 * pY[ 0 ][ -2 ] + pY[ 0 ][ -1 ] + 2 ) >> 2
[531]
또는, 현재 블록의 좌상단 이웃 영역이 비가용이고, 상단 이웃 영역이 휘도 블록과 상이한 CTU에 속하는 경우, 화소 pTopDsY[ 0 ]은 상단 이웃 영역의 화소 pY[ 0 ][ -1 ]로 설정될 수 있다.
[532]
(실시예 2)
[533]
다운샘플링된 상단 이웃 영역의 화소 pTopDsY[x] (x=0..numSampT-1)은, 상단 이웃 영역이 휘도 블록과 상이한 CTU에 속하는지 여부를 고려하여 유도될 수 있다.
[534]
상단 이웃 영역이 휘도 블록과 동일한 CTU에 속하는 경우, 다운샘플링된 상단 이웃 영역의 화소 pTopDsY[x]는 상단 이웃 영역의 대응 화소 pY[2*x][-2] 및 주변 화소에 기초하여 유도될 수 있다. 주변 화소는, 대응 화소의 하단, 좌측, 우측, 좌하단 또는 우하단 중 적어도 하나의 방향으로 인접한 화소를 의미할 수 있다. 예를 들어, 화소 pTopDsY[x]은 다음 수학식 28과 같이 유도될 수 있다.
[535]
[수학식 28]
[536]
pTopDsY[ x ] = ( pY[ 2 * x - 1 ][ -2 ] + pY[ 2 * x - 1 ][ -1 ] + 2* pY[ 2 * x ][ -2 ] + 2*pY[ 2 * x ][ -1 ] + pY[ 2 * x + 1 ][ -2 ] + pY[ 2 * x + 1 ][ -1 ] + 4 ) >> 3
[537]
반면, 상단 이웃 영역이 휘도 블록과 상이한 CTU에 속하는 경우, 다운샘플링된 상단 이웃 영역의 화소 pTopDsY[x]는 상단 이웃 영역의 대응 화소 pY[2*x][-1] 및 주변 화소에 기초하여 유도될 수 있다. 주변 화소는, 대응 화소의 좌측 또는 우측 중 적어도 하나의 방향으로 인접한 화소를 의미할 수 있다. 예를 들어, 화소 pTopDsY[ x ]은 다음 수학식 29와 같이 유도될 수 있다.
[538]
[수학식 29]
[539]
pTopDsY[ x ] = ( pY[ 2 * x - 1 ][ -1 ] + 2* pY[ 2 * x ][ -1 ] + pY[ 2 * x + 1 ][ -1 ] + 2 ) >> 2
[540]
또는, 현재 블록의 좌상단 이웃 영역이 비가용인 경우, 상기 주변 화소는 대응 화소의 상단 또는 하단 중 적어도 하나의 방향으로 인접한 화소를 의미할 수 있다. 예를 들어, 화소 pTopDsY[ 0 ]은 다음 수학식 30과 같이 유도될 수 있다.
[541]
[수학식 30]
[542]
pTopDsY[ 0 ] = ( pY[ 0 ][ -2 ] + pY[ 0 ][ -1 ] + 1 ) >> 1
[543]
또는, 현재 블록의 좌상단 이웃 영역이 비가용이고, 상단 이웃 영역이 휘도 블록과 상이한 CTU에 속하는 경우, 화소 pTopDsY[ 0 ]은 상단 이웃 영역의 화소 pY[ 0 ][ -1 ]로 설정될 수 있다.
[544]
마찬가지로, 상단 이웃 영역의 다운샘플링은, 전술한 실시예 1과 2 중 어느 하나에 기초하여 수행될 수 있다. 이때 소정의 플래그에 기초하여 실시예 1 또는 2 중 어느 하나가 선택될 수 있다. 상기 플래그는, 다운샘플링된 휘도 화소가 원 휘도 화소와 동일한 위치를 가지는지 여부를 나타내며, 이는 전술한 바와 같다.
[545]
한편, 상단 이웃 영역에 대한 다운샘플링은, numSampT 값이 0보다 큰 경우에 한하여 수행될 수 있다. numSampT 값이 0보다 큰 경우라 함은, 현재 블록의 상단 이웃 영역이 가용이고, 현재 블록의 인트라 예측 모드는 INTRA_LT_CCLM 또는 INTRA_T_CCLM인 경우를 의미할 수 있다.
[546]
전술한 휘도 블록의 좌측 또는 상단 이웃 영역 중 적어도 하나(이하, 휘도 참조 영역)에 대한 다운샘플링은, 특정 위치의 대응 화소 pY[-2][2*y] 및 주변 화소만을 이용하여 수행될 수 있다. 여기서, 특정 위치는, 색차 블록의 좌측 또는 상단 이웃 영역 중 적어도 하나(이하, 색차 참조 영역)에 속한 복수의 화소 중 선택된 화소의 위치에 기초하여 결정될 수 있다.
[547]
상기 선택된 화소는, 색차 참조 영역에서 홀수번째에 위치한 화소이거나 짝수번째에 위치한 화소일 수 있다. 또는, 상기 선택된 화소는, 시작 화소 및 시작 화소로부터 소정의 간격마다 위치한 하나 또는 그 이상의 화소일 수 있다. 여기서, 시작 화소는 색차 참조 영역에서 첫번째, 두번째 또는 세번째에 위치한 화소일 수 있다. 상기 간격은 1개, 2개, 3개, 4개 또는 그 이상의 샘플 간격일 수 있다. 예를 들어, 상기 간격이 1개 샘플 간격인 경우, 선택된 화소는 n번째 화소, (n+2)번째 화소 등을 포함할 수 있다. 선택된 화소의 개수는, 2개, 4개, 6개, 8개 또는 그 이상일 수 있다.
[548]
상기 선택된 화소의 개수, 시작 화소 및 간격은, 색차 참조 영역의 길이(즉, numSampL 및/또는 numSampT) 또는 색차 블록의 인트라 예측 모드 중 적어도 하나에 기초하여 가변적으로 결정될 수 있다. 또는, 선택된 화소의 개수는, 색차 참조 영역의 길이 및 색차 블록의 인트라 예측 모드에 관계없이, 부호화/복호화 장치에 기-약속된 고정된 개수(e.g., 4개)일 수 있다.
[549]
도 41을 참조하면, 색차 블록의 성분 간 참조를 위한 파라미터를 유도할 수 있다(S4130).
[550]
상기 파라미터는 가중치 또는 오프셋 중 적어도 하나를 포함할 수 있다. 상기 파라미터는, 현재 블록의 인트라 예측 모드를 고려하여 결정될 수 있다. 상기 파라미터는, 색차 참조 영역의 선택된 화소 및 휘도 참조 영역의 다운샘플링을 통해 획득된 화소를 이용하여 유도될 수 있다.
[551]
구체적으로, 휘도 참조 영역의 다운샘플링을 통해 획득된 n개의 화소 간의 크기 비교를 수행하여, n개의 화소를 2개의 그룹으로 분류할 수 있다. 예를 들어, 제1 그룹은 n개의 화소 중 상대적으로 큰 값을 가진 화소의 그룹이고, 제2 그룹은 n개의 샘플 중 제1 그룹의 화소를을 제외한 나머지 화소의 그룹일 수 있다. 즉, 제2 그룹은 상대적으로 작은 값을 가진 화소의 그룹일 수 있다. 여기서, n은 4, 8, 16 또는 그 이상일 수 있다. 제1 그룹에 속한 화소들의 평균값을 최대값(MaxL)으로 설정하고, 제2 그룹에 속한 화소들의 평균값을 최소값(MinL)으로 설정할 수 있다.
[552]
상기 휘도 참조 영역의 다운샘플링을 통해 획득된 n개의 화소에 대한 그룹핑에 따라, 색차 참조 영역의 선택된 화소를 그룹핑할 수 있다. 휘도 참조 영역에 대한 제1 그룹의 화소에 대응하는 색차 참조 영역의 화소를 이용하여, 색차 참조 영역에 대한 제1 그룹을 구성하고, 휘도 참조 영역에 대한 제2 그룹의 화소에 대응하는 색차 참조 영역의 화소를 이용하여, 색차 참조 영역에 대한 제2 그룹을 구성할 수 있다. 마찬가지로, 제1 그룹에 속한 화소들의 평균값을 최대값(MaxC)으로 설정하고, 제2 그룹에 속한 화소들의 평균값을 최소값(MinC)으로 설정할 수 있다.
[553]
상기 산출된 최대값(MaxL, MaxC) 및 최소값(MinL, MaxC)을 기반으로, 상기 파라미터의 가중치 및/또는 오프셋을 유도할 수 있다.
[554]
색차 블록은, 다운샘플링된 휘도 블록과 파라미터를 기반으로 예측됟 수 있다(S4140).
[555]
색차 블록은 다운샘플링된 휘도 블록의 화소에 기-유도된 가중치 또는 오프셋 중 적어도 하나를 적용하여 예측될 수 있다.
[556]
다만, 도 41은 휘도 블록의 주변 영역에 대한 다운샘플링 방법의 일예에 불과하며, 다른 다운샘플링/서브샘플링 방법이 적용될 수도 있으며, 이에 대해서는 이하 도 42 내지 도 48을 참조하여 자세히 살펴보도록 한다.
[557]
[558]
도 42 내지 도 48은 본 발명이 적용되는 일실시예로서, 휘도 블록의 주변 영역에 대한 다운샘플링 및 성분 간 참조를 위한 파라미터 유도 방법을 도시한 것이다.
[559]
현재 코딩 유닛의 주변 샘플을 Downsampling 또는 subsampling 중 적어도 하나를 수행한 영상을 기반으로 선형 예측하여 수학식 31과 같이 예측 영상을 생성할 수 있다.
[560]
[수학식 31]
[561]
Pred c(i,j) = (α * rec l'(i,j) >> S) + β
[562]
수학식 31에서, rec l'은 다운샘플링된 휘도 블록의 복원 샘플을 의미하며, Pred c은 선형 크로마 예측에 의해 생성된 색차 블록의 예측 샘플을 의미할 수 있다.
[563]
현재 코딩 유닛의 주변 샘플은 도 42의 오른쪽 그림과 같이 현재 코딩 유닛의 좌측 경계와 상측 경계에 존재하는 샘플로 구성할 수 있으며, 이를 다운샘플링 (도 42의 오른쪽 그림의 회색 샘플로 다운샘플링)할 수 있으며, 이를 휘도 주변 템플릿 영상이라 부르기로 한다.
[564]
이때 수학식 31의 예측 에러를 가장 적게하는 선형 크로마 예측 파라미터 α 및 β 값은 다음 수학식 32와 같이 유도할 수 있다.
[565]
[수학식 32]
[566]
α = (y B - y A) / (x B - x A)
[567]
β = y A - α* x A
[568]
여기서 도 43과 같이 x A는 서브 샘플링된 휘도의 주변 샘플(즉, 휘도 주변 템플릿 영상) 중 가장 작은 값을 나타내고, x B는 서브 샘플링된 휘도의 주변 샘플 중 가장 큰 값을 나타낸다. y A는 x A와 대응되는 크로마의 주변 샘플을 나타내고, y B는 x B와 대응되는 크로마의 주변 샘플을 나타낸다.
[569]
또는, 도 44와 같이, 휘도 주변 템플릿 영상을 서브 샘플링하여 Max 및 min 값을 유도할 수도 있다. 전술한 바와 같이, 다운샘플링/서브샘플링을 통해 획득된 n개의 샘플을 2개의 그룹으로 분류할 수 있다. 예를 들어, 제1 그룹은 n개의 샘플 중 상대적으로 큰 값을 가진 샘플의 그룹이고, 제2 그룹은 n개의 샘플 중 제1 그룹의 샘플을 제외한 나머지 샘플의 그룹일 수 있다. 즉, 제2 그룹은 상대적으로 작은 값을 가진 샘플의 그룹일 수 있다. 여기서, n은 4, 8, 16 또는 그 이상일 수 있다. 제1 그룹에 속한 샘플들의 평균값을 최대값(Max)으로 설정하고, 제2 그룹에 속한 샘플들의 평균값을 최소값(Min)으로 설정할 수 있다.
[570]
Min 또는 Max 값이 다른 샘플로부터 많이 떨어져 있는 아이솔레이티드 샘플(isolated sample)인 경우, 수학식 32를 이용하여 크로마 예측을 하면 예측 성능이 낮아질 가능성이 크다.
[571]
휘도 주변 템플릿 영상을 서브 샘플링 함으로써 아이솔레이티드 샘플이 최대값 또는 최소값이 되는 경우가 적어지고, 예측 성능을 올릴 수 있는 장점이 있다. 또한 최대값 및 최소값을 구하기 위해 비교 연산을 수행해야 하는데, 연산의 수가 4N(최대값 2N 및 최소값 2N)에서 2N(최대값 N 및 최소값 N)번으로 줄어들 수 있다.
[572]
휘도 주변 템플릿 영상을 휘도 블록 상측 경계에 인접한 i개 라인과 좌측 경계에 인접한 j개 라인에서 유도할 수 있다. i와 j는 2, 3, 4, 또는 그 이상일 수 있다. i는 j와 동일할 수 있고, i는 j보다 큰 값으로 설정될 수도 있다.
[573]
도 45와 같이 상측 경계에 인접한 4개 라인에서 2개 라인이 되도록 서브 샘플링/다운 샘플링을 수행할 수 있고, 좌측 경계에 인접한 4개 라인에서 2개 라인이 되도록 서브 샘플링/다운 샘플링을 수행할 수 있으며, 이를 1차 휘도 템플릿이라고 한다. 1차 휘도 템플릿의 Max 및 min 값을 유도하여, 선형 예측 크로마 파라미터 α 및 β를 유도할 수 있다. 유도된 선형 예측 크로마 파라미터와 휘도 블록의 복원 샘플을 이용하여, 색차 블록에 대한 선형 예측 크로마 예측을 수행할 수 있다. 여기서, 휘도 블록의 복원 샘플은 색차 블록의 해상도에 대응되도록 다운샘플링된 샘플일 수 있다.
[574]
도 46과 같이 다운 샘플링을 통해 생성된 1차 휘도 템플릿에서 서브 샘플링을 수행하여, 휘도 주변 템플릿 영상을 생성할 수 있다.
[575]
일 예로, 1차 휘도 템플릿 중 상측 라인에서는 x축 좌표가 같은 샘플끼리 동시에 서브 샘플링이 되지 않도록 구성할 수 있다. 마찬가지로, 1차 휘도 템플릿 중 상측 라인에서는 y축 좌표가 같은 샘플을 동시에 서브 샘플링 되지 않도록 구성할 수 있다.
[576]
또는, 휘도 블록에서 멀티 라인 인트라 예측 방법을 사용한 경우에는 인트라 레퍼런스 라인 인덱스(intra_luma_ref_idx)에 따라 휘도 주변 템플릿 영상을 서로 다르게 구성할 수도 있다. 구체적으로 예를 들어, intra_luma_ref_idx 값이 0인 경우에는 도 47의 좌측 그림과 같이 휘도 경계에 인접한 휘도 주변 템플릿 영상을 구성할 수 있고, intra_luam_ref_idx 값이 0이 아닌 경우에는 우측 그림과 같이 휘도 경계와 인접하지 않은 휘도 주변 템플릿 영상을 구성할 수 있다.
[577]
또는, 휘도에서 멀티 라인 인트라 예측 방법을 사용한 경우에는 인트라 레퍼런스 라인 인덱스(intra_luma_ref_idx)에 따라 휘도 주변 템플릿 영상 내 샘플을 가중 예측하여 휘도 주변 템플릿 영상의 최대값 및 최소값을 유도할 수 있다. 구체적으로 예를 들어, 상측 2개 라인에서 x축 좌표가 같은 샘플 끼리 가중 예측을 수행하고, 좌측 2개 라인에서 y축 좌표가 같은 샘플끼리 가중 예측을 수행하여 제2 주변 템플릿 샘플을 생성할 수 있다. 제2 주변 템플릿 샘플의 max 및 min 값을 산출하고, 이를 이용하여 선형 예측 크로마 파라미터 α 및 β를 유도할 수 있으며, 선형 예측 크로마 예측을 수행할 수 있다.
[578]
제2 주변 템플릿 샘플 생성시 사용되는 가중 예측 파라미터 값은 도 48과 같이 intra_luma_ref_idx 값에 따라 서로 다르게 설정할 수 있다. 구체적으로 예를 들어, intra_luma_ref_idx 값이 0인 경우에는 블록 경계와 인접한 라인에 속한 샘플에 가중치를 크게 설정할 수 있고, intra_luma_ref_idx 값이 0이 아닌 경우에는 블록 경계와 인접하지 않은 라인에 속한 샘플에 가중치를 크게 설정할 수 있다.
[579]
[580]
인터 예측, 인트라 예측, 머지 모드 또는 스킵 모드와 같이 기존 예측 모드 중 적어도 두개의 예측 모드를 가중 예측하여 새로운 예측 영상을 생성할 수 있으며, 이를 결합 예측 모드(Multi-hypothesis prediction mode)라고 부르며, 가중 예측에 사용되는 가중치를 결합 예측 가중치라고 부른다.
[581]
예를 들어, 인터 예측과 인트라 예측을 가중 예측하여 결합 예측을 생성할 수도 있다. 구체적으로 예를 들어, 머지 모드와 인트라 예측를 기반으로 각각 예측 블록을 생성하고, 이를 가중 예측하여 최종 예측 블록을 생성할 수도 있으며, 이를 머지-인트라 결합 예측이라고 부른다.
[582]
머지 플래그 (merge_flag) 값이 1인 경우에 머지-인트라 결합 예측 방법을 선택적으로 적용할 수도 있다. 머지-인트라 결합 예측을 사용하는지를 나타내는 머지 인트라 결합 예측 플래그 mh_intra_flag를 시그날링할 수 있다. mh_intra_flag 값이 1이면, 머지-인트라 결합 예측 방법을 사용함을 나타낸다. 머지-인트라 결합 예측 영상 P comb은 수학식 33과 같이 머지 모드에서 생성된 머지 예측 영상 P merge와 인트라 예측 영상에서 생성된 인트라 예측 영상 P intra를 가중 예측하여 유도할 수 있다.
[583]
[수학식 33]
[584]
P comb = ( w * P merge + (N-w) * P intra + 4 ) >> log2N
[585]
일 예로, 수학식 33에서 N을 3으로 설정할 수도 있다.
[586]
머지-인트라 결합 예측에서는 멀티 라인 인트라 방법을 사용하지 않도록 제한할 수도 있다.
[587]
머지-인트라 결합 예측을 사용하는 경우에는 인트라 예측 모드 중 특정 예측 모드만 사용하도록 제한할 수도 있다. 구체적으로 예를 들어, 인트라 예측 모드 중 DC, Planar, Horizontal, Vertical 모드만 사용하도록 제한할 수도 있다.
[588]
또 다른 예를 들어, 인트라 예측 모드 중 Planar, Horizontal, Vertical 모드만 사용하거나, 또는 Planar, DC, Horizontal 모드만 사용하거나, 또는 Planar, DC, Vertical mode만 사용하도록 제한할 수도 있다.
[589]
또 다른 예를 들어, 인트라 예측 모드 중 주변 블록에서 유도한 6개의 MPM 모드 또는 그 중 일부만 사용하도록 제한할 수도 있다. 구체적으로 예를 들어, MPM 모드가 {PLANAR, DC, INTRA_MODE32, INTRA_MODE31, INTRA_MODE33, INTRA_MODE30}으로 구성된 경우에 PLNAR, DC, INTRA_MODE32, INTRA_MODE31만 사용하도록 제한할 수도 있다.
[590]
머지-인트라 결합 예측에서 멀티 라인 인트라 방법을 사용할 수도 있다. 즉 머지 모드로 생성한 예측 영상과 멀티 라인 인트라 방법을 사용하여 생성한 예측 영상을 결합 예측 할 수도 있다. 비인접 레퍼런스 라인을 사용하여 인트라 예측을 생성하는 경우에는 Vertical, Horizontal, INTRA_MODE2, INTRA_MODE66만 사용하도록 제한할 수도 있다. 또는 비인접 레퍼런스 라인을 사용하여 인트라 예측을 생성하는 경우에는 Vertical, Horizontal 만 사용하도록 제한할 수도 있다
[591]
머지-인트라 결합 예측 방법에 사용된 인트라 예측 모드를 시그날링하기 위해서 머지-인트라 예측 인덱스 mh_intra_idx를 시그날링할 수 있다. 일 예로, 다음 표 11 내지 표 12와 같이 나타낼 수 있다.
[592]
[표11]
mh_intra_idx 0 1 2 3
intra mode PLANAR DC VERTICAL HORIZONTAL

[593]
[표12]
mh_intra_idx 0 1 2
intra mode PLANAR VERTICAL HORIZONTAL

[594]
결합 예측을 이용하여 삼각 예측 유닛의 예측 영상을 생성할 수도 있다. 일 예로, 머지-인트라 결합 예측 방법을 사용하여 삼각 예측 유닛의 예측 영상을 생성할 수도 있다. 좌삼각 예측 유닛의 머지 인덱스 및 인트라 예측 모드, 우삼각 예측 유닛의 머지 인덱스 및 인트라 예측 모드에 관한 정보를 시그날링할 수 있다.
[595]
[596]
도 49 및 도 50은 본 발명이 적용되는 일실시예로서, 복원 블록에 인루프 필터를 적용하는 방법을 도시한 것이다.
[597]
인루프 필터링(In-loop filtering)은 양자화 및 부호화 과정에서 발생하는 정보의 손실을 줄이기 위해 복호화 된 영상에 적응적으로 필터링을 수행하는 기술이다. 디블록킹 필터(Deblocking filter), 샘플 적응적 오프셋 필터(sample adaptive offset filter, SAO), 적응적 루프 필터(adaptive loop filter, ALF)는 인루프 필터링의 한 예이다.
[598]
제1 복원 영상에 디블록킹 필터, 샘플 적응적 오프셋(Sample Adaptive Offset, SAO) 또는 적응적 루프 필터(adaptive loop filter, ALF) 중 적어도 어느 하나를 수행하여 제2 복원 영상을 생성할 수 있다.
[599]
복원 영상에 디블록킹 필터를 적용한 후, SAO 및 ALF를 적용할 수 있다.
[600]
비디오 부호화 과정에서 블록 단위로 변환과 양자화를 수행한다. 양자화 과정에서 발생한 손실이 발생하고, 이를 복원한 영상의 경계에서는 불연속이 발생한다. 블록 경계에 나타난 불연속 영상을 블록 화질 열화(blocking artifact)라고 부른다.
[601]
Deblocking filter는 제1 영상의 블록 경계에서 발생하는 블록 화질 열화(blocking artifact)를 완화시키고, 부호화 성능을 높여주는 방법이다.
[602]
블록 경계에서 필터링을 수행하여 블록 화질 열화를 완화 시킬수 있으며, 도 49와 같이 블록이 인트라 예측 모드로 부호화 되었는지 여부, 또는 이웃한 블록의 움직임 벡터 절대값의 차이가 기-정의된 소정의 문턱값보다 큰지 여부, 이웃한 블록의 참조 픽쳐가 서로 동일한지 여부 중 적어도 어느 하나에 기초하여 블록 필터 강도(blocking strength, 이하 BS) 값을 결정할 수 있다. BS 값이 0이면 필터링을 수행하지 않으며, BS 값이 1 또는 2인 경우에 블록 경계에서 필터링을 수행할 수 있다.
[603]
주파수 영역에서 양자화를 수행하기 때문에, 물체 가장 자리에 링잉 현상 (ringing artifact)을 발생시키거나, 화소 값이 원본에 비해 일정한 값만큼 커지거나 작아기게 된다.
[604]
SAO는 제1 복원 영상의 패턴을 고려하여 블록 단위로 특정 오프셋을 더하거나 빼는 방법으로 링잉 현상을 효과적으로 줄일 수 있다. SAO는 복원 영상의 특징에 따라 에지 오프셋(Edge offset, 이하 EO)과 밴드 오프셋(Band offset, BO)으로 구성된다. 에지 오프셋은 주변 화소 샘플 패턴에 따라 현재 샘플에 오프셋을 다르게 더해주는 방법이다. 밴드 오프셋은 영역 안의 비슷한 화소 밝기 값을 가진 화소 집합에 대해 일정 값을 더해 부호화 오류를 줄이는 것이다. 화소 밝기를 32개의 균일한 밴드로 나눠 비슷한 밝기 값을 가지는 화소를 하나의 집합이 되도록 할 수 있다. 예를 들어, 인접한 4개의 밴드를 하나의 범주로 묶을 수 있다. 하나의 범주에서는 동일한 오프셋 값을 사용하도록 설정할 수 있다.
[605]
ALF (Adaptive Loop Filter)는 수학식 34와 같이 제1 복원 영상 또는 제1 복원 영상에 deblocking filtering을 수행한 복원 영상에 기 정의된 필터 중 어느 하나를 사용하여 제2 복원 영상을 생성하는 방법이다.
[606]
[수학식 34]
[607]
[608]
이 때 필터는 픽쳐 단위 또는 CTU 단위로 선택할 수 있다.
[609]
Luma 성분에서는 다음 도 50과 같이 5x5, 7x7 또는 9x9 다이아몬드 형태 중 어느 하나를 선택할 수 있다. Chroma 성분에서는 5x5 다이아몬드 형태만 사용할 수 있도록 제한할 수도 있다.
[610]
대각 파티셔닝이 사용된 코딩 유닛의 예측 블록 경계에서는 인루프 필터링이 사용되지 않도록 제한할 수도 있다.
[611]
[612]
본 개시의 다양한 실시 예는 모든 가능한 조합을 나열한 것이 아니고 본 개시의 대표적인 양상을 설명하기 위한 것이며, 다양한 실시 예에서 설명하는 사항들은 독립적으로 적용되거나 또는 둘 이상의 조합으로 적용될 수도 있다.
[613]
또한, 본 개시의 다양한 실시 예는 하드웨어, 펌웨어(firmware), 소프트웨어, 또는 그들의 결합 등에 의해 구현될 수 있다. 하드웨어에 의한 구현의 경우, 하나 또는 그 이상의 ASICs(Application Specific Integrated Circuits), DSPs(Digital Signal Processors), DSPDs(Digital Signal Processing Devices), PLDs(Programmable Logic Devices), FPGAs(Field Programmable Gate Arrays), 범용 프로세서(general processor), 컨트롤러, 마이크로 컨트롤러, 마이크로 프로세서 등에 의해 구현될 수 있다.
[614]
본 개시의 범위는 다양한 실시 예의 방법에 따른 동작이 장치 또는 컴퓨터 상에서 실행되도록 하는 소프트웨어 또는 머신-실행가능한 명령들(예를 들어, 운영체제, 애플리케이션, 펌웨어(firmware), 프로그램 등), 및 이러한 소프트웨어 또는 명령 등이 저장되어 장치 또는 컴퓨터 상에서 실행 가능한 비-일시적 컴퓨터-판독가능 매체(non-transitory computer-readable medium)를 포함한다.

산업상 이용가능성

[615]
본 발명은 비디오 부호화/복호화하기 위해 이용될 수 있다.

청구범위

[청구항 1]
현재 블록을 2개의 예측 유닛으로 분할하는 단계; 여기서, 상기 2개의 예측 유닛 중 적어도 하나의 형태는 삼각형임, 상기 현재 블록의 머지 후보 리스트를 구성하는 단계; 상기 현재 블록의 머지 후보 인덱스와 상기 머지 후보 리스트를 이용하여 상기 현재 블록의 움직임 정보를 유도하는 단계; 및 상기 유도된 움직임 정보를 이용하여, 상기 현재 블록의 인터 예측을 수행하는 단계를 포함하는, 비디오 신호 복호화 방법.
[청구항 2]
제1항에 있어서, 상기 분할은, 소정의 분할 라인에 관한 정보에 기초하여 수행되고, 상기 정보는 상기 분할 라인의 시작점, 끝점, 각도 또는 방향 중 적어도 적어도 하나에 관한 정보를 포함하는, 비디오 신호 복호화 방법.
[청구항 3]
제1항에 있어서, 상기 분할은, 상기 현재 블록의 크기가 소정의 문턱크기보다 크거나 같은 경우에 한하여 수행되고, 상기 현재 블록의 크기는, 상기 현재 블록의 너비, 높이, 너비와 높이의 비율(ratio) 또는 너비와 높이의 곱으로 표현되는, 비디오 신호 복호화 방법.
[청구항 4]
제1항에 있어서, 상기 머지 후보 리스트는, 복수의 삼각 머지 후보(triangular merge candidates)로 구성되고, 상기 삼각 머지 후보는, 공간적 머지 후보, 시간적 머지 후보 또는 소정의 크기를 가진 버퍼에 저장된 움직임 정보 중 적어도 하나를 포함하며, 상기 버퍼에 저장된 움직임 정보는, 상기 현재 블록 이전에 복호화가 완료된 블록의 움직임 정보를 의미하는, 비디오 신호 복호화 방법.
[청구항 5]
제4항에 있어서, 상기 삼각 머지 후보의 최대 개수를 지시하는 개수 정보를 복호화하는 단계를 더 포함하고, 복호화 장치는, 상기 복호화된 개수 정보에 기초하여, 상기 삼각 머지 후보의 최대 개수를 설정하는, 비디오 신호 복호화 방법.
[청구항 6]
제1항에 있어서, 상기 현재 블록에 속한 2개의 예측 유닛은 상기 하나의 머지 후보 리스트를 공유하는, 비디오 신호 복호화 방법.
[청구항 7]
제1항에 있어서, 상기 머지 후보 인덱스는, 상기 현재 블록의 제1 예측 유닛에 대한 제1 머지 후보 인덱스와 상기 현재 블록의 제2 예측 유닛에 대한 제2 머지 후보 인덱스를 포함하고, 상기 제1 머지 후보 인덱스와 상기 제2 머지 후보 인덱스는 각각 시그날링되는, 비디오 신호 복호화 방법.
[청구항 8]
제7항에 있어서, 상기 제1 예측 유닛의 움직임 정보는, 상기 제1 머지 후보 인덱스에 의해 특정된 삼각 머지 후보를 이용하여 유도되고, 상기 제2 예측 유닛의 움직임 정보는, 상기 제1 머지 후보 인덱스와 상기 제2 머지 후보 인덱스를 기반으로 특정된 삼각 머지 후보를 이용하여 유도되는, 비디오 신호 복호화 방법.
[청구항 9]
제8항에 있어서, 상기 머지 후보 인덱스의 값에 따라, 상기 특정된 삼각 머지 후보의 L0 방향의 움직임 정보 또는 L1 방향의 움직임 정보 중 어느 하나가 선택적으로 이용되는, 비디오 신호 복호화 방법.
[청구항 10]
제2항에 있어서, 상기 분할 라인 상에 위치한 경계 화소 또는 상기 경계 화소의 주변 화소 중 적어도 하나는, 상기 현재 블록의 제1 예측 유닛의 화소와 제2 예측 유닛의 화소에 소정의 가중치를 적용하여 예측되는, 비디오 신호 복호화 방법.
[청구항 11]
현재 블록을 2개의 예측 유닛으로 분할하는 단계; 여기서, 상기 2개의 예측 유닛 중 적어도 하나의 형태는 삼각형임, 상기 현재 블록의 머지 후보 리스트를 구성하는 단계; 상기 현재 블록의 머지 후보 인덱스와 상기 머지 후보 리스트를 이용하여 상기 현재 블록의 움직임 정보를 유도하는 단계; 및 상기 유도된 움직임 정보를 이용하여, 상기 현재 블록의 인터 예측을 수행하는 단계를 포함하는, 비디오 신호 부호화 방법.
[청구항 12]
비디오 비트스트림을 저장하기 위한 디지털 저장 매체에 있어서, 현재 블록을 2개의 예측 유닛으로 분할하고, 여기서, 상기 2개의 예측 유닛 중 적어도 하나의 형태는 삼각형임, 상기 현재 블록의 머지 후보 리스트를 구성하며, 상기 현재 블록의 머지 후보 인덱스와 상기 머지 후보 리스트를 이용하여 상기 현재 블록의 움직임 정보를 유도하고, 상기 유도된 움직임 정보를 이용하여 상기 현재 블록의 인터 예측을 수행하는 처리를 실행하는 비디오 복호화 프로그램을 기록한, 디지털 저장 매체.

도면

[도1]

[도2]

[도3]

[도4]

[도5]

[도6]

[도7]

[도8]

[도9]

[도10]

[도11]

[도12]

[도13]

[도14]

[도15]

[도16]

[도17]

[도18]

[도19]

[도20]

[도21]

[도22]

[도23]

[도24]

[도25]

[도26]

[도27]

[도28]

[도29]

[도30]

[도31]

[도32]

[도33]

[도34]

[도35]

[도36]

[도37]

[도38]

[도39]

[도40]

[도41]

[도42]

[도43]

[도44]

[도45]

[도46]

[도47]

[도48]

[도49]

[도50]