本专利文档涉及图像和视频编码及解码。
背景技术:
1、数字视频在互联网和其他数字通信网络中占据了最大的带宽使用。随着能够接收和显示视频的连接用户设备的数量增加,预计对数字视频使用的带宽需求将继续增长。
技术实现思路
1、本文档公开了可以由视频编码器和解码器在编码和解码操作期间使用的各种视频处理技术。
2、在一个示例方面,公开了一种视频处理的方法。该方法包括:为使用仿射编解码工具在视频的当前块和视频的比特流表示之间的转换确定当前块的子块的第一运动矢量和作为当前块的代表性运动矢量的第二运动矢量符合尺寸约束。该方法还包括基于该确定执行该转换。
3、在另一示例方面,公开了一种视频处理的方法。该方法包括:为视频的当前块和视频的比特流表示之间的转换确定包括六个参数的仿射模型。仿射模型从当前块的邻近块的仿射编解码信息继承。该方法还包括基于仿射模型执行转换。
4、在另一示例方面,公开了一种视频处理的方法。该方法包括:对于视频的块和视频的比特流表示之间的转换,基于宽度为w且高度为h的块的尺寸来确定双向预测编解码技术是否适用于该块,其中w和h为正整数。该方法还包括根据该确定执行该转换。
5、在另一示例方面,公开了一种视频处理的方法。该方法包括:对于视频的块和视频的比特流表示之间的转换,基于根据编解码树划分过程而作为块的子编解码单元的子块的尺寸,确定编解码树划分过程是否适用于该块。子块的宽度为w且高度为h,其中w和h为正整数。该方法还包括根据该确定执行该转换。
6、在另一示例方面,公开了一种视频处理的方法。该方法包括:对于视频的当前块和视频的比特流表示之间的转换,基于关于当前块的位置的规则来确定是否推导了编解码单元级别权重双向预测(bi-prediction with coding unit level weight,bcw)编解码模式的索引。在bcw编解码模式下,包括多个权重的权重集被用于生成当前块的双向预测值。该方法还包括基于该确定执行该转换。
7、在另一示例方面,公开了一种视频处理的方法。该方法包括:对于使用组合帧间和帧内预测(combined inter and intra prediction,ciip)编解码技术编解码的视频的当前块和该视频的比特流表示之间的转换,独立于邻近块的帧内预测模式来确定当前块的帧内预测模式。ciip编解码技术使用中间帧间预测值和中间帧内预测值来推导当前块的最终预测值。该方法还包括基于该确定执行该转换。
8、在另一示例方面,公开了一种视频处理的方法。该方法包括:对于使用组合帧间和帧内预测(ciip)编解码技术编解码的视频的当前块和该视频的比特流表示之间的转换,根据第一邻近块的第一帧内预测模式和第二邻近块的第二帧内预测模式来确定当前块的帧内预测模式。第一邻近块是使用帧内预测编解码技术进行编解码的,并且第二邻近块是使用ciip编解码技术进行编解码的。第一帧内预测模式被赋予不同于第二帧内预测模式的优先级。ciip编解码技术使用中间帧间预测值和中间帧内预测值来推导当前块的最终预测值。该方法还包括基于该确定执行该转换。
9、在另一示例方面,公开了一种视频处理的方法。该方法包括:对于视频的当前块和视频的比特流表示之间的转换,基于当前块的尺寸来确定组合帧间和帧内预测(ciip)过程是否适用于当前块的颜色分量。ciip编解码技术使用中间帧间预测值和中间帧内预测值来推导当前块的最终预测值。该方法还包括基于该确定执行该转换。
10、在另一示例方面,公开了一种视频处理的方法。该方法包括:对于视频的当前块和视频的比特流表示之间的转换,基于当前块的特性,确定是否将组合帧间和帧内预测(ciip)编解码技术应用于当前块。ciip编解码技术使用中间帧间预测值和中间帧内预测值来推导当前块的最终预测值。该方法还包括基于该确定执行该转换。
11、在另一示例方面,公开了一种视频处理的方法。该方法包括:对于视频的当前块和视频的比特流表示之间的转换,基于当前块是否是用组合帧间和帧内预测(ciip)编解码技术编解码的,确定是否要对当前块禁用编解码工具。编解码工具包括以下中的至少一个:双向光流(bi-directional optical flow,bdof)、重叠块运动补偿(overlapped blockmotion compensation,obmc)或解码器侧运动矢量细化过程(decoder-side motionvector refinement process,dmvr)。该方法还包括基于该确定执行该转换。
12、在另一示例方面,公开了一种视频处理的方法。该方法包括:对于视频的块和视频的比特流表示之间的转换,确定用于空域运动预测的运动矢量的第一精度p1和用于时域运动预测的运动矢量的第二精度p2。p1和/或p2是分数,并且p1和p2都不在比特流表示中被信令通知。该方法还包括基于该确定执行该转换。
13、在另一示例方面,公开了一种视频处理的方法。该方法包括:对于视频的块和视频的比特流表示之间的转换,确定精度为(px,py)的运动矢量(mvx,mvy)。px与mvx相关联,并且py与mvy相关联。mvx和mvy存储为各自具有n比特的整数,并且minx≤mvx≤maxx且miny≤mvy≤maxy,其中minx、maxx、miny和maxy是实数。该方法还包括基于该确定执行该转换。
14、在另一示例方面,公开了一种视频处理的方法。该方法包括:对于视频的当前块和视频的比特流表示之间的转换,根据当前块的编解码模式来确定共享merge列表是否适用于当前块。该方法还包括基于该确定执行该转换。
15、在另一示例方面,公开了一种视频处理的方法。该方法包括:对于尺寸为wxh的视频的当前块和该视频的比特流表示之间的转换,确定维度为(w+n-1)x(h+n-1)的第二块以用于该转换期间的运动补偿。第二块是基于维度为(w+n-1-pw)x(h+n-1-ph)的参考块而确定的。n表示滤波器尺寸,w、h、n、pw和ph是非负整数。pw和ph不都等于0。该方法还包括基于该确定执行该转换。
16、在另一示例方面,公开了一种视频处理的方法。该方法包括:对于尺寸为wxh的视频的当前块和该视频的比特流表示之间的转换,确定维度为(w+n-1)x(h+n-1)的第二块以用于该转换期间的运动补偿。w、h是非负整数,并且n是非负整数并基于滤波器尺寸。在该转换期间,根据对原始运动矢量的运动矢量细化操作,基于多点搜索确定细化的运动矢量,并且通过重复一个或多个非边界像素确定参考块的像素长边界。该方法还包括基于该确定执行该转换。
17、在另一示例方面,公开了一种视频处理的方法。该方法包括:对于使用组合帧间-帧内预测(ciip)编解码技术编解码的视频的块和该视频的比特流表示的转换,基于块中一位置处的帧间预测值和帧内预测值的加权和来确定该位置处的预测值。加权和基于将偏移添加到基于帧间预测值和帧内预测值而获得的初始和,并且该偏移在执行以确定加权和的右移操作之前被添加。该方法还包括基于该确定执行该转换。
18、在另一示例方面,公开了一种视频处理的方法。该方法包括:确定被仿射编解码的当前视频块的代表性运动矢量和该当前视频块的子块的运动矢量之间的尺寸限制,以及通过使用尺寸限制来执行当前视频块或子块的比特流表示和像素值之间的转换。
19、在另一示例方面,公开了另一种视频处理的方法。该方法包括:为被仿射编解码的当前视频块确定该当前视频块的一个或多个子块,其中每个子块的尺寸为mxn个像素,其中m和n是2或4的倍数,使子块的运动矢量符合尺寸限制,以及通过使用尺寸限制,条件性地基于触发来执行当前视频块的比特流表示和像素值之间的转换。
20、在又一示例方面,公开了另一种视频处理的方法。该方法包括:确定当前视频块满足尺寸条件,以及基于该确定,通过排除当前视频块的双向预测编码模式来执行当前视频块的比特流表示和像素值之间的转换。
21、在又一示例方面,公开了另一种视频处理的方法。该方法包括:确定当前视频块满足尺寸条件,以及基于该确定来执行当前视频块的比特流表示和像素值之间的转换,其中帧间预测模式是根据尺寸条件在比特流表示中信令通知的。
22、在又一示例方面,公开了另一种视频处理的方法。该方法包括:确定当前视频块满足尺寸条件,以及基于该确定来执行当前视频块的比特流表示和像素值之间的转换,其中在该转换期间merge候选列表的生成取决于尺寸条件。
23、在又一示例方面,公开了另一种视频处理的方法。该方法包括:确定当前视频块的子编解码单元满足尺寸条件,以及基于该确定来执行当前视频块的比特流表示和像素值之间的转换,其中用于生成子编解码单元的编解码树划分过程取决于尺寸条件。
24、在又一示例方面,公开了另一种视频处理的方法。该方法包括:基于当前视频块的位置来确定用于当前视频块的广义双向预测(generalized bi-prediction,gbi)过程的权重索引,以及使用权重索引执行当前视频块和其比特流表示之间的转换以实施gbi过程。
25、在又一示例方面,公开了另一种视频处理的方法。该方法包括:确定当前视频块被编解码为帧内-帧间预测(intra-inter prediction,iip)编解码块,以及使用用于确定当前视频块的帧内预测模式或最可能模式(most probable mode,mpm)的简化规则来执行当前视频块和其比特流表示之间的转换。
26、在又一示例方面,公开了另一种视频处理的方法。该方法包括:确定当前视频块满足简化准则,以及通过禁止将帧间-帧内预测模式用于当前视频块和比特流表示之间的转换或者通过禁用用于该转换的附加编解码工具来执行该转换。
27、在又一示例方面,公开了另一种视频处理的方法。该方法包括:使用基于运动矢量的编码过程执行当前视频块和当前视频块的比特流表示之间的转换,其中(a)在转换过程期间,精度p1用于存储空域运动预测结果,并且精度p2用于存储时域运动预测结果,其中p1和p2是分数,或者(b)精度px用于存储x运动矢量,并且精度py用于存储y运动矢量,其中px和py是分数。
28、在又一示例方面,公开了另一种视频处理的方法。该方法包括:通过提取(w2+n–1–pw)*(h2+n–1–ph)块、对提取的块进行像素填充、对像素填充的块执行边界像素重复、以及获得尺寸为w1xh1的小子块的像素值,在当前视频块的尺寸为w2xh2的大子块中内插该小子块,其中w1、w2、h1、h2以及pw和ph为整数,以及使用小子块的内插的像素值执行当前视频块和当前视频块的比特流表示之间的转换。
29、在另一示例方面,公开了另一种视频处理的方法。该方法包括:在维度为wxh的当前视频块和该当前视频块的比特流表示的转换期间,通过在运动补偿操作期间提取(w+n–1–pw)*(w+n–1–ph)个参考像素并且在提取的参考像素外部填充参考像素来执行运动补偿操作,以及使用运动补偿操作的结果执行当前视频块和当前视频块的比特流表示之间的转换,其中w、h、n、pw和ph为整数。
30、在又一示例方面,公开了另一种视频处理的方法。该方法包括:基于当前视频块的尺寸来确定当前视频块的双向预测或单向预测不被允许,以及基于该确定,通过禁用双向预测或单向预测模式来执行当前视频块的比特流表示和像素值之间的转换。
31、在又一示例方面,公开了另一种视频处理的方法。该方法包括:基于当前视频块的尺寸来确定当前视频块的双向预测或单向预测不被允许,以及基于该确定,通过禁用双向预测或单向预测模式来执行当前视频块的比特流表示和像素值之间的转换。
32、在又一示例方面,公开了一种视频编码器装置。视频编码器包括被配置为实施上述方法的处理器。
33、在又一示例方面,公开了一种视频编码器装置。视频编码器包括被配置为实施上述方法的处理器。
34、在又一示例方面,公开了一种其上存储有代码的计算机可读介质。该代码以处理器可执行代码的形式体现本文描述的方法之一。
35、这些以及其他特征贯穿本文档进行描述。
1.一种视频处理的方法,包括:
2.根据权利要求1所述的方法,其中,在满足至少一个条件之一的情况下,所述双向预测编解码技术不适用,其中所述至少一个条件包括以下之一:
3.根据权利要求2所述的方法,其中,t1=8,并且t2=4。
4.根据权利要求2所述的方法,其中,t1=4,并且t2=4。
5.根据权利要求1所述的方法,其中,在所述块的尺寸为4x8或8x4或4x4之一的情况下,所述双向预测编解码技术不适用。
6.根据权利要求1所述的方法,其中,在所述双向预测编解码技术适用的情况下,指示关于所述双向预测编解码技术的信息的指示符在所述比特流中被信令通知。
7.根据权利要求1所述的方法,其中,指示所述双向预测编解码技术还是单向预测编解码技术的指示符的信令通知方法基于所述块的尺寸。
8.根据权利要求7所述的方法,其中,在第一尺寸范围的块中,所述指示符具有分别对应于双向预测、来自列表0的单向预测和来自列表1的单向预测的三个值;以及
9.根据权利要求1所述的方法,其中,所述块的尺寸对应于所述块的第一颜色分量,并且针对所述块的第一颜色分量和剩余颜色分量确定所述双向预测编解码技术是否适用。
10.根据权利要求9所述的方法,其中,所述第一颜色分量是亮度分量。
11.根据权利要求1所述的方法,其中,在所述双向预测编解码技术不适用的情况下,三角形预测模式不适用于所述块。
12.根据权利要求1所述的方法,其中,所述双向预测编解码技术适用于所述块,其中预测块的尺寸为(w+n-1-pw)x(h+n-1-ph),并且其中所述预测块的边界像素被重复以生成尺寸为(w+n-1)x(h+n-1)的第二块用于插值操作,n表示插值滤波器抽头,n、pw和ph为整数。
13.根据权利要求1所述的方法,其中,merge候选列表构建过程基于所述块的尺寸来执行。
14.根据权利要求1所述的方法,其中,编解码树划分过程是否适用于所述块基于根据所述编解码树划分过程而作为所述块的子编解码单元的子块的尺寸,所述子块的宽度为w1且高度为h1,w1和h1为正整数。
15.根据权利要求1所述的方法,其中,执行所述转换包括将所述块编码为所述比特流。
16.根据权利要求1所述的方法,其中,执行所述转换包括从所述比特流解码所述块。
17.一种用于处理视频数据的装置,包括处理器和其上具有指令的非暂时性存储器,其中所述指令在由所述处理器执行时使得所述处理器:
18.根据权利要求17所述的装置,其中,在满足至少一个条件之一的情况下,所述双向预测编解码技术不适用,其中所述至少一个条件包括以下之一:
19.一种存储指令的非暂时性计算机可读存储介质,所述指令使得处理器:
20.一种存储由视频处理装置执行的方法生成的视频的比特流的非暂时性计算机可读记录介质,其中所述方法包括:
21.一种存储由视频处理装置执行的方法生成的视频的比特流的非暂时性计算机可读记录介质,其中所述方法包括:
22.一种视频处理的方法,包括:
23.根据权利要求22所述的方法,其中,如果w=t1并且h=t2,则所述双向预测编解码技术不适用,其中t1和t2为正整数。
24.根据权利要求22所述的方法,其中,如果w=t2并且h=t1,则所述双向预测编解码技术不适用,其中t1和t2为正整数。
25.根据权利要求22所述的方法,其中,如果w=t1并且h≤t2,则所述双向预测编解码技术不适用,其中t1和t2为正整数。
26.根据权利要求22所述的方法,其中,如果w≤t2并且h=t1,则所述双向预测编解码技术不适用,其中t1和t2为正整数。
27.根据权利要求22至26中一项或多项所述的方法,其中,t1=4并且t2=16。
28.根据权利要求22所述的方法,其中,如果w≤t1并且h≤t2,则所述双向预测编解码技术不适用,其中t1和t2为正整数。
29.根据权利要求28所述的方法,其中,t1=t2=8。
30.根据权利要求28所述的方法,其中,t1=8并且t2=4。
31.根据权利要求28所述的方法,其中,t1=t2=4。
32.根据权利要求28所述的方法,其中,t1=4并且t2=8。
33.根据权利要求23至32中一项或多项所述的方法,其中,如果所述双向预测编解码技术适用,则指示关于双向预测编解码技术的信息的指示符在比特流中被信令通知。
34.根据权利要求23至32中一项或多项所述的方法,其中,如果所述双向预测编解码技术不适用于块,则指示关于用于所述块的双向预测编解码技术的信息的指示符被排除在比特流之外。
35.根据权利要求22所述的方法,其中,如果块的尺寸为4x8或8x4之一,则所述双向预测编解码技术不适用。
36.根据权利要求22所述的方法,其中,如果块的尺寸为4xn或nx4,则所述双向预测编解码技术不适用,其中n为正整数并且n≤16。
37.根据权利要求22至36中任一项或多项所述的方法,其中,所述块的尺寸对应于块的第一颜色分量,并且针对第一颜色分量和块的剩余颜色分量确定双向预测编解码技术是否适用。
38.根据权利要求22至36中任一项或多项所述的方法,其中,所述块的尺寸对应于块的第一颜色分量,并且仅针对第一颜色分量确定双向预测编解码技术是否适用。
39.根据权利要求37或38所述的方法,其中,所述第一颜色分量包括亮度分量。
40.根据权利要求22至39中任一项或多项所述的方法,包括,如果所述双向预测编解码技术不适用于当前块:
41.根据权利要求22至40中任一项或多项所述的方法,包括,如果所述双向预测编解码技术不适用于当前块:
42.根据权利要求22至41中任一项或多项所述的方法,其中,所述双向预测编解码技术是否适用与预测方向相关联,预测方向还与单向预测编解码技术相关联,并且其中预测方向是基于块的尺寸在比特流中信令通知的。
43.根据权利要求32所述的方法,其中,如果(1)wxh<64或者(2)wxh=64,则关于单向预测编解码技术的信息在比特流中被信令通知,其中w不等于h。
44.根据权利要求42所述的方法,其中,如果(1)wxh>64或者(2)wxh=64,则关于单向预测编解码技术或双向编解码技术的信息在比特流中被信令通知,其中w等于h。
45.根据权利要求42所述的方法,其中,一个限制指示如果块的尺寸为4x4,则双向编解码技术和单向技术都不适用于所述块。
46.根据权利要求45所述的方法,其中,如果块是仿射编解码的,则所述限制适用。
47.根据权利要求45所述的方法,其中,如果块不是仿射编解码的,则所述限制适用。
48.根据权利要求45所述的方法,其中,如果块是帧内编解码的,则所述限制适用。
49.根据权利要求45至48中一项或多项所述的方法,其中,如果块的运动矢量具有整数精度,则所述限制不适用。
50.根据权利要求22至49中一项或多项所述的方法,其中,对所述块基于父块的划分而生成的信令通知在比特流中跳过,(1)对于四叉树划分,父块的尺寸为8x8,(2)对于二叉树划分,父块的尺寸为8x4或4x8,(3)或者对于三叉树划分,父块的尺寸为4x16或16x4。
51.根据权利要求50所述的方法,其中,指示运动矢量具有整数精度的指示符在比特流中被设置为1。
52.根据权利要求50或51所述的方法,其中,所述块的运动矢量被取整到整数精度。
53.根据权利要求22所述的方法,其中,所述双向预测编解码技术适用于所述块,参考块的尺寸为(w+n-1-pw)x(h+n-1-ph),并且其中参考块的边界像素被重复以生成尺寸为(w+n-1)x(h+n-1)的第二块用于插值操作,n表示插值滤波器抽头,n、pw和ph为整数。
54.根据权利要求53所述的方法,其中,ph=0,并且至少左边界或右边界的像素被重复以生成第二块。
55.根据权利要求53或54所述的方法,其中,pw=0,并且至少顶部边界或底部边界的像素被重复以生成第二块。
56.根据权利要求53所述的方法,其中,pw>0并且ph>0,并且第二块通过重复至少左边界或右边界的像素、接着重复至少顶部边界或底部边界的像素而生成。
57.根据权利要求53所述的方法,其中,pw>0并且ph>0,并且第二块通过重复至少顶部边界或底部边界的像素、接着重复至少左边界或右边界的像素而生成。
58.根据权利要求53至57中任一项或多项所述的方法,其中,左边界的像素被重复m1次,并且其中右边界的像素被重复(pw-m1)次。
59.根据权利要求53至58中任一项或多项所述的方法,其中,顶部边界的像素被重复m2次,并且其中底部边界的像素被重复(ph-m2)次。
60.根据权利要求53至59中任一项或多项所述的方法,其中,如何重复参考块的边界像素被应用于一些或所有参考块以用于所述转换。
61.根据权利要求53至60中任一项或多项所述的方法,其中,对于所述块的不同分量,pw和ph是不同的。
62.根据权利要求22至61中任一项或多项所述的方法,其中,merge候选列表构建过程基于所述块的尺寸而执行。
63.根据权利要求62所述的方法,其中,如果(1)merge候选是使用双向预测编解码技术而编解码的,以及(2)双向预测根据块的尺寸而不适用于所述块,则merge候选被认为是参考单向预测编解码技术中的第一参考列表的单向预测候选。
64.根据权利要求63所述的方法,其中,第一参考列表包括单向预测编解码技术的参考列表0或参考列表1。
65.根据权利要求62所述的方法,其中,如果(1)merge候选是使用双向预测编解码技术而编解码的,以及(2)双向预测根据块的尺寸而不适用于所述块,则merge候选被认为是不可用的。
66.根据权利要求65所述的方法,其中,在merge候选列表构建过程中,不可用的merge候选从merge候选列表中移除。
67.根据权利要求62至66中任一项或多项所述的方法,其中,如果双向预测根据块的尺寸而不适用于所述块,则用于三角形预测模式的merge候选列表构建过程被调用。
68.一种视频处理的方法,包括:
69.根据权利要求68所述的方法,其中,如果w=t1并且h=t2,则所述编解码树划分过程不适用,其中t1和t2为正整数。
70.根据权利要求68所述的方法,其中,如果w=t2并且h=t1,则所述编解码树划分过程不适用,其中t1和t2为正整数。
71.根据权利要求68所述的方法,其中,如果w=t1并且h≤t2,则所述编解码树划分过程不适用,其中t1和t2为正整数。
72.根据权利要求68所述的方法,其中,如果w≤t2并且h=t1,则所述编解码树划分过程不适用,其中t1和t2为正整数。
73.根据权利要求69至72中一项或多项所述的方法,其中,t1=4并且t2=16。
74.根据权利要求68所述的方法,其中,如果w≤t1并且h≤t2,则所述编解码树划分过程不适用,其中t1和t2为正整数。
75.根据权利要求74所述的方法,其中,t1=t2=8。
76.根据权利要求74所述的方法,其中,t1=8并且t2=4。
77.根据权利要求74所述的方法,其中,t1=t2=4。
78.根据权利要求74所述的方法,其中,t1=4。
79.根据权利要求74所述的方法,其中,t2=4。
80.根据权利要求68至79中任一项或多项所述的方法,其中,如果所述编解码树划分过程不适用于当前块,则编解码树划分过程的信令通知从比特流中省略。
81.根据权利要求22至80中任一项或多项所述的方法,其中,执行所述转换包括基于所述视频的当前块来生成所述比特流表示。
82.根据权利要求22至80中任一项或多项所述的方法,其中,执行所述转换包括从所述比特流表示生成所述视频的当前块。
83.一种视频处理装置,包括处理器,其中所述处理器被配置为执行权利要求1至16和21至82中的一项或多项所述的方法。
84.一种其上存储有代码的计算机可读介质,所述代码在由处理器执行时使得处理器实施权利要求1至16和21至82中任一项或多项所述的方法。