【ECM技术】局部光照补偿技术(LIC)

news/2024/10/30 19:27:36/

该技术的核心是当前块与参考块之间存在线性光照变化,并且此变化是线性变化。通过当前块和参考块的相邻重构像素(模板),拟合出线性函数a*p[x]+b来补偿光照变化。其中p[x]为参考块,a为缩放因子,b为偏移量,如下图所示

其中a和b利用最小二乘法推导得到:

LIC使用条件:

  • CIIP模式和IBC模式禁用
  • 面积小于32的块禁用
  • LIC flag 没有时域继承性
  • 生成merge候选列表时无需基于LIC flag进行修剪
  • 不可用于双向预测()
  • LIC应用于1616的处理单元时,使用当前CU中左上角1616的单元进行参数推导,并且用于CU内其他部分,如图所示
    在这里插入图片描述
  • LIC 应用于子块模式,其中 LIC 参数是根据在子块基础上导出的样本导出的,但仅限于左上角的第一个 16x16 处理单元,如图所示
    在这里插入图片描述

编码端的优化:

  1. 未开启LIC时的运动搜索结果将在LIC开启时重复使用(JVET-MJVET-M0182提出)
  2. 若相邻4 * 4子块的LIC使用率超过阈值TH(0.10),则开启LIC下,以MR-SAD为标准进行运动搜索
    在这里插入图片描述

代码:
LIC的主函数为xLocalIlluComp,该函数由xPredInterBlk所调用。函数内部主要分为三个步骤:

  1. 获取当前块和参考块的模板像素 ——xGetSublkTemplate函数
  2. 根据模板像素,利用最小二乘法,确定线性变换的参数a、b ——xGetLICParamGeneral函数
  3. 将当前块的像素带入线性变换中,进行光照补偿 ——linearTransform函数
oid InterPrediction::xLocalIlluComp(const PredictionUnit& pu,const ComponentID     compID,const Picture&        refPic,const Mv&             mv,const bool            biPred,PelBuf&               dstBuf
)
{Pel* refLeftTemplate  = m_pcLICRefLeftTemplate;//LJY:用于保存参考块的模板像素Pel* refAboveTemplate = m_pcLICRefAboveTemplate;Pel* recLeftTemplate  = m_pcLICRecLeftTemplate;//LJY:用于保存当前快的模板像素指针Pel* recAboveTemplate = m_pcLICRecAboveTemplate;int numTemplate[2] = { 0 , 0 }; // 0:Above, 1:Left//LJY:获取当前块和参考块的模板像素xGetSublkTemplate(*pu.cu, compID, refPic, mv, pu.blocks[compID].width, pu.blocks[compID].height, 0, 0, numTemplate, refLeftTemplate, refAboveTemplate, recLeftTemplate, recAboveTemplate);//LJY:根据最小二乘法,确定参数a、bint shift = 0, scale = 0, offset = 0;xGetLICParamGeneral(*pu.cu, compID, numTemplate, refLeftTemplate, refAboveTemplate, recLeftTemplate, recAboveTemplate, shift, scale, offset);const ClpRng& clpRng = pu.cu->cs->slice->clpRng(compID);dstBuf.linearTransform(scale, shift, offset, true, clpRng);//LJY:将当前块的像素带入表达式,进行线性变换,修正像素值
}

xGetSublkTemplate函数用于获取当前块和参考块的模板像素,其中主要通过xGetPredBlkTpl函数获取。

void InterPrediction::xGetSublkTemplate(const CodingUnit& cu,const ComponentID compID,const Picture&    refPic,const Mv&         mv,const int         sublkWidth,const int         sublkHeight,const int         posW,const int         posH,int*              numTemplate,Pel*              refLeftTemplate,Pel*              refAboveTemplate,Pel*              recLeftTemplate,Pel*              recAboveTemplate)
{const int       bitDepth = cu.cs->sps->getBitDepth(toChannelType(compID));const int       precShift = std::max(0, bitDepth - 12);const Picture&  currPic = *cu.cs->picture;const CodingUnit* const cuAbove = cu.cs->getCU(cu.blocks[compID].pos().offset(0, -1), toChannelType(compID));const CodingUnit* const cuLeft = cu.cs->getCU(cu.blocks[compID].pos().offset(-1, 0), toChannelType(compID));const CPelBuf recBuf = cuAbove || cuLeft ? currPic.getRecoBuf(cu.cs->picture->blocks[compID]) : CPelBuf();//LJY:获取当前块的像素const CPelBuf refBuf = cuAbove || cuLeft ? refPic.getRecoBuf(refPic.blocks[compID]) : CPelBuf();//LJY:获取参考块的像素std::vector<Pel>& invLUT = m_pcReshape->getInvLUT();// aboveif (cuAbove && posH == 0)//LJY:获取上模板像素{xGetPredBlkTpl<true>(cu, compID, refBuf, mv, posW, posH, sublkWidth, refAboveTemplate);//LJY:获取参考块的模板像素,保存在refAboveTemplateconst Pel*    rec = recBuf.bufAt(cu.blocks[compID].pos().offset(0, -1));for (int k = posW; k < posW + sublkWidth; k++)//LJY:逐点进行处理,移位,放入容器中{int refVal = refAboveTemplate[k];int recVal = rec[k];if (isLuma(compID) && cu.cs->picHeader->getLmcsEnabledFlag() && m_pcReshape->getCTUFlag()){recVal = invLUT[recVal];}recVal >>= precShift;refVal >>= precShift;refAboveTemplate[k] = refVal;recAboveTemplate[k] = recVal;numTemplate[0]++;//LJY:该值不为0说明存在上相邻模板,后期拟合系数需要}}// leftif (cuLeft && posW == 0)//LJY:获取左模板像素{xGetPredBlkTpl<false>(cu, compID, refBuf, mv, posW, posH, sublkHeight, refLeftTemplate);const Pel*    rec = recBuf.bufAt(cu.blocks[compID].pos().offset(-1, 0));for (int k = posH; k < posH + sublkHeight; k++){int refVal = refLeftTemplate[k];int recVal = rec[recBuf.stride * k];if (isLuma(compID) && cu.cs->picHeader->getLmcsEnabledFlag() && m_pcReshape->getCTUFlag()){recVal = invLUT[recVal];}recVal >>= precShift;refVal >>= precShift;refLeftTemplate[k] = refVal;recLeftTemplate[k] = recVal;numTemplate[1]++;//LJY:该值不为0说明存在左相邻模板,后期拟合系数需要}}
}

xGetLICParamGeneral函数采用最小二乘法,确定亮度变化线性关系中的参数a和b

void InterPrediction::xGetLICParamGeneral(const CodingUnit& cu,const ComponentID compID,int*              numTemplate,Pel*              refLeftTemplate,Pel*              refAboveTemplate,Pel*              recLeftTemplate,Pel*              recAboveTemplate,int&              shift,int&              scale,int&              offset
)
{const int       cuWidth = cu.blocks[compID].width;const int       cuHeight = cu.blocks[compID].height;const int       bitDepth = cu.cs->sps->getBitDepth(toChannelType(compID));const int       precShift = std::max(0, bitDepth - 12);const int       maxNumMinus1 = 30 - 2 * std::min(bitDepth, 12) - 1;const int       minDimBit = floorLog2(std::min(cuHeight, cuWidth));const int       minDim = 1 << minDimBit;int       minStepBit = minDim > 8 ? 1 : 0;while (minDimBit > minStepBit + maxNumMinus1) { minStepBit++; } //make sure log2(2*minDim/tmpStep) + 2*min(bitDepth,12) <= 30const int       numSteps = minDim >> minStepBit;const int       dimShift = minDimBit - minStepBit;//----- get correlation data -----int x = 0, y = 0, xx = 0, xy = 0, cntShift = 0;//LJY:初始化最小二乘所需的参数// aboveif (numTemplate[0] != 0)//LJY:说明上相邻模板存在,进行拟合,得到最小二乘的参数{for (int k = 0; k < numSteps; k++){CHECK(((k * cuWidth) >> dimShift) >= cuWidth, "Out of range");int refVal = refAboveTemplate[((k * cuWidth) >> dimShift)];int recVal = recAboveTemplate[((k * cuWidth) >> dimShift)];x += refVal;y += recVal;xx += refVal * refVal;xy += refVal * recVal;}cntShift = dimShift;}// leftif (numTemplate[1] != 0)//LJY:说明左相邻模板存在,进行拟合,得到最小二乘的参数{for (int k = 0; k < numSteps; k++){CHECK(((k * cuHeight) >> dimShift) >= cuHeight, "Out of range");int refVal = refLeftTemplate[((k * cuHeight) >> dimShift)];int recVal = recLeftTemplate[((k * cuHeight) >> dimShift)];x += refVal;y += recVal;xx += refVal * refVal;xy += refVal * recVal;}cntShift += (cntShift ? 1 : dimShift);}//----- determine scale and offset -----shift = m_LICShift;if (cntShift == 0){scale = (1 << shift);offset = 0;return;}const int cropShift = std::max(0, bitDepth - precShift + cntShift - 15);const int xzOffset = (xx >> m_LICRegShift);const int sumX = x << precShift;const int sumY = y << precShift;const int sumXX = ((xx + xzOffset) >> (cropShift << 1)) << cntShift;const int sumXY = ((xy + xzOffset) >> (cropShift << 1)) << cntShift;const int sumXsumX = (x >> cropShift) * (x >> cropShift);const int sumXsumY = (x >> cropShift) * (y >> cropShift);int a1 = sumXY - sumXsumY;int a2 = sumXX - sumXsumX;int scaleShiftA2 = getMSB(abs(a2)) - 6;int scaleShiftA1 = scaleShiftA2 - m_LICShiftDiff;scaleShiftA2 = std::max(0, scaleShiftA2);scaleShiftA1 = std::max(0, scaleShiftA1);const int scaleShiftA = scaleShiftA2 + 15 - shift - scaleShiftA1;a1 = a1 >> scaleShiftA1;a2 = Clip3(0, 63, a2 >> scaleShiftA2);scale = int((int64_t(a1) * int64_t(m_LICMultApprox[a2])) >> scaleShiftA);//LJY:缩放ascale = Clip3(0, 1 << (shift + 2), scale);const int maxOffset = (1 << (bitDepth - 1)) - 1;const int minOffset = -1 - maxOffset;offset = (sumY - ((scale * sumX) >> shift) + ((1 << (cntShift)) >> 1)) >> cntShift;//LJY:偏移量boffset = Clip3(minOffset, maxOffset, offset);
}

http://www.ppmy.cn/news/456035.html

相关文章

lic文件用计算机程序打开,LIC 文件扩展名: 它是什么以及如何打开它?

LIC 疑难解答 打开 LIC 文件的问题 缺少 Microsoft Visual C 尝试打开 LIC 时&#xff0c;你会遇到一条错误消息&#xff0c;例如 “%%os%% 无法打开 LIC 文件”。 发生这种情况时&#xff0c;通常是由于 %%os%% 中缺少 Microsoft Visual C。 通过双击打开 LIC 的典型路径将不起…

软件授权文件.lic文件

文章目录 软件授权文件.lic文件什么是.lic文件license适用场景软件License认证方案的设计思路license授权机制的原理开源的Springboot-软件授权License 软件授权文件.lic文件 什么是.lic文件 一种软件授权文件格式&#xff0c;license文件&#xff0c;用于程序限制用的。这是…

LIC(Line Integral Convolution)

前言 最近在阅读NPR相关论文时需要用到线积分卷积&#xff0c;因此查阅了一下相关论文以及网上已有的实现方法。本文主要讲解线积分卷积的快速实现版本&#xff08;SIGGRAPH,1995&#xff09;。为了便于实验和测试&#xff0c;用Python实现并进行了简单的封装。如果本文讲解部…

LIC 2022 视频语义理解基线(快速启动版)

转自AI Studio&#xff0c;原文链接&#xff1a; LIC 2022 视频语义理解基线&#xff08;快速启动版&#xff09; - 飞桨AI Studio LIC2022视频语义理解基线 ❗️该版本为快速启动版&#xff0c;训练集取比赛提供的训练集的子集&#xff0c;目的是减少在线项目加载等待时间&am…

ubuntu 20.04 qemu arm64 linux6.3.8 开发环境搭建

开发环境 ubuntu 20.04 VMware Workstation Pro 16 基于qemu&#xff08;模拟器&#xff09;&#xff0c;ARM64 &#xff1a;virt cortex-a57 平台 搭建Linux 6.3.8 (当前最新版本&#xff09; 准备 Linux 内核下载&#xff0c;下载最新稳定版本&#xff0c;当前为 linux-…

本周大新闻|Quest游戏订阅服务曝光;平价版苹果XR头显25年推出

本周XR大新闻&#xff0c;AR方面&#xff0c;彭博苹果预计25年推出更亲民头显&#xff1b;Vision Pro外屏含微透镜&#xff1b;WWDC23苹果高管脱口秀爆料更多细节&#xff1b;外媒爆料称Vision Pro预期销量改为15万台&#xff1b;VitreaLab展示RGB激光背光技术。还是提前说一下…

C# hello world

目录 一 C#简介 二 Hello world程序 三 C#未来的发展趋势 四 C#学习路线推荐 一 C#简介 C#&#xff08;C Sharp&#xff09;是微软开发的一种面向对象的编程语言&#xff0c;它于2000年发布&#xff0c;并被设计为在.NET平台上运行。C#语言具有简单、安全、类型安全、可扩…

X站全称是什么_科普|HDMI是什么意思?有什么用处?一文带你了解HDMI的发展史...

HDMI接口想必很多人都不陌生&#xff0c;随着智能电视盒子的普及&#xff0c;越来越多的家庭都通过HDMI高清线来连接电视盒子与电视&#xff0c;广泛应用于智能电视、机顶盒、投影仪等。HDMI全称是高清晰度多媒体接口&#xff0c;英文全称High Definition Multimedia Interface…