重要性采样

Word count: 5.1kReading time: 17 min

 2021/04/17 

1 蒙特卡洛路径追踪简要回顾

1.1 算法主要流程

所有的全局光照算法其实都是围绕着如何求解渲染方程：

着色点向发出的光线由两部分组成，一部分是本身的自发光(一般只有光源才有，其他物体为0)，另一部分由法线所在半球的各个方向上的光线共同贡献得到。
路径追踪的方法也非常的直观，即每次碰撞到物体之后都去采样一条可能的scatter的方向，然后递归这个过程直到光线逃逸出场景，或达到终止条件，又或者击中光源形成一条真正可行的光路。简单图示如下：

了解了基本的路径追踪的过程，那么伪代码也就比较好写了：
Color color(Point p, Direction w, int depth)
{
if depth **<=** 0**:**
return Le(p, **-**w);

// 递归采样
w’ = uniform sampling from hemisphere;
Point hit_point = trace(p, w’);

// 逃逸出场景
if not hit something:
return 0;

return Le(p, **-w) + BRDF ***** color(hit_point, w’, depth-**1) ***** cos / pdf;
}

当然以上的伪代码只是进行一次路径追踪的过程，蒙特卡洛路径追踪是利用多次路径追踪的结果求均值从而不断逼近真实解的一个过程，本质上就是蒙特卡洛积分：

(具体的蒙特卡洛路径追踪的内容可以参考之前的文章，这里就简单的回顾一下)

1.2 半球面均匀采样方法

阅读上一小节的伪代码，可以看到在每次采样下一次光线的方向的时候，是对半球面进行均匀采样的，那么具体是如何做到的呢？为此，我们首先要介绍一下如何从一个给定的概率分布进行采样的方法。
**问题描述:**设随机变量，记累积分布函数，现希望从该概率分布中进行采样。
**方法:**假设随机变量，不难得出该满足均匀分布的随机变量的累积分布函数为。现构造另一随机变量，则

因此新构造出来的随机变量恰好符合随机变量的分布，因此想要对随机变量进行采样，可以转化为对随机变量进行采样，而对后者进行采样是颇为直接的，只用两步：
1.在(0,1)之内进行均匀采样得到
2.再对其进行的逆分布函数变换即可。
上述方法一般被称为逆分布函数方法，虽然只介绍了对一维随机变量的采样，但拓展到高维也是比较直接的，假设现在要生成二维随机变量，则可以先根据边缘概率密度生成的采样，再根据条件概率密度生成的采样即可，更高维也类似，不再详述。
好了，经过以上的介绍已经明白了如何从一个给定的分布中进行采样，那么接下来就应该回归到本节的标题，如何对半球进行均匀采样？因为目标是对半球进行均匀采样，所以立体角满足的概率密度必然是一个常数，所以有：

现在的问题是虽然知道了立体角的概率密度，但没有办法从立体角转化到三维坐标，因此这里利用，将立体角转化为球面坐标，如果能对单位球面坐标进行采样，自然可以转化为三维坐标x, y, z了，因此：

根据上式不难得到的联合概率密度，进一步可以计算得到：

回想本节一开始所讲的采样方法，现在有了边缘概率密度和条件概率密度，那么接下来的采样过程也非常简单了，首先计算得到分布函数：

设是[0, 1]均匀分布的随机数，利用逆分布函数可以得到采样结果：

最终转化为3维坐标：

以上就是一个完整的对半球面均匀采样的一个过程了（tips:因为这里求得的是局部坐标，实际使用中可能还需要根据法线方向，再做一次转换到世界坐标才行）。

2 重要性采样的运用

2.1 简单例子与基本概念

首先重新回顾一下蒙特卡洛积分的基本形式：

即对任意函数的积分都可以写成右边的形式来进行近似，通过对指定的概率密度分布进行采样，最终代入求均值即可。但采样的pdf往往会对近似结果的误差及收敛速度有着巨大的影响，我们从一个简单的积分例子入手：

该积分十分的简单，通过解析解可以直接得出答案为8，那么接下来分别使用4种不同的pdf，来进行蒙特卡洛积分的近似，看看他们的结果会有什么不同：

如上图所示，这里选用了如第一列所示的4种pdf，从第三列的降低到一定误差所需的采样数量可以看到，第一种的pdf最差，最后一种pdf最好，仅需要1个sample就可以达到要求。那么从第一种到第四种发生了什么变化呢？
不难看出pdf的图像是越来越接近被积函数的图像的，也就是说只要pdf越接近收敛速度也就会更快，在极端条件下当，即pdf完全正比于被积函数时，方差达到0，此时只需要1个sample就能得到积分的正确结果。我们可以简要的证明一下：

以上的简单例子其实也基本带出了重要性采样的思想，也就是选用好的pdf来作为采样的分布，而所谓好的pdf也就是。我们也可以从直观的角度来考虑一下这个问题，假设被积函数图像如下:

当某一区域函数值比较大的时候，这部分积分的值自然会对最终结果有比较大的(重要)影响，理所应当的应该在这部分区域采样更多的点，来减小误差，也就是说f(x)大,pdf(x)也应该大。反之当某一区域函数值比较小的时候，这部分积分的值对最终结果没有比较明显的贡献，因此对于这部分区域减少采样点，即使相对误差较大，但最终放到整体的积分结果中也是可以接受的。综上为什么应该尽量选取也就不难理解了。

2.2 路径追踪中的重要性采样

在理解了重要性采样的想法之后，应该回到路径追踪当中的积分问题，看看如何进行提升：

仔细观察上式，显然积分函数. 根据2.1节中所说最佳的采样pdf应该正比于被积函数f(x)，但是这在实际中往往是不可能的，因为需要提前知道所有关于f(x)的信息，就比如你想算其实本身就是另一个积分问题了。虽然没有办法得到最优的pdf，但是另一个被广泛采纳的策略是让pdf与被积函数中的一部分成正比，如下图：

在这个例子中左边使用了均匀采样，右边使用了正比于部分被积函数的重要性采样方法，不难想象，右边的收敛速度一定是快于左边的。再回到被积函数：

想要正比于部分被积函数，无非3个选项：

BRDF
incident radiance
cosine term

但项在这里的条件下并不可行，所以我们只去介绍如何对cosine项和BRDF进行重要性采样的方法。

2.2.1 Cosine-weighted 半球采样

对cosine项进行重要性采样，也就意味着pdf正比于cosine项，有，则：

这里省去计算过程，不难得到，利用与第一章类似的方法，再将代入，可得：

再计算出边缘概率密度和条件概率密度，以及他们的分布函数：

设是[0, 1]均匀分布的随机数，利用逆分布函数可以得到采样结果：

转化为3维坐标：

最后将cosine-weighted的重要性采样和均匀采样一起运用在环境光遮蔽的计算之中进行比较

可以明显的看出同样是4 samples per pixel，使用cosine-weighted的重要性采样收敛结果远远好于均匀采样。

2.2.2 BRDF采样

既然要根据BRDF进行采样，那么首先自然是确定BRDF的形式，这里采用基于微表面模型理论的BRDF：

其中：

(为了后序推导的方便，这里对微表面BRDF还进行了一定的简化，即没有用菲涅尔项带来计算反射与折射的百分比，而是直接使用kd和ks，简单的保证了能量守恒)
具体来说，这里采用Beckmann分布作为法线分布函数(为微平面法线与宏观法线的夹角)：

几何函数则使用Smith近似：

再次仔细观察BRDF，不难看出，其中分为左边的漫反射项和右边的镜面反射项，当单独考虑坐标的漫反射项时可以结合原被积函数中的cos项，使其变为一个cosine-weighted的重要性采样。此时有：

当不看漫反射项，单独考虑镜面反射项的时候其式子略有一些复杂，不过可以做一做排除法，菲涅尔项需要知道采样方向之后才能计算，所以需要排除在外，几何函数项并非连续函数，所以也可以直接排除在外，那么此时分母上只剩下法线分布函数了，而我们所要做的也正是使得pdf正比于法线分布函数项！回想在前文Cook-Torrance BRDF推导中，曾对法线分布函数的物理含义进行具体的定义，即每单位面积,每单位立体角所有法向为的微平面的面积，利用该点定义可以推出：

可以看到积分结果恰好为1，那么被积函数应该是一个概率密度函数，但可惜的是这里是的概率密度函数，而需要的是的概率密度函数，所以需要一个转换，同样利用Cook-Torrance BRDF推导文中得到的和的关系：

将此式代入：

因此最终得到想要的。（关于这部分直接拿来用的关系可以参考前文推导，这里就不重复推一遍了）
有的读者可能会疑惑，绕这么一圈得到单独考虑brdf漫反射项和镜面反射项的重要性采样分布是为了什么，最后不还是只能对单独某一个pdf采样吗。答案是为了尽可能抓住brdf的特性，所以最终采样的pdf不仅仅是漫反射部分，也不仅仅是镜面反射部分，而是把两部分结合起来的一个全新的pdf：

那么要想符合这个pdf进行重要性采样，需要首先生成一个随机数，如果小于ks则用镜面反射部分的pdf来采样，否则则用漫反射部分的pdf进行采样。这种结合的方式其实是非常直观的，如果ks大也就是镜面反射多，那么就应该以更大的概率用镜面反射部分的pdf来采样，反之亦然。
(tips：由于对brdf的简化，所以这里的结合方式不是那么的物理，如果使用更加物理的brdf，这里的结合需要考虑metalness，个人感觉这里的ks应该设为，因为找了一些资料也没找到具体的设置方法，所以不保证正确，有大佬知道也欢迎告知)
在2.2.1节，已经推导过了cosine-weighted的重要性采样，所以当的时候，直接用那一套的方法就可以了，但是当时，对于镜面反射部分pdf还不知道如何进行采样，这里给出一个简要的推导：
虽然我们已经得到了对于镜面反射部分。但实际上并不需要对直接采样，更好的方法是对直接采样微平面法线，再利用转换到即可（因为二者关于微平面法线呈反射关系）。同样的，对于直接采样微平面法线使用的还是在第一章里面所说的那一套方法：

得到：

关于边缘概率密度，条件概率密度，以及对应的分布函数，这里就不推导了，主要是过程比较繁杂，但实际上就是积分运算（可以令，则，来简便推导运算过程）
最终可以得到：

从球极坐标转化为3维坐标之后，别忘了在再用关于镜面反射到即可。
最后，均匀采样v.s.BRDF重要性采样：

注：虽然本文给出的是Beckmann分布作为法线分布函数的BRDF采样，但改成GGX也是一样的推导过程，不同的是积分运算的结果。

3 多重重要性采样的运用

在第二章中介绍了几种重要性采样分布的具体方法，确实都大大加速了收敛的速度，值得一提的是，在讲蒙特卡洛路径追踪的前文中，使用将光照分为直接光照和间接光照的方法（好像英文叫Next Event Estimation，不太懂为啥这样叫）本质上也可以看做是一种重要性采样的方法，因为在计算直接光照的时候是对光源直接采样的。那么是不是单纯的重要性采样已经足够了呢，答案显然是否定的。我们来观察这样一个场景：

场景中首先有4个大小不一，颜色不同的光源，悬挂在半空中，其次还有四块长板子，这4块长板有着不同的光滑程度，最底端的最为粗糙，最顶端的最为光滑。在这样一个设置之下直接对光源采样来计算直接光照得到的就是上图中的结果，可以看到在图片的右上角部分十分的noise。造成这种现象的原因是长板十分光滑，意味着它的brdf接近delta函数（只有一个小范围才可能对计算结果有贡献），而光源又比较大，在这么大一个光源上进行均匀采样的时候，很难恰好找到那一个有贡献的小的范围，而这就造成了越靠近右上角越noise的现象。
既然直接采样光源不行，那就换一种重要性采样，用BRDF采样!

即使换了一种采样方法，不难看到在图片的左下角依然出现了非常noise的现象，造成这样的结果的原因是长板十分粗糙，所以用brdf采样的时候其实也就有点接近均匀采样了，那么对于很小的光源几乎就是不可能碰撞到的了。
虽然说直接光源采样不行，BRDF采样也不给力，但重新回顾一下两种重要性采样方法的结果，light采样不行的地方似乎brdf很行，而brdf不行的地方，light又很行，二者形成了一个貌似互补的关系！那么有没有什么好的方法能够将两种重要性采样方法的优点给结合起来呢，这就要提到Veach所提出的大名鼎鼎的多重重要性采样(Multiple Importance Sampling, MIS)方法了。
MIS提供了一种将多种采样分布结合起来的无偏估计的方法，假设现在有种采样分布，每种采样分布采样了个点，则最后的估计为：

可以看到其本身依旧是一个蒙特卡洛积分的形式，只不过对于从不同的采样分布中采样的结果都乘上了一个与之对应的权重. 要想保证这样的estimator依旧是无偏的则需要满足以下两个条件：

其中关于第一个条件进一步理解是，只要在有值的地方，就一定存在某个分布能够采样到，从另外一个角度来说某些分布完全可以专门负责某些特殊的地方即可。
对于这样一个estimator，它的无偏性的证明也是比较简单的：

那么对于这样一个无偏的estimator，该如何设置权重，才能够很好的把各个重要性采样分布的有点结合起来了呢？这里简要介绍两种：
1. Balance heuristic:

这种设置方法的目的很直接，倘若在一个点你采样的pdf越大，其实也就说明了这个重要性采样分布更加擅长这个区域，理应给它更高的权重，而如果pdf小，意味着该重要性采样分布对这个区域没有什么自信，当然应该减小权重，来降低误差。可能这样说比较抽象，我们就以本章一开始的场景为例子，假设为光源采样,为BRDF采样。
1.当在右上角使用光源采样的时候，由于光源较大，那么自然就会比较小，而BRDF采样由于长板比较光滑，所以会相对较大，综合下来就会比较小，降低了在右上角使用光源采样从而造成的误差(想想第一张图的那些右上角noise，现在都会被乘一个小的权重)
2.当在左下角使用BRDF采样的时候，由于光源较小，那么自然就会比较大，而此时长板十分粗糙，所以就比较小，因此就会比较小，降低了在左上角使用BRDF采样从而造成的误差(想想第二张图的那些左下角noise，现在都会被乘一个小的权重)
经过以上的解释，相信已经能够大致明白MIS的一个原理了。这里要介绍的第二种权重的设置方法，其实就是在第一种的基础之上用一个指数加大了pdf的差距，使得这种差别变的更加明显
2.Power heuristic：

在原论文中，建议. 在具体实践中，这种进一步扩大pdf区别的power heuristic方法一般可以取得更好的效果。
看看使用了power heuristic的MIS的方法之后：

该图片显然结合了光源采样和BRDF采样的优点，不再会在右上角和左下角出现noise了。再看一看该场景之下的权重图：

红色代表BRDF的权重更大，绿色代表light sampling的权重更大，黄色则代表差不多，回想一下之前的分析，完全符合预期！
最后给出一个实现MIS的伪代码以供参考：

该代码可以看作是在NEE的基础之上修改添加了MIS，这里的两个重要性采样分布就是光源采样与BRDF采样。它们是符合本章一开始所讲的那两个条件的，所以结果一定是一个无偏估计！
或者换一种角度看，其实就相当于在计算直接光照的时候有两部分构成，一部分是光源采样，一部分是BRDF采样，它们并不是重复计算，因为都乘了一个weight，被缩小了。而在计算间接光照的时候，实际上还是只有BRDF采样在干活。