厦门外贸网站建设报价,工业互联网平台的意义有哪些,下载app免费下载app,网站改版要重新备案吗最近看了不少使用QIS重建图像的文章#xff0c;觉得比较完整详细的还是Abhiram Gnanasambandam的博士论文#xff1a;https://hammer.purdue.edu/articles/thesis/Computer_vision_at_low_light/20057081
1 介绍
讲述了又墨子的小孔成像原理#xff0c;到交卷相机#xf…最近看了不少使用QIS重建图像的文章觉得比较完整详细的还是Abhiram Gnanasambandam的博士论文https://hammer.purdue.edu/articles/thesis/Computer_vision_at_low_light/20057081
1 介绍
讲述了又墨子的小孔成像原理到交卷相机再到数字相机的发展过程。指出本文的主要目的是为了针对光子随机到达相机产生的散粒噪声即使是完美的传感器也没有办法避免提出相应的解决思路。 作者指出现有的相机在照度超过25lux的场景下都能取得较好的重建效果而当照度只有2.5lux时通过高增益或者ISO可以从传感器中获得有价值的信号。而当照度到0.25lux及以下的时候即使使用了高增益图片的质量也会很差。
如下图所示即使是使用完美的传感器传感器自身不带噪声低光照情况下仍然有很严重的散粒噪声。 同时低光照也会对颜色重建产生影响相机通常使用CFA(Color Filter Arrays)来进行图像颜色的构建从CFA中的单一图像通道恢复三通道RGB图像的过程也叫作去马赛克。低光照会使得这一过程更加困难主要还是噪声的影响。
低光照同样会对目标检测、目标分类等下游视觉任务产生不利的影响。 针对动态场景在低光照情况下为了减少运动模糊可以提高相机的帧数但是减少的曝光时间会导致光照不足致使噪声增大降低图像的SNR。 同时曝光时间较短容易造成暗处物体噪声过大曝光时间较长又容易造成亮出物体过曝。如何保证相机的HDRHigh Dynamic Range即如何在一张图形中使得受光照强度不同的物体都展现出良好的拍摄效果也是一个很重要的问题。 所以本文希望借助QIS传感器拥有更小的读出噪声、暗电流以及像素块在低光照、HDR场景下获得成像良好的图像。
2 数字图像传感器
2.1 现代相机的历史
现代相机的发展可以从卤化银薄膜技术说起其主要原理是卤化银和光的反应光子会打破卤化银中的化学键从而产生银而光子的数量决定了银的产生数量通过这样的方式和后续处理就得到了最终的图像。在卤化银相机中胶卷同时作为图像捕捉和保存的媒介。
而随后的电子相机则将图像捕捉和存储的任务给分开了通过图像传感器捕捉场景然后将其存储在格外的空间中。
最早的数码相机是基于CCD(Charge-Coupled Device)技术的CCD传感器通过测量电荷再经过ADC(Analog-to-Digital Conversion)得到最终的数字量。而后CMOS传感器开始兴起其主可以在像素内实现成像以及ADC。期初CCD靠着自己低读出噪声、暗电流高量子转化效率的优势在相机产业占据优势但随着科技的发展特别是CIS(CMOS Image Sensor)像素制造技术的进步CIS凭借自身功耗小处理速度快的优势以及处理噪声的降低逐渐成为了相机产业的主导传感器。 随着人们对高像素、低功耗的需求图像的像素尺寸在持续下降然后小的像素尺寸会造成满阱容量即每个像素点可以收集的最大电子数量的下降进一步导致SNR的下降。在这种情况下Dr. Eric Fossum提出了QIS这是一种新型的传感器只有亚衍射极限大小的像素并且它的满阱容量只有一即只能收集到一个电子它拥有对每一个光子进行计数每秒钟几千次成像的能力。
另一种QIS的替代技术是SPAD(Single-Photon Avalanche diode)SPAD通过雪崩倍增的方式实现单光子计数。
2.2 半导体基础
2.2.1 反向偏置p-n结
p结包含了大量的可移动的正电荷空穴n结则包含了大量的可移动的负电荷。当p结和n结摆放在一起时就会构成耗散区其中包含了正负离子。p结中的大量可移动正电荷会向n结扩散n结中的大量可移动的电子则会向p结扩散然后构成和扩散运动相反的内电场当内电场阻碍和扩散运动达成平衡时就会形成稳定的耗散区。可以通过增加反向电压p结接低电压n结接高电压的方式增大耗散区此时耗散区外的载流子会验证外电场的方向移动耗散区增大。同理如果增加正向电压p结接高电压n结接低电压则耗散区会变小。
2.2.2 光电效应和光电二极管
光电效应主要指当光波照射到材料上时光子会把自身的能量转换到材料的电子中使其成为自由电子。 一个光子中包含的能量主要取决于它的频率或者波长假设光子的频率为vvv则其波长为λ\lambdaλ为λcv\lambda\frac{c}{v}λvc(ccc为真空环境下的光速)其携带的能量为 EhvhcvEhv\frac{hc}{v} Ehvvhc 一个光子需要有足够的能量将电子从价电子带受原子束缚激活到传导带不受原子束缚才能产生光电效应。一个光子最多可以激活一个电子而光子却不一定能激活电子。这种激活成功率通常称为QE(Quantum Efficiency)。 光电二极管正是使用了光电效应光电二极管是在反向电压下工作的无光照时呈现截止状态只有微弱的暗电流当有光照时光电效应激发了大量可以自由移动的电子由于反向电压的作用产生较大的反向电流光电二极管导通。一般来说反向电压越大满阱容量也会越大。
2.3 CCD
2.3.1 MOS 电容
CCD传感器的基础是MOS电容。MOS电容有一个半导体基板一个绝缘体还有一个称为栅极的金属电极。这里绝缘体相当于电容里的电介质。金属起到的作用相当于p-n结中的n结而半导体的基板相当于p结。通过在栅极上施加电压类似于向p-n结上施加反向电压n结上加正向电压会形成一个耗散区下图(a)。当基板里的电子被激活时电子会涌向栅极但是中间的绝缘层会阻隔电子使其在绝缘层和基板之间的接触面聚集下图(b)。也可以用一个液体模型来表示这个过程下图©。
2.3.2 电荷转换
下面来介绍将两块MOS电容放在一起时会发生什么情况。考虑如下图所示的情况两个gate都正极相连现在假设它们其中的一个积累了光生电子一个没有当两个距离较远时会保持原样当两个距离较近时如下图(b)所示这两个potential well会合并成一个。 当有偏向电压被施加时会产生potential well当电压撤去后potential well会消失当两个potential well距离靠近时会完成两个potential well的合并MOS电容间的电荷主要便是通过这种方式进行转移。 下面介绍对于一个大型传感器如何做到这一点主要是通过顺序的行、列读取完成。首先会将电荷一列右移最右侧的一列电荷就会被移入read register。而read register下面会有一个floating diffusion(FD)可以将电荷转化为一个数字。然后一行一行地将read register里的电荷送入到FD中读取数据。当read register中每一行的数据都被读出后再将电荷整体右移一列重复之前的步骤直到全部电荷被读出。
2.3.3 新传感器技术的需求
从上述的电荷转移机制我们可以发现CCD将电荷存储和电荷转移分开了。CCD的主要优势如下 1、CCD图像传感器是优化后的光电探测器。它们不服务于其他目的这意味着它们有很好的QE和小的暗电流。 2、引入的噪声是很小的因为转换过程几乎是完美的。 3、考虑到只有一个floating diffusion和一个放大器像素之间不存在不执行的问题。 当时CCD传感器也有其缺点 1、CCD需要比较高的电压通常10-15V。 2、一个电荷一个电荷轮流读出的机制使其处理速度较慢。 3、由于像素块针对光子探测器进行了优化也没有其他电路结构在像素块内添加其他功能会变得非常困难。
2.4 CMOS图像传感器
CMOS(Complementary Metal Oxide Semiconductor)技术起源于结合了PPD(Pinned Photodiode)和像素内电荷转换的传感器。CMOS的主要优点包括 1、CMOS APS有像素读出电路这意味其电荷可以在像素内得到放大和ADC。像素内读出电路与X-Y寻址相结合使CMOS图像传感器在封装像素和跳过像素这方面有极大的灵活性这使得CMOS的处理速度很快。 2、CMOS的能耗更低CMOS通常运行在3V左右。 3、CMOS的像素电路是高度编程话的使CMOS APS可以很灵活地针对特征需要进行修改。
2.4.1 Pinned photodiodes
pinned phtotdiodes是现代CMOS APS的重要组成部分。下图展示了一个简化版的PPD已经它是如何进行电荷转移的。 FD使用的n型半导体掺杂的电子密度更高这使得FD相比PPD会产生一个更大的势阱。 在PPD顶端植入的p增加了向FD转换电荷的效率。PPD设计的一个优势是能够进行真正的CDS(Correlated Double Sampling)在CDS中我们两次读出FD的电压一次是在TG关闭的时候一次是在电荷转移后。电位的变化被读出作为像素的信号。这样读出信号的质量得到了提高。
2.4.2 CMOS APS
下图展示了四个晶体管有源像素器的系统框架图包括了Transfer gate(TG)Reset(RST)Source follower(SF)和Row select(SEL)。 一旦TG打开光电二极管中产生的光生电子就会被转移到FD中。FD中的电压变化ΔVFD\Delta V_{FD}ΔVFD由FD节点的电容CDC_DCD以及从PPD转移到转移到FD的电荷QPhQ_{Ph}QPh决定。 ΔVFDQPhCD\Delta V_{FD}\frac{Q_{Ph}}{C_D} ΔVFDCDQPh 从而我们可以计算出转移的电荷数QPh/qeQ_{Ph}/q_eQPh/qe这里qeq_eqe是一个电荷所带的电荷数。从而增益(CG)可以表示为 CGΔVFDQPh/qeqeCDCG\frac{\Delta V_{FD}}{Q_{Ph}/q_e}\frac{q_e}{C_D} CGQPh/qeΔVFDCDqe 对于一个通常的CMOS APSCG一般是在50μV/e−150\mu V/e^{-1}50μV/e−1到100μV/e−1100\mu V/e^{-1}100μV/e−1之间。由于噪声的影响输出电压会有一个电子的变化。一旦电荷被转移到FD打开SF就可以从FD中读到放大后的电压信号。接着可以使用列总线和SEL信号选择想要从那个像素读取信号。最后将ISO输出的电压送入到ADC中进行模数转换。 注这里计算的增益是内在的像素增益。总体的增益是总体的放大包含了ISO放大。
APS中的光电二极管只需要产生光生电子。像素会有一套单独的结构来进行信号放大。 尽管CMOS图像传感器拥有处理速度更快的优势因为每一个像素都有自己独有的处理电路但是它容易受到不一致性的影响比如光子相应不一致性和暗电流不一致性。但是由于电路占用了一部分像素面积导致填充因子光敏面积与总面积的比例降低从而影响了灵敏度。然而这个问题可以通过一些技术来缓解比如背照式照明back-side illuminationBSI和微透镜的使用。下表展示了CCD和CMOS图像传感器在一些重要因素上的比较。
2.5 单光子计数图像传感器
CMOS在处理有限光子成像上还存在很多问题。我们想要它们具备光子计数的能力这需要他们对每一个光子都敏感并且可以从这些光子中获得尽可能多的信息。现在为了实现这个目标的三种方案 1、CIS-QIS 2、SPAD 3、EMCCD(Electron multipying CCD) 通常SPAD和CIS-QIS都可以归类到QIS中。
2.5.1 CIS-QIS
泵门点(pump-gate jot)
泵门点CIS-QIS的基础结构。由于CIS的增益取决于FD的电容CDC_DCD。而像素内的CG需要超过1000μV/e−1\mu V/e^{-1}μV/e−1从而取得低于0.15e−10.15e^{-1}0.15e−1的读出噪声。 为了减少FD的电容可以增加TG和FD之间的距离。但是这会增加电荷转移的难度。所以提出了一种pump的模式。这种模式下的电荷转移过程如下图所示。
QIS
图像传感器可以使用泵门点来使得噪声到达0.19e−10.19e^{-1}0.19e−1。现有的CIS-QIS可以在单比特和多比特的模式上运行。可以通过减少ADC中的比特位数来得到一个高速的QIS。但比特位数和速度的取舍一直没有明确的定论。 CIS-QIS拥有CIS几乎所有的特性所以它们拥有许多共同点比如编程上的灵活性。CIS-QIS可以利用CIS的优势比如BISCDS和微棱镜来获得良好的读出噪声填充因子QE和暗电流。
2.5.2 SPAD
SPAD的模型如下图所示 SPAD是专门用于反向偏压电压远高于击穿电压的传感器这会导致一个自由的电荷就可以引起雪崩从而产生大量的电流。CIS-QIS可以长时间地对光子计数SPAD则不能。一旦电荷被检测到我们需要在下次使用传感器之前重置传感器。这种现象导致了运行SPAD时存在一个死时区传感器需要关闭从而重置像素。
SPAD需要一个高电压15-20V用来击穿并且由于雪崩效用功耗也会很高并且SPAD的像素尺寸也会比CIS-QIS大。然而SPAD可以达到每秒100k帧。因为高速并且可以准确计算出雪崩发生的时间SPAD更适合用来处理时间相关图像处理。
2.5.3 EMCCD
EMCCD本质上还是CCD它在移位寄存机和ADC之间配备了多个增益寄存器。每个增益寄存器都会尝试使用冲击电离来进行电子倍增。冲击电离和雪崩二极管的操作非常类似通过一个高电场加速电荷希望引起雪崩效应。但是EMCCD中一个光子倍增的概率非常低。EMCCD通过拥有多个这样的寄存器来获得合适的电子检测概率。和SPAD和CIS-QIS相比EMCCD拥有一个非常高的暗电流并且必须在低温下运行。
2.5.4 三种技术的比较 3 相机的数学模型
3.1 噪声来源
所有对不同噪声源的解释都是从信号处理的角度进行的。除非有必要我们不会讨论太多关于导致所有这些噪声源的传感器物理的细节。
3.1.1 光子达到过程
光子的达到是一个随机过程这种随机性是电磁波粒子性质的直接结果。在图像领域这叫做散粒噪声。在这部分我们展示一些光子达到的性质。 假设一个强度为I(x,y;t)I(x,y;t)I(x,y;t)的光波到达xyxyxy平面上的图像传感器。我们对光子的到达做三个假设 1、单个光子到达面积小于相干区域且小于相干时间的区域的概率与光波的强度I(x,y;t)I(x,y;t)I(x,y;t)成正比。设KKK为在时间间隔Δt\Delta tΔt和区域Δa\Delta aΔa内达到图像传感器的光子数。这个概率是说对特定的α\alphaα: P(K1;Δt,ΔA)αΔtΔAI(x,y;t)P(K1;\Delta t,\Delta A)\alpha \Delta t \Delta A I(x,y;t) P(K1;Δt,ΔA)αΔtΔAI(x,y;t) 2、在时间间隔Δt\Delta tΔt和区域Δa\Delta aΔa内达到的光子数量超过1的可能性可以忽略不计也就是说P(K1;Δt,ΔA)≈0P(K1;\Delta t,\Delta A)\approx 0P(K1;Δt,ΔA)≈0。因此我们可以写成 P(K0;Δt,ΔA)1−αΔtΔAI(x,y;t)P(K0;\Delta t,\Delta A)1-\alpha \Delta t\Delta AI(x,y;t) P(K0;Δt,ΔA)1−αΔtΔAI(x,y;t) 3、光子到达过程在任何非重叠区域或时间间隔内都是相互独立的。 让我们看看光子数量KKK在任意时间间隔(T,TτΔτ)(T,T\tau\Delta \tau)(T,TτΔτ)到达图像传感器的区域ΔA\Delta AΔA的概率分布。由于我们考虑的是(x,y)(x,y)(x,y)附近固定的ΔA\Delta AΔA区域我们将暂时忽略方程中的ΔA,x\Delta A,xΔA,x和yyy。 P(Kk;(T,TτΔτ))P(Kk−1;(T,Tτ))⋅P(K1;(TτΔτ))P(Kk;(T,Tτ))⋅P(K0;(Tτ,TτΔτ))P(Kk;(T,T\tau\Delta\tau))P(Kk-1;(T,T\tau))\cdot P(K1;(T\tau\Delta \tau))\\ P(Kk;(T,T\tau))\cdot P(K0;(T\tau,T\tau\Delta \tau)) P(Kk;(T,TτΔτ))P(Kk−1;(T,Tτ))⋅P(K1;(TτΔτ))P(Kk;(T,Tτ))⋅P(K0;(Tτ,TτΔτ)) 现在使用假设3中的独立性以及假设1和2中的式子重写上式可以得到 P(Kk;(T,TτΔτ))P(Kk−1;(T,Tτ))⋅αΔτI(Tτ)P(kk;(T,Tτ))⋅[1−αΔτI(tτ)]P(Kk;(T,T\tau\Delta \tau))P(Kk-1;(T,T\tau))\cdot \alpha\Delta \tau I(T\tau)\\ P(kk;(T,T\tau))\cdot[1-\alpha\Delta \tau I(t\tau)] P(Kk;(T,TτΔτ))P(Kk−1;(T,Tτ))⋅αΔτI(Tτ)P(kk;(T,Tτ))⋅[1−αΔτI(tτ)] 重新整理式子可以得到 P(Kk;(T,TτΔτ))−P(Kk;(T,Tτ))ΔταI(tτ)[P(Kk−1;(T,Tτ))−P(Kk;(T,Tτ))]\frac{P(Kk;(T,T\tau\Delta \tau))-P(Kk;(T,T\tau))}{\Delta \tau}\\ \alpha I(t\tau)[P(Kk-1;(T,T\tau))-P(Kk;(T,T\tau))] ΔτP(Kk;(T,TτΔτ))−P(Kk;(T,Tτ))αI(tτ)[P(Kk−1;(T,Tτ))−P(Kk;(T,Tτ))] 让Δτ\Delta \tauΔτ趋近于0我们可以得到 dP(Kk;(T,TτΔτ))−P(Kk;(T,Tτ))dταI(tτ)[P(Kk−1;(T,Tτ))−P(Kk;(T,Tτ))](3.6)\frac{dP(Kk;(T,T\tau\Delta \tau))-P(Kk;(T,T\tau))}{d\tau}\\ \alpha I(t\tau)[P(Kk-1;(T,T\tau))-P(Kk;(T,T\tau))]\tag{3.6} dτdP(Kk;(T,TτΔτ))−P(Kk;(T,Tτ))αI(tτ)[P(Kk−1;(T,Tτ))−P(Kk;(T,Tτ))](3.6) 然后可以根据定理3.1.1得到解。 这里证明(3.8)(3.8)(3.8)是(3.7)(3.7)(3.7)的一个解。 将(3.8)(3.8)(3.8)带进(3.7)(3.7)(3.7)让θ(τ)(∫TTτG(t)dt)\theta(\tau)(\int_T^{T\tau }G(t)dt)θ(τ)(∫TTτG(t)dt)可以得到 这和式3.7的右侧一样。这里(a)使用了dθ(τ)dτddτ∫TTτG(t)dtG(Tτ)\frac{d\theta(\tau)}{d\tau}\frac{d}{d\tau}\int_T^{T\tau}G(t)dtG(T\tau)dτdθ(τ)dτd∫TTτG(t)dtG(Tτ)。 通过G(t)αI(t)G(t)\alpha I(t)G(t)αI(t)替换式3.8我们得到了3.6的解进一步令θ∫TTταI(t)dt\theta\int_T^{T\tau}\alpha I(t)dtθ∫TTταI(t)dt得 P(Kk;(T,Tτ))e−θθkk!P(Kk;(T,T\tau))\frac{e^{-\theta}\theta^k}{k!} P(Kk;(T,Tτ))k!e−θθk 这就是著名的泊松PMF分布。 到目前为止的讨论已经假设我们有一个固定的小面积Δa\Delta aΔa和一个更长的时间间隔τ\tauτ。按照类似的步骤我们还可以证明同样的结果也适用于更大的区域。在上式的一个更一般的版本中我们将会有 θ∫(x,y)∈A∫∫TTταI(x,y;t)dtdxdy\theta\int_{(x,y)\in A}\int\int_{T}^{T\tau}\alpha I(x,y;t)dtdxdy θ∫(x,y)∈A∫∫TTταI(x,y;t)dtdxdy
3.1.2 相干光和非相干光
假设已知光强I(x,y;t)I(x,y;t)I(x,y;t)我们可以推导出光子到达过程。然而这个假设不一定满足这里需要理解光的相干性。 两个光波在空间或者时间上的同一点具有恒定的相位差就认为它们是相干的。一个产生所有具有相同相位的光波光源被认为是一个相干光源。 对于一个相干光源则知道光强的假设是成立的因此会服从泊松到达分布。然而对于非相干光我们只知道它的平均光强因为它的实际光强是一个随机过程这使得上式的θ\thetaθ是一个随机变量在这种情况下得到 P(Kk∣θ)e−θθkk!P(Kk|\theta)\frac{e^{-\theta }\theta^k}{k!} P(Kk∣θ)k!e−θθk 然后可以得到 P(Kk)∫θ0∞P(Kk∣θ)PΘ(θ)dθ∫θ0∞e−θθkk!PΘ(θ)dθ(3.12)P(Kk)\int_{\theta0}^\infty P(Kk|\theta)P_\Theta(\theta)d\theta\int_{\theta0}^\infty \frac{e^{-\theta}\theta^k}{k!}P_\Theta(\theta)d\theta\tag{3.12} P(Kk)∫θ0∞P(Kk∣θ)PΘ(θ)dθ∫θ0∞k!e−θθkPΘ(θ)dθ(3.12) 这个式子通常被称为曼德尔公式。
非相干光
当光源是非相干时对于任意的区间τ\tauτPΘ(θ)P_{\Theta}(\theta)PΘ(θ)遵循高斯分布 PΘ(θ)1α(αMβ)M⋅(θα)M−1exp{−Mθβ}Γ(M)(3.13)P_{\Theta}(\theta)\frac{1}{\alpha}(\frac{\alpha\mathcal{M}}{\beta})^\mathcal{M}\cdot \frac{(\frac{\theta}{\alpha})^{\mathcal{M}-1}exp\{{-\mathcal{M}\frac{\theta}{\beta}}\}}{\Gamma(M)}\tag{3.13} PΘ(θ)α1(βαM)M⋅Γ(M)(αθ)M−1exp{−Mβθ}(3.13) 这里M\mathcal{M}M表示测量区间的自由度βE(θ)\betaE(\theta)βE(θ)当只允许时间上的自由度时 M[1τ∫−∞∞Λ(ητ)∣γ(η)∣2dη]−1(3.14)\mathcal{M}[\frac{1}{\tau}\int_{-\infty}^\infty \Lambda(\frac{\eta}{\tau})|\gamma(\eta)|^2d\eta]^{-1} \tag{3.14} M[τ1∫−∞∞Λ(τη)∣γ(η)∣2dη]−1(3.14) 其中γ(η)\gamma(\eta)γ(η)是相关的复杂度 (3.13)-(3.15)的式子可以参照论文J. W. Goodman, Statistical optics. John Wiley Sons, 2015. 将(3.13)带入(3.12)得 这个式子我也没有看的很明白应该用了gamma函数的性质 这个分布被称为负二项分布。这个分布可以用在任意的计数间隔τ\tauτ。我们来讨论两种特殊情况当τ\tauτ相比相干时间特别小或者特别长的时候。
短计数区间
当计数区间τ\tauτ小于相干时间时M\mathcal{M}M本质上是统一的通过让式(3.13)中的M\mathcal{M}M为1我们可以发现θ\thetaθ服从指数分布 PΘ(θ)1βe−θβ,θ≥0(3.17)P_{\Theta}(\theta)\frac{1}{\beta}e^{-\frac{\theta}{\beta}},\theta\geq0\tag{3.17} PΘ(θ)β1e−βθ,θ≥0(3.17) 将M1\mathcal{M}1M1带入(3.16)可以得到 P(Kk)11β(ββ1)kP(Kk)\frac{1}{1\beta}(\frac{\beta}{\beta1})^k P(Kk)1β1(β1β)k 这个叫做波色爱因斯坦分布。
长计数区间
对于长的τ,M→∞\tau,\mathcal{M}\rightarrow\inftyτ,M→∞为了反应这一点对于任意小的δ\deltaδ令Mβ/δ\mathcal{M}\beta/\deltaMβ/δ然后(3.16)变成 使用 Stirling近似可以得到 对于δ→0\delta\rightarrow 0δ→0可以得到 讲这些带入(3.19)可以得到 又由于δ→0\delta\rightarrow 0δ→0所以 (1kδβ)kβδ−0.5≈ek(1\frac{k\delta}{\beta})^{k\frac{\beta}{\delta}-0.5}\approx e^k (1βkδ)kδβ−0.5≈ek 所以我们可以得到 P(Kk)e−ββkk!P(Kk)\frac{e^{-\beta}\beta^k}{k!} P(Kk)k!e−ββk 这就是我们熟知的泊松分布。 在波长为500nm时我们需要一个10−12s的计数间隔来满足(3.18)的条件这个间隔太短了。一般来说我们可以安全地假设到达图像传感器的几乎所有成像应用中的光子都遵循泊松分布。
3.1.3 到达时间
下面的定理给出光子到达遵循泊松分布时到达时间的概率分布。 证明 对于一个时间间隔ttt泊松随机变量KKK的概率密度函数可以表示为 P(Kk)e−γt(γt)kk!(3.23)P(Kk)\frac{e^{-\gamma t}(\gamma t)^k}{k!}\tag{3.23} P(Kk)k!e−γt(γt)k(3.23) 记Δτ\Delta\tauΔτ是两次到达之间的间隙这意味在Δτ\Delta\tauΔτ内没有到达所以我们可以写成 P(Δτt)P(K0)e−γt(3.24)P(\Delta\taut)P(K0)e^{-\gamma t}\tag{3.24} P(Δτt)P(K0)e−γt(3.24) 我们知道P(Δτt)1−FΔt(t)P(\Delta\taut)1-F_{\Delta t}(t)P(Δτt)1−FΔt(t)这里FΔt(t)F_{\Delta t}(t)FΔt(t)是达到时间的CDF累积分布函数。因此 FΔt(t)1−e−γt(3.25)F_{\Delta t}(t)1-e^{-\gamma t}\tag{3.25} FΔt(t)1−e−γt(3.25) 对FΔt(t)F_{\Delta t}(t)FΔt(t)求微分就可以得到需要的概率密度函数。
3.1.4 光子到电子
上一节已经证明了光子的到达过程是一个泊松过程。光子通过光电效应来激发像素中的电子。这个过程如下图所示。
光电效应表明一个光子只能激发一个电子然而并不是所有的光子都能激发电子。然而并不是所有光子都能激发电子。每个入射光子平均激发0≤η≤10\leq \eta \leq 10≤η≤1个电子。≤\leq≤被称为图像传感器的量子效率。图像传感器在不同的波长下通常具有不同的量子效率。我们通常使用的大多数图像传感器对电磁光谱的可见光范围400-700纳米都有很高的灵敏度。
单色光
假设光是单色的它的光波波长为λ0\lambda_0λ0记光强为I(x,y,,t;λ0)I(x,y,,t;\lambda_0)I(x,y,,t;λ0)。我么同样假设光子服从泊松分布。假设到达一个特定像素的光子的平均个数为β(λ0)\beta(\lambda_0)β(λ0)。到达传感器k的光子数根据式3.21进行概率分布我们将像素的光子检测建模为伯努利随机变量检测的概率为η(λ0)\eta(\lambda_0)η(λ0)。然后检测到每一个光子概率分布为 P(detection)η(λ0),P(miss)1−η(λ0)P(detection)\eta(\lambda_0),P(miss)1-\eta(\lambda_0) P(detection)η(λ0),P(miss)1−η(λ0) 探测到的光子数获产生的电子数是KkKkKk伯努利随机变量的和。伯努利随机变量的和遵循二项分布。因此像素检测到的光子数量KekeK_ek_eKeke与到达像素的光子数量的分布满足 P(Keke)P(K_ek_e)P(Keke)的概率分布为 证明 我们将使用力矩母函数来证明这一点。对于t∈Rt\in Rt∈RKeKeKe的矩母函数为 MKe(t)EKe[etKe]Ek{EKe∣K[etKe]}(3.31)M_{Ke}(t)E_{Ke}[e^{tKe}]E_k\{E_{Ke|K}[e^{tKe}]\}\tag{3.31} MKe(t)EKe[etKe]Ek{EKe∣K[etKe]}(3.31) 伯努利随机变量的矩母函数为 Ek{EKe∣K[etKe]}(1−ηηet)K(3.32)E_k\{E_{K_e|K}[e^{tKe}]\}(1-\eta\eta e^t)^K\tag{3.32} Ek{EKe∣K[etKe]}(1−ηηet)K(3.32) 注关于矩母函数可以参考博客https://blog.csdn.net/weixin_48524215/article/details/123162267 因此 MKe(t)EK[(1−ηηet)K]Ek[elog(1−ηηet)K](3.33)M_{K_e}(t)E_K[(1-\eta\eta e^t)^K]E_k[e^{\log(1-\eta\eta e^t)K}]\tag{3.33} MKe(t)EK[(1−ηηet)K]Ek[elog(1−ηηet)K](3.33) 记slog(1−ηηet)s\log(1-\eta\eta e^t)slog(1−ηηet)则Ek[elog(1−ηηet)K]Ek[esK]E_k[e^{\log(1-\eta\eta e^t)K}]E_k[e^{sK}]Ek[elog(1−ηηet)K]Ek[esK]。再考虑到KKK的矩母函数即泊松分布的矩母函数则 MKe(t)EK[esK]eβ(es−1)eβ(elog(1−ηηet)−1)eβ(1−ηηet−1)eηβ(et−1)(3.34)M_{K_e}(t)E_K[e^{sK}]e^{\beta(e^s-1)}e^\beta(e^{log(1-\eta\eta e^t)}-1)e^{\beta(1-\eta\eta e^t-1)}e^{\eta\beta^{(e^t-1)}}\tag{3.34} MKe(t)EK[esK]eβ(es−1)eβ(elog(1−ηηet)−1)eβ(1−ηηet−1)eηβ(et−1)(3.34) 通过将MKe(t)M_{Ke}(t)MKe(t)和泊松随机变量的矩母函数作比较不难看出KeKeKe是以ηβ\eta\betaηβ为均值的泊松分布。 因此可以写成 P(Keke)e−η(λ0)β(λ0)(η(λ0)β(λ0))keke!(3.35)P(K_ek_e)\frac{e^{-\eta(\lambda_0)\beta(\lambda_0)}(\eta(\lambda_0)\beta(\lambda_0))^{k_e}}{k_e!}\tag{3.35} P(Keke)ke!e−η(λ0)β(λ0)(η(λ0)β(λ0))ke(3.35) 我们已经证明了由单色光源激发的电子数遵循泊松过程。然而在现实生活中我们不会经常遇到单色光很少有例外比如我们使用激光作为光源。因此我们也需要将这个结果扩展到非单色光。
非单色光
下图展示了太阳光谱的例子。辐射照度J(λ)J(\lambda)J(λ)可以很容易地转化为光子速率 Φ(λ)J(λ)λhc\Phi(\lambda)\frac{J(\lambda)\lambda}{hc} Φ(λ)hcJ(λ)λ 这里hhh是普朗克常数ccc是光速Φ(λ)\Phi(\lambda)Φ(λ)的单位为光子/秒/单位面积/nm。假设Φ(λ)\Phi(\lambda)Φ(λ)在空间上上一致可以认为它是每个到达图像传感器的光子所属波长的概率分布。 f(λ)Φ(λ)∫0∞Φ(λ)dλf(\lambda)\frac{\Phi(\lambda)}{\int_0^\infty\Phi(\lambda)d\lambda} f(λ)∫0∞Φ(λ)dλΦ(λ) 对于到达像素的KKK个光子的每一个它的波长是满足概率密度函数为f(λ)f(\lambda)f(λ)的随机变量。对于每不同的波长它到达像素的量子效率都会发生变化。 所以现在可以写出被像素检测出的光子数目的概率分布 这里Fke\mathcal{F}_{k_e}Fke包含了kek_eke个元素的所有子集。这样的分布叫做泊松二项分布。并且我们假设每一个λi\lambda_iλi都相互独立。 接下来的定理会给出P(Keke)P(K_ek_e)P(Keke)的概率分布。 证明 同样使用矩母函数进行证明。 MKe(t)EK{Eλ∣K{EKe∣K,λ[etKe]}}(3.42)M_{K_e}(t)E_K{\{E_{\lambda|K}\{E_{K_e|K,\lambda}[e^{tK_e}]\}}\}\tag{3.42} MKe(t)EK{Eλ∣K{EKe∣K,λ[etKe]}}(3.42) 其中Ke∣K,λK_e|K,\lambdaKe∣K,λ是泊松二项分布它就是将KKK个独立的拥有不同成功率的伯努利随机变量加起来。因此对应的矩母函数为 EKe∣K,λ[etKe]∏i1K(1−η(λi)η(λi)et)(3.43)E_{K_e|K,\lambda}[e^{tK_e}]\prod_{i1}^{K}(1-\eta(\lambda_i)\eta(\lambda_i)e^t)\tag{3.43} EKe∣K,λ[etKe]i1∏K(1−η(λi)η(λi)et)(3.43) 进一步得到 这里(a)是因为假设λi\lambda_iλi都是独立的并且记η‾Eλ(η(λ))\overline{\eta}E_\lambda(\eta(\lambda))ηEλ(η(λ))。于是我们可以将KeK_eKe的矩母函数写成: 然后遵循定理3.1.3就可以完成相应的证明。 因此我们已经证明无论光是否为单色的由图像传感器检测到的光子数都遵循泊松分布。定理3.1.3和3.1.4中的结果适用于相干光和具有较长计数间隔的非相干光。 3.1.5 暗电流
暗电流值得是在无光照的情况下产生的电流。它是我们不想要的因为它阻碍了我们想要测量的实际光子数量。暗电流减少了动态范围即可以检测到的光子范围因为可以存储在像素中的光子数量是有限的在弱光成像中当场景中的光子数量与暗电流产生的假电子数量差不多时暗电流就会产生比较多的问题。暗电流有会很多来源。暗电流是集成时间和运行温度的函数由于暗电流产生的电荷KdK_dKd可以被建模为泊松分布 P(Kdk)e−βd(βd)kk!P(K_dk)\frac{e^{-\beta_d}(\beta_d)^k}{k!} P(Kdk)k!e−βd(βd)k 这里βdγdτ\beta_d\gamma_d\tauβdγdτ是由暗电流积累的电荷数目的均值。其中τ\tauτ是集成时间γd\gamma_dγd是单位时间内由于暗电流产生的电荷数目。 记总的像素积累的电荷数为KKeKdKK_eK_dKKeKd这里的KKK和之前的到达数目KKK不一样。所以假设βe\beta_eβe是被到达光子激活的电荷数目的均值βd\beta_dβd是暗电流产生并且积累的电荷数目的均值。像素积累的总电荷数目遵循均值为βtotalβeβd\beta_{total}\beta_e\beta_dβtotalβeβd。 P(Kk)e−(βeβd)(βeβd)kk!P(Kk)\frac{e^{-(\beta_e\beta_d)}(\beta_e\beta_d)^k}{k!} P(Kk)k!e−(βeβd)(βeβd)k
3.1.6 读出噪声
一旦像素积累的电荷这些电荷需要被读出。读出噪声通常是指像素的读出电子器件产生的噪声该噪声通常被建模为高斯噪声 ηread∼N(0,δread2)\eta_{read}\sim N(0,\delta_{read}^2) ηread∼N(0,δread2) 这里δread\delta_{read}δread是读出噪声的标准差其对应的概率分布为 进一步可以得到传感器读出的模拟信号为 yG⋅(Kηread)(3.50)yG\cdot(K\eta_{read})\tag{3.50} yG⋅(Kηread)(3.50) 这里GGG是传感器的转换增益即将电荷数目转化为传感器读出的电压值。YYY是泊松-高斯变量。而YYY的分布是泊松分布和高斯分布的卷积 下图展示了无读出噪声和不同读出噪声下YYY的概率分布βtot2\beta_{tot}2βtot2 我们使用来自QIS像素的数据验证了是式(3.51)中模型的准确性如下图所示通过从一个像素中进行了50000从重复测量来构建光子计数直方图(PCH)。每个度量的积分时间时50μs50\mu s50μs。平均光子计数为每像素1.48个光子。ADC使用的是14位的位深度最小显著性位是0.05e−0.05e^{-}0.05e−。由于使用的ADC位数为14所以的大的直方图近似为一个连续体。 其中我们假定读出噪声为0.25e−0.25e^-0.25e−暗电流假定位0.0068e−/s0.0068e^-/s0.0068e−/s。βtot\beta_{tot}βtot的选择使直方图和理论曲线之间的均方差误差最小。由于集成时间只有50μs50\mu s50μs所以我们可以忽略暗电流。从而做出下图 在下图中我们用仿真数据做出不同强度读出噪声对弱光子图像成像影响的可视化图。我们模拟了三幅图像平均信号水平为每像素0.05e−0.05e^-0.05e−我么假定暗电流为0并且转化增益G1G1G1。第一张图的读出噪声δread0\delta_{read}0δread0它的唯一噪声来源为散粒噪声。第二张图中我们让读出噪声δread0.25\delta_{read}0.25δread0.25。这和第一张图像没有太大的差别。第三章图像中让读出噪声δread1.5\delta_{read}1.5δread1.5则图像的一些细节彻底被破坏了。 关于Remark 3.4这里推荐一个视频讲的很清楚视频链接
3.1.7 固定模式噪声
到目前为止我们已经研究了时间噪声源即他们会根据时间变化并且这些噪声在不同时间的实现是不一样的。也有一些别的噪声它们不随时间变化叫做固定模式噪声( fixed pattern noise,FPN)。最常见的两种固定模式噪声是光子相应不一致性(Photon Response Non-Uniformity,PRNU)和暗信号不一致性(Dark Signal Non-Uniformity,DSNU)。 PRNU是不同像素的光子检测效率η‾\overline{\eta}η和转化增益GGG之间的随机性。PRNU产生于制造过程中的随机性导致同一传感器像素之间的微小变化。因此当被一个均匀的光源照明时每个像素将有一个不同的平均电压读出。PRNU通常是光照的函数因此是在不同的光水平下计算的。PRNU会在低光照场景下占据主导地位。比如PRNU的范围可以从15000e−15000e^-15000e−信号时的0.10.1%0.1到10e−10e^-10e−时的66%6。DSNU是暗电流βd\beta_dβd中的一个类似的变化。DSNU不依赖于照明而是依赖于积分时间和工作温度。下图展示了PRNU和DSNU的事例直方图分布。
死像素
在图像传感器中有时像素停止响应我们称之为死像素。它们提供零或非常大的输出与照明无关。这些像素在某种意义上是PRNU的特殊情况这些图像的乘因子仅为零或一个巨大的常数。
3.1.8 ADC模数转换
对ADC建模 其中⌊⋅⌉\lfloor\cdot\rceil⌊⋅⌉是取整函数O是加到信号上的偏移量以便我们可以访问负信号值LADCL_{ADC}LADC是ADC可以计数的最大整数。L取决于ADC所使用的位深度。例如如果我们使用一个10位的ADCL210−11023L 2^{10}−1 1023L210−11023。图像传感器的位深度影响相机运行的速度因为数据读出传感器的比特率是相机速度的瓶颈。因此不同的相机和成像技术使用不同的位深度。
满阱容量
满阱容量是像素的性质并且应该放在在光生电子后介绍。ADC的位数也会影响图像传感器的满阱容量。 通常在一个像素中只有有限数量的电子可以被激发这限制了像素中可以积累的电荷总量所以积累的电荷会遵循阈值泊松分布而不是(3.47)中的传统泊松分布。积累的电荷总量不能超过满阱容量对于一个满阱容量为LfwL_{fw}Lfw的像素积累在像素中的总电荷数服从下面的分布 满阱容量LfwL_{fw}Lfw依赖于像素的尺寸。更大的像素通常会有更高的满阱容量反之亦然。下图展示了这种相关性。 在较高ISO 的情况下通常像素本身的满阱容量不会影响可读取的最大光生电子数而是ADC能够读取的最大电子数决定了满阱容量。由于增益因子GGG在高ISO下是一个很大的数字因此在数字数据中可以读出的最大光生电子数量变得有限。在这种情况下满阱容量最终为LADC/GL_{ADC}/GLADC/G。单位bit的QIS通常只有一个电子的满阱容量。 注这段文字解释了相机中的高 ISO 设置如何影响图像传感器的满阱容量 (FWC)。 FWC 是像素在饱和前可以容纳的最大电荷量。 在高 ISO 下FWC 由模数转换器 (ADC) 决定它将每个像素的模拟信号转换为数字值。 ADC 可输出的数字数字 (DN) 范围有限该范围除以增益系数 G 以放大高 ISO 下的信号。 这意味着在高 ISO 下每个 DN 可以表示更少的光电子光子撞击像素产生的电荷单位因此 FWC 降低。
3.1.9 其他来源的噪声只介绍本文不涉及
衍射极限
衍射是光通过孔径时弯曲的物理现象。下图展示了显示了当激光发出的红光通过另一个平板上的一个小孔时在平板上看到的衍射图案。当通过一个圆形孔径时衍射图案也是圆形的因此被称为艾里斑。艾里斑的大小取决于光的波长和孔径的大小。孔径越小艾里斑的尺寸就越大。艾里斑的直径可以这样计算 x≈2.44λfd(3.54)x\approx2.44\lambda\frac{f}{d}\tag{3.54} x≈2.44λdf(3.54) 这里fd\frac{f}{d}df是镜头的光圈比镜头焦距和光圈直径的比值λ\lambdaλ是波长。假设采用f8\frac{f}{8}8f设定使用波长为550nm550nm550nm的绿光进行成像则艾里斑的直径约为10μm10\mu m10μm。因此如果像素间距小于10μm10\mu m10μm则会由于捕捉图像中的衍射而出现模糊这一点我们可能需要在后续处理中进行处理。如果像素间的间距小于艾里斑的25%则这两点会变得不可分辨即像素间距小于2.5μm2.5\mu m2.5μm不会增加任何分辨率增益。我们可以使用更大的光圈孔径来使得艾里斑变小。然而这样会引起失焦模糊——光圈越大景深越小失焦模糊的半径就会越大。
串扰
串扰是指一个本应该入射到一个特定像素上的光子最终在一个邻近像素中产生一个光电子的过程。可能发生两种不同的过程。 1.入射到特定像素上的光子可能最终出现在邻近的像素上。这叫做光学串扰。最近的创新如背面照明传感器BSI和微透镜已经在很大程度上减轻了这种类型的串扰。然而当像素小于衍射极限时光学串扰变得不可避免。2.在一个像素中产生的电荷可能会扩散到邻近的一个像素中这种类型的串扰只能通过精密的图像传感器硬件设计解决。下图展示了这两种串扰。 串扰导致捕获的图像由于引入的模糊而失去分辨率它也减少了每个像素的颜色信号导致了颜色通道之间更多的重叠。串扰使颜色重建复杂化使恢复的图像在颜色上褪色这需要在图像信号处理管道中处理。
3.2 模拟一个相机
我们已经研究了图像传感器中不同的不同噪声源以及如何建模。现在让我们把它们放在一起模拟一个相机成像模型。下图显示了我们到目前为止所看到的所有不同噪声源的紧凑版本。 这部分的代码暂时略过。
3.3 模拟相机的性能
到目前为止我们一直在研究如何建模任何照相机。现在让我们来看看我们如何分析一个相机的性能。例如假设我们有两个摄像头。 1.一种传统的具有14位ADC的CMOS图像传感器。 2.一个具有1位ADC的量子图像传感器QIS。当然传感器之间有更多的差异比如满级容量和帧率。我们必须决定这两个传感器中哪一个更适合我们的应用。为了能够决定这一点我们需要量化这两个相机的性能。信噪比SNR是我们可以用来量化这种性能的一个度量指标。本章的其余部分是关于理解信噪比和推导的数学表达式我们可以用来量化一个相机的性能。
3.3.1 信噪比SNR
信噪比是信号功率与噪声功率的比值 SNRsignalpowernoisepowerSNR\frac{signal\quad power}{noise\quad power} SNRnoisepowersignalpower 有时会会写成log的形式10log10SNR10\log_{10}SNR10log10SNR。对于数字图像传感器由于测量的像素值是电压值的模数转换一个更常见的定义形式是测量均值和标准差的比 SNRoutE[Y]Var[Y](3.57)SNR_{out}\frac{E[Y]}{\sqrt{Var[Y]}}\tag{3.57} SNRoutVar[Y]E[Y](3.57) 这里YYY是表示传感器测量值的随机变量E[⋅]E[\cdot]E[⋅]是数学期望Var[⋅]Var[\cdot]Var[⋅]表示方差。这种表示的SNR通常叫做output-referred SNR因为它直接测量了传感器的输出。 输出参考的信噪比便于计算。在最直接的设置下我们可以访问传感器的模拟数据并且传感器的输出主要受散粒噪声和读出噪声的影响YYY将遵循泊松-高斯分布 这里β\betaβ表示表面积和曝光时间上积分的总通量σread\sigma_{read}σread是读出噪声的标准差。假设满阱容量无穷大因此测量值YYY永远不会饱和则YYY的期望为β\betaβ方差Var[Y]βσread2Var[Y]\beta\sigma_{read}^2Var[Y]βσread2。从而SNRoutSNR_{out}SNRout可以表达为 SNRout(β)ββσread2SNR_{out}(\beta)\frac{\beta}{\beta\sigma_{read}^2} SNRout(β)βσread2β 如果忽略读出噪声即σread0\sigma_{read}0σread0我们可以得到一个更简单的表达SNRout(β)βSNR_{out}(\beta)\sqrt{\beta}SNRout(β)β。这个被广泛采用的方程式表明随着场景变得更亮信号中的增益将会覆盖噪声的随机波动因此信噪比将会增加。
output-referred SNR的不足
问题的原因是传感器的满阱容量并不是无限的。当然式3.57中SNRout(β)SNR_{out}(\beta)SNRout(β)的表达在曝光β\betaβ小于满阱容量时仍然是有效的。然而如果β\betaβ到达了满阱容量甚至超过了满阱容量这意味着E[Y]E[Y]E[Y]将停止和β\betaβ一起增长如下图所示 方差Var[Y]Var[Y]Var[Y]会逐渐降到0因为YYY不可以超过满阱容量。结果根据式3.57SNRoutSNR_{out}SNRout会变成无穷。然而这不可能成立因为超过饱和的信噪比一定很差。
SNRoutSNR_{out}SNRout趋于无穷大是由于SNRoutSNR_{out}SNRout无法捕获接近和超过满阱容量的行为。这里的普遍采取的方式是通过设置一个零信噪比来创建一个特殊的情况 式中LLL为满阱容量。式3.59中的定义对于满阱容量足够大的图像传感器就足够了。更重要的是它便于信号处理。在饱和之前信噪比呈线性增长在对数-对数图中。之后信噪比为零。
然而这些年图像传感器的像素尺寸在急剧减小。其对应的满阱容量也越来越小。举例来说一个单位bit的QIS若它的阈值为qqq个光子则测量YYY变成了二元随机变量 对于更加普遍的lll位数字图像传感器若其满阱容量为L2l−1L2^l-1L2l−1则其测量变成了 这里X∼Poission(β)Gaussian(0,σ2)X\sim Poission(\beta)Gaussian(0,\sigma^2)X∼Poission(β)Gaussian(0,σ2)是ADC前实际的电压。对于这些小的像素非线性会缺失因此式(3.59)会无效。
Exposure-referred SNR
当满阱容量LLL很小时SNR的推导很困难2013年Fossum提出了exposure-referred SNR SNRexp(β)βVar[Y]⋅dμdβ(3.62)SNR_{exp}(\beta)\frac{\beta}{\sqrt{Var[Y]}}\cdot\frac{d\mu}{d\beta}\tag{3.62} SNRexp(β)Var[Y]β⋅dβdμ(3.62) 其中μE[Y]\muE[Y]μE[Y] Elgendy和Chan 在论文的补充报告中记录了暴露参考信噪比的直觉。他们认为导数的dβ/dμd\beta/d\mudβ/dμ可以被认为是一个黑盒系统的“传递函数”这里不是很理解传递函数不应该是dμ/dβd\mu/d\betadμ/dβ么该系统获取输出的μ\muμ并将其映射回输入的μ\muμ。因此dβ/dμd\beta/d\mudβ/dμ是这样一个传递函数的增益该传递函数将噪声从Var[Y]\sqrt{Var[Y]}Var[Y]扩展到Var[Y]dβdµ\sqrt{Var[Y]\frac{dβ}{dµ}}Var[Y]dµdβ。它还解释说如果β\betaβ超过了满阱容量LLL衍生物dµ/dβ将变为零因为β/\beta/β/的任何变化都将不再影响μ\muμ。因此信噪比趋于无穷大的问题得到了解决因为当一个像素饱和时dμ/dβd\mu/d\betadμ/dβ为0因此信噪比将趋于零。 上述的直觉当然并不严格。在本节中我们将尝试通过回答四个问题来填补这一理论空白
i定义信噪比的正确方法是什么以及如何从从理论上推导出SNRexp(β)SNR_{exp}(\beta)SNRexp(β) iiSNRout(β)SNR_{out}(\beta)SNRout(β)和SNRexp(β)SNR_{exp}(\beta)SNRexp(β)之间的关系是什么在什么情况下前者会成为后者的特殊情况 iii对于没有封闭形式表达式的复杂噪声模型如何通过蒙特卡罗采样技术来数值预测信噪比ivSNRexp(β)SNR_{exp}(\beta)SNRexp(β)可以提供哪些工具来提高传感器的成像能力
3.3.2 一些数学基础
截断泊松函数和不完全伽马函数
设X∼Poisson(β)X\sim Poisson(\beta)X∼Poisson(β)是一个泊松随机变量其参数β\betaβ表示在传感器面积和曝光时间上的总曝光积分。期受限于有限的满阱容量为LLL超过LLLXXX就会处于饱和状态。根据式3.61可以定义一个截断泊松变量YYY的概率质量函数为 通过构造随机变量YYY永远不会取大于LLL的值。YLY LYL的概率由泊松尾之和给出可以通过不完全伽马函数方便地表示如下图所示。 不完全伽马函数定义 ΨL(β)\Psi_L(\beta)ΨL(β)的一阶微分为 这意味着对于β\betaβ而言ΨL(β)\Psi_L(\beta)ΨL(β)是严格单调递减的。通过曲率分析可以确定最陡的斜率 令上式为0可以得到β∗L−1\beta^*L-1β∗L−1。在这个临界点假设L1L1L1则根据Stirling公式可以得到 因此ΨL′(β∗)−12π(L−1)\Psi_L(\beta^*)-\frac{1}{\sqrt {2\pi(L-1)}}ΨL′(β∗)−2π(L−1)1。不完全伽马函数的斜率随着LLL的增加而减小。
delta方法
当一个随机变量经历一个非线性变换时它近似于方差。 证明 考虑泰勒展开 f(X)≈f(μ)f′(μ)(X−μ)f(X)\approx f(\mu)f(\mu)(X-\mu) f(X)≈f(μ)f′(μ)(X−μ) 则(f(X)−f(μ))(f(X)-f(\mu))(f(X)−f(μ))的期望为 E[(f(X)−f(μ))2]E(f′(μ)2(X−μ)2)[f′(μ)]2Var[X]E[(f(X)-f(\mu))^2]E(f(\mu)^2(X-\mu)^2)[f(\mu)]^2Var[X] E[(f(X)−f(μ))2]E(f′(μ)2(X−μ)2)[f′(μ)]2Var[X]
这种近似的有效性取决于二阶项当随机变量XXX足够接近μ\muμ时可以假设二阶项很小。这样做的一种方式是设随机变量XXX是NNN个随机变量的样本均值这样有X(1/N)∑n1NYnX(1/N)\sum_{n1}^NY_nX(1/N)∑n1NYn对于全部的nnn有E[Yn]μE[Y_n]\muE[Yn]μ。对于足够大的NNNXXX会集中在μ\muμ附近此时delta方式是有效的。
3.3.3 SNR统计定义
平均不变性
当定义SNR时定义信号的信息处理过程是很重要的。在大部分的图像处理问题中潜在的信号是场景的曝光度β\betaβ。观测是从以β\betaβ为参数的某种分布pY(y;β)p_Y(y;\beta)pY(y;β)中获得的随机样本。举例来说如果Y∼Possion(β)Y\sim Possion(\beta)Y∼Possion(β)那么其对应的分布为pY(y;β)βye−β/y!p_Y(y;\beta)\beta^ye^{-\beta}/y!pY(y;β)βye−β/y!。
从YYY中重建信号β\betaβ通常是基于估计器β^(⋅)\hat{\beta}(\cdot)β^(⋅)一个估计器可以将YYY映射到估计β^(Y)\hat{\beta}(Y)β^(Y)。估计器β^(⋅)\hat{\beta}(\cdot)β^(⋅)可以是最大似然估计器最大后验估计器或者其他映射。对于SNR来说技术需求要求估计器满足平均不变性。 这里可能会混淆平均不变性和无偏估计。一个估计器β^(Y)\hat{\beta}(Y)β^(Y)是无偏的如果E[β^(Y)]βE[\hat{\beta}(Y)]\betaE[β^(Y)]β。而平均不变性则要求β^(E(Y))β\hat{\beta}(E(Y))\betaβ^(E(Y))β。满足前者的估计器未必满足后者满足后者的估计器未必满足前者当β^(⋅)\hat{\beta}(\cdot)β^(⋅)是线性时其满足两者。
下面两个例子展示了对于许多估计器它们就满足了平均不变性 如果估计器满足平均不变性并不难那么为什么还要引入这个概念呢从实际的角度来看测量YYY的分布可能带有一个复杂的表达式。因此构造一个估计器β^(Y)\hat{\beta}(Y)β^(Y)来最大化可能性并不总是容易的。另一方面确定平均E[Y]E[Y]E[Y]要容易得多。即使不能解析地推导出E[Y]E[Y]E[Y]的表达式蒙特卡罗抽样也足以用数值上生成它。一旦均值E[Y]E[Y]E[Y]确定通过平均不变性就可以确定估计器β^(Y)\hat{\beta}(Y)β^(Y)令μ(β)E[Y]\mu(\beta)E[Y]μ(β)E[Y]然后可以写成 β^μ−1(3.69)\hat{\beta}\mu^{-1}\tag{3.69} β^μ−1(3.69) 回到Example3.1和Example3.2上面的论证提供了一个过程来构造一个将满足平均不变性原理的估计量。 平均不变性的优点是它绕过了求解优化的复杂性如最大似然。另一方面由于β^\hat{\beta}β^的构造方式它保证满足均值不变性。 基于到目前为止的分析似乎很自然地推测任何极大似然估计量都将满足平均不变性。也就是说β^ML(E(Y))β\hat{\beta}_{ML}(E(Y))\betaβ^ML(E(Y))β。证明或给出条件这个猜想将是有价值的。一个完全任意的估计量β^(⋅)\hat{\beta}(\cdot)β^(⋅)不适用于信噪比。例如β^(Y)0\hat{\beta}(Y)0β^(Y)0对于所有的YYY都是一个估计器但它是无用的。因此可以将均值不变性作为保证一个有意义的信噪比的充分条件。然而这是否是一个必要的条件是另一个有探索价值的开放性问题。
定义SNR
在描述清楚估计器假设后对SNR中噪声的讨论是很有必要的。首先估计器β^(Y)\hat{\beta}(Y)β^(Y)是随机的因为它是YYY的函数β^(Y)\hat{\beta}(Y)β^(Y)相对于真正的确定性参数β\betaβ是波动的。随机性定义了噪声它实际上是均方误差 noiseE[(β^(Y)−β)2](3.70)noiseE[(\hat{\beta}(Y)-\beta)^2]\tag{3.70} noiseE[(β^(Y)−β)2](3.70) 接下来定义SNR 为了让读者相信信噪比的正式定义是有效的请考虑下面的两个例子
Exposure-referred SNR
现在要问的一个很自然的问题是SNR(β)SNR(\beta)SNR(β)与SNRexp(β)SNR_{exp}(\beta)SNRexp(β)和SNRout(β)SNR_{out}(\beta)SNRout(β)相比如何。结果表明如果使用delta方法进行近似SNR(β)SNR(\beta)SNR(β)与SNRexp(β)SNR_{exp}(\beta)SNRexp(β)相同。这样我们就可以解释式3.62中的“神奇”导数dμ/dβd\mu/d\betadμ/dβ从何而来。 证明 根据delta方法均方误差可以近似为 E[(β^(Y)−β)2]E[(β^(Y)−β^(μ))2]≈[β^(μ)]2Var[Y]E[(\hat{\beta}(Y)-\beta)^2]E[(\hat{\beta}(Y)-\hat{\beta}(\mu))^2]\approx [\hat{\beta}(\mu)]^2Var[Y] E[(β^(Y)−β)2]E[(β^(Y)−β^(μ))2]≈[β^(μ)]2Var[Y] 由于β^(μ)β\hat{\beta}(\mu)\betaβ^(μ)β所以dβ^(μ)dμdβdμ\frac{d\hat{\beta}(\mu)}{d\mu}\frac{d\beta}{d\mu}dμdβ^(μ)dμdβ进一步可得 E[(β^(Y)−β)2][dβdμ]2Var[Y]E[(\hat{\beta}(Y)-\beta)^2] [\frac{d\beta}{d\mu}]^2Var[Y] E[(β^(Y)−β)2][dμdβ]2Var[Y]由于dβdμ1/dμdβ\frac{d\beta}{d\mu}1/\frac{d\mu}{d\beta}dμdβ1/dβdμ所以SNR可以写成 SNR(β)βE[(β^(Y)−β)2]βVar[Y]⋅dμdβSNRexp(β)SNR(\beta)\frac{\beta}{\sqrt{E[(\hat{\beta}(Y)-\beta)^2]}}\frac{\beta}{\sqrt{Var[Y]}}\cdot\frac{d\mu}{d\beta}SNR_{exp}(\beta) SNR(β)E[(β^(Y)−β)2]βVar[Y]β⋅dβdμSNRexp(β) 下面证明第二个关系
使用单位bitQIS阐释信噪比
设X∼Poisson(β)X\sim Poisson(\beta)X∼Poisson(β)YYY为服从式3.60的随机变量。 首先考虑q1q1q1由于Y∼Bernoulli(1−e−β)Y\sim Bernoulli(1-e^{-\beta})Y∼Bernoulli(1−e−β)它的均值E[Y]1−e−βE[Y]1-e^{-\beta}E[Y]1−e−β记μE[Y]1−e−β\muE[Y]1-e^{-\beta}μE[Y]1−e−β。如Example 3.1所示关于β\betaβ的虽大似然估计β^(Y)−log(1−Y)\hat{\beta}(Y)-\log(1-Y)β^(Y)−log(1−Y)它满足均值不变性导数dμ/dβd\mu/d\betadμ/dβ为 dμdβddβ[1−e−β]e−β\frac{d\mu}{d\beta}\frac{d}{d\beta}[1-e^{-\beta}]e^{-\beta} dβdμdβd[1−e−β]e−β 将其带入到Theorem 3.3.1中可以的 对于q 1的情况可以利用不完全伽马函数来表示截断泊松随机变量 pY(y;β){1−Ψq(β),y1Ψq(β)∑l0q−1βle−βl!,y0p_Y(y;\beta)\left\{ \begin{array}{ll} 1-\Psi_q(\beta),\quad y1\\ \Psi_q(\beta)\sum^{q-1}_{l0}\frac{\beta^le^{-\beta}}{l!},\quad y0 \end{array} \right. pY(y;β){1−Ψq(β),y1Ψq(β)∑l0q−1l!βle−β,y0 上式的期望E[Y]1−Ψq(β)E[Y]1-\Psi_q(\beta)E[Y]1−Ψq(β)选择估计器使得β^(Y)−Ψq−1(1−Y)\hat{\beta}(Y)-\Psi_q^{-1}(1-Y)β^(Y)−Ψq−1(1−Y)。这样平均一致性可以被证实导数dμ/dβd\mu/d\betadμ/dβ为Ψq(β)\Psi_q(\beta)Ψq(β)的定义参照Definition 3.3.1 因此SNR为 SNRout(β)SNR_{out}(\beta)SNRout(β)根据定义可以求得 SNR(β)(SNRexp(β))SNR(\beta)(SNR_{exp}(\beta))SNR(β)(SNRexp(β))和SNRout(β)SNR_{out}(\beta)SNRout(β)的可视化结果如下图所示 SNRout(β)SNR_{out}(\beta)SNRout(β)随着β\betaβ的增长而无限增长这是错误的因为当β\betaβ增长超过阈值qqq时测量值YYY将更有可能保持在Y1Y 1Y1。信号会下降因此最终的信噪比应该会降到零。
3.3.4 有限满阱容量下的SNRexp(β)SNR_{exp}(\beta)SNRexp(β)
截断泊松分布下的SNRexp(β)SNR_{exp}(\beta)SNRexp(β) 证明 YYY的概率密度函数为 从而YYY的均值为 标红处应该为βk\beta^kβk。 进一步得到导数dμ/dβd\mu/d\betadμ/dβ 对于方差由于Var[Y]E[Y2]−μ2Var[Y]E[Y^2]-\mu^2Var[Y]E[Y2]−μ2还需要确定E[Y2]E[Y^2]E[Y2]
下图显示了不同满阱容量LLL下的评估结果。与单位bitQIS的例子一致截断泊松分布变量的exposure-referred SNR随着像素饱和下降。 更有趣的是随着L的增加SNRexp(β)SNR_{exp}(\beta)SNRexp(β)在log-log图中变成了一条直线在饱和后会急剧衰减。这让人想起了式3.59中的SNRexp(β)SNR_{exp}(\beta)SNRexp(β)的启发式定义。然而对于小的LLL光滑过渡是式3.59没有预测到的。
饱和后的快速下降有两个原因。首先log-log图压缩xxx轴以便用β\betaβ放大斜率。如果以线性尺度而不是对数尺度绘制xxx轴急剧的截止将在一个更平滑的过渡中出现。然而在实践中曝光总是在对数尺度上显示出来。因此图3.21中所示的内容是有效的。饱和后下降的第二个原因是由于不完全伽马函数的极限行为。随着LLL的增加log-log图中的不完整伽马函数将会有一个越来越尖锐的瞬态如图3.19所示。
证明 因为Y(1/N)∑n1NYnY(1/N)\sum_{n1}^{N}Y_nY(1/N)∑n1NYnE[Y]E[Y1]E[Y]E[Y_1]E[Y]E[Y1]。所以dμ/dβd\mu/d\betadμ/dβ的值不变。对于方差可以很容易地证明Var[Y]Var[Y1]/NVar[Y]Var[Y_1]/NVar[Y]Var[Y1]/N。将其带入到式3.76中可以得到
限制情况
图3.21展示了随着满阱容量LLL增加SNRexp(β)SNR_{exp}(\beta)SNRexp(β)在log-log图中越来越线性。这种行为可以通过分析不完全伽马函数的极限情况从理论上推导出。 图3.19中不完整的伽马函数是一个在LLL处过渡的单调递减函数。假设过渡态的宽度是δ\deltaδ然后存在一个区间β∣L−δ/2≤β≤Lδ/2{β | L−δ/2≤β≤L δ/2}β∣L−δ/2≤β≤Lδ/2这样的下限和上限是 这里近似“≈”可以基于置信度定义例如99%的置信度。在这两种极限情况下可以相应地推导出exposure-referred SNR。 证明 当LLL足够大的时候ΨL(β)\Psi_L(\beta)ΨL(β)和ΨL−1(β)\Psi_{L-1}(\beta)ΨL−1(β)足够接近因而可以被认为近似相等。记Ψ(β)\Psi(\beta)Ψ(β)的值为Ψ\PsiΨ。由式3.79可知当β≥Lδ/2\beta\geq L\delta/2β≥Lδ/2时Ψ→0\Psi\rightarrow 0Ψ→0当β≤L−δ/2\beta\leq L-\delta/2β≤L−δ/2时Ψ→1\Psi\rightarrow 1Ψ→1。在这两种情况下由于Ψ\PsiΨ都是常数所以ΨL′(β)0\Psi_L(\beta)0ΨL′(β)0。
当β≤L−δ/2\beta\leq L-\delta/2β≤L−δ/2时 此时的SNR为 注μ,Var[Y],dμdβ\mu,Var[Y],\frac{d\mu}{d\beta}μ,Var[Y],dβdμ的定义参考式3.77。
当β≥Lδ/2\beta\geq L\delta/2β≥Lδ/2时 由于Ψ→0\Psi\rightarrow 0Ψ→0进一步可得 结合两种情况的证明Corollary 3.2得证。
该推论表明随着LLL的增加在对数-对数图中绘制SNRexp(β)SNR_{exp}(β)SNRexp(β)将给出一个线性响应然后出现一个突变。这正是在方程3.59中所示的output-referred SNR中发生的情况。因此Theorem 3.3.2是一个广泛定义的output-referred SNR。
截断泊松-高斯分布对应的SNRexp(β)SNR_{exp}(β)SNRexp(β)
我们找到了截断泊松的SNR表达式。让我们通过添加读出噪声和量化式3.52来使情况更现实一点。我们假设转换增益G1G 1G1和偏移量O0O 0O0。在这种情况下观测值ZZZ可以写成 这里证明略去可以看Appendix B获得详细证明。
3.3.5 蒙特卡罗仿真
我们可以看到当我们使噪声模型真实时SNR的表达式开始变得混乱。随着我们使模型更加现实解析表达式将明显更具挑战性。一种更合理的方法是采用数值格式来估计近似的SNR。
主要原则
为了计算任何给定分布的SNRexp(β)SNR_{exp}(\beta)SNRexp(β)更可行的方法是对由正向模型定义的分布进行抽样 Ymforwardmodel(β∣βdark,σread,L)(3.86)Y_mforward model(\beta|\beta_{dark},\sigma_{read},L)\tag{3.86} Ymforwardmodel(β∣βdark,σread,L)(3.86) 这里m1,...,Mm1,...,Mm1,...,MMMM表示用来计算SNR的蒙特卡罗采样数量。式3.86表示从任意前向模型中提取的第mmm个样本YmY_mYm。样本YmY_mYm是信号β\betaβ以及其他参数的函数。当进行蒙特卡罗仿真时对于任意的β\betaβ一系列的{Y1,...,Ym}\{Y_1,...,Y_m\}{Y1,...,Ym}会被用来计算均值和方差。 具体来说样本均值是对E[Y]E[Y]E[Y]的估计样本方差是对Var[Y]Var[Y]Var[Y]的估计 一旦针对每个β\betaβ的μ^(β)\hat{\mu}(\beta)μ^(β)被确认导数dμ/dβd\mu/d\betadμ/dβ就可以被近似出来 进一步可以近似出SNRexp(β)SNR_{exp}(\beta)SNRexp(β)
Matlab代码
这部分暂时略过
可视化βdark\beta_{dark}βdark和σread\sigma_{read}σread的影响 3.3.6 SNR的替代品
Entropy熵
如果YYY是二元的即pY(1)1−Ψq(β)p_Y(1)1-\Psi_q(\beta)pY(1)1−Ψq(β)pY(0)Ψq(β)p_Y(0)\Psi_q(\beta)pY(0)Ψq(β)那么熵为 熵关于Ψq(β)\Psi_q(\beta)Ψq(β)的导数为 令上式为0可以得到Ψq(β)12\Psi_q(\beta)\frac{1}{2}Ψq(β)21。因此当E[Y]1−Ψq(β)12E[Y]1-\Psi_q(\beta)\frac{1}{2}E[Y]1−Ψq(β)21时熵的值最大。这意味着当测量中5050%50为05050%50为1时熵的值最大。因此如果目标是识别一个阈值qqq从而使传感器的性能最大化那么替代的选择不是优化SNR而是优化熵。
误码率Bit Error Rate,BER
对于1位量子图像传感器误码率测量了做出错误决策的概率即将0声明为1或将1声明为0。它可以计算为 如果q1/2q1/2q1/2误码率可以简化为 它并不依赖于βββ。如果BER(β)BER(β)BER(β)可以通过经验测量那么通过反演方程3.90就可以估计读取噪声σreadσ_readσread。对于一个固定的β我们也可以通过找到一个合适的qqq来优化公式3.89。