
1. 项目概述当光谱成像遇见压缩感知在环境监测、工业安全和科学研究领域气体检测一直是个核心课题。传统的气体检测方法比如傅里叶变换红外光谱仪虽然精度高但设备往往笨重、昂贵对环境振动敏感而且需要逐点扫描获取一张完整的光谱图像耗时很长。这就像用一台巨大的天文望远镜去观察家门口的树——能力是过剩的但用起来实在不方便。尤其是在需要大范围、实时监测气体泄漏或污染物扩散的场合比如化工厂周边、城市空气质量网格化监测传统设备的短板就更加明显。中波红外波段是解决这个问题的“黄金窗口”。许多我们关心的气体比如二氧化碳、二氧化硫、一氧化碳、氮氧化物它们的分子在这个波段有非常独特且强烈的振动吸收特征就像人的指纹一样被称为“指纹光谱”。如果能快速、准确地获取目标区域的中波红外光谱图像我们就能不仅“看到”气体的分布还能“认出”它是谁甚至“算出”它有多少。然而理想很丰满现实却很骨感。获取高光谱图像本质上是获取一个三维数据立方体二维的空间信息加上一维的光谱信息。按照传统思路这需要庞大的分光系统和精密的机械扫描机构导致系统复杂、成本高昂。压缩感知理论的出现为打破这个僵局提供了全新的思路。它的核心思想颠覆了传统的“先大量采样后压缩”的模式而是“边采样边压缩”。简单来说如果信号本身是稀疏的即可以用少数几个基向量的组合来近似表示那么我们就有可能用远低于传统采样定理要求的测量次数完美地重建出原始信号。将压缩感知应用于光谱成像就催生了计算光谱成像这一前沿方向。其基本流程是首先通过一组精心设计的光学滤波器比如文中提到的宽带薄膜滤波器阵列对入射的光谱信息进行编码和压缩只采集少数几个通道的混合光强图像然后利用已知的滤波器透过率曲线测量矩阵和信号在某个“字典”下的稀疏性先验通过数学算法从这些压缩的测量值中反推出完整的光谱数据立方体。这就像你只听了交响乐中几个关键乐器的混合声音但凭借对乐谱字典和乐器声音特点稀疏性的了解就能在脑海中重建出整个乐团的演奏。本文介绍的工作正是这一思路在中波红外气体检测领域的一次深入实践。我们提出并验证了一套完整的基于字典学习与稀疏重建的中波红外计算光谱成像技术方案。这套方案的核心优势在于它巧妙地平衡了“轻量化硬件”与“高精度算法”之间的矛盾。我们不再追求复杂的光学系统而是转向设计简单的宽带滤波器阵列和强大的后端重建算法。其中字典学习负责从数据中自动学习最能代表目标光谱特征的“基元”字典原子而稀疏重建算法则负责用最少的基元来拟合观测到的压缩信号。特别地针对中波红外气体光谱尖锐吸收峰的特点我们设计了一种分阶段字典构建策略有效提升了算法对这类特征的刻画能力。2. 核心原理拆解从物理编码到数学重建要理解这套技术我们需要深入两个层面一是物理层面光信号是如何被压缩测量的二是数学层面压缩的信号是如何被重建出来的。这两个层面通过“测量矩阵”紧密耦合。2.1 物理编码模型滤波器阵列如何工作想象一下我们在相机传感器焦平面阵列的每个像素前放置一个微小的、透过率曲线不同的滤波器。这些滤波器排列成一个马赛克图案这就是多光谱滤波器阵列。场景中某一点的光谱信号 $H(\lambda)$在到达传感器像素时会先经过其正上方的那个滤波器。这个滤波器就像一个“加权筛子”对不同波长的光有不同的透过率 $R_i(\lambda)$。最终这个像素记录下的强度值 $I_i$是光谱 $H(\lambda)$ 与滤波器响应 $R_i(\lambda)$ 在整个波段上的积分结果再加上系统噪声 $e_i$。用公式表示就是 $$I_i \int_{\lambda_{min}}^{\lambda_{max}} H(\lambda) R_i(\lambda) d\lambda e_i$$如果我们有 $M$ 种不同的滤波器对整个场景成像后我们就能得到 $M$ 张二维强度图像。每一张图像都包含了所有空间点的、但经过特定滤波器调制后的混合光谱信息。将上述公式离散化并忽略噪声可以写成简洁的矩阵形式 $$\mathbf{I} \mathbf{R} \cdot \mathbf{H}$$ 这里$\mathbf{I} \in \mathbb{R}^M$ 是由 $M$ 个测量值构成的向量对应 $M$ 张图像中同一个空间位置的像素值$\mathbf{H} \in \mathbb{R}^N$ 是我们想要求解的、具有 $N$ 个光谱通道的原始光谱向量而 $\mathbf{R} \in \mathbb{R}^{M \times N}$ 就是测量矩阵它的每一行代表一个滤波器在 $N$ 个波长通道上的光谱响应。问题的关键来了通常我们为了降低硬件复杂度和数据量会使用较少数量的滤波器类型即 $M \ll N$。例如文中使用9种滤波器来重建41个光谱通道。这使得方程 $\mathbf{I} \mathbf{R} \cdot \mathbf{H}$ 是一个严重的欠定方程有无穷多解。单靠这个方程我们无法确定唯一的 $\mathbf{H}$。2.2 数学重建基石信号的稀疏性与字典表示压缩感知之所以能解决这个欠定问题依赖于信号的一个关键特性稀疏性。稀疏性是指一个信号在某个合适的基或字典下展开时绝大部分系数为零或接近于零只有少数几个系数显著不为零。对于光谱信号 $\mathbf{H}$我们假设存在一个字典 $\mathbf{D} \in \mathbb{R}^{N \times P}$其列向量称为字典原子使得 $\mathbf{H}$ 可以近似表示为字典中原子的线性组合且组合系数向量 $\mathbf{s} \in \mathbb{R}^P$ 是稀疏的即只有 $k$ 个非零元素$k \ll P$。用公式表示就是 $$\mathbf{H} \approx \mathbf{D} \cdot \mathbf{s}, \quad \text{满足} \ |\mathbf{s}|_0 \leq k$$ 这里 $|\cdot|_0$ 表示 $L_0$ 范数即非零元素的个数。将稀疏表示代入测量方程 $$\mathbf{I} \mathbf{R} \cdot \mathbf{H} \approx \mathbf{R} \cdot \mathbf{D} \cdot \mathbf{s} \mathbf{\Phi} \cdot \mathbf{s}$$ 其中$\mathbf{\Phi} \mathbf{R} \cdot \mathbf{D} \in \mathbb{R}^{M \times P}$ 被称为压缩感知矩阵或等效测量矩阵。现在我们的问题转变了从求解欠定的 $\mathbf{H}$转变为在稀疏约束下求解 $\mathbf{s}$。即寻找一个最稀疏的系数向量 $\mathbf{s}$使得 $\mathbf{\Phi} \cdot \mathbf{s}$ 尽可能接近观测值 $\mathbf{I}$。数学上表示为 $$\min_{\mathbf{s}} |\mathbf{I} - \mathbf{\Phi} \cdot \mathbf{s}|_2^2 \quad \text{subject to} \quad |\mathbf{s}|_0 \leq k$$ 这是一个组合优化问题直接求解是NP难的。但有一大类贪婪算法或凸优化算法可以高效地求得近似解例如本文采用的正交匹配追踪算法。注意这里存在一个“三角关系”测量矩阵 $\mathbf{R}$ 由硬件滤波器决定字典 $\mathbf{D}$ 由算法和数据决定而最终的重建精度和效率取决于它们共同构成的压缩感知矩阵 $\mathbf{\Phi}$ 的性质。一个好的 $\mathbf{\Phi}$ 需要满足有限等距性质等条件以确保稀疏解的唯一性和稳定性。因此硬件设计和字典设计必须协同优化。2.3 算法核心分阶段字典学习与OMP重建本文方法的创新点之一在于字典的构建策略。通用的字典如离散余弦变换基、小波基可能无法高效表示中波红外气体光谱这种具有尖锐吸收峰的特异性信号。因此我们采用数据驱动的字典学习方法来构建专用字典。第一阶段基础字典学习我们从公开的大规模可见光平滑光谱数据集如ARAD-1K中随机抽取数万条光谱作为训练集。目标是学习一个字典 $\mathbf{D}0$使得这些训练光谱 $\mathbf{Y}$ 能够被字典稀疏地表示。这通过求解以下优化问题实现 $$\min{\mathbf{C}, \mathbf{D}_0} |\mathbf{Y} - \mathbf{C} \cdot \mathbf{D}_0|_F^2 \lambda |\mathbf{C}|_1$$ 其中 $\mathbf{C}$ 是稀疏系数矩阵$|\cdot|_F$ 是Frobenius范数$|\cdot|_1$ 是 $L_1$ 范数用于促进稀疏性$\lambda$ 是正则化参数。通过交替优化 $\mathbf{C}$ 和 $\mathbf{D}_0$我们可以得到一个擅长表示平滑光谱背景的初始字典。这个字典是后续增强的基础。第二阶段中波红外特征增强初始字典 $\mathbf{D}_0$ 源于可见光波段缺乏对中波红外特征特别是气体尖锐吸收峰的刻画能力。为此我们设计了一个分阶段增强策略构建 Dictionary-V1在 $\mathbf{D}_0$ 的基础上直接加入四种典型气体CO2, SO2, CO, NO在目标波段的透过率曲线作为新的字典原子。这样字典就显式地包含了目标气体的“指纹”特征。构建 Dictionary-V2在 Dictionary-V1 的基础上进一步加入一个温度范围如353K-553K内的黑体辐射光谱曲线。这是因为在实际气体检测中目标光谱是气体吸收特征与背景黑体辐射光谱的乘积。加入黑体辐射原子有助于字典同时建模背景辐射和气体吸收的耦合效应。这种分阶段构建的字典兼具了对平滑背景的回归能力和对尖锐吸收特征的刻画能力为高精度重建奠定了基础。重建过程正交匹配追踪有了测量矩阵 $\mathbf{R}$ 和增强后的字典 $\mathbf{D}$我们就得到了压缩感知矩阵 $\mathbf{\Phi}$。对于每一个空间像素点的压缩测量向量 $\mathbf{I}$我们使用正交匹配追踪算法来求解稀疏系数 $\mathbf{s}$。 OMP是一种贪婪迭代算法其步骤如下初始化残差 $\mathbf{r}_0 \mathbf{I}$支持集 $\Lambda_0 \emptyset$迭代次数 $t1$。匹配找到与当前残差 $\mathbf{r}{t-1}$ 最相关的字典原子即 $\mathbf{\Phi}$ 的列的索引 $\lambda_t \arg \max_j |\langle \mathbf{r}{t-1}, \phi_j \rangle|$。更新支持集$\Lambda_t \Lambda_{t-1} \cup {\lambda_t}$。求解最小二乘利用支持集 $\Lambda_t$ 对应的列构造矩阵 $\mathbf{\Phi}{\Lambda_t}$求解 $\mathbf{s}t \arg \min{\mathbf{s}} |\mathbf{I} - \mathbf{\Phi}{\Lambda_t} \mathbf{s}|_2^2$。更新残差$\mathbf{r}t \mathbf{I} - \mathbf{\Phi}{\Lambda_t} \mathbf{s}_t$。判断终止如果 $t k$达到预设的稀疏度或残差足够小则停止否则 $t t1$返回步骤2。最终重建的光谱为 $\mathbf{\hat{H}} \mathbf{D} \cdot \mathbf{s}_k$。OMP算法计算效率高对噪声有一定鲁棒性非常适合嵌入式或实时性要求较高的应用场景。3. 硬件与参数协同设计寻找最优平衡点计算光谱成像是一个典型的“软硬结合”系统。算法性能的上限很大程度上由硬件编码器的设计决定。本文的核心硬件是宽带光学薄膜滤波器。它的设计参数直接决定了测量矩阵 $\mathbf{R}$ 的质量进而影响整个重建过程。3.1 滤波器关键参数仿真分析我们通过大规模的仿真实验系统地探究了三个关键硬件参数对光谱重建性能的影响滤波器数量 $M$、薄膜层数以及单层厚度范围。评价指标是重建光谱与原始光谱之间的峰值信噪比。滤波器数量与薄膜层数仿真结果表明增加滤波器数量能显著提升重建精度。这直观易懂更多的测量值提供了更多关于原始信号的信息。然而薄膜层数的影响并非单调递增。当层数达到一定数量后例如8层再增加层数对性能提升微乎其微反而增加了制备复杂度和成本。这说明通过优化薄膜结构设计可以用相对简单的结构实现有效的编码。在我们的设计中最终选择了9种滤波器每种8层薄膜的配置在性能和复杂度之间取得了良好平衡。单层厚度范围薄膜每层的物理厚度是一个需要优化的随机变量均匀分布。仿真发现当最小厚度在100-250 nm最大厚度在600-700 nm范围内时重建性能最优。这个范围恰好落在常规红外光学镀膜工艺的可实现区间内为工程化提供了便利。实操心得在进行这类参数扫描仿真时一定要建立完整的正向成像模型和逆向重建流程。我们的做法是随机生成数万组符合厚度范围约束的滤波器透过率曲线对固定的测试光谱集进行重建统计平均PSNR。这个过程计算量巨大但能可靠地找到全局较优的参数区间避免了依靠经验或局部搜索可能陷入的次优解。3.2 字典规模与数据需求的权衡字典学习需要数据。但在中波红外领域尤其是针对特定气体的高光谱数据集非常稀缺。我们的另一个仿真分析了字典学习所需训练集大小对性能的影响。令人振奋的结果是即使在小样本场景下例如仅使用100-200条光谱进行训练算法也能保持良好的重建性能。当训练光谱数量增加到1000条以上时性能提升趋于平缓并保持在高位。这意味着我们的方法对训练数据的依赖程度较低这极大地增强了其在数据匮乏的实际气体检测场景中的实用性。这背后的原因是我们构建的字典原子164个数量远小于光谱的维度41通道。字典学习的过程本质上是学习一个低维流形在这个流形上光谱信号是稀疏的。只要训练样本能覆盖这个流形的主要变化模式学习到的字典就具有较好的泛化能力。中波红外气体光谱虽然形态特异但其变化模式相对于广阔的可见光谱而言是有限的因此不需要海量数据。4. 仿真验证与结果分析方法可行性的数字证明在确定了硬件参数和算法框架后我们通过严格的仿真来验证方法的有效性。测试集包含三类光谱黑体辐射光谱、非训练平滑光谱以及四种典型气体的吸收光谱。4.1 平滑光谱重建验证基础回归能力首先测试算法对平滑光谱的重建能力这是所有复杂光谱重建的基础。我们使用黑体辐射光谱353K-553K作为测试对象。结果使用最终增强的 Dictionary-V2 和其对应的最优滤波器组对黑体辐射光谱的重建取得了最佳效果。其重建PSNR最低值也超过了40 dB这意味着重建误差非常小。作为对比仅使用基础平滑字典 Dictionary-V0 时重建光谱会出现明显的锯齿状结构。这是因为 Dictionary-V0 缺乏对黑体辐射形状的先验知识在稀疏约束下难以同时保证信号的平滑性和拟合精度。分析这一结果清晰地证明了分阶段字典构建策略中“加入黑体辐射原子”的必要性。Dictionary-V2 通过显式引入背景辐射模型使法能更精准地分离和重建背景成分为后续叠加气体吸收特征打下了坚实基础。4.2 气体吸收光谱重建核心挑战的攻克气体吸收光谱的重建是本项目的核心目标也是最大挑战。气体吸收峰通常很尖锐半高宽在50-200 nm吸收深度大30%-100%这对字典的细节刻画能力提出了极高要求。结果对比我们对比了三个字典V0 V1 V2在重建 CO2 SO2 CO NO 吸收光谱时的表现。关键指标如下表所示字典版本最小 PSNR (dB)最大 RMSE最大 SAM (弧度)核心特点Dictionary-V0较低较高较大仅含平滑背景原子无法表征尖锐吸收峰。Dictionary-V1显著提升降低减小在V0基础上加入气体透过率曲线对吸收峰重建能力增强。Dictionary-V2最高最低最小在V1基础上加入黑体辐射原子能同时建模“背景辐射 x 气体吸收”性能最优。深入解读Dictionary-V0 的失败它本质上是一个“通用平滑光谱压缩器”其原子是平滑的。试图用平滑原子的线性组合去拟合一个具有尖锐凹陷的信号就像试图用一系列缓坡去拼出一个深坑必然会在坑的边缘产生振荡吉布斯现象导致吸收峰位置和深度严重失真。Dictionary-V1/V2 的成功V1 直接引入了气体吸收峰的形状作为原子。在重建时OMP算法可以主动选择这些“尖峰原子”从而精准地重建出吸收特征。V2 更进一步引入了黑体辐射原子使得字典能更自然地表达“温度-辐射-吸收”的耦合关系因此重建精度和稳定性最高。性能与效率的权衡Dictionary-V2 原子数最多重建耗时也最长单线程下约0.11秒/光谱。这是一个典型的权衡更高的精度需要更丰富的字典从而增加计算量。但在实际应用中通过多线程并行处理图像中所有像素的光谱这个时间开销是可以接受的。例如对于一幅320x256的图像10线程并行重建整个数据立方体仅需约3.3秒。避坑指南在仿真中我们发现滤波器组与字典必须联合优化。随机生成的滤波器组与一个优秀的字典搭配可能效果很差反之亦然。我们通过海量随机搜索10万组为每个字典找到了其“最佳搭档”滤波器组。这个步骤不可或缺它确保了硬件编码和软件解码之间的匹配达到最优是工程落地前必须完成的“调参”过程。5. 实验验证与系统搭建从仿真走向现实仿真的成功需要真实的实验来背书。由于直接将滤波器阵列集成到商用制冷型红外焦平面探测器上工艺复杂、成本高昂我们采用了一种顺序模拟快照的折中方案使用滤光轮依次切换9片制备好的宽带薄膜滤波器对静态目标成像以此来模拟快照成像时不同滤波器单元同时采集信息的过程。5.1 实验系统与流程实验装置主要包括中波红外黑体辐射源模拟高温背景、充满特定浓度气体的气室模拟目标气体、滤光轮、中波红外相机以及数据处理计算机。系统标定首先我们需要精确测量整个系统的光谱响应矩阵 $\mathbf{R}$。这通过在不同温度黑体辐射下测量每个滤波器的实际透过率曲线来完成。我们采用最小二乘法对每个像素进行响应标定以消除探测器非均匀性等影响。图像采集将黑体辐射源加热至目标温度如393K 453K 513K分别通入氮气作为参考和待测气体如CO2 SO2。对于每种状态旋转滤光轮依次采集9张对应不同滤波器的二维强度图像。光谱重建对于图像中的每一个像素提取其在不同滤波器图像中的强度值构成压缩测量向量 $\mathbf{I}$。使用标定好的 $\mathbf{R}$ 和预先训练好的 Dictionary-V2运行OMP算法重建出该像素点的41通道光谱曲线。结果分析将重建光谱与理论光谱根据HITRAN数据库计算的气体透过率曲线乘以黑体辐射谱进行对比计算PSNR RMSE SAM等指标。5.2 实验结果与挑战实验成功重建了特定浓度二氧化碳和二氧化硫在高温下的吸收光谱以及背景空气含0.03% CO2的吸收峰。成功案例对于二氧化硫其吸收未饱和重建光谱与参考光谱吻合度很高清晰再现了吸收峰特征。对于空气中低浓度的二氧化碳重建出的吸收峰半高宽与理论值基本一致证明了方法在真实环境中不损失光谱分辨率。遇到的挑战与析因饱和吸收问题对于高浓度二氧化碳在4250 nm处的强吸收近乎饱和截止重建光谱在吸收谷底部出现了轻微振荡。这是因为饱和吸收导致了光谱曲线的不连续性严重违背了稀疏表示所依赖的信号平滑或可稀疏化的先验假设。字典中没有任何原子能很好地表示这种“直角悬崖”式的特征。误差随温度升高而增大实验中发现温度越高辐射信号越强重建误差有增大趋势。这主要归因于a) 高温下系统杂散光和冷反射增强引入了非线性误差b) 采用最小二乘法的系统标定对高强度信号的校准误差更敏感。动态场景限制当前基于滤光轮的顺序采集方案只适用于静态场景。对于动态目标不同滤波器图像间的目标位移会导致严重的空间错位重建失败。实操心得与解决方案探讨应对饱和吸收根本思路是打破当前稀疏模型的局限。可以尝试①增加滤波器数量提供更多测量维度来约束解空间②引入非线性重建模型或专门针对不连续特征的字典原子③ 在预处理中检测并标记饱和区域采用插值或外推等后处理手段进行修复。提升系统稳定性需改进标定方法例如采用多项式拟合或神经网络建模来更精确地刻画系统的非线性响应。同时在光学设计阶段就要严格抑制杂散光。走向真正的快照成像最终的出路是研制可与探测器单片集成的多光谱滤波器阵列。将9种滤波器以微米级精度制备在探测器像元前实现所有光谱通道的同时曝光才能从根本上解决动态监测问题。这是我们下一步硬件研发的重点。6. 总结与展望一条通向轻量化气体成像的可行之路回顾整个工作我们提出并验证了一套基于字典学习与稀疏重建的中波红外计算光谱成像技术方案。其核心价值在于通过算法端的精巧设计分阶段字典来弥补硬件端的极致简化少量宽带滤波器在保证气体检测核心功能识别与定量的前提下为实现系统的小型化、轻量化、低成本化开辟了一条切实可行的技术路径。该方法的核心优势总结如下硬件简化潜力巨大采用易于制备的宽带薄膜滤波器替代复杂的分光元件系统结构简单光通量高易于与红外焦平面阵列集成为研制芯片级光谱成像仪奠定了基础。算法高效数据需求低结合了字典学习的自适应特征提取能力和OMP算法的高效稀疏求解能力。特别是分阶段字典构建策略用较少的数据和原子数实现了对中波红外气体尖锐吸收特征的高精度表征。验证充分指标明确通过系统的仿真分析了关键参数的影响并通过真实实验验证了方法对典型气体吸收光谱的重建能力PSNR大于26 dBSAM小于0.157 rad达到了实用化要求的精度门槛。当前局限与未来方向当然这项工作仍处于从实验室原理验证走向实际应用的阶段。如前所述饱和吸收重建和动态场景成像是两大亟待突破的瓶颈。此外对于多组分混合气体的复杂光谱其稀疏性模式会发生变化需要进一步优化字典学习和重建算法。我个人在实际研究中的体会是计算光谱成像的魅力在于它打破了硬件与软件的边界。未来更智能的算法如结合物理模型的深度学习与更先进的微纳光学器件如超表面滤波器阵列相结合将是推动该领域发展的关键。我们下一步计划正是设计并流片基于MEMS工艺的微缩滤波器阵列将其与探测器封装打造真正意义上的、可用于无人机或手持设备的中波红外快照高光谱相机。这条路虽然充满挑战但看到算法在仿真和实验中一点点将那些隐藏在压缩测量中的气体“指纹”还原出来时那种成就感是驱动我们继续前进的最大动力。