
1. 项目概述与核心价值在5G NR上行链路的设计中我们这些做物理层算法和原型验证的工程师始终被一个核心矛盾所困扰如何在有限的用户设备UE发射功率预算下榨取出更高的有效辐射功率EIRP从而提升上行覆盖或数据速率这个问题的根源直指射频前端的“心脏”——功率放大器PA。PA的非线性特性尤其是当信号驱动其接近饱和区P1dB点附近时会引发严重的频谱再生产生大量的带外OOB辐射。这不仅会干扰相邻信道更会触发严格的频谱发射模板SEM和邻道泄漏比ACLR规范迫使PA必须工作在功率回退Power Back-Off状态导致整机效率低下。传统的解决方案比如在LTE时代广泛应用的DFT-s-OFDM即SC-FDMA虽然通过预编码有效降低了峰均功率比PAPR但其频谱抑制能力一般且对MIMO的支持不如CP-OFDM灵活。而基线CP-OFDM波形虽然MIMO友好、调度灵活但其固有的矩形脉冲形状导致频谱泄漏严重PAPR也高对PA的非线性极为敏感。因此业界一直在寻找一种既能保持CP-OFDM优点又能实现优异频谱抑制的波形增强技术。加权重叠相加WOLA-OFDM是一种直观的时域加窗方法通过平滑符号边缘来改善频谱泄漏但它对由削波一种常用的PAPR降低技术产生的非线性失真引起的OOB辐射抑制能力有限。而快速卷积滤波OFDMFC-F-OFDM则提供了一种更根本的解决方案。它本质上是一种高效的频域子带滤波技术能够为每个子带或带宽部分BWP独立设计高滚降系数的滤波器从而实现近乎理想的“砖墙”式频谱整形。其核心价值在于卓越的频谱抑制能力为PA提供了更大的“非线性容忍度”允许信号在更高的平均功率下工作而OOB辐射仍能满足规范要求。本文分享的正是我们基于软件定义无线电SDR平台对“削波FC-F-OFDM”这一组合拳进行的一次深度原型验证与性能剖析。我们不仅复现了FC-F-OFDM的发射链路更重要的是提出并验证了一种名为“滤波器通带扩展”FPE的创新方法用于优化削波噪声的分配从而在FC-F-OFDM优异的频谱抑制和因滤波而抬升的PAPR之间取得更佳平衡。我们搭建了包含真实PA的完整硬件在环HIL测试床以5G NR FR1的UE发射机规范为标尺系统性地对比了FC-F-OFDM与WOLA-OFDM在最大可达发射功率这一关键指标上的表现。实测数据表明在相同的ACLR和误差矢量幅度EVM约束下FC-F-OFDM能带来平均超过1 dB的功率优势——这对于上行链路预算紧张、电池续航至关重要的UE设备而言意义非凡。2. 核心波形技术原理与设计权衡2.1 FC-F-OFDM从频域滤波到高效实现FC-F-OFDM的核心思想并不复杂在标准的CP-OFDM符号生成之后插入一个高效的频域滤波环节。但这个“高效”的实现正是其精髓所在。传统的时域滤波对于一个长度为N的符号使用一个长度为L的滤波器进行卷积复杂度是O(N*L)。当滤波器阶数很高为了获得陡峭的过渡带时计算量会急剧膨胀。FC快速卷积方法巧妙地解决了这个问题。它基于重叠-保留Overlap-Save或重叠-相加Overlap-Add算法将长序列的卷积转化为多个短块上的循环卷积进而利用FFT/IFFT在频域实现。具体到我们的发射机处理链如图1所示对于第m个子带CP-OFDM生成与削波首先生成标准的时域CP-OFDM符号序列x_t,m。为了降低PAPR我们在此阶段对信号进行幅度削波Clipping得到\bar{x}_t,m。削波是一种非线性失真会引入额外的“削波噪声”其频谱会扩散到整个带宽。分块与变换将\bar{x}_t,m分割成一系列重叠的块重叠因子λ1/2是个常用折衷选择。对每个块进行Lm点FFT转换到频域。频域加窗滤波这是关键步骤。用一个设计好的频域窗D_m本质是目标滤波器频域响应的采样乘以每个频域块。这个窗决定了滤波器的通带、阻带和过渡带特性。我们提出的FPE方法正是在这一步做文章将窗的通带从仅包含激活子载波扩展到包含部分保护带。这样由削波产生、主要分布在信号带内及其附近的噪声分量可以有更宽的“容器”来容纳而不必被强行压制到带内那会抬高PAPR或泄漏到更远的阻带那会恶化OOB。子带映射与合成将滤波后的各子带频域信号根据其中心频率映射到一个更大的复合频域缓冲区中。逆变换与重叠保留对复合的频域信号进行N点IFFT转换回时域。由于采用了重叠-保留处理每个输出块只需截取中间不重叠的Ns个样本然后拼接起来就得到了最终经过滤波和采样率转换的发射信号y_t。注意FC处理中的相位旋转操作\Theta_m是为了保证块间的相位连续性这在接收端是透明的意味着标准的CP-OFDM接收机无需任何修改即可解调这是FC-F-OFDM向后兼容性的重要体现。2.2 WOLA-OFDM时域加窗的利与弊作为对比基准WOLA-OFDM的处理则更为直接。它在CP-OFDM符号的头部和尾部进行循环扩展然后对扩展后的整个符号包括CP部分施加一个时域窗函数如升余弦窗。最后相邻符号的扩展部分通过重叠相加OLA进行叠加以消除因加窗引入的时间开销。其数学表达可以简洁地用一个块对角矩阵K_m来描述该矩阵包含了窗函数权重和循环扩展操作。WOLA的优势在于实现简单仅需在IFFT输出后增加一些点乘和叠加操作计算复杂度低。它能有效平滑符号边界抑制由矩形脉冲引起的带外辐射。然而WOLA有一个根本性的局限它本质上是对整个符号进行时域加窗这种加窗对于由非线性失真如削波产生的、在符号内部随机出现的噪声尖峰抑制效果有限。削波噪声在频域是宽带的WOLA的时域窗无法像FC的频域滤波器那样对其进行精准的、高抑制比的滤除。因此当为了降低PAPR而进行深度削波时WOLA-OFDM的ACLR性能会迅速恶化。2.3 削波与FPE一对关键的共生技术削波是降低OFDM系统PAPR最直接、计算复杂度最低的方法。其操作简单粗暴设定一个门限γ任何幅度超过γ的采样点其幅度被限制为γ相位保持不变。虽然这会引入失真但在一定范围内系统通过频域均衡可以容忍这种失真。问题的关键在于削波噪声的处理。传统的迭代削波滤波ICF方法通过反复的削波和带外噪声置零来逼近目标计算量大。在我们的方案中强大的FC滤波器承担了抑制带外削波噪声的主要任务。但如前所述FC滤波器在压制带外噪声的同时也会将一部分噪声能量“挤压”回带内反而可能抬高信号的PAPR。FPE方法的提出正是为了打破这个僵局。其设计思路非常工程化既然5G NR为每个信道带宽配置了固定的保护带Guard Band这些保护带本就是为容纳发射机引起的频谱扩展而预留的那么我们何不“物尽其用”通过将FC滤波器的通带从激活子载波区域向两侧保护带适度扩展例如扩展2-4个PRB我们为削波噪声提供了一个更宽松的“泄洪区”。这样滤波器在抑制远带OOB辐射时无需对靠近通带边缘的噪声分量施加过大的衰减从而减轻了对PAPR的负面影响。图4和图5的仿真结果清晰地展示了FPE的效果随着通带扩展FPE尺寸增大滤波后信号的总削波噪声功率增加这是允许的只要不超出保护带和频谱模板限制而信号的PAPR显著降低。当FPE尺寸扩展到约200个子载波约1.7倍信号带宽时PAPR的改善趋于饱和。在实际设计中我们需要在PAPR增益和OOB辐射之间进行权衡选择一个不违反频谱发射模板的最大FPE尺寸。2.4 功率放大器建模连接仿真与现实的桥梁要准确评估波形在最大发射功率下的性能一个能够精确反映真实PA非线性特性和记忆效应的模型至关重要。纯理想仿真会过于乐观而完全依赖硬件测试则参数搜索效率极低。我们采用了记忆多项式Memory Polynomial, MP模型来表征测试中使用的Mini-Circuits ZHL-4240 PA。MP模型是行为级建模的经典方法它在无记忆多项式模型的基础上引入了时延抽头能够捕捉PA的动态非线性特性在精度和复杂度之间取得了良好平衡。模型提取过程如下数据采集用一组具有不同PAPR和平均功率的宽带信号如OFDM驱动PA并同步采集其输入y_t[n]和输出z_t[n]的基带I/Q样本。模型结构MP模型的输出是输入信号及其共轭的非线性函数与时延的叠加。我们采用了直到6阶的非线性项和一定的记忆深度Q。参数辨识将采集到的大量输入输出数据对构成如公式(19a)所示的回归矩阵\Phi_t然后利用最小二乘LS算法直接求解模型系数向量\beta_PA公式18。这样得到的模型能够相当准确地预测该PA在特定工作点下对任意输入信号的响应包括AM/AM、AM/PM失真以及频谱再生效应。有了这个精确的PA模型我们就可以在软件仿真器中快速、大量地遍历不同的波形参数如削波门限、FPE尺寸、信道带宽和子载波间隔寻找在满足ACLR和EVM要求下的最大输出功率点。这极大地缩小了后续硬件测试的搜索范围使原型验证工作有的放矢。3. SDR原型平台搭建与实测方法3.1 硬件测试床架构理论分析和仿真固然重要但通信算法的价值最终要靠硬件来检验。我们搭建了一套基于通用软件无线电外设USRP的SDR原型测试床其核心架构如图9所示旨在真实复现5G NR UE的发射场景。发射链TX Chain基带处理Host PC所有基带信号处理均在LabVIEW环境中离线完成。这包括CP-OFDM符号生成、QAM映射、削波、FC-F-OFDM或WOLA-OFDM波形成形等。我们生成并存储好完整的基带I/Q样本数据块。实时发射USRP-2954 RIO通过PCIe x4接口将预生成的基带样本高速传输至NI USRP-2954 RIO设备。该设备充当UE发射机在3.5 GHz载频上完成数字上变频、数模转换和射频调制。USRP内部的前置放大器将信号提升到一定的功率电平。功率放大与监测USRP输出的射频信号经过一个3 dB功率分配器一路送入RS NRP-Z11功率计进行实时功率监测确保信号功率稳定波动0.2 dB另一路送入外置的Mini-Circuits ZHL-4240 PA进行功率放大。该PA在3.5 GHz提供约42 dB增益是我们模拟UE功放非线性特性的关键器件。接收链RX Chain衰减与接收PA输出信号经过一个34 dB的固定衰减器确保输入到接收机的信号功率在NI PXIe-5840矢量信号收发器VST的线性动态范围内避免接收机自身产生非线性失真。信号采集与分析VST在1 GHz瞬时带宽下捕获下变频后的信号并传回另一台Host PC进行离线分析。接收端处理采用标准的CP-OFDM接收流程包括同步利用CP的自相关特性进行定时偏移和载波频偏估计与补偿。信道估计与均衡采用梳状Comb-type导频结构每6个子载波一个导频通过一维频域插值获取信道响应并进行迫零ZF均衡。性能度量计算最终计算关键的系统性能指标包括误差矢量幅度EVM或文中的MSE、功率谱密度PSD、ACLR以及实际测得的PAPR。这套测试床的优势在于灵活性高可以快速部署和修改不同的波形处理算法同时通过引入真实的PA和专业的测量仪器保证了评估结果的真实性和可信度。3.2 5G NR发射机合规性测试标准我们的性能评估严格遵循3GPP TS 38.101-1UE无线发射与接收中针对FR1的规范。主要关注两个核心的发射机指标邻道泄漏比ACLR定义为“工作NR信道滤波后的平均功率”与“相邻NR信道滤波后的平均功率”之比。测量带宽并非固定值而是等于“该信道带宽下支持的最大传输配置对应的带宽”加上“该信道带宽下支持的最小SCS”。例如对于5 MHz信道支持25个PRB15 kHz SCS最大传输带宽为4.5 MHz加上15 kHz后ACLR测量带宽为4.515 MHz。规范要求通常为30 dB或更高取决于功率等级和共存场景。频谱发射模板SEM定义了在偏离信道边缘不同偏移量处在特定测量带宽内的最大允许发射功率。它通常分为近端例如偏移量Δf 1 MHz和远端Δf ≥ 1 MHz区域不同区域有不同的测量带宽和限值。例如对于5-40 MHz信道在Δf 1 MHz处使用1%信道带宽的测量滤波器限值为-13 dBm在Δf ≥ 1 MHz处使用1 MHz测量带宽限值随Δf增大而严格。在我们的实验中最大可达发射功率的定义是在满足ACLR ≥ 30 dB且EVM ≤ -15 dB对应于QPSK调制的解调要求且完全满足SEM要求的前提下PA能够输出的最大平均功率。4. 性能评估仿真与实测结果深度解析我们针对5G NR FR1支持的所有信道带宽和子载波间隔SCS组合进行了全面的仿真扫描并选取了5 MHz、20 MHz、100 MHzSCS30 kHz这三个典型带宽进行了详细的硬件实测验证。4.1 关键性能指标对比分析在深入最大功率对比前我们首先通过仿真图2直观感受FC-F-OFDM和WOLA-OFDM在几个关键指标上的差异。配置为5 MHz信道30 kHz SCS削波目标PAPR6 dB。功率谱密度PSDFC-F-OFDM展示了近乎理想的“砖墙”式频谱形状带外衰减极其陡峭轻松满足SEM要求。WOLA-OFDM虽然比原始CP-OFDM好很多但其带外裙边skirt仍然较宽且在削波后OOB辐射明显抬升。原始CP-OFDM的频谱泄漏最为严重。ACLR性能FC-F-OFDM的ACLR性能卓越即使在深度削波PAPR目标低至3 dB时仍能保持80 dB以上的高水平。WOLA-OFDM的ACLR随削波深度增加而显著恶化在PAPR6 dB时约为45 dB而CP-OFDM则完全无法满足36 dB的UTRA共存要求图中虚线。PAPR性能得益于削波CP-OFDM和WOLA-OFDM都能实现很低的PAPR可低至3.5 dB。FC-F-OFDM由于滤波过程会重新塑造信号包络其PAPR会有所升高但在FPE辅助下仍能实现5 dB左右的PAPR。EVM/BER性能在适度的削波门限下如PAPR5 dB三种波形的EVM和BER性能相近。但当追求极低PAPR深度削波时所有波形的EVM都会恶化FC-F-OFDM由于滤波对噪声的整形其EVM恶化曲线略有不同。核心结论CP-OFDM因ACLR太差而出局。WOLA-OFDM和FC-F-OFDM的竞争本质上是“低PAPR但ACLR受限”与“ACLR卓越但PAPR稍高”之间的权衡。而最大发射功率正是这两个指标在PA非线性约束下共同作用的最终结果。4.2 最大可达发射功率仿真与实测的相互印证表3汇总了仿真得到的在各种配置下两种波形能达到的最大发射功率。一个清晰的趋势是在所有测试的带宽和SCS组合下FC-F-OFDM均优于WOLA-OFDM平均优势超过1 dB。子载波间隔15 kHz, 30 kHz, 60 kHz对结果没有显示出系统性影响。硬件实测结果图10, 11, 12有力地验证了仿真结论。我们以20 MHz信道为例图11进行解读PSD与SEM图11a在各自最优的削波设置下FC-F-OFDM红线的发射功率比WOLA-OFDM蓝线高出约1.3 dB但其频谱仍然被严格限制在SEM灰色阴影之下尤其是远带抑制效果明显更好。WOLA-OFDM的频谱边缘更“胖”限制了其功率提升空间。最大功率 vs. 目标PAPR图11b这张图揭示了寻找最优工作点的过程。对于FC-F-OFDM红色三角当目标PAPR从8 dB降低时最大输出功率先快速上升因为降低PAPR意味着提高平均功率在PAPR≈3 dB时达到峰值26.5 dBm之后开始下降。下降的原因是深度削波带来的EVM恶化图11c成为了新的瓶颈即使ACLR依然良好。对于WOLA-OFDM蓝色圆圈其最大功率在PAPR≈6 dB时达到峰值25.2 dBm之后功率下降的主要限制因素是ACLR的急剧恶化。EVM性能图11cFC-F-OFDM在PAPR低于3 dB后EVM迅速恶化至-15 dB门限以上。WOLA-OFDM的EVM曲线则相对平缓在整个PAPR范围内都满足要求。这印证了FC-F-OFDM的功率瓶颈在于EVM而WOLA-OFDM的瓶颈在于ACLR。实际PAPR图11d由于滤波和PA非线性的影响实际测得的PAPR实线会略高于软件基带设定的目标PAPR虚线。FC-F-OFDM的“实际-目标”PAPR差值更大反映了滤波过程对信号包络的复杂影响。实测与仿真的匹配度对于20 MHz和100 MHz信道仿真与实测的最大功率值高度吻合差异0.3 dB。对于5 MHz信道在FC-F-OFDM低PAPR区域出现了较大偏差约0.8 dB这很可能是因为我们的PA模型是用20 MHz信号训练的在窄带信号下的行为预测存在误差。但这并不影响核心结论。4.3 FPE的效果与复杂度考量图5专门展示了FPE对FC-F-OFDM性能的影响。可以看到将通带扩展2个或4个PRB确实能在不违反SEM的前提下图5a带来PAPR的切实降低图5b。虽然提升幅度不像理想矩形滤波器那么大图4d但对于FC滤波这种复杂过程任何PAPR的改善都是宝贵的。关于复杂度表2给出了定量的比较。在单子带情况下FC-F-OFDM所需的实数乘法和加法运算量大约是WOLA-OFDM的2.7-2.8倍。这主要来自于额外的FFT/IFFT操作和频域加窗。然而这个复杂度差距需要辩证地看多子带优势当系统配置多个不同参数的子带混合参数集时WOLA-OFDM需要为每个子带单独进行过采样的IFFT而FC-F-OFDM可以通过灵活的频域映射在同一个大IFFT中高效合成多个子带此时两者的复杂度差距会缩小。性能收益1 dB的功率增益对于上行链路意味着覆盖半径扩大约11%或小区边缘数据速率提升约25%。在许多功耗和覆盖受限的场景下用适度的计算复杂度换取如此显著的链路预算改善是非常值得的。实现优化FC算法本身非常适合并行化和流水线实现可以通过FPGA或专用ASIC高效部署。5. 工程实践中的问题排查与调优心得在实际的SDR原型开发和测试过程中我们遇到了不少教科书上不会写的“坑”。这里分享一些关键的经验和排查思路供后来者参考。5.1 同步与信道估计的细节在搭建完整的发射-接收测试环时接收端的同步精度直接决定了EVM和ACLR测量的可信度。问题初期测试发现FC-F-OFDM的EVM偶尔会异常跳变但WOLA-OFDM相对稳定。排查检查接收端同步算法。标准CP-OFDM的同步通常利用CP的自相关性。但FC-F-OFDM经过滤波后符号边界处的波形发生了变化可能会影响基于CP相关的定时估计精度。解决我们采用了更鲁棒的同步策略在发射信号中周期性插入已知的时域训练序列如ZC序列接收端通过匹配滤波寻找相关峰值来完成粗同步再利用CP相关进行精同步。对于信道估计我们坚持使用梳状导频而非块状导频因为FC滤波可能会在时域引入轻微的符号间干扰梳状导频在频域更均匀插值效果更好。5.2 PA模型精度与泛化能力行为级PA模型的准确性是整个仿真预测体系的基石。问题如4.2节所述用20 MHz信号训练的模型在预测5 MHz信号行为时出现了偏差。心得PA模型是“工作点依赖”的。理想情况下应该针对不同的目标平均输出功率和信号带宽影响峰均比和频谱形状分别训练模型。在实际工程中一个折衷的办法是用一组最能代表你目标应用场景的信号例如最大带宽、中等PAPR来训练模型。虽然在其他场景下会有误差但通常能抓住主要趋势。如果资源允许建立一个小型的模型查找表LUT针对几个关键工作点存储不同的模型系数是提升预测精度的有效方法。5.3 FPE尺寸的自动化选择FPE尺寸不是越大越好它需要在PAPR增益和OOB辐射之间取得平衡。实操流程确定约束首先根据3GPP规范明确当前信道带宽和分配RB数下的SEM和ACLR要求。扫描仿真在软件仿真器中固定削波目标PAPR从小到大扫描FPE尺寸例如从0到最大可用保护带PRB数。绘制曲线绘制“FPE尺寸 vs. 输出ACLR”和“FPE尺寸 vs. 输出PAPR”两条曲线。寻找拐点找到满足ACLR要求的前提下能使PAPR最低的那个FPE尺寸。通常PAPR随FPE增大而降低的曲线会有一个“拐点”超过拐点后PAPR下降不再明显但OOB辐射可能开始触碰SEM限值。硬件微调将仿真找到的“最优FPE尺寸”作为初值在真实硬件上进行小范围微调以补偿模型误差和硬件的不理想特性。5.4 削波门限的设定策略削波门限或目标PAPR是另一个关键可调参数。对于WOLA-OFDM其最优工作点通常在一个较窄的区间例如5.5-6.5 dB。低于此区间ACLR急剧恶化高于此区间功率回退太多。建议以6 dB为起点进行二分法搜索。对于FC-F-OFDM其最优工作点更低例如3-4 dB且更受EVM限制。建议从4 dB开始测试。一个重要发现由于FC滤波器的存在基带设定的削波门限与实际射频输出信号的PAPR存在较大差异见图11d。因此不能只看基带PAPR必须通过闭环测量以最终输出的ACLR和EVM为准反向确定基带的削波门限。5.5 测试床的校准与验证在开始正式对比测试前必须对测试床本身进行充分校准。功率校准确保从USRP到PA输入再到VST接收端的整个链路增益是已知且稳定的。使用连续波CW信号或已知功率的窄带信号结合功率计对整个链路的增益进行标定。线性度验证在输入较低功率时确保整个链路特别是接收端的VST加衰减器工作在线性区。可以通过输入一个单音信号观察输出频谱中三阶交调失真IMD3相对于主音的电平来确认。基线测试先用标准的、未经削波和特殊滤波的CP-OFDM信号进行测试验证其EVM底噪、同步性能等是否正常建立一个可信的性能基线。经过这些繁琐但必要的步骤我们最终得到的对比数据才是可靠、有说服力的。实测中那稳定的1 dB以上的功率优势让我们确信在5G NR上行链路尤其是对功率效率和频谱共存有严苛要求的场景下FC-F-OFDM结合FPE和削波的技术路径提供了一个极具竞争力的物理层解决方案。它用适度的计算复杂度增加换来了实实在在的链路预算提升这笔“交易”在很多场景下都是划算的。