
1. 从并行到串行高速通信的基石SerDes在数字电路的世界里数据最初大多以并行的形式存在比如我们熟悉的32位或64位数据总线。但当我们需要把数据从一个芯片发送到另一个芯片或者从一块电路板传到另一块尤其是在高速场景下并行传输的弊端就暴露无遗需要大量的信号线布线复杂成本高昂而且各条数据线之间的时序偏差skew会严重限制传输速率。这就好比让一支庞大的军队排成密集方阵在狭窄的山路上行军速度根本快不起来还容易互相踩踏。于是SerDes技术应运而生它成为了现代高速通信从芯片间互连如PCIe、SATA到板级通信如以太网PHY再到光模块内部的核心引擎。SerDes是Serializer串行器和Deserializer解串器的合成词顾名思义它的核心工作就是在发送端把多路并行的低速数据合并成一路高速的串行数据流发送出去在接收端再将这路高速串行流拆解还原成原始的并行数据。这个过程就像是把一队分散的士兵并行数据高效地编成一路纵队串行数据通过一条狭窄但高速的通道差分对快速送达目的地然后再重新整队。理解SerDes尤其是其物理层PHY的实现是深入任何高速接口设计的基础。今天我就结合自己这些年调试各种高速链路的经验来拆解一下SerDes-PHY的经典结构并重点聊聊为什么差分传输几乎统治了所有高速信号领域。无论你是正在学习相关知识的在校学生还是初入行业的硬件或FPGA工程师希望这篇接地气的解读能帮你把书本上的框图变成脑子里清晰可操作的电路图。2. SerDes-PHY核心架构全景解析一个完整的SerDes-PHY模块远不止一个简单的并串转换。它是一个精密的系统环环相扣共同保证了数据在恶劣的电气环境下也能可靠传输。我们可以把它想象成一个现代化的快递分拣中心并行数据是来自各个仓库的包裹PHY负责打包、贴上防错标签、装上高速运输车差分信号、运送到目的地、检查包裹完整性、最后拆包分拣。2.1 发送端Tx链路从数据到信号发送端的任务是把原始的用户数据转换成适合在物理通道上长距离、抗干扰传输的电气信号。这个过程是分层的通常对应PCS物理编码子层和PMA物理介质接入子层。2.1.1 物理编码子层PCS的逻辑加工在数据进入高速串行器之前需要先经过PCS层进行一系列“预处理”。这可不是多此一举而是保证链路稳定性的关键。扰码Scrambling这是第一道工序。用户数据可能存在长串的“0”或“1”或者固定的重复模式如全0xFF。这样的数据流经过串行化后会在频谱上产生强烈的能量尖峰导致严重的电磁干扰EMI并且会使接收端的时钟恢复电路CDR失锁。扰码器本质上是一个线性反馈移位寄存器LFSR它产生一个伪随机序列与原始数据进行异或运算。这样一来输出的数据流看起来就像是随机的“噪声”能量被均匀地分散到更宽的频带上极大地降低了EMI也利于CDR工作。在接收端再用相同的LFSR序列异或一次就能完美恢复原始数据。以PCIe Gen1/2为例它使用一个16位的LFSR多项式为 G(X)X^16 X^5 X^4 X^3 1确保其周期足够长不会在短时间内产生重复模式。8b/10b编码或其他编码扰码解决了随机性问题但还需要解决直流平衡和同步问题。8b/10b编码将每8位数据映射成10位码字。这样做主要有三个目的第一保证在传输的码流中“0”和“1”的数量大致相等从而实现“直流平衡”防止信号因长期高电平或低电平而发生的基线漂移DC Wander这对于交流耦合AC Coupling的链路至关重要。第二这10位码字中有足够多的跳变边沿0-1或1-0为接收端的CDR提供了丰富的时钟信息来锁定频率和相位。第三额外的2位带来了冗余可以用来构造一些特殊的控制字符K码用于链路训练、对齐和错误检测。编码器会跟踪一个“运行不一致性Running Disparity RD”参数确保连续码字的正负极性交替进一步平衡0和1的数量。2.1.2 物理介质接入子层PMA的物理转换经过编码的数据流进入PMA层在这里完成从数字逻辑到模拟信号的最后转换。并串转换器Serializer这是SerDes的“S”部分。它将来自PCS的并行数据比如20位宽对应两个10b码字在本地高速时钟的控制下依次移位输出形成超高比特率的串行数据流。这个本地时钟通常由片上的锁相环PLL产生其频率是串行比特率的一半因为采用双沿采样技术即DDR。时钟产生与PLL一个低抖动、低相位噪声的时钟是SerDes的心脏。片上PLL以外部输入的、相对低频且稳定的参考时钟如100MHz或156.25MHz为基准通过倍频、分频和相位调整产生Serializer所需的高频时钟。PLL的性能直接决定了输出信号的眼图质量。驱动器Driver串行器输出的信号是芯片内部的数字电平如CMOS电平驱动能力很弱无法直接送到板级走线上。驱动器将其转换为适合长距离传输的差分信号通常具有可调节的摆幅Swing和预加重Pre-emphasis功能。预加重是一种简单的均衡技术在信号跳变时增强高频分量以补偿传输通道对高频信号的衰减在接收端获得更清晰的眼图。2.2 传输通道差分对的舞台发送端产生的差分信号通过一对紧密耦合的传输线通常是PCB上的微带线或带状线也可能是电缆中的双绞线传向接收端。这一对线一根传正相信号P一根传反相信号N。信号的有效信息体现在两者的电压差Vp - Vn上而不是它们各自对地的绝对电压。2.3 接收端Rx链路从信号到数据接收端的任务是应对经过通道衰减和畸变的信号从中准确地提取出时钟和数据。接收均衡Equalization信号经过长距离传输后高频分量损失严重会导致码间干扰ISI眼图几乎闭合。接收均衡器如连续时间线性均衡器CTLE或判决反馈均衡器DFE的作用就是放大高频分量抑制低频分量重新“打开”眼图为后续的采样判决创造条件。CTLE像一个可调节的滤波器而DFE则利用已判决的历史数据来抵消当前比特受到的来自前几个比特的干扰能力更强但也更复杂。时钟数据恢复CDR这是接收端最核心、最精妙的模块。发送端只发送了数据没有随路时钟。CDR的任务就是从数据流中实时地恢复出与发送端同步的时钟并用这个恢复出的时钟来精确采样数据。最常见的CDR结构是相位插值器PI型或锁相环PLL型。它通过一个相位检测器PD比较恢复时钟与输入数据跳变沿的相位差产生误差信号然后通过环路滤波器LF控制压控振荡器VCO或相位插值器调整时钟相位直至锁定。一个设计良好的CDR可以容忍高达数千ppm的频偏。采样与判决Sampler Decision利用CDR恢复出的时钟在数据眼图的中心位置通常还有边缘位置用于相位检测对均衡后的信号进行采样并将模拟电压判决为逻辑“0”或“1”。串并转换器Deserializer这是SerDes的“D”部分。它将高速串行比特流用恢复出的时钟降速采集重新组装成并行数据。解码与解扰并行数据被送入PCS层先进行8b/10b解码检查码字有效性和极性规则将10b码字转换回8b数据然后再通过解扰器与发送端相同的LFSR恢复出原始的用户数据。3. 差分传输为何成为高速设计的唯一选择如果你观察任何一款高速接口的硬件设计无论是PCIe、SATA、USB还是以太网其高速信号线无一例外都是成对出现的差分对。为什么单端传输一根信号线参考地在低速时代很常见到了高速领域却几乎被差分传输全面取代这背后是电磁学、信号完整性和工程实践的多重胜利。3.1 强大的共模噪声抑制能力这是差分信号最核心的优势。想象一下你和朋友在一个人声鼎沸的嘈杂房间里对话很难听清。但如果你们俩约定好一个人说“是”的时候另一个人同时说“不是”那么无论房间多吵你们只需要关注两人声音的“差异”就能准确获取信息。差分传输正是如此。在PCB或电缆中信号线就像天线会拾取周围环境中的各种电磁干扰噪声这些噪声通常会同时、同相地耦合到紧密相邻的两根差分线上成为共模噪声。在接收端我们只关心P线和N线的电压差V_diff Vp - Vn。任何同时加在P和N上的噪声V_noise都会被减掉 (Vp V_noise) - (Vn V_noise) Vp - Vn。理想情况下共模噪声被完全抵消。实操心得虽然理论上共模噪声被抑制但实际差分对的两条走线不可能绝对对称这会导致部分共模噪声转化为差模噪声即影响了电压差。因此在布局布线时必须尽全力保证差分对的等长和等距。我通常要求长度匹配误差在5mil0.127mm以内并尽可能采用紧耦合布线线间距小于线宽让它们“亲密无间”地走在一起以最大化共模噪声的耦合一致性。3.2 显著降低电磁干扰EMI高速数字信号的快速跳变陡峭的上升/下降沿会产生高频电磁辐射这是EMI的主要来源。对于单端信号电流从驱动器流出经过信号线到达接收端然后通过地平面流回源端。这个回流路径面积很大形成了一个有效的“环形天线”辐射较强。对于差分信号情况截然不同。在任一时刻P线和N线上的电流大小相等、方向相反。它们产生的磁场也是大小相等、方向相反。当这两条线紧密耦合时比如双绞线或紧耦合的PCB走线这两个磁场会相互抵消从而极大地减少了向外的电磁辐射。同样电场也因极性相反而部分抵消。注意事项要充分发挥差分对的EMI优势必须保证信号的正负路径严格对称。除了走线等长等距还需要注意过孔、连接器的对称性。一个常见的错误是只关注差分线本身的布线却忽略了在换层过孔处一个信号打两个过孔而另一个只打一个这破坏了回流路径的对称性会显著增加EMI。3.3 对参考平面的依赖性低电源系统更干净单端信号需要一个稳定、低阻抗的参考地平面作为电压回流路径。如果地平面不完整或有噪声会直接叠加到信号上影响信号质量。差分信号则不同它的回流路径就是另一根信号线。P线的返回电流绝大部分通过N线流回反之亦然。这意味着差分信号对参考地平面的完整性要求大大降低它甚至可以工作在非理想或带有噪声的电源/地系统上。这给系统电源设计带来了极大的灵活性也减少了因“地弹”等问题引发的信号完整性问题。3.4 更低的电压摆幅与功耗在相同的信噪比要求下差分信号可以采用比单端信号更小的电压摆幅。因为接收器检测的是差值较小的差值就能可靠判决。例如单端LVTTL可能需要3.3V摆幅而LVDS差分标准仅需350mV的摆幅。更低的电压摆幅意味着更低的功耗驱动器的动态功耗与电压的平方和频率成正比降低电压对省电有巨大贡献。更快的开关速度更小的电压摆幅需要充放电的电荷量更少理论上可以实现更快的上升/下降时间支持更高的速率。进一步减少EMI更小的电压摆幅直接意味着更小的电场强度辐射自然更弱。4. 深入关键子模块原理与实战陷阱了解了整体架构和差分优势我们还需要钻进几个关键的子模块里看看它们是如何工作的以及在实际设计中容易在哪里“踩坑”。4.1 交流耦合AC Coupling的必然与挑战几乎所有高速SerDes链路在发送端和接收端之间都会串联一个电容这就是交流耦合。它的核心作用是隔离直流分量即隔离发送端和接收端不同的共模电压。不同的芯片可能采用不同的供电电压如1.8V, 1.2V, 0.9V其输出信号的共模电平也不同。AC耦合电容阻断了直流路径允许两端的电路工作在自己最优的直流偏置点上互不影响。这极大地提高了系统的兼容性和模块化程度。但是AC耦合引入了一个经典问题基线漂移DC Wander。由于电容的“隔直通交”特性如果传输的数据流中“0”和“1”的数量长期不平衡电容会被充电或放电导致信号基线共模电压缓慢地向上或向下漂移。极端情况下漂移过大可能导致信号超出接收器的输入范围造成误码。解决方案与实战技巧编码保证直流平衡这就是8b/10b、64b/66b等编码的核心任务之一。通过编码规则确保无论传输什么数据长周期内“0”和“1”的数量基本相等从源头上避免了基线漂移。电容值选择耦合电容的值需要精心计算。太小低频分量衰减严重可能影响数据模式太大则充放电时间常数长系统从断电状态恢复建立稳定直流的时间也长。通常根据传输速率和允许的下降量来计算。一个经验公式是时间常数 τ R * C 应远大于最长连续相同位数如5个的位时间之和。例如对于5Gbps信号位时间200ps如果最长连续5个0则总时间1ns。通常选择τ在100ns量级对应电容常在0.1uF左右。注意必须使用高频特性好的电容如0402或0201封装的X7R、X5R材质MLCC并尽量靠近连接器或通道放置。4.2 时钟数据恢复CDR链路的同步灵魂CDR是接收端的“大脑”。它不像传统同步系统那样有一个明确的时钟线而是要从看似杂乱无章的数据流中“猜”出发送端的时钟节奏。主流的结构是相位锁定环PLL或延迟锁定环DLL的变种。其工作流程可以简化为相位检测器PD持续比较恢复时钟边沿与输入数据跳变沿的位置。如果数据跳变沿早于时钟边沿说明时钟慢了PD输出信号告诉VCO“加速”反之则“减速”。经过环路滤波器的平滑VCO的输出时钟相位被不断调整直至其边沿牢牢锁定在数据眼图的中心位置此时采样最可靠。CDR的锁定与失锁CDR要锁定前提是数据流中有足够多的跳变。如果长时间没有边沿如长串的0或1PD就没有输入CDR会进入“盲区”可能失锁。这就是为什么高速串行协议都强制要求使用扰码和特定编码来保证跳变密度。例如8b/10b编码保证了连续相同符号不超过5个。实操心得CDR带宽的选择。CDR环路有一个带宽参数它决定了CDR能跟踪输入信号相位变化的速度。高带宽CDR能快速跟踪抖动但容易受到噪声影响低带宽CDR抗噪性好但跟踪快速抖动能力差。这个参数需要根据参考时钟的抖动特性和传输介质的特性来权衡。在芯片数据手册中它可能是一个可配置的选项。对于存在扩频时钟SSC的系统CDR带宽必须足够低以跟踪缓慢的时钟频率调制但又不能太低以至于无法跟踪数据中的抖动。4.3 参考时钟系统全局同步的基石整个SerDes系统的定时源头是参考时钟。它的精度和稳定性至关重要。时钟架构根据发送端Tx和接收端Rx参考时钟的关系可分为几种模式同源时钟Common ClockTx和Rx共享同一个物理时钟源。这是最理想、最简单的情况CDR只需跟踪相位无需跟踪频率。分离参考时钟SRNS/SRISTx和Rx使用各自独立的时钟源。这是更常见也更复杂的情况。两个独立的晶振即使标称频率相同也存在细微的频率偏差频偏。CDR必须能够补偿这个频偏。SRIS模式还要求参考时钟进行扩频调制以降低EMI这对CDR的跟踪能力提出了更高要求。扩频时钟SSC这是一种主动降低EMI的技术。它有意让时钟频率在一个很小范围内如±0.5%周期性缓慢波动调制频率约30-33kHz。这样时钟及其谐波的频谱从一根窄线被“展宽”成一个宽峰峰值能量大幅下降从而通过EMI认证测试。但这给CDR和系统时序设计带来了额外负担。频偏容忍与弹性缓冲Elastic Buffer当Tx和Rx时钟存在频偏时即使CDR能恢复时钟数据速率在长期来看也是不同的。例如Tx时钟快100ppm每秒就会多产生100个比特。为了解决这个问题PCS层中有一个弹性缓冲器EB。它是一个先入先出FIFO缓冲区。发送端会定期插入特殊的“跳过Skip”有序集。当Rx时钟较慢时缓冲区可能变满此时丢弃一些Skip字符当Rx时钟较快时缓冲区可能变空此时插入一些空闲字符。通过这种动态调整来吸收两端的频率差异。频偏越大需要插入/删除的Skip字符比例越高有效数据传输带宽就越低。5. 高速SerDes设计实战从原理图到PCB的避坑指南理论很美好但把一颗支持高速SerDes的芯片焊到板子上并能稳定跑起来中间有无数个坑。下面我结合几个常见的故障场景分享一些实战排查技巧。5.1 常见问题与排查思路速查表问题现象可能原因排查思路与工具链路训练失败无法建立连接1. 参考时钟缺失或不稳。2. 电源/复位未就绪。3. 差分对极性接反P/N互换。4. AC耦合电容损坏或值不对。5. 发送端驱动器未使能或配置错误。1. 用示波器测量芯片参考时钟引脚确认频率、幅度、抖动达标。2. 检查芯片所有电源轨电压、纹波确认复位时序满足手册要求。3. 核对原理图与PCB确认差分对线序。可尝试软件配置极性反转如果芯片支持。4. 测量耦合电容两端直流电压发送端应有共模电压接收端应为偏置电压。链路时通时断高误码率1. 信号完整性差反射、损耗、ISI。2. 差分对长度不匹配严重。3. 共模噪声抑制差参考平面不完整。4. CDR无法锁定跳变不足时钟抖动大。5. 电源噪声大。1.首选工具眼图仪或高速示波器。观察眼图是否张开幅度、抖动、眼高眼宽是否达标。2. 使用TDR测量阻抗是否连续检查是否有stub或过孔残桩。3. 检查差分对布线确保严格等长、等距、紧耦合。4. 检查发送数据模式确保使用了扰码/编码。测量参考时钟抖动。5. 用近场探头扫描PCB定位噪声源。测量电源纹波。系统工作一段时间后出错1. 温漂导致时钟频偏超出CDR捕获范围。2. 电源芯片或LDO过热纹波增大。3. 基线漂移DC Wander累积。1. 进行高低温测试监控链路状态。选择温漂系数小的晶振。2. 加强散热检查电源芯片负载与散热设计。3. 检查是否因特殊数据模式导致编码规则被破坏或耦合电容值不合适。EMI测试超标1. 差分对布线不对称共模辐射大。2. 信号回流路径不完整形成大的环路天线。3. 未使用SSC或SSC配置不当。4. 连接器或电缆屏蔽不良。1. 审查PCB布局确保差分对对称。使用屏蔽性能好的连接器。2. 确保信号线下方有完整参考平面避免跨分割。3. 确认芯片SSC功能已开启且参数调制频率、幅度符合标准。4. 在实验室可用近场探头预扫描定位辐射热点。5.2 PCB布局布线黄金法则阻抗控制是生命线必须与板厂明确指定差分阻抗目标值如100Ω并提供完整的叠层结构、线宽、线距和介质参数。回来后要用TDR测量验证。等长匹配要苛刻我通常要求差分对内长度匹配误差5mil同一组通道间如PCIe的4个lane匹配误差20mil。使用PCB设计软件的延时匹配功能通过蛇形线Serpentine补偿但要注意蛇形线的拐角应使用45°或圆弧避免90°直角。紧耦合优于松耦合在空间允许的情况下尽量减小差分线之间的间距S使其小于线宽W。这能最大化磁场抵消效应提高抗共模噪声能力。参考平面必须完整高速差分线的正下方必须是一个完整、无分割的参考平面通常是地平面。严禁差分线跨电源分割区。如果不可避免必须在跨区处紧邻信号线放置缝合电容如0.1uF和0.01uF并联。过孔是最大的敌人尽量减少过孔使用。如果必须换层应使用一对地孔紧邻信号过孔为返回电流提供最短路径。避免使用焊盘内径过大的过孔以减少stub效应。对于10Gbps以上速率建议使用背钻技术去除过孔的无用残桩。AC耦合电容的摆放电容必须靠近发送端放置。这样从驱动器到电容之间的短走线是点对点的反射问题较小电容之后的长走线则以接收端的输入阻抗为终端匹配更好。5.3 电源与去耦设计SerDes模拟电路PLL、驱动器、接收器对电源噪声极其敏感。必须为它们提供独立、干净的电源轨并通过磁珠或π型滤波器与数字电源隔离。分层去耦在每个SerDes芯片的电源引脚附近采用分层去耦策略放置1-2个10uF的钽电容或大尺寸MLCC作为“水库”再配合多个0.1uF和0.01uF的MLCC滤除中高频噪声。这些小电容必须尽可能靠近芯片引脚以最小化寄生电感。地平面至关重要一个坚实、低阻抗的地平面是所有高速设计的基础。确保模拟地和数字地单点连接且连接点选择在SerDes芯片下方或附近。调试高速SerDes链路眼图分析是最直观有效的手段。一个清晰、开阔的眼图直接意味着低的误码率。当眼图闭合时需要系统地分析是发送端问题抖动大、预加重不足、通道问题损耗大、反射严重还是接收端问题均衡不足。通常的调试顺序是先确认发送端输出眼图是否规范再检查通道S参数损耗、回损最后调整接收端均衡参数。这个过程需要耐心也是对理论知识的终极检验。每一次成功打开一个闭合的眼图那种成就感就是硬件工程师最大的乐趣之一。