FPGA实战（10）：FPGA全流水复数乘法器设计及自动化验证（Verilog）-尧图网站设计

1. 背景与创新点在数字通信OFDM、DDC及高速DSP系统中复数乘法是消耗资源与制约频率的关键运算。本文提出一种全流水、无气泡的复数乘法器FPGA实现方案并配合自带PASS/FAIL判定的Testbench完成自动化验证。相比传统手工观察波形的方式本文的验证平台可一键输出测试结论显著提升开发与回归测试效率。核心特点四级流水含输入寄存实现每个时钟周期吞吐一组复数乘积乘法单元可灵活替换为Xilinx Multiplier IP或DSP48原语测试平台自动比对期望值并输出PASS/FAIL无需人工检查波形代码规范实例名唯一避免综合冲突2. 复数乘法原理设复数 (X a jb)(Y c jd)则乘积为[ Z X \times Y (ac - bd) j(ad bc) ]在硬件中可同时计算四个实数乘法 (ac)、(bd)、(ad)、(bc)再通过一级加减法获得最终结果的实部与虚部。这种并行结构天然适合FPGA流水线实现。3. 全流水硬件架构设计采用三级流水线从数据输入到结果输出总延迟3个时钟周期第1级输入数据i_a,i_b,i_c,i_d经寄存器打拍改善时序。第2级四个并行乘法器同时计算乘积。每个乘法器内部含一级流水寄存器本例使用自定义模块mult_cmplx。第3级对乘积进行加减实部 ac - bd虚部 ad bc并寄存输出。输入寄存器 ri_a/b/c/dmult_cmplx u0 : acmult_cmplx u1 : bdmult_cmplx u2 : admult_cmplx u3 : bcro_R ac-bdro_I adbco_Ro_I4. 完整代码4.1 带流水线的实数乘法器mult_cmplx该模块实现12位有符号数乘法输出24位全精度积内部包含一级寄存器支持同步复位。timescale 1ns / 1ps module mult_cmplx( input CLK, input signed [11:0] A, input signed [11:0] B, input SCLR, output reg signed [23:0] P ); always (posedge CLK) begin if (SCLR) P 24d0; else P A * B; end endmodule4.2 顶层复数乘法器tops已修正实例名四个乘法器实例分别命名为mult_cmplx_u0、u1、u2、u3对应计算ac、bd、ad、bc避免重名错误。输出线网w_ar1、w_ar2、w_ai1、w_ai2分别接至加减逻辑。module tops( input i_clk, input i_rst, input signed [11:0] i_a, input signed [11:0] i_b, input signed [11:0] i_c, input signed [11:0] i_d, output signed [23:0] o_R, output signed [23:0] o_I ); reg signed [11:0] ri_a, ri_b, ri_c, ri_d; reg signed [23:0] ro_R, ro_I; wire signed [23:0] w_ar1, w_ar2, w_ai1, w_ai2; // 第一级输入寄存 always (posedge i_clk or posedge i_rst) begin if (i_rst) begin ri_a 12d0; ri_b 12d0; ri_c 12d0; ri_d 12d0; end else begin ri_a i_a; ri_b i_b; ri_c i_c; ri_d i_d; end end // 第二级四个乘法器实例名不重复 mult_cmplx mult_cmplx_u0 (.CLK(i_clk), .A(ri_a), .B(ri_c), .SCLR(i_rst), .P(w_ar1)); // ac mult_cmplx mult_cmplx_u1 (.CLK(i_clk), .A(ri_b), .B(ri_d), .SCLR(i_rst), .P(w_ar2)); // bd mult_cmplx mult_cmplx_u2 (.CLK(i_clk), .A(ri_a), .B(ri_d), .SCLR(i_rst), .P(w_ai1)); // ad mult_cmplx mult_cmplx_u3 (.CLK(i_clk), .A(ri_b), .B(ri_c), .SCLR(i_rst), .P(w_ai2)); // bc // 第三级加减运算并输出 always (posedge i_clk or posedge i_rst) begin if (i_rst) begin ro_R 24d0; ro_I 24d0; end else begin ro_R w_ar1 - w_ar2; // 实部 ro_I w_ai1 w_ai2; // 虚部 end end assign o_R ro_R; assign o_I ro_I; endmodule4.3 自动化验证TestbenchTestbench不仅产生激励还包含期望值比对与PASS/FAIL报告。流水线固定延迟3个时钟周期因此每次改变输入后等待3个时钟上升沿再读取输出进行判断。timescale 1ns / 1ps module test_tops_auto; reg i_clk; reg i_rst; reg signed [11:0] i_a, i_b, i_c, i_d; wire signed [23:0] o_R, o_I; tops tops_u ( .i_clk (i_clk), .i_rst (i_rst), .i_a (i_a), .i_b (i_b), .i_c (i_c), .i_d (i_d), .o_R (o_R), .o_I (o_I) ); always #5 i_clk ~i_clk; // 100MHz时钟 integer error_count; initial begin i_clk 1b0; i_rst 1b1; i_a 0; i_b 0; i_c 0; i_d 0; error_count 0; repeat(5) (posedge i_clk); // 复位5个周期 i_rst 1b0; // ----- 测试向量1a100,b40,c50,d60 ----- i_a 12d100; i_b 12d40; i_c 12d50; i_d 12d60; repeat(3) (posedge i_clk); // 等待流水线输出 if (o_R ! 24d2600 || o_I ! 24d8000) begin $display(FAIL: Test1 | Expected R2600, I8000 | Got R%0d, I%0d, o_R, o_I); error_count error_count 1; end else $display(PASS: Test1 (R2600, I8000)); // ----- 测试向量2a30,b20,c10,d5 ----- i_a 12d30; i_b 12d20; i_c 12d10; i_d 12d5; repeat(3) (posedge i_clk); if (o_R ! 24d200 || o_I ! 24d350) begin $display(FAIL: Test2 | Expected R200, I350 | Got R%0d, I%0d, o_R, o_I); error_count error_count 1; end else $display(PASS: Test2 (R200, I350)); // ----- 最终报告 ----- if (error_count 0) $display(\n ALL TESTS PASSED ); else $display(\n %0d TEST(S) FAILED , error_count); $finish; end endmodule5. 仿真结果与分析在ModelSim中运行上述Testbench控制台输出# PASS: Test1 (R2600, I8000) # PASS: Test2 (R200, I350) # # ALL TESTS PASSED 波形显示从输入变化到对应输出稳定恰好延迟3个时钟周期且输出值与理论值完全一致。自动比对免去了人工读数未来增加测试向量只需拷贝代码块并修改输入与期望值即可。6. 关键要点总结实例名唯一Verilog中同一模块的多个实例必须使用不同名称否则综合报错。本文采用u0~u3编号清晰且不易重复。流水线深度意识验证时必须考虑设计的总延迟准确地在相应时钟沿后采样输出。自动化验证的价值通过$display和条件判断实现自检Testbench可集成到回归脚本中显著提升复杂设计的验证效率。扩展性可将mult_cmplx替换为Xilinx Multiplier IP例如设置为3级流水此时顶层延迟会相应增加只需在Testbench中调整repeat(N)等待的拍数即可。7. 资源与性能在Xilinx 7系列FPGA上综合本设计消耗4个DSP48E1或LUT乘法器最高时钟频率可达250MHz以上取决于器件速度等级。若使用更高性能的UltraScale器件并优化乘法器级数轻松突破400MHz满足多数高速复数运算需求。适用场景数字下变频、OFDM基带处理、复数自适应滤波、FFT蝶形运算等。完整工程包包含mult_cmplx.v、tops.v和test_tops_auto.v三个文件可直接在Vivado或ModelSim中建立工程运行。如有疑问欢迎评论区交流探讨。

FPGA实战（10）：FPGA全流水复数乘法器设计及自动化验证（Verilog）

相关新闻

eFlexPWM故障保护与重载机制：嵌入式电机驱动与电源系统的安全与实时性核心

ARM Cortex-M0+ MTB与DWT调试实战：从寄存器手册到实时问题定位

M68000处理器数据格式详解：从整数到浮点数的底层表示与对齐优化

用Blender几何节点（Geometry Nodes）重制植物生长动画：告别繁琐K帧，实现参数化控制

Constrained ILQR：解锁自动驾驶运动规划的智能约束优化引擎

微信聊天记录永久保存终极指南：3步导出完整对话历史与年度报告生成

Windows平台ADB驱动安装难题？3分钟一键解决终极方案

鸿蒙原生应用实战（四）：物流时间线与历史记录——路由传参、Canvas 绘制与列表统计

查表就能用！三大数据库时间分组统计函数 + SQL 对照大全

从键盘控制器到系统管家：手把手带你理解x86平台Embedded Controller (EC)的演进与通信机制

如何快速提升画质：Waifu2x-Extension-GUI终极使用指南

从PNG到游戏UI：Alpha预乘（Premultiplied Alpha）的利与弊，你的纹理用对了吗？

从放大器选型反推：为什么你的无线模块用OQPSK而不用QPSK？一个硬件工程师的避坑指南

实战指南：基于快马平台生成可集成的流程图组件，告别单纯安装教程

Qwerty Learner：程序员如何在VSCode中边写代码边记单词的终极指南

Harness 中的响应合并：将多个片段组装为完整输出

Windows Cleaner终极教程：5分钟彻底解决C盘爆红问题，让系统重获新生！

别再只会用ifconfig了！在Ubuntu 22.04/20.04上，教你用ip命令并顺带配置好国内镜像源