
1. 项目概述当量子几何遇上条形码识别在机器学习的浩瀚海洋里我们总在寻找那把能更精准、更高效地切割数据的“刀”。经典神经网络尤其是深度卷积网络已经在图像识别领域取得了统治级的地位。但当我们面对的任务不再是识别一只猫或一辆车而是判断两幅看似简单的“条形码”图像是否在全局上存在某种隐秘的相关性时经典方法似乎遇到了瓶颈——它们需要海量的数据去“记住”模式却难以从寥寥几个样本中“理解”并泛化出背后的深层规律。这正是我们这次探索的起点一个关于“相似性测试”的经典难题。想象一下你手头有两串由黑白方块组成的二进制序列就像超市商品上的条形码。你的任务不是读取它代表什么数字而是判断这两串码是否“同源”——即它们是否来自同一个具有内在相关性的生成过程。这听起来像是一个简单的二分类问题但难点在于这种相关性是全局的、结构化的可能隐藏在数据的整体分布中而非局部的像素特征。近年来量子机器学习QML的兴起为我们提供了新的工具箱。其核心思想是利用量子态的叠加和纠缠特性将数据编码到指数级庞大的希尔伯特空间中从而可能发现经典空间难以捕捉的模式。而几何量子机器学习GQML则更进一步它像一位深谙对称之美的建筑师将数据本身具有的对称性例如交换两个条形码、对条形码进行整体取反等操作不应改变其类别标签直接“浇筑”进量子模型的骨架里。这种设计哲学不仅让模型更贴合问题本质更关键的是它极大地约束了模型的假设空间从而有望用少得多的样本实现优异的泛化。本文要拆解的正是埃克塞特大学团队在2024年9月发表的一项有趣工作。他们不再局限于传统的、通过参数化量子线路变分量子神经网络来调整模型的方式而是转向了一种更为巧妙的策略对称性感知的自适应测量。简单说他们固定了数据编码的方式然后设计了一组符合问题对称性的量子可观测量可以理解为从不同“角度”去观测量子态最后通过机器学习方法自适应地组合这些观测量的结果来做出分类决策。实验结果表明这种“测量优先”的策略在条形码相似性测试任务上仅用个位数的训练样本就实现了接近完美的测试精度而经典的孪生神经网络无论是全连接还是卷积结构则几乎在随机猜测的水平挣扎。这不仅仅是一个实验胜利其背后更与计算复杂性理论中一个著名的难题——BQP有界错误量子多项式时间与PH多项式层级的分离——紧密相连。该工作暗示对于某些具有特定相关结构的数据分布量子模型可能拥有经典模型无法企及的学习效率。下面我们就深入这个量子几何世界看看这把“新刀”是如何被锻造和使用的。2. 核心思路拆解为什么是几何为什么是测量在深入电路细节之前我们必须先理解这个项目的顶层设计逻辑。为什么选择GQML为什么放弃更常见的变分线路转而采用自适应测量这背后是一连串基于问题特性和量子计算本质的深思熟虑。2.1 问题定义与数据生成隐藏在分布中的“关联”任务本身非常清晰给定一对N位的二进制字符串可视化为N个像素的黑白条形图判断它们是否“相关”。所谓“相关”并非指它们看起来相似而是指它们来自一个特定的联合概率分布PA(x)这个分布使得两个字符串之间存在一种全局的、经过哈达玛变换关联起来的结构。具体来说如果第一个字符串是x1那么“相关”的第二个字符串x2并非x1的简单拷贝而是近似满足 x2 ≈ H⊗n x1其中H是哈达玛门n log₂N。这意味着在量子态或经过某种傅里叶变换的视角下两者存在强关联。而不相关的样本对则来自两个独立同分布PB(x)。关键点这种“关联”是全局和线性代数的而非局部像素的匹配。经典模型如CNN擅长捕捉局部特征如边缘、纹理但要从少量样本中学习这种整体的、变换后的关联性极为困难。2.2 对称性的力量为模型注入先验知识这是GQML的精华所在。研究人员识别出该问题具有两个关键的对称性交换对称性交换一对条形码中的两个字符串其标签是否相关不变。即g(x1, x2) g(x2, x1)。比特翻转对称性将每个条形码的所有位取反0变11变0其标签也不变。即g(x1, x2) g(not(x1), not(x2))。在经典机器学习中我们可能会通过数据增强如随机交换样本对、随机翻转像素来让模型隐式地学习这些不变性。但在GQML中我们选择将这些对称性显式地、严格地构建到模型架构中。这通过以下方式实现等变数据编码将数据编码为量子态|φ_x⟩的映射方式必须与对称群的表示相容。本文使用的“相位状态”编码|φ_x⟩ (1/√N) Σ_j (-1)^x[j] |j⟩恰好满足这一点。不变测量最终用于分类的量子可观测量O必须在对称群的作用下保持不变。这意味着无论我们对编码后的量子态施加何种对称操作测量该可观测量得到的期望值都相同。将对称性作为硬约束嵌入模型极大地缩小了假设空间。模型无需从零开始学习“交换两个条形码不影响结果”这个规则而是天生就遵守它。这直接带来了两个好处第一减少了过拟合的风险因为模型搜索的解空间更小、更精准第二大幅降低了对训练数据量的需求因为许多无效的、违反对称性的假设从一开始就被排除在外了。2.3 架构抉择变分线路 vs. 自适应测量这是本文最具启发性的对比。团队尝试了两种GQML实现方式QNNU (基于变分酉线路的量子神经网络)这是更常见的VQA思路。数据编码后经过一个由参数θ控制的变分量子线路W(θ)进行处理最后测量一个固定的可观测量O。优化目标是调整θ使得测量结果与标签的误差最小。优势理论上具有强大的表达能力和灵活性。劣势在实践中对于本任务它表现不佳。如图3所示QNNU虽然能降低训练损失但测试精度徘徊在60%左右说明它陷入了过拟合它记住了训练集但没学会泛化。其根本原因在于要表达出能够区分本任务中那种特定全局关联的最优决策边界可能需要非常复杂、深层的酉变换而简单的变分线路难以通过梯度下降有效地找到这个解更容易陷入局部最优或仅仅拟合了训练噪声。QNNM (基于自适应测量的量子神经网络)这是本文的亮点。思路非常巧妙固定编码使用与QNNU相同的、满足对称性的相位状态编码。多角度观测不进行复杂的酉变换而是直接在一组精心挑选的、同样满足对称性的可观测量{O1, O2, ..., OK}上进行测量得到一个K维的经典特征向量φ(x) [⟨O1⟩, ⟨O2⟩, ..., ⟨OK⟩]。这些观测量就像一组不同的“滤镜”每个都从某个特定角度提取量子态的信息。经典线性组合通过一个经典的线性模型如LASSO回归来学习这些特征向量的最优权重组合α即模型输出为h(x) α · φ(x)。训练过程就是寻找那个能最好地区分两类样本的权重向量α。优势训练极其高效且稳定。因为它本质上将一个复杂的量子优化问题转化为了一个经典的、凸的线性回归问题LASSO后者有成熟的、保证收敛的优化算法。如图3所示QNNM仅用极少样本就能快速收敛并达到近乎完美的测试精度。核心洞见对于本任务区分两类数据的关键信息已经蕴含在编码后的量子态中问题在于如何“读取”它。自适应测量策略相当于提供了一组完备的“读数头”然后让经典算法去选择哪些读数头以及如何组合它们的读数是最有效的。这比让量子线路自己去“变形”态以适配一个固定的读数头测量要更直接、更高效。这个抉择告诉我们在QML中并非总是“更参数化、更复杂”的模型更好。有时将量子处理的核心限制在高效制备和提供丰富的量子特征而将复杂的特征选择和组合任务交给经典优化器是一种更务实、更强大的范式。这尤其适用于那些量子优势可能体现在状态表示本身而非动态演化过程的任务。3. 量子实现细节从理论到线路理解了“为什么”之后我们来看“怎么做”。这一部分将深入量子线路和测量的具体设计这是将GQML思想付诸实践的关键。3.1 数据编码制备相位状态将经典二进制数据加载到量子态是QML的第一步也是决定模型能力上限的关键。本文采用了一种称为“相位状态”或“实等权态”的编码方式。对于一个长度为N2ⁿ的二进制字符串x其对应的n量子比特相位状态定义为|φ_x⟩ (1/√N) Σ_{j0}^{N-1} (-1)^{x[j]} |j⟩其中x[j]是字符串的第j位0或1|j⟩是计算基态。如何用量子线路实现初始化将所有n个量子比特置于|0⟩态。制备均匀叠加态对每个量子比特施加一个哈达玛门H得到|⟩^{⊗n} (1/√N) Σ_j |j⟩。编码相位根据字符串x对每个基态|j⟩施加一个条件相位翻转。如果x[j]1则在基态|j⟩上添加一个 -1 的相位即π相位。这可以通过一个多控制的Z门MCZ来实现但其复杂度随n指数增长。更实用的方法是利用以下事实相位状态是图状态的一种。一种高效的制备方法是先制备一个所有节点相连的n-量子比特图状态通过在所有量子比特间施加受控Z门。然后根据字符串x对第j个量子比特施加Z^{x[j]}门。由于Z|⟩ |-这等效于引入了(-1)^{x[j]}的相位。对于一对条形码(x1, x2)我们分别制备|φ_x1⟩和|φ_x2⟩然后将它们作为两个独立的量子寄存器各n个量子比特总系统为2n个量子比特。这个编码过程U_φ(x)被证明对于前述的交换对称性和比特翻转对称性是等变的。3.2 对称性感知的可观测量池构建对于QNNM模型我们需要构建一个可观测量集合。这些观测量必须与对称群对易即它们是不变的。团队从满足对易关系的泡利字符串Pauli Strings和全局算符中挑选。具体例子包括局部算符Σ_i Y_i,Σ_i X_i X_{i1},Σ_i Y_i Y_{i1},Σ_i Z_i Z_{i1}。这些算符捕捉局部的关联。全局算符X^{⊗2n}: 所有量子比特的X泡利算符的张量积。Z^{⊗2n}: 所有量子比特的Z泡利算符的张量积。SWAP_{total} Π_{i1}^n SWAP_{i, in}: 交换两个条形码寄存器对应位置上的所有量子比特。这是捕捉两个条形码之间全局关联的关键算符之一。H^{⊗2n}: 在所有量子比特上作用哈达玛门。这与数据生成过程中的哈达玛变换相关联。关键技巧由于两个对称算符U_Z2(交换) 和U_Φ(全局比特翻转即Y^{⊗n}) 的对易子集合是封闭的这些算符的乘积也会对易。因此我们可以将基础算符相乘来生成更多复杂的、不变的可观测量例如SWAP_{total} · X^{⊗2n}或H^{⊗2n} · Z^{⊗2n}。这大大丰富了特征池。在实验中他们选择了K10个这样的观测量构成特征向量φ(x)。每个观测量对应一个期望值⟨O_k⟩ ⟨φ_x| O_k |φ_x⟩通过多次制备和测量量子态来估计。3.3 自适应测量与经典学习LASSO回归得到特征向量φ(x)后问题就转化为了一个经典的监督学习问题找到一个权重向量α使得线性预测h(x) α · φ(x)尽可能接近真实标签y0或1。他们选择了LASSO最小绝对收缩和选择算子回归。其损失函数为L(α) (1/2M) Σ_{m1}^M (α · φ(x_m) - y_m)² λ ||α||₁其中M是训练样本数λ是正则化参数。为什么用LASSO特征选择L1正则化||α||₁倾向于产生稀疏解即迫使许多α_k变为零。这自动实现了可观测量选择从10个候选特征中挑出最相关、最重要的那几个来构建分类器。这提高了模型的解释性和泛化能力。凸优化LASSO问题是凸的存在高效的优化算法如坐标下降能保证找到全局最优解避免了量子变分算法中常见的梯度消失、陷入局部最优等问题。效率一旦通过量子测量计算出所有训练样本的特征向量φ(x_m)剩下的就是一个轻量级的经典优化问题训练速度极快。这个过程完美诠释了“混合量子-经典”计算量子处理器负责高效地生成高维的、经典难以计算的特征即各个不变观测量的期望值经典处理器则负责高效的、确定性的特征选择和模型拟合。3.4 经典对比基线孪生神经网络为了凸显量子方法的优势需要强大的经典基线。作者选择了两种基于孪生架构的神经网络深度神经网络两个共享权重的全连接子网络分别处理两个条形码输出一个特征向量然后计算两个特征向量之间的欧氏距离作为不相似度度量。卷积神经网络两个共享权重的卷积子网络用于捕捉图像中的空间局部特征同样输出特征向量后计算距离。训练目标通过优化网络参数使得相关样本对的特征向量距离小不相关样本对的距离大。最终通过这个距离值来做二分类。实验设置中他们使用了与量子模型相同的小训练集每类仅1-10个样本并尝试了不同的损失函数如二元交叉熵、正则化Dropout和相似性度量余弦相似度以尽可能优化经典模型的性能。4. 实验结果与优势分析理论很美好但最终要看实验数据。论文中的图表清晰地展示了量子自适应测量模型QNNM的压倒性优势。4.1 性能对比泛化能力的鸿沟图4展示了随着训练样本数增加量子模型与两种经典模型的性能变化针对1024像素的大条形码对应20个量子比特系统训练损失所有模型QNNM DNN CNN都能将训练损失降到很低甚至达到100%的训练准确率。这说明它们都有能力“记住”训练集。测试准确率这才是见真章的地方。经典模型DNN/CNN其测试准确率始终在50%-60%之间徘徊仅比随机猜测50%好一点点。即使增加训练样本到每类10个总共20个提升也微乎其微。这表明经典模型严重过拟合它记住了训练样本的特定噪声但没有学到“全局相关性”这一本质特征。量子模型QNNM表现令人震惊。仅用每类3个样本共6个进行训练测试准确率就接近100%。随着样本数增加性能保持稳定在近乎完美的水平。这展示了其卓越的样本效率和泛化能力。图5则固定训练样本数每类5个展示了随着系统规模条形码像素数/所需量子比特数增大模型性能的变化。结果是无论是量子还是经典模型性能都基本保持稳定。这说明量子优势并非特定于某个小规模问题而是在不同尺度上都存在。4.2 优势根源探析与“Forrelation”问题的联系为什么QNNM能如此成功而经典模型和变分量子模型QNNU却不行论文将这一现象与计算复杂性理论中的一个著名问题——Forrelation傅里叶相关性——联系了起来。Forrelation问题大致是判断两个布尔函数f和g是“相关”一个函数的傅里叶变换与另一个函数高度相关还是“近似无关”。Aaronson和Ambainis在2015年证明量子计算机可以在O(1)次查询内解决这个问题而任何经典算法都需要Ω(√N)次查询这是一个指数级的分离。本文条形码数据集的构造正是受到了Raz和Tal2019工作的启发该工作利用Forrelation问题展示了BQP量子易解问题类与PH经典多项式层级的分离。具体来说他们构造的“相关”分布PA本质上就是让条形码对(x1, x2)满足x2 ≈ H^{⊗n} x1。而量子算法区分这两类分布的核心正是计算一个类似于Forrelation的量F |⟨φ_x1| H^{⊗n} |φ_x2⟩|²对于相关样本这个值很大对于不相关样本这个值指数小。那么QNNM是如何学到这一点的呢在QNNM的可观测量池中包含了SWAP_{total}和H^{⊗2n}这样的算符。LASSO回归通过优化权重α实际上就是学会了如何将这些观测量的期望值线性组合以近似计算出F或其判别式。最优的决策边界对应的可观测量恰好就是H^{⊗2n} · SWAP_{total}。这个算符在QNNM的池中是存在的因此可以被学习到。相反对于QNNU变分线路模型要构造一个酉变换W(θ)和一个固定的可观测量O使得W†(θ) O W(θ)等价于H^{⊗2n} · SWAP_{total}是非常困难的。变分线路的搜索空间虽然大但梯度优化很难找到这个特定的解因此它更容易学到一些仅仅拟合训练数据的平凡解导致泛化失败。4.3 实操启示与局限性给实践者的启示对称性先行在设计量子机器学习任务时首要任务是分析数据中的对称性。将对称性作为硬约束嵌入模型GQML能极大提升样本效率和泛化性能。测量即特征不要总想着用复杂的变分线路去“扭曲”量子态。对于许多问题将量子计算机视为一个强大的“特征生成器”通过测量一组精心设计的、与问题相关的可观测量来提取经典特征然后交给强大的经典机器学习模型如线性模型、LASSO、SVM去处理可能是一条更稳健、更高效的路径。这降低了量子电路的深度和训练难度。问题适配是关键量子优势并非万能。本文展示的优势严重依赖于数据分布具有特定的、量子友好如Forrelation的结构。对于一般的图像分类如猫狗识别量子方法目前未必能超越精心调优的经典CNN。当前局限性“非神谕”数据加载论文也坦诚指出一个关键限制在于数据加载方式。本文使用的相位状态编码其对应的经典计算哈达玛变换是高效的。这意味着理论上存在一个经典的“去量子化”算法可以模拟这个过程。真正的、基于查询复杂度的量子优势可能需要更复杂的数据加载方式如涉及多级Forrelation的Oracle。可扩展性虽然实验模拟到了20个量子比特1024像素但实际在含噪声中等规模量子设备上制备高保真度的多量子比特相位状态并执行可靠的测量仍然是一个挑战。问题特异性该方法目前被证明在具有类似Forrelation结构的全局相关性检测任务上有效。其普适性如何能否推广到更广泛的相似性测试或模式识别任务仍需进一步探索。5. 总结与展望这项研究为我们提供了一个清晰的案例在特定问题具有对称性和特定全局相关结构上结合了几何先验和自适应测量策略的量子机器学习模型能够实现远超经典方法的样本效率和泛化能力。它成功地将一个理论上的计算复杂性分离问题BQP vs. PH转化为了一个可执行的、具有明显优势的机器学习实验。其核心方法论——对称性约束 量子特征提取测量 经典稀疏模型LASSO——为量子机器学习的研究和实践提供了一个非常有价值的范式。它提醒我们在追求量子优势的道路上与其盲目地堆砌参数化量子门不如更深入地思考问题的本质结构并设计与之匹配的、高效的量子-经典混合算法。未来的工作可能会沿着几个方向展开一是探索更复杂、更具实际意义的数据集和对称性群二是研究如何在真实的量子硬件上稳健地实现这类协议对抗噪声三是进一步理论探究明确界定哪些类型的学习问题能够通过这种“测量优先”的GQML方法获得可证明的量子优势。对于我们从业者而言这项工作的最大价值在于它展示了一种务实且强大的QML设计思路。当你在处理一个具有内在对称性和复杂关联模式的问题时不妨先问问自己我能否设计一组对称性不变的量子观测量能否将量子部分的任务精简为特征生成而把复杂的模式识别交给经典算法这或许就是通往高效量子学习的一条捷径。