深度学习融合达西流:数字岩石物理中渗透率升尺度预测新方法

发布时间:2026/5/25 7:27:59

深度学习融合达西流:数字岩石物理中渗透率升尺度预测新方法 1. 项目概述与核心挑战在油气勘探、地热开发以及碳封存等地下工程领域岩石的渗透率是一个决定性的参数。它直接决定了流体如油、气、水能否高效地通过地下岩层从而影响资源开采效率、能源储存安全以及工程的经济可行性。然而精确获取岩心尺度的渗透率一直是个老大难问题。传统的岩心驱替实验虽然被视为“金标准”但成本高昂、耗时漫长且具有破坏性无法大规模应用。数字岩石物理技术通过计算机断层扫描获取岩石的三维数字图像为无损、快速地分析岩石物性开辟了新途径。但这里存在一个根本性的矛盾高分辨率的CT扫描能清晰揭示微米级的孔隙结构足以进行精确的孔隙尺度流动模拟如格子玻尔兹曼方法但其扫描视野极小通常只能覆盖岩心的一小部分“代表体积元”。反之覆盖整个岩心的低分辨率CT图像虽然能展现宏观结构却因分辨率不足而模糊了关键的孔隙喉道细节导致基于其直接计算的渗透率严重失真。这就是所谓的“尺度鸿沟”如何将高精度但小尺度的孔隙信息可靠地“放大”到低精度但大尺度的岩心模型上近年来以卷积神经网络为代表的深度学习技术因其强大的图像特征提取和非线性映射能力在数字岩石物理领域展现出巨大潜力。它仿佛一位经验丰富的“地质翻译官”能够学习低分辨率CT图像的灰度纹理与高精度渗透率数值之间的复杂关系。本研究正是基于这一思路构建了一个融合CNN与达西流模拟的升尺度预测框架。其核心创新点在于它并非简单地进行端到端的黑箱预测而是构建了一个物理信息嵌入的、可解释的工作流先利用CNN从低分辨率图像中预测出空间分布的渗透率场再将其作为输入通过基于物理的达西流求解器计算出岩心整体的等效渗透率。本文将深入拆解这一方法的每个环节并重点探讨一个实践中至关重要却常被忽视的问题用于训练CNN的子样本体积究竟多大才合适这直接关系到计算成本、预测精度以及最终升尺度结果的可靠性。2. 方法论深度解析从多尺度图像到升尺度渗透率2.1 整体工作流设计思路本方法的核心思想是“以小见大数据驱动”。它巧妙地规避了直接对低分辨率图像进行流场模拟的精度瓶颈转而利用深度学习建立一种“代理模型”。整个工作流可以清晰地分为三个阶段环环相扣。第一阶段是数据制备与模型训练。首先对同一块岩心进行双分辨率CT扫描低分辨率如20微米/体素覆盖整个岩心获取宏观结构高分辨率如3微米/体素针对岩心中心区域进行精细扫描以捕获真实的孔隙网络。接着对高分辨率图像进行去噪、分割等处理得到二值化的孔隙-骨架模型。从这个模型中切割出大量不同尺寸如100³, 200³, 300³体素的三维子样本。对这些子样本进行格子玻尔兹曼方法模拟得到每个子样本在特定方向如Z轴的绝对渗透率值——这就是我们需要的“地面真值”。与此同时从低分辨率全岩心图像的对应空间位置上提取出同样位置的、更大体素尺寸的子样本因为分辨率低所以物理尺寸相同但体素数更少。这样我们就获得了一个成对的数据集输入是低分辨率的三维灰度图像块输出是对应的高精度渗透率标量。用这个数据集去训练一个三维CNN如ResNet34其目标就是学会从模糊的宏观图像中“读出”其蕴含的流动能力信息。第二阶段是岩心尺度渗透率场预测。一旦CNN训练完成它便成为一个强大的预测工具。我们将整个低分辨率岩心图像按照与训练时相同的子样本尺寸进行网格化切割得到成千上万个图像块。将这些图像块逐一输入训练好的CNN模型即可快速预测出每个网格位置的渗透率值。最终我们得到一张覆盖整个岩心的、空间连续的“渗透率分布图”。这个过程完全基于数据驱动速度极快避免了在每个位置进行耗时的直接数值模拟。第三阶段是基于物理的升尺度计算。得到渗透率分布图并不是终点。岩石的宏观渗透率并非其内部所有局部渗透率的简单算术平均因为流体流动路径是连续的会受到低渗区域的瓶颈效应和高渗区域的窜流效应影响。因此我们需要进行基于物理的升尺度。将预测得到的渗透率分布图每个网格赋予一个渗透率张量本研究主要考虑主方向导入达西流求解器如MRST。在岩心模型的两端施加压力差其他边界设为不流动然后求解达西方程计算出整个岩心内部的压力场和流速场。最后根据总体积流量和压力梯度利用达西定律反算出整个岩心的等效渗透率。这一步确保了升尺度结果符合流体力学基本原理使整个方法兼具数据驱动的高效性和物理约束的可靠性。2.2 关键环节训练数据集构建的策略与权衡构建高质量的训练数据集是本方法成功的基石其中子样本尺寸的选择是核心决策点它直接引发了“代表性”与“异质性”之间的根本矛盾。子样本的“代表性”要求一个理想的训练子样本其内部应包含足够多的孔隙和喉道以构成一个统计上稳定的“代表单元体”。这意味着子样本的渗透率值应该对该局部区域的流动特性具有代表性并且当子样本尺寸继续增大时其渗透率值趋于稳定。从孔隙网络模型分析来看更大的子样本如300³体素平均包含超过1200个孔隙体其配位数分布更集中、平均值更高表明其内部孔隙网络的连通性更好、更稳定。这样的子样本作为训练数据其特征更为鲁棒CNN更容易从中学习到可靠的模式。子样本的“异质性”体现然而岩石的本质是非均质的。如果子样本尺寸过大其内部的高渗区和低渗区会被平均化从而掩盖了真实的局部波动。从渗透率分布的直方图可以明显看出100³体素小子样本的渗透率值分布非常分散标准差大这正反映了岩石小尺度的强烈非均质性。这种数据多样性对于机器学习模型捕捉复杂模式而言初期看似乎是有益的。实践中的权衡与选择我们的研究发现尽管小尺寸子样本提供了丰富的“数据多样性”但它们引入了过多的“噪声”和“极端值”。一些小子样本可能完全由固体骨架或连通的流道构成其渗透率值会异常高或低成为数据中的“离群点”。用包含大量离群点的数据训练CNN会导致模型预测不稳定在生成渗透率分布图时产生剧烈的局部波动。相反大尺寸子样本虽然平滑了局部细节但其渗透率值分布更集中离群点少训练出的模型预测结果更一致、更准确。如图6所示使用300³体素的大子样本仅需约1万个训练数据其预测精度R²就能接近1.0且快速收敛而100³体素的小子样本即使用尽近5万个数据精度也难以企及前者。实操心得子样本尺寸的“甜蜜点”选择子样本尺寸时没有一个放之四海而皆准的“最佳值”。它取决于岩石类型、孔隙结构以及CT图像分辨率。一个实用的经验法则是子样本的物理尺寸应至少是岩石平均颗粒直径的5-10倍且其内部平均孔隙数最好能超过200个。对于Boise砂岩平均粒径~100微米在3微米分辨率下200³体素物理尺寸600微米是一个不错的起点。在实际操作中建议进行一个快速的敏感性分析选取2-3个不同尺寸如1倍、2倍、3倍于平均粒径的尺寸切割子样本分别训练轻量级模型观察验证集精度的收敛速度和稳定性。通常预测精度随尺寸增大而提升但训练时间和内存消耗会呈立方级增长需要在精度和效率间找到平衡点。3. 模型构建、训练与预测全流程实操3.1 卷积神经网络模型的选择与适配在本研究中我们选择了ResNet34作为核心的预测模型。选择ResNet系列网络并非偶然其残差连接结构能有效缓解深度网络中的梯度消失问题非常适用于从三维图像中提取多层次特征。对于三维的CT图像块我们需要将标准的2D ResNet适配为3D版本即所有的卷积核、池化层都采用三维操作。输入数据预处理输入CNN的是直接从低分辨率CT图像中截取的原始灰度图像子块。一个关键技巧是无需对这些低分辨率图像进行分割或二值化。分割过程会引入误差而原始灰度值本身包含了物质密度信息这些信息与孔隙度、进而与渗透率潜在相关。CNN有能力直接从灰度图像中学习到这些关联。数据送入网络前需要进行归一化处理通常将体素灰度值缩放到[0, 1]区间以加速训练收敛。输出与损失函数本任务是一个回归问题网络输出层是一个神经元对应预测的渗透率值通常取对数形式以压缩其动态范围。损失函数采用均方误差损失MSE优化器常用Adam或SGD with momentum。训练策略由于三维数据体积庞大必须使用小批量梯度下降。批量大小Batch Size需要根据GPU内存谨慎设置。对于300³的大尺寸输入批量大小可能只能设为1或2。可以采用梯度累积技术来模拟更大的批量。学习率采用余弦退火或带热重启的调度策略有助于模型跳出局部最优。为了防止过拟合除了使用验证集监控外可以在网络中适当加入Dropout层或使用较强的权重衰减L2正则化。3.2 达西流求解与升尺度计算实现获得渗透率分布图后升尺度计算通过开源工具MRST完成。这一步将数据驱动的预测结果重新锚定在物理定律上。网格与属性赋值将整个岩心区域离散化为规则的三维网格。网格的尺寸应与CNN预测时使用的子样本尺寸在物理上对齐。例如若CNN子样本物理尺寸为0.6mm那么达西求解的网格尺寸也应设为0.6mm。然后将CNN预测得到的每个子样本位置的渗透率值Kxx, Kyy, Kzz赋予对应的网格单元。这样就构建了一个非均质的渗透率场模型。边界条件与求解设置在岩心柱体的两端通常是Z方向设置固定的压力边界条件如入口1 Pa出口0 Pa其余四个侧面设置为无流动边界。MRST内部会基于两点流量近似法离散并求解达西方程得到每个网格单元的压力和界面流量。等效渗透率计算求解完成后计算通过整个岩心截面的总流量Q。根据达西定律的宏观形式K (Q * μ * L) / (A * ΔP)。其中μ是流体粘度L是岩心长度A是横截面积ΔP是施加的压力差。由此计算出的K即为升尺度后的岩心等效渗透率。这个过程本质上是一个数值化的“虚拟岩心驱替实验”。注意事项各向异性的处理本研究通过旋转子样本并分别预测三个主方向的渗透率来近似获取渗透率张量的对角元。这是一种实用方法但假设了渗透率主轴与图像坐标轴对齐。对于具有明显倾斜层理或裂缝的岩石此假设可能不成立。更严谨的做法是在LBM模拟阶段就计算完整渗透率张量并将其作为训练目标。但这会显著增加数据制备的成本和复杂度。对于大多数碎屑岩其渗透率各向异性主要源于沉积层理通常与扫描方向垂直或平行于层理相关因此本文的方法在多数情况下是足够有效的。4. 结果分析、对比与工程意义解读4.1 预测精度与子样本尺寸的量化关系我们的实验系统地评估了子样本尺寸Case I: 100³, Case II: 200³, Case III: 300³体素对CNN预测性能的影响。结果清晰地表明“更大并不总是更好但足够大确实更稳”。预测精度如图7所示Case III300³的预测结果与LBM模拟值几乎完美地分布在对角线两侧R²值最高。Case II次之而Case I的预测点则非常分散误差较大。这说明大子样本提供的“上下文信息”更丰富其特征更能代表该区域的本质流动特性减少了局部奇异点如孤立大孔隙或封闭区域的干扰。训练效率尽管大子样本的单次前向传播和梯度计算更耗时但其达到相同精度所需的训练数据量更少。Case III仅需约1万组数据即可达到高精度收敛而Case I即使使用近5万组数据精度仍逊色不少。从总训练成本看虽然Case III的单轮迭代时间长但其所需的总epoch数可能更少整体训练时间未必呈立方增长。表2显示从Case I到Case III训练时间从8.3小时增至89.8小时但换来了预测精度的质的飞跃。渗透率-孔隙度关系图9展示了预测值与KC模型曲线的对比。有趣的是对于小子样本Case I数据点非常分散KC模型拟合线严重偏离。这是因为KC模型是一个基于平均化假设的经验公式无法刻画小尺度上的剧烈非均质性。而随着子样本增大无论是真实数据还是预测数据都更紧密地围绕在KC曲线周围。这进一步证明大子样本更能反映“统计平均”后的岩石物性关系而CNN成功学习到了这种超越简单孔隙度、包含更多结构信息的复杂关系。4.2 升尺度渗透率图与流动场可视化分析预测生成的渗透率分布图图10是理解非均质性的直观窗口。Case I的图显得非常“嘈杂”布满高频变化这虽然看似细节丰富但实际上很多是预测误差和极端局部值造成的“伪细节”。Case III的图则平滑得多呈现出清晰的宏观高渗条带和低渗区域这与岩心的沉积结构预期更为吻合。这种平滑的渗透率场输入到达西求解器后产生的流动场也更符合物理直觉。压力场和流速场的计算结果图12, 14极具说服力。Case I由于局部渗透率波动剧烈导致压力场出现许多不合理的局部高压和低压区甚至在局部出现了“回流”负速度。这显然是物理上不真实的是小子样本预测噪声在流动模拟中被放大的结果。Case II的压力场已大为平滑但仍有残余波动。Case III的压力场则呈现出近乎完美的线性下降趋势在均匀介质中应严格线性仅在渗透率发生真实变化的区域如图13所示出现平滑的偏离。其流速场也分布均匀真实地反映了主要流道。4.3 方法优势与不同技术路线对比我们将本方法的最终升尺度渗透率结果表3与几种传统方法进行了对比算术平均法直接将所有子样本的渗透率取平均。这种方法完全忽略了流动的连续性在强非均质条件下误差极大。Case I的算术平均值15.3D与升尺度值10.9D偏差达40%而Case III的偏差则缩小到约6%。孔隙网络模型法对高分辨率区域进行PNM分析得到渗透率19.1D远高于实验值8.9D。PNM将复杂孔隙空间简化为球管网络在Boise砂岩这类孔隙结构复杂的岩石中容易高估连通性、低估流动阻力导致渗透率预测偏高。岩心驱替实验作为基准值8.9D。本方法Case III的预测结果为12.2D虽然仍有偏差但已显著优于PNM且计算时间从数小时PNMLBM缩短至约40分钟CNN预测达西求解。更重要的是本方法提供了PNM和实验都无法提供的——全岩心空间连续的渗透率分布图。核心价值提炼本方法的真正优势不在于其绝对精度超越了所有传统方法而在于它在可接受的计算成本内实现了从“点”到“面”再到“体”的跨越。它用一次高分辨率扫描和一次低分辨率扫描的成本结合高效的数据驱动训练就能快速预测出整个岩心任意位置的渗透率并计算出符合流动物理的宏观等效值。这对于需要评估岩心非均质性、寻找优势渗流通道或计算方向渗透率比的工程应用价值巨大。5. 常见问题、挑战与未来优化方向5.1 实操中可能遇到的问题与排查CNN预测结果不收敛或精度极低检查数据对齐这是最常见的问题。务必确保高分辨率子样本与低分辨率子样本在三维空间中是严格对准的。任何微小的错位都会导致模型学习到错误的映射。建议在提取子样本前使用互信息最大化等图像配准算法对高、低分辨率图像进行精确的空间对齐。检查数据标签质量LBM模拟的渗透率值是否可靠检查模拟的收敛性确保边界条件设置正确如采用周期性边界以减少尺寸效应。对于渗透率极低接近0的子样本可以考虑取对数或进行截断处理防止极端值主导损失函数。检查输入数据范围确认输入CNN的灰度图像是否已正确归一化。异常值如金属矿物导致的极高灰度是否需要被剔除或限幅。达西流求解发散或结果不合理检查渗透率场将CNN预测的渗透率分布图可视化检查是否存在负值或异常大的值。这些非物理值会导致系数矩阵病态求解失败。需要在前处理阶段设置合理的上下限。检查网格与属性匹配确认每个达西求解网格的渗透率属性是否与CNN预测网格正确对应。网格尺寸和数量不一致是常见错误。检查边界条件确保压力边界施加在正确的面上无流动边界设置无误。对于各向异性渗透率场检查主方向定义是否与流动方向协调。计算资源与时间瓶颈大尺寸子样本训练300³体素的图像块对GPU内存要求极高。可采用混合精度训练如AMP、梯度累积、或使用更高效的网络架构如3D U-Net的变体来降低内存消耗。数据制备耗时LBM模拟是主要瓶颈。可以预先建立一个涵盖多种孔隙结构类型的“数字岩心库”及其渗透率数据库。对于新样本可通过图像相似性匹配从库中快速检索近似样本的渗透率作为标签大幅减少模拟需求。5.2 方法的局限性与发展方向泛化能力当前模型是针对特定岩石类型Boise砂岩训练的。将其直接应用于矿物成分、胶结类型、孔隙结构迥异的岩石如碳酸盐岩、致密砂岩时预测精度可能会下降。未来的方向是构建更大规模、更多样化的训练数据集或探索迁移学习、元学习等框架使模型具备更好的跨岩性适应能力。多相流与动态属性本研究仅预测了绝对渗透率。在实际油藏中相对渗透率、毛细管压力曲线更为关键。如何扩展框架以预测含水饱和度分布、乃至动态的多相流参数是更具挑战性也更有应用价值的前沿。从岩心到油藏尺度本文解决了从孔隙到岩心的升尺度。如何进一步将这套方法推广到测井尺度、甚至油藏模拟网格尺度是终极目标。这可能需要引入多级升尺度策略或结合地质统计学方法将岩心非均质性信息作为约束整合到地质建模中。模型可解释性CNN作为“黑箱”其决策过程难以理解。未来可结合类激活映射等可视化技术分析CNN在预测渗透率时重点关注图像的哪些区域如孔隙连通处、喉道狭窄处这不仅能增强我们对模型的信任还可能发现新的、与渗透率相关的微观结构表征参数。我个人在实际操作中的体会是这个框架最吸引人的地方在于它搭建了一座连接“微观机理”与“宏观表现”的桥梁。它没有抛弃物理也没有完全依赖数据而是让两者在最适合的环节发挥作用让LBM在它能精确计算的微小尺度上生成真值让CNN在它擅长的图像模式识别领域进行高效插值和推广最后让达西定律这个坚实的物理基石来完成从分布到整体属性的整合。这种“物理引导的数据驱动”范式或许是解决复杂地质工程问题更普适的路径。在实际项目中从一个精心挑选的、具有代表性的岩心样本开始严格按照此流程走通一遍所获得的不仅仅是几个渗透率数字更是一整套对目标储层非均质性的数字化洞察这对于后续的工程决策具有重要的指导意义。

相关新闻