1. 引言
对储层评价而言,物性参数至关重要,其中孔隙度是一个很重要的参数。对于白云岩储层,岩体结构中孔缝洞系统的发育程度和分布范围难以表征 [1],对优质储层的准确评价带来了巨大挑战。取心和地球物理测井是油气工业中确定孔隙度的主要方法,通常取心成本高、耗时长、样本少,且仅适用于部分储层。通过寻找常规测井电性参数与孔隙度的相关性往往不能得到满意的效果,很大程度上依赖于解释人员的经验,这一问题在致密碳酸盐岩储层中更为突出 [2] [3]。
为了解决这些问题,大量机器学习方法被引入到孔隙度预测中,并进行了多方面的研究。常用的机器学习模型主要为神经网络和支持向量机。其中神经网络细分为卷积神经网络(CNN) [4],反向传播神经网络(BP) [5] [6],数据分组处理神经网络(GMDH) [7] 等。支持向量机 [8] 按其应用方式分为支持向量分类机(Support Vector Machine, SVM)和支持向量回归机(Support Vector Regression, SVR),其代表优化算法为遗传算法(Genetic Algorithm, GA),粒子群(Particle Swarm Optimization, PSO)及网格搜索(Grid Search, GS)等,这些方法多数具有可靠的预测性能。在成像测井应用方面一些学者进行了深入的探讨,陈义祥、李晓辉等通过电成像测井参数定义算法对孔隙度值进行计算 [9] [10],平海涛等提出了基于电成像孔隙度谱分析的复杂储层渗透率模型,实现了核磁共振测井与电成像测井的有机结合 [11]。不少学者采用图像处理技术对成像测井图像上缝洞面积进行提取,并建立相关性间接的进行孔隙度预测及评价 [12] [13]。在实际应用中,各种方法均存在不同程度的缺陷,利用常规测井存在相关性较差,解释结果偏差较大;成像测井在采集时易受噪声及异物的影响,出现局部异常值。
为此,本文采用机器学习模型结合上述两种测井作进一步研究,通过对6种机器学习模型的优选,将常规测井与成像测井结合,建立一种综合方法。利用M1井非试气段实测岩心样本,建立预测模型,再用M1井试气段实测岩心样本对模型进行测试校正。利用校正后的模型对M2井L组白云岩储层进行了可靠的孔隙度解释,并以M2井L组实测岩心样本和实际测试段单井日产气量数据作为验证。
2. 方法原理
2.1. 支持向量回归机
支持向量回归机是支持向量在函数回归领域的应用。寻求最优超平面使所有样本点离超平面的“总偏差”最小,对于非线性回归问题,一般用线性函数拟合:
(1)
式中:
为模型系数,其中
为输入量。在利用SVR进行训练时,可引入参数ε,即不敏感损失函数度量(epsilon) [14],以确保对偶变量的稀疏性,保证全局最小解及提高泛化能力:
(2)
式中:
为松弛因子。核函数作为支持向量回归机的重要组成部分,经常用于将非线性可分问题从原始特征空间映射到高维空间,从而将非线性可分问题转化为线性可分问题,不同的核函数会导致不同的。核函数作为支持向量回归机的重要组成部分,经常用于将非线性可分问题从原始特征空间映射到高维空间,从而将非线性可分问题转化为线性可分问题,不同的核函数会导致不同的SVR性能,常规的核函数有线性核(Linear Kernel)、多项式核(Polynomial Kernel)及径向基核函数(Radial Basis Function, RBF)等。针对碳酸盐岩非均质性较强、线性不可分等特点,RBF核函数具有明显的优势。为找到最优的模型参数,引入网格搜索(GS)、遗传算法(GA)及粒子群(PSO)三种寻优算法,图1为三种寻优算法的工作流程。网格搜索作为最常用方法虽然在小范围搜索时能够得到全局最优解,但在范围较大时往往会很费时间。而采用遗传和粒子群算法就可以不必遍历网格内的所有的参数点,极大的节省了计算时间,但缺点是比网格搜索法更容易陷入局部最优解。
Figure 1. Work flow of parameter optimization: (a) GS; (b) GA; and (c) PSO
图1. 寻优算法工作流程图:(a) 网格搜索;(b) 遗传算法;(c) 粒子群算法
2.2. 模型评价指标
为更科学的评价各机器学习机模型的预测准确度,采用决定系数。(Coefficient of determination, R2)、均方根误差(Root mean square error, RMSE)、平均绝对误差(Average absolute error, AAE)和最大绝对误差(Maximum absolute error, MAE)等四种指标。其中R2、RMSE和AAE反映了预测值与实测值的总体偏差,R2越大,RMSE、AAE越小,模型性能越好,MAE反应了预测值与实测值的局部偏差,MAE越小,预测准确度越高。计算公式如下:
(3)
(4)
(5)
(6)
式(3)~(6)中:
为样本数值,
为该样本预测值,
为样本平均值。
2.3. 新方法预测孔隙度的流程
目前利用机器学习算法对孔隙度进行预测多数情况基于常规测井电性参数。相对于常规测井,电成像测井具有其独特的自身优势,采集数据时可实现井周360度高分辨率成像。成像测井图像真实的体现了沿井深度各地层的表面情况,其明暗程度一定程度上反映了该区域孔隙结构的发育情况,由于在非均质碳酸盐岩中,泥质含量相对较小,对孔隙度值的影响甚小,成像测井图像的灰度值可作为确定孔隙度值的一种参数。
本文首先根据实际取心样本孔隙度值、常规测井电性参数及成像测井图像等包含孔隙度信息的高分辨率数据源,通过岩心归位、岩心标定等常规方法进行深度校正,采用Python语言编程对成像测井图像进行批量处理,实现了沿深度方向的灰度值提取,再将样本孔隙度值与测井参数进行关联。在实际操作过程中,由于成像测井图像通常一口井分为数段,故在编写算法的时候将相邻图片的原始灰度值矩阵进行拼接操作,并在深度重叠的部分采用算术平均值法进行拼接,最后得到完整的单井灰度值曲线。通过对6种不同的机器学习模型进行对比分析评价,确定最佳孔隙度预测模型,最后对全井孔隙度值进行解释。图2为基于常规测井和电成像测井结合的机器学习孔隙度预测流程。
Figure 2. Porosity prediction technology flow
图2. 孔隙度预测流程
3. 实验数据及模型
3.1. 灰度值与样本分析
川西地区L组的白云岩沉积厚度较大,分布范围较广。由于储层非均质性较强,储层规模、质量特征缺乏深入认识,严重制约了勘探突破。研究区中M1井、M2井均为重要的工业气井。
将M1井白云岩地层182个岩心样本进行总孔隙度和灰度值的频率分布分析,如图3所示。孔隙度值分布在0.3%~12.25%区间,超过70%的孔隙度值小于4%,灰度值主要分布在140~180,仅有少数灰度值小于140。本文将常规测井曲线自然伽马(GR)、声波时差(DT)、补偿中子(CNL)、密度(DEN)、成像测井灰度值及其求导斜率等作为输入参数,这些参数包涵了岩石孔隙度的绝大部分原始信息。
Figure 3. Frequency distribution of the core porosity and gray value
图3. 岩心孔隙度和灰度值频率分布图
图4表明孔隙度与测井响应参数没有明显的线性关系,进一步证实了白云岩储层的非均质性。为寻找一个可靠的机器学习模型,将M1井所有可用的取心样本数据分为两组:为保证训练样本的丰富性,根据孔隙度频率直方图,抽取不同频率段约20%的样本作为测试数据集(40个样本),其余样本作为训练数据集(142个样本)。
Figure 4. Cross-plot of porosity and various logging parameters
图4. 孔隙度和各测井参数值交会图
3.2. 基于常规测井的机器学习模型优选
将8种测井参数作为输入参数,孔隙度值作为输出参数,样本测井参数响应范围见表1。
Table 1. Log response range of core samples
表1. 样本测井响应范围
4种评价指标(R2, RMSE, AAE, MAE)用于评价训练后6种机器学习模型的各项性能。图5为不同机器学习模型孔隙度实测值与预测值的交会图,数据点越靠近预期拟合线y = x表明预测准确率越高。不难看出,在该区域仅依靠常规测井电性参数对白云岩孔隙度进行预测难以取得较好的效果,不仅归咎于白云岩的非均质性,还存在于岩心归位、取心深度及实验数据等多方面。各机器学习模型之间的主要区别反映在对2.5%~7.5%孔隙度区间预测的能力。
Figure 5. Cross-plot of the core porosity and porosity predicted by the various machine learning models
图5. 不同机器学习模型实测孔隙度与预测孔隙度交会图
图6可以看出,在引入不敏感损失函数度量ε下的GA-SVR模型的预测效果最好,R2最大,RMSE、AAE、MAE最小,在训练集和测试集中分别为0.79、0.86、107.51、2.95和0.35、1.38、47.38、3.95。该研究表明采用GA-SVR with ε模型优于其他模型,能获得全局最小解,具有更佳的泛化能力。
Figure 6. Performance comparison of different machine learning models based on conventional log
图6. 基于常规测井建模的不同机器学习模型性能对比图
3.3. 基于常规测井与成像测井结合的模型建立
通过对全部测井参数进行不同的组合的寻优,确定将5种测井参数作为输入参数,孔隙度值作为输出参数,训练集样本测井响应参数见表2。图7为6种机器学习模型孔隙度实测值与预测值的交会图,从图中可清楚的看到随着成像测井灰度值的引入预测效果有显著的提升,不足的地方主要表现在2%~3%孔隙度区间,表明训练模型对该区域的泛化能力较弱,该区间对应的储层孔隙结构较复杂。图8可看出,GA-SVR with ε模型性能最佳,R2最大,RMSE、AAE、MAE最小,在训练集和测试集中分别为0.90、0.46、71.78、3.83和0.87、0.46、17.97、2.79。
Table 2. Log response parameter of training set samples
表2. 训练集样本测井响应参数
Figure 7. Cross-plot of the core porosity and porosity predicted by the various machine learning models
图7. 不同机器学习模型实测孔隙度与预测孔隙度交会图
Figure 8. Performance comparison of different machine learning models with conventional logging and imaging logging combined
图8. 常规测井与成像测井结合不同机器学习模型性能对比图
实验结果表明遗传算法GA-SVR with ε不仅在正确率方面优于其他算法,实际操作过程中,计算速度方面较网格搜索算法也有明显的优势。研究表明,通过6种机器学习模型的对比,在支持向量机模型算法中引入不敏感损失函数度量ε能提高其泛化能力,针对样本较少的情况预测结果更佳精准,模型更加稳定。研究表明通过引入成像测井图像灰度值作为训练参数,能减轻白云岩储层孔隙度非均质性的不利影响,也从侧面说明了在该区域中常规测井参数自然伽马(GR)与声波时差(DT)蕴含着白云岩储层孔隙度的绝大部分信息。将GA-SVR with ε机器学习模型与常规测井、成像测井相结合的方法比常规孔隙度线性或非线性预测方法更准确、可靠,有利于非均质白云岩的优质储层的识别与评价。
3.4. 数据准备
由于不同地区白云岩原生孔隙、次生孔隙度发育情况不一,沉积环境各异,通过单口测井数据建模达到较高的精度并不足以证明该方法的可靠性。为此,选取M2井L组实测样本数据验证本方法的应用效果。
采用GA-SVR with ε机器学习模型对M2井测井参数进行训练,并对孔隙度进行预测。将数据分为两组用于对比本方法与常规测井预测方法的应用效果。
1) 第一组训练数据集由M2井自然伽马(GR)及其斜率、声波时差(DT)及其斜率,成像测井灰度值等组成,测试集为孔隙度值。
2) 第二组训练数据集由M2井常规测井参数自然伽马(GR)及其斜率、声波时差(DT)及其斜率等组成,测试集为孔隙度值,用于验证。
3.5. 孔隙度解释实例与效果分析
图9为M2井L组储层两种不同孔隙度预测方法对比。其中图(a)左6道为实测孔隙度,左7道为常规测井方法预测孔隙度(蓝色离散曲线)与实测孔隙度(黄色散点)的组合图道,其最大偏差达超过50%。
Figure 9. Porosity interpretation result map of L formation in well M2. (a) Results of single well; (b) Partial enlarged drawing
图9. M2井L组测井孔隙度解释成果图。(a) 单井成果图;(b) 局部放大图
左8道为通过Python程序提取的成像测井的灰度值,右1道为采用本方法预测的孔隙度(红色离散曲线)与实测孔隙度(蓝色散点)的组合图道,最大偏差小于4%。图(b)中成像特征2道为成像测井灰度图像,成像特征1道为成像测井原始图像。通过对比可以看出,预测结果与实际取心资料、单井产量成像特征等钻探信息一致,说明本方法针对该研究区孔隙度预测具有较高的可信度。在5435 m左右深度,灰度值异常下降、孔隙度分布普遍偏高,这是由于成像测井图像分辨率较低,采集过程中存在一定噪声,出现局部异常值,不影响对白云岩优质储层的识别。
4. 结论
1) 川西地区L组白云岩储层的非均质性给储层评价和预测带来了很大的困难。本文结合常规测井和成像测井,运用了6种机器学习模型,确定了一种可靠的孔隙度解释方法。
2) 针对研究区白云岩的非均质性,在支持向量回归算法中引入不敏感损失函数度量ε能有效地提高模型的泛化能力,其中GA-SVR with ε模型性能最佳,R2最大,RMSE、AAE、MAE最小,R2在训练集和测试集中分别为0.90和0.87,用该模型对孔隙度进行预测较可靠,较精准。
3) 将机器学习模型应用于常规测井与成像测井相结合的储层参数预测方法,明显优于常规方法,有利于研究区白云岩储层孔隙度的精细解释与识别。